RU2818762C2 - Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in methods of sequencing polynucleotides - Google Patents

Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in methods of sequencing polynucleotides Download PDF

Info

Publication number
RU2818762C2
RU2818762C2 RU2020141465A RU2020141465A RU2818762C2 RU 2818762 C2 RU2818762 C2 RU 2818762C2 RU 2020141465 A RU2020141465 A RU 2020141465A RU 2020141465 A RU2020141465 A RU 2020141465A RU 2818762 C2 RU2818762 C2 RU 2818762C2
Authority
RU
Russia
Prior art keywords
nucleotide
group
nucleotides
paragraphs
sequencing
Prior art date
Application number
RU2020141465A
Other languages
Russian (ru)
Other versions
RU2020141465A (en
Inventor
Антуан ФРАНСЕ
Елена КРЕССИНА
Адам КАЛЛИ
Анжелика МАРЬЯНИ
Сяолинь У
Сяохай ЛЮ
Original Assignee
Иллюмина Кембридж Лимитед
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Иллюмина Кембридж Лимитед filed Critical Иллюмина Кембридж Лимитед
Publication of RU2020141465A publication Critical patent/RU2020141465A/en
Application granted granted Critical
Publication of RU2818762C2 publication Critical patent/RU2818762C2/en

Links

Abstract

FIELD: biotechnology.
SUBSTANCE: group of inventions relates to methods for sequencing polynucleotides. Disclosed is a nucleotide containing ribose or deoxyribose, having removable 3'-OH blocking group covalently attached to 3'-carbon atom. Also disclosed is an oligonucleotide, a method of producing a growing polynucleotide complementary to a target single-stranded polynucleotide in a sequencing reaction, method of determining the sequence of a target single-stranded polynucleotide, a kit for use in multiplex sequencing by synthesis, use of a nucleotide in multiplex sequencing by synthesis.
EFFECT: group of inventions provides a wider range of products for a specific purpose.
54 cl, 7 dwg, 7 ex

Description

Настоящее раскрытие в общем относится к нуклеотидам, нуклеозидам или олигонуклеотидам, содержащим 3’-гидрокси защитные группы, и к их применению в способах секвенирования полинуклеотидов. Также раскрываются способы получения 3’-гидрокси защищенных нуклеотидов, нуклеозидов или олигонуклеотидов.The present disclosure generally relates to nucleotides, nucleosides or oligonucleotides containing 3'-hydroxy protecting groups, and their use in polynucleotide sequencing methods. Methods for preparing 3'-hydroxy protected nucleotides, nucleosides or oligonucleotides are also disclosed.

Описание родственной областиDescription of related area

К успехам в исследовании молекул отчасти привели улучшения технологий, используемых для характеристики молекул или их биологических реакций. В частности, исследование нуклеиновых кислот - ДНК и РНК - выиграло от разработки технологий, используемых для анализа последовательностей и исследований событий гибридизации.Advances in molecular research have been driven in part by improvements in the technologies used to characterize molecules or their biological reactions. In particular, the study of nucleic acids—DNA and RNA—has benefited from the development of technologies used for sequence analysis and studies of hybridization events.

Примером технологий, которые улучшили исследование нуклеиновых кислот, является разработка готовых к применению чипов иммобилизованных нуклеиновых кислот. Данные чипы типично состоят из высокоплотной матрицы полинуклеотидов, иммобилизованных на веществе твердой подложки. См., например, Fodor et al., Trends Biotech. 12: 19-26, 1994, в которой описываются пути сборки нуклеиновых кислот с использованием химически сенсибилизированной стеклянной поверхности, защищенной маской, но экспонированной в определенных областях для обеспечения присоединения подходящим образом модифицированных нуклеотидфосфорамидитов. Готовые к применению чипы также могут быть изготовлены методикой «нанесения в виде пятен» известных полинуклеотидов на твердую подложку в заданных положениях (например, Stimpson et al., Proc. Natl. Acad. Sci. 92: 6379-6383, 1995).An example of technologies that have improved nucleic acid research is the development of ready-to-use immobilized nucleic acid chips. These chips typically consist of a high-density array of polynucleotides immobilized on a solid support material. See, for example, Fodor et al., Trends Biotech. 12: 19-26, 1994, which describes ways to assemble nucleic acids using a chemically sensitized glass surface, protected by a mask, but exposed in certain areas to allow the attachment of suitably modified nucleotide phosphoramidites. Ready-to-use chips can also be made by "spotting" known polynucleotides onto a solid support at predetermined positions (eg, Stimpson et al., Proc. Natl. Acad. Sci. 92: 6379-6383, 1995).

Один способ определения нуклеотидной последовательности нуклеиновой кислоты, связанной с чипом, называется «секвенирование посредством синтеза» или «SBS». Данная методика определения последовательности ДНК в идеале требует контролируемого (т.е. по очереди) включения правильного комплементарного нуклеотида напротив секвенируемой нуклеиновой кислоты. Это обеспечивает точное секвенирование посредством добавления нуклеотидов в многочисленных циклах, так как каждый нуклеотидный остаток секвенируется по очереди, таким образом, предотвращая осуществление неконтролируемых серий включений. Включенный нуклеотид считывается с использованием подходящей метки, присоединенной к нему, перед удалением группировки метки и последующим дальнейшим циклом секвенирования.One method of determining the nucleotide sequence of a nucleic acid associated with a chip is called sequencing-by-synthesis or SBS. This DNA sequencing technique ideally requires the controlled (i.e., sequential) incorporation of the correct complementary nucleotide opposite the nucleic acid being sequenced. This ensures accurate sequencing by adding nucleotides in multiple rounds as each nucleotide residue is sequenced in turn, thus preventing uncontrolled series of additions from occurring. The included nucleotide is read using a suitable tag attached to it, before removing the tag cluster and subsequent further round of sequencing.

Для обеспечения того, что происходит только одно включение, в каждый меченый нуклеотид, который добавляется к растущей цепи, включается структурная модификация («защитная группа» или «блокирующая группа») для обеспечения того, что включается только один нуклеотид. После добавления нуклеотида с защитной группой защитная группа затем удаляется при условиях реакции, которые не мешают целостности секвенируемой ДНК. Цикл секвенирования может затем продолжаться с включением следующего защищенного меченого нуклеотида.To ensure that only one incorporation occurs, a structural modification ("protecting group" or "blocking group") is included in each labeled nucleotide that is added to the growing strand to ensure that only one nucleotide is incorporated. After adding a nucleotide with a protecting group, the protecting group is then removed under reaction conditions that do not interfere with the integrity of the DNA being sequenced. The sequencing cycle can then continue with the inclusion of the next protected labeled nucleotide.

Для того, чтобы быть полезными в секвенировании ДНК нуклеотиды, которые обычно представляют собой нуклеотидтрифосфаты, обычно требуют 3’-гидрокси защитной группы, чтобы предотвращать продолжение репликации полимеразой, используемой для включения в полинуклеотидную цепь, как только добавляется основание на нуклеотиде. Имеется много ограничений по типам групп, которые могут быть добавлены на нуклеотид и все еще являются подходящими. Защитная группа должна предотвращать добавление дополнительных нуклеотидных молекул в полинуклеотидную цепь, в то же самое время будучи легко удаляемой от сахарного фрагмента, без вызова повреждения полинуклеотидной цепи. Кроме того, модифицированному нуклеотиду нужно быть совместимым с полимеразой или другим подходящим ферментом, используемым для его включения в полинуклеотидную цепь. Идеальная защитная группа, следовательно, должна демонстрировать долговременную стабильность, быть эффективно включаемой полимеразным ферментом, вызывать блокирование вторичного или дальнейшего включения нуклеотидов и иметь способность к удалению при мягких условиях, которые не вызывают повреждение структуры полинуклеотида, предпочтительно при водных условиях.To be useful in DNA sequencing, nucleotides, which are typically nucleotide triphosphates, typically require a 3'-hydroxy protecting group to prevent the polymerase used to be incorporated into the polynucleotide chain from continuing replication once a base on the nucleotide is added. There are many restrictions on the types of groups that can be added to a nucleotide and still be suitable. The protecting group should prevent the addition of additional nucleotide molecules to the polynucleotide chain, while at the same time being easily removed from the sugar moiety without causing damage to the polynucleotide chain. In addition, the modified nucleotide must be compatible with the polymerase or other suitable enzyme used to incorporate it into the polynucleotide chain. An ideal protecting group should therefore exhibit long-term stability, be efficiently incorporated by the polymerase enzyme, cause blocking of secondary or further incorporation of nucleotides, and be removable under mild conditions that do not cause damage to the polynucleotide structure, preferably under aqueous conditions.

Обратимые защитные группы были описаны ранее. Например, Metzker et al., (Nucleic Acids Research, 22 (20): 4259-4267, 1994) раскрывает синтез и применение восьми 3’-модифицированных 2-дезоксирибонуклеозид-5'-трифосфатов (3'-модифицированный дНТФ) и тестирование в двух анализах ДНК-матрицы на активность включения. В WO 2002/029003 описан способ секвенирования, который может включать применение аллильной защитной группы для кэппирования 3’-ОН группы на растущей цепи ДНК в полимеразной реакции.Reversible protecting groups have been described previously. For example, Metzker et al., (Nucleic Acids Research, 22 (20): 4259-4267, 1994) discloses the synthesis and use of eight 3'-modified 2-deoxyribonucleoside 5'-triphosphates (3'-modified dNTP) and testing in two DNA template assays for incorporation activity. WO 2002/029003 describes a sequencing method that may involve the use of an allyl protecting group to cap a 3'-OH group on a growing DNA strand in a polymerase reaction.

Кроме того, разработка целого ряда обратимых защитных групп и способов снятия их защиты при совместимых с ДНК условиях была ранее описана в публикациях международных заявок № WO 2004/018497 и WO 2014/139596, каждая из которых является тем самым включенной посредством ссылки во всей ее полноте.In addition, the development of a variety of reversible protecting groups and methods for deprotecting them under DNA-compatible conditions has previously been described in International Application Publications No. WO 2004/018497 and WO 2014/139596, each of which is hereby incorporated by reference in its entirety .

КРАТКОЕ ИЗЛОЖЕНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION

Некоторые воплощения настоящего раскрытия относятся к нуклеотиду или нуклеозиду, содержащему рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН защитную или блокирующую группу, образующую структуру ковалентно присоединенную к атому 3’-углерода, в которой:Some embodiments of the present disclosure provide a nucleotide or nucleoside containing ribose or deoxyribose having a 3'-OH leaving protecting or blocking group forming the structure covalently attached to the 3' carbon atom, in which:

каждый R1a и R1b независимо представляет собой Н, С16 алкил, С16 галогеналкил, С16 алкокси, С16 галогеналкокси, циано, галоген, возможно замещенный фенил или возможно замещенный аралкил;each R 1a and R 1b independently represents H, C 1 -C 6 alkyl, C 1 -C 6 haloalkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkoxy, cyano, halogen, optionally substituted phenyl or optionally substituted aralkyl ;

каждый R2a и R2b независимо представляет собой Н, С16 алкил, С16 галогеналкил, циано или галоген;each R 2a and R 2b independently represents H, C 1 -C 6 alkyl, C 1 -C 6 haloalkyl, cyano or halogen;

в качестве альтернативы, R1a и R2a, наряду с атомами, к которым они присоединяются, образуют возможно замещенную пяти-восьмичленную гетеро цикл ильную группу;alternatively, R 1a and R 2a , along with the atoms to which they are attached, form an optionally substituted five to eight membered heterocyclyl group;

R3 представляет собой Н, возможно замещенный С26 алкенил, возможно замещенный С37 циклоалкенил, возможно замещенный С26 алкинил или возможно замещенный (С16 алкилен)Si(R4)3; иR 3 is H, optionally substituted C 2 -C 6 alkenyl, optionally substituted C 3 -C 7 cycloalkenyl, optionally substituted C 2 -C 6 alkynyl or optionally substituted (C 1 -C 6 alkylene)Si(R 4 ) 3 ; And

каждый R4 независимо представляет собой Н, С16 алкил или возможно замещенный С610 арил. В некоторых воплощениях, когда каждый R1a и R1b представляет собой Н или C1-C6 алкил, оба R2a и R2b представляют собой Н, тогда R3 представляет собой замещенный С26 алкенил, возможно замещенный С37 циклоалкенил, возможно замещенный С26 алкинил или возможно замещенный (C1-C6 алкилен)Si(R4)3. В некоторых воплощениях, когда каждый R1a, R1b, R2a и R2b представляет собой Н, тогда R3 не является Н.each R 4 independently represents H, C 1 -C 6 alkyl or optionally substituted C 6 -C 10 aryl. In some embodiments, when R 1a and R 1b are each H or C 1 -C 6 alkyl, both R 2a and R 2b are H, then R 3 is substituted C 2 -C 6 alkenyl, optionally substituted C 3 - C 7 cycloalkenyl, optionally substituted C 2 -C 6 alkynyl or optionally substituted (C 1 -C 6 alkylene)Si(R 4 ) 3 . In some embodiments, when R1a , R1b , R2a , and R2b are each H, then R3 is not H.

Некоторые воплощения настоящего раскрытия относятся к нуклеозиду или нуклеотиду, содержащему рибозу или дезоксирибозу, имеющую удаляемую блокирующую 3’-ОН группу, образующую структуру ковалентно присоединенную к 3’-атому углерода, в которой:Some embodiments of the present disclosure provide a nucleoside or nucleotide containing ribose or deoxyribose having a removable 3'-OH blocking group forming the structure covalently attached to the 3' carbon atom, in which:

каждый из R5 и R6 независимо представляет собой Н, С16 алкил, С26 алкенил, С26 алкинил, С16 галогеналкил, С28 алкоксиалкил, возможно замещенный -(СН2)m-фенил, возможно замещенныйeach of R 5 and R 6 independently represents H, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 1 -C 6 haloalkyl, C 2 -C 8 alkoxyalkyl, optionally substituted - (CH 2 ) m -phenyl, possibly substituted

-(СН2)n-(5 или 6-членный гетероарил), возможно замещенный-(СН2)k37 карбоциклил или возможно замещенный -(СН2)р-(3-7-членный гетероциклил);-(SN2)n-(5 or 6 membered heteroaryl), possibly substituted-(CH2)k-WITH3-WITH7 carbocyclyl or possibly substituted -(CH2)R-(3-7 membered heterocyclyl);

каждый из -(СН2)m-, -(СН2)n- -(СН2)k- и -(СН2)p- является возможно замещенным; иeach of -(CH 2 ) m -, -(CH 2 ) n - -(CH 2 ) k - and -(CH 2 ) p - is optionally substituted; And

каждый из m, n, k и р независимо представляет собой 0, 1, 2, 3 или 4.m, n, k, and p are each independently 0, 1, 2, 3, or 4.

Некоторые воплощения настоящего раскрытия относятся к олигонуклеотиду или полинуклеотиду, содержащему 3’-ОН-блокированную молекулу нуклеотида, описанную в данном документе.Some embodiments of the present disclosure relate to an oligonucleotide or polynucleotide containing a 3'-OH-blocked nucleotide molecule described herein.

Некоторые воплощения настоящего раскрытия относятся к способу получения растущего полинуклеотида, комплементарного целевому одноцепочечному полинуклеотиду, в реакции секвенирования, включающему включение молекулы нуклеотида, описанной в данном документе, в растущий комплементарный поли нуклеотид, где включение данного нуклеотида предотвращает введение любого последующего нуклеотида в растущий комплементарный полинуклеотид. В некоторых воплощениях включение данного нуклеотида осуществляется полимеразой, терминальной дезоксинуклеотидилтрансферазой (TdT) или обратной транскриптазой. В одном воплощении включение осуществляется полимеразой (например, ДНК-полимеразой).Some embodiments of the present disclosure relate to a method of producing a growing polynucleotide complementary to a target single-stranded polynucleotide in a sequencing reaction comprising incorporating a nucleotide molecule described herein into a growing complementary polynucleotide, wherein inclusion of the nucleotide prevents the introduction of any subsequent nucleotide into the growing complementary polynucleotide. In some embodiments, the incorporation of a given nucleotide is accomplished by a polymerase, terminal deoxynucleotidyl transferase (TdT), or reverse transcriptase. In one embodiment, the incorporation is accomplished by a polymerase (eg, DNA polymerase).

Некоторые другие воплощения настоящего раскрытия относятся к способу определения последовательности целевого одноцепочечного полинуклеотида, включающему:Certain other embodiments of the present disclosure provide a method for determining the sequence of a target single-stranded polynucleotide, comprising:

(a) включение нуклеотида, содержащего 3’-ОН блокирующую группу и выявляемую метку, как описано в данном документе, в копию полинуклеотидной цепи, комплементарной по меньшей мере части целевой полинуклеотидной цепи;(a) incorporating a nucleotide containing a 3'-OH blocking group and a detectable tag as described herein into a copy of the polynucleotide chain complementary to at least a portion of the target polynucleotide chain;

(b) выявление идентичности нуклеотида, включенного в копию полинуклеотидной цепи; и(b) identifying the identity of a nucleotide included in a copy of the polynucleotide chain; And

(с) химическое удаление метки и 3’-ОН блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи.(c) chemical removal of the tag and 3'-OH blocking group from a nucleotide included in a copy of the polynucleotide chain.

В некоторых воплощениях способ секвенирования дополнительно включает (d) отмывку химически удаленных метки и 3'-блокирующей группы от копии полинуклеотидной цепи. В некоторых воплощениях такая стадия отмывки также удаляет не включенные нуклеотиды. В некоторых таких воплощениях 3'-блокирующая группа и выявляемая метка включенного нуклеотида удаляются перед введением следующего комплементарного нуклеотида. В некоторых других воплощениях 3’-блокирующая группа и выявляемая метка удаляются в одной стадии химической реакции. В некоторых воплощениях последовательное включение, описанное в данном документе, проводится по меньшей мере 50 раз, по меньшей мере 100 раз, по меньшей мере 150 раз, по меньшей мере 200 раз или по меньшей мере 250 раз.In some embodiments, the sequencing method further comprises (d) washing the tag and 3' blocking group chemically removed from a copy of the polynucleotide chain. In some embodiments, this washing step also removes unincorporated nucleotides. In some such embodiments, the 3' blocking group and detectable tag of the included nucleotide are removed before the introduction of the next complementary nucleotide. In some other embodiments, the 3' blocking group and the detectable tag are removed in a single chemical reaction step. In some embodiments, the sequential actuation described herein is performed at least 50 times, at least 100 times, at least 150 times, at least 200 times, or at least 250 times.

Некоторые другие воплощения настоящего раскрытия относятся к наборам, содержащим целый ряд молекул нуклеотидов или нуклеозидов, описанных в данном документе, и их упаковочные материалы. Нуклеотиды, нуклеозиды, олигонуклеотиды или наборы, которые излагаются в данном документе, могут использоваться для выявления, измерения или идентификации биологической системы (включая, например, ее процессы и компоненты). Типичные методики, в которых могут использоваться нуклеотиды, олигонуклеотиды или наборы, включают секвенирование, анализ экспрессии, анализ гибридизации, генетический анализ, анализ РНК, клеточный анализ (например, связывание с клеткой или анализ клеточной функции) или анализ белка (например, анализ связывания белка или анализ активности белка). Данное применение может осуществляться на автоматическом приборе для выполнения конкретной методики, таком как автоматический секвенатор. Секвенатор может содержать два или более чем два лазера, работающих при разных длинах волн, для различения между разными выявляемыми метками.Certain other embodiments of the present disclosure provide kits containing a variety of nucleotide or nucleoside molecules described herein and packaging materials therefor. The nucleotides, nucleosides, oligonucleotides or kits that are set forth herein can be used to detect, measure or identify a biological system (including, for example, its processes and components). Typical techniques in which nucleotides, oligonucleotides or kits may be used include sequencing, expression analysis, hybridization analysis, genetic analysis, RNA analysis, cellular analysis (eg, cell binding or cell function assay), or protein analysis (eg, protein binding assay or protein activity assay). This application can be carried out on an automatic instrument for performing a specific technique, such as an automatic sequencer. The sequencer may contain two or more than two lasers operating at different wavelengths to distinguish between different detectable marks.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHIC MATERIALS

ФИГ. 1 представляет собой график, иллюстрирующий стабильность разных 3' блокированных нуклеотидов как функцию времени в буферном растворе при 65°С.FIG. 1 is a graph illustrating the stability of various 3' blocked nucleotides as a function of time in buffer solution at 65°C.

ФИГ. 2А представляет собой график, иллюстрирующий процентную долю (%) остающегося нуклеотида (исходное вещество) как функцию времени при сравнении скорости деблокирования нуклеотида с 3’-АОМ блокирующей группой с нуклеотидом с 3’-О-азидометильной (-CH2N3) блокирующей группой в растворе.FIG. 2A is a graph illustrating the percentage (%) of nucleotide (starting material) remaining as a function of time when comparing the rate of unblocking of a nucleotide with a 3'-AOM blocking group with a nucleotide with a 3'-O-azidomethyl (-CH 2 N 3 ) blocking group in solution.

ФИГ. 2В представляет собой график, иллюстрирующий процентную долю (%) 3' деблокированных нуклеотидов как функцию времени при сравнении скорости деблокирования 3' блокированных нуклеотидов с разными ацетальными блокирующими группами в растворе.FIG. 2B is a graph illustrating the percentage (%) of 3' unblocked nucleotides as a function of time when comparing the rate of unblocking of 3' blocked nucleotides with different acetal blocking groups in solution.

ФИГ. 3А и 3В иллюстрируют результаты секвенирования на приборе Illumina MiniSeq® с использованием полностью функционализированных нуклеотидов (ffN) с 3’-АОМ блокирующей группой в смеси для включения.FIG. 3A and 3B illustrate sequencing results on an Illumina MiniSeq® instrument using fully functionalized nucleotides (ffN) with a 3'-AOM blocking group in the inclusion mixture.

ФИГ. 3С иллюстрирует показатель ошибки секвенирования с использованием полностью функционализированных нуклеотидов (ffN) с 3’-АОМ блокирующей группой в смеси для включения по сравнению со стандартными ffN с 3’-О-азидометильной блокирующей группой.FIG. 3C illustrates the sequencing error rate using fully functionalized nucleotides (ffN) with a 3'-AOM blocking group in the inclusion mixture compared to standard ffNs with a 3'-O-azidomethyl blocking group.

ФИГ. 4А и 4В каждая иллюстрирует сравнение первичных показателей секвенирования, включающих фазирование, предфазирование и показатель ошибок, с использованием полностью функционализированных нуклеотидов с 3’-АОМ и 3’-О-азидометильными блокирующими группами с использованием двух разных ДНК-полимераз (Pol 812 и Pol 1901) соответственно.FIG. 4A and 4B each illustrate a comparison of raw sequencing metrics including phasing, prephasing, and error rates using fully functionalized nucleotides with 3'-AOM and 3'-O-azidomethyl blocking groups using two different DNA polymerases (Pol 812 and Pol 1901 ) respectively.

ФИГ. 5 представляет собой график, иллюстрирующий стабильность секвенирования полностью функционализированных нуклеотидов с 3’-АОМ и 3’-О-азидометильными блокирующими группами как функцию времени в буферном растворе при 45°С.FIG. 5 is a graph illustrating the sequencing stability of fully functionalized nucleotides with 3'-AOM and 3'-O-azidomethyl blocking groups as a function of time in buffer solution at 45°C.

ФИГ. 6 представляет собой график, иллюстрирующий стабильность нуклеозидов с разными 3' блокирующими группами как функцию времени в буферном растворе при 65°С.FIG. 6 is a graph illustrating the stability of nucleosides with different 3' blocking groups as a function of time in buffer solution at 65°C.

ФИГ. 7 представляет собой график, иллюстрирующий процентную долю (%) остающегося 3' блокированного нуклеотида как функцию времени при сравнении скорости расщепления (деблокирования) тиокарбаматной 3' блокирующей группы диметилтиокарбамата (DMTC) при двух разных условиях (Oxone® или NaIO4) со скоростью расщепления 3’-О-азидометильной (3'-O-CH2N3) блокирующей группы.FIG. 7 is a graph illustrating the percentage (%) of 3' blocked nucleotide remaining as a function of time when comparing the rate of cleavage (deblocking) of the dimethylthiocarbamate (DMTC) thiocarbamate 3' blocking group under two different conditions (Oxone® or NaIO 4 ) with the rate of cleavage 3 '-O-azidomethyl (3'-O-CH 2 N 3 ) blocking group.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION

Воплощения настоящего раскрытия относятся к нуклеозидам и нуклеотидам с 3’-ОН ацетальной или тиокарбаматной блокирующими группами для приложений секвенирования, например, секвенирования посредством синтеза (SBS). Данные блокирующие группы обеспечивают лучшую стабильность в растворе по сравнению с блокирующими группами, известными в данной области. В частности, 3’-ОН блокирующие группы имеют улучшенную стабильность во время синтеза полностью функционализированных нуклеотидов (ffN) и также большую стабильность в растворе во время приготовления в виде препарата, хранения и действия на секвенаторах. Кроме того, с 3’-ОН блокирующими группами, описанными в данном документе, также могут достигаться низкое предфазирование, меньшее угасание сигнала для улучшенного качества данных, что обеспечивает более длинные считываемые фрагменты из приложений секвенирования.Embodiments of the present disclosure relate to nucleosides and nucleotides with 3'-OH acetal or thiocarbamate blocking groups for sequencing applications, such as sequencing by synthesis (SBS). These blocking groups provide better stability in solution compared to blocking groups known in the art. In particular, 3'-OH blocking groups have improved stability during the synthesis of fully functionalized nucleotides (ffN) and also greater stability in solution during formulation, storage, and operation on sequencers. Additionally, with the 3'-OH blocking groups described herein, low prephasing, less signal decay for improved data quality can also be achieved, enabling longer reads from sequencing applications.

ОпределенияDefinitions

Если не определено иначе, все технические и научные термины, использованные в данном документе, имеют такое значение, которое является общедоступным для обычного специалиста в данной области. Применение термина «включающий», а также других форм, таких как «включают», «включает» и «включенный», не является ограничивающим. Применение термина «имеющий», а также других форм, таких как «имеют», «имеет» и «имел», не является ограничивающим. Термины «содержат(жит)» и «содержащий» в том виде, в котором они используются в данном описании изобретения, независимо оттого, в переходной фразе или в отличительной части формулы изобретения, следует интерпретировать как имеющие неограничивающее значение. То есть, приведенные выше термины следует интерпретировать синонимично с фразами «имеющий по меньшей мере» или «включающий по меньшей мере». Например, при использовании в контексте способа, термин «содержащий» означает то, что данный способ включает по меньшей мере перечисленные этапы, но может включать дополнительные этапы. При использовании в контексте соединения, композиции или устройства термин «содержащий» означает то, что соединение, композиция или устройство включает по меньшей мере перечисленные характеристики или компоненты, но также может включать дополнительные характеристики или компоненты.Unless otherwise defined, all technical and scientific terms used herein have the meaning that is within the meaning of ordinary skill in the art. The use of the term “including,” as well as other forms such as “include,” “includes,” and “included,” is not intended to be limiting. The use of the term “having”, as well as other forms such as “have”, “has” and “had”, is not limiting. The terms “comprise” and “comprising” as used in this specification, whether in a transitional phrase or a distinctive portion of the claims, are to be interpreted as having a non-limiting meaning. That is, the above terms should be interpreted synonymously with the phrases “having at least” or “including at least.” For example, when used in the context of a method, the term “comprising” means that the method includes at least the listed steps, but may include additional steps. When used in the context of a compound, composition, or device, the term “comprising” means that the compound, composition, or device includes at least the listed features or components, but may also include additional features or components.

В том виде, в котором они используются в данном документе, обычные сокращения органических соединений определяются следующим образом:As used herein, the usual abbreviations for organic compounds are defined as follows:

Термин «чип» в том виде, в котором он используется в данном документе, относится к популяции разных молекул-зондов, которые присоединяются к одному или более чем одному субстрату, таким образом, что разные молекулы-зонды могут быть дифференцированы друг от друга согласно относительному положению. Чип может включать разные молекулы-зонды, каждая из которых располагается в отличном адресуемом месте на субстрате. Альтернативно или дополнительно, чип может включать отельные субстраты, причем каждый несет отличную молекулу-зонд, где разные молекулы-зонды могут быть идентифицированы согласно положениям субстратов на поверхности, к которой присоединяются субстраты, или согласно положениям субстратов в жидкости. Типичные чипы, в которых отдельные субстраты располагаются на поверхности, включают, без ограничения, чипы, включающие шарики в лунках, как описано, например, в патенте США №6355431 В1, US 2002/0102578 и публикации РСТ № WO 00/63437. Типичные форматы, которые можно использовать в данном изобретении для различения шариков в жидком чипе, например, с использованием микроструйного прибора, такого как сортер флуоресцентно активированных клеток (FACS), описываются, например, в патенте США №6524793. Другие примеры чипов, которые можно использовать в данном изобретении, включают, без ограничения, чипы, описанные в патентах США №5429807; 5436327; 5561071; 5583211; 5658734; 5837858; 5874219; 5919523; 6136269; 6287768; 6287776; 6288220; 6297006; 6291193; 6346413; 6416949; 6482591; 6514751 и 6610482; и WO 93/17126; WO 95/11995; WO 95/35505; ЕР 742287; и ЕР 799897.The term "chip" as used herein refers to a population of different probe molecules that are attached to one or more than one substrate, such that the different probe molecules can be differentiated from each other according to relative position. The chip may include different probe molecules, each positioned at a distinct addressable location on the substrate. Alternatively or additionally, the chip may include separate substrates, each carrying a different probe molecule, where the different probe molecules can be identified according to the positions of the substrates on the surface to which the substrates are attached, or according to the positions of the substrates in the liquid. Typical chips in which individual substrates are disposed on a surface include, but are not limited to, chips comprising beads in wells, as described, for example, in US Pat. No. 6,355,431 B1, US 2002/0102578 and PCT Publication No. WO 00/63437. Typical formats that can be used in this invention to distinguish beads in a liquid chip, for example, using a microfluidic device such as a fluorescence activated cell sorter (FACS), are described, for example, in US patent No. 6524793. Other examples of chips that can be used in this invention include, but are not limited to, those described in US Pat. No. 5,429,807; 5436327; 5561071; 5583211; 5658734; 5837858; 5874219; 5919523; 6136269; 6287768; 6287776; 6288220; 6297006; 6291193; 6346413; 6416949; 6482591; 6514751 and 6610482; and WO 93/17126; WO 95/11995; WO 95/35505; EP 742287; and EP 799897.

Термин «ковалентно присоединенный» или «ковалентно связанный» в том виде, в котором он используется в данном документе, относится к образованию химического связывания, которое отличается обобществлением пар электронов между атомами. Например, ковалентно присоединенное полимерное покрытие относится к полимерному покрытию, которое образует химические связи с функционализированной поверхностью субстрата, по сравнению с присоединением к поверхности посредством других способов, например, адгезии или электростатического взаимодействия. Будет понятно то, что полимеры, которые ковалентно присоединяются к поверхности, также могут быть связаны посредством других способов, помимо ковалентного присоединения.The term "covalently attached" or "covalently bonded" as used herein refers to the formation of a chemical bond that is characterized by the sharing of pairs of electrons between atoms. For example, a covalently attached polymer coating refers to a polymer coating that forms chemical bonds with the functionalized surface of a substrate, as opposed to attaching to the surface through other means, such as adhesion or electrostatic interaction. It will be appreciated that polymers that are covalently attached to a surface may also be linked by means other than covalent attachment.

Любая(бые) группа(пы) «R» в том виде, в котором данный термин используется в данном документе, представляет заместители, которые могут быть присоединены к указанному атому. Группа R может быть замещенной или незамещенной. Если две группы «R» описываются как «вместе с атомами, к которым они присоединяются» формирующие кольцо или кольцевую систему, это означает то, что совокупным блоком атомов, расположенных между связей и двух групп R является описанное кольцо. Например, при наличии следующей подструктуры:Any "R" group(s) as the term is used herein represents substituents that can be attached to the indicated atom. The R group may be substituted or unsubstituted. If two "R" groups are described as "together with the atoms to which they are attached" forming a ring or ring system, this means that the aggregate block of atoms located between the bonds and two R groups is the described ring. For example, given the following substructure:

и R1, и R2 определяются как выбранные из группы, состоящей из водорода и алкила, или R1 и R2 совместно с атомами, к которым они присоединяются, образуют арил или карбоциклил, это означает то, что R1 и R2 могут быть выбраны из водорода или алкила, или альтернативно, данная подструктура имеет структуру:both R 1 and R 2 are defined as being selected from the group consisting of hydrogen and alkyl, or R 1 and R 2 together with the atoms to which they are added form aryl or carbocyclyl, which means that R 1 and R 2 can be selected from hydrogen or alkyl, or alternatively, the given substructure has the structure:

где А представляет собой арильное кольцо или карбоциклил, содержащий указанную двойную связь.where A represents an aryl ring or a carbocyclyl containing said double bond.

Следует понимать то, что определенные соглашения по названию радикалов могут включать либо монорадикал, либо дирадикал, в зависимости от контекста. Например, в случае, где заместитель требует две точки присоединения к остальной молекуле, понятно то, что данный заместитель представляет собой дирадикал. Например, заместитель, идентифицированный как алкил, который требует две точки присоединения, включает дирадикалы, такие как -СН2- -СН2СН2-, -СН2СН(СН3)СН2- и тому подобные. Другие соглашения по наименованию радикалов ясно указывают то, что данный радикал представляет собой дирадикал, такой как «алкилен» или «алкенилен».It should be understood that certain radical naming conventions may include either a monoradical or a diradical, depending on the context. For example, in the case where a substituent requires two points of attachment to the rest of the molecule, it is clear that the substituent is a diradical. For example, a substituent identified as alkyl that requires two points of attachment includes diradicals such as -CH 2 - -CH 2 CH 2 -, -CH 2 CH(CH 3 )CH 2 - and the like. Other radical naming conventions clearly indicate that the radical is a diradical such as "alkylene" or "alkenylene".

Термин «галоген» или «галоген-» в том виде, в котором он используется в данном документе, означает любой из радиоактивно стабильных атомов столбца 7 Периодической таблицы элементов, например, фтор, хлор, бром или йод, причем фтор и хлор являются предпочтительными.The term “halogen” or “halo-” as used herein means any of the radioactively stable atoms in column 7 of the Periodic Table of the Elements, such as fluorine, chlorine, bromine or iodine, with fluorine and chlorine being preferred.

Термин «от Са до Cb», в котором «а» и «b» представляют собой целые числа, в том виде, в котором он используется в данном документе, относится к числу атомов углерода в алкильной, алкенильной или алкинильной группе, или к числу атомов кольца циклоалкильной или арильной группы. То есть, данный алкил, алкенил, алкинил, кольцо циклоалкила и кольцо арила может содержать от «а» до «b» включительно атомов углерода. Например, «С14 алкильная» группа относится ко всем алкильным группам, имеющим от 1 до 4 углеродов, то есть, СН3-, СН3СН2-, СН3СН2СН2-, (СН3)2СН-, СН3СН2СН2СН2-, СН3СН2СН(СН3)- и (СН3)3С-; С34 циклоалкильная группа относится ко всем циклоалкильным группам, имеющим от 3 до 4 атомов углерода, то есть, циклопропильной и циклобутильной. Аналогичным образом, «4-6-членная гетероциклильная» группа относится ко всем гетеро цикл ильным группам с 4-6 общими атомами кольца, например, к азетидину, оксэтану, оксазолину, пирролидину, пиперидину, пиперазину, морфолину и тому подобным. Если не обозначены «а» и «b» по отношению к алкильной, алкенильной, алкинильной, циклоалкильной или арильной группе, следует предполагать самый широкий интервал, описываемый в данных определениях. Термин «С16» в том виде, в котором он используется в данном документе, включает С1, С2, С3, С4, С5 и С6, и интервал, определенный любыми двумя данными числами. Например, С16 алкил включает С1, С2, С3, С4, С5 и С6 алкил, С26 алкил, С13 алкил и т.д. Аналогичным образом, С26 алкенил включает С2, С3, С4, С5 и С6 алкенил, С25 алкенил, С34 алкенил и т.д.; и С26 алкинил включает С2, С3, С4, С5 и С6 алкинил, С25 алкинил, С34 алкинил и т.д. Каждый С38 циклоалкил включает углеводородное кольцо, содержащее 3, 4, 5, 6, 7 и 8 атомов углерода, или интервал, определенный любыми двумя числами, как, например, С37 циклоалкил или С56 циклоалкил.The term "C a to C b ", in which "a" and "b" are integers, as used herein, refers to the number of carbon atoms in an alkyl, alkenyl or alkynyl group, or to the number of ring atoms of the cycloalkyl or aryl group. That is, a given alkyl, alkenyl, alkynyl, cycloalkyl ring and aryl ring may contain from “a” to “b”, inclusive, carbon atoms. For example, "C 1 -C 4 alkyl" group refers to all alkyl groups having from 1 to 4 carbons, that is, CH 3 -, CH 3 CH 2 -, CH 3 CH 2 CH 2 -, (CH 3 ) 2 CH-, CH 3 CH 2 CH 2 CH 2 -, CH 3 CH 2 CH(CH 3 )- and (CH 3 ) 3 C-; The C 3 -C 4 cycloalkyl group refers to all cycloalkyl groups having from 3 to 4 carbon atoms, that is, cyclopropyl and cyclobutyl. Likewise, a “4-6 membered heterocyclyl” group refers to all heterocyclyl groups with 4-6 common ring atoms, for example, azetidine, oxetane, oxazoline, pyrrolidine, piperidine, piperazine, morpholine and the like. Unless "a" and "b" are indicated with respect to an alkyl, alkenyl, alkynyl, cycloalkyl or aryl group, the widest range described in these definitions should be assumed. The term "C 1 -C 6 " as used herein includes C 1 , C 2 , C 3 , C 4 , C 5 and C 6 , and the interval defined by any two of these numbers. For example, C 1 -C 6 alkyl includes C 1 , C 2 , C 3 , C 4 , C 5 and C 6 alkyl, C 2 -C 6 alkyl, C 1 -C 3 alkyl, etc. Likewise, C 2 -C 6 alkenyl includes C 2 , C 3 , C 4 , C 5 and C 6 alkenyl, C 2 -C 5 alkenyl, C 3 -C 4 alkenyl, etc.; and C 2 -C 6 alkynyl includes C 2 , C 3 , C 4 , C 5 and C 6 alkynyl, C 2 -C 5 alkynyl, C 3 -C 4 alkynyl, etc. Each C 3 -C 8 cycloalkyl includes a hydrocarbon ring containing 3, 4, 5, 6, 7 and 8 carbon atoms, or a range defined by any two numbers, such as C 3 -C 7 cycloalkyl or C 5 -C 6 cycloalkyl.

Термин «алкил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, которая является полностью насыщенной (т.е. не содержит двойные или тройные связи). Алкильная группа может иметь от 1 до 20 атомов углерода (числовое значение, такое как «от 1 до 20» всякий раз, когда оно появляется в данном документе, относится к каждому целому числу в данном интервале, например, «от 1 до 20 атомов углерода» означает то, что алкильная группа может состоять из 1 атома углерода, 2 атомов углерода, 3 атомов углерода и т.д., вплоть до и включая 20 атомов углерода, хотя настоящее определение также охватывает появление термина «алкил», где не обозначается числовой интервал). Алкильная группа также может представлять собой алкил среднего размера, имеющий от 1 до 9 атомов углерода. Алкильная группа также могла бы представлять собой низший алкил, имеющий от 1 до 6 атомов углерода. Алкильная группа может быть обозначена как «С14алкил» или аналогичными обозначениями. Лишь в качестве примера, «С16алкил» указывает то, что в алкильной цепи имеется от одного до шести атомов углерода, т.е. алкильная цепь выбрана из группы, состоящей из метила, этила, пропила, изопропила, н-бутила, изобутила, втор-бутила и трет-бутила. Типичные алкильные группы включают метил, этил, пропил, изопропил, бутил, изобутил, третичный бутил, пентил, гексил и тому подобные, но ни в коей мере не ограничиваются ими.The term "alkyl" as used herein refers to a straight or branched hydrocarbon chain that is fully saturated (ie, does not contain double or triple bonds). An alkyl group may have from 1 to 20 carbon atoms (a numerical value such as "1 to 20" whenever it appears herein refers to each integer in the range, e.g. "1 to 20 carbon atoms " means that an alkyl group may consist of 1 carbon atom, 2 carbon atoms, 3 carbon atoms, etc., up to and including 20 carbon atoms, although this definition also covers the occurrence of the term "alkyl" where no numerical designation is given interval). The alkyl group may also be a medium-sized alkyl having from 1 to 9 carbon atoms. The alkyl group could also be lower alkyl having from 1 to 6 carbon atoms. An alkyl group may be designated "C 1 -C 4 alkyl" or similar designations. By way of example only, "C 1 -C 6 alkyl" indicates that the alkyl chain has from one to six carbon atoms, i.e. the alkyl chain is selected from the group consisting of methyl, ethyl, propyl, isopropyl, n-butyl, isobutyl, sec-butyl and tert-butyl. Typical alkyl groups include, but are not in any way limited to, methyl, ethyl, propyl, isopropyl, butyl, isobutyl, tertiary butyl, pentyl, hexyl, and the like.

Термин «алкокси» в том виде, в котором он используется в данном документе, относится к формуле -OR, в которой R представляет собой алкил, как определяется выше, как, например, «С19 алкокси», включая метокси, этокси, н-пропокси, 1-метилэтокси (изопропокси), н-бутокси, изобутокси, втор-бутокси и трет-бутокси, и тому подобные, но не ограничиваясь ими.The term "alkoxy" as used herein refers to the formula -OR in which R is alkyl as defined above, such as "C 1 -C 9 alkoxy", including methoxy, ethoxy , n-propoxy, 1-methylethoxy (isopropoxy), n-butoxy, isobutoxy, sec-butoxy and tert-butoxy, and the like, but not limited to.

Термин «алкенил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, содержащей одну или более чем одну двойную связь. Данная алкенильная группа может иметь от 2 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «алкенил», где числовой интервал не обозначается. Алкенильная группа также может представлять собой алкенил среднего размера, имеющий от 2 до 9 атомов углерода. Алкенильная группа также могла бы быть низшим алкенилом, имеющим от 2 до 6 атомов углерода. Алкенильная группа может быть обозначена как «С26 алкенил» или аналогичными обозначениями. Лишь в качестве примера, «С26 алкенил» указывает на то, что в алкенильной цепи имеется от двух до шести атомов углерода, т.е. данная алкенильная цепь выбрана из группы, состоящей из этенила, пропен-1-ила, пропен-2-ила, пропен-3-ила, бутен-1-ила, бутен-2-ила, бутен-3-ила, бутен-4-ила, 1-метил-пропен-1-ила, 2-метил-пропен-1-ила, 1-этил-этен-1-ила, 2-метил-пропен-3-ила, бута-1,3-диенила, бута-1,2-диенила и бута-1,2-диен-4-ила.The term "alkenyl" as used herein refers to a straight or branched hydrocarbon chain containing one or more double bonds. A given alkenyl group may have from 2 to 20 carbon atoms, although the present definition also covers the occurrence of the term "alkenyl" where no numerical range is designated. The alkenyl group may also be a medium sized alkenyl group having from 2 to 9 carbon atoms. The alkenyl group could also be lower alkenyl, having from 2 to 6 carbon atoms. An alkenyl group may be designated "C 2 -C 6 alkenyl" or similar designations. By way of example only, “C 2 -C 6 alkenyl” indicates that the alkenyl chain has from two to six carbon atoms, i.e. the alkenyl chain is selected from the group consisting of ethenyl, propen-1-yl, propen-2-yl, propen-3-yl, buten-1-yl, buten-2-yl, buten-3-yl, buten-4 -yl, 1-methyl-propen-1-yl, 2-methyl-propen-1-yl, 1-ethyl-ethen-1-yl, 2-methyl-propen-3-yl, buta-1,3-dienyl , buta-1,2-dienyl and buta-1,2-dien-4-yl.

Типичные алкенильные группы включают, но ни к коей мере не ограничиваются этенилом, пропенилом, бутенилом, пентенилом и гексенилом, и тому подобными.Typical alkenyl groups include, but are in no way limited to ethenyl, propenyl, butenyl, pentenyl and hexenyl, and the like.

Термин «алкинил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, содержащей одну или более чем одну тройную связь. Данная алкинильная группа может иметь от 2 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «алкинил», где не обозначается числовой интервал. Алкинильная группа также может представлять собой алкинил среднего размера, имеющий от 2 до 9 атомов углерода. Алкинильная группа также могла бы быть низшим алкинилом, имеющим от 2 до 6 атомов углерода. Алкинильная группа может быть обозначена как «С26 алкинил» или аналогичными обозначениями. Лишь в качестве примера, «С26 алкинил» указывает на то, что в алкинильной цепи имеется от двух до шести атомов углерода, т.е. данная алкинильная цепь выбрана из группы, состоящей из этинила, пропин-1-ила, пропин-2-ила, бутин-1-ила, бутин-3-ила, бутин-4-ила и 2-бутинила. Типичные алкинильные группы включают, но ни к коей мере не ограничиваются этинилом, пропинилом, бутинилом, пентинилом и гексинилом, и тому подобными.The term "alkynyl" as used herein refers to a straight or branched hydrocarbon chain containing one or more triple bonds. A given alkynyl group may have from 2 to 20 carbon atoms, although the present definition also covers the occurrence of the term "alkynyl" where no numerical range is indicated. The alkynyl group may also be a medium sized alkynyl group having from 2 to 9 carbon atoms. The alkynyl group could also be a lower alkynyl group having from 2 to 6 carbon atoms. An alkynyl group may be designated "C 2 -C 6 alkynyl" or similar designations. By way of example only, "C 2 -C 6 alkynyl" indicates that the alkynyl chain has from two to six carbon atoms, i.e. the alkynyl chain is selected from the group consisting of ethynyl, propyn-1-yl, propyn-2-yl, butyn-1-yl, butyn-3-yl, butyn-4-yl and 2-butynyl. Typical alkynyl groups include, but are by no means limited to, ethynyl, propynyl, butynyl, pentynyl and hexynyl, and the like.

Термин «гетероалкил» в том виде, в котором он используется в данном документе, относится к прямой или разветвленной углеводородной цепи, содержащей один или более чем один гетероатом, то есть, отличный от углерода элемент в остове цепи, включающий азот, кислород и серу, но не ограничивающийся ими. Гетероалкильная группа может иметь от 1 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «гетероалкил», где не обозначается числовой интервал. Гетероалкильная группа также может представлять собой гетероалкил среднего размера, имеющий от 1 до 9 атомов углерода. Данная гетероалкильная группа также могла бы быть низшим гетероалкилом, имеющим от 1 до 6 атомов углерода. Данная гетероалкильная группа может быть обозначена «С16 гетероалкил» или аналогичными обозначениями. Данная гетероалкильная группа может содержать один или более чем один гетероатом. Лишь в качестве примера, «С46 гетероалкил» указывает то, что имеется от четырех до шести атомов углерода в гетероалкильной цепи и дополнительно один или более чем один гетероатом в остове цепи.The term "heteroalkyl" as used herein refers to a straight or branched hydrocarbon chain containing one or more than one heteroatom, that is, a non-carbon element in the backbone of the chain including nitrogen, oxygen and sulfur, but not limited to them. A heteroalkyl group may have from 1 to 20 carbon atoms, although the present definition also covers the occurrence of the term "heteroalkyl" where no numerical range is designated. The heteroalkyl group may also be a medium-sized heteroalkyl having from 1 to 9 carbon atoms. This heteroalkyl group could also be a lower heteroalkyl having from 1 to 6 carbon atoms. This heteroalkyl group may be designated "C 1 -C 6 heteroalkyl" or similar designations. A given heteroalkyl group may contain one or more than one heteroatom. By way of example only, "C 4 -C 6 heteroalkyl" indicates that there are four to six carbon atoms in the heteroalkyl chain and additionally one or more than one heteroatom in the backbone of the chain.

Термин «ароматический» относится к кольцу или кольцевой системе, имеющей систему конъюгированных пи-электронов, и он включает как карбоциклическую ароматическую (например, фенильную), так и гетероциклическую ароматическую группы (например, пиридин). Данный термин включает моноциклическую группу или полициклическую группу с конденсированным кольцом (т.е. кольца, которые имеют общие смежные пары атомов), при условии, что вся кольцевая система является ароматической.The term "aromatic" refers to a ring or ring system having a system of conjugated pi electrons, and it includes both carbocyclic aromatic (eg phenyl) and heterocyclic aromatic groups (eg pyridine). This term includes a monocyclic group or a polycyclic group with a fused ring (i.e., rings that share adjacent pairs of atoms), provided that the entire ring system is aromatic.

Термин «арил» в том виде, в котором он используется в данном документе, относится к ароматическому кольцу или кольцевой системе (т.е. к двум или более чем двум конденсированным кольцам, которые имеют два общих смежных атома углерода), содержащей только углерод в остове кольца. Когда арил представляет собой кольцевую систему, каждое кольцо в данной системе является ароматическим. Арильная группа может иметь от 6 до 18 атомов углерода, хотя настоящее определение также охватывает появление термина «арил», где не обозначается числовой интервал. В некоторых воплощениях арильная группа имеет от 6 до 10 атомов углерода. Данная арильная группа может быть обозначена как «С610 арил», «С6 или С10 арил» или аналогичными обозначениями. Примеры арильных групп включают фенил, нафтил, азуленил и антраценил, но не ограничиваются ими.The term "aryl" as used herein refers to an aromatic ring or ring system (i.e., two or more fused rings that share two adjacent carbon atoms) containing only the carbon at the core of the ring. When aryl is a ring system, each ring in the system is aromatic. An aryl group may have from 6 to 18 carbon atoms, although the present definition also covers the occurrence of the term "aryl" where no numerical range is indicated. In some embodiments, the aryl group has from 6 to 10 carbon atoms. This aryl group may be designated "C 6 -C 10 aryl", "C 6 or C 10 aryl" or similar designations. Examples of aryl groups include, but are not limited to, phenyl, naphthyl, azulenyl, and anthracenyl.

«Аралкил» или «арилалкил» представляет собой арильную группу, присоединенную, в качестве заместителя, через алкиленовую группу, как, например, «С7-14 аралкил» и тому подобные, включающую бензил, 2-фенилэтил, 3-фенилпропил и нафтилалкил, но не ограничивающуюся ими. В некоторых случаях алкиленовая группа представляет собой низшую алкиленовую группу (т.е. С16 алкиленовую группу)."Aralkyl" or "arylalkyl" is an aryl group attached, as a substituent, through an alkylene group, such as "C 7-14 aralkyl" and the like, including benzyl, 2-phenylethyl, 3-phenylpropyl and naphthylalkyl, but not limited to them. In some cases, the alkylene group is a lower alkylene group (ie, a C 1 -C 6 alkylene group).

Термин «гетероарил» в том виде, в котором он используется в данном документе, относится к ароматическому кольцу или кольцевой системе (т.е. к двум или более чем двум конденсированным кольцам, которые имеют два смежных атома), которая(рые) содержит(жат) один или более чем один гетероатом, то есть, к отличному от углерода элементу в остове кольца, включающему азот, кислород и серу, но не ограничивающемуся ими. Когда гетероарил представляет собой кольцевую систему, каждое кольцо в данной системе является ароматическим. Гетероарильная группа может иметь 5-18 членов кольца (т.е. число атомов, составляющих остов кольца, включая атомы углерода и гетероатомы), хотя настоящее определение также охватывает появление термина «гетероарил», где не обозначается числовой интервал. В некоторых воплощениях гетероарильная группа имеет от 5 до 10 членов кольца или от 5 до 7 членов кольца. Гетероарильная группа может быть обозначена как «5-7-членный гетероарил», «5-10-членный гетероарил» или аналогичными обозначениями. Примеры гетероарильных колец включают фурил, тиенил, фталазинил, пирролил, оксазолил, тиазолил, имидазолил, пиразолил, изоксазолил, изотиазолил, триазолил, тиадиазолил, пиридинил, пиридазинил, пиримидинил, пиразинил, триазинил, хинолинил, изохинолинил, бензимидазолил, бензоксазолил, бензотиазолил, индолил, изоиндолил и бензотиенил, но не ограничиваются ими.The term "heteroaryl" as used herein refers to an aromatic ring or ring system (i.e., two or more fused rings that have two adjacent atoms) which contains ( zhat) one or more than one heteroatom, that is, to an element other than carbon in the backbone of the ring, including, but not limited to, nitrogen, oxygen and sulfur. When heteroaryl is a ring system, each ring in the system is aromatic. A heteroaryl group may have 5-18 ring members (ie, the number of atoms constituting the backbone of the ring, including carbon atoms and heteroatoms), although the present definition also covers the occurrence of the term “heteroaryl” where no numerical range is indicated. In some embodiments, the heteroaryl group has from 5 to 10 ring members or from 5 to 7 ring members. A heteroaryl group may be designated "5-7 membered heteroaryl", "5-10 membered heteroaryl" or similar designations. Examples of heteroaryl rings include furyl, thienyl, phthalazinyl, pyrrolyl, oxazolyl, thiazolyl, imidazolyl, pyrazolyl, isoxazolyl, isothiazolyl, triazolyl, thiadiazolyl, pyridinyl, pyridazinyl, pyrimidinyl, pyrazinyl, triazinyl, quinolinyl, isoquinolinyl, benzimidazolyl, benzoxazolyl, benzothiazolyl, indolyl, isoindolyl and benzothienyl, but are not limited to them.

«Гетероаралкил» или «гетероарилалкил» представляет собой гетероарильную группу, соединенную, в качестве заместителя, через алкиленовую группу. Примеры включают 2-тиенилметил, 3-тиенилметил, фурилметил, тиенилэтил, пирролилалкил, пиридилалкил, изоксазоллилалкил и имидазолилалкил. В некоторых случаях алкиленовая группа представляет собой низшую алкиленовую группу (т.е. С16 алкиленовую группу)."Heteroaralkyl" or "heteroarylalkyl" is a heteroaryl group linked, as a substituent, through an alkylene group. Examples include 2-thienylmethyl, 3-thienylmethyl, furylmethyl, thienylethyl, pyrrolylalkyl, pyridylalkyl, isoxazollylalkyl and imidazolylalkyl. In some cases, the alkylene group is a lower alkylene group (ie, a C 1 -C 6 alkylene group).

Термин «карбоциклил» в том виде, в котором он используется в данном документе, означает неароматическое циклическое кольцо или кольцевую систему, содержащую только атомы углерода в остове кольцевой системы. Когда карбоциклил представляет собой кольцевую систему, два или более чем два кольца могут быть связаны друг с другом конденсированным, мостиковым или спиро-соединенным способом. Карбоциклилы могут иметь любую степень насыщения, при условии, что по меньшей мере одно кольцо в данной кольцевой системе не является ароматическим. Таким образом, карбоциклилы включают циклоалкилы, циклоалкенилы и циклоалкинилы. Карбоциклильная группа может иметь от 3 до 20 атомов углерода, хотя настоящее определение также охватывает появление термина «карбоциклил», где не обозначается числовой интервал. Карбоциклильная группа также может представлять собой карбоциклил среднего размера, имеющий от 3 до 10 атомов углерода. Карбоциклильная группа также может представлять собой карбоциклил, имеющий от 3 до 6 атомов углерода. Карбоциклильная группа может быть обозначена «С36 карбоциклил» или аналогичными обозначениями. Примеры карбо цикл ильных колец включают циклопропил, циклобутил, циклопентил, циклогексил, циклогексенил, 2,3-дигидро-инден, бицикл[2.2.2]октанил, адамантил и спиро[4.4]нонанил, но не ограничиваются ими.The term "carbocyclyl" as used herein means a non-aromatic cyclic ring or ring system containing only carbon atoms in the backbone of the ring system. When the carbocyclyl is a ring system, two or more than two rings may be linked to each other in a fused, bridged or spiro-linked manner. Carbocyclyls can have any degree of saturation, as long as at least one ring in the ring system is non-aromatic. Thus, carbocyclyls include cycloalkyls, cycloalkenyls and cycloalkynyls. A carbocyclyl group may have from 3 to 20 carbon atoms, although the present definition also covers the occurrence of the term "carbocyclyl" where no numerical range is indicated. The carbocyclyl group may also be a medium sized carbocyclyl having from 3 to 10 carbon atoms. The carbocyclyl group may also be a carbocyclyl group having from 3 to 6 carbon atoms. A carbocyclyl group may be designated "C 3 -C 6 carbocyclyl" or similar designations. Examples of carbocyclyl rings include, but are not limited to, cyclopropyl, cyclobutyl, cyclopentyl, cyclohexyl, cyclohexenyl, 2,3-dihydro-indene, bicycl[2.2.2]octanyl, adamantyl, and spiro[4.4]nonanyl.

Термин «циклоалкил» в том виде, в котором он используется в данном документе, означает полностью насыщенное карбоциклильное кольцо или кольцевую систему. Примеры включают циклопропил, циклобутил, циклопентил и циклогексил.The term "cycloalkyl" as used herein means a fully saturated carbocyclyl ring or ring system. Examples include cyclopropyl, cyclobutyl, cyclopentyl and cyclohexyl.

Термин «гетероциклил» в том виде, в котором он используется в данном документе, означает неароматическое циклическое кольцо или кольцевую систему, содержащую по меньшей мере один гетероатом в остове кольца. Гетероциклилы могут быть связаны друг с другом конденсированным, мостиковым или спиро-связанным способом. Гетероциклилы могут иметь любую степень насыщения, при условии, что по меньшей мере одно кольцо в данной кольцевой системе не является ароматическим. Гетероатом(мы) может(гут) присутствовать либо в неароматическом, либо в ароматическом кольце в кольцевой системе. Гетероциклическая группа может иметь от 3 до 20 членов кольца (т.е. число атомов, составляющих остов кольца, включая атомы углерода и гетероатомы), хотя настоящее определение также охватывает появление термина «гетероциклил», где не обозначается числовой интервал. Гетероциклильная группа также может представлять собой гетероциклил среднего размера, имеющий от 3 до 10 членов кольца. Данная гетероциклильная группа также могла бы быть гетероциклилом, имеющим от 3 до 6 членов кольца. Данная гетероциклильная группа может быть обозначена как «3-6-членный гетероциклил» или аналогичными обозначениями. В предпочтительных шестичленных моноциклических гетероциклилах гетероатом(мы) выбран(ны) из одного-трех О, N или S, и в предпочтительных пятичленных моноциклических гетероциклилах гетероатом(мы) выбран(ны) из одного или двух гетероатомов, выбранных из О, N или S. Примеры гетероциклильных колец включают азепинил, акридинил, карбазолил, циннолинил, диоксоланил, имидазолинил, имидазолидинил, морфолинил, оксиранил, оксепанил, тиепанил, пиперидинил, пиперазинил, диоксопиперазинил, пирролидинил, пирролидонил, пирролидионил, 4-пиперидонил, пиразолинил, пиразолидинил, 1,3-диоксинил, 1,3-диоксанил, 1,4-диоксинил, 1,4-диоксанил, 1,3-оксатианил, 1,4-оксатиинил, 1,4-оксатианил, 2Н-1,2-оксазинил, триоксанил, гексагидро-1,3,5-триазинил, 1,3-диоксолил, 1,3-диоксоланил, 1,3-дитиолил, 1,3-дитиоланил, изоксазолинил, изоксазолидинил, оксазолинил, оксазолидинил, оксазолидинонил, тиазолинил, тиазолидинил, 1,3-оксатиоланил, индолинил, изоиндолинил, тетрагидрофуранил, тетрагидропиранил, тетрагидротиофенил, тетрагидротиопиранил, тетрагидро-1,4-тиазинил, тиаморфолинил, дигидробензофуранил, бензимидазолидинил и тетрагидрохинолин, но не ограничиваются ими.The term “heterocyclyl” as used herein means a non-aromatic cyclic ring or ring system containing at least one heteroatom in the core of the ring. Heterocyclyls can be linked to each other in a fused, bridged or spiro-linked manner. Heterocyclyls can have any degree of saturation, as long as at least one ring in the ring system is non-aromatic. The heteroatom(s) may be present on either a non-aromatic or an aromatic ring in a ring system. A heterocyclic group may have from 3 to 20 ring members (ie, the number of atoms that make up the core of the ring, including carbon atoms and heteroatoms), although the present definition also covers the occurrence of the term “heterocyclyl” where no numerical range is indicated. The heterocyclyl group may also be a medium-sized heterocyclyl group having from 3 to 10 ring members. This heterocyclyl group could also be a heterocyclyl having 3 to 6 ring members. This heterocyclyl group may be designated "3-6 membered heterocyclyl" or similar designations. In preferred six-membered monocyclic heterocyclyls, the heteroatom(s) are selected from one to three O, N or S, and in preferred five-membered monocyclic heterocyclyls, the heteroatom(s) are selected from one or two heteroatoms selected from O, N or S Examples of heterocyclyl rings include azepinyl, acridinyl, carbazolyl, cinnolinyl, dioxolanyl, imidazolinyl, imidazolidinyl, morpholinyl, oxiranyl, oxepanyl, tiepanyl, piperidinyl, piperazinyl, dioxopiperazinyl, pyrrolidinyl, pyrrolidonyl, pyrrolidionyl, 4-piperidonyl, pyrazolinyl, pyrazolidinyl, 1,3 -dioxynyl, 1,3-dioxanyl, 1,4-dioxynyl, 1,4-dioxanyl, 1,3-oxathianyl, 1,4-oxathiinyl, 1,4-oxathianyl, 2H-1,2-oxazinyl, trioxanyl, hexahydro -1,3,5-triazinyl, 1,3-dioxolyl, 1,3-dioxolanyl, 1,3-dithiolyl, 1,3-dithiolanyl, isoxazolinyl, isoxazolidinyl, oxazolinyl, oxazolidinyl, oxazolidinonyl, thiazolinyl, thiazolidinyl, 1,3 -oxathiolanyl, indolinyl, isoindolinyl, tetrahydrofuranyl, tetrahydropyranyl, tetrahydrothiophenyl, tetrahydrothiopyranyl, tetrahydro-1,4-thiazinyl, thiamorpholinyl, dihydrobenzofuranyl, benzimidazolidinyl and tetrahydroquinoline.

«О-карбокси» группа относится к группе «-OC(=O)R», в которой R выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.The "O-carboxy" group refers to the group "-OC(=O)R", in which R is selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 - C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl as defined herein.

«С-карбокси» группа относится к группе «-C(=O)OR», в которой R выбран из группы, состоящей из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе. Неограничивающий пример включает карбоксил (т.е. -С(=O)ОН).The "C-carboxy" group refers to the group "-C(=O)OR", in which R is selected from the group consisting of hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl , C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein. A non-limiting example includes carboxyl (ie -C(=O)OH).

«Сульфонильная» группа относится к группе «-SO2R», в которой R выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.A "sulfonyl" group refers to the group "-SO 2 R" in which R is selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl as defined herein.

«Сульфино» группа относится к группе «-S(=O)OH».The “sulfino” group refers to the “-S(=O)OH” group.

«S-сульфонамидо» группа относится к группе «-SO2NRARB», в которой каждый из RA и RB независимо выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.The "S-sulfonamido" group refers to the group "-SO 2 NR A R B ", in which each of R A and RB is independently selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 - C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein.

«N-сульфонамидо» группа относится к группе «-N(RA)SO2Rb», в которой каждый из RA и RB независимо выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.The "N-sulfonamido" group refers to the group "-N( RA )SO 2 R b ", in which each of RA and RB is independently selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein.

«С-амидо» группа относится к группе «-C(=O)NRARB», в которой каждый из RA и RB независимо выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.The "C-amido" group refers to the group "-C(=O)NR A R B ", in which each of R A and R B is independently selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein.

«N-амидо» группа относится к группе «-N(RA)C(=O)RB», в которой каждый из RA и RB независимо выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе.An "N-amido" group refers to the group "-N(R A )C(=O)R B ", in which each of R A and R B is independently selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein.

«Аминогруппа» относится к группе «-NRARB», в которой каждый из RA и RB независимо выбран из водорода, С16 алкила, С26 алкенила, С26 алкинила, С37 карбоциклила, С610 арила, 5-10-членного гетероарила и 3-10-членного гетероциклила, как определено в данном документе. Неограничивающий пример включает свободный амино (т.е. -NH2)."Amino group" refers to the group "-NR A R B ", in which each of R A and R B is independently selected from hydrogen, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 3 -C 7 carbocyclyl, C 6 -C 10 aryl, 5-10 membered heteroaryl and 3-10 membered heterocyclyl, as defined herein. A non-limiting example includes free amino (ie -NH 2 ).

«Аминоалкильная» группа относится к аминогруппе, присоединенной через алкиленовую группу.An "aminoalkyl" group refers to an amino group attached via an alkylene group.

«Алкоксиалкильная» группа относится к алкоксигруппе, присоединенной через алкиленовую группу, такой как «С28 алкоксиалкил» и тому подобное.An "alkoxyalkyl" group refers to an alkoxy group attached through an alkylene group, such as "C 2 -C 8 alkoxyalkyl" and the like.

Замещенная группа в том виде, в котором данный термин используется в данном документе, происходит от незамещенной родительской группы, в которой была замена одного или более чем одного атома водорода на другой атом или группу. Если не указано иное, когда группа считается «замещенной», подразумевается то, что данная группа замещена одним или более чем одним заместителем, независимо выбранным из C1-C6 алкила, С16 алкенила, С16 алкинила, С16 гетероалкила, С37 карбоциклила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, С16 галогеналкилом и С16 галогеналкокси), С37 карбоциклил-С16-алкила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, С16 галогенал килом и C1-C6 галогеналкокси), 3-10-членного гетероциклила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, С16 галогенал килом и С16 галогеналкокси), 3-10-членного гетероциклил-С16-алкила (возможно замещенного галоген-, C1-C6 алкилом, С16 алкокси, С16 галогеналкилом и C1-C6 галогеналкокси), арила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, C1-C6 галогеналкилом и С16 галогеналкокси), арил(С16)алкила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, С16 галогеналкилом и С16 галогеналкокси), 5-10-членного гетероарила (возможно замещенного галоген-, С16 алкилом, C1-C6 алкокси, С16 галогеналкилом и С16 галогеналкокси), 5-10-членного гетероарил(С16)алкила (возможно замещенного галоген-, С16 алкилом, С16 алкокси, С16 галогеналкилом и С16 галогеналкокси), галоген-, -CN, гидрокси, С16 алкокси, С16 алкокси(С16)алкила (т.е. простой эфир), арилокси, сульфгидрила (меркапто), галоген(С16)алкила (например, -CF3), галогенC16)алкокси (например, -OCF3), С16 алкилтио, арилтио, амино, амино(C1-C6)алкила, нитро, О-карбамила, N-карбамила, О-тиокарбамила, N-тиокарбамила, С-амидо, N-амидо, S-сульфонамидо, N-сульфонамидо, С-карбокси, О-карбокси, ацила, цианато, изоцианато, тиоцианато, изотиоцианато, сульфинила, сульфонила, -SO3H, сульфино, -OSO2C1-4алкила и оксо (=O). Во всех случаях если группа описывается как «возможно замещенная», данная группа может быть замещена приведенными выше заместителями.A substituted group, as the term is used herein, is derived from an unsubstituted parent group in which one or more hydrogen atoms have been replaced by another atom or group. Unless otherwise indicated, when a group is considered "substituted", it is meant that the group is substituted with one or more substituents independently selected from C 1 -C 6 alkyl, C 1 -C 6 alkenyl, C 1 -C 6 alkynyl, C 1 -C 6 heteroalkyl, C 3 -C 7 carbocyclyl (possibly substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), C 3 -C 7 carbocyclyl-C 1 -C 6 -alkyl (possibly substituted with halogen-, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 3- 10-membered heterocyclyl (possibly substituted with halogen-, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 3-10-membered heterocyclyl-C 1 - C 6 -alkyl (possibly substituted with halogen-, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), aryl (possibly substituted with halogen-, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), aryl(C 1 -C 6 )alkyl (possibly substituted with halogen, C 1 -C 6 alkyl, C 1 - C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 5-10 membered heteroaryl (possibly substituted with halogen, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), 5-10-membered heteroaryl (C 1 -C 6 )alkyl (possibly substituted with halogen-, C 1 -C 6 alkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkyl and C 1 -C 6 haloalkoxy), halogen-, -CN, hydroxy, C 1 -C 6 alkoxy, C 1 -C 6 alkoxy (C 1 -C 6 )alkyl (i.e. ether), aryloxy, sulfhydryl (mercapto), halogen(C 1 -C 6 )alkyl (for example, -CF 3 ), halogenC 1 -C 6 )alkoxy (for example, -OCF 3 ), C 1 -C 6 alkylthio, arylthio, amino, amino(C 1 -C 6 )alkyl, nitro, O-carbamyl, N-carbamyl, O-thiocarbamyl, N-thiocarbamyl, C-amido, N-amido, S-sulfonamido, N-sulfonamido, C- carboxy, O-carboxy, acyl, cyanato, isocyanato, thiocyanato, isothiocyanato, sulfinyl, sulfonyl, -SO 3 H, sulfin, -OSO 2 C1-4alkyl and oxo (=O). In all cases, if a group is described as "optionally substituted", the group may be substituted with the substituents listed above.

Термин «гидрокси» в том виде, в котором он используется в данном документе, относится к группе -ОН.The term "hydroxy" as used herein refers to the -OH group.

Термин «цианогруппа» в том виде, в котором он используется в данном документе, относится к группе «-CN».The term "cyano group" as used herein refers to the "-CN" group.

Термин «азидо» в том виде, в котором он используется в данном документе, относится к группе -N3.The term "azido" as used herein refers to the -N 3 group.

Термин «нуклеотид» в том виде, в котором он используется в данном документе, включает азотсодержащее гетероциклическое основание, сахар и одну или более чем одну фосфатную группу. Они представляют собой мономерные звенья последовательности нуклеиновой кислоты. В РНК сахар представляет собой рибозу, а в ДНК - дезоксирибозу, т.е. сахар с отсутствием гидроксильной группы, которая присутствует в рибозе. Азотсодержащим гетероциклическим основанием может быть пуриновое или пиримидиновое основание. Пуриновые основания включают аденин (А) и гуанин (G), и их модифицированные производные или аналоги. Пиримидиновые основания включают цитозин (С), тимин (Т) и урацил (U), и их модифицированные производные или аналоги. Атом С-1 дезоксирибозы связывается с N-1 пиримидина или N-9 пурина.The term "nucleotide" as used herein includes a nitrogen-containing heterocyclic base, a sugar, and one or more phosphate groups. They are monomeric units of a nucleic acid sequence. In RNA, the sugar is ribose, and in DNA it is deoxyribose, i.e. a sugar lacking the hydroxyl group found in ribose. The nitrogen-containing heterocyclic base may be a purine or pyrimidine base. Purine bases include adenine (A) and guanine (G), and their modified derivatives or analogs. Pyrimidine bases include cytosine (C), thymine (T), and uracil (U), and their modified derivatives or analogs. The C-1 atom of deoxyribose binds to N-1 of pyrimidine or N-9 of purine.

«Нуклеозид» в том виде, в котором данный термин используется в данном документе, является структурно сходным с нуклеотидом, но с отсутствием фосфатных группировок. Примером аналога нуклеозида был бы аналог, в котором с основанием связывается метка, и отсутствует фосфатная группа, присоединенная к молекуле сахара. Термин «нуклеозид» используется в данном документе в его исходном смысле, как понятно специалистам в данной области. Примеры включают рибонуклеозид, содержащий рибозный фрагмент, и дезоксирибонуклеозид, содержащий дезоксирибозный фрагмент, но не ограничиваются ими. Модифицированный пентозный фрагмент представляет собой пентозный фрагмент, в котором атом кислорода был заменен углеродом, и/или углерод был заменен серой или атомом кислорода. «Нуклеозид» представляет собой мономер, который имеет замещенное основание и/или сахарный фрагмент. Дополнительно, нуклеозид может быть включен в большие полимеры ДНК и/или РНК и олигомеры.A "nucleoside" as the term is used herein is structurally similar to a nucleotide but lacks the phosphate moieties. An example of a nucleoside analog would be one in which a tag is bound to the base and there is no phosphate group attached to the sugar molecule. The term "nucleoside" is used herein in its original sense, as understood by those skilled in the art. Examples include, but are not limited to, a ribonucleoside containing a ribose moiety and a deoxyribonucleoside containing a deoxyribose moiety. A modified pentose moiety is a pentose moiety in which the oxygen atom has been replaced by carbon, and/or the carbon has been replaced by sulfur or an oxygen atom. A "nucleoside" is a monomer that has a substituted base and/or sugar moiety. Additionally, the nucleoside may be included in large DNA and/or RNA polymers and oligomers.

Термин «пуриновое основание» используется в данном документе в его исходном смысле, как понятно специалистам в данной области, и включает его таутомеры. Аналогичным образом, термин «пиримидиновое основание» используется в данном документе в его исходном смысле, как понятно специалистам в данной области, и включает его таутомеры. Неограничивающий список возможно замещенных пуриновых оснований включает пурин, аденин, гуанин, гипоксантин, ксантин, аллоксантин, 7-алкилгуанин (например, 7-метилгуанин), теобромин, кофеин, мочевую кислоту и изогуанин. Примеры пиримидиновых оснований включают цитозин, тимин, урацил, 5,6-дигидроурацил и 5-алкилцитозин (например, 5-метилцитозин), но не ограничиваются ими.The term “purine base” is used herein in its original sense, as understood by those skilled in the art, and includes its tautomers. Likewise, the term “pyrimidine base” is used herein in its original sense, as understood by those skilled in the art, and includes tautomers thereof. A non-limiting list of possibly substituted purine bases includes purine, adenine, guanine, hypoxanthine, xanthine, alloxanthine, 7-alkylguanine (eg, 7-methylguanine), theobromine, caffeine, uric acid and isoguanine. Examples of pyrimidine bases include, but are not limited to, cytosine, thymine, uracil, 5,6-dihydrouracil, and 5-alkylcytosine (eg, 5-methylcytosine).

При описании олигонуклеотида или полинуклеотида, в том виде, в котором данные термины используются в данном документе, как «содержащих» нуклеозид или нуклеотид, описанный в данном документе, это означает то, что нуклеозид или нуклеотид, описанный в данном документе, образует ковалентную связь сданным олигонуклеотидом или полинуклеотидом. Аналогичным образом, при описании нуклеозида или нуклеотида как части олигонуклеотида или полинуклеотида, таких как «включенные в» олигонуклеотид или полинуклеотид, это означает то, что нуклеозид или нуклеотид, описанный в данном документе, образует ковалентную связь с данным олигонуклеотидом или полинуклеотидом. В некоторых таких воплощениях ковалентная связь образуется между 3’-гидроксигруппой олигонуклеотида или полинуклеотида с 5'-фосфатной группой нуклеотида, описанного в данном документе, в виде фосфодиэфирной связи между 3' атомом углерода олигонуклеотида или полинуклеотида и 5' атомом углерода данного нуклеотида.When an oligonucleotide or polynucleotide, as these terms are used herein, is described as “containing” a nucleoside or nucleotide described herein, it means that the nucleoside or nucleotide described herein forms a covalent bond oligonucleotide or polynucleotide. Likewise, when describing a nucleoside or nucleotide as part of an oligonucleotide or polynucleotide, such as “incorporated into” an oligonucleotide or polynucleotide, it means that the nucleoside or nucleotide described herein forms a covalent bond with the oligonucleotide or polynucleotide. In some such embodiments, a covalent bond is formed between the 3'-hydroxy group of the oligonucleotide or polynucleotide with the 5'-phosphate group of the nucleotide described herein, in the form of a phosphodiester bond between the 3' carbon atom of the oligonucleotide or polynucleotide and the 5' carbon atom of the nucleotide.

Термин «производное» или «аналог» в том виде, в котором он используется в данном документе, означает синтетическое нуклеотидное или нуклеозидное производное, имеющее модифицированные фрагменты основания и/или модифицированные фрагменты сахара. Такие производные и аналоги обсуждаются, например, в Scheit, Nucleotide Analogs (John Wiley & Son, 1980) и Uhlman et al., Chemical Reviews 90:543-584, 1990. Нуклеотидные аналоги также могут содержать модифицированные фосфодиэфирные связи, включающие фосфоротиоатные, фосфородитиоатные, алкил-фосфонатные,The term “derivative” or “analogue” as used herein means a synthetic nucleotide or nucleoside derivative having modified base moieties and/or modified sugar moieties. Such derivatives and analogs are discussed, for example, in Scheit, Nucleotide Analogs (John Wiley & Son, 1980) and Uhlman et al., Chemical Reviews 90:543-584, 1990. Nucleotide analogs may also contain modified phosphodiester bonds, including phosphorothioate, phosphorodithioate , alkyl phosphonate,

фосфоранилидатные и фосфорамидатные связи. Термины «производное», «аналог» и «модифицированный» в том виде, в котором они используются в данном документе, могут использоваться взаимозаменяемо и охватываются терминами «нуклеотид» и «нуклеозид», определенными в данном документе.phosphoranidate and phosphoramidate bonds. The terms “derivative,” “analog,” and “modified,” as used herein, may be used interchangeably and are encompassed by the terms “nucleotide” and “nucleoside” as defined herein.

Термин «фосфат» в том виде, в котором он используется в данном документе, используется в его обычном смысле, как понятно специалистам в данной области, и включает его протонированные формы (например, ). Термины «монофосфат», «дифосфат» и «трифосфат» в том виде, в котором они используются в данном документе, используется в их обычном смысле, как понятно специалистам в данной области, и включают протонированные формы.The term “phosphate” as used herein is used in its ordinary sense as understood by those skilled in the art and includes its protonated forms (e.g. ). The terms "monophosphate", "diphosphate" and "triphosphate" as used herein are used in their ordinary sense as understood by those skilled in the art and include the protonated forms.

Термины «защитная группа» и «защитные группы» в том виде, в котором они используются в данном документе, относятся к любому атому или группе атомов, которые добавляются к молекуле для того, чтобы предотвращать нежелательные химические реакции существующих групп в молекуле. Иногда термины «защитная группа» и «блокирующая группа» могут использоваться взаимозаменяемо.The terms “protecting group” and “protecting groups” as used herein refer to any atom or group of atoms that is added to a molecule to prevent unwanted chemical reactions of existing groups in the molecule. Sometimes the terms "protecting group" and "blocking group" may be used interchangeably.

Приставки «фото» или «фото-» в том виде, в котором они используются в данном документе, означают относящиеся к световому или электромагнитному излучению. Данный термин может охватывать весь электромагнитный спектр или часть электромагнитного спектра, включая один или более чем один интервал, обычно известный как радио, микроволновые, инфракрасные, видимые, ультрафиолетовые, рентгеновские или гамма-лучевые части спектра, но не ограничиваясь ими. Данная часть спектра может представлять собой часть спектра, которая блокируется металлической областью поверхности, как, например, теми металлами, которые изложены в данном документе. Альтернативно или дополнительно, данная часть спектра может представлять собой часть спектра, которая проходит через промежуточную область поверхности, такую как область, сделанная из стекла, пластмассы, диоксида кремния или другого вещества, изложенного в данном документе. В конкретных воплощениях может использоваться излучение, которое способно проходить через металл. Альтернативно или дополнительно, может использоваться излучение, которое маскируется стеклом, пластмассой, диоксидом кремния или другим веществом, изложенным в данном документе.The prefixes “photo” or “photo-” as used herein refer to light or electromagnetic radiation. The term may cover all or part of the electromagnetic spectrum, including, but not limited to, one or more than one range commonly known as the radio, microwave, infrared, visible, ultraviolet, x-ray or gamma ray portions of the spectrum. This portion of the spectrum may be a portion of the spectrum that is blocked by a metallic region of the surface, such as those metals disclosed herein. Alternatively or additionally, this portion of the spectrum may be the portion of the spectrum that passes through an intermediate surface region, such as a region made of glass, plastic, silica, or other substance set forth herein. In particular embodiments, radiation that is capable of passing through metal may be used. Alternatively or additionally, radiation may be used that is masked by glass, plastic, silica, or other substance set forth herein.

Термин «фазирование» в том виде, в котором он используется в данном документе, относится к явлению в SBS, которое вызвано неполным удалением 3' терминаторов и флуорофоров, и неудачей в завершении включения части цепей ДНК в кластеры посредством полимераз в данном цикле секвенирования. Предфазирование вызвано включением нуклеотидов без эффективных 3' терминаторов, где событие включения идет 1 циклом ранее из-за неудачи терминации. Фазирование и предфазирование вызывают то, что измеренные интенсивности сигнала для конкретного цикла состоят из сигнала от текущего цикла, а также из шума от предшествующего и последующего циклов. По мере увеличения числа циклов, доля последовательностей на кластер, подвергавшихся фазированию и предфазированию, увеличивается, затрудняя идентификацию правильного основания. Предфазирование может быть вызвано присутствием следового количества незащищенных или неблокированных 3’-ОН нуклеотидов во время секвенирования посредством синтеза (SBS). Незащищенные 3’-ОН нуклеотиды могли бы быть получены во время процессов изготовления или возможно во время хранения и процессов манипуляций с реагентами. Соответственно, открытие аналогов нуклеотидов, которые уменьшают частоту предфазирования, является неожиданным и обеспечивает большое преимущество в приложениях SBS над существующими аналогами нуклеотидов. Например, предоставленные аналоги нуклеотидов могут приводить к более короткому времени цикла SBS, меньшим значениям фазирования и предфазирования, и большей длине считываемых фрагментов секвенирования.The term "phasing" as used herein refers to a phenomenon in SBS that is caused by incomplete removal of 3' terminators and fluorophores, and failure to complete the incorporation of a portion of DNA strands into clusters by polymerases in a given sequencing run. Prephasing is caused by the incorporation of nucleotides without effective 3' terminators, where the incorporation event occurs 1 cycle earlier due to termination failure. Phasing and prephasing cause the measured signal intensities for a particular cycle to consist of the signal from the current cycle as well as noise from the preceding and subsequent cycles. As the number of cycles increases, the proportion of sequences per cluster that undergo phasing and prephasing increases, making identification of the correct base difficult. Prephasing can be caused by the presence of trace amounts of exposed or unblocked 3'-OH nucleotides during sequencing by synthesis (SBS). Unprotected 3'-OH nucleotides could be generated during manufacturing processes or possibly during storage and reagent handling processes. Accordingly, the discovery of nucleotide analogs that reduce the frequency of prephasing is unexpected and provides a major advantage in SBS applications over existing nucleotide analogs. For example, the provided nucleotide analogues can result in shorter SBS cycle times, lower phasing and prephasing values, and longer sequencing read lengths.

3’-Гидроксиацетальные блокирующие группы3'-Hydroxyacetal blocking groups

Некоторые воплощения настоящего раскрытия относятся к молекуле нуклеотида или нуклеозида, содержащей рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН защитную или блокирующую группу, образующую структуру ковалентно присоединенную к 3’-атому углерода, в которой: каждый R1a и R1b независимо представляет собой Н, С16 алкил, С16 галогеналкил, С16 алкокси, С16 галогеналкокси, циано, галоген, возможно замещенный фенил или возможно замещенный аралкил;Some embodiments of the present disclosure provide a nucleotide or nucleoside molecule containing ribose or deoxyribose having a 3'-OH leaving protecting or blocking group forming the structure covalently attached to the 3' carbon atom, in which: each R 1a and R 1b independently represents H, C 1 -C 6 alkyl, C 1 -C 6 haloalkyl, C 1 -C 6 alkoxy, C 1 -C 6 haloalkoxy , cyano, halogen, optionally substituted phenyl or optionally substituted aralkyl;

каждый R2a и R2b независимо представляет собой Н, С16 алкил, С16 галогеналкил, циано или галоген;each R 2a and R 2b independently represents H, C 1 -C 6 alkyl, C 1 -C 6 haloalkyl, cyano or halogen;

в качестве альтернативы, R1a и R2a, наряду с атомами, к которым они присоединяются, образуют возможно замещенную пяти-восьмичленную гетеро цикл ильную группу;alternatively, R 1a and R 2a , along with the atoms to which they are attached, form an optionally substituted five to eight membered heterocyclyl group;

R3 представляет собой Н, возможно замещенный С26 алкенил, возможно замещенный С37 циклоалкенил, возможно замещенный С26 алкинил или возможно замещенный (С16 алкилен)Si(R4)3; иR 3 is H, optionally substituted C 2 -C 6 alkenyl, optionally substituted C 3 -C 7 cycloalkenyl, optionally substituted C 2 -C 6 alkynyl or optionally substituted (C 1 -C 6 alkylene)Si(R 4 ) 3 ; And

каждый R4 независимо представляет собой Н, C1-C6 алкил или возможно замещенный С610 арил при условии, что когда каждый R1a, R1b, R2a и R2b представляет собой Н, тогда R3 не является Н.each R 4 independently represents H, C 1 -C 6 alkyl or optionally substituted C 6 -C 10 aryl with the proviso that when R 1a , R 1b , R 2a and R 2b are each H, then R 3 is not H .

Некоторые другие воплощения настоящего раскрытия относятся к соединению, имеющему структуру Формулы (I):Some other embodiments of the present disclosure relate to a compound having the structure of Formula (I):

в которой R' представляет собой Н, монофосфат, дифосфат, трифосфат, тиофосфат, аналог сложного эфира фосфата, -О-, присоединенный к реакционноспособной фосфоросодержащей группе, или -О-, защищенный защитной группой; R" представляет собой Н или ОН; В представляет собой нуклеиновое основание; каждый из R1a, R1b, R2a, R2b и R3 определяется выше. wherein R' is H, monophosphate, diphosphate, triphosphate, thiophosphate, phosphate ester analogue, -O- attached to a reactive phosphorus-containing group, or -O- protected by a protecting group; R" represents H or OH; B represents a nucleic base; each of R 1a , R 1b , R 2a , R 2b and R 3 is defined above.

В некотором другом воплощении В представляет собой is В некоторых других воплощениях нуклеиновое основание ковалентно связывается с выявляемой меткой (например, флуоресцентным краситетем (Dye)), возможно через линкер, например, В представляет собой В некоторых таких воплощениях R' представляет собой трифосфат. В некотором таком воплощении R" представляет собой Н.In some other embodiment, B represents is In some other embodiments, the nucleic base is covalently linked to a detectable label (eg, fluorescent dye (Dye)), optionally via a linker, for example, B is In some such embodiments, R' is a triphosphate. In some such embodiment, R" is H.

В некоторых воплощениях ацетальной блокирующей группы, описанной в данном документе, по меньшей мере один из R1a и R1b представляет собой Н. В некоторых таких воплощениях каждый R1a и R1b представляет собой Н. В некоторых других воплощениях по меньшей мере один из R1a и R1b представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых воплощениях каждый из R2a и R2b независимо представляет собой Н, галоген или С16 алкил. В некоторых воплощениях по меньшей мере один из R2a и R2b представляет собой Н или С16 алкил. В некотором таком воплощении каждый R2a и R2b представляет собой Н. В некотором таком воплощении каждый R2a и R2b представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В одном воплощении каждый R2a и R2b представляет собой метил. В некоторых таких воплощениях каждый из R2a и R2b независимо представляет собой С16 алкил или галоген. В некоторых таких воплощениях R2a представляет собой Н, и R2b представляет собой галоген или С16 алкил.In some embodiments of the acetal blocking group described herein, at least one of R 1a and R 1b is H. In some such embodiments, R 1a and R 1b are each H. In some other embodiments, at least one of R 1a and R 1b is C 1 -C 6 alkyl, for example methyl, ethyl, isopropyl or tert-butyl. In some embodiments, R 2a and R 2b are each independently H, halogen, or C 1 -C 6 alkyl. In some embodiments, at least one of R 2a and R 2b is H or C 1 -C 6 alkyl. In some such embodiment, R 2a and R 2b are each H. In some such embodiment, R 2a and R 2b are each C 1 -C 6 alkyl, for example, methyl, ethyl, isopropyl or tert-butyl. In one embodiment, R 2a and R 2b are each methyl. In certain such embodiments, R 2a and R 2b are each independently C 1 -C 6 alkyl or halogen. In some such embodiments, R 2a is H and R 2b is halogen or C 1 -C 6 alkyl.

В некоторых воплощениях ацетальной блокирующей группы, описанной в данном документе, R3 возможно замещен С26 алкенилом. В некоторых таких воплощениях R3 представляет собой С26 алкенил (например, винил, пропенил), возможно замещенный одним или более чем одним заместителем, независимо выбранным из группы, состоящей из галогена, С16 алкила, С16 галогеналкила и их комбинаций. В некоторых других воплощениях R3 представляет собой In some embodiments of the acetal blocking group described herein, R 3 is optionally substituted with C 2 -C 6 alkenyl. In some such embodiments, R 3 is C 2 -C 6 alkenyl (eg, vinyl, propenyl), optionally substituted with one or more substituents independently selected from the group consisting of halogen, C 1 -C 6 alkyl, C 1 - With 6 haloalkyl and their combinations. In some other embodiments, R 3 is

В некоторых других воплощениях R3 возможно замещен С26 алкинилом. В некоторых таких воплощениях R3 представляет собой С26 алкинил (например, этинил, пропинил), возможно замещенный одним или более чем одним заместителем, независимо выбранным из группы, состоящей из галогена, С16 алкила, С16 галогеналкила и их комбинаций. В одном воплощении R3 возможно замещен этинилом В некоторых других воплощениях, R3 возможно замещен (С16алкилене)Si(R4)3. В некоторых таких воплощениях по меньшей мере один из R4 представляет собой С1-4 алкил. В некоторых других воплощениях каждый один из R4 представляет собой С14 алкил, например, метил, этил, изопропил или трет-бутил. В одном воплощении, R3 представляет собой -(CH2)-SiMe3. В некоторых альтернативных воплощениях R3 представляет собой С16 алкил.In some other embodiments, R 3 is optionally substituted with C 2 -C 6 alkynyl. In certain such embodiments, R 3 is C 2 -C 6 alkynyl (eg, ethynyl, propynyl), optionally substituted with one or more substituents independently selected from the group consisting of halogen, C 1 -C 6 alkyl, C 1 - With 6 haloalkyl and their combinations. In one embodiment, R 3 is optionally substituted with ethynyl In some other embodiments, R 3 is optionally substituted with (C 1 -C 6 alkylene)Si(R 4 ) 3 . In some such embodiments, at least one of R 4 is C 1-4 alkyl. In some other embodiments, each one of R 4 is C 1 -C 4 alkyl, for example, methyl, ethyl, isopropyl or tert-butyl. In one embodiment, R 3 is -(CH 2 )-SiMe 3 . In some alternative embodiments, R 3 represents C 1 -C 6 alkyl.

В некоторых альтернативных воплощениях R1a и R2a совместно с атомами, к которым они присоединяются, образуют пяти-семичленный гетероциклил. В некоторых таких воплощениях R1a и R2a совместно с атомами, к которым они присоединяются, образуют шестичленный гетероциклил. В некоторых таких воплощениях шестичленная гетероциклильная группа имеет структуру В некоторых других воплощениях по меньшей мере один из каждого R1b, R2b и R3 представляет собой Н. В некоторых других воплощениях по меньшей мере один из каждого R1b, R2b и R3 представляет собой C1-C6 алкил. В одном воплощении каждый R1b, R2b и R3 представляет собой Н.In some alternative embodiments, R 1a and R 2a together with the atoms to which they are attached form a five- to seven-membered heterocyclyl. In some such embodiments, R 1a and R 2a together with the atoms to which they are attached form a six-membered heterocyclyl. In some such embodiments, the six-membered heterocyclyl group has the structure In certain other embodiments, at least one of each R 1b , R 2b , and R 3 is H. In certain other embodiments, at least one of each R 1b , R 2b , and R 3 is C 1 -C 6 alkyl. In one embodiment, R 1b , R 2b and R 3 are each H.

В некоторых других воплощениях соединение Формулы (I) также представлено Формулой (Ia):In certain other embodiments, the compound of Formula (I) is also represented by Formula (Ia):

где каждый R2c и R2d независимо представляет собой Н, галоген (например, фтор-, хлор-), С16 алкил (например, метил, этил или изопропил) или С16 галогеналкил (например, -CHF2, -CH2F или -CF3). В некоторых таких воплощениях один из R1a и R1b представляет собой Н. В некоторых таких воплощениях каждый R1a и R1b представляет собой Н. В некоторых других воплощениях по меньшей мере один из R1a и R1b представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых воплощениях каждый из R2a и R2b независимо представляет собой Н, галоген или C1-C6 алкил. В некотором таком воплощении, каждый R2a и R2b представляет собой Н. В некоторых таких воплощениях каждый из R2c и R2d независимо представляет собой Н, галоген или С16 алкил. В некоторых таких воплощениях каждый R2c и R2d представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В одном воплощении каждый R2c и R2d представляет собой метил. В некоторых таких воплощениях каждый R2c и R2d независимо представляет собой галоген. В некоторых таких воплощениях R2c представляет собой Н, и R2d представляет собой Н, галоген (фтор-, хлор-) или С16 алкил (например, метил, этил, изопропил или трет-бутил). В других воплощениях каждый R1a и R1b представляет собой Н; R2a представляет собой Н; R2b представляет собой Н, галоген или метил; R2c представляет собой Н; и R2d представляет собой Н, галоген, метил, этил, изопропил или трет-бутил. wherein each R 2c and R 2d independently represents H, halogen (eg fluoro-, chloro-), C 1 -C 6 alkyl (eg methyl, ethyl or isopropyl) or C 1 -C 6 haloalkyl (eg -CHF 2 , -CH 2 F or -CF 3 ). In some such embodiments, one of R 1a and R 1b is H. In some such embodiments, each of R 1a and R 1b is H. In some other embodiments, at least one of R 1a and R 1b is C 1 -C 6 alkyl, for example methyl, ethyl, isopropyl or tert-butyl. In some embodiments, R 2a and R 2b are each independently H, halogen, or C 1 -C 6 alkyl. In some such embodiment, R 2a and R 2b are each H. In some such embodiments, R 2c and R 2d are each independently H, halogen, or C 1 -C 6 alkyl. In some such embodiments, R 2c and R 2d are each C 1 -C 6 alkyl, for example, methyl, ethyl, isopropyl or tert-butyl. In one embodiment, R 2c and R 2d are each methyl. In some such embodiments, R 2c and R 2d are each independently halogen. In some such embodiments, R 2c is H, and R 2d is H, halogen (fluoro-, chloro-) or C 1 -C 6 alkyl (eg, methyl, ethyl, isopropyl or tert-butyl). In other embodiments, R 1a and R 1b are each H; R 2a represents H; R 2b is H, halogen or methyl; R 2c represents H; and R 2d is H, halogen, methyl, ethyl, isopropyl or tert-butyl.

Неограничивающие воплощения блокирующих групп, описанных в данном документе, включают группы, имеющие структуру, выбранную из группы, состоящей из: ковалентно присоединенной к 3’-углероду рибозы или дезоксирибозы.Non-limiting embodiments of the blocking groups described herein include groups having a structure selected from the group consisting of: covalently attached to the 3' carbon of ribose or deoxyribose.

3’-Гидрокситиокарбаматные блокирующие группы3'-Hydroxythiocarbamate blocking groups

Некоторые дополнительные воплощения настоящего раскрытия относятся к нуклеозиду или нуклеотиду, содержащему рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН блокирующую группу, образующую структуру ковалентно присоединенную к 3'-атому углерода, в которой:Some further embodiments of the present disclosure relate to a nucleoside or nucleotide containing ribose or deoxyribose having a 3'-OH leaving blocking group forming the structure covalently attached to the 3' carbon atom, in which:

каждый из R5 и R6 независимо представляет собой Н, С16 алкил, С26 алкенил, С26 алкинил, С16 галогеналкил, С28 алкоксиалкил, возможно замещенный -(СН2)m-фенил, возможно замещенныйeach of R 5 and R 6 independently represents H, C 1 -C 6 alkyl, C 2 -C 6 alkenyl, C 2 -C 6 alkynyl, C 1 -C 6 haloalkyl, C 2 -C 8 alkoxyalkyl, optionally substituted - (CH 2 ) m -phenyl, possibly substituted

-(СН2)n-(5 или 6-членный гетероарил), возможно замещенный-(СН2)k37 карбоциклил или возможно замещенный-(СН2)р-(3-7-членный гетероциклил);-(CH 2 ) n -(5 or 6 membered heteroaryl), optionally substituted-(CH 2 ) k -C 3 -C 7 carbocyclyl or optionally substituted-(CH 2 ) p -(3-7 membered heterocyclyl);

в качестве альтернативы, R5 и R6, совместно с атомами, к которым они присоединяются, образуют возможно замещенный пяти-семичленный гетероциклил;alternatively, R 5 and R 6 , together with the atoms to which they are attached, form an optionally substituted five- to seven-membered heterocyclyl;

каждый из -(СН2)m-, -(СН2)n-, -(СН2)k- и -(СН2)p- возможно является замещенным; иeach of -(CH 2 ) m -, -(CH 2 ) n -, -(CH 2 ) k - and -(CH 2 ) p - is optionally substituted; And

каждый из m, n, k и р независимо равен 0, 1, 2, 3 или 4.each of m, n, k and p is independently equal to 0, 1, 2, 3 or 4.

Некоторые дополнительные воплощения относятся к соединению Формулы (II):Some additional embodiments relate to the compound of Formula (II):

в котором R' представляет собой Н, монофосфат, дифосфат, трифосфат, тиофосфат, аналог сложного эфира фосфата, -О-, присоединенный к реакционноспособной фосфоросодержащей группе, или -О-, защищенный защитной группой; R" представляет собой Н или ОН; В представляет собой нуклеиновое основание; каждый из R5 и R6 является таким, как определено выше. В некотором другом воплощении В представляет собой wherein R' is H, monophosphate, diphosphate, triphosphate, thiophosphate, phosphate ester analogue, -O- attached to a reactive phosphorus-containing group, or -O- protected by a protecting group; R" is H or OH; B is a nucleic acid base; R5 and R6 are each as defined above. In some other embodiment, B is

В некоторых других воплощениях нуклеиновое основание ковалентно связывается с выявляемой меткой (например, флуоресцентным красителем), возможно через линкер, например, В представляет собой В некоторых таких воплощениях R' представляет собой трифосфат.В некотором таком воплощении R" представляет собой Н. In some other embodiments, the nucleic base is covalently linked to a detectable label (eg, a fluorescent dye), possibly through a linker, for example, B is In some such embodiments, R' is a triphosphate. In some such embodiment, R" is H.

В некоторых воплощениях тиокарбаматной блокирующей группы, описанной в данном документе, по меньшей мере один из R5 и R6 представляет собой Н. В некоторых таких воплощениях каждый R5 и R6 представляет собой Н. В некоторых таких воплощениях R5 представляет собой Н, и R6 представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых таких воплощениях R5 представляет собой Н, и R6 представляет собой С26 алкенил (например, винил или аллил) или С26 алкинил (например, этинил или пропинил). В некоторых таких воплощениях R5 представляет собой Н, и R2 представляет собой возможно замещенный -(СН2)m-фенил, возможно замещенный -(СН2)n-(5-или 6-членный гетероарил), возможно замещенный -(СН2)k37 карбоциклил или возможно замещенный -(СН2)р-(3-7-членный гетероциклил). В некотором другом воплощении С37 карбоциклильная группа может представлять собой С37 циклоалкил или С37 циклоалкенил. 3-7-членная гетероциклильная группа может содержать ноль или одну двойную связь в структуре кольца. В других воплощениях R5 представляет собой Н, и R6 представляет собой возможно замещенный (СН2)m-фенил, возможно замещенный -(СН2)n-6-членный гетероарил, возможно замещенный -(СН2)k5 или С6 карбоциклил, или возможно замещенный -(СН2)p-(5- или 6-членный гетероциклил). В некоторых воплощениях m, n, k или р равен 0. В других воплощениях m, n, k или р равен 1 или 2. В некоторых других воплощениях по меньшей мере один из R5 и R6 представляет собой С16 алкил, например, метил, этил, изопропил или трет-бутил. В некоторых других воплощениях и R5, и R6 представляет собой С16 алкил. В одном воплощении и R5, и R6 представляет собой метил.In some embodiments of the thiocarbamate blocking group described herein, at least one of R 5 and R 6 is H. In some such embodiments, R 5 and R 6 are each H. In some such embodiments, R 5 is H. and R 6 is C 1 -C 6 alkyl, for example methyl, ethyl, isopropyl or tert-butyl. In some such embodiments, R 5 is H and R 6 is C 2 -C 6 alkenyl (eg, vinyl or allyl) or C 2 -C 6 alkynyl (eg, ethynyl or propynyl). In some such embodiments, R 5 is H, and R 2 is optionally substituted -(CH 2 ) m -phenyl, optionally substituted -(CH 2 ) n -(5- or 6-membered heteroaryl), optionally substituted -(CH 2 ) k -C 3 -C 7 carbocyclyl or possibly substituted -(CH 2 ) p -(3-7-membered heterocyclyl). In some other embodiment, the C 3 -C 7 carbocyclyl group may be C 3 -C 7 cycloalkyl or C 3 -C 7 cycloalkenyl. A 3-7 membered heterocyclyl group may contain zero or one double bond in the ring structure. In other embodiments, R 5 is H and R 6 is optionally substituted (CH 2 ) m -phenyl, optionally substituted -(CH 2 ) n -6-membered heteroaryl, optionally substituted -(CH 2 ) k -C 5 or C 6 carbocyclyl, or possibly substituted -(CH 2 ) p -(5- or 6-membered heterocyclyl). In some embodiments, m, n, k, or p is 0. In other embodiments, m, n, k, or p is 1 or 2. In some other embodiments, at least one of R 5 and R 6 is C 1 -C 6 alkyl eg methyl, ethyl, isopropyl or tert-butyl. In some other embodiments, both R 5 and R 6 are C 1 -C 6 alkyl. In one embodiment, both R 5 and R 6 are methyl.

В некоторых альтернативных воплощениях R5 и R6 совместно с атомами, к которым они присоединены, образуют возможно замещенный пяти-семичленный гетероциклил. В некоторых таких воплощениях R5 и R6 совместно с атомами, к которым они присоединены, образуют возможно замещенный пиперидинил.In some alternative embodiments, R 5 and R 6 together with the atoms to which they are attached form an optionally substituted five- to seven-membered heterocyclyl. In some such embodiments, R 5 and R 6 together with the atoms to which they are attached form an optionally substituted piperidinyl.

Неограничивающие воплощения 3’-О-тиокарбаматных блокирующих групп, описанных в данном документе, включающие воплощения, имеющие структуру, выбранную из группы, состоящей из ковалентно присоединяются к 3’-углероду рибозы или дезоксирибозы.Non-limiting embodiments of the 3'-O-thiocarbamate blocking groups described herein, including embodiments having a structure selected from the group consisting of covalently attached to the 3' carbon of ribose or deoxyribose.

Дополнительные воплощения настоящего раскрытия относятся к олигонуклеотиду или полинуклеотиду, содержащему нуклеозид или нуклеотид, описанный в данном документе.Additional embodiments of the present disclosure relate to an oligonucleotide or polynucleotide containing a nucleoside or nucleotide described herein.

В любом из воплощений блокирущих групп, описанных в данном документе, когда группа описывается как «возможно замещенная», она может быть либо незамещенной, либо замещенной.In any of the embodiments of the blocking groups described herein, when a group is described as “optionally substituted,” it may be either unsubstituted or substituted.

В любых воплощениях нуклеотидов или нуклеозидов с 3' гидрокси блокирующей группой, описанной в данном документе, нуклеозид или нуклеотид может быть ковалентно присоединен к выявляемой метке (например, флуорофор), возможно через линкер. Данный линкер может быть расщепляемым или нерасщепляемым. В некоторых таких воплощениях выявляемая метка (например, флуорофор) ковалентно присоединена к нуклеиновому основанию нуклеозида или нуклеотида через расщепляемый линкер. В некоторых других воплощениях выявляемая метка (например, флуорофор) ковалентно присоединена к 3' кислороду нуклеозида или нуклеотида через расщепляемый линкер. В некоторых других воплощениях такой расщепляемый линкер может содержать азидный фрагмент или дисульфидный фрагмент, ацетальный фрагмент или тиокарбаматный фрагмент. В некоторых воплощениях 3' гидрокси блокирующая группа и расщепляемый линкер (и присоединенная метка) могут быть удалены при таких же или по существу таких же условиях химической реакции, например, блокирующая группа и выявляемая метка могут быть удалены в одной химической реакции. В других воплощениях блокирующая группа и выявляемая метка удаляются за две отдельные стадии.In any embodiments of nucleotides or nucleosides with a 3' hydroxy blocking group described herein, the nucleoside or nucleotide can be covalently attached to a detectable label (eg, a fluorophore), possibly through a linker. This linker may be cleavable or non-cleavable. In some such embodiments, a detectable label (eg, a fluorophore) is covalently attached to the nucleic acid base of the nucleoside or nucleotide through a cleavable linker. In some other embodiments, a detectable label (eg, a fluorophore) is covalently attached to the 3' oxygen of the nucleoside or nucleotide through a cleavable linker. In some other embodiments, such a cleavable linker may contain an azide moiety or a disulfide moiety, an acetal moiety, or a thiocarbamate moiety. In some embodiments, the 3' hydroxy blocking group and the cleavable linker (and attached tag) can be removed under the same or substantially the same chemical reaction conditions, for example, the blocking group and the detectable tag can be removed in a single chemical reaction. In other embodiments, the blocking group and the detectable label are removed in two separate steps.

В некоторых воплощениях нуклеотиды или нуклеозиды, описанные в данном документе, содержат 2'-дезоксирибозу. В некоторых других аспектах 2'-дезоксирибоза содержит одну, две или три фосфатные группы в 5' положении сахарного кольца. В некотором другом аспекте нуклеотиды, описанные в данном документе, представляют собой нуклеотидтрифосфат.In some embodiments, the nucleotides or nucleosides described herein contain 2'-deoxyribose. In some other aspects, 2'-deoxyribose contains one, two, or three phosphate groups at the 5' position of the sugar ring. In another aspect, the nucleotides described herein are nucleotide triphosphate.

В некоторых воплощениях 3' блокированные нуклеотиды или нуклеозиды, описанные в данном документе, обеспечивают превосходные стабильность в растворе во время хранения или обращение с реагентами во время приложений секвенирования по сравнению с такими же нуклеотидами или нуклеозидами, защищенными стандартной 3’-ОН блокирующей группой, раскрытой в предшествующем уровне техники, например, 3’-О-азидометильной защитной группой. Например, ацетальные или тиокарбаматные блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% или 3000% улучшенную стабильность по сравнению с защищенной азидометилом 3’-ОН при тех же самых условиях в течение такого же периода времени, уменьшая посредством этого значения предфазирования и приводя к большим длинам считываемых фрагментов при секвенировании. В некоторых воплощениях стабильность измеряется при температуре окружающей среды или при температуре ниже температуры окружающей среды (как, например, 4-10°С). В других воплощениях стабильность измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях стабильность измеряется в растворе в среде с основным рН, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых таких воплощениях стабильность измеряется с присутствием или без присутствия фермента, такого как полимераза (например, ДНК-полимераза), терминальная дезоксинуклеотидил трансфераза или обратная транскриптаза.In some embodiments, the 3' blocked nucleotides or nucleosides described herein provide superior stability in solution during storage or reagent handling during sequencing applications compared to the same nucleotides or nucleosides protected by the standard 3'-OH blocking group disclosed in the prior art, for example, a 3'-O-azidomethyl protecting group. For example, acetal or thiocarbamate blocking groups disclosed herein can impart at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100 %, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% or 3000% improved stability compared to azidomethyl protected 3'- OH under the same conditions for the same period of time, thereby reducing prephasing values and leading to longer read lengths during sequencing. In some embodiments, stability is measured at ambient temperature or at a temperature below ambient temperature (such as 4-10°C). In other embodiments, stability is measured at elevated temperature, such as 40°C, 45°C, 50°C, 55°C, 60°C, or 65°C. In some such embodiments, stability is measured in solution at a basic pH environment, for example, pH 9.0; 9.2; 9.4; 9.6; 9.8 or 10.0. In some such embodiments, stability is measured with or without the presence of an enzyme, such as a polymerase (eg, DNA polymerase), terminal deoxynucleotidyl transferase, or reverse transcriptase.

В некоторых воплощениях 3' блокированные нуклеотиды или нуклеозиды, описанные в данном документе, обеспечивают превосходную скорость деблокирования в растворе во время стадии химического расщепления приложений по секвенированию по сравнению с такими же нуклеотидами или нуклеозидами, защищенными стандартной 3’-ОН блокирующей группой, раскрытой в предшествующем уровне техники, например, 3’-О-азидометильной защитной группой. Например, ацетальные или тиокарбаматные блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% или 2000% улучшенную скорость деблокирования по сравнению с защищенной азидометилом 3’-ОН с использованием стандартного деблокирующего реагента (такого как трис(гидроксипропил)фосфин), уменьшая, посредством этого, общее время для цикла секвенирования. В некоторых воплощениях скорость деблокирования измеряется при температуре окружающей среды или температуре ниже температуры окружающей среды (такой как 4-10°С). В других воплощениях скорость деблокирования измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях скорость деблокирования измеряется в растворе в среде с основным рН, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых таких воплощениях молярное отношение деблокирующего реагента к субстрату (т.е. 3' блокированному нуклеозиду или нуклеотиду) составляет примерно 10:1, примерно 5:1, примерно 2:1 или примерно 1:1.In some embodiments, the 3' blocked nucleotides or nucleosides described herein provide superior release rates in solution during the chemical digestion step of sequencing applications compared to the same nucleotides or nucleosides protected by the standard 3'-OH blocking group disclosed in the preceding prior art, for example, a 3'-O-azidomethyl protecting group. For example, acetal or thiocarbamate blocking groups disclosed herein can impart at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100 %, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% or 2000% improved release rate compared to azidomethyl protected 3'-OH with using a standard deblocking reagent (such as tris(hydroxypropyl)phosphine), thereby reducing the overall time for a sequencing run. In some embodiments, the release rate is measured at ambient or sub-ambient temperature (such as 4-10°C). In other embodiments, the release rate is measured at an elevated temperature, such as 40°C, 45°C, 50°C, 55°C, 60°C, or 65°C. In some such embodiments, the deblocking rate is measured in solution in a basic pH environment, for example, pH 9.0; 9.2; 9.4; 9.6; 9.8 or 10.0. In some such embodiments, the molar ratio of deblocking reagent to substrate (ie, 3' blocked nucleoside or nucleotide) is about 10:1, about 5:1, about 2:1, or about 1:1.

В некоторых воплощениях палладиевый деблокирущий реагент (например, для удаления 3' ацетальных блокирующих групп (например, блокирующей группы АОМ) используется Pd(0)). Pd может образовать хелатированный комплекс с двумя атомами кислорода группы АОМ, а также с двойной связью аллильной группы, обеспечивая удаление деблокирующего реагента в непосредственной близости от функциональной группы, и может приводить к повышенной скорости деблокирования.In some embodiments, a palladium deblocking reagent (eg, Pd(0) is used to remove 3' acetal blocking groups (eg, an AOM blocking group)). Pd can form a chelated complex with the two oxygen atoms of the AOM group as well as the double bond of the allyl group, allowing removal of the deblocking reagent in close proximity to the functional group, and can result in an increased rate of deblocking.

Снятие защиты 3’-ОН блокирующих группDeprotection of 3'-OH blocking groups

3’-ацетальные блокирующие группы, описанные в данном документе, могут быть удалены или расщеплены при разных химических условиях. Для ацетальных блокирующих групп которые содержат винильный или алкенильный фрагмент, неограничивающее условие расщепления включает комплекс Pd(II), такой как Pd(OAc)2 или димер аллилPd(II) хлорида, в присутствии фосфинового лиганда, например, трис(гидроксиметил)фосфина (ТНМР) или трис(гидроксипропил)фосфина (ТНР или ТНРР). Для тех блокирующих групп, которые содержат алкинильную группу (например, этинил), они также могут быть удалены посредством комплекса Pd(II) (например, Pd(OAc)2 или димер аллилPd(II) хлорида) в присутствии фосфинового лиганда (например, ТНР или ТНМР).The 3'-acetal blocking groups described herein can be removed or cleaved under a variety of chemical conditions. For acetal blocking groups which contain a vinyl or alkenyl moiety, the non-limiting cleavage condition includes a Pd(II) complex, such as Pd(OAc) 2 or an allylPd(II) chloride dimer, in the presence of a phosphine ligand, such as tris(hydroxymethyl)phosphine (THMP) or tris( hydroxypropyl)phosphine (THP or THPP). For those blocking groups that contain an alkynyl group (eg ethynyl), they can also be removed by a Pd(II) complex (eg Pd(OAc) 2 or allylPd(II) chloride dimer) in the presence of a phosphine ligand (eg THP or TNMR).

Палладиевые расщепляющие реагентыPalladium decomposition reagents

В некоторых воплощениях ацетальная блокирующая группа, описанная в данном документе, может быть расщеплена палладиевым катализатором. В некоторых таких воплощениях Pd катализатор является водорастворимым. В некоторых таких воплощениях он представляет собой комплекс Pd(0) (например, нонагидрат нонанатриевой соли трис(3,3',3"-фосфинидинтрис(бензолсульфонато)палладия(0)). В некоторых случаях комплекс Pd(0) может быть генерирован in situ из-за восстановления комплекса Pd(II) посредством таких реагентов, как алкены, спирты, амины, фосфины или гидриды металлов. Подходящие источники палладия включают Na2PdCl4, Pd(CH3CN)2Cl2: (PdCl(C3H5))2, [Pd(C3H5)(THP)]Cl, [Pd(C3H5)(THP)2]Cl, Pd(OAc)2, Pd(Ph3)4, Pd(dba)2, Pd(Acac)2, PdCl2(COD), и Pd(TFA)2. В одном таком воплощении комплекс Pd(0) генерируется in situ из Na2PdCl4. В другом воплощении источником палладия является димер хлорида аллилпалладия(II) [(PdCl(C3H5))2]. В некоторых воплощениях комплекс Pd(0) генерируется в водном растворе посредством смешивания комплекса Pd(II) с фосфином. Подходящие фосфины включают водорастворимые фосфины, такие как трис(гидроксипропил)фосфин (ТНР), трис(гидроксиметил)фосфин (ТНМР), 1,3,5-триаза-7-фосфаадамантан (РТА), калиевая соль бис(п-сульфонатофенил)фенилфосфина, трис(карбоксиэтил)фосфин (ТСЕР) и тринатриевая соль трифенилфосфин-3,3',3"-трисульфоновой кислоты.In some embodiments, the acetal blocking group described herein can be cleaved with a palladium catalyst. In some such embodiments, the Pd catalyst is water soluble. In some such embodiments, it is a Pd(0) complex (e.g., tris(3,3',3"-phosphinidintris(benzenesulfonato)palladium(0) nonasodium salt). In some cases, the Pd(0) complex can be generated in in situ due to the reduction of the Pd(II) complex by reagents such as alkenes, alcohols, amines, phosphines or metal hydrides. Suitable sources of palladium include Na 2 PdCl 4 , Pd(CH 3 CN) 2 Cl 2: (PdCl(C 3 H 5 )) 2 , [Pd(C 3 H 5 )(THP)]Cl, [Pd(C 3 H 5 )(THP) 2 ]Cl, Pd(OAc) 2 , Pd(Ph 3 ) 4 , Pd( dba) 2 , Pd(Acac) 2 , PdCl 2 (COD), and Pd(TFA) 2 . In one such embodiment, the Pd(0) complex is generated in situ from Na 2 PdCl 4 . In another embodiment, the palladium source is an allyl palladium chloride dimer. (II) [(PdCl(C 3 H 5 )) 2 ] In some embodiments, the Pd(0) complex is generated in aqueous solution by mixing the Pd(II) complex with a phosphine. Suitable phosphines include water-soluble phosphines such as tris(hydroxypropyl) phosphine (THP), tris(hydroxymethyl)phosphine (THMP), 1,3,5-triaza-7-phosphadamantane (PTA), bis(p-sulfonatophenyl)phenylphosphine potassium salt, tris(carboxyethyl)phosphine (TCEP) and trisodium salt triphenylphosphine-3,3',3"-trisulfonic acid.

В некоторых воплощениях Pd(0) получают смешиванием комплекса Pd(II) [(PdCI(C3H5))2] с ТНР in situ. Молярное отношение комплекса Pd(II) и ТНР может составлять примерно 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 или 1:10. В некоторых других воплощениях может быть добавлен один или более чем один восстановитель, такой как аскорбиновая кислота или ее соль (например, аскорбат натрия). В некоторых воплощениях расщепляющая смесь может содержать дополнительные буферизующие реагенты, такие как первичный амин, вторичный амин, третичный амин, карбонатная соль, фосфатная соль или боратная соль или их комбинации. В некоторых других воплощениях буферизующий реагент содержит этаноламин (ЕА), трис(гидроксиметил)аминометан (Tris), глицин, карбонат натрия, фосфат натрия, борат натрия, 2-диметиламинометанол (DMEA), 2-диэтиламинометанол (DEEA), N,N,N',N'-тетраметилэтилендиамин (TEMED) или N,N,N',N'-тетраэтилэтилендиамин (TEEDA), или их комбинации. В одном воплощении буферизующий реагент представляет собой DEEA. В другом воплощении буферизующий реагент содержит одну или более чем одну неорганическую соль, такую как карбонатная соль, фосфатная соль или боратная соль, или их комбинации. В одном воплощении неорганическая соль представляет собой натриевую соль.In some embodiments, Pd(0) is prepared by mixing the Pd(II) complex [(PdCI(C 3 H 5 )) 2 ] with THP in situ. The molar ratio of Pd(II) complex to THP can be about 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 or 1:10. In some other embodiments, one or more reducing agents, such as ascorbic acid or a salt thereof (eg, sodium ascorbate), may be added. In some embodiments, the cleavage mixture may contain additional buffering reagents, such as a primary amine, a secondary amine, a tertiary amine, a carbonate salt, a phosphate salt, or a borate salt, or combinations thereof. In some other embodiments, the buffering reagent contains ethanolamine (EA), tris(hydroxymethyl)aminomethane (Tris), glycine, sodium carbonate, sodium phosphate, sodium borate, 2-dimethylaminomethanol (DMEA), 2-diethylaminomethanol (DEEA), N,N, N',N'-tetramethylethylenediamine (TEMED) or N,N,N',N'-tetraethylethylenediamine (TEEDA), or combinations thereof. In one embodiment, the buffering reagent is DEEA. In another embodiment, the buffering reagent contains one or more inorganic salts, such as a carbonate salt, a phosphate salt, or a borate salt, or combinations thereof. In one embodiment, the inorganic salt is a sodium salt.

В качестве альтернативы, алкинильный фрагмент, содержащий блокирующие группы, также может расщепляться в присутствии (NH4)2MoS4. Другое неограничивающее условие расщепления для алкинильного фрагмента включает комплекс Cu(II) с лигандом ТНРТА (трис(3-гидроксипропилтриазолилметил)амин), и аскорбат. Неограничивающие условия расщепления для блокирующих групп, содержащих шестичленный гетероцикл (например, тетрагидропиран), включают циклодекстрин или Ln(OTf)3 (лантанида трифлат). Неограничивающее условие расщепления для блокирующих групп, содержащих алкилсилановую группу (например, -CH2SiMe3), включает LiBF4 (тетрафторборат лития). Другие ацетальные блокирующие группы, такие как -O(CH2)O-C1-C6 алкил, могут быть удалены посредством LiBF4 или Bi(OTf)3 (трифлат висмута). Неограничивающие типичные условия для расщепления описанных разных блокирующих групп иллюстрируются на Схеме 1 ниже.Alternatively, an alkynyl moiety containing blocking groups can also be cleaved in the presence of (NH 4 ) 2 MoS 4 . Another non-limiting cleavage condition for the alkynyl moiety involves complexing Cu(II) with the ligand THPTA (tris(3-hydroxypropyltriazolylmethyl)amine), and ascorbate. Non-limiting cleavage conditions for blocking groups containing a six-membered heterocycle (eg, tetrahydropyran) include cyclodextrin or Ln(OTf) 3 (lanthanide triflate). A non-limiting cleavage condition for blocking groups containing an alkylsilane group (eg, -CH 2 SiMe 3 ) includes LiBF 4 (lithium tetrafluoroborate). Other acetal blocking groups, such as -O(CH 2 )OC 1 -C 6 alkyl, can be removed by LiBF 4 or Bi(OTf) 3 (bismuth triflate). Non-limiting typical conditions for the cleavage of the various blocking groups described are illustrated in Scheme 1 below.

Схема 1. Иллюстрация 3’-деблокирующих условий (Dye+Linker - краситель+линкер)Scheme 1. Illustration of 3'-deblocking conditions (Dye + Linker - dye + linker)

3’-тиокарбаматные блокирующие группы, описанные в данном документе, могут быть удалены или расщеплены при разных химических условиях. Неограничивающие типичные условия для расщепления тиокарбаматных блокирующих групп, описанных в данном документе, включают NaIO4 и Oxone® (калия пероксимоносульфат).The 3'-thiocarbamate blocking groups described herein can be removed or cleaved under a variety of chemical conditions. Non-limiting typical conditions for the cleavage of thiocarbamate blocking groups described herein include NaIO 4 and Oxone® (potassium peroxymonosulfate).

Кроме того, азидогруппа в -CH2N3 может быть превращена в аминогруппу посредством фосфина. В качестве альтернативы, азидогруппа в -CH2N3 может быть превращена в аминогруппу посредством приведения в контакт таких молекул с тиолами, в частности, с водорастворимыми тиолами, такими как дитиотрейтол (DTT). В одном воплощении фосфин представляет собой ТНР.In addition, the azido group in -CH 2 N 3 can be converted to an amino group via phosphine. Alternatively, the azido group in -CH 2 N 3 can be converted to an amino group by contacting such molecules with thiols, in particular water-soluble thiols such as dithiothreitol (DTT). In one embodiment, the phosphine is THP.

Совместимость с линеаризациейLinearization compatible

Для того чтобы максимизировать производительность реакций секвенирования нуклеиновых кислот, полезной является возможность параллельного секвенирования множества молекул-матриц. Параллельная обработка многих матриц может достигаться с применением технологии чипа нуклеиновых кислот. Данные чипы типично состоят из высокоплотной матрицы полинуклеотидов, иммобилизованных на веществе твердой подложки.In order to maximize the throughput of nucleic acid sequencing reactions, the ability to sequence multiple template molecules in parallel is useful. Parallel processing of many templates can be achieved using nucleic acid chip technology. These chips typically consist of a high-density array of polynucleotides immobilized on a solid support material.

Как в WO 98/44151, так и в WO 00/18957 описываются способы амплификации нуклеиновой кислоты, которые обеспечивают иммобилизацию продуктов амплификации на твердой подложке для того, чтобы образовать чипы, состоящие из кластеров или «колоний», образованных из множества идентичных иммобилизованных полинуклеотидных цепей и множества идентичных иммобилизованных комплементарных цепей. Чипы данного типа называются в данном документе «кластерными чипами». Молекулы нуклеиновой кислоты, присутствующие в колониях ДНК на кластерных чипах, полученных согласно данным способам, могут предоставлять матрицы для реакций секвенирования, например, как описано в WO 98/44151. Продукты реакций твердофазной амплификации, такие как продукты, описанные в WO 98/44151 и WO 00/18957, представляют собой так называемые «мостиковые» структуры, образованные отжигом пар иммобилизованных полинуклеотидных цепей и иммобилизованных комплементарных цепей, причем оба типа цепей присоединяются к твердой подложке на 5'-конце. Для того чтобы предоставить более подходящие матрицы для секвенирования нуклеиновых кислот, предпочтительным является удаление по существу всей или по меньшей мере части одной из иммобилизованных цепей в «мостиковой» структуре для того, чтобы получить матрицу, которая является по меньшей мере частично одноцепочечной. Часть матрицы, которая является одноцепочечной, будет, таким образом, доступной для гибридизации с праймером секвенирования. Процесс удаления всей или части одной иммобилизованной цепи в «мостиковой» двухцепочечной структуре нуклеиновой кислоты называется «линеаризацией». Существуют разные способы линеаризации, включающие ферментативное расщепление, фотохимическое расщепление или химическое расщепление, но не ограничивающиеся ими. Неограничивающие примеры способов линеаризации раскрываются в публикации РСТ № WO 2007/010251, публикации патента США №2009/0088327, публикации патента США №2009/0118128 и заявке на патент США 62/671816, которые включаются посредством ссылки во всей их полноте.Both WO 98/44151 and WO 00/18957 describe nucleic acid amplification methods that immobilize the amplification products on a solid support to form chips consisting of clusters or “colonies” formed from multiple identical immobilized polynucleotide chains and multiple identical immobilized complementary chains. This type of chip is referred to in this document as “cluster chips.” Nucleic acid molecules present in DNA colonies on cluster chips obtained according to these methods can provide templates for sequencing reactions, for example, as described in WO 98/44151. The products of solid phase amplification reactions, such as those described in WO 98/44151 and WO 00/18957, are so-called “bridge” structures formed by annealing pairs of immobilized polynucleotide chains and immobilized complementary strands, both types of chains being attached to a solid support on 5' end. In order to provide more suitable templates for nucleic acid sequencing, it is preferred to remove substantially all or at least a portion of one of the immobilized strands in the bridge structure in order to obtain a template that is at least partially single-stranded. The portion of the template that is single-stranded will thus be available for hybridization with the sequencing primer. The process of removing all or part of one immobilized strand in a bridged double-stranded nucleic acid structure is called “linearization.” There are various linearization methods including, but not limited to, enzymatic digestion, photochemical digestion, or chemical digestion. Non-limiting examples of linearization methods are disclosed in PCT Publication No. WO 2007/010251, US Patent Publication No. 2009/0088327, US Patent Publication No. 2009/0118128, and US Patent Application No. 62/671816, which are incorporated by reference in their entirety.

В некоторых воплощениях условие для снятия защиты или удаления 3’-ОН блокирующих групп также является совместимым с процессами линеаризации. В некоторых других воплощениях условие снятия защиты является совместимым с процессом химической линеаризации, который включает применение комплекса Pd и фосфина, например, Pd(OAc)2 и ТНР. В некоторых воплощениях комплекс Pd представляет собой комплекс Pd(II), который генерирует Pd(0) in situ в присутствии фосфина.In some embodiments, the condition for deprotection or removal of 3'-OH blocking groups is also compatible with linearization processes. In some other embodiments, the deprotection condition is compatible with a chemical linearization process that involves the use of a complex of Pd and a phosphine, for example, Pd(OAc) 2 and THP. In some embodiments, the Pd complex is a Pd(II) complex that generates Pd(0) in situ in the presence of phosphine.

Если не указано иное, ссылка на нуклеотиды также подразумевается применимой к нуклеозидам.Unless otherwise stated, reference to nucleotides is also intended to apply to nucleosides.

Меченые нуклеотидыLabeled nucleotides

Согласно одному аспекту данного раскрытия описанный 3’-ОН блокированный нуклеотид также содержит выявляемую метку, и такой нуклеотид называется меченым нуклеотидом. Метка (например, флуоресцентный краситель) может быть конъюгирована через возможный линкер посредством множества способов, включая гидрофобное притяжение, ионное притяжение и ковалентное присоединение. В некоторых аспектах красители конъюгируются с субстратом посрдством ковалентного присоединения. Более конкретно, ковалентное присоединение осуществляется посредством линкерной группы. В некоторых случаях такие меченые нуклеотиды также называются «модифицированными нуклеотидами».According to one aspect of this disclosure, the described 3'-OH blocked nucleotide also contains a detectable label, and such nucleotide is called a labeled nucleotide. A label (eg, a fluorescent dye) can be conjugated through a possible linker through a variety of methods, including hydrophobic attraction, ionic attraction, and covalent attachment. In some aspects, dyes are conjugated to a substrate through covalent attachment. More specifically, covalent attachment is accomplished through a linker group. In some cases, such labeled nucleotides are also called "modified nucleotides".

Меченые нуклеозиды и нуклеотиды являются полезными для мечения полинуклеотидов, образованных ферментативным синтезом, как, например, в качестве неограничивающего примера, в ПЦР-амплификации, изотермической амплификации, твердофазной амплификации, секвенировании полинуклеотидов (например, твердофазное секвенирование), реакциях ник-трансляции и тому подобных.Labeled nucleosides and nucleotides are useful for labeling polynucleotides formed by enzymatic synthesis, such as, by way of non-limiting example, in PCR amplification, isothermal amplification, solid-phase amplification, polynucleotide sequencing (e.g., solid-phase sequencing), nick-translation reactions, and the like .

В некоторых воплощениях данный краситель может ковалентно присоединяться колигонуклеотидам или нуклеотидам посредством нуклеотидного основания. Например, меченый нуклеотид или олигонуклеотид может иметь метку, присоединенную к С5 положению пиримидинового основания или к С7 положению 7-деазапуринового основания через линкерный фрагмент.In some embodiments, the dye may be covalently attached to oligonucleotides or nucleotides via a nucleotide base. For example, a labeled nucleotide or oligonucleotide may have a label attached to the C5 position of a pyrimidine base or to the C7 position of a 7-deazapurine base via a linker moiety.

Если не указано иное, ссылка на нуклеотиды также подразумевается как применимая к нуклеозидам. Настоящая заявка также будет дополнительно описана со ссылкой на ДНК, хотя данное описание также будет применимым к РНК, ПНК (пептидная нуклеиновая кислота) и другим нуклеиновым кислотам, если не указано иное.Unless otherwise indicated, reference to nucleotides is also intended to apply to nucleosides. The present application will also be further described with reference to DNA, although this description will also apply to RNA, PNA (peptide nucleic acid) and other nucleic acids unless otherwise noted.

ЛинкерыLinkers

В некоторых воплощениях, описанных в данном документе, пуриновое или пиримидиновое основание нуклеотидных или нуклеозидных молекул, описанных в данном документе, может быть связано с выявляемой меткой, как описано выше. В некоторых таких воплощениях используемые линкеры являются расщепляемыми. Применение расщепляемых линкеров обеспечивает то, что метка может, если требуется, удаляться после выявления, избегая какого-либо мешающего сигнала с любым меченым нуклеотидом или нуклеозидом, включенным далее. В некоторых воплощениях расщепляемый линкер содержит азидный фрагмент, -O-С26 алкенильный фрагмент (например, -О-аллил), дисульфидный фрагмент, ацетальный фрагмент (такой же или аналогичный 3’-ацетальной блокирующей группе, описанной в данном документе) или тиокарбаматный фрагмент (такую же или аналогичную 3’-ацетальной блокирующей группе, описанной в данном документе).In some embodiments described herein, the purine or pyrimidine base of the nucleotide or nucleoside molecules described herein may be linked to a detectable label as described above. In some such embodiments, the linkers used are cleavable. The use of cleavable linkers ensures that the label can, if desired, be removed after detection, avoiding any interfering signal with any labeled nucleotide or nucleoside included below. In some embodiments, the cleavable linker contains an azide moiety, an -O-C 2 -C 6 alkenyl moiety (e.g., -O-allyl), a disulfide moiety, an acetal moiety (same or similar to the 3'-acetal blocking group described herein) or a thiocarbamate moiety (same or similar to the 3'-acetal blocking group described herein).

В некоторых других воплощениях используемые линкеры являются нерасщепляемыми. Поскольку в каждом случае, когда включается меченый нуклеотид по изобретению, затем не нужно включать нуклеотиды, и, таким образом, от данного нуклеотида не нужно удалять метку.In some other embodiments, the linkers used are non-cleavable. Because in each case where a labeled nucleotide of the invention is included, no nucleotides then need to be included, and thus no label needs to be removed from the given nucleotide.

В данной области известны расщепляемые линкеры, и для присоединения линкера к нуклеотидному основанию и метке можно применять традиционную химию. Данный линкер может расщепляться любым походящим способом, включая воздействие кислот, оснований, нуклеофилов, электрофилов, радикалов, металлов, восстановителей или окислителей, света, температуры, ферментов и т.д. Линкер, как обсуждается в данном документе, также может расщепляться тем же самым катализатором, используемым для расщепления связи 3’-О-блокирующей группы. Подходящие линкеры могут быть адаптированы из стандартных химических защитных групп, как раскрыто в Greene & Wuts, Protective Groups in Organic Synthesis, John Wiley & Sons. Другие подходящие расщепляемые линкеры, используемые в твердофазном синтезе, раскрываются в Guillier et al. (Chem. Rev. 100:2092-2157, 2000).Cleavable linkers are known in the art, and conventional chemistry can be used to attach the linker to the nucleotide base and tag. This linker can be cleaved by any suitable means, including exposure to acids, bases, nucleophiles, electrophiles, radicals, metals, reducing or oxidizing agents, light, temperature, enzymes, etc. The linker, as discussed herein, can also be cleaved by the same catalyst used to cleave the bond of the 3'-O-blocking group. Suitable linkers can be adapted from standard chemical protecting groups as disclosed in Greene & Wuts, Protective Groups in Organic Synthesis, John Wiley & Sons. Other suitable cleavable linkers used in solid phase synthesis are disclosed in Guillier et al. (Chem. Rev. 100:2092-2157, 2000).

Когда выявляемая метка присоединяется к основанию, линкер может присоединяться в любом положении на нуклеотидном основании, при условии, что все еще может осуществляться образование пар оснований по Уотсону-Крику. В контексте пуриновых оснований предпочтительным является, если линкер присоединяется посредством 7-положения пурина или предпочтительного деазапуринового аналога, через 8-модифицированный пурин, через N-6 модифицированный аденозин или N-2 модифицированный гуанин. Для пиримидинов присоединение предпочтительно осуществляется через 5-положение на цитозине, тимидине или урациле и N-4 положение на цитозине.When a detectable tag is attached to a base, the linker can attach at any position on the nucleotide base as long as Watson-Crick base pairing can still occur. In the context of purine bases, it is preferred if the linker is attached via the 7-position of a purine or a preferred deazapurine analogue, via an 8-modified purine, via an N-6 modified adenosine or an N-2 modified guanine. For pyrimidines, the attachment is preferably via the 5-position on cytosine, thymidine or uracil and the N-4 position on cytosine.

В некоторых воплощениях линкер может содержать спейсерное звено. Длина данного линкера не является важной, при условии, что метка удерживается на достаточном расстоянии от нуклеотида таким образом, чтобы не мешать какому-либо взаимодействию между нуклеотидом и ферментом, например, полимеразой.In some embodiments, the linker may contain a spacer unit. The length of a given linker is not important as long as the label is kept at a sufficient distance from the nucleotide so as not to interfere with any interaction between the nucleotide and an enzyme, such as a polymerase.

В некоторых воплощениях линкер может состоять из аналогичной функциональной группы, такой как 3’-ОН защитная группа. Это будет делать более эффективными снятие защиты и способ осуществления снятия защиты, так как будет требоваться только одна обработка для удаления как метки, так и защитной группы.In some embodiments, the linker may consist of a similar functional group, such as a 3'-OH protecting group. This will make the deprotection and deprotection process more efficient since only one processing will be required to remove both the label and the protecting group.

Применение термина «расщепляемый линкер» не означает то, что он подразумевает, что требуется удаление целого линкера. Сайт расщепления может быть расположен в положении на линкере, которое обеспечивает то, что часть линкера остается присоединенной к группировке красителя и/или субстрата после расщепления. Расщепляемые линкеры, в качестве неограничивающего примера, могут представлять собой электрофильно расщепляемые линкеры, нуклеофильно расщепляемые линкеры, фоторасщепляемые линкеры, расщепляемые при восстановительных условиях (например, линкеры, содержащие дисульфид или азид), окислительных условиях, расщепляемые посредством применения линкеров с защелкой или расщепляемые посредством механизмов элиминации. Применение расщепляемого линкера для присоединения соединения-красителя к группировке субстрата обеспечивает то, что метка, если требуется, может быть удалена после выявления, избегая какого-либо мешающего сигнала на последующих стадиях.The use of the term "cleavable linker" is not intended to imply that removal of the entire linker is required. The cleavage site may be located at a position on the linker that ensures that a portion of the linker remains attached to the dye and/or substrate moiety after cleavage. Cleavable linkers, by way of non-limiting example, can be electrophilically cleavable linkers, nucleophilically cleavable linkers, photocleavable linkers, cleavable under reducing conditions (e.g., disulfide or azide containing linkers), oxidative conditions, cleavable through the use of latch linkers, or cleavable through mechanisms elimination. The use of a cleavable linker to attach the dye compound to the substrate moiety ensures that the label, if required, can be removed after detection, avoiding any interfering signal in subsequent steps.

Полезные линкерные группы можно найти в публикации РСТ № WO 2004/018493 (включенной в данный документ посредством ссылки), примеры которых включают линкеры, которые могут расщепляться с использованием водорастворимых фосфинов или водорастворимых катализаторов на основе переходных металлов, образованных из переходного металла и по меньшей мере частично водорастворимых лигандов, например, комплекса Pd(II) и ТНР. В водном растворе последние образуют по меньшей мере частично водорастворимые комплексы переходного металла. Такие расщепляемые линкеры можно использовать для соединения оснований нуклеотидов с метками, такими как красители, изложенные в данном документе.Useful linker groups can be found in PCT Publication No. WO 2004/018493 (incorporated herein by reference), examples of which include linkers that can be cleaved using water-soluble phosphines or water-soluble transition metal catalysts formed from a transition metal and at least partially water-soluble ligands, for example, the Pd(II) complex and THP. In aqueous solution, the latter form at least partially water-soluble transition metal complexes. Such cleavable linkers can be used to connect nucleotide bases to labels, such as the dyes set forth herein.

Конкретные линкеры включают линкеры, раскрытые в публикации РСТ № WO 2004/018493 (включена в данный документ посредством ссылки), такие как линкеры, которые включают фрагменты следующих формул:Specific linkers include those disclosed in PCT Publication No. WO 2004/018493 (incorporated herein by reference), such as linkers that include portions of the following formulas:

(где X выбран из группы, содержащей О, S, NH и NQ, где Q представляет собой С1-10 замещенную или незамещенную алкильную группу, Y выбран из группы, содержащей О, S, NH и N(аллил), Т представляет собой водород или С1-10 замещенную или незамещенную алкильную группу, и * указывает, где данный фрагмент соединен с остальной частью нуклеотида или нуклеозида). В некоторых аспектах линкеры соединяют основания нуклеотидов с метками, такими как, например, соединения-красители, описанные в данном документе.(where X is selected from the group containing O, S, NH and NQ, where Q is a C 1-10 substituted or unsubstituted alkyl group, Y is selected from the group containing O, S, NH and N(allyl), T is hydrogen or a C 1-10 substituted or unsubstituted alkyl group, and * indicates where the fragment is connected to the rest of the nucleotide or nucleoside). In some aspects, linkers connect nucleotide bases to tags, such as, for example, dye compounds described herein.

Дополнительные примеры линкеров включают линкеры, раскрытые в публикации США №2016/0040225 (включена в данный документ посредством ссылки), такие как линкеры, включающие фрагменты следующих формул:Additional examples of linkers include those disclosed in US Publication No. 2016/0040225 (incorporated herein by reference), such as linkers comprising portions of the following formulas:

Линкерные фрагменты, проиллюстрированные в данном документе, могут содержать полную или частичную структуру линкера между нуклеотидами/нуклеозидами и метками.The linker moieties illustrated herein may contain full or partial linker structure between nucleotides/nucleosides and tags.

Дополнительные примеры линкеров («L») включают фрагменты следующих формул:Additional examples of linkers (“L”) include portions of the following formulas:

где В представляет собой нуклеиновое основание; Z представляет собой -N3 (азидо), -О-C1-C6 алкил, -O-С26 алкенил или -O-С26 алкинил; и FI содержит флуоресцентную метку, которая может содержать дополнительную линкерную структуру. Обычному специалисту в данной области понятно то, что метка ковалентно связывается с линкером посредством осуществления взаимодействия функциональной группы метки (например, карбоксил) с функциональной группой линкера (например, амино). where B represents a nucleic base; Z represents -N 3 (azido), -O-C 1 -C 6 alkyl, -O-C 2 -C 6 alkenyl or -O-C 2 -C 6 alkynyl; and FI contains a fluorescent label, which may contain an additional linker structure. One of ordinary skill in the art will appreciate that a label is covalently linked to a linker by reacting a functional group of the label (eg, carboxyl) with a functional group of the linker (eg, amino).

В конкретных воплощениях длина линкера между флуоресцентным красителем (флуорофор) и гуаниновым основанием может быть изменена, например, введением полиэтиленгликолевой спейсерной группы, увеличивая, посредством этого, интенсивность флуоресценции по сравнению с таким же флуорофором, присоединенным к гуаниновому основанию через другие связи, известные в данной области. Типичные линкеры и их свойства излагаются в публикации РСТ № WO 2007020457 (включена в данный документ посредством ссылки). Конструкция линкеров и особенно их увеличенная длина могут обеспечивать улучшения в яркости флуорофоров, присоединенных к гуаниновым основаниям гуанозиновых нуклеотидов при включении в полинуклеотиды, такие как ДНК. Таким образом, когда краситель предназначен для применения в любом способе анализа, в котором требуется выявление метки флуоресцентного красителя, присоединенной к гуанинсодержащему нуклеотиду, полезным является, если линкер содержит спейсерную группу формулы -((СН2)2O)n- где n представляет собой целое число от 2 до 50, как описано в WO 2007/020457.In specific embodiments, the length of the linker between the fluorescent dye (fluorophore) and the guanine base can be changed, for example, by introducing a polyethylene glycol spacer group, thereby increasing the fluorescence intensity compared to the same fluorophore attached to the guanine base through other linkages known in the art. areas. Typical linkers and their properties are set forth in PCT Publication No. WO 2007020457 (incorporated herein by reference). The design of the linkers, and especially their increased length, can provide improvements in the brightness of fluorophores attached to the guanine bases of guanosine nucleotides when incorporated into polynucleotides such as DNA. Thus, when the dye is intended for use in any assay that requires detection of a fluorescent dye tag attached to a guanine-containing nucleotide, it is useful if the linker contains a spacer group of the formula -((CH 2 ) 2 O) n - where n is an integer from 2 to 50, as described in WO 2007/020457.

Нуклеозиды и нуклеотиды могут быть мечеными в сайтах на сахаре или нуклеиновом основании. Как известно в данной области, «нуклеотид» состоит из азотистого основания, сахара и одной или более чем одной фосфатной группы. В РНК сахаром является рибоза, а в ДНК - дезоксирибоза, т.е. сахар, не имеющий гидроксильной группы, которая присутствует в рибозе. Азотистое основание представляет собой производное пурина или пиримидина. Пуринами являются аденин (А) и гуанин (G), а пиримидинами являются цитозин (С) и тимин (Т) или, в контексте РНК - урацил (U). Атом С-1 дезоксирибозы связывается с N-1 пиримидина или N-9 пурина. Нуклеотид также представляет собой сложный фосфатный эфир нуклеозида с этерификацией, происходящей на гидроксильной группе, присоединенной к С-3 или С-5 сахара. Нуклеотиды обычно представляют собой моно-, ди- или трифосфаты.Nucleosides and nucleotides can be labeled at sites on the sugar or nucleic acid base. As is known in the art, a "nucleotide" consists of a nitrogenous base, a sugar, and one or more phosphate groups. In RNA the sugar is ribose, and in DNA it is deoxyribose, i.e. a sugar that does not have a hydroxyl group, which is present in ribose. The nitrogenous base is a purine or pyrimidine derivative. Purines are adenine (A) and guanine (G), and pyrimidines are cytosine (C) and thymine (T) or, in the context of RNA, uracil (U). The C-1 atom of deoxyribose binds to N-1 of pyrimidine or N-9 of purine. A nucleotide is also a phosphate ester of a nucleoside with esterification occurring on the hydroxyl group attached to the C-3 or C-5 of the sugar. Nucleotides are usually mono-, di- or triphosphates.

«Нуклеозид» является структурно сходным с нуклеотидом, но у него отсутствуют фосфатные фрагменты. Примером аналога нуклеозида был бы аналог, в котором метка связывается с основанием, и отсутствует фосфатная группа, присоединенная к молекуле сахара.A "nucleoside" is structurally similar to a nucleotide, but lacks the phosphate moieties. An example of a nucleoside analog would be one in which the label binds to the base and there is no phosphate group attached to the sugar molecule.

Хотя основание обычно называют пурином или пиримидином, специалисту будет понятно то, что доступны производные и аналоги, которые не изменяют способность нуклеотида или нуклеозида к образованию пар оснований по Уотсону-Крику. «Производное» или «аналог» означает соединение или молекулу, структура ядра которой является такой же или имеет близкое сходство со структурой родительского соединения, но которое имеет химическую или физическую модификацию, такую как, например, другая или дополнительная боковая группа, которая позволяет производному нуклеотида или нуклеозида связываться с другой молекулой. Например, данное основание может представлять собой деазапурин. В конкретных воплощениях данные производные должны быть способны к образованию пар по Уотсону-Крику. «Производное» и «аналог» также включает, например, синтетическое производное нуклеотида или нуклеозида, имеющее модифицированные фрагменты основания и/или модифицированные фрагменты сахара. Такие производные и аналоги обсуждаются, например, в Scheit, Nucleotide analogs (John Wiley & Son, 1980) и Uhlman et al., Chemical Reviews 90:543-584, 1990. Аналоги нуклеотидов также могут содержать модифицированные фосфодиэфирные связи, включающие фосфоротиоатные, фосфородитиоатные, алкилфосфонатные, фосфоранилидатные, фосфорамидатные связи и тому подобные.Although the base is commonly referred to as a purine or pyrimidine, one skilled in the art will appreciate that derivatives and analogs are available that do not alter the Watson-Crick base pairing ability of the nucleotide or nucleoside. "Derivative" or "analogue" means a compound or molecule whose core structure is the same or closely similar to the structure of the parent compound, but which has a chemical or physical modification, such as, for example, a different or additional side group that allows the nucleotide to be derived or nucleoside to bind to another molecule. For example, the base may be deazapurine. In specific embodiments, these derivatives must be capable of forming Watson-Crick pairs. "Derivative" and "analog" also include, for example, a synthetic derivative of a nucleotide or nucleoside having modified base moieties and/or modified sugar moieties. Such derivatives and analogs are discussed, for example, in Scheit, Nucleotide analogs (John Wiley & Son, 1980) and Uhlman et al., Chemical Reviews 90:543-584, 1990. Nucleotide analogs may also contain modified phosphodiester linkages, including phosphorothioate, phosphorodithioate , alkylphosphonate, phosphoranilidate, phosphoramidate bonds and the like.

Краситель может быть присоединен в любом положении на нуклеотидном основании, например, через линкер. В конкретных воплощениях образование пар оснований по Уотсону-Крику все еще может осуществляться для образующегося в результате аналога. Конкретные сайты мечения нуклеинового основания включают положение С5 пиримидинового основания или положение С7 7-деазапуринового основания. Как описано выше, линкерную группу можно использовать для ковалентного присоединения красителя к нуклеозиду или нуклеотиду.The dye can be attached at any position on the nucleotide base, for example through a linker. In certain embodiments, Watson-Crick base pairing can still be performed for the resulting analogue. Specific nucleobase labeling sites include the C5 position of the pyrimidine base or the C7 position of the 7-deazapurine base. As described above, a linker group can be used to covalently attach a dye to a nucleoside or nucleotide.

В конкретных воплощениях меченый нуклеозид или нуклеотид может быть ферментативно включаемым и ферментативно удлиняемым. Соответственно, линкерный фрагмент может иметь достаточную длину для соединения нуклеотида с соединением, таким образом, что данное соединение не мешает значительно общему связыванию и распознаванию нуклеотида ферментом репликации нуклеиновой кислоты. Таким образом, данный линкер также может содержать спейсерный элемент. Данный спейсер, например, помещает на расстоянии нуклеотидное основание от сайта расщепления или метки.In specific embodiments, the labeled nucleoside or nucleotide may be enzymatically incorporated and enzymatically extended. Accordingly, the linker fragment may be of sufficient length to connect a nucleotide to a compound such that the connection does not significantly interfere with the overall binding and recognition of the nucleotide by the nucleic acid replication enzyme. Thus, this linker may also contain a spacer element. This spacer, for example, places a nucleotide base at a distance from the cleavage site or tag.

Нуклеозиды или нуклеотиды, меченные красителями, описанными в данном документе, могут иметь следующую формулу:Nucleosides or nucleotides labeled with the dyes described herein may have the following formula:

где, Dye представляет собой соединение-краситель, В представляет собой нуклеиновое основание, такое как, например, урацил, тимин, цитозин, аденин, гуанин и тому подобные; L представляет собой возможную линкерную группу, которая может присутствовать или может не присутствовать; R' может представлять собой Н, монофосфат, дифосфат, трифосфат, тиофосфат, аналог сложного фосфатного эфира, -О-, присоединенный к реакционноспособной фосфоросодержащей группе, или -О-, защищенный блокирующей группой; R''' может представлять собой Н, ОН, фосфорамидит, или 3’-ОН блокирующую группу, описанную в данном документе, и R" представляет собой Н или ОН. Когда R''' представляет собой фосфорамидит, R' представляет собой кислоторасщепляемую гидрокси защитную группу, которая обеспечивает последующее связывание мономера при условиях автоматического синтеза.wherein Dye is a dye compound, B is a nucleic acid base such as, for example, uracil, thymine, cytosine, adenine, guanine and the like; L represents a possible linker group which may or may not be present; R' may be H, monophosphate, diphosphate, triphosphate, thiophosphate, phosphate ester analog, -O- attached to a reactive phosphorus-containing group, or -O- protected by a blocking group; R'' may be H, OH, phosphoramidite, or a 3'-OH blocking group as described herein, and R" is H or OH. When R''' is phosphoramidite, R' is an acid-cleavable hydroxy a protecting group that ensures subsequent binding of the monomer under automatic synthesis conditions.

В конкретном воплощении присутствуют и линкер (между красителем и нуклеотидом), и блокирующая группа, и они являются отдельными фрагментами. В конкретных воплощениях и линкер, и блокирующая группа являются расщепляемыми при по существу аналогичных условиях. Таким образом, способы снятия защиты и снятия блокировки могут быть более эффективными, так как будет требоваться только одна обработка для удаления и соединения-красителя, и блокирующей группы. Однако в некоторых воплощениях линкеру и блокирующей группе не нужно быть расщепляемыми при аналогичных условиях, вместо этого они являются индивидуально расщепляемыми при отличных условиях.In a particular embodiment, both a linker (between the dye and the nucleotide) and a blocking group are present and are separate moieties. In certain embodiments, both the linker and the blocking group are cleavable under substantially similar conditions. Thus, the deprotection and deblocking methods may be more efficient since only one treatment will be required to remove both the dye compound and the blocking group. However, in some embodiments, the linker and blocking group do not need to be cleavable under similar conditions, but instead are individually cleavable under different conditions.

Данное раскрытие также охватывает полинуклеотиды, включающие соединения-красители. Такие полинуклеотиды могут представлять собой ДНК или РНК, содержащие, соответственно, дезоксирибонуклеотиды или рибонуклеотиды, соединенные в фосфодиэфирной связи. Полинуклеотиды могут содержать встречающиеся в природе нуклеотиды, нуклеотиды, не встречающиеся в природе (или модифицированные), отличные от меченых нуклеотидов, описанных в данном документе, или любую их комбинацию в комбинации с по меньшей мере одним модифицированным нуклеотидом (например, меченным соединением-красителем), как изложено в данном документе. Полинуклеотиды согласно данному раскрытию также могут включать неприродные связи остова и/или ненуклеотидные химические модификации. Химерные структуры, состоящие из смесей рибонуклеотидов и дезоксирибонуклеотидов, содержащие по меньшей мере один меченый нуклеотид, также рассматриваются.This disclosure also covers polynucleotides including dye compounds. Such polynucleotides may be DNA or RNA containing, respectively, deoxyribonucleotides or ribonucleotides linked in a phosphodiester bond. The polynucleotides may contain naturally occurring nucleotides, non-naturally occurring (or modified) nucleotides other than the labeled nucleotides described herein, or any combination thereof in combination with at least one modified nucleotide (e.g., a labeled dye compound) , as set forth in this document. The polynucleotides of this disclosure may also include non-natural backbone linkages and/or non-nucleotide chemical modifications. Chimeric structures consisting of mixtures of ribonucleotides and deoxyribonucleotides containing at least one labeled nucleotide are also contemplated.

Неограничивающие типичные меченые нуклеотиды, как описано в данном документе, включают следующие: Non-limiting exemplary labeled nucleotides as described herein include the following:

где L представляет линкер, и R представляет остаток сахара, как описано выше, или остаток сахара с 5'-положением, замещенным одним, двумя или тремя фосфатами.where L represents a linker and R represents a sugar residue as described above, or a sugar residue with the 5' position substituted by one, two or three phosphates.

В некоторых воплощениях неограничивающие типичные конъюгаты с флуоресцентными красителями показаны ниже:In some embodiments, non-limiting typical fluorescent dye conjugates are shown below:

где PG означает группы, блокирующие 3' гидрокси, описанные в данном документе. В любых воплощениях меченого нуклеотида, описанного в данном документе, данный нуклеотид представляет собой нуклеотидтрифосфат.where PG refers to the 3' hydroxy blocking groups described herein. In any embodiments of the labeled nucleotide described herein, the nucleotide is a nucleotide triphosphate.

НаборыSets

Согласно настоящему раскрытию также предложены наборы, включающие один или более чем один 3' блокированный нуклеозид и/или нуклеотид, описанный в данном документе, например, 3' блокированный нуклеотид Формулы (I), (Ia) или (II). Такие наборы обычно будут включать по меньшей мере один 3' блокированный нуклеотид или нуклеозид, меченный красителем, наряду с по меньшей мере одним дополнительным компонентом. Дополнительный(ные) компонент(ты) может(гут) представлять собой один или более чем один компонент, идентифицированный в способе, изложенном в данном документе, или в разделе Примеров ниже. Некоторые неограничивающие примеры компонентов, которые могут быть объединены в набор по настоящему раскрытию, излагаются ниже.The present disclosure also provides kits comprising one or more 3' blocked nucleosides and/or nucleotides described herein, for example, a 3' blocked nucleotide of Formula (I), (Ia) or (II). Such kits will typically include at least one 3' blocked nucleotide or dye-labeled nucleoside, along with at least one additional component. The additional component(s) may be one or more than one component identified in the method set forth herein or in the Examples section below. Some non-limiting examples of components that may be combined in the present disclosure are set forth below.

В конкретном воплощении набор может включать по меньшей мере один меченый 3' блокированный нуклеотид или нуклеозид совместно с мечеными или немечеными нуклеотидами или нуклеозидами. Например, нуклеотиды, меченные красителями, могут быть поставлены в комбинации с немечеными или природными нуклеотидами и/или с флуоресцентно мечеными нуклеотидами или их любой комбинацией. Комбинации нуклеотидов могут быть предоставлены в виде отдельных индивидуальных компонентов (например, один тип нуклеотида на сосуд или пробирку) или в виде смесей нуклеотидов (например, два или более чем два нуклеотида, смешанных в том те самом сосуде или пробирке).In a particular embodiment, the kit may include at least one labeled 3' blocked nucleotide or nucleoside together with labeled or unlabeled nucleotides or nucleosides. For example, dye-labeled nucleotides may be provided in combination with unlabeled or naturally occurring nucleotides and/or fluorescently labeled nucleotides or any combination thereof. Combinations of nucleotides may be provided as separate individual components (eg, one type of nucleotide per vial or tube) or as mixtures of nucleotides (eg, two or more than two nucleotides mixed in the same vial or tube).

Когда наборы содержат множество, в частности, два или три, или более, в частности, четыре 3' блокированных нуклеотида, меченных соединением-красителем, разные нуклеотиды могут быть меченными разными соединениями-красителями, или один может быть темным - без соединений-красителей. Когда разные нуклеотиды являются меченными разными соединениями-красителями, характеристикой данных наборов является именно то, что соединения-красители представляют собой спектрально различимые флуоресцентные красители. Термин «спектрально различимые флуоресцентные красители» в том виде, в котором он используется в данном документе, относится к флуоресцентным красителям, которые испускают флуоресцентную энергию при длинах волн, которые могут быть различены оборудованием для выявления флуоресценции (например, имеющаяся в продаже платформа секвенирования ДНК на основе капилляров) при присутствии в одном образце двух или более чем двух таких красителей. Когда два нуклеотида, меченных соединениями-флуоресцентными красителями, поставляются в виде набора, характеристикой некоторых воплощений является именно то, что спектрально различимые флуоресцентные красители могут быть возбуждены при одинаковой длине волны, как, например, посредством того же самого лазера. Когда четыре 3' блокированных нуклеотида (А, С, Т и G), меченных соединениями-флуоресцентными красителями, поставляются в виде набора, характеристикой некоторых воплощений является именно то, что два из спектрально различимых флуоресцентных красителей могут быть оба возбуждены при одной длине волны, а другие два спектрально различимых красителя могут быть оба возбуждены при другой длине волны. Конкретными длинами волн возбуждения являются 488 нм и 532 нм.When the arrays contain multiple, in particular two or three or more, in particular four 3' blocked nucleotides labeled with a dye compound, different nucleotides may be labeled with different dye compounds, or one may be dark without dye compounds. When different nucleotides are labeled with different dye compounds, the characteristic of these kits is that the dye compounds are spectrally distinguishable fluorescent dyes. The term "spectrally detectable fluorescent dyes" as used herein refers to fluorescent dyes that emit fluorescent energy at wavelengths that can be detected by fluorescence detection equipment (e.g., a commercially available DNA sequencing platform on capillary base) in the presence of two or more than two such dyes in one sample. When two nucleotides labeled with fluorescent dye compounds are supplied as a set, it is a feature of some embodiments that the spectrally distinct fluorescent dyes can be excited at the same wavelength, such as by the same laser. When four 3' blocked nucleotides (A, C, T and G) labeled with fluorescent dye compounds are supplied as a set, a characteristic of some embodiments is that two of the spectrally distinguishable fluorescent dyes can both be excited at the same wavelength, and the other two spectrally distinct dyes can both be excited at a different wavelength. The specific excitation wavelengths are 488 nm and 532 nm.

В одном воплощении набор включает первый 3' блокированный нуклеотид, меченный первым красителем, и второй нуклеотид, меченный вторым красителем, где данные красители имеют различие в максимуме поглощения по меньшей мере 10 нм, в частности, от 20 нм до 50 нм. Более конкретно два данных соединения-красителя имеют Стоксовы сдвиги от 15 до 40 нм, где «стоксов сдвиг» представляет собой расстояние между длинами волн пика поглощения и пика испускания.In one embodiment, the kit includes a first 3' blocked nucleotide labeled with a first dye and a second nucleotide labeled with a second dye, wherein the dyes have a difference in absorbance maximum of at least 10 nm, in particular from 20 nm to 50 nm. More specifically, the two dye compounds have Stokes shifts of 15 to 40 nm, where the “Stokes shift” is the distance between the wavelengths of the absorption peak and the emission peak.

В альтернативном воплощении наборы по данному раскрытию могут содержать 3’-блокированные нуклеотиды, где то же самое основание мечено двумя или более чем двумя разными красителями. Первый нуклеотид (например, 3' блокированный нуклеотидтрифосфат Т или 3' блокированный нуклеотидтрифосфат G) может метиться первым красителем. Второй нуклеотид (например, 3' блокированный нуклеотидтрифосфат С) может метиться вторым красителем, спектрально отличным от первого красителя, например, «зеленым» красителем, поглощающим при меньше, чем 600 нм, и «синим» красителем, поглощающим при меньше, чем 500 нм, например, при 400-500 нм, в частности 450-460 нм). Третий нуклеотид (например, 3' блокированный нуклеотидтрифосфат А) может метиться в виде смеси первого и второго красителей или смеси первого, второго и третьего красителей, а четвертый нуклеотид (например, 3' блокированный нуклеотидтрифосфат G или 3' блокированный нуклеотидтрифосфат Т) может быть «темным» и не содержит метки. В одном примере нуклеотиды 1-4 могут быть меченными «синим», «зеленым», «сине-зеленым» и темным. Для дальнейшего упрощения оборудования четыре нуклеотида могут метиться двумя красителями, возбуждаемыми одним лазером, и, таким образом, мечение нуклеотидов 1-4 может представлять собой «синий 1», «синий 2», «синий 1/синий 2» и темный.In an alternative embodiment, the kits of this disclosure may contain 3'-blocked nucleotides, where the same base is labeled with two or more different dyes. A first nucleotide (eg, 3' blocked nucleotide triphosphate T or 3' blocked nucleotide triphosphate G) may be labeled with a first dye. The second nucleotide (e.g., 3' blocked nucleotide triphosphate C) may be labeled with a second dye that is spectrally different from the first dye, for example, a “green” dye that absorbs at less than 600 nm and a “blue” dye that absorbs at less than 500 nm , for example, at 400-500 nm, in particular 450-460 nm). The third nucleotide (e.g., 3' blocked nucleotide triphosphate A) may be labeled as a mixture of the first and second dyes or a mixture of the first, second and third dyes, and the fourth nucleotide (e.g., 3' blocked nucleotide triphosphate G or 3' blocked nucleotide triphosphate T) may be " dark" and does not contain a label. In one example, nucleotides 1-4 may be labeled blue, green, blue-green, and dark. To further simplify the equipment, four nucleotides can be labeled with two dyes excited by a single laser, and thus the labeling of nucleotides 1-4 can be blue 1, blue 2, blue 1/blue 2, and dark.

В конкретных воплощениях данные наборы могут содержать четыре меченых 3' блокированных нуклеотида (например, А, С, Т, G), где каждый тип нуклеотида содержит такую же 3' блокирующую группу и флуоресцентную метку, и где каждая флуоресцентная метка имеет отличный максимум флуоресценции, и каждая из флуоресцентных меток отличается от других трех меток. Данные наборы могут быть такими, что две или более чем две флуоресцентные метки имеют аналогичный максимум поглощения, но отличный стоксов сдвиг. В некоторых других воплощениях один тип нуклеотида является немеченым.In specific embodiments, these kits may contain four labeled 3' blocked nucleotides (e.g., A, C, T, G), where each type of nucleotide contains the same 3' blocking group and a fluorescent label, and where each fluorescent label has a different fluorescence maximum, and each of the fluorescent marks is different from the other three marks. These arrays may be such that two or more than two fluorescent labels have a similar absorption maximum but a different Stokes shift. In some other embodiments, one type of nucleotide is unlabeled.

Хотя наборы и иллюстрируются в данном документе примерами в отношении конфигураций, имеющих разные нуклеотиды, которые метятся разными соединениями-красителями, будет понятно то, что данные наборы могут включать 2, 3, 4 или более разных нуклеотидов, которые имеют такое же соединение-краситель. В некоторых воплощениях данный набор также включает фермент и подходящий для действия фермента буфер. В некоторых таких воплощениях фермент представляет собой полимеразу, терминальную дезоксинуклеотидилтрансферазу или обратную транскриптазу. В конкретных воплощениях данный фермент представляет собой ДНК-полимеразу, такую как ДНК-полимераза 812 (Pol 812) или ДНК-полимераза 1901 (Pol 1901). Аминокислотные последовательности полимераз Pol 812 и Pol 1901 описываются, например, в заявках на патент США №16/670876, поданной 31 октября 2019 г., и 16/703569, поданной 4 декабря 2019 г., которые обе включаются в данный документ посредством ссылки.Although the sets are exemplified herein with respect to configurations having different nucleotides that are labeled with different dye compounds, it will be appreciated that the sets may include 2, 3, 4 or more different nucleotides that have the same dye compound. In some embodiments, the kit also includes an enzyme and a buffer suitable for the action of the enzyme. In some such embodiments, the enzyme is a polymerase, terminal deoxynucleotidyl transferase, or reverse transcriptase. In specific embodiments, the enzyme is a DNA polymerase, such as DNA polymerase 812 (Pol 812) or DNA polymerase 1901 (Pol 1901). The amino acid sequences of the polymerases Pol 812 and Pol 1901 are described, for example, in US patent applications No. 16/670876, filed October 31, 2019, and 16/703569, filed December 4, 2019, both of which are incorporated herein by reference.

Другие компоненты, подлежащие включению в такие наборы, могут включать буферы и тому подобное. Нуклеотиды по настоящему раскрытию и любые другие нуклеотидные компоненты, включающие смеси разных нуклеотидов, могут быть предоставлены в данном наборе в концентрированном виде для разведения перед применением. В таких воплощениях также может быть включен подходящий буфер для разведения. Опять-таки, в набор по настоящему раскрытию может быть включен один или более чем один компонент, идентифицированный в способе, изложенном в данном документе.Other components to be included in such kits may include buffers and the like. The nucleotides of the present disclosure and any other nucleotide components, including mixtures of different nucleotides, may be provided in this kit in concentrated form for dilution before use. In such embodiments, a suitable dilution buffer may also be included. Again, one or more than one components identified in the method set forth herein may be included in the kit of the present disclosure.

Способы секвенированияSequencing methods

Меченые нуклеотиды или нуклеозиды согласно настоящему раскрытию можно использовать в любом способе анализа, таком как способ, который включает выявление флуоресцентной метки, присоединенной к нуклеотиду или нуклеозиду, независимо от того, самой ли по себе или включенной в или ассоциированной с большей молекулярной структурой или конъюгатом. В данном контексте термин «включенный в полинуклеотид» может означать то, что 5'-фосфат соединяется в фосфодиэфирной связи с 3’-ОН группой второго (модифицированного или немодифицированного) нуклеотида, который сам может образовать часть более длинной полинуклеотидной цепи. 3' конец нуклеотида, изложенного в данном документе, может быть связан или может не быть связан в фосфодиэфирной связи с 5'-фосфатом другого (модифицированного или немодифицированного) нуклеотида. Таким образом, в одном неограничивающем воплощении согласно данному раскрытию предложен способ выявления нуклеотида, включенного в полинуклеотид, который включает: (а) включение по меньшей мере одного нуклеотида по раскрытию в полинуклеотид и (b) выявление нуклеотида(дов), включенного(ных) в данный полинуклеотид посредством выявления флуоресцентного сигнала от соединения-красителя, присоединенного к указанному(ным) нуклеотиду(дам).The labeled nucleotides or nucleosides of the present disclosure can be used in any assay method, such as a method that involves detecting a fluorescent label attached to the nucleotide or nucleoside, whether alone or included in or associated with a larger molecular structure or conjugate. As used herein, the term "embedded in a polynucleotide" may mean that the 5'-phosphate is linked in a phosphodiester bond to the 3'-OH group of a second (modified or unmodified) nucleotide, which itself may form part of a longer polynucleotide chain. The 3' end of a nucleotide set forth herein may or may not be linked in a phosphodiester bond to the 5'-phosphate of another (modified or unmodified) nucleotide. Thus, in one non-limiting embodiment according to this disclosure, there is provided a method for detecting a nucleotide included in a polynucleotide, which includes: (a) including at least one nucleotide of the disclosure in the polynucleotide and (b) identifying the nucleotide(s) included in a given polynucleotide by detecting a fluorescent signal from a dye compound attached to said nucleotide(s).

Данный способ может включать: стадию синтеза (а), в которой один или более чем один нуклеотид согласно данному раскрытию включается в полинуклеотид, и стадию выявления (b), в которой один или более чем один нуклеотид, включенный в полинуклеотид, выявляется посредством выявления или количественного измерения их флуоресценции.The method may include: a synthesis step (a), in which one or more than one nucleotide according to this disclosure is included in a polynucleotide, and a detection step (b), in which one or more than one nucleotide included in the polynucleotide is detected by detection or quantitative measurement of their fluorescence.

Некоторые воплощения настоящей заявки направлены на способы секвенирования, включающие: (а) включение по меньшей мере одного меченого нуклеотида, как описано в данном документе, в полинуклеотид и (b) выявление меченого(ных) нуклеотида(дов), включенного(ных) в данный полинуклеотид, посредством выявления флуоресцентного сигнала от нового флуоресцентного красителя, присоединенного куказанному(ным) полинуклеотиду(дам).Some embodiments of the present application are directed to sequencing methods comprising: (a) incorporating at least one labeled nucleotide as described herein into a polynucleotide and (b) identifying the labeled nucleotide(s) included in the polynucleotide. polynucleotide, by detecting a fluorescent signal from a new fluorescent dye attached to the specified polynucleotide(s).

Некоторые воплощения настоящего раскрытия относятся к способу определения последовательности целевого одноцепочечного полинуклеотида, включающему:Some embodiments of the present disclosure provide a method for determining the sequence of a target single-stranded polynucleotide, comprising:

(a) включение нуклеотида, содержащего 3’-ОН блокирующую группу и выявляемую метку, как описано в данном документе, в копию полинуклеотидной цепи, комплементарной по меньшей мере части целевой полинуклеотидной цепи;(a) incorporating a nucleotide containing a 3'-OH blocking group and a detectable tag as described herein into a copy of the polynucleotide chain complementary to at least a portion of the target polynucleotide chain;

(b) выявление идентичности нуклеотида, включенного в копию полинуклеотидной цепи; и(b) identifying the identity of a nucleotide included in a copy of the polynucleotide chain; And

(c) осуществление химического удаления метки и 3’-ОН блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи.(c) effecting chemical removal of the tag and the 3'-OH blocking group from a nucleotide included in a copy of the polynucleotide chain.

В некоторых воплощениях способ секвенирования дополнительно включает (d) отмывку химически удаленной метки и 3' блокирующей группы от копии полинукеотидной цепи. В некоторых таких воплощениях 3' блокирующая группа и выявляемая метка удаляются перед введением следующего комплементарного нуклеотида. В некоторых других воплощениях 3' блокирующая группа и выявляемая метка удаляются за один этап химической реакции. В некотором воплощении стадия промывки (d) также удаляет не включенные нуклеотиды. В некоторых других воплощениях на стадии промывки после химического расщепления метки и 3' блокирующей группы также используется палладиевый акцептор радикалов.In some embodiments, the sequencing method further comprises (d) washing the chemically removed tag and 3' blocking group from a copy of the polynucleotide chain. In some such embodiments, the 3' blocking group and detectable tag are removed before introducing the next complementary nucleotide. In some other embodiments, the 3' blocking group and detectable tag are removed in a single chemical reaction step. In some embodiment, washing step (d) also removes unincorporated nucleotides. In some other embodiments, a palladium radical scavenger is also used in the washing step after chemical cleavage of the label and 3' blocking group.

В некоторых воплощениях стадии (a)-(d) повторяют, пока не определится последовательность части матричной полинуклеотидной цепи. В некоторых воплощениях стадии (a)-(d) повторяют по меньшей мере 50 раз, по меньшей мере 75 раз, по меньшей мере 100 раз, по меньшей мере 150 раз, по меньшей мере 200 раз, по меньшей мере 250 раз или по меньшей мере 300 раз.In some embodiments, steps (a)-(d) are repeated until the sequence of a portion of the template polynucleotide chain is determined. In some embodiments, steps (a)-(d) are repeated at least 50 times, at least 75 times, at least 100 times, at least 150 times, at least 200 times, at least 250 times, or at least at least 300 times.

В некоторых воплощениях метка и 3' блокирующая группа удаляются в двух отдельных химических реакциях. В некоторых таких воплощениях удаление метки от нуклеотида, включенного в копию полинуклеотидной цепи, включает приведение в контакт копии цепи, включающей данный включенный нуклеотид, с первым расщепляющим раствором. В некотором таком воплощении первый расщепляющий раствор содержит фосфин, такой как триал килфосфин. Неограничивающие примеры триалкилфосфинов включаютIn some embodiments, the tag and the 3' blocking group are removed in two separate chemical reactions. In some such embodiments, removing the label from a nucleotide included in a copy of the polynucleotide strand includes contacting the copy of the strand including the included nucleotide with a first digestion solution. In some such embodiment, the first cleavage solution contains a phosphine, such as trial kylphosphine. Non-limiting examples of trialkylphosphines include

трис(гидроксипропил)фосфин (ТНР), трис-(2-карбоксиэтил)фосфин (ТСЕР), трис(гидроксиметил)фосфин (ТНМР) или трис(гидроксиэтил)фосфин (ТНЕР). В одном воплощении первый расщепляющий раствор содержит ТНР. В некоторых таких воплощениях удаление 3' блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи, включает приведение в контакт копии цепи, включающей данный включенный нуклеотид, со вторым расщепляющим раствором. В некоторых таких воплощениях второй расщепляющий раствор содержит палладиевый (Pd) катализатор. В некоторых других воплощениях Pd катализатор представляет собой Pd(0) катализатор. В некоторых таких воплощениях Pd(0) получают смешиванием комплекса Pd(II) [(PdCl(C3H5))2] с ТНР in situ. Молярное отношение комплекса Pd(II) и ТНР может составлять 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 или 1:10. В одном воплощении молярное отношение Pd:THP составляет 1:5. В некоторых других воплощениях можно добавлять один или более чем один восстановитель, такой как аскорбиновая кислота или ее соль (например, аскорбат натрия). В некоторых воплощениях второй расщепляющий раствор может содержать один или более чем один буферизующий реагент, такой как первичный амин, вторичный амин, третичный амин, карбонатная соль, фосфатная соль или боратная соль, или их комбинации. В некоторых других воплощениях буферизующий реагент содержит этаноламин (ЕА),tris(hydroxypropyl)phosphine (THP), tris-(2-carboxyethyl)phosphine (TCEP), tris(hydroxymethyl)phosphine (THMP) or tris(hydroxyethyl)phosphine (THEP). In one embodiment, the first cleavage solution contains THP. In some such embodiments, removing a 3' blocking group from a nucleotide included in a copy of the polynucleotide strand involves contacting the copy of the strand including the included nucleotide with a second cleavage solution. In some such embodiments, the second cleavage solution contains a palladium (Pd) catalyst. In some other embodiments, the Pd catalyst is a Pd(0) catalyst. In some such embodiments, Pd(0) is prepared by mixing the Pd(II) complex [(PdCl(C 3 H 5 )) 2 ] with THP in situ. The molar ratio of Pd(II) complex and THP can be 1:2, 1:3, 1:4, 1:5, 1:6, 1:7, 1:8, 1:9 or 1:10. In one embodiment, the Pd:THP molar ratio is 1:5. In some other embodiments, one or more reducing agents, such as ascorbic acid or a salt thereof (eg, sodium ascorbate), can be added. In some embodiments, the second cleavage solution may contain one or more buffering reagents, such as a primary amine, a secondary amine, a tertiary amine, a carbonate salt, a phosphate salt, or a borate salt, or combinations thereof. In some other embodiments, the buffering reagent contains ethanolamine (EA),

трис(гидроксиметил)аминометан (Tris), глицин, карбонат натрия, фосфат натрия, борат натрия, 2-диметиламинометанол (DMEA), 2-диэтиламинометанол (DEEA), N,N,N',N'-тетраметилэтилендиамин (TEMED) или N,N,N',N'-тетраэтилэтилендиамин (TEEDA), или их комбинации. В одном воплощении буферизующий реагент представляет собой DEEA. В другом воплощении буферизующий реагент содержит одну или более чем одну неорганическую соль, такую как карбонатна соль, фосфатная соль или боратная соль, или их комбинации. В одном воплощении неорганическая соль представляет собой натриевую соль. В некоторых других воплощениях 3' блокированный нуклеотид содержит группу АОМ, а второй расщепляющий раствор содержит палладиевый (Pd) катализатор и один или более чем один буферизующий реагент, описанный в данном документе (например, третичный амин, такой как DEEA), и имеет рН от примерно 9,0 до примерно 10,0 (например, 9,6 или 9,8).tris(hydroxymethyl)aminomethane (Tris), glycine, sodium carbonate, sodium phosphate, sodium borate, 2-dimethylaminomethanol (DMEA), 2-diethylaminomethanol (DEEA), N,N,N',N'-tetramethylethylenediamine (TEMED) or N ,N,N',N'-tetraethylethylenediamine (TEEDA), or combinations thereof. In one embodiment, the buffering reagent is DEEA. In another embodiment, the buffering reagent contains one or more inorganic salts, such as a carbonate salt, a phosphate salt or a borate salt, or combinations thereof. In one embodiment, the inorganic salt is a sodium salt. In some other embodiments, the 3' blocked nucleotide contains an AOM group, and the second cleavage solution contains a palladium (Pd) catalyst and one or more than one buffering reagent described herein (e.g., a tertiary amine such as DEEA), and has a pH of about 9.0 to about 10.0 (for example, 9.6 or 9.8).

В некоторых альтернативных воплощениях метку и 3’-ОН блокирующую группу удаляют в одной химической реакции. В некоторых таких воплощениях метка присоединяется к нуклеотиду через расщепляемый линкер, содержащий такой же фрагмент, что и 3' блокирующая группа, например, и линкер, и 3' блокирующая группа могут содержать ацетальный фрагмент или тиокарбаматный фрагмент как описано в данном документе. В некотором таком воплощении одна химическая реакция проводится в расщепляющем растворе, содержащем Pd катализатор, описанный выше.In some alternative embodiments, the tag and the 3'-OH blocking group are removed in a single chemical reaction. In some such embodiments, the label is attached to the nucleotide through a cleavable linker containing the same moiety as the 3' blocking group, e.g., both the linker and the 3' blocking group may contain an acetal moiety or thiocarbamate fragment as described in this document. In some such embodiment, one chemical reaction is carried out in a cleavage solution containing the Pd catalyst described above.

В некоторых других воплощениях нуклеотиды, используемые на стадии включения (а), представляют собой полностью функционализированные нуклеотидтрифосфаты А, С, Т и G, причем каждый содержит 3' блокирующую группу, описанную в данном документе. В некоторых таких воплощениях нуклеотиды, описанные в данном документе, обеспечивают превосходную стабильность в растворе во время циклов секвенирования по сравнению с такими же нуклеотидами, защищенными стандартной 3’-О-азидометильной блокирующей группой. Например, ацетальная или тиокарбаматная блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% или 3000% улучшенную стабильность по сравнению с защищенной азидометилом 3’-ОН при тех же самых условиях в течение такого же периода времени, уменьшая, посредством этого, значения предфазирования и приводя к большим длинам считываемых фрагментов при секвенировании. В некоторых воплощениях стабильность измеряется при температуре окружающей среды или при температуре ниже температуры окружающей среды (такой как 4-10°С). В других воплощениях стабильность измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях стабильность измеряется в растворе при основном рН среды, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых других воплощениях значение предфазирования с 3' блокированным нуклеотидом, описанным в данном документе, составляет меньше, чем примерно 0,25; 0,24; 0,23; 0,22; 0,21; 0,20; 0,19; 0,18; 0,17; 0,16; 0,15; 0,14; 0,13; 0,12; 0,11; 0,10; 0,09; 0,08; 0,07; 0,06 или 0,05 после более чем 50, 100 или 150 циклов SBS. В некоторых других воплощениях значение предфазирования с 3' блокированным нуклеотидом составляет меньше, чем примерно 0,25; 0,24; 0,23; 0,22; 0,21; 0,20; 0,19; 0,18; 0,17; 0,16; 0,15; 0,14; 0,13; 0,12; 0,11; 0,10; 0,09; 0,08; 0,07; 0,06 или 0,05 после более чем 50, 100 или 150 циклов SBS. В одном воплощении каждый ffN содержит группу 3’-АОМ.In certain other embodiments, the nucleotides used in incorporation step (a) are fully functionalized nucleotide triphosphates A, C, T, and G, each containing a 3' blocking group as described herein. In some such embodiments, the nucleotides described herein provide superior stability in solution during sequencing runs compared to the same nucleotides protected by a standard 3'-O-azidomethyl blocking group. For example, acetal or thiocarbamate blocking groups disclosed herein can impart at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100 %, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500%, 2000%, 2500% or 3000% improved stability compared to azidomethyl protected 3'- OH under the same conditions for the same period of time, thereby reducing prephasing values and resulting in longer read lengths when sequencing. In some embodiments, stability is measured at ambient temperature or at a temperature below ambient temperature (such as 4-10°C). In other embodiments, stability is measured at elevated temperature, such as 40°C, 45°C, 50°C, 55°C, 60°C, or 65°C. In some such embodiments, stability is measured in solution at the basic pH of the environment, for example, pH 9.0; 9.2; 9.4; 9.6; 9.8 or 10.0. In some other embodiments, the prephasing value with the 3' blocked nucleotide described herein is less than about 0.25; 0.24; 0.23; 0.22; 0.21; 0.20; 0.19; 0.18; 0.17; 0.16; 0.15; 0.14; 0.13; 0.12; 0.11; 0.10; 0.09; 0.08; 0.07; 0.06 or 0.05 after more than 50, 100 or 150 SBS cycles. In some other embodiments, the 3' blocked nucleotide prephasing value is less than about 0.25; 0.24; 0.23; 0.22; 0.21; 0.20; 0.19; 0.18; 0.17; 0.16; 0.15; 0.14; 0.13; 0.12; 0.11; 0.10; 0.09; 0.08; 0.07; 0.06 or 0.05 after more than 50, 100 or 150 SBS cycles. In one embodiment, each ffN contains a 3'-AOM group.

В некоторых воплощениях 3' блокированные нуклеотиды, описанные в данном документе, обеспечивают превосходную скорость деблокирования в растворе после стадии химического расщепления цикла секвенирования, по сравнению с такими же нуклеотидами, защищенными стандартной 3’-О-азидометильной блокирующей группой. Например, ацетальная (например, АОМ) или тиокарбаматная блокирующие группы, раскрытые в данном документе, могут придавать по меньшей мере на 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% или 2000% улучшенную скорость деблокирования по сравнению с 3’-ОН, защищенной азидометилом, с использованием стандартного деблокирущего реагента (такого как трис(гидроксипропил)фосфин), уменьшая, посредством этого, общее время для цикла секвенирования. В некоторых воплощениях время деблокирования для каждого нуклеотида уменьшается примерно на 5%, 10%, 20%, 30%, 40%, 50% или 60%. Например, время деблокирования для 3’-АОМ и 3’-О-азидометила составляет примерно 4-5 секунд и примерно 9-10 секунд, соответственно, при определенных условиях химической реакции. В некоторых воплощениях время полужизни (t1/2) блокирующей группы АОМ по меньшей мере в 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 раз меньше, чем азидометильной блокирующей группы. В некотором таком воплощении t1/2 АОМ составляет примерно 1 минуту, тогда как t1/2 азидометила составляет примерно 11 минут. В некоторых воплощениях скорость деблокирования измеряется при температуре окружающей среды или при температуре ниже температуры окружающей среды (такой как 4-10°С). В других воплощениях скорость деблокирования измеряется при повышенной температуре, такой как 40°С, 45°С, 50°С, 55°С, 60°С или 65°С. В некоторых таких воплощениях скорость деблокирования измеряется в растворе в среде с основным рН, например, при рН 9,0; 9,2; 9,4; 9,6; 9,8 или 10,0. В некоторых таких воплощениях молярное отношение деблокирующего реагента к субстрату (т.е. 3' блокированному нуклеозиду или нуклеотиду) составляет примерно 10:1, примерно 5:1, примерно 2:1, примерно 1:1, примерно 1:2, примерно 1:5 или примерно 1:10. В одном воплощении каждый ffN содержит группу 3’-АОМ.In some embodiments, the 3' blocked nucleotides described herein provide superior release rates in solution after the chemical cleavage step of the sequencing run, compared to the same nucleotides protected by a standard 3'-O-azidomethyl blocking group. For example, acetal (eg, AOM) or thiocarbamate blocking groups disclosed herein can impart at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80% , 90%, 100%, 150%, 200%, 300%, 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 1500% or 2000% improved release speed compared to 3' -OH protected with azidomethyl using a standard deblocking reagent (such as tris(hydroxypropyl)phosphine), thereby reducing the overall sequencing run time. In some embodiments, the unblocking time for each nucleotide is reduced by about 5%, 10%, 20%, 30%, 40%, 50%, or 60%. For example, the release time for 3'-AOM and 3'-O-azidomethyl is about 4-5 seconds and about 9-10 seconds, respectively, under certain chemical reaction conditions. In some embodiments, the half-life (t 1/2 ) of the AOM blocking group is at least 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 times less than the azidomethyl blocking group. In some such embodiment, the t1 /2 of AOM is about 1 minute, while the t1 /2 of azidomethyl is about 11 minutes. In some embodiments, the release rate is measured at ambient temperature or at a temperature below ambient temperature (such as 4-10°C). In other embodiments, the release rate is measured at an elevated temperature, such as 40°C, 45°C, 50°C, 55°C, 60°C, or 65°C. In some such embodiments, the deblocking rate is measured in solution in a basic pH environment, for example, pH 9.0; 9.2; 9.4; 9.6; 9.8 or 10.0. In some such embodiments, the molar ratio of deblocking reagent to substrate (i.e., 3' blocked nucleoside or nucleotide) is about 10:1, about 5:1, about 2:1, about 1:1, about 1:2, about 1 :5 or approximately 1:10. In one embodiment, each ffN contains a 3'-AOM group.

В любых воплощениях способов, описанных в данном документе, меченый нуклеотид представляет собой нуклеотидтрифосфат. В любых воплощениях способа, описанного в данном документе, цепь целевого полинуклеотида присоединяется к твердой подложке, такой как проточная ячейка.In any embodiments of the methods described herein, the labeled nucleotide is a nucleotide triphosphate. In any embodiments of the method described herein, a strand of the target polynucleotide is attached to a solid support, such as a flow cell.

В одном воплощении по меньшей мере один нуклеотид включается в полинуклеотид на стадии синтеза посредством действия фермента полимеразы. В некоторых таких воплощениях полимераза может представлять собой ДНК-полимеразу Pol 812 или Pol 1901. Однако можно использовать другие способы присоединения нуклеотидов к полинуклеотидам, как, например, химический синтез олигонуклеотидов или лигирование меченых олигонуклеотидов с немечеными олигонуклеотидами. Следовательно, термин «включение» при использовании по отношению к нуклеотиду и полинуклеотиду может охватывать синтез полинуклеотида химическими способами, а также ферментативными способами.In one embodiment, at least one nucleotide is incorporated into a polynucleotide during synthesis through the action of a polymerase enzyme. In some such embodiments, the polymerase may be DNA polymerase Pol 812 or Pol 1901. However, other methods of joining nucleotides to polynucleotides can be used, such as chemical synthesis of oligonucleotides or ligation of labeled oligonucleotides to unlabeled oligonucleotides. Therefore, the term "incorporation" when used in relation to a nucleotide and a polynucleotide can cover the synthesis of a polynucleotide by chemical methods as well as enzymatic methods.

В конкретном воплощении стадия синтеза проводится и возможно может включать инкубирование цепи полинуклеотида-матрицы с реакционной смесью, содержащей меченые 3' блокированные нуклеотиды по данному раскрытию. Полимераза также может быть предоставлена при условиях, которые обеспечивают образование фосфодиэфирной связи между свободной 3’-ОН группой на цепи полинуклеотида, подвергнутого отжигу с цепью полинуклеотида-матрицы, и 5' фосфатной группой на нуклеотиде. Таким образом, стадия синтеза может включать образование цепи полинуклеотида в том виде, в котором оно управляется комплементарным образованием пар нуклеотидов с цепью матрицы.In a particular embodiment, the synthesis step is carried out and may optionally include incubating the template polynucleotide strand with a reaction mixture containing labeled 3' blocked nucleotides according to this disclosure. The polymerase may also be provided under conditions that allow formation of a phosphodiester bond between the free 3'-OH group on the polynucleotide chain annealed to the template polynucleotide chain and the 5' phosphate group on the nucleotide. Thus, the synthesis step may involve the formation of a polynucleotide strand as driven by complementary nucleotide pairing with the template strand.

Во всех воплощениях данных способов стадия выявления может проводиться, в то время как цепь полинуклеотида, в которую включаются меченые нуклеотиды, подвергается отжигу с цепью матрицы или после стадии денатурации, на которой две данные цепи разделяются. Другие стадии, например, стадии химической или ферментативной реации, или стадии очистки, могут быть включены между стадией синтеза и стадией выявления. В частности, целевая цепь, включающая меченый(ные) нуклеотид(ды), может быть выделена или очищена и затем подвергнута дальнейшей обработке или использована в последующем анализе. В качестве примера, целевые полинуклеотиды, меченные нуклеотидом(дами), как описано в данном документе, на стадии синтеза могут быть затем использованы в качестве меченых зондов или праймеров. В других воплощениях продукт стадии синтеза, изложенный в данном документе, может быть подвергнут дальнейшим стадиям реакции и, если желательно, продукт данных последующих стадий очищают или выделяют.In all embodiments of these methods, the detection step may be carried out while the polynucleotide strand into which the labeled nucleotides are included is annealed to the template strand or after a denaturation step in which the two strands are separated. Other steps, for example chemical or enzymatic reaction steps, or purification steps, may be included between the synthesis step and the detection step. In particular, the target strand including the labeled nucleotide(s) can be isolated or purified and then further processed or used in subsequent analysis. As an example, target polynucleotides labeled with nucleotide(s) as described herein in the synthesis step can then be used as labeled probes or primers. In other embodiments, the product of the synthesis step set forth herein may be subjected to further reaction steps and, if desired, the product of these subsequent steps is purified or isolated.

Подходящие условия для стадии синтеза будут хорошо известны знакомым со стандартными методиками молекулярной биологии. В одном воплощении стадия синтеза может быть аналогичной стандартной реакции достройки праймера с использованием нуклеотидов-предшественников, включающих нуклеотиды, как описано в данном документе, с образованием достроенной целевой цепи, комплементарной цепи матрицы, в присутствии подходящего фермента полимеразы. В других воплощениях стадия синтеза может сама образовать часть реакции амплификации, продуцирующей меченый двухцепочечный продукт амплификации, состоящий из подвергнувшихся отжигу комплементарных цепей, полученных в результате копирования целевой и матричной полинуклеотидных цепей. Другие типичные стадии синтеза включают ник-трансляцию, полимеризацию с вытеснением цепи, случайное мечение ДНК с праймерами и т.д. Особенно полезным ферментом-полимеразой для стадии синтеза является полимераза, которая способна катализировать включение нуклеотидов, как изложено в данном документе. Можно использовать целый ряд встречающихся в природе или модифицированных полимераз. В качестве примера, для синтетической реакции, которая проводится с использованием условий термоциклирования, можно использовать термостабильную полимеразу, тогда как термостабильная полимераза может быть нежелательной для изотермических реакций достройки праймера. Подходящие термостабильные полимеразы, которые способны включать нуклеотиды согласно данному раскрытию, включают полимеразы, описанные в WO 2005/024010 или WO 06/120433, каждая из которых включается в данный документ посредством ссылки. В синтетических реакциях, которые проводятся при меньших температурах, таких как 37°С, ферменты-полимеразы не обязательно должны быть термостабильными полимеразами, следовательно, выбор полимеразы будет зависеть от целого ряда факторов, таких как температура реакции, рН, активность вытеснения цепи и тому подобных.Suitable conditions for the synthesis step will be well known to those familiar with standard molecular biology techniques. In one embodiment, the synthesis step may be similar to a standard primer extension reaction using precursor nucleotides comprising nucleotides as described herein to form an extended target strand complementary to the template strand, in the presence of a suitable polymerase enzyme. In other embodiments, the synthesis step may itself form part of an amplification reaction producing a labeled double-stranded amplification product consisting of annealed complementary strands resulting from copying of the target and template polynucleotide chains. Other typical synthesis steps include nick translation, strand displacement polymerization, random DNA labeling with primers, etc. A particularly useful polymerase enzyme for the synthesis step is one that is capable of catalyzing the incorporation of nucleotides, as set forth herein. A variety of naturally occurring or modified polymerases can be used. As an example, for a synthetic reaction that is carried out using thermocycling conditions, a thermostable polymerase may be used, whereas a thermostable polymerase may not be desirable for isothermal primer extension reactions. Suitable thermostable polymerases that are capable of incorporating nucleotides according to this disclosure include the polymerases described in WO 2005/024010 or WO 06/120433, each of which is incorporated herein by reference. In synthetic reactions that are carried out at lower temperatures, such as 37°C, polymerase enzymes do not necessarily need to be thermostable polymerases, therefore the choice of polymerase will depend on a number of factors such as reaction temperature, pH, chain displacement activity and the like .

В конкретных неограничивающих воплощениях данное раскрытие охватывает способы секвенирования нуклеиновых кислот, повторного секвенирования, полногеномного секвенирования, подсчета однонуклеотидных полиморфизмов, любое другое приложение, включающее выявление меченого нуклеотида или нуклеозида, изложенных в данном документе, при их включении в полинуклеотид. В любом из множества других приложений, выигрывающих от применения полинуклеотидов, меченных нуклеотидами, содержащими флуоресцентные красители, можно использовать меченые нуклеотиды или нукеозиды с красителями, изложенные в данном документе.In specific non-limiting embodiments, this disclosure covers methods for nucleic acid sequencing, resequencing, whole genome sequencing, single nucleotide polymorphism counting, any other application involving the detection of a labeled nucleotide or nucleoside as set forth herein when incorporated into a polynucleotide. Any of the many other applications that benefit from the use of polynucleotides labeled with nucleotides containing fluorescent dyes can use the labeled nucleotides or nuceosides with dyes set forth herein.

В конкретном воплощении согласно данному раскрытию предложено применение меченых нуклеотидов согласно данному раскрытию в реакции секвенирования полинуклеотида посредством синтеза (SBS). Секвенирование посредством синтеза обычно включает последовательное добавление одного или более чем одного нуклеотида или олигонуклеотида к растущей полинуклеотидной цепи в направлении от 5' до 3' с использованием полимеразы или лигазы для того, чтобы образовать удлиненную полинуклеотидную цепь, комплементарную нуклеиновой кислоте-матрице, подлежащей секвенированию. Идентичность основания, присутствующего в одном или более чем одном добавленном нуклеотиде, может быть определена на этапе выявления или «визуализации». Идентичность добавленного основания может быть определена после каждой стадии включения нуклеотида. Последовательность матрицы может быть затем выведена с использованием традиционных правил образования пар оснований по Уотсону-Крику. Применение меченых нуклеотидов, изложенных в данном документе, для определения идентичности одного основания может быть полезным, например, в подсчете однонуклеотидных полиморфизмов, и такие реакции достройки на одно основание находятся в пределах объема данного раскрытия.In a specific embodiment, this disclosure provides the use of labeled nucleotides according to this disclosure in a polynucleotide sequencing by synthesis (SBS) reaction. Sequencing by synthesis typically involves the sequential addition of one or more nucleotides or oligonucleotides to a growing polynucleotide chain in the 5' to 3' direction using a polymerase or ligase to form an extended polynucleotide chain complementary to the template nucleic acid to be sequenced. The identity of the base present in one or more than one added nucleotide can be determined during the detection or "visualization" step. The identity of the added base can be determined after each nucleotide incorporation step. The template sequence can then be deduced using traditional Watson-Crick base pairing rules. The use of labeled nucleotides set forth herein to determine single base identity may be useful, for example, in the counting of single nucleotide polymorphisms, and such single base extension reactions are within the scope of this disclosure.

В одном воплощении настоящего раскрытия последовательность полинуклеотида-матрицы определяется посредством выявления включения одного или более чем одного 3' блокированного нуклеотида, описанного в данном документе, в растущую цепь, комплементарную полинуклеотиду-матрице, подлежащему секвенированию, посредством выявления флуоресцентной(ных) метки(ток), присоединенной(ных) к включенному(ным) нуклеотиду(дам). Секвенирование полинуклеотида-матрицы может быть запущено с использованием подходящего праймера (или он может быть получен в виде конструкции шпильки, которая будет содержать праймер как часть шпильки), и растущая цепь достраивается ступенчато посредством добавления нуклеотидов к 3' концу праймера в реакции, катализируемой полимеразой.In one embodiment of the present disclosure, the sequence of a template polynucleotide is determined by detecting the inclusion of one or more 3' blocked nucleotides described herein in a growing strand complementary to the template polynucleotide to be sequenced by detecting fluorescent tag(s) , attached to the included nucleotide(s). Sequencing of the template polynucleotide can be started using a suitable primer (or it can be produced as a hairpin construct that will contain the primer as part of the hairpin), and the growing strand is completed stepwise by adding nucleotides to the 3' end of the primer in a polymerase-catalyzed reaction.

В конкретных воплощениях каждый из разных нуклеотидтрифосфатов (А, Т, G и С) может метиться уникальным флуорофором и также содержит блокирующую группу в 3' положении для предотвращения неконтролируемой полимеризации. В качестве альтернативы, один из четырех нуклеотидов может быть немеченым (темным). Фермент-полимераза включает нуклеотид в растущую цепь, комплементарную полинуклеотиду-матрице, и блокирующая группа предотвращает дальнейшее включение нуклеотидов. Любые невключенные нуклеотиды могут быть отмыты, и флуоресцентный сигнал от каждого включенного нуклеотида может быть «считан» оптически посредством подходящих средств, таких как прибор с зарядовой связью с использованием возбуждения лазером и подходящих фильтров испускания. 3’-блокирующая группа и соединения-флуоресцентные красители могут быть затем удалены (снятие защиты) одновременно или последовательно для экспонирования растущей цепи для дальнейшего включения нуклеотидов. Типично идентичность включенного нуклеотида будет определяться после каждой стадии включения, но это не является строго существенным. Аналогичным образом, в патенте США №5302509 (который включен в данный документ посредством ссылки) раскрыт способ секвенирования полинуклеотидов, иммобилизованных на твердой подложке.In specific embodiments, each of the different nucleotide triphosphates (A, T, G and C) may be labeled with a unique fluorophore and also contains a blocking group at the 3' position to prevent uncontrolled polymerization. Alternatively, one of the four nucleotides may be unlabeled (dark). The polymerase enzyme incorporates a nucleotide into a growing strand complementary to the template polynucleotide, and the blocking group prevents further incorporation of nucleotides. Any unincorporated nucleotides can be washed away, and the fluorescent signal from each incorporated nucleotide can be "read" optically by suitable means, such as a charge-coupled device using laser excitation and suitable emission filters. The 3' blocking group and fluorescent dye compounds can then be removed (deprotection) simultaneously or sequentially to expose the growing chain for further incorporation of nucleotides. Typically the identity of the incorporated nucleotide will be determined after each incorporation step, but this is not strictly essential. Similarly, US Pat. No. 5,302,509 (which is incorporated herein by reference) discloses a method for sequencing polynucleotides immobilized on a solid support.

В данном способе, как проиллюстрировано примерами выше, используется включение флуоресцентно меченых, 3’-блокированных нуклеотидов A, G, С и Т в растущую цепь, комплементарную иммобилизованному полинуклеотиду, в присутствии ДНК-полимеразы. Данная полимераза включает основание, комплементарное целевому полинуклеотиду, но дальнейшее добавление ей предотвращается посредством 3'-блокирующей группы. Затем может быть определена метка включенного нуклеотида, и блокирующая группа удаляется посредством химического расщепления с обеспечением дальнейшей полимеризации. Нуклеиновая кислота-матрица, подлежащая секвенированию в реакции секвенирования посредством синтеза, может представлять собой любой полинуклеотид, который желательно секвенировать. Нуклеиновая кислота-матрица для реакции секвенирования будет типично содержать двухцепочечную область, имеющую свободную 3’-ОН группу, которая служит в качестве праймера или точки инициации для добавления дальнейших нуклеотидов в реакции секвенирования. Область матрицы, подлежащая секвенированию, будет формировать липкий конец с этой свободной 3’-ОН группой на комплементарной цепи. Область с липким концом матрицы, подлежащая секвенированию, может быть одноцепочечной, но может быть двухцепочечной, при условии, что «присутствует одноцепочесный разрыв» на цепи, комплементарной цепи матрицы, подлежащей секвенированию, с предоставлением свободной 3’-ОН группы для инициации реакции секвенирования. В таких воплощениях секвенирование может идти посредством замещения цепи. В некоторых воплощениях в качестве отдельного компонента может быть добавлен праймер, несущий свободную 3’-ОН группу (например, короткий олигонуклеотид), который гибридизуется с одноцепочечной областью матрицы, подлежащей секвенированию. В качестве альтернативы, каждый из праймера и цепи матрицы, подлежащей секвенированию, могут образовать часть частично комплементарной самой себе цепи нуклеиновой кислоты, способной формировать внутримолекулярный дуплекс, такой как, например, структура петли шпильки. Полинуклеотиды шпильки и способы, посредством которых они могут быть присоединены к твердым подложкам, раскрываются в публикациях РСТ № WO 01/57248 и WO 2005/047301, каждая из которых включается в данный документ посредством ссылки. Нуклеотиды могут добавляться к растущему праймеру последовательно, приводя к синтезу полинуклеотидной цепи в направлении от 5' к 3'. Природа основания, которое было добавлено, может быть определена, в частности, но не обязательно после добавления каждого нуклеотида, предоставляя, таким образом, информацию о последовательности для матрицы нуклеиновой кислоты. Таким образом, нуклеотид включается в цепь нуклеиновой кислоты (или полинуклеотид) посредством соединения данного нуклеотида со свободной 3’-ОН группой цепи нуклеиновой кислоты через образование фосфодиэфирной связи с 5' фосфатной группой нуклеотида.This method, as illustrated by the examples above, uses the incorporation of fluorescently labeled, 3'-blocked nucleotides A, G, C and T into a growing strand complementary to the immobilized polynucleotide in the presence of DNA polymerase. This polymerase includes a base complementary to the target polynucleotide, but further addition is prevented by a 3' blocking group. The label of the included nucleotide can then be determined and the blocking group is removed by chemical cleavage to allow further polymerization. The template nucleic acid to be sequenced in a sequencing reaction by synthesis may be any polynucleotide that is desired to be sequenced. A template nucleic acid for a sequencing reaction will typically comprise a double-stranded region having a free 3'-OH group that serves as a primer or initiation point for adding further nucleotides to the sequencing reactions. The region of the template to be sequenced will form a sticky end with this free 3'-OH group on the complementary strand. The sticky end region of the template to be sequenced may be single-stranded, but may be double-stranded, provided that a "single-strand break is present" on a strand complementary to the template strand to be sequenced, providing a free 3'-OH group to initiate the sequencing reaction. In such embodiments, sequencing may proceed through strand displacement. In some embodiments, a primer carrying a free 3'-OH group (eg, a short oligonucleotide) that hybridizes to the single-stranded region of the template to be sequenced may be added as a separate component. Alternatively, the primer and template strand to be sequenced may each form part of a partially complementary nucleic acid strand capable of forming an intramolecular duplex, such as, for example, a hairpin loop structure. Hairpin polynucleotides and methods by which they can be attached to solid supports are disclosed in PCT Publication No. WO 01/57248 and WO 2005/047301, each of which is incorporated herein by reference. Nucleotides can be added to the growing primer sequentially, resulting in the synthesis of a polynucleotide chain in the 5' to 3' direction. The nature of the base that has been added may be determined, particularly but not necessarily after the addition of each nucleotide, thereby providing sequence information for the nucleic acid template. Thus, a nucleotide is incorporated into a nucleic acid chain (or polynucleotide) by combining the nucleotide with a free 3'-OH group of the nucleic acid chain through the formation of a phosphodiester bond with the 5' phosphate group of the nucleotide.

Нуклеиновая кислота-матрица, подлежащая секвенированию, может представлять собой ДНК или РНК, или даже гибридную молекулу, состоящую из дезоксинуклеотидов и рибонуклеотидов. Нуклеиновая кислота-матрица может содержать встречающиеся в природе и/или невстречающиеся в природе нуклеотиды и природные или неприродные связи остова, при условии, что они не предотвращают копирование матрицы в реакции секвенирования.The template nucleic acid to be sequenced may be DNA or RNA, or even a hybrid molecule consisting of deoxynucleotides and ribonucleotides. The template nucleic acid may contain naturally occurring and/or non-naturally occurring nucleotides and natural or non-natural backbone linkages, provided they do not prevent copying of the template in the sequencing reaction.

В некоторых воплощениях нуклеиновая кислота-матрица, подлежащая секвенированию, может быть присоединена к твердой подложке посредством любого подходящего способа связывания, известного в данной области, например, посредством ковалентного присоединения. В некоторых воплощениях полинуклеотиды матрицы могут присоединяться непосредственно к твердой подложке (например, подложка на основе диоксида кремния). Однако в других воплощениях данного раскрытия поверхность твердой подложки может быть некоторым способом модифицирована таким образом, чтобы обеспечивать либо прямое ковалентное присоединение полинуклеотидов матрицы, либо для иммобилизации полинуклеотидов матрицы через гидрогель или мультислой полиэлектролита, который сам может быть нековалентно присоединен к твердой подложке.In some embodiments, the template nucleic acid to be sequenced can be attached to a solid support by any suitable coupling method known in the art, such as covalent attachment. In some embodiments, the template polynucleotides may be attached directly to a solid support (eg, a silica support). However, in other embodiments of this disclosure, the surface of the solid support may be modified in some manner to permit either direct covalent attachment of the template polynucleotides or to immobilize the template polynucleotides through a hydrogel or polyelectrolyte multilayer, which itself may be non-covalently attached to the solid support.

Воплощения и альтернативы секвенирования посредством синтезаImplementations and alternatives of sequencing by synthesis

Некоторые воплощения включают методики пиросеквенирования. Пиросеквенирование выявляет высвобождение неорганического фосфата (PPi) по мере того, как конкретные нуклеотиды включаются в растущую цепь (Ronaghi, М., Karamohamed, S., Pettersson, В., Uhlen, М. and Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9; Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11; Ronaghi, M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363; патенты США №6210891; 6258568 и 6274320, раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). При пиросеквенировании высвобожденный PPi может быть выявлен посредством немедленного превращения до аденозинтрифосфата (АТФ) АТФ-сульфуразой, и уровень генерированного АТФ выявляется посредством продуцированных люциферазой фотонов. Нуклеиновые кислоты, подлежащие секвенированию, могут быть присоединены к элементам на чипе, и данный чип может быть визуализирован для фиксации хемилюминисцентных сигналов, которые продуцируются из-за включения нуклеотидов в элементы чипа. Может быть получено изображение после обработки чипа конкретным типом нуклеотида (например, А, Т, С или G). Изображения, полученные после добавления каждого типа нуклеотида, будут отличаться в отношении того, какие элементы на чипе выявляются. Данные различия на изображении отражают разное содержание последовательности элементов на чипе. Однако относительные положения каждого элемента будут оставаться неизменными на изображениях. Данные изображения можно сохранять, обрабатывать и анализировать с использованием способов, изложенных в данном документе. Например, изображениями, полученными после обработки чипа каждым другим типом нуклеотида, можно манипулировать таким же способом, как проиллюстрировано в данном документе примерами для изображений, полученных от разных каналов выявления для способов секвенирования, основанных на обратимом терминаторе.Some embodiments include pyrosequencing techniques. Pyrosequencing detects the release of inorganic phosphate (PPi) as specific nucleotides are incorporated into the growing chain (Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. and Nyren, P. (1996) "Real- time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9; Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11; Ronaghi , M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363; US patents 6210891 and 6274320, the disclosures of which are included herein. document by reference in their entirety). In pyrosequencing, released PPi can be detected by immediate conversion to adenosine triphosphate (ATP) by ATP sulfurase, and the level of ATP generated is detected by photons produced by luciferase. Nucleic acids to be sequenced can be attached to elements on a chip, and the chip can be imaged to capture the chemiluminescent signals that are produced due to the incorporation of nucleotides into elements of the chip. An image can be obtained after treating the chip with a specific type of nucleotide (for example, A, T, C or G). The images obtained after adding each type of nucleotide will differ in what features on the chip are detected. These differences in the image reflect the different content of the sequence of elements on the chip. However, the relative positions of each element will remain the same in the images. The image data can be stored, processed and analyzed using the methods described herein. For example, images obtained after processing the chip with each other type of nucleotide can be manipulated in the same manner, as illustrated herein by examples for images obtained from different detection channels for reversible terminator-based sequencing methods.

В другом показательном типе SBS циклическое секвенирование осуществляется поэтапным добавлением нуклеотидов с обратимым терминатором, содержащим, например, расщепляемую или фотообесцвечиваемую метку-краситель, как описано, например, в WO 04/018497 и патенте США №7057026, раскрытия которых включаются в данный документ посредством ссылки. Данный подход выводится на рынок Solexa (теперь Illumina, Inc.) и также описывается в WO 91/06678 и WO 07/123744, каждая из которых включается в данный документ посредством ссылки. Доступность флуоресцентно меченых терминаторов, в которых и терминация может быть обращена, и флуоресцентная метка расщеплена, облегчает эффективное циклическое секвенирование на основе обратимой терминации (CRT). Полимеразы также могут быть подвергнуты соинженении для эффективного включения и достройки от этих модифицированных нуклеотидов.In another exemplary type of SBS, cycle sequencing is accomplished by stepwise addition of nucleotides with a reversible terminator containing, for example, a cleavable or photobleachable dye tag, as described, for example, in WO 04/018497 and US Pat. No. 7,057,026, the disclosures of which are incorporated herein by reference. . This approach is being marketed by Solexa (now Illumina, Inc.) and is also described in WO 91/06678 and WO 07/123744, each of which is incorporated herein by reference. The availability of fluorescently labeled terminators, in which both termination can be reversed and the fluorescent tag cleaved, facilitates efficient cycle sequencing based on reversible termination (CRT). Polymerases can also be co-engineered to efficiently incorporate and extend from these modified nucleotides.

Предпочтительно в воплощениях секвенирования на основе обратимого терминатора метки по существу не ингибируют достройку при условиях реакции SBS. Однако выявляемые метки могут быть удаляемыми, например, посредством расщепления или деградации. Изображения могут фиксироваться после включения меток в упорядоченные элементы с нуклеиновыми кислотами. В конкретных воплощениях каждый цикл включает одновременную доставку четырех разных типов нуклеотидов на чип, и каждый тип нуклеотида имеет спектрально отличную метку. Затем можно получить четыре изображения, причем в каждом используется выявляющий канал, который является селективным для одной из четырех разных меток. В качестве альтернативы, разные типы нуклеотидов могут быть добавлены последовательно, и изображение чипа может быть получено между каждой стадией добавления. В таких воплощениях каждое изображение будет показывать элементы с нуклеиновыми кислотами, которые включили нуклеотиды конкретного типа. Разные элементы будут присутствовать или отсутствовать на разных изображениях из-за разного содержания последовательности каждого элемента. Однако относительное положение данных элементов будет оставаться на изображениях неизменным. Изображения, полученные от таких способов SBS на основе обратимого терминатора, можно сохранять, обрабатывать и анализировать, как изложено в данном документе. После стадии фиксации изображения метки можно удалять, а фрагменты обратимого терминатора можно удалять для последующих циклов присоединения и выявления нуклеотидов. Удаление меток после их выявления в конкретном цикле и перед последующим циклом может давать преимущество уменьшения фонового сигнала и перекрывания между циклами. Примеры полезных меток и способов удаления излагаются ниже.Preferably, in embodiments of reversible terminator sequencing, the tags do not substantially inhibit extension under SBS reaction conditions. However, the detected marks may be removable, for example, by cleavage or degradation. Images can be captured by incorporating tags into ordered nucleic acid elements. In specific embodiments, each cycle involves the simultaneous delivery of four different types of nucleotides to the chip, and each type of nucleotide has a spectrally distinct label. Four images can then be acquired, each using a detection channel that is selective for one of four different marks. Alternatively, different types of nucleotides can be added sequentially, and an image of the chip can be obtained between each addition step. In such embodiments, each image will show nucleic acid elements that include a particular type of nucleotide. Different elements will be present or absent in different images due to the different sequence content of each element. However, the relative position of these elements will remain unchanged in the images. Images obtained from such reversible terminator SBS methods can be stored, processed and analyzed as described herein. After the image fixation step, tags can be removed and reversible terminator fragments can be removed for subsequent rounds of addition and nucleotide detection. Removing cues after they have been identified in a particular run and before a subsequent run may have the benefit of reducing background signal and overlap between runs. Examples of useful tags and removal methods are outlined below.

В некоторых воплощениях может использоваться выявление четырех разных нуклеотидов с использованием меньше, чем четырех разных меток. Например, SBS можно осуществлять с использованием способов и систем, описанных во включенных материалах публикации США №2013/0079232. В качестве первого примера пару типов нуклеотидов можно выявлять при той же самой длине волны, но различать на основе различия в интенсивности для одного члена пары по сравнению с другим или на основе изменения одного члена пары (например, посредством химической модификации, фотохимической модификации или физической модификации), которое вызывает появление или исчезновение различимого сигнала по сравнению с сигналом, выявляемым для другого члена пары. В качестве второго примера, три из четырех разных типов нуклеотидов можно выявлять при конкретных условиях, тогда как четвертый тип нуклеотида не имеет метки, которая выявляется при данных условиях, или она минимально выявляется при данных условиях (например, минимальное выявление из-за фоновой флуоресценции и т.д.). Включение первых трех типов нуклеотидов в нуклеиновую кислоту может определяться на основе присутствия их соответствующих сигналов, а включение четвертого типа нуклеотида в нуклеиновую кислоту может определяться на основе отсутствия или минимального выявления какого-либо сигнала. В качестве третьего примера один тип нуклеотида может включать метку(ки), которая(рые) выявляется(ются) в двух разных каналах, тогда как другие типы нуклеотидов выявляются в не более чем одном из каналов. Три вышеупомянутые типичные конфигурации не считаются взаимоисключающими и могут использоваться в разных комбинациях. Типичное воплощение, которое объединяет все три примера, представляет собой способ SBS на основе флуоресценции, в котором используется первый тип нуклеотида, который выявляется в первом канале (например, дАТФ, имеющий метку, которая выявляется в первом канале при возбуждении посредством первой длины волны возбуждения), второй тип нуклеотида, который выявляется во втором канале (например, дЦТФ, имеющий метку, которая выявляется во втором канале при возбуждении посредством второй длины волны возбуждения), третий тип нуклеотида, который выявляется как в первом, так и во втором канале (например, дТТФ, имеющий по меньшей мере одну метку, которая выявляется в обоих каналах при возбуждении посредством первой и/или второй длины волны возбуждения), и четвертый тип нуклеотида, который не имеет метки, то есть не выявляется или минимально выявляется в любом из каналов (например, дГТФ, не имеющий метки).In some embodiments, detection of four different nucleotides using less than four different labels may be used. For example, SBS can be performed using the methods and systems described in the included materials of US Publication No. 2013/0079232. As a first example, a pair of nucleotide types may be detected at the same wavelength but distinguished based on a difference in intensity for one member of the pair compared to the other or based on a change in one member of the pair (e.g., through chemical modification, photochemical modification, or physical modification ), which causes the appearance or disappearance of a distinguishable signal compared to the signal detected for the other member of the pair. As a second example, three of four different types of nucleotides can be detected under particular conditions, whereas a fourth type of nucleotide has no label that is detected under given conditions, or is only minimally detectable under given conditions (e.g., minimal detection due to background fluorescence and etc.). The inclusion of the first three types of nucleotides in a nucleic acid can be determined based on the presence of their respective signals, and the inclusion of a fourth type of nucleotide in a nucleic acid can be determined based on the absence or minimal detection of any signal. As a third example, one type of nucleotide may include tag(s) that are detected in two different channels, while other types of nucleotides are detected in at most one of the channels. The above three typical configurations are not considered mutually exclusive and can be used in different combinations. A typical embodiment that combines all three examples is a fluorescence-based SBS method that uses a first type of nucleotide that is detected in a first channel (e.g., dATP having a label that is detected in the first channel when excited by a first excitation wavelength) , a second type of nucleotide that is detected in the second channel (e.g., dCTP having a label that is detected in the second channel when excited by a second excitation wavelength), a third type of nucleotide that is detected in both the first and second channels (e.g. dTTP having at least one label that is detected in both channels when excited by the first and/or second excitation wavelength), and a fourth type of nucleotide that is unlabeled, that is, not detected or minimally detected in either channel (e.g. , unlabeled dGTP).

Кроме того, как описано во включенных материалах публикации США №2013/0079232, данные секвенирования могут быть получены с использованием одного канала. В таких так называемых подходах секвенирования с одним красителем первый тип нуклеотида является меченым, но метка удаляется после получения первого изображения, и второй тип нуклеотида метится только после получения первого изображения. Третий тип нуклеотида сохраняет его метку как на первом, так и на втором изображении, а четвертый тип нуклеотида остается немеченым на обоих изображениях.In addition, as described in the included materials of US Publication No. 2013/0079232, sequencing data can be obtained using a single channel. In these so-called single-dye sequencing approaches, the first type of nucleotide is labeled, but the label is removed after the first image is acquired, and the second type of nucleotide is labeled only after the first image is acquired. The third type of nucleotide retains its label in both the first and second images, and the fourth type of nucleotide remains unlabeled in both images.

В некоторых воплощениях может использоваться секвенирование посредством методик лигирования. В таких методиках используется ДНК-лигаза для включения олигонуклеотидов и идентификации включения таких олигонуклеотидов. Данные олигонуклеотиды типично имеют разные метки, которые коррелируют с идентичностью конкретного нуклеотида в последовательности, с которой гибридизуется данный олигонуклеотид. Как и с другими способами SBS, изображения могут быть получены после обработки чипа элементов с нуклеиновыми кислотами с использованием меченых реагентов для секвенирования. На каждом изображении будут показаны элементы с нуклеиновыми кислотами, которые включили метки конкретного типа. Разные элементы будут присутствовать или отсутствовать на разных изображениях из-за разного содержания последовательности каждого элемента, но относительное положение данных элементов останется неизменным на изображениях. Изображения, полученные от способов секвенирования на основе лигирования можно хранить, обрабатывать и анализировать, как изложено в данном документе. Типичные системы и способы SBS, которые можно использовать со способами и системами, описанными в данном документе, описываются в патентах США №6969488, 6172218 и 6306597, раскрытия которых включаются в данный документ посредством ссылки во всей их полноте.In some embodiments, sequencing via ligation techniques may be used. Such techniques use DNA ligase to incorporate oligonucleotides and identify the inclusion of such oligonucleotides. These oligonucleotides typically have different labels that correlate with the identity of the particular nucleotide in the sequence to which the oligonucleotide hybridizes. As with other SBS methods, images can be obtained after processing the nucleic acid element chip using labeled sequencing reagents. Each image will show elements with nucleic acids that have included a specific type of tag. Different elements will be present or absent in different images due to the different sequence content of each element, but the relative position of these elements will remain the same in the images. Images obtained from ligation-based sequencing methods can be stored, processed and analyzed as described herein. Exemplary SBS systems and methods that can be used with the methods and systems described herein are described in US Pat. Nos. 6,969,488, 6,172,218, and 6,306,597, the disclosures of which are incorporated herein by reference in their entirety.

В некоторых воплощениях может использоваться секвенирование на основе нанопор (Deamer, D.W. & Akeson, М. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000); Deamer, D. and D. Branton, "Characterization of nucleic acids by nanopore analysis", Асе, Chem, Res. 35:817-825 (2002); Li, J., M. Gershow, D. Stein, E. Brandin, and J.A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003), раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). В таких воплощениях целевая нуклеиновая кислота проходит через нанопору. Нанопора может представлять собой синтетическую пору или белок биологической мембраны, такой как а-хемолизин. По мере прохождения целевой нуклеиновой кислоты через нанопору каждая пара оснований может быть идентифицирована посредством измерения колебаний в электрической проводимости данной поры (патент США №7001792; Soni, G.V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007); Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007); Cockroft, S.L, Chu, J., Amorin, M. & Ghadiri, M.R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc. 130, 818-820 (2008), раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). Данные, полученные от секвенирования на основе нанопор, можно сохранять, обрабатывать и анализировать, как изложено в данном документе. В частности, данные можно обрабатывать в виде изображения согласно типичной обработке оптических изображений и других изображений, как изложено в данном документе.In some embodiments, nanopore-based sequencing may be used (Deamer, D.W. & Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000); Deamer, D. and D. Branton , "Characterization of nucleic acids by nanopore analysis", Ace, Chem, Res. 35:817-825 (2002); Li, J., M. Gershow, D. Stein, E. Brandin, and J.A. and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003), the disclosures of which are incorporated herein by reference in their entirety). In such embodiments, the target nucleic acid passes through the nanopore. The nanopore may be a synthetic pore or a biological membrane protein such as α-chemolysin. As the target nucleic acid passes through the nanopore, each base pair can be identified by measuring fluctuations in the electrical conductivity of that pore (U.S. Patent No. 7001792; Soni, G.V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin Chem. 53, 1996-2001 (2007); Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007); & Ghadiri, M.R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. 130, 818-820 (2008), the disclosures of which are incorporated herein by reference. their completeness). Data obtained from nanopore-based sequencing can be stored, processed and analyzed as described herein. In particular, the data may be processed in image form according to typical processing of optical images and other images as set forth herein.

Некоторые другие воплощения способа секвенирования включают применение 3' блокированного нуклеотида, описанного в данном документе, в методике секвенирования на основе наношарика, такой как методики, описанные в патенте США №9222132, раскрытие которого включается посредством ссылки. Посредством способа амплификации по типу катящегося кольца (RCA) можно получать большое число дискретных наношариков ДНК. Смесь наношариков затем распределяется на структурированной поверхности предментного стекла, содержащей элементы, которые обеспечивают ассоциацию одиночного наношарика с каждым положением. При получении наношариков ДНК ДНК фрагментируется и лигируется с первой из четырех адапторных последовательностей. Матрица амплифицируется, циркуляризируется и расщепляется эндонуклеазой типа II. Добавляют второй набор адапторов, с последующей амплификацией, циркуляризацией и расщеплением. Данный способ повторяется для остальных двух адапторов. Конечный продукт представляет собой кольцевую матрицу с четырьмя адапторами, причем каждый разделен последовательностью матрицы. Молекулы библиотеки подвергаются стадии амплификации по типу катящегося кольца, генерируя большую массу конкатемеров, именуемых наношариками ДНК, которые затем наносятся на проточную ячейку. Goodwin et al., "Coming of age: ten years of next-generation sequencing technologies," Nat Rev Genet. 2016; 17(6):333-51.Some other embodiments of the sequencing method include the use of the 3' blocked nucleotide described herein in a nanobead-based sequencing technique, such as the techniques described in US Pat. No. 9,222,132, the disclosure of which is incorporated by reference. Through the rolling circle amplification (RCA) method, a large number of discrete DNA nanobeads can be obtained. The mixture of nanobeads is then distributed on a structured glass slide surface containing elements that ensure the association of a single nanobead with each position. When producing DNA nanobeads, the DNA is fragmented and ligated to the first of four adapter sequences. The template is amplified, circularized, and cleaved by type II endonuclease. A second set of adapters is added, followed by amplification, circularization and cleavage. This method is repeated for the remaining two adapters. The final product is a ring matrix with four adapters, each separated by a matrix sequence. The library molecules undergo a rolling ring amplification step, generating a large mass of concatemers called DNA nanobeads, which are then applied to the flow cell. Goodwin et al., "Coming of age: ten years of next-generation sequencing technologies," Nat Rev Genet. 2016; 17(6):333-51.

В некоторых воплощениях могут использоваться способы, включающие мониторинг активности ДНК-полимеразы в реальном времени. Включения нуклеотидов можно выявлять посредством взаимодействий резонансного переноса энергии флуоресценции (FRET) между полимеразой, несущей флуорофор, и нуклеотидами, меченными у-фосфатом, как описано, например, в патентах США №7329492 и 7211414, которые оба включаются в данный документ посредством ссылки, или включения нуклеотидов можно выявлять с использованием волноводов с нулевой модой, как описано, например, в патенте США №7315019, который включается в данный документ посредством ссылки, и с использованием флуоресцентных аналогов нуклеотидов и модифицированных полимераз, как описывается, например, в патенте США №7405281 и публикации США №2008/0108082, которые оба включаются в данный документ посредством ссылки. Освещение может ограничиваться объемом в масштабе зептолитров вокруг связанной с поверхностью полимеразы таким образом, что включение флуоресцентно меченых нуклеотидов можно наблюдать с малым фоном (Levene, М.J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003); Lundquist, P.M. et al. "Parallel confocal detection of single molecules in real time." Opt. Lett. 33, 1026-1028 (2008); Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008), раскрытия которых включаются в данный документ посредством ссылки во всей их полноте). Изображения, полученные от таких способов, можно сохранять, обрабатывать и анализировать, как изложено в данном документе.In some embodiments, methods may be used that include monitoring DNA polymerase activity in real time. Nucleotide inclusions can be detected through fluorescence resonance energy transfer (FRET) interactions between a fluorophore-carrying polymerase and γ-phosphate-labeled nucleotides, as described, for example, in US Pat. Nos. 7,329,492 and 7,211,414, both of which are incorporated herein by reference, or Nucleotide inclusions can be detected using zero-mode waveguides, as described, for example, in US Pat. No. 7,315,019, which is incorporated herein by reference, and using fluorescent nucleotide analogues and modified polymerases, as described, for example, in US Pat. No. 7,405,281 and US Publication No. 2008/0108082, both of which are incorporated herein by reference. Illumination can be limited to the zeptoliter-scale volume around the surface-bound polymerase such that the incorporation of fluorescently labeled nucleotides can be observed with little background (Levene, M.J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003); Lundquist, P. M. et al. "Parallel confocal detection of single molecules in real time." Opt. 33, 1026-1028 (2008); aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008), the disclosures of which are incorporated herein by reference in their entirety) . Images obtained from such methods can be stored, processed and analyzed as described herein.

Некоторые воплощения SBS включают выявление протона, высвобожденного при включении нуклеотида в продукт достройки. Например, в секвенировании на основе выявления высвобожденных протонов могут использоваться электрический детектор и ассоциированные методики, которые имеются в продаже у Ion Torrent (Guilford, СТ, подразделение Life Technologies), или способы и системы секвенирования, описанные в публикациях США №2009/0026082; 2009/0127589; 2010/0137143 и 2010/0282617, которые все включаются в данный документ посредством ссылки. Способы, изложенные в данном документе для амплификации целевых нуклеиновых кислот с использованием кинетического исключения, могут быть легко применены к субстратам, используемым для выявления протонов. Более конкретно, способы, изложенные в данном документе, можно использовать для получения клональных популяций ампиконов, которые используются для выявления протонов.Some embodiments of SBS involve detecting a proton released upon incorporation of a nucleotide into an extension product. For example, released proton sequencing may use an electrical detector and associated techniques that are commercially available from Ion Torrent (Guilford, CT, a division of Life Technologies), or the sequencing methods and systems described in US Publication No. 2009/0026082; 2009/0127589; 2010/0137143 and 2010/0282617, all of which are incorporated herein by reference. The methods outlined herein for amplifying target nucleic acids using kinetic exclusion can be readily applied to substrates used for proton detection. More specifically, the methods set forth herein can be used to generate clonal ampicon populations that are used for proton detection.

Приведенные выше способы SBS можно преимущественно осуществлять в мультиплексных форматах таким образом, что манипуляции с многими разными целевыми нуклеиновыми кислотами осуществляются одновременно. В конкретных воплощениях разные целевые нуклеиновые кислоты можно обрабатывать в общем реакционном сосуде или на поверхности конкретного субстрата. Это обеспечивает удобную доставку реагентов для секвенирования, удаление непрореагировавших реагентов и выявление событий включения мультиплексным способом. В воплощениях с использованием связанных с поверхностью целевых нуклеиновых кислот целевые нуклеиновые кислоты могут находиться в формате чипа. В формате чипа целевые нуклеиновые кислоты типично могут связываться с поверхностью пространственно различимым способом. Целевые нуклеиновые кислоты могут связываться посредством прямого ковалентного присоединения, присоединения к шарику или другой частице, или связывания с полимеразой или другой молекулой, которая присоединяется к поверхности. Данный чип может включать одну копию целевой нуклеиновой кислоты в каждом сайте (также именуемом элементом) или много копий, имеющих ту же самую последовательность, могут присутствовать в каждом сайте или элементе. Многие копии могут продуцироваться такими способами амплификации, как мостиковая амплификация или эмульсионная ПЦР (полимеразная цепная реакция), как описано с дополнительными подробностями ниже.The above SBS methods can advantageously be carried out in multiplex formats such that many different target nucleic acids are manipulated simultaneously. In specific embodiments, different target nucleic acids can be processed in a common reaction vessel or on the surface of a specific substrate. This enables convenient delivery of sequencing reagents, removal of unreacted reagents, and detection of inclusion events in a multiplex manner. In embodiments using surface-bound target nucleic acids, the target nucleic acids may be in a chip format. In a chip format, target nucleic acids can typically bind to a surface in a spatially distinct manner. Target nucleic acids can be bound by direct covalent attachment, attachment to a bead or other particle, or binding to a polymerase or other molecule that is attached to a surface. A given chip may include one copy of the target nucleic acid at each site (also called an element), or many copies having the same sequence may be present at each site or element. Many copies can be produced by amplification methods such as bridge amplification or emulsion PCR (polymerase chain reaction), as described in further detail below.

В способах, изложенных в данном документе, могут использоваться чипы, имеющие элементы в любой из целого ряда плотностей, включающих, например, по меньшей мере примерно 10 элементов/см2, 100 элементов/см2, 500 элементов/см2, 1000 элементов/см2, 5000 элементов/см2, 10000 элементов/см2, 50000 элементов/см2, 100000 элементов/см2, 1000000 элементов/см2, 5000000 элементов/см2 или больше.The methods set forth herein may use chips having elements in any of a range of densities including, for example, at least about 10 elements/cm 2 , 100 elements/cm 2 , 500 elements/cm 2 , 1000 elements/cm 2 cm2 , 5000 elements/ cm2 , 10000 elements/ cm2 , 50000 elements/ cm2 , 100000 elements/ cm2 , 1000000 elements/ cm2 , 5000000 elements/ cm2 or more.

Преимуществом способов, изложенных в данном документе, является то, что они обеспечивают быстрое и эффективное параллельное выявление большого количества целевой нуклеиновой кислоты. Соответственно, согласно настоящему раскрытию предложены интегрированные системы, способные получать и выявлять нуклеиновые кислоты с использованием методик, известных в данной области, такие как системы, проиллюстрированные примерами выше. Таким образом, интегрированная система по настоящему раскрытию может включать жидкостные компоненты, способные доставлять амплификационные реагенты и/или реагенты для секвенирования к одному или более чем одному иммобилизованному фрагменту ДНК, систему, содержащую такие компоненты, как насосы, клапаны, резервуары, жидкостные линии и тому подобное. В интегрированной системе для выявления целевых нуклеиновых кислот может быть сконфигурирована и/или использована проточная ячейка. Типичные проточные ячейки описываются, например, в публикации США №2010/0111768 и публикации США с серийным номером 13/273666, каждая из которых включается в данный документ посредством ссылки. Как проиллюстрировано примерами для проточных ячеек, для способа амплификации и для способа выявления можно использовать один или более чем один жидкостный компонент интегрированной системы. Беря в качестве примера воплощение секвенирования нуклеиновой кислоты, один или более чем один жидкостный компонент интегрированной системы можно использовать для способа амплификации, изложенного в данном документе, и для доставки реагентов для секвенирования в способе секвенирования, таком как способы, проиллюстрированные примерами выше. В качестве альтернативы, интегрированная система может включать отдельные жидкостные системы для осуществления способов амплификации и для осуществления способов выявления. Примеры интегрированных систем секвенирования, которые способны создавать амплифицированные нуклеиновые кислоты и также определять последовательность данных нуклеиновых кислот, включают, без ограничения, платформу MiSeq™ (Illumina, Inc., San Diego, CA) и устройства, описанные в публикации США с серийным №13/273666, которые включаются в данный документ посредством ссылки.An advantage of the methods described herein is that they provide rapid and efficient parallel detection of large quantities of target nucleic acid. Accordingly, the present disclosure provides integrated systems capable of obtaining and detecting nucleic acids using techniques known in the art, such as the systems exemplified above. Thus, the integrated system of the present disclosure may include fluid components capable of delivering amplification reagents and/or sequencing reagents to one or more immobilized DNA fragments, a system containing components such as pumps, valves, reservoirs, fluid lines, and the like. similar. In an integrated system, a flow cell may be configured and/or used to detect target nucleic acids. Exemplary flow cells are described, for example, in US Publication No. 2010/0111768 and US Publication Serial No. 13/273666, each of which is incorporated herein by reference. As illustrated by the flow cell examples, one or more fluid components of the integrated system can be used for the amplification method and for the detection method. Taking an embodiment of nucleic acid sequencing as an example, one or more liquid components of an integrated system can be used for the amplification method set forth herein and for delivering sequencing reagents in a sequencing method such as the methods illustrated in the examples above. Alternatively, the integrated system may include separate fluid systems for carrying out the amplification methods and for carrying out the detection methods. Examples of integrated sequencing systems that are capable of generating amplified nucleic acids and also determining the sequence of these nucleic acids include, but are not limited to, the MiSeq™ platform (Illumina, Inc., San Diego, CA) and devices described in US Publication Serial No. 13/ 273666, which are incorporated herein by reference.

Чипы, в которых полинуклеотиды были непосредственно присоединены к подложкам на основе диоксида кремния, представляют собой чипы, например, раскрытые в WO 00/06770 (включенной в данный документ посредством ссылки), где полинуклеотиды иммобилизуются на стеклянной подложке посредством реакции между боковой эпоксидной группой на стекле со внутренней аминогруппой на полинуклеотиде. Кроме того, полинуклеотиды могут быть присоединены к твердой подложке посредством реакции нуклеофила на основе серы с твердой подложкой, например, как описано в WO 2005/047301 (включена в данный документ посредством ссылки). Еще одним другим примером матричных полинуклеотидов на твердой подложке является случай, где матричные полинуклеотиды присоединяются к гидрогелевой подложке на подложках на основе диоксида кремния или другого твердого вещества, например, как описано в WO 00/31148, WO 01/01143, WO 02/12566, WO 03/014392, патенте США №6465178 и WO 00/53812, каждый из которых включается в данный документ посредством ссылки.Chips in which polynucleotides have been directly attached to silica substrates are chips, such as those disclosed in WO 00/06770 (incorporated herein by reference), where the polynucleotides are immobilized on a glass substrate by reaction between a pendant epoxy group on the glass with an internal amino group on the polynucleotide. In addition, polynucleotides can be attached to a solid support by reacting a sulfur-based nucleophile with the solid support, for example, as described in WO 2005/047301 (incorporated herein by reference). Yet another example of template polynucleotides on a solid support is where template polynucleotides are attached to a hydrogel support on silica or other solid supports, for example as described in WO 00/31148, WO 01/01143, WO 02/12566, WO 03/014392, US Patent No. 6465178 and WO 00/53812, each of which is incorporated herein by reference.

Конкретная поверхность, на которой могут быть иммобилизованы матричные полинуклеотиды, представляет собой полиакриламидный гидрогель. Полиакриламидные гидрогели описываются в ссылках, процитированных выше, и в WO 2005/065814, которая включается в данный документ посредством ссылки. Конкретные гидрогели, которые можно использовать, включают гидрогели, описанные в WO 2005/065814 и публикации США №2014/0079923. В одном воплощении гидрогель представляет собой PAZAM (поли(N-(5-азидоацетамидилпентил)акриламид-соакриламид)).A particular surface on which template polynucleotides can be immobilized is a polyacrylamide hydrogel. Polyacrylamide hydrogels are described in the references cited above and in WO 2005/065814, which is incorporated herein by reference. Specific hydrogels that can be used include those described in WO 2005/065814 and US Publication No. 2014/0079923. In one embodiment, the hydrogel is PAZAM (poly(N-(5-azidoacetamidylpentyl)acrylamide-coacrylamide)).

Молекулы ДНК-матрицы могут быть присоединены к шарикам или микрочастицам, например, как описано в патенте США №6172218 (который включен в данный документ посредством ссылки). Присоединение к шарикам или микрочастицам может быть полезным для приложений секвенирования. Могут быть получены библиотеки шариков, где каждый шарик содержит разные последовательности ДНК. Типичные библиотеки и способы их создания описываются в Nature, 437, 376-380 (2005); Science, 309, 5741, 1728-1732 (2005), каждая из которых включается в данный документ посредством ссылки. Секвенирование чипов таких шариков с использованием нуклеотидов, изложенных в данном документе, находится в пределах объема данного раскрытия.Template DNA molecules can be attached to beads or microparticles, for example, as described in US Pat. No. 6,172,218 (which is incorporated herein by reference). Attachment to beads or microparticles may be useful for sequencing applications. Bead libraries can be generated where each bead contains a different DNA sequence. Typical libraries and methods for their construction are described in Nature, 437, 376-380 (2005); Science, 309, 5741, 1728-1732 (2005), each of which is incorporated herein by reference. Sequencing chips of such beads using the nucleotides set forth herein is within the scope of this disclosure.

Матрицы, которые подлежат секвенированию, могут образовать часть «чипа» на твердой подложке, причем в данном случае чип может принимать любую удобную форму. Таким образом, способ по данному раскрытию применим ко всем типам высокоплотных чипов, включая одномолекулярные чипы, кластерные чипы и шариковые чипы. Меченые нуклеотиды по настоящему раскрытию можно использовать для секвенирования матриц по существу на любом типе чипа, включая чипы, образованные иммобилизацией молекул нуклеиновых кислот на твердой подложке, но не ограничиваясь ими.The templates to be sequenced can form part of a “chip” on a solid support, and in this case the chip can take any convenient shape. Thus, the method of this disclosure is applicable to all types of high-density chips, including single-molecule chips, cluster chips, and ball chips. The labeled nucleotides of the present disclosure can be used for sequencing templates on essentially any type of chip, including, but not limited to, chips formed by immobilizing nucleic acid molecules on a solid support.

Однако меченые нуклеотиды по данному раскрытию являются особенно полезными в контексте секвенирования кластерных чипов. В кластерных чипах отличные области на чипе (часто именуемые сайты или элементы) содержат многие молекулы полинуклеотида-матрицы. В общем, данные многие молекулы полинуклеотидов не являются индивидуально разрешимыми посредством оптических средств и, вместо этого, выявляются как единое целое. В зависимости от того, как образуется чип, каждый сайт на чипе может содержать многие копии одной индивидуальной молекулы полинуклеотида (например, данный сайт является гомогенным в отношении конкретного вида одно- или двухцепочечной нуклеиновой кислоты) или даже многие копии малого числа разных молекул полинуклеотидов (например, многие копии двух разных видов нуклеиновых кислот). Кластерные чипы молекул нуклеиновой кислоты могут быть получены с использованием общеизвестных в данной области методик. В качестве примера, WO 98/44151 и WO 00/18957, каждая из которых включается в данный документ, описывает способы амплификации нуклеиновых кислот, где и матрица, и продукты амплификации остаются иммобилизованными на твердой подложке для того, чтобы образовать чипы, состоящие из кластеров или «колоний» иммобилизованных молекул нуклеиновых кислот. Молекулы нуклеиновых кислот, присутствующие на кластерных чипах, полученных согласно данным способам, представляют собой подходящие матрицы для секвенирования с использованием нуклеотидов, меченных соединениями-красителями по данному раскрытию.However, the labeled nucleotides of this disclosure are particularly useful in the context of cluster chip sequencing. In cluster chips, distinct regions on the chip (often called sites or elements) contain many template polynucleotide molecules. In general, these multiple polynucleotide molecules are not individually resolved by optical means and are instead detected as a unit. Depending on how the chip is formed, each site on the chip may contain many copies of one individual polynucleotide molecule (e.g., a given site is homogeneous for a particular type of single- or double-stranded nucleic acid) or even many copies of a small number of different polynucleotide molecules (e.g. , many copies of two different types of nucleic acids). Cluster chips of nucleic acid molecules can be prepared using techniques generally known in the art. By way of example, WO 98/44151 and WO 00/18957, each of which are incorporated herein, describe methods for amplifying nucleic acids where both the template and the amplification products remain immobilized on a solid support to form chips consisting of clusters or “colonies” of immobilized nucleic acid molecules. The nucleic acid molecules present on cluster chips prepared according to these methods are suitable templates for sequencing using nucleotides labeled with the dye compounds of this disclosure.

Меченые нуклеотиды по настоящему раскрытию также являются полезными в секвенировании матриц на одномолекулярных чипах. Термин «одномолекулярный чип» или «SMA» в том виде, в котором он используется в данном документе, относится к популяции молекул полинуклеотидов, распределенных (или выстроенных) над твердой подложкой, где расстояние любого индивидуального полинуклеотида от всех других в популяции является таким, что возможно индивидуально разрешать индивидуальные молекулы полинуклеотидов. Целевые молекулы нуклеиновых кислот, иммобилизованных на поверхности твердой подложки, в некоторых воплощениях могут быть, таким образом, способны к разрешению оптическими средствами. Это означает то, что один или более чем один отличный сигнал, каждый представляющий один полинуклеотид, будет появляться в пределах разрешаемой области конкретного используемого визуализирующего устройства.The labeled nucleotides of the present disclosure are also useful in sequencing templates on single-molecule chips. The term "single molecule chip" or "SMA" as used herein refers to a population of polynucleotide molecules distributed (or arrayed) over a solid support, where the distance of any individual polynucleotide from all others in the population is such that it is possible to individually resolve individual polynucleotide molecules. Target nucleic acid molecules immobilized on the surface of a solid support may, in some embodiments, thus be capable of resolution by optical means. This means that one or more distinct signals, each representing a single polynucleotide, will appear within the resolution region of the particular imaging device being used.

Может достигаться выявление одиночных молекул, где расстояние между смежными молекулами полинуклеотидов на чипе составляет по меньшей мере 100 нм, более конкретно по меньшей мере 250 нм, еще более конкретно по меньшей мере 300 нм, даже более конкретно по меньшей мере 350 нм. Таким образом, каждая молекула является индивидуально разрешимой и выявляемой в виде флуоресцентной точки одной молекулы, и флуоресценция от указанной флуоресцентной точки одной молекулы также демонстрирует одноэтапное фотообесцвечивание.Detection of single molecules can be achieved where the distance between adjacent polynucleotide molecules on the chip is at least 100 nm, more particularly at least 250 nm, even more particularly at least 300 nm, even more particularly at least 350 nm. Thus, each molecule is individually resolvable and detectable as a single-molecule fluorescent dot, and the fluorescence from said single-molecule fluorescent dot also exhibits one-step photobleaching.

Термины «индивидуально разрешимый» и «индивидуальное разрешение» используются в данном документе для точного определения того, что, при визуализации, возможно различение одной молекулы на чипе от ее соседних молекул. Разделение между индивидуальными молекулами на чипе будет определяться, отчасти, конкретной методикой, используемой для разрешения индивидуальных молекул. Общие характеристики одномолекулярных чипов будут понятными посредством ссылки на опубликованные заявки WO 00/06770 и WO 01/57248, каждая из которых включается в данный документ посредством ссылки. Хотя одним применением нуклеотидов по данному раскрытию является применение в реакциях секвенирования посредством синтеза, польза данных нуклеотидов не ограничивается такими способами. На самом деле, данные нуклеотиды можно с пользой использовать в любой методологии секвенирования, которая требует выявления флуоресцентных меток, присоединенных к нуклеотидам, включенным в полинуклеотид.The terms "individually resolvable" and "individually resolved" are used herein to specifically define that, when imaged, it is possible to distinguish one molecule on a chip from its neighboring molecules. The separation between individual molecules on a chip will be determined, in part, by the specific technique used to resolve individual molecules. The general characteristics of single-molecule chips will be understood by reference to published applications WO 00/06770 and WO 01/57248, each of which is incorporated herein by reference. Although one use of the nucleotides of this disclosure is in sequencing reactions by synthesis, the usefulness of these nucleotides is not limited to such methods. In fact, these nucleotides can be usefully used in any sequencing methodology that requires the detection of fluorescent tags attached to nucleotides included in a polynucleotide.

В частности, меченые нуклеотиды по данному раскрытию можно использовать в протоколах автоматического флуоресцентного секвенирования, в частности, циклического секвенирования с флуоресцентным красителем-терминатором, на основе способа секвенирования с обрывом цепи Сэнджера и сотрудников. В таких способах обычно используются ферменты и циклическое секвенирование для включения флуоресцентно меченых дидезоксинуклеотидов в реакцию секвенирования с достройкой праймера. Так называемые способы секвенирования по Сэнджеру и родственные протоколы (сэнджеровского типа) используют рандомизированный обрыв цепи с мечеными дидезоксинуклеоидами.In particular, the labeled nucleotides of this disclosure can be used in automated fluorescent sequencing protocols, particularly fluorescent dye terminator cycle sequencing, based on the chain termination sequencing method of Sanger and co-workers. Such methods typically use enzymes and cycle sequencing to incorporate fluorescently labeled dideoxynucleotides into the primer extension sequencing reaction. So-called Sanger sequencing methods and related (Sanger-type) protocols use randomized chain termination with labeled dideoxynucleoids.

Таким образом, настоящее раскрытие также охватывает меченые нуклеотиды, которые представляют собой дидезоксинуклеоиды, не имеющие гидроксильных групп в обоих положениях: 3' и 2', причем такие дидезоксинуклеоиды подходят для применения в способах секвенирования сэнджеровского типа и тому подобных.Thus, the present disclosure also covers labeled nucleotides that are dideoxynucleoids lacking hydroxyl groups at both the 3' and 2' positions, such dideoxynucleoids being suitable for use in Sanger-type sequencing methods and the like.

Будет понятно то, что меченые нуклеотиды по настоящему раскрытию, включающие 3' блокирующие группы, также могут быть полезными с способах по Сэнджеру и родственных протоколах, так как такой же эффект, достигаемый посредством применения дидезоксинуклеотидов, может достигаться с использованием нуклеотидов, имеющих 3’-ОН блокирующие группы: и те, и другие предотвращают включение последующих нуклеотидов. Когда нуклеотиды согласно настоящему раскрытию, имеющие 3' блокирующую группу, следует использовать в способах секвенирования сенджеровского типа, будет очевидно то, что соединения-красители или выявляемые метки, присоединенные к данным нуклеотидам, не должны присоединяться через расщепляемые линкеры, так как в каждом случае, где включается меченый нуклеотид по данному раскрытию, далее не должны включаться нуклеотиды, и, таким образом, метка не должна удаляться от нуклеотида.It will be understood that the labeled nucleotides of the present disclosure, including 3' blocking groups, can also be useful with Sanger and related protocols, since the same effect achieved by using dideoxynucleotides can be achieved using nucleotides having 3'- OH blocking groups: both prevent the incorporation of subsequent nucleotides. When nucleotides of the present disclosure having a 3' blocking group are to be used in Sanger sequencing methods, it will be appreciated that the dye compounds or detectable tags attached to the nucleotides should not be attached via cleavable linkers, since in each case, where a labeled nucleotide of this disclosure is included, no further nucleotides should be included, and thus the label should not be removed from the nucleotide.

В любых воплощениях способов, описанных в данном документе, нуклеотид, используемый в приложении секвенирования, представляют собой 3' блокированный нуклеотид, описанный в данном документе, например, нуклеотид Формулы (I), (Ia) или (II). В любых воплощениях 3' блокированный нуклеотид представляет собой нуклеотидтрифосфат.In any embodiments of the methods described herein, the nucleotide used in the sequencing application is a 3' blocked nucleotide described herein, for example, a nucleotide of Formula (I), (Ia) or (II). In any embodiments, the 3' blocked nucleotide is a nucleotide triphosphate.

ПРИМЕРЫEXAMPLES

Дополнительные воплощения раскрываются с дополнительными подробностями с следующих примерах, которые ни в коей мере не предназначены для того, чтобы ограничивать объем формулы изобретения.Additional embodiments are disclosed in further detail with the following examples, which are in no way intended to limit the scope of the claims.

Пример 1. Получение нуклеозидов, блокированных 3’-ацеталем Example 1. Preparation of 3'-acetal-capped nucleosides

В данном примере получали разные нуклеозиды Т, защищенные 3’-ацеталем, согласно Схеме 2.In this example, various 3'-acetal protected nucleosides T were prepared according to Scheme 2.

Получение T1: в высушенную в печи, продутую азотом 100 мл колбу добавляли 5-йод-2'-дезоксиуридин (5,0 г, 14,12 ммоль). Его совместно выпаривали 3 раза с 30 мл пиридина, затем помещали под азот. Добавляли безводный пиридин (25 мл), и данную реакционную смесь перемешивали при комнатной температуре, пока не получался гомогенный раствор (~15 минут). Данную смесь охлаждали до 0°С в бане со льдом-водой, и медленно добавляли трет-бутилдифенилсилил хлорид (4,04 мл, 15,5 ммоль) по каплям с энергичным перемешиванием (~1 часа). Данную реакционную смесь поддерживали при 0°С в течение 8 часов, пока весь SM не потреблялся при определении посредством ТСХ (тонкослойная хроматография). Добавляли насыщенный водный раствор хлорида аммония (~15 мл), и давали данной реакционной смеси нагреться до комнатной температуры. Данную смесь разбавляли этилацетатом (100 мл) и промывали насыщенным водным хлоридом аммония (200 мл). Органический слой отделяли, и водный слой экстрагировали этилацетатом (4×50 мл). Органические слои объединяли, сушили (MgSO4) и концентрировали в вакууме с получением ~8 г прозрачного желтого масла после удаления остаточного растворителя под высоким вакуумом. Неочищенный продукт Т1 очищали колоночной флэш-хроматографией на диоксиде кремния в виде белого кристаллического вещества. Выход составляет 6,94 г (83%). ЖХ-МС (жидкостная хроматография-масс-спектрометрия) (элетрораспылительная, в режиме отрицательно заряженных ионов) 591,08 [М-Н].Preparation T1: 5-iodo-2'-deoxyuridine (5.0 g, 14.12 mmol) was added to an oven-dried, nitrogen-purged 100 mL flask. It was co-evaporated 3 times with 30 ml of pyridine, then placed under nitrogen. Anhydrous pyridine (25 ml) was added and the reaction mixture was stirred at room temperature until a homogeneous solution was obtained (~15 minutes). This mixture was cooled to 0°C in an ice-water bath, and tert-butyldiphenylsilyl chloride (4.04 mL, 15.5 mmol) was added slowly dropwise with vigorous stirring (~1 hour). This reaction mixture was maintained at 0°C for 8 hours until all SM was consumed as determined by TLC (thin layer chromatography). Saturated aqueous ammonium chloride (~15 mL) was added and the reaction mixture was allowed to warm to room temperature. This mixture was diluted with ethyl acetate (100 ml) and washed with saturated aqueous ammonium chloride (200 ml). The organic layer was separated and the aqueous layer was extracted with ethyl acetate (4×50 ml). The organic layers were combined, dried (MgSO 4 ) and concentrated in vacuo to give ~8 g of a clear yellow oil after removal of residual solvent under high vacuum. The crude product T1 was purified by flash silica column chromatography as a white crystalline solid. The yield is 6.94 g (83%). LC-MS (liquid chromatography-mass spectrometry) (electrospray, negative ion mode) 591.08 [M-N].

Получение T2: в высушенную в печи, продутую азотом коричневую 500 мл трехгорлую колбу добавляли Т1 (6,23 г, 10,5 ммоль), йодид меди(I) (200 мг, 1,05 ммоль) и бис(трифенилфосфин)палладия(II) дихлорид (369 мг, 0,526 ммоль) под азотом. Данную колбу защищали от света, и добавляли безводный дегазированный DMF (диметилформамид) (200 мл). К данному раствору добавляли 2,2,2-трифтор-N-проп-2-инил-ацетамид (4,74 г, 31,6 ммоль), с последующим добавлением дегазированного триэтиламина (2,92 мл, 21,0 ммоль). Данную реакционную смесь перемешивали при комнатной температуре под азотом в течение 6 часов до того момента, когда не наблюдали дополнительного исходного вещества посредством анализа ТСХ. Летучие вещества удаляли в вакууме (~15 мин), a DMF удаляли под сильным вакуумом (~1 часа) до коричневого осадка. Его растворяли в этилацетате (200 мл) и экстрагировали 0,1 М EDTA (этилендиаминтетрауксусная кислота) в воде (2×200 мл). Водные слои объединяли и дополнительно экстрагировали этилацетатом (200 мл). Органические фазы объединяли, сушили (MgSO4), летучие вещества удаляли в вакууме (~30 мин) и дополнительно сушили под сильным вакуумом (~1 часа) с получением примерно 8 г неочищенного коричневого/желтого масла. Данную смесь очищали колоночной флэш-хроматографией на силикагеле в виде беловатого твердого вещества. Выход: 6,0 г (85%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) 614,19 [М-Н].Preparation of T2: T1 (6.23 g, 10.5 mmol), copper(I) iodide (200 mg, 1.05 mmol) and bis(triphenylphosphine)palladium( II) dichloride (369 mg, 0.526 mmol) under nitrogen. The flask was protected from light and anhydrous degassed DMF (200 ml) was added. To this solution was added 2,2,2-trifluoro-N-prop-2-ynyl-acetamide (4.74 g, 31.6 mmol), followed by the addition of degassed triethylamine (2.92 mL, 21.0 mmol). This reaction mixture was stirred at room temperature under nitrogen for 6 hours until no additional starting material was observed by TLC analysis. Volatiles were removed under vacuum (~15 min) and DMF was removed under high vacuum (~1 hour) to a brown precipitate. It was dissolved in ethyl acetate (200 ml) and extracted with 0.1 M EDTA (ethylenediaminetetraacetic acid) in water (2 x 200 ml). The aqueous layers were combined and further extracted with ethyl acetate (200 ml). The organic phases were combined, dried (MgSO 4 ), volatiles were removed in vacuo (~30 min) and further dried under high vacuum (~1 hour) to obtain approximately 8 g of a crude brown/yellow oil. This mixture was purified by flash column chromatography on silica gel as an off-white solid. Yield: 6.0 g (85%). LC-MS (electrospray, negative ion mode) 614.19 [M-H].

Получение Т3: в высушенную в печи, продутую азотом 100 мл колбу, содержащую исходный нуклеозид T2 (2,0 г, 3,25 ммоль), под азотом добавляли одной порцией безводный DMSO (диметилсульфоксид) (6,9 мл, 97,5 ммоль) при комнатной температуре и перемешивали, пока не образовался гомогенный раствор. Добавляли по каплям уксусную кислоту (11,1 мл, 195 ммоль), с последующим добавлением по каплям уксусного ангидрида (15,1 мл, 162,09 ммоль) (~5 минут каждый). Данную смесь нагревали до 50°С и перемешивали до полного потребления исходного нуклеозида (~5 часов) при определении ТСХ (EtOAc/петролейный эфир 3:2). Данную реакционную смесь затем концентрировали до половины объема и охлаждали с использованием бани со льдом до приблизительно 0,5°С. Обработку начинали медленным добавлением холодного (~0,5°С) NaHCO3 (водн., насыщ.) (45 мл), и обеспечивали дальнейшее перемешивание до тех пор, пока больше не наблюдалось шипение (~15 мин). Данному раствору давали нагреться до комнатной температуры, затем водную фазу экстрагировали в EtOAc (3×100 мл). Объединенные органические слои сушили над MgSO4, фильтровали, и летучие вещества выпаривали при пониженном давлении и дополнительно посредством сильного вакуума. Неочищенный продукт Т3 очищали флэш-хроматографией на силикагеле в виде беловатого твердого вещества. Выход: 1,79 г (82%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) 674,20 [М-Н]-.Preparation of T3: To an oven-dried, nitrogen-purged 100 mL flask containing the starting nucleoside T2 (2.0 g, 3.25 mmol), under nitrogen, anhydrous DMSO (6.9 mL, 97.5 mmol) was added in one portion ) at room temperature and stirred until a homogeneous solution was formed. Acetic acid (11.1 mL, 195 mmol) was added dropwise, followed by acetic anhydride (15.1 mL, 162.09 mmol) dropwise (~5 minutes each). This mixture was heated to 50°C and stirred until complete consumption of the starting nucleoside (~5 hours) as determined by TLC (EtOAc/petroleum ether 3:2). This reaction mixture was then concentrated to half volume and cooled using an ice bath to approximately 0.5°C. The treatment was started by slowly adding cold (~0.5°C) NaHCO 3 (aq, sat) (45 ml) and continued stirring until no more fizzing was observed (~15 min). This solution was allowed to warm to room temperature, then the aqueous phase was extracted into EtOAc (3×100 ml). The combined organic layers were dried over MgSO 4 , filtered, and the volatiles were evaporated under reduced pressure and additionally under high vacuum. The crude product T3 was purified by flash silica gel chromatography as an off-white solid. Yield: 1.79 g (82%). LC-MS (electrospray, negative ion mode) 674.20 [M-H] - .

Получение Т4: в раствор исходного нуклеозида Т3 (1,79 г, 2,649 ммоль) в безводном CH2Cl2 (50 мл) под N2 добавляли циклогексен (1,34 мл, 13,2 ммоль). Данную смесь охлаждали в бане со льдом до 0°С, и медленно добавляли по каплям дистиллированный сульфурилхлорид (322 мкл, 3,97 ммоль) (~20 мин) под N2. После перемешивания в течение 20 мин при данной температуре ТСХ (EtOAc:петролейный эфир - 3:2 (об./об.)) показала полное потребление исходного нуклеозида. Хлоридное промежуточное соединение затем гасили прямым добавлением по каплям свежеперегнанного соответствующего ненасыщенного спирта (5 экв.), как показано на Схеме 3. Образующийся раствор перемешивали при комнатной температуре в течение 2 часов, с последующим выпариванием летучих веществ при пониженном давлении. Маслянистый остаток распределяли между EtOAc:рассолом (3:2) (125 мл). Органический слой отделяли, и водный слой дополнительно экстрагировали в EtOAc (2×50 мл). Объединенные органические экстракты сушили над MgSO4, фильтровали и летучие вещества выпаривали при пониженном давлении. Маслянистый остаток распределяли между EtOAc:рассолом (3:2) (125 мл). Органический слой отделяли, и водный слой дополнительно экстрагировали в EtOAc (2×50 мл). Объединенные органические экстракты сушили над MgSO4, фильтровали и летучие вещества выпаривали при пониженном давлении. Неочищенные продукты Т4 очищали флэш-хроматографией на силикагеле с получением конечных продуктов в виде желтого масла. Выход: 1,20 г (69%) для АОМ; 1,29 г (71%) для PrOM; 1,34 г (71%) для DPrOM.Preparation of T4: cyclohexene (1.34 ml, 13.2 mmol) was added to a solution of the starting nucleoside T3 (1.79 g, 2.649 mmol) in anhydrous CH 2 Cl 2 (50 ml) under N 2 . This mixture was cooled in an ice bath to 0°C, and distilled sulfuryl chloride (322 μl, 3.97 mmol) was slowly added dropwise (~20 min) under N 2 . After stirring for 20 minutes at this temperature, TLC (EtOAc:petroleum ether - 3:2 (v/v)) showed complete consumption of the starting nucleoside. The chloride intermediate was then quenched by direct dropwise addition of freshly distilled corresponding unsaturated alcohol (5 eq.) as shown in Scheme 3. The resulting solution was stirred at room temperature for 2 hours, followed by evaporation of the volatiles under reduced pressure. The oily residue was partitioned between EtOAc:brine (3:2) (125 ml). The organic layer was separated and the aqueous layer was further extracted into EtOAc (2×50 ml). The combined organic extracts were dried over MgSO 4 , filtered and the volatiles were evaporated under reduced pressure. The oily residue was partitioned between EtOAc:brine (3:2) (125 ml). The organic layer was separated and the aqueous layer was further extracted into EtOAc (2×50 ml). The combined organic extracts were dried over MgSO 4 , filtered and the volatiles were evaporated under reduced pressure. The crude T4 products were purified by flash silica gel chromatography to give the final products as a yellow oil. Yield: 1.20 g (69%) for AOM; 1.29 g (71%) for PrOM; 1.34 g (71%) for DPrOM.

3’-АОМ: желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 684,24.3'-AOM: yellow oil. LC-MS (electrospray, negative ion mode) [M-H] 684.24.

3’-PrOM: желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 682,22.3'-PrOM: yellow oil. LC-MS (electrospray, negative ion mode) [M-H] 682.22.

3’-DprOM: желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 710,25.3'-DprOM: yellow oil. LC-MS (electrospray, negative ion mode) [M-H] 710.25.

Получение Т5: в исходное вещество Т4 (1,04 г, 1,516 ммоль) в 50 мл круглодонной колбе под азотом добавляли безводный THF (9 мл) при комнатной температуре. Затем добавляли по каплям TBAF (1,0 М в THF, 1,7 мл, 1,70 ммоль), и данный раствор перемешивали, пока не поглощалось все SM, при определении посредством ТСХ (~2 часа). Данный раствор становился оранжевым по ходу реакции. Летучие вещества удаляли под вакуумом с получением оранжевого остатка, который растворяли в EtOAc (100 мл) и разделяли с NaHCO3 (насыщ. водн.) (60 мл). Два слоя разделяли, и водный слой экстрагировали EtOAc (60 мл). Органические слои объединяли, сушили (MgSO4), фильтровали и упаривали с получением неочищенного продукта в виде желтого масла. Данный неочищенный продукт очищали флэш-хроматографией на силикагеле с получением прозрачного желтого масла. Выход: 637 мг (94%) для АОМ; 526 мг (78%) для PrOM; 617 мг (86%) для DPrOM.Preparation of T5: Anhydrous THF (9 mL) was added to the starting material T4 (1.04 g, 1.516 mmol) in a 50 mL round bottom flask under nitrogen at room temperature. TBAF (1.0 M in THF, 1.7 mL, 1.70 mmol) was then added dropwise and the solution was stirred until all SM was absorbed as determined by TLC (~2 hours). This solution turned orange as the reaction progressed. Volatiles were removed in vacuo to leave an orange residue, which was dissolved in EtOAc (100 ml) and partitioned with NaHCO 3 (sat. aq.) (60 ml). The two layers were separated and the aqueous layer was extracted with EtOAc (60 ml). The organic layers were combined, dried (MgSO 4 ), filtered and evaporated to give the crude product as a yellow oil. This crude product was purified by flash chromatography on silica gel to give a clear yellow oil. Yield: 637 mg (94%) for AOM; 526 mg (78%) for PrOM; 617 mg (86%) for DPrOM.

3’-АОМ: прозрачное желтое масло. ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 446,12.3'-AOM: clear yellow oil. LC-MS (electrospray, negative ion mode): [M-H] 446.12.

3’-PrOM: прозрачное желтое масло (526 мг, 78%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 444,10.3'-PrOM: clear yellow oil (526 mg, 78%). LC-MS (electrospray, negative ion mode): [M-H] 444.10.

3’-DPrOM: прозрачное желтое масло (617 мг, 86%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 472,13.3'-DPrOM: clear yellow oil (617 mg, 86%). LC-MS (electrospray, negative ion mode): [M-H] 472.13.

Кроме того, получали два дополнительных 3' блокированных нуклеозида Т (3’-еАОМ Т и 3’-iAOM Т), следуя аналогичному способу, как описано выше. 3’-iAOM Т: ЖХ-МС (ЭР): (отрицательный ион) m/z 325,5 (М-Н+), (положительный ион) 327,3 (М+Н+). 3’-еАОМ Т: ЖХ-МС (ЭР): (положительный ион) m/z 341,3 (М+1Н+).In addition, two additional 3' blocked T nucleosides (3'eAOM T and 3'iAOM T) were prepared following a similar method as described above. 3'-iAOM T: LC-MS (ER): (negative ion) m/z 325.5 (M-H + ), (positive ion) 327.3 (M + H + ). 3'-eAOM T: LC-MS (ER): (positive ion) m/z 341.3 (M+1H + ).

Пример 2. Анализ стабильности 3’-ОН блокирующей группыExample 2 Stability Analysis of 3'-OH Blocking Group

В данном примере анализы стабильности для нуклеотида 5'-mP 3’-АОМ проводили параллельно в растворе буфера для включения со стандартом - нуклеотидом 5'-mP 3’-О-азидометил Т.In this example, stability assays for the nucleotide 5'-mP 3'-AOM were carried out in parallel in an inclusion buffer solution with a standard nucleotide 5'-mP 3'-O-azidomethyl T.

Приготовление бубэерного раствораPreparation of bubeer solution

1 мл 0,1 мМ каждого 5'-монофосфат 3’-защищенного нуклеотида Т в растворе 100 мМ этаноламинного буфера (рН 9,8), 100 мМ NaCl и 2,5 мМ EDTA инкубировали при 65°С в нагревательном блоке в течение 2 недель. В установленные моменты времени отбирали 40 мкл аликвоты и анализировали ВЭЖХ (высокоэффективная жидкостная хроматография) для определения процентной доли остающегося блокированного нуклеотида и окончательного образования неблокированного нуклеотида.1 ml of 0.1 mM each 5'-monophosphate 3'-protected nucleotide T in a solution of 100 mM ethanolamine buffer (pH 9.8), 100 mM NaCl and 2.5 mM EDTA was incubated at 65°C in a heating block for 2 weeks At specified time points, 40 μl aliquots were removed and analyzed by HPLC (high performance liquid chromatography) to determine the percentage of blocked nucleotide remaining and the final formation of unblocked nucleotide.

Результаты анализа стабильности, относящиеся к 5'-монофосфат 3'-защищенным нуклеотидам с ацетальными защитными группами АОМ, PrOM, DPrOM и стандартной азидометильной блокирующей группой, иллюстрируются на ФИГ. 1. Наблюдали то, что 3' блокированный нуклеотид монофосфат с блокирующими группами АОМ, PrOM и DPrOM давал более чем 30-50-кратное улучшение в уменьшении скорости деблокирования в растворе. Данный эксперимент имитирует то, как соответствующие полностью функционализированные нуклеотиды (ffN) вели бы себя при хранении в смеси для включения на картридже устройства для секвенирования. Улучшение стабильности, обеспечиваемое данными ацетальными защитными группами, также приводило бы к меньшему показателю предфазирования в циклах секвенирования. Наконец, оно улучшает срок хранения реагента - смеси для включения.The results of the stability analysis related to 5'-monophosphate 3'-protected nucleotides with acetal protecting groups AOM, PrOM, DPrOM and a standard azidomethyl blocking group are illustrated in FIG. 1. It was observed that 3' blocked nucleotide monophosphate with blocking groups AOM, PrOM and DPrOM gave more than 30-50-fold improvement in reducing the deblocking rate in solution. This experiment simulates how the corresponding fully functionalized nucleotides (ffN) would behave when stored in a mixture for inclusion on a sequencing device cartridge. The improved stability provided by these acetal protecting groups would also result in less prephasing in sequencing runs. Finally, it improves the shelf life of the reagent mixture to be included.

Пример 3. Анализ деблокирования 3’-АОМExample 3: 3'-AOM Deblocking Assay

В данном примере анализы деблокирования для 5'-mP 3’-АОМ Т и стандартного нуклеотида 5'-mP 3’-О-азидометильного Т проводили индивидуально в растворе, уникальном для каждой блокирующей группы. Создавали условия для имитации стандартного деблокирующего реагента Illumina настолько близко, насколько это возможно, и следовали одинаковой методологии. Поддерживали одинаковые концентрации активного деблокирующего реагента, буфера и нуклеозида во всех анализах, но идентичность каждого компонента была уникальной. При данном способе наблюдаемое различие в скорости между индивидуальными химиями деблокирования не может быть обусловлено различиями в концентрации препарата.In this example, unblocking assays for 5'-mP 3'-AOM T and the standard nucleotide 5'-mP 3'-O-azidomethyl T were performed individually in a solution unique to each blocking group. Conditions were set to mimic the standard Illumina release reagent as closely as possible and followed the same methodology. The same concentrations of active deblocking reagent, buffer, and nucleoside were maintained in all assays, but the identity of each component was unique. With this method, the observed differences in rates between individual deblocking chemistries cannot be due to differences in drug concentration.

Стандартные условия деблокирования азидометилаStandard conditions for azidomethyl deprotection

Нуклеотид: 5'-монофосфат 3’-О-азидометил Т. Активный деблокирующий реагент: трис(гидроксипропил)фосфин (ТНР) (1 М в 18 мΩ воде). (Возможная) добавка: аскорбат натрия (0,1 мМ в 18 мΩ воде), конечная концентрация - 1 мМ. Буфер: этаноламин, рН 9,8 (2 М в 18 мΩ воде). Гасящий реагент: H2O2.Nucleotide: 5'-monophosphate 3'-O-azidomethyl T. Active deblocking reagent: tris(hydroxypropyl)phosphine (THP) (1 M in 18 mΩ water). (Possible) additive: sodium ascorbate (0.1 mM in 18 mΩ water), final concentration 1 mM. Buffer: ethanolamine, pH 9.8 (2 M in 18 mΩ water). Quenching reagent: H 2 O 2 .

Условия деблокирования А ОМConditions for releasing A OM

Нуклеотид: 5'-монофосфат 3’-О-азидометил Т. Маточный раствор 3’-АОМ Т разводили до 0,1 мМ в 100 мМ этаноламинном буфере (рН 9,8) в стеклянном сосуде под азотом. Маточный раствор добавки - аскорбата натрия - добавляли до конечной концентрации 0,1 мМ, и данный раствор перемешивали 5 минут. Для начала данного анализа добавляли в перемешиваемый раствор при комнатной температуре деблокирующие реагенты (Pd/THP - 1/5; аскорбат натрия; этаноламин) до конечной концентрации 1 мМ ТНР. В определенные моменты времени отбирали 40 мкл аликвоты и гасили 6 мкл смеси 1:3 EDTA/H2O2 (0,025:0,075 М). Проводили анализ ВЭЖХ посредством измерения площади пика исходного нуклеозида, пика 3’-ОН и любых других пиков нуклеотидов, которые появляются на хроматограмме ВЭЖХ. Не наблюдали других побочных продуктов на основе нуклеотидов.Nucleotide: 3'-O-azidomethyl T 5'-monophosphate. The stock solution of 3'-AOM T was diluted to 0.1 mM in 100 mM ethanolamine buffer (pH 9.8) in a glass vessel under nitrogen. A stock solution of the additive, sodium ascorbate, was added to a final concentration of 0.1 mM, and this solution was stirred for 5 minutes. To begin this assay, deblocking reagents (Pd/THP - 1/5; sodium ascorbate; ethanolamine) were added to a stirred solution at room temperature to a final concentration of 1 mM THP. At certain time points, 40 μl aliquots were removed and quenched with 6 μl of a mixture of 1:3 EDTA/H 2 O 2 (0.025:0.075 M). HPLC analysis was performed by measuring the area of the parent nucleoside peak, the 3'-OH peak, and any other nucleotide peaks that appeared in the HPLC chromatogram. No other nucleotide-based byproducts were observed.

Сравнительный результат показан на ФИГ. 2А. Наблюдали то, что АОМ обеспечивал 10-кратное улучшение скорости в показателях скорости деблокирования в растворе по сравнению со стандартной азидометильной блокирующей группой. Данный эксперимент служит цели имитации того, как соответствующие ffN вели бы себя при секвенировании во время стадии деблокирования. Существенное улучшение скорости деблокирования обеспечивало бы деблокирующую стадию в виде промывки вместо 10-20-секундного времени инкубации, типично используемого в определенных платформах секвенирования от Illumina. В результате скорость деблокирования будет иметь значительное влияние на время цикла секвенирования посредством синтеза (SBS).The comparative result is shown in FIG. 2A. It was observed that AOM provided a 10-fold improvement in terms of deblocking rate in solution compared to the standard azidomethyl blocking group. This experiment serves the purpose of simulating how the corresponding ffNs would behave when sequenced during the unblocking step. A significant improvement in deblocking speed would provide a deblocking wash step instead of the 10-20 second incubation times typically used in certain Illumina sequencing platforms. As a result, the release rate will have a significant impact on the sequencing-by-synthesis (SBS) turnaround time.

Аналогичные экспериментальные условия использовали для анализа деблокирования для 3’-еАОМ Т и 3’-iAOM Т. В качестве единственного изменения отношение Pd катализатора к субстрату уменьшали до 5:1 для того, чтобы наблюдать менее отчетливые различия в скорости деблокирования. 3’-АОМ Т использовали в качестве контроля, и результаты иллюстрируются на ФИГ. 2В. Данные результаты показали то, что скорость деблокирования еАОМ и iAOM в 2-3 раза медленнее, чем АОМ при данной конкретной концентрации деблокирующего реагента с Pd катализатором. Можно ожидать то, что данное различие в скорости деблокирования среди замещенной версии и незамещенной версии блокирующих групп АОМ было бы меньше при более высоком отношении Pd катализатора к субстрату.Similar experimental conditions were used for deblocking assays for 3'-eAOM T and 3'-iAOM T. As a single change, the Pd catalyst to substrate ratio was reduced to 5:1 in order to observe less distinct differences in deblocking rates. 3'-AOM T was used as a control and the results are illustrated in FIG. 2B. These results showed that the deblocking rate of eAOM and iAOM is 2-3 times slower than AOM at a given specific concentration of the deblocking reagent with a Pd catalyst. It can be expected that this difference in deblocking rate between the substituted version and the unsubstituted version of the AOM blocking groups would be smaller at a higher Pd catalyst to substrate ratio.

Пример 4. Оптимизация палладиевой расщепляющей смеси для секвенированияExample 4: Optimization of Palladium Digestion Mixture for Sequencing

Pd/THP катализатор, используемый в реакции деблокирования, описанной в Примере 2, является очень воздухочувствительным. При воздействии воздуха он демонстрировал существенную потерю активности. В данном примере разрабатывали анализ окислительного стресса для оценки воздухочувствительности разных препаратов палладиевой расщепляющей смеси.The Pd/THP catalyst used in the deprotection reaction described in Example 2 is very air sensitive. When exposed to air, it showed a significant loss of activity. In this example, an oxidative stress assay was developed to evaluate the air sensitivity of different palladium cleavage mixture preparations.

0,5 мл Pd расщепляющей смеси аликвотировали в 5 мл стеклянный флакон и оставляли открытой для воздуха в течение 3 часов при комнатной температуре. Остаточную активность окисленной расщепляющей смеси оценивали посредством измерения расщепления 3’-АОМ следующим образом. Маточный раствор 3’-АОМ Т разводили до 0,1 мМ в 100 мМ буфере для расщепляющей смеси. Добавляли маточный раствор аскорбата натрия до конечной концентрации 1 мМ, с последующей окисленной расщепляющей смесью до конечного разведения 1/20. Через 1 час 40 мкл раствора немедленно гасили 10 мкл смеси 1:1 EDTA/H202 (0,25:0,25 М) и анализировали посредством ВЭЖХ. В данном эксперименте подвергали скринингу разные буферные реагенты, включая: первичные амины (такие как этаноламин, Tris и глицин); третичные амины (такие как 2-диметиламинометанол (DMEA), 2-диэтиламинометанол (DEEA), N,N,N',N'-тетраметилэтилендиамин (TEMED) или N,N,N',N'-тетраэтилэтилендиамин (TEEDA)); и разные неорганические соли (такие как боратная соль, карбонатная соль, фосфатная соль). Наблюдали то, что неорганические буферные реагенты (такие как борат натрия, карбонат натрия, фосфат натрия) обеспечивали наилучшую стабильность на воздухе, и палладиевый комплекс сохранял высокий % активностей. Кроме того, третичные амины также существенно улучшали стабильность Pd расщепляющей смеси по сравнению с первичными аминами.0.5 ml of Pd digestion mixture was aliquoted into a 5 ml glass vial and left open to air for 3 hours at room temperature. The residual activity of the oxidized cleavage mixture was assessed by measuring 3'-AOM cleavage as follows. The 3'-AOM T stock solution was diluted to 0.1 mM in 100 mM digestion buffer. Sodium ascorbate stock solution was added to a final concentration of 1 mM, followed by an oxidized digestion mixture to a final dilution of 1/20. After 1 hour, 40 μl of the solution was immediately quenched with 10 μl of a mixture of 1:1 EDTA/H 2 0 2 (0.25:0.25 M) and analyzed by HPLC. In this experiment, various buffer reagents were screened, including: primary amines (such as ethanolamine, Tris, and glycine); tertiary amines (such as 2-dimethylaminomethanol (DMEA), 2-diethylaminomethanol (DEEA), N,N,N',N'-tetramethylethylenediamine (TEMED) or N,N,N',N'-tetraethylethylenediamine (TEEDA)); and various inorganic salts (such as borate salt, carbonate salt, phosphate salt). It was observed that inorganic buffer reagents (such as sodium borate, sodium carbonate, sodium phosphate) provided the best stability in air, and the palladium complex retained a high % of activities. In addition, tertiary amines also significantly improved the stability of the Pd cleavage mixture compared to primary amines.

На основе этих данных получали две палладиевые расщепляющие смеси. В первом примере маточный раствор 250 мМ водн. боратного буфера (рН 9,6, 20 мл) разводили водой (14 мл) перед добавлением маточного раствора ТНР (1 М в 100 мМ Tris, рН 9, 5 мл, 5,0 ммоль) и димера аллилпалладия (II) хлорида (183 мг, 0,5 ммоль). Данную смесь энергично перемешивали в течение нескольких минут при комнатной температуре перед добавлением 1 М водн. аскорбата натрия (0,5 мл, 0,5 ммоль), 5 М водн. NaCl (10 мл) и 10% об./об. Tween 20 (0,5 мл). Во втором примере маточный раствор 2 М водн. буфера DEEA (рН 9,6, 0,6 мл) разводили водой (7,6 мл) перед добавлением маточного раствора ТНР (1 М в 100 мМ Tris, рН 9, 1,2 мл, 1,2 ммоль) и твердого димера аллилпалладия (II) хлорида (43,9 мг, 0,12 ммоль). Данную смесь энергично перемешивали в течение нескольких минут при комнатной температуре перед добавлением 1 М водн. аскорбата натрия (0,12 мл, 0,12 ммоль), 5 М водн. NaCl (2,4 мл) и 10% об./об. Tween 20 (0,12 мл).Based on these data, two palladium fission mixtures were prepared. In the first example, the stock solution is 250 mM aq. borate buffer (pH 9.6, 20 mL) was diluted with water (14 mL) before adding THP stock solution (1 M in 100 mM Tris, pH 9. 5 mL, 5.0 mmol) and allyl palladium(II) chloride dimer (183 mg, 0.5 mmol). This mixture was stirred vigorously for several minutes at room temperature before adding 1 M aq. sodium ascorbate (0.5 ml, 0.5 mmol), 5 M aq. NaCl (10 ml) and 10% v/v. Tween 20 (0.5 ml). In the second example, the stock solution is 2 M aq. DEEA buffer (pH 9.6, 0.6 mL) was diluted with water (7.6 mL) before adding THP stock solution (1 M in 100 mM Tris, pH 9, 1.2 mL, 1.2 mmol) and solid dimer allylpalladium(II) chloride (43.9 mg, 0.12 mmol). This mixture was stirred vigorously for several minutes at room temperature before adding 1 M aq. sodium ascorbate (0.12 ml, 0.12 mmol), 5 M aq. NaCl (2.4 ml) and 10% v/v. Tween 20 (0.12 ml).

Пример 5. Получение полностью функционализированных нуклеотидов и применения для приложения секвенированияExample 5: Preparation of Fully Functionalized Nucleotides and Use for Sequencing Applications

В данном примере подробно описывается получение разных полностью функционализированных нуклеотидов (ffN) с 3’-АОМ блокирующей группой. Данные ffN также использовали в приложении секвенирования посредством синтеза на платформе Illumina MiniSeq®.This example details the preparation of various fully functionalized nucleotides (ffN) with a 3'-AOM blocking group. The ffN data were also used in a sequencing-by-synthesis application on the Illumina MiniSeq® platform.

Синтез промежуточного соединения АОМ С2: нуклеозид С1 (0,5 г, 0,64 ммоль) растворяли в безводном DCM (12 мл) под N2, и данную смесь охлаждали до 0°С. Добавляли циклогексен (0,32 мл, 3,21 ммоль), с последующим добавлением по каплям SO2Cl2 (1,0 М в DCM, 1,27 мл, 1,27 ммоль). Добавляли дополнительный циклогексен (0,32 мл, 3,21 ммоль) перед быстрым переносом данной реакционной смеси на ротационный испаритель для удаления всех летучих веществ при пониженном давлении. Твердый остаток дополнительно сушили под сильным вакуумом в течение 10 мин перед растворением в безводном DCM (5 мл) под N2. Данную смесь охлаждали до 0°С, и добавляли по каплям ледяной аллиловый спирт (5 мл). Данную реакционную смесь перемешивали при 0°С в течение 2 ч перед гашением посредством добавления насыщ. водн. NaHCO3 (50 мл) и DCM (30 мл). Две фазы разделяли, и водный слой экстрагировали EtOAc (2×50 мл). Органические слои объединяли, сушили над MgSO4, фильтровали, и летучие вещества выпаривали при пониженном давлении. Неочищенный продукт очищали флэш-хроматографией на силикагеле с использованием EtOAc/петролейного эфира с получением АОМ С2 в виде белого твердого вещества (264 мг, выход 52%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 787, [M+Cl] 823.Synthesis of AOM intermediate C2: Nucleoside C1 (0.5 g, 0.64 mmol) was dissolved in anhydrous DCM (12 ml) under N 2 and the mixture was cooled to 0°C. Cyclohexene (0.32 mL, 3.21 mmol) was added, followed by dropwise addition of SO 2 Cl 2 (1.0 M in DCM, 1.27 mL, 1.27 mmol). Additional cyclohexene (0.32 mL, 3.21 mmol) was added before quickly transferring this reaction mixture to a rotary evaporator to remove all volatiles under reduced pressure. The solid residue was further dried under high vacuum for 10 min before dissolving in anhydrous DCM (5 ml) under N 2 . This mixture was cooled to 0°C and ice-cold allylic alcohol (5 ml) was added dropwise. This reaction mixture was stirred at 0°C for 2 hours before quenching by adding sat. aq. NaHCO 3 (50 ml) and DCM (30 ml). The two phases were separated and the aqueous layer was extracted with EtOAc (2×50 ml). The organic layers were combined, dried over MgSO 4 , filtered, and the volatiles were evaporated under reduced pressure. The crude product was purified by flash chromatography on silica gel using EtOAc/petroleum ether to give AOM C2 as a white solid (264 mg, 52% yield). LC-MS (electrospray, negative ion mode): [M-H] 787, [M+Cl] 823.

Синтез промежуточного соединения АОМ С3: АОМ С2 (246 мг, 0,31 ммоль) растворяли в безводном THF (9,5 мл) под N2, и данную смесь охлаждали до 0°С. Добавляли уксусную кислоту (0,054 мл, 0,94 ммоль), с последующим добавлением по каплям TBAF (1,0 М в THF, 5% воды по массе, 0,99 мл, 0,94 ммоль). Данную реакционную смесь перемешивали при 0°С в течение 5 ч перед разведением EtOAc (20 мл) и затем выливали в 0,05 М HCl водн. (20 мл). Два слоя разделяли, и водный слой экстрагировали EtOAc (2×20 мл). Органические слои объединяли, сушили над MgSO4, фильтровали, и летучие вещества выпаривали при пониженном давлении. Неочищенный продукт очищали флэш-хроматографией на силикагеле с использованием DCM/EtOAc, с получением АОМ С3 в виде желтоватого твердого вещества (114 мг, выход 66%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 549, [М+H2O-Н] 567, [M+Cl] 585, (электрораспылительная, в режиме положительно заряженных ионов): [М+Н] 551, [М+H2O+Н] 569.Synthesis of intermediate compound AOM C3: AOM C2 (246 mg, 0.31 mmol) was dissolved in anhydrous THF (9.5 ml) under N 2 and the mixture was cooled to 0°C. Acetic acid (0.054 mL, 0.94 mmol) was added, followed by dropwise addition of TBAF (1.0 M in THF, 5% water by weight, 0.99 mL, 0.94 mmol). This reaction mixture was stirred at 0°C for 5 hours before diluting with EtOAc (20 ml) and then poured into 0.05 M HCl aq. (20 ml). The two layers were separated and the aqueous layer was extracted with EtOAc (2×20 ml). The organic layers were combined, dried over MgSO 4 , filtered, and the volatiles were evaporated under reduced pressure. The crude product was purified by flash chromatography on silica gel using DCM/EtOAc to give AOM C3 as a yellowish solid (114 mg, 66% yield). LC-MS (electrospray, negative ion mode): [M-H] 549, [M+H 2 O-H] 567, [M+Cl] 585, (electrospray, positive ion mode): [M +H] 551, [M+H 2 O+H] 569.

Синтез промежуточного соединения АОМ С4: АОМ С3 (0,114 г, 0,21 ммоль), свежеактивированные 4А молекулярные сита, протонную губку (0,066 г, 0,31 ммоль) и магнитную мешалку помещали под N2, и добавляли безводный триметилфосфат (1,0 мл). Данную реакционную смесь охлаждали при ~10°С, и добавляли по каплям свежеперегнанный POCl3 (23 мкл, 0,25 ммоль). Данную реакционную смесь перемешивали при ~10°С в течение 1 часа. Раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (0,5 М в DMF, 1,7 мл, 0,85 ммоль) и безводного три-н-бутиламина (0,41 мл, 1,74 ммоль) предварительно смешивали и добавляли в ледяной раствор активированных нуклеозидов одной порцией. Данную смесь энергично перемешивали в течение 5 минут при комнатной температуре. Данную реакционную смесь выливали в отдельную колбу, содержащую энергично перемешиваемый водн. раствор 2 М ТЕАВ (~10 мл). Данную реакционную колбу промывали маленьким количеством H2O, и промывки добавляли в 2 М раствор ТЕАВ. Объединенную смесь затем перемешивали при комнатной температуре в течение 4 часов, после чего выпаривали растворитель при пониженном давлении. Остаток растворяли в водн. NH3 (35%, ~10 мл) и перемешивали при комнатной температуре в течение ночи. Данную реакционную смесь концентрировали под вакуумом и очищали флэш-хроматографией на DEAE-Sephadex. Продукт дополнительно очищали препаративной ВЭЖХ с получением чистого АОМ С4 (62 мкмоль, выход 30%, определенный спектрометрией в УФ(ультрафиолетовой)-видимой области, λmax равно 294 нм, ε равно 8600 М-1 см-1). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 589.Synthesis of intermediate compound AOM C4: AOM C3 (0.114 g, 0.21 mmol), freshly activated 4A molecular sieves, proton sponge (0.066 g, 0.31 mmol) and a magnetic stirrer were placed under N 2 , and anhydrous trimethylphosphate (1.0) was added ml). This reaction mixture was cooled at ~10°C, and freshly distilled POCl 3 (23 μl, 0.25 mmol) was added dropwise. This reaction mixture was stirred at ~10°C for 1 hour. A solution of pyrophosphate as bis-tri-n-butylammonium salt (0.5 M in DMF, 1.7 ml, 0.85 mmol) and anhydrous tri-n-butylamine (0.41 ml, 1.74 mmol) was premixed and added to an ice-cold solution of activated nucleosides in one portion. This mixture was stirred vigorously for 5 minutes at room temperature. This reaction mixture was poured into a separate flask containing vigorously stirred aq. solution of 2 M TEAB (~10 ml). This reaction flask was washed with a small amount of H 2 O, and the washes were added to a 2 M TEAB solution. The combined mixture was then stirred at room temperature for 4 hours, after which the solvent was evaporated under reduced pressure. The residue was dissolved in aq. NH 3 (35%, ~10 ml) and stirred at room temperature overnight. This reaction mixture was concentrated in vacuo and purified by flash chromatography on DEAE-Sephadex. The product was further purified by preparative HPLC to obtain pure AOM C4 (62 μmol, 30% yield, determined by UV-vis spectrometry, λ max equal to 294 nm, ε equal to 8600 M -1 cm -1 ). LC-MS (electrospray, negative ion mode): [M-N] 589.

Синтез 3'-AOM-ffC-LN3-SO7181: LN3-SO7181 (0,0205 ммоль) растворяли в безводном DMA (4 мл) под N2. Добавляли N,N-диизопропилэтиламин (28,6 мкл, 0,164 ммоль), с последующим добавлением TSTU (0,1 М в DMA, 234 мкл, 0,0234 ммоль). Реакционную смесь перемешивали под N2 при комнатной температуре в течение 1 часа. Тем временем, водный раствор АОМ С4 (0,0101 ммоль) выпаривали досуха при пониженном давлении, ресуспендировали в 0,1 М водн. ТЕАВ (400 мкл) и добавляли в раствор LN3-SO7181. Данную реакционную смесь перемешивали при RT (комнатная температура) в течение 17,5 часов и затем гасили 0,1 М водн. ТЕАВ (4 мл). Неочищенный продукт очищали флэш-хроматографией на DEAE-Sephadex. Данный продукт дополнительно очищали препаративной ВЭЖХ с получением чистого 3’-АОМ-ffC-LN3-SO7181 (6,81 мкмоль, выход 67%, определенный спектрометрией в УФ-видимой области, λmax равно 644 нм, ε равно 200000 М-1 см-1). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов): [М-Н] 1561, [М-2Н] 781, [М-3Н] 520.Synthesis of 3'-AOM-ffC-LN3-SO7181: LN3-SO7181 (0.0205 mmol) was dissolved in anhydrous DMA (4 ml) under N 2 . N,N-Diisopropylethylamine (28.6 μL, 0.164 mmol) was added, followed by TSTU (0.1 M in DMA, 234 μL, 0.0234 mmol). The reaction mixture was stirred under N 2 at room temperature for 1 hour. Meanwhile, an aqueous solution of AOM C4 (0.0101 mmol) was evaporated to dryness under reduced pressure, resuspended in 0.1 M aq. TEAB (400 μL) and added to the LN3-SO7181 solution. This reaction mixture was stirred at RT (room temperature) for 17.5 hours and then quenched with 0.1 M aq. TEAB (4 ml). The crude product was purified by flash chromatography on DEAE-Sephadex. This product was further purified by preparative HPLC to obtain pure 3'-AOM-ffC-LN3-SO7181 (6.81 µmol, 67% yield, determined by UV-visible spectrometry, λ max = 644 nm, ε = 200,000 M -1 cm -1 ). LC-MS (electrospray, negative ion mode): [M-H] 1561, [M-2H] 781, [M-3H] 520.

Синтез промежуточного соединения АОМ А2: нуклеозид А1 (716 мг, 0,95 ммоль) растворяли в 10 мл безводного дихлорметана под атмосферой N2, добавляли циклогексен (481 мкл, 4,75 ммоль), и данный раствор охлаждали до приблизительно -15°С. Добавляли по каплям сульфурилхлорид (перегнанный, 92 мкл, 1,14 ммоль), и данную реакционную смесь перемешивали в течение 20 минут. После того как все исходное вещество потреблялось, добавляли дополнительную часть циклогексена (481 мкл, 4,75 ммоль), и данную реакционную смесь выпаривали досуха при пониженном давлении. Остаток быстро продували азотом, затем добавляли аллиловый спирт (5 мл, ~100 ммоль) при перемешивании при 0°С. Данную реакционную смесь перемешивали при 0°С в течение 1 часа, затем гасили 50 мл насыщенного водн. NaHCO3. Данную реакционную смесь экстрагировали 2× 100 мл этилацетата. Объединенные органические фазы промывали 100 мл воды и 100 мл рассола, затем сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием петролейного эфира/EtOAc. Выход 60% (435 мг, 0,57 ммоль). ЖХ-МС (ЭР (электрораспылительная ионизация) и ХИ (химическая ионизация): (положительный ион) m/z 763 (М+Н+); (отрицательный ион) m/z 761 (М-Н+).Synthesis of AOM intermediate A2: nucleoside A1 (716 mg, 0.95 mmol) was dissolved in 10 ml of anhydrous dichloromethane under N 2 atmosphere, cyclohexene (481 μl, 4.75 mmol) was added and this solution was cooled to approximately -15°C . Sulfuryl chloride (distilled, 92 µl, 1.14 mmol) was added dropwise and the reaction mixture was stirred for 20 minutes. After all of the starting material had been consumed, additional cyclohexene (481 μL, 4.75 mmol) was added and the reaction mixture was evaporated to dryness under reduced pressure. The residue was quickly purged with nitrogen, then allyl alcohol (5 ml, ~100 mmol) was added with stirring at 0°C. This reaction mixture was stirred at 0°C for 1 hour, then quenched with 50 ml of saturated aq. NaHCO3 . This reaction mixture was extracted with 2×100 ml ethyl acetate. The combined organic phases were washed with 100 ml water and 100 ml brine, then dried over MgSO 4 , filtered and evaporated to dryness. The residue was purified by flash chromatography on silica gel using petroleum ether/EtOAc. Yield 60% (435 mg, 0.57 mmol). LC-MS (ES (electrospray ionization) and CI (chemical ionization): (positive ion) m/z 763 (M+H + ); (negative ion) m/z 761 (M-H + ).

Синтез промежуточного соединения АОМ A3: нуклеозид АОМ А2 (476 мг, 0,62 ммоль) растворяли в сухом THF (5 мл) под атмосферой N2, затем добавляли раствор 1,0 М TBAF в THF (750 мкл, 0,75 ммоль). Данный раствор перемешивали при комнатной температуре в течение 1,5 часов. Данный раствор разбавляли 50 мл EtOAc, затем промывали 100 мл насыщ. NaH2PO4 (рН 3) и 100 мл рассола. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием EtOAc/МеОН. Выход 90% (292 мг, 0,55 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 525 (М+Н+); (отрицательный ион) m/z 523 (М-Н+).Synthesis of intermediate AOM A3: AOM A2 nucleoside (476 mg, 0.62 mmol) was dissolved in dry THF (5 ml) under N 2 atmosphere, then a solution of 1.0 M TBAF in THF (750 μl, 0.75 mmol) was added. . This solution was stirred at room temperature for 1.5 hours. This solution was diluted with 50 ml EtOAc, then washed with 100 ml sat. NaH 2 PO 4 (pH 3) and 100 ml of brine. The organic phase was dried over MgSO 4 , filtered and evaporated to dryness. The residue was purified by flash chromatography on silica gel using EtOAc/MeOH. Yield 90% (292 mg, 0.55 mmol). LC-MS (ER and CI): (positive ion) m/z 525 (M+H + ); (negative ion) m/z 523 (M-H + ).

Синтез промежуточного соединения АОМ А4: нуклеозид АОМ A3 (285 мг, 0,544 ммоль) сушили при пониженном давлении над P2O5 в течение 18 ч. Добавляли к нему под азотом безводный триэтилфосфат (2 мл) и некоторое количество свежеактивированных 4 молекулярных сит, затем данную реакционную колбу охлаждали до 0°С в бане со льдом. Добавляли по каплям свежеперегнанный POCl3 (61 мкл, 0,65 ммоль), с последующим добавлением Proton Sponge® (175 мг, 0,816 ммоль). После добавления данную реакционную смесь дополнительно перемешивали при 0°С в течение 15 мин. Затем быстро добавляли 0,5 М раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (5,4 мл, 2,72 ммоль) в безводном DMF, с последующим немедленным добавлением три-н-бутиламина (540 мкл, 2,3 ммоль). Данную реакционную смесь выдерживали в бане со льдом-водой в течение еще 10 минут, затем гасили выливанием ее в 1 М водный триэтиламмония бикарбонат (ТЕАВ, 20 мл) и перемешивали при комнатной температуре в течение 4 часов. Все растворители выпаривали при пониженном давлении. Добавляли в приведенный выше остаток 35%-ный водный раствор аммония (20 мл), и данную смесь перемешивали при комнатной температуре в течение по меньшей мере 5 часов. Затем выпаривали растворители при пониженном давлении. Неочищенный продукт очищали сначала ионообменной хроматографией на DEAE-Sephadex А25 (100 г). Колонку элюировали градиентом водного триэтиламмония бикарбоната. Фракции, содержащие трифосфат, объединяли, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ в препаративном масштабе с использованием колонки YMC-Pack-Pro С18, элюируя 0,1 М ТЕАВ и ацетонитрилом. ЖХ-МС (ЭР и ХИ): (отрицательный ион) m/z 612 (М-Н+); (положительный ион) m/z 614 (М+Н+), 715 (M+Et3NH+).Synthesis of intermediate AOM A4: AOM A3 nucleoside (285 mg, 0.544 mmol) was dried under reduced pressure over P 2 O 5 for 18 hours. Anhydrous triethyl phosphate (2 ml) and some freshly activated 4 were added to it under nitrogen. molecular sieves, then this reaction flask was cooled to 0°C in an ice bath. Freshly distilled POCl 3 (61 µl, 0.65 mmol) was added dropwise, followed by Proton Sponge® (175 mg, 0.816 mmol). After addition, this reaction mixture was further stirred at 0°C for 15 minutes. A 0.5 M solution of bis-tri-n-butylammonium pyrophosphate (5.4 mL, 2.72 mmol) in anhydrous DMF was then quickly added, followed immediately by tri-n-butylamine (540 μL, 2.3 mmol). This reaction mixture was kept in an ice-water bath for an additional 10 minutes, then quenched by pouring it into 1 M aqueous triethylammonium bicarbonate (TEAB, 20 ml) and stirred at room temperature for 4 hours. All solvents were evaporated under reduced pressure. 35% aqueous ammonium solution (20 ml) was added to the above residue and the mixture was stirred at room temperature for at least 5 hours. The solvents were then evaporated under reduced pressure. The crude product was first purified by ion exchange chromatography on DEAE-Sephadex A25 (100 g). The column was eluted with a gradient of aqueous triethylammonium bicarbonate. The fractions containing the triphosphate were combined and the solvent was evaporated to dryness under reduced pressure. The crude material was further purified by preparative scale HPLC using a YMC-Pack-Pro C18 column, eluting with 0.1 M TEAB and acetonitrile. LC-MS (ER and CI): (negative ion) m/z 612 (M-H + ); (positive ion) m/z 614 (M+H + ), 715 (M+Et 3 NH + ).

Общая методика синтеза ffA: краситель-линкер (0,020 ммоль) растворяли в 2 мл безводного N,N'-диметилацетамида (DMA). Добавляли N,N'-диизопропилэтиламин (28,4 мкл, 0,163 ммоль), с последующим добавлением N,N,N',N'-тетраметил-O-(N-сукцинимидил)урония тетрафторбората в виде 0,1 М раствора в безводном DMA (TSTU, 232 мкл, 0,023 ммоль). Данную реакционную смесь перемешивали под азотом при комнатной температуре в течение 1 часа. Тем временем водный раствор трифосфата АОМ А4 (0,01 ммоль) выпаривали досуха при пониженном давлении и ресуспендпровали в 200 мкл 0,1 М раствора триэтиламмония бикарбоната (ТЕАВ) в воде. В данный трифосфат добавляли раствор активированного красителя-линкера, и реакционную смесь перемешивали при комнатной температуре в течение 18 часов. Неочищенный продукт очищали сначала ионообменной хроматографией на DEAE-Sephadex А25 (25 г). Фракции, содержащие трифосфат, объединяли, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ-ОФ (высокоэффективная жидкостная хроматография с обращенной фазой) в препаративном масштабе с использованием колонки YMC-Pack-Pro С18. 3’-АОМ-ffA-LN3-NR7180A: выход 38% (3,8 мкмоль). ЖХ-МС (ЭР): (отрицательный ион) m/z 1459 (М-Н+), 729 (М-2Н+), 486 (М-3Н4). 3'-AOM-ffA-LN3-BL-NR550S0: выход 37% (3,7 мкмоль). ЖХ-МС (ЭР): (отрицательный ион) m/z 1771 (М-Н+), 885 (М-2Н+), 589 (М-3Н+). 3’-АОМ ffA-LN3-BL-NR650C5: выход 51% (51 мкмоль). ЖХ-МС (ЭР): (отрицательный ион) m/z 1917 (М-Н+), 958 (М-2Н+), 645 (М-3Н+).General procedure for the synthesis of ffA: linker dye (0.020 mmol) was dissolved in 2 ml of anhydrous N,N'-dimethylacetamide (DMA). N,N'-diisopropylethylamine (28.4 µl, 0.163 mmol) was added, followed by N,N,N',N'-tetramethyl-O-(N-succinimidyl)uronium tetrafluoroborate as a 0.1 M solution in anhydrous DMA (TSTU, 232 µl, 0.023 mmol). This reaction mixture was stirred under nitrogen at room temperature for 1 hour. Meanwhile, an aqueous solution of AOM A4 triphosphate (0.01 mmol) was evaporated to dryness under reduced pressure and resuspended in 200 μl of a 0.1 M solution of triethylammonium bicarbonate (TEAB) in water. An activated dye-linker solution was added to this triphosphate, and the reaction mixture was stirred at room temperature for 18 hours. The crude product was first purified by ion exchange chromatography on DEAE-Sephadex A25 (25 g). The fractions containing the triphosphate were combined and the solvent was evaporated to dryness under reduced pressure. The crude material was further purified by RP-HPLC (reverse phase high performance liquid chromatography) on a preparative scale using a YMC-Pack-Pro C18 column. 3'-AOM-ffA-LN3-NR7180A: yield 38% (3.8 µmol). LC-MS (ES): (negative ion) m/z 1459 (M-H + ), 729 (M-2H + ), 486 (M-3H 4 ). 3'-AOM-ffA-LN3-BL-NR550S0: yield 37% (3.7 µmol). LC-MS (ES): (negative ion) m/z 1771 (M-H + ), 885 (M-2H + ), 589 (M-3H + ). 3'-AOM ffA-LN3-BL-NR650C5: yield 51% (51 µmol). LC-MS (ES): (negative ion) m/z 1917 (M-H + ), 958 (M-2H + ), 645 (M-3H + ).

Синтез промежуточного соединения АОМ G4: известный нуклеозид dG3 (100 мг, 0,143 ммоль) растворяли в 10 мл безводного дихлорметана под атмосферой N2, добавляли циклогексен (72 мкл, 0,714 ммоль), и данный раствор охлаждали до -12°С. Добавляли по каплям сульфурилхлорид (перегнанный, (1 M в DCM), 171 мкл, 0,171 ммоль), и данную реакционную смесь перемешивали в течение 10 мин. Добавляли дополнительную часть циклогексена (72 мкл, 0,714 ммоль), и данную реакционную смесь перемешивали в течение 30 мин при -12°С. Данную реакционную смесь выпаривали досуха при пониженном давлении, остаток продували азотом, и добавляли ледяной чистый аллиловый спирт (перегнанный, 0,8 мл, 12 ммоль) при перемешивании при -12°С. Данную реакционную смесь перемешивали при -12°С в течение 60 мин, затем гасили 2 мл насыщенного водн. NaHCO3. Данную смесь разделяли с этилацетатом (2 мл), водный слой экстрагировали этилацетатом. Объединенные органические фазы промывали 4 мл воды и 4 мл рассола, сушили над MgSO4, фильтровали и упаривали до неочищенного масла. Остаток очищали флэш-хроматографией на силикагеле с получением АОМ G4 в виде прозрачного масла. Выход 36% (50,9 мг, 0,072 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 710 [М+Н]+; (отрицательный ион) m/z 708 [М-Н]-.Synthesis of intermediate compound AOM G4: the known nucleoside dG3 (100 mg, 0.143 mmol) was dissolved in 10 ml of anhydrous dichloromethane under an atmosphere of N 2 , cyclohexene (72 μl, 0.714 mmol) was added and this solution was cooled to -12°C. Sulfuryl chloride (distilled, (1 M in DCM), 171 µl, 0.171 mmol) was added dropwise and the reaction mixture was stirred for 10 minutes. An additional portion of cyclohexene (72 μl, 0.714 mmol) was added and the reaction mixture was stirred for 30 minutes at -12°C. This reaction mixture was evaporated to dryness under reduced pressure, the residue was purged with nitrogen, and ice-cold pure allylic alcohol (distilled, 0.8 mL, 12 mmol) was added with stirring at -12°C. This reaction mixture was stirred at -12°C for 60 minutes, then quenched with 2 ml of saturated aq. NaHCO3 . This mixture was separated with ethyl acetate (2 ml), the aqueous layer was extracted with ethyl acetate. The combined organic phases were washed with 4 ml water and 4 ml brine, dried over MgSO 4 , filtered and evaporated to a crude oil. The residue was purified by flash chromatography on silica gel to give AOM G4 as a clear oil. Yield 36% (50.9 mg, 0.072 mmol). LC-MS (ER and CI): (positive ion) m/z 710 [M+H] + ; (negative ion) m/z 708 [M-H] - .

Синтез промежуточного соединения АОМ G5: нуклеозид AOM-G4 (111 мг, 0,156 ммоль) растворяли в сухом THF (5 мл) в атмосфере N2. Добавляли уксусную кислоту (27 мкл, 0,468 ммоль), с последующим добавлением раствора 1,0 М TBAF в THF (296 мкл, 0,296 ммоль). Данный раствор перемешивали при комнатной температуре в течение 5 часов. Данный раствор разбавляли 10 мл EtOAc, промывали 10 мл 0,05 М водн. HCl, и органическую фазу отделяли. Водную фазу экстрагировали этилацетатом. Объединенные органические фазы сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с получением АОМ G5 в виде белого твердого вещества. Выход 44% (32,4 мг, 0,068 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 472 [М+Н]+; (отрицательный ион) m/z 470 [М-Н]-.Synthesis of AOM G5 intermediate: AOM-G4 nucleoside (111 mg, 0.156 mmol) was dissolved in dry THF (5 ml) under N 2 atmosphere. Acetic acid (27 μL, 0.468 mmol) was added, followed by the addition of a solution of 1.0 M TBAF in THF (296 μL, 0.296 mmol). This solution was stirred at room temperature for 5 hours. This solution was diluted with 10 ml of EtOAc, washed with 10 ml of 0.05 M aq. HCl, and the organic phase was separated. The aqueous phase was extracted with ethyl acetate. The combined organic phases were dried over MgSO 4 , filtered and evaporated to dryness. The residue was purified by flash chromatography on silica gel to obtain AOM G5 as a white solid. Yield 44% (32.4 mg, 0.068 mmol). LC-MS (ER and CI): (positive ion) m/z 472 [M+H] + ; (negative ion) m/z 470 [M-H] - .

Синтез 3’-AOM-pppG: нуклеозид AOM-G5 (79 мг, 0,168 ммоль) со свежеактивированными 4 молекулярными ситами сушили при пониженном давлении над P2O5 в течение 18 ч. Добавляли под азотом Proton Sponge® (175 мг, 0,816 ммоль) и безводный триэтилфосфат (0,8 мл) и перемешивали при комнатной температуре в течение 1 часа. Реакционную колбу охлаждали до 0°С в ледяной бане, добавляли по каплям свежеперегнанный POCl3 (19 мкл, 0,202 ммоль), и данную реакционную смесь перемешивали при 0°С в течение 15 минут. Затем быстро добавляли 0,5 М раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (1,68 мл, 0,84 ммоль) в безводном DMF, с последующим немедленным добавлением три-н-бутиламина (168 мкл, 0,705 ммоль). Данную реакционную смесь удаляли из бани со льдом/водой и энергично перемешивали в течение 5 минут, затем гасили вливанием ее в 1 М водный триэтиламмония бикарбонат (ТЕАВ, 6 мл) и перемешивали при комнатной температуре в течение 18 часов. Все растворители выпаривали при пониженном давлении. Остаток растворяли в 35%-ном водном растворе аммиака (10 мл) и перемешивали при комнатной температуре в течение по меньшей мере 5 часов. Растворители затем выпаривали при пониженном давлении и дополнительно совместно выпаривали с водой. Неочищенный продукт сперва очищали ионообменной хроматографией на DEAE-Sephadex А25 (50 г). Колонку элюировали линейным градиентом водного триэтиламмония. Фракции, содержащие трифосфат, отбирали, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ в препаративном масштабе с использованием колонки YMC-Pack-Pro С18. 3’-AOM-pppG получали в виде триэтиламмониевой соли. Выход 24% (39,7 мкмоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 576 [М-Н]-; (положительно заряженный ион) m/z 578 [М+Н]+.Synthesis of 3'-AOM-pppG: nucleoside AOM-G5 (79 mg, 0.168 mmol) with freshly activated 4 molecular sieves were dried under reduced pressure over P 2 O 5 for 18 hours. Proton Sponge® (175 mg, 0.816 mmol) and anhydrous triethyl phosphate (0.8 ml) were added under nitrogen and stirred at room temperature for 1 hour. The reaction flask was cooled to 0°C in an ice bath, freshly distilled POCl 3 (19 μL, 0.202 mmol) was added dropwise, and the reaction mixture was stirred at 0°C for 15 minutes. A 0.5 M solution of pyrophosphate as bis-tri-n-butylammonium salt (1.68 ml, 0.84 mmol) in anhydrous DMF was then quickly added, followed by the immediate addition of tri-n-butylamine (168 µl, 0.705 mmol) . This reaction mixture was removed from the ice/water bath and stirred vigorously for 5 minutes, then quenched by pouring it into 1 M aqueous triethylammonium bicarbonate (TEAB, 6 ml) and stirred at room temperature for 18 hours. All solvents were evaporated under reduced pressure. The residue was dissolved in 35% aqueous ammonia (10 ml) and stirred at room temperature for at least 5 hours. The solvents were then evaporated under reduced pressure and further co-evaporated with water. The crude product was first purified by ion exchange chromatography on DEAE-Sephadex A25 (50 g). The column was eluted with a linear gradient of aqueous triethylammonium. Fractions containing triphosphate were collected and the solvent was evaporated to dryness under reduced pressure. The crude material was further purified by HPLC on a preparative scale using a YMC-Pack-Pro C18 column. 3'-AOM-pppG was obtained as triethylammonium salt. Yield 24% (39.7 µmol). LC-MS (ER and CI): (negatively charged ion) m/z 576 [M-H] - ; (positively charged ion) m/z 578 [M+H] + .

3'-AOM-ffT-LN3-NR550S0 синтезировали аналогично тому, как описано при получении 3’-АОМ ffA и ffC.3′-AOM-ffT-LN3-NR550S0 was synthesized in the same manner as described for the preparation of 3′-AOM ffA and ffC.

Синтез промежуточного соединения Т1: 5-йод-2'-дезоксиуридин (3 г, 8,4 ммоль) и ацетат палладия(II) (1,6 г, 7,14 ммоль) растворяли в сухом дегазированном DMF, затем добавляли N-аллилтрифторацетамид (6,4 мл, 42 ммоль). Раствор помещали под вакуум, затем продували азотом 3 раза, затем добавляли дегазированный триэтиламин (2,3 мл, 16,8 ммоль). Данный раствор нагревали до 80°С в течение 2 часов. Черную смесь охлаждали до комнатной температуры, затем разбавляли 50 мл метанола. Добавляли приблизительно 0,5 г активированного угля, и данный раствор фильтровали на целите, затем выпаривали при пониженном давлении с получением коричневого густого масла. Это неочищенное вещество очищали хроматографией на силикагеле с использованием EtOAc/МеОН. Выход: (2,27 г, 5,99 ммоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 378 (М-Н+).Synthesis of intermediate T1: 5-iodo-2'-deoxyuridine (3 g, 8.4 mmol) and palladium(II) acetate (1.6 g, 7.14 mmol) were dissolved in dry degassed DMF, then N-allyltrifluoroacetamide was added (6.4 ml, 42 mmol). The solution was placed under vacuum, then purged with nitrogen 3 times, then degassed triethylamine (2.3 mL, 16.8 mmol) was added. This solution was heated to 80°C for 2 hours. The black mixture was cooled to room temperature, then diluted with 50 ml of methanol. Approximately 0.5 g of activated carbon was added and the solution was filtered on Celite, then evaporated under reduced pressure to obtain a brown thick oil. This crude material was purified by silica gel chromatography using EtOAc/MeOH. Yield: (2.27 g, 5.99 mmol). LC-MS (ER and CI): (negatively charged ion) m/z 378 (M-H + ).

Синтез промежуточного соединения Т2: 5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т1) (2,55 г, 6,72 ммоль) растворяли в сухом DMF. Добавляли имидазол (1,37 г, 20,1 ммоль), с последующим добавлением 4-(диметиламино)пиридина (410 мг, 3,36 ммоль). Данную реакционную смесь охлаждали до 0°С, затем медленно добавляли 3 порциями трет-бутил(хлор)дифенилсилан (1,92 мл, 7,39 ммоль) с интервалами 30 минут.Данную реакционную смесь перемешивали при 0°С в течение 6 часов. Растворитель затем выпаривали, остаток ресуспендировали в 200 мл EtOAc и промывали 2× 200 мл водн. насыщенного NaHCO3 и 200 мл воды, затем 100 мл рассола. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Неочищенный продукт очищали флэш-хроматографией на диоксиде кремния с использованием DCM/EtOAc. Выход 68% (2,806 г, 4,54 ммоль). ЖХ-МС (ЭР и ХИ): (положительно заряженный ион) m/z 618 (М+Н+); (отрицательно заряженный ион) m/z 616 (М-Н+).Synthesis of intermediate T2: 5-[3-(2,2,2-trifluoroacetamido)-allyl]-2'-deoxyuridine (T1) (2.55 g, 6.72 mmol) was dissolved in dry DMF. Imidazole (1.37 g, 20.1 mmol) was added, followed by 4-(dimethylamino)pyridine (410 mg, 3.36 mmol). This reaction mixture was cooled to 0°C, then tert-butyl(chloro)diphenylsilane (1.92 mL, 7.39 mmol) was slowly added in 3 portions at 30 minute intervals. This reaction mixture was stirred at 0°C for 6 hours. The solvent was then evaporated, the residue was resuspended in 200 ml EtOAc and washed with 2× 200 ml aq. saturated NaHCO 3 and 200 ml of water, then 100 ml of brine. The organic phase was dried over MgSO 4 , filtered and evaporated to dryness. The crude product was purified by flash silica chromatography using DCM/EtOAc. Yield 68% (2.806 g, 4.54 mmol). LC-MS (ER and CI): (positively charged ion) m/z 618 (M+H + ); (negatively charged ion) m/z 616 (M-H + ).

Синтез промежуточного соединения Т3: 5'-O-(трет-бутилдифенилсилил)-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т2) (2,8 г, 4,53 ммоль) растворяли в 10 мл безводного DMSO (136 ммоль), затем добавляли ледяную уксусную кислоту (16 мл, 272 ммоль) и уксусный ангидрид (16 мл, 158 ммоль). Данную реакционную смесь нагревали до 50°С в течение 6 часов, затем гасили 200 мл водн. насыщенного NaHCO3. После того как в растворе прекратили образовываться пузырьки, его экстрагировали 2× 150 мл EtOAc. Органические фазы объединяли и промывали 2×200 мл водн. насыщенного NaHCO3, 200 мл воды и 100 мл рассола. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Неочищенный продукт очищали флэш-хроматографией на диоксиде кремния с использованием DCM/EtOAc. Выход 77% (2,375 г, 3,51 ммоль). ЖХ-МС (ЭР и ХИ): (положительный ион) m/z 678 (М+Н+); (отрицательный ион) m/z 676 (М-Н4).Synthesis of intermediate T3: 5'-O-(tert-butyldiphenylsilyl)-5-[3-(2,2,2-trifluoroacetamido)-allyl]-2'-deoxyuridine (T2) (2.8 g, 4.53 mmol) was dissolved in 10 ml of anhydrous DMSO (136 mmol), then glacial acetic acid (16 ml, 272 mmol) and acetic anhydride (16 ml, 158 mmol) were added. This reaction mixture was heated to 50°C for 6 hours, then quenched with 200 ml of aq. saturated NaHCO 3 . Once the solution stopped forming bubbles, it was extracted with 2 x 150 ml EtOAc. The organic phases were combined and washed with 2×200 ml aq. saturated NaHCO 3 , 200 ml of water and 100 ml of brine. The organic phase was dried over MgSO 4 , filtered and evaporated to dryness. The crude product was purified by flash silica chromatography using DCM/EtOAc. Yield 77% (2.375 g, 3.51 mmol). LC-MS (ER and CI): (positive ion) m/z 678 (M+H + ); (negative ion) m/z 676 (M-H 4 ).

Синтез промежуточного соединения Т4: 5'-O-(трет-бутилдифенилсилил)-3'-O-метилтиометил-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т3) (310 мг, 0,45 ммоль) растворяли в 5 мл безводного дихлорметана в атмосфере N2, добавляли циклогексен (228 мкл, 2,25 ммоль), и данный раствор охлаждали до приблизительно -15°С. Сульфурилхлорид (перегнанный, 55 мкл, 0,675 ммоль) добавляли по каплям, и данную реакционную смесь перемешивали в течение 20 минут. После потребления всего исходного вещества добавляли дополнительную часть циклогексена (228 мкл, 2,25 ммоль), и данную реакционную смесь выпаривали досуха при пониженном давлении.Synthesis of intermediate T4: 5'-O-(tert-butyldiphenylsilyl)-3'-O-methylthiomethyl-5-[3-(2,2,2-trifluoroacetamido)allyl]-2'-deoxyuridine (T3) (310 mg, 0.45 mmol) was dissolved in 5 ml of anhydrous dichloromethane under N 2 atmosphere, cyclohexene (228 μl, 2.25 mmol) was added and this solution was cooled to approximately -15°C. Sulfuryl chloride (distilled, 55 μl, 0.675 mmol) was added dropwise and the reaction mixture was stirred for 20 minutes. After all the starting material had been consumed, an additional portion of cyclohexene (228 μL, 2.25 mmol) was added and the reaction mixture was evaporated to dryness under reduced pressure.

Остаток быстро продували азотом, затем добавляли ледяной аллиловый спирт (2,5 мл) при перемешивании при 0°С. Данную реакционную смесь перемешивали при 0°С в течение 35 минут, затем гасили 25 мл насыщенного водн. NaHCO3, затем дополнительно разбавляли 100 мл насыщенного водн. NaHCO3. Данную смесь экстрагировали 2×50 мл этилацетата. Объединенные органические фазы сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием DCM/EtOAc. Выход 69% (214 мг, 0,311 ммоль). ЖХ-МС (ЭР и ХИ): (положительно заряженный ион) m/z 688 (М+Н+); (отрицательно заряженный ион) m/z 686 (М-Н+).The residue was quickly purged with nitrogen, then ice-cold allylic alcohol (2.5 ml) was added with stirring at 0°C. This reaction mixture was stirred at 0°C for 35 minutes, then quenched with 25 ml of saturated aq. NaHCO 3 , then further diluted with 100 ml saturated aq. NaHCO3 . This mixture was extracted with 2×50 ml ethyl acetate. The combined organic phases were dried over MgSO 4 , filtered and evaporated to dryness. The residue was purified by flash chromatography on silica gel using DCM/EtOAc. Yield 69% (214 mg, 0.311 mmol). LC-MS (ER and CI): (positively charged ion) m/z 688 (M+H + ); (negatively charged ion) m/z 686 (M-H + ).

Синтез промежуточного соединения Т5: 5'-O-(трет-бутилдифенилсилил)-3'-O-аллилоксиметил-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т4) (210 мг, 0,305 ммоль) растворяли в сухом THF (3 мл) под атмосферой N2. Добавляли раствор 1,0 М TBAF в THF (367 мкл, 0,367 ммоль). Данный раствор перемешивали при комнатной температуре в течение 3 часов. Раствор разбавляли 50 мл EtOAc, затем промывали 50 мл насыщ. NaH2PO4 (рН 3) и 50 мл воды. Органическую фазу сушили над MgSO4, фильтровали и выпаривали досуха. Остаток очищали флэш-хроматографией на силикагеле с использованием DCM/EtOAc. Выход 95% (130 мг, 0,289 ммоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 448 (М-Н+), 484 (М+Cl-).Synthesis of intermediate T5: 5'-O-(tert-butyldiphenylsilyl)-3'-O-allyloxymethyl-5-[3-(2,2,2-trifluoroacetamido)allyl]-2'-deoxyuridine (T4) (210 mg, 0.305 mmol) was dissolved in dry THF (3 ml) under N 2 atmosphere. A solution of 1.0 M TBAF in THF (367 μL, 0.367 mmol) was added. This solution was stirred at room temperature for 3 hours. The solution was diluted with 50 ml EtOAc, then washed with 50 ml sat. NaH 2 PO 4 (pH 3) and 50 ml of water. The organic phase was dried over MgSO 4 , filtered and evaporated to dryness. The residue was purified by flash chromatography on silica gel using DCM/EtOAc. Yield 95% (130 mg, 0.289 mmol). LC-MS (ER and CI): (negatively charged ion) m/z 448 (M-H + ), 484 (M+Cl - ).

Синтез промежуточного соединения Т6: 3'-O-аллилоксиметил-5-[3-(2,2,2-трифторацетамидо)-аллил]-2'-дезоксиуридин (Т5) (120 мг, 0,267 ммоль) сушили при пониженном давлении над P2O5 в течение 18 ч. Добавляли к нему под азотом безводный триэтилфосфат (1 мл) и некоторое количество свежеактивированных 4 молекулярных сит, затем колбу с реакционной смесью охлаждали до 0°С. Добавляли по каплям свежеперегнанный POCl3 (30 мкл, 0,32 ммоль), с последующим добавлением Proton Sponge® (85 мг, 0,40 ммоль). После добавления данную реакционную смесь дополнительно перемешивали при 0°С в течение 15 минут. Затем быстро добавляли 0,5 М раствор пирофосфата в виде бис-три-н-бутиламмониевой соли (2,7 мл, 1,33 ммоль) в безводном DMF, с последующим немедленным добавлением три-н-бутиламина (270 мкл, 1,2 ммоль). Данную реакционную смесь выдерживали в бане со льдом-водой в течение еще 10 минут, затем гасили вливанием ее в 1 М водный триэтиламмония бикарбонат (ТЕАВ, 10 мл) и перемешивали при комнатной температуре в течение 4 часов. Все растворители выпаривали при пониженном давлении. В вышеупомянутый остаток добавляли 35%-ный водный раствор аммиака (10 мл), и данную смесь перемешивали при комнатной температуре в течение 18 часов. Растворители затем выпаривали при пониженном давлении, остаток ресуспендировали в 10 мл 0,1 М ТЕАВ и фильтровали. Фильтрат сперва очищали ионообменной хроматографией на DEAE-Sephadex А25 (100 г). Колонку элюировали водным триэтиламмония бикарбонатом (ТЕАВ). Фракции, содержащие трифосфат, объединяли, и растворитель выпаривали досуха при пониженном давлении. Неочищенное вещество дополнительно очищали ВЭЖХ в препаративном масштабе с использованием колонки YMC-Pack-Pro С18. Соединение Т6 получали в виде триэтиламмониевой соли. Выход 33% (89 мкмоль). ЖХ-МС (ЭР и ХИ): (отрицательно заряженный ион) m/z 592 (М-Н+), 295 (М-2Н+).Synthesis of intermediate T6: 3'-O-allyloxymethyl-5-[3-(2,2,2-trifluoroacetamido)allyl]-2'-deoxyuridine (T5) (120 mg, 0.267 mmol) dried under reduced pressure over P 2 O 5 for 18 hours. Anhydrous triethyl phosphate (1 ml) and a certain amount of freshly activated 4 were added to it under nitrogen. molecular sieves, then the flask with the reaction mixture was cooled to 0°C. Freshly distilled POCl 3 (30 µl, 0.32 mmol) was added dropwise, followed by Proton Sponge® (85 mg, 0.40 mmol). After addition, this reaction mixture was further stirred at 0°C for 15 minutes. A 0.5 M solution of bis-tri-n-butylammonium pyrophosphate (2.7 mL, 1.33 mmol) in anhydrous DMF was then quickly added, followed immediately by tri-n-butylamine (270 μL, 1.2 mmol). This reaction mixture was kept in an ice-water bath for an additional 10 minutes, then quenched by pouring it into 1 M aqueous triethylammonium bicarbonate (TEAB, 10 ml) and stirred at room temperature for 4 hours. All solvents were evaporated under reduced pressure. A 35% aqueous ammonia solution (10 ml) was added to the above residue, and the mixture was stirred at room temperature for 18 hours. The solvents were then evaporated under reduced pressure and the residue was resuspended in 10 ml of 0.1 M TEAB and filtered. The filtrate was first purified by ion exchange chromatography on DEAE-Sephadex A25 (100 g). The column was eluted with aqueous triethylammonium bicarbonate (TEAB). The fractions containing the triphosphate were combined and the solvent was evaporated to dryness under reduced pressure. The crude material was further purified by HPLC on a preparative scale using a YMC-Pack-Pro C18 column. Compound T6 was obtained as triethylammonium salt. Yield 33% (89 µmol). LC-MS (ER and CI): (negatively charged ion) m/z 592 (M-H + ), 295 (M-2H + ).

Синтез S'-AOM-ffT-LN3'-NRSSOSO: высушенное известное соединение LN3-NR550S0 (0,015 ммоль) растворяли в безводном DMA (2 мл) под N2. Добавляли N,N-диизопропилэтиламин (17 мкл, 0,1 ммоль), с последующим добавлением TSTU (0,1 М в DMA, 180 мкл, 0,018 ммоль). Данную реакционную смесь перемешивали под N2 при комнатной температуре в течение 1 часа. Тем временем, водный раствор Т6 (0,01 ммоль) выпаривали досуха при пониженном давлении, ресуспендировали в 0,1 М водн. ТЕАВ (200 мкл) и добавляли в раствор LN3-NR550S0. Данную реакционную смесь перемешивали при RT в течение 18 часов и затем гасили 0,1 М водн. ТЕАВ (4 мл). Неочищенный продукт очищали флэш-хроматографией на DEAE-Sephadex. Продукт дополнительно очищали препаративной ВЭЖХ с получением чистого 3'-AOM-ffT-LN3'-NR550S0. Выход 67% (41 мкмоль, при определении спектрометрией в УФ-видимой области, λmax равно 550 нм, е равен 125000 М-1 см-1). ЖХ-МС (ЭР): (отрицательно заряженный ион) m/z 1521 (М-Н+),761 (М-2Н4), 507 (М-3Н+).Synthesis of S'-AOM-ffT-LN3'-NRSSOSO: The dried known compound LN3-NR550S0 (0.015 mmol) was dissolved in anhydrous DMA (2 ml) under N 2 . N,N-Diisopropylethylamine (17 μL, 0.1 mmol) was added, followed by TSTU (0.1 M in DMA, 180 μL, 0.018 mmol). This reaction mixture was stirred under N 2 at room temperature for 1 hour. Meanwhile, an aqueous solution of T6 (0.01 mmol) was evaporated to dryness under reduced pressure, resuspended in 0.1 M aq. TEAB (200 μl) and added to the LN3-NR550S0 solution. This reaction mixture was stirred at RT for 18 hours and then quenched with 0.1 M aq. TEAB (4 ml). The crude product was purified by flash chromatography on DEAE-Sephadex. The product was further purified by preparative HPLC to obtain pure 3'-AOM-ffT-LN3'-NR550S0. Yield 67% (41 µmol, as determined by spectrometry in the UV-visible region, λ max equal to 550 nm, e equal to 125000 M -1 cm -1 ). LC-MS (ES): (negatively charged ion) m/z 1521 (M-H + ), 761 (M-2H 4 ), 507 (M-3H + ).

Эксперименты по секвенированию посредством синтезаSequencing-by-synthesis experiments

ffN затем анализировали в секвенировании с использованием прибора Illumina MiniSeq®. За исключением новой смеси для включения, включающей данные ffN, использовали все стандартные имеющиеся в продаже реагенты. Использовали стандартный рецепт 2×150. Помимо стандартных протоколов секвенирования посредством синтеза (SBS), добавляли 5-секундную инкубацию в растворе палладиевой расщепляющей смеси (Pd:THP равно 1/5 в DEEA, как описано в Примере 4) для разблокирования 3’-АОМ.ffN was then analyzed by sequencing using an Illumina MiniSeq® instrument. With the exception of the new inclusion mixture including these ffN, all standard commercially available reagents were used. We used the standard 2×150 recipe. In addition to standard sequencing-by-synthesis (SBS) protocols, a 5-second incubation in a palladium digest solution (Pd:THP equal to 1/5 in DEEA as described in Example 4) was added to unblock the 3'-AOM.

В первом эксперименте использовали следующие ffN в смеси для включения: 3'-AOM-ffT-LN3-NR550S0, 3'-AOM-ffA-LN3-BL-NR550S0, 3'-AOM-ffA-LN3-BL-NR650C5, 3'-AOM-ffA-LN3-NR7180A, 3'-AOM-ffC-LN3-SO7181 и 3’-AOM-pppG (темный G), и результат секвенирования для считываемого фрагмента 1 обобщается ниже.In the first experiment, the following ffNs were used in the inclusion mixture: 3'-AOM-ffT-LN3-NR550S0, 3'-AOM-ffA-LN3-BL-NR550S0, 3'-AOM-ffA-LN3-BL-NR650C5, 3' -AOM-ffA-LN3-NR7180A, 3′-AOM-ffC-LN3-SO7181 and 3′-AOM-pppG (dark G), and the sequencing result for read 1 is summarized below.

Во втором эксперименте немеченый 3’-АОМ-рррТ синтезировали аналогично получению 3’-AOM-pppG, описанному выше (ЖХ-МС (ЭР): (отрицательно заряженный ион) m/z 551 (М-Н4)). Его использовали в присутствии имеющегося в продаже зеленого ffG-LN3-PEG12-ATT0532 (используется на 4-канальных системах Illumina) в секвенировании, и использовались такие же ffA и ffC, что и ffA и ffC, описанные в первом эксперименте выше. Результаты обобщаются ниже. Имелись значительные улучшения по значениям фазирования и предфазирования, и не наблюдали затухания сигнала (ФИГ. 3А). Кроме того, также уменьшались показатели ошибки и для считываемого фрагмента 1, и для считываемого фрагмента 2.In the second experiment, unlabeled 3'-AOM-pppT was synthesized similarly to the preparation of 3'-AOM-pppG described above (LC-MS (ES): (negative ion) m/z 551 (M-H 4 )). It was used in the presence of the commercially available green ffG-LN3-PEG12-ATT0532 (used on 4-channel Illumina systems) in sequencing, and the same ffA and ffC were used as the ffA and ffC described in the first experiment above. The results are summarized below. There were significant improvements in phasing and prephasing values, and no signal attenuation was observed (FIG. 3A). In addition, the error rates for both read fragment 1 and read fragment 2 also decreased.

В другом эксперименте использовали смесь для включения, содержащую 3'-AOM-ffT-LN3'-NR550S0, 3'-AOM-ffA-LN3-BL-NR550S0, 3'-AOM-ffA-LN3-BL-NR650C5, 3'-AOM-ffA-LN3-NR7180A, 3'-AOM-ffC-LN3-S07181 и 3’-AOM-pppG (темный G). Аналогично предыдущим прогонам, в стандартный цикл SBS добавляли 5-секундную инкубацию с расщепляющей смесью, содержащей палладиевый катализатор (Pd/THP равно 1:10; 100 мМ DEEA, как описано в Примере 4). Использовали стандартную ДНК-полимеразу MiniSeq®, но с 2-кратным временем включения. Не наблюдали фенотип затухания сигнала (ФИГ. 3В). Кроме того, данные результаты секвенирования сравнивали с прогонами имеющейся в продаже MiniSeq® (среднее из 3; N равно 3), используя ffN со стандартной азидометильной блокирующей группой. Наблюдали то, что показатели ошибок были почти идентичными (ФИГ. 3С). Результаты секвенирования обобщаются ниже.In another experiment, an inclusion mixture containing 3'-AOM-ffT-LN3'-NR550S0, 3'-AOM-ffA-LN3-BL-NR550S0, 3'-AOM-ffA-LN3-BL-NR650C5, 3'- AOM-ffA-LN3-NR7180A, 3′-AOM-ffC-LN3-S07181, and 3′-AOM-pppG (dark G). Similar to previous runs, a 5-second incubation with a digestion mixture containing palladium catalyst (Pd/THP equal to 1:10; 100 mM DEEA, as described in Example 4) was added to the standard SBS run. Standard MiniSeq® DNA polymerase was used, but with a 2-fold turn-on time. No signal attenuation phenotype was observed (FIG. 3B). Additionally, these sequencing results were compared to commercially available MiniSeq® runs (average of 3; N = 3) using ffN with a standard azidomethyl blocking group. It was observed that the error rates were almost identical (FIG. 3C). The sequencing results are summarized below.

Кроме того, первичные показатели секвенирования для ffN с 3’-АОМ блокирующими группами сравнивали с первичными показателями секвенирования, полученными посредством стандартного имеющегося в продаже набора MiniSeq®, включающего ДНК-полимеразу Pol 812, и на ФИГ. 4А демонстрируются сравнимые результаты. Очень низкое предфазирование наблюдалось из-за улучшенной стабильности 3’-AOM-ffN. Однако фазирование все еще было повышенным, даже если использовали 2-кратное время включения.In addition, raw sequencing metrics for ffN with 3'-AOM blocking groups were compared to raw sequencing metrics generated by a standard commercially available MiniSeq® kit including Pol 812 DNA polymerase and FIG. 4A shows comparable results. Very low prephasing was observed due to the improved stability of 3′-AOM-ffN. However, phasing was still elevated even when 2x the on time was used.

В еще одном другом эксперименте использовали другую ДНК-полимеразу (Pol 1901) вместо ДНК-полимеразы в имеющихся в продаже наборах MiniSeq® (Pol 812). Pol 1901 обеспечивала стандартное 1× время включения в секвенировании вместо 2-кратного времени включения, описанного выше. Кроме того, инкубация в Pd расщепляющей смеси была уменьшена наполовину по сравнению со стандартным прогоном. Это обеспечивало 10%-ную экономию времени при полном химическом цикле SBS. Показатели секвенирования были значительно улучшенными и превышали значения, полученные от стандартных имеющихся в продаже наборов, содержащих 3’-О-азидометильную блокирующую группу (ФИГ. 4 В).In yet another experiment, a different DNA polymerase (Pol 1901) was used instead of the DNA polymerase in the commercially available MiniSeq® kits (Pol 812). Pol 1901 provided the standard 1× turn-on time in sequencing instead of the 2× turn-on time described above. In addition, the Pd incubation of the digestion mixture was reduced by half compared to the standard run. This provided a 10% time saving for the complete SBS chemical cycle. Sequencing performance was significantly improved and exceeded that obtained from standard commercially available kits containing a 3'-O-azidomethyl blocking group (FIG. 4 B).

Анализ стабильности 3' блокирующей группы при секвенированииAnalysis of the stability of the 3' blocking group during sequencing

Для демонстрации улучшения стабильности ffN с 3’-АОМ их сравнивали параллельно со стандартными ffN MiniSeq® с 3’-О-азидометильной группой. Два набора ffN инкубировали при 45°С в течение нескольких суток в стандартных препаратах смесей для включения, исключая только ДНК-полимеразу. Для каждого момента времени добавляли свежую полимеразу для завершения получения смеси для включения непосредственно перед загрузкой на MiniSeq®. Использовали условия секвенирования, описанные ранее. % предфазирования является прямым индикатором процентной доли 3'ОН-ffN, присутствующих в смеси, следовательно, он непосредственно коррелирует со стабильностью 3' блокирующей группы. Значения предфазирования для обоих наборов ffN записывали и откладывали на графике (ФИГ. 5). При 45° наблюдали то, что ffN, содержащие 3’-АОМ, оказывались в 6 раз более стабильными, чем стандартные ffN с 3’-О-азидометильной группой. Показатели секвенирования также подтверждали тенденцию, наблюдаемую во время анализа стабильности в растворе - 3’-АОМ блок был значительно более стабильным, чем 3’-О-азидометильная группа.To demonstrate the improved stability of ffNs with a 3'-AOM, they were compared in parallel to standard MiniSeq® ffNs with a 3'-O-azidomethyl group. Two sets of ffN were incubated at 45°C for several days in standard inclusion mixture preparations, excluding only DNA polymerase. For each time point, fresh polymerase was added to complete the inclusion mixture immediately before loading onto the MiniSeq®. Sequencing conditions described previously were used. % prephasing is a direct indicator of the percentage of 3'OH-ffN present in the mixture, therefore it directly correlates with the stability of the 3' blocking group. Prephasing values for both sets of ffN were recorded and plotted (FIG. 5). At 45°, it was observed that ffNs containing 3'-AOM were 6 times more stable than standard ffNs with a 3'-O-azidomethyl group. Sequencing performance also confirmed the trend observed during solution stability analysis—the 3'-AOM block was significantly more stable than the 3'-O-azidomethyl group.

Пример 6. Получение нуклеозидов, блокированных 3’-О-тиокарбаматом В данном примере получали разные нуклеозиды Т, защищенные 3’-О-тиокарбаматом, согласно Схеме 8.Example 6. Preparation of 3'-O-thiocarbamate-protected nucleosides In this example, various 3'-O-thiocarbamate-protected nucleosides T were prepared according to Scheme 8.

Получение Т-7: в высушенную в печи, продутую азотом 100 мл колбу добавляли 5'-O-(4,4'-диметокситритил)тимидин (1,0 г, 1,836 ммоль). Данную смесь совместно выпаривали с безводным DMF (3×20 мл) и помещали под азотом. Добавляли безводный DCM (9,2 мл) и 4-диметиламинопиридин (224 мг, 0,184 ммоль), и перемешивали при комнатной температуре, пока не образовался гомогенный раствор. Затем быстро добавляли 1,1'-тиокарбонилдиимидазол (360 мг, 2,02 ммоль) через струю азота, реакционную смесь повторно запечатывали и перемешивали при комнатной температуре в течение 2 часов, пока не потреблялось все исходное вещество. Данную реакционную смесь фильтруют через слой силикагеля, и остаток на фильтре промывают EtOAc (10 мл). Летучие вещества удаляли в вакууме, и неочищенный остаток использовали без дальнейшей очистки.Preparation of T-7: 5'-O-(4,4'-dimethoxytrityl)thymidine (1.0 g, 1.836 mmol) was added to an oven-dried, nitrogen-purged 100 mL flask. This mixture was co-evaporated with anhydrous DMF (3×20 ml) and placed under nitrogen. Anhydrous DCM (9.2 mL) and 4-dimethylaminopyridine (224 mg, 0.184 mmol) were added and stirred at room temperature until a homogeneous solution was formed. 1,1'-thiocarbonyldiimidazole (360 mg, 2.02 mmol) was then quickly added under a stream of nitrogen and the reaction mixture was resealed and stirred at room temperature for 2 hours until all starting material was consumed. This reaction mixture is filtered through a pad of silica gel and the filter cake is washed with EtOAc (10 ml). Volatiles were removed in vacuo and the crude residue was used without further purification.

Получение Т-8: соединение Т-7 с предыдущей стадии использовали немедленно после сушки в вакууме. Остаток помещали под азотом в 25 мл круглодонной колбе, добавляли диметиламин (2 M в THF, 7,3 мл, 14,6 ммоль), и данную реакционную смесь перемешивали в течение 2 часов, пока все исходное вещество не потреблялось согласно ТСХ. Все летучие вещества удаляли в вакууме с образованием прозрачного неочищенного остатка, который очищали колоночной флэш-хроматографией на силикагеле с получением Т-8 в виде белого твердого вещества. Выход: 1,15 г (99%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) 630,23 [М-Н].Preparation of T-8: Compound T-7 from the previous step was used immediately after vacuum drying. The residue was placed under nitrogen in a 25 mL round bottom flask, dimethylamine (2 M in THF, 7.3 mL, 14.6 mmol) was added and the reaction mixture was stirred for 2 hours until all starting material was consumed by TLC. All volatiles were removed in vacuo to leave a clear crude residue, which was purified by flash column chromatography on silica gel to give T-8 as a white solid. Yield: 1.15 g (99%). LC-MS (electrospray, negative ion mode) 630.23 [M-H].

Получение Т-9: исходный нуклеозид Т-8 (320 мг, 0,504 ммоль) растворяли в минимальном количестве ацетонитрила в 50 мл круглодонной колбе на воздухе. Добавляли за один прием раствор АсОН/H2O 5:1 (12,5 мл: 2,5 мл), и данную реакционную смесь перемешивали при комнатной температуре, пока не потреблялось все исходное вещество (2-4 часа). Выпаривание всех летучих веществ под вакуумом и совместное выпаривание остатка в толуоле (2×60 мл) давало неочищенный продукт в виде беловатого твердого вещества. Данный неочищенный продукт очищали колоночной флэш-хроматографией с получением Т-9 в виде белого твердого вещества. Выход: 123 мг (74%). ЖХ-МС (электрораспылительная, в режиме отрицательно заряженных ионов) [М-Н] 328,10.Preparation of T-9: the starting nucleoside T-8 (320 mg, 0.504 mmol) was dissolved in a minimal amount of acetonitrile in a 50 ml round-bottom flask in air. A 5:1 AcOH/H 2 O solution (12.5 ml: 2.5 ml) was added at one time and the reaction mixture was stirred at room temperature until all the starting material was consumed (2-4 hours). Evaporation of all volatiles under vacuum and co-evaporation of the residue in toluene (2 x 60 ml) gave the crude product as a whitish solid. This crude product was purified by flash column chromatography to give T-9 as a white solid. Yield: 123 mg (74%). LC-MS (electrospray, negative ion mode) [M-H] 328.10.

Следуя аналогичной синтетической методике с использованием соответствующих MeNH2 или NH3, также получали нуклеозиды с двумя тиокарбаматными защитными группами. Общая схема реакции демонстрируется ниже:Following a similar synthetic procedure using the appropriate MeNH 2 or NH 3 , nucleosides with two thiocarbamate protecting groups were also prepared. The general reaction scheme is shown below:

Анализ стабильности 3’-О-тиокарбаматных блокирующих группAnalysis of the stability of 3'-O-thiocarbamate blocking groups

Анализы стабильности для нуклеотида 5'-mP 3’-DMTC Т проводили параллельно в растворе буфера для включения со стандартным нуклеотидом 5'-mP 3’-О-азидометил Т.Stability assays for the nucleotide 5'-mP 3'-DMTC T were performed in parallel in inclusion buffer solution with the standard nucleotide 5'-mP 3'-O-azidomethyl T.

И для 5'-mP 3’-DMTC Т, и для 5'-mP 3’-О-азидометил Т конечный объем раствора составлял 1 мл, и конечные концентрации соответствующих нуклеотидов состаляли 0,1 мМ для обоих. Другие компоненты водного буферного раствора включают этаноламин (ЕА), этаноламин HCl, NaCl (100 мМ) и EDTA (2,5 мМ). Данный буферный раствор имеет следующую концентрацию: 0,5 М буфер ЕА, 0,5 М NaCl, 0,01 М EDTA.For both 5'-mP 3'-DMTC T and 5'-mP 3'-O-azidomethyl T, the final solution volume was 1 ml, and the final concentrations of the corresponding nucleotides were 0.1 mM for both. Other components of the aqueous buffer solution include ethanolamine (EA), ethanolamine HCl, NaCl (100 mM) and EDTA (2.5 mM). This buffer solution has the following concentration: 0.5 M buffer EA, 0.5 M NaCl, 0.01 M EDTA.

Методология анализа стабильностиStability Analysis Methodology

200 мкл 10× буферного раствора добавляли в 1,7 мл полипропиленовую микропробирку с крышкой с защелкой и разводили правильным объемом 18 мΩ воды. Затем добавляли соответствующий нуклеозид, флакон закупоривали и осуществляли перемешивание посредством переворачивания, легкого перемешивания или отсасывания микропипеткой. Отбирали 40 мкл аликвоту и анализировали посредством ВЭЖХ для того, чтобы она действовала в качестве исходного значения (или t равно 0). Данные флаконы затем помещали в предварительно нагретый до 65°С колбонагреватель, покрывали толстым слоем алюминиевой фольги и оставляли нагреваться в течение одного месяца. Периодически отбирали 40 мкл аликвоты (неделя 1: один раз в сутки. Недели 2-4:1 раз каждые 2 суток) и анализировали посредством ВЭЖХ для определения процентной доли исходного вещества и процентной доли деблокированного (3’-ОН) нуклеотида в данных образцах. Анализ ВЭЖХ проводили посредством измерения площади пика исходного нуклеотида и пика 3'ОН. Данные значения использовали для расчета графически процентной доли деблокированного нуклеотида, который присутствовал, и использовали для сравнения стабильности в буфере для включения между образцами. На ФИГ. 6 проиллюстрированы сравнительные результаты стабильности трех разных 3' блокированных тиокарбаматом нуклеотидов с нуклеотидами, блокированными 3’-О-азидометильной блокирующей группой, при 65°С. Наблюдали то, что в то время как нуклеотид с 3'-O-C(=S)NH2 или 3'-O-C(=S)NHCH3 был менее стабильным, чем нуклеотид, защищенный стандартной 3’-О-азидометильной группой, нуклеотид с 3’-DMTC придавал улучшенную стабильность во время 9-сутокчного периода анализа. DMTC, как таковой, демонстрировал превосходную стабильность над стандартной азидометильной блокирующей группой.200 μL of 10× buffer solution was added to a 1.7 mL polypropylene microtube with a snap cap and diluted with the correct volume of 18 mΩ water. The appropriate nucleoside was then added, the vial was capped, and mixing was accomplished by inversion, gentle stirring, or micropipette suction. A 40 μl aliquot was taken and analyzed by HPLC to act as the input value (or t equal to 0). These vials were then placed in a heating mantle preheated to 65°C, covered with a thick layer of aluminum foil and allowed to heat for one month. 40 μl aliquots were taken periodically (week 1: once daily. Weeks 2-4: 1 times every 2 days) and analyzed by HPLC to determine the percentage of starting material and the percentage of deblocked (3'-OH) nucleotide in these samples. HPLC analysis was performed by measuring the peak area of the parent nucleotide and the 3'OH peak. These values were used to graphically calculate the percentage of unblocked nucleotide that was present and used to compare stability in inclusion buffer between samples. In FIG. 6 illustrates comparative stability results of three different 3' thiocarbamate-blocked nucleotides with 3'-O-azidomethyl blocking group-blocked nucleotides at 65°C. It was observed that while a nucleotide with 3'-OC(=S)NH 2 or 3'-OC(=S)NHCH 3 was less stable than a nucleotide protected by a standard 3'-O-azidomethyl group, a nucleotide with 3'-DMTC provided improved stability during the 9-day assay period. DMTC, as such, exhibited superior stability over the standard azidomethyl blocking group.

Пример 7. Анализ деблокирования 3’-О-тиокарбаматной блокирующей группыExample 7 Deblocking Assay for 3'-O-thiocarbamate Blocking Group

В данном примере деблокирование или анализы деблокирования для 5'-mP 3’-DMTC Т и стандартного 5'-mP 3’-О-азидометил Т проводили индивидуально в уникальном растворе для каждой блокирующей группы. Были созданы условия для имитации стандартного деблокирующего реагента Illumina настолько близко, насколько это возможно, и следуя той же самой методологии. Поддерживали те же самые концентрации активного деблокирующего реагента, буфера и нуклеозида во всех анализах, но идентичность каждого компонента была уникальной. Данным способом наблюдаемое различие в скорости между индивидуальными химиями деблокирования не может быть обусловлено различиями в концентрации препарата.In this example, deblocking or deblocking assays for 5'-mP 3'-DMTC T and standard 5'-mP 3'-O-azidomethyl T were performed individually in a unique solution for each blocking group. Conditions were set to mimic the standard Illumina release reagent as closely as possible and following the same methodology. The same concentrations of active deblocking reagent, buffer, and nucleoside were maintained in all assays, but the identity of each component was unique. In this manner, the observed differences in rates between individual deblocking chemistries cannot be due to differences in drug concentration.

Общая методология анализа деблокированияGeneral methodology for release analysis

Каждый компонент реакции готовили индивидуально в виде концентрированного маточного раствора в 18 мΩ воде, хранили надлежащим образом, и аликвоты объединяли в конкретном порядке, приведенном ниже. Реакция начиналась добавлением предварительно приготовленного деблокирующего реагента. Конечные концентрации: нуклеозид (0,1 мМ), активный деблокирующий реагент (1 мМ), добавка (специфичная по отношению к деблокирующему реагенту), буфер (100 мМ). Конечный объем: 2000 мкл.Each reaction component was prepared individually as a concentrated stock solution in 18 mΩ water, stored appropriately, and aliquots were combined in the specific order given below. The reaction was started by adding a previously prepared deblocking reagent. Final concentrations: nucleoside (0.1 mM), active deblocking reagent (1 mM), additive (specific to the deblocking reagent), buffer (100 mM). Final volume: 2000 µl.

В 3 мл стеклянный флакон добавляли предварительно приготовленный буферный раствор, с последующим добавлением предварительно приготовленной добавки. Данную смесь разбавляли правильным объемом 18 мΩ воды и перемешивали в течение 10 минут. Затем добавляли аликвоту раствора нуклеотида и перемешивали в течение 5 минут. Затем отбирали 40 мкл аликвоту, добавляли гасящий реагент и анализировали посредством ВЭЖХ в качестве эталонного пика (или t равно 0 мин). Затем добавляли к перемешиваемому раствору в один прием деблокирующий реагент, и начинался отсчет времени. В определенные моменты времени отбирали 40 мкл аликвоты и немедленно гасили подходящим гасящим реагентом, затем анализировали посредством ВЭЖХ для определения количества деблокированного нуклеотида, который появлялся в данные определенные моменты времени. Результаты графически откладывали на графике и использовали для сравнения эффективности и действенности деблокирования.A pre-prepared buffer solution was added to a 3 ml glass vial, followed by the addition of a pre-prepared additive. This mixture was diluted with the correct volume of 18 mΩ water and stirred for 10 minutes. An aliquot of the nucleotide solution was then added and mixed for 5 minutes. A 40 μL aliquot was then removed, a quenching reagent was added, and analyzed by HPLC as a reference peak (or t = 0 min). Then the deblocking reagent was added to the stirred solution in one step, and the countdown began. At specific time points, 40 μl aliquots were removed and immediately quenched with a suitable quenching reagent, then analyzed by HPLC to determine the amount of released nucleotide that appeared at those specific time points. The results were plotted graphically and used to compare the effectiveness and efficiency of release.

Деблокирование DMTCDMTC release

Нуклеотид: 5'-mP 3'-DMTC Т. Активный деблокирующий реагент: NaIO4 (0,1 М в 18 мΩ воде) или Oxone® (0,1 М в 18 мΩ воде). Добавка: нет. Буфер для NaIO4: фосфатный буфер с рН 6,75 (1 М в 18 мΩ воде). Буфер для Oxone®: фосфатный буфер с рН 8,65 (1 М в 18 мΩ воде). Гасящий реагент: тиосульфат натрия. Условия деблокирования 3'-О-азидометила являются такими же, как условия, описанные в Примере 3.Nucleotide: 5'-mP 3'-DMTC T. Active deblocking reagent: NaIO 4 (0.1 M in 18 mΩ water) or Oxone® (0.1 M in 18 mΩ water). Additive: no. Buffer for NaIO 4 : phosphate buffer with pH 6.75 (1 M in 18 mΩ water). Buffer for Oxone®: phosphate buffer pH 8.65 (1 M in 18 mΩ water). Quenching reagent: sodium thiosulfate. The conditions for deprotection of 3'-O-azidomethyl are the same as those described in Example 3.

Анализ ВЭЖХ проводили посредством измерения площади пика исходного нуклеозида, пика 3'-ОН и любых других пиков нуклеотидов, которые появляются на хроматограмме ВЭЖХ. Данные значения использовали для расчета процентной доли исходного нуклеотида и деблокированного нуклеотида, которую представляли графически и использовали для сравнения скорости, эффективности и действенности деблокирования между образцами. Сравнительный результат показан на ФИГ. 7. Наблюдали то, что деблокирование DMTC с использованием NaIO4 не было эффективным. Однако % остающегося исходного вещества был значительно меньше для нуклеотида с блокирующей группой DMTC при расщеплении DMTC с использованием Oxone®. В заключение, DMTC продемонстрировал превосходную скорость деблокирования (с Oxone®) над скоростью деблокирования стандартной азидометильной блокирующей группы.HPLC analysis was performed by measuring the area of the parent nucleoside peak, the 3'-OH peak, and any other nucleotide peaks that appear in the HPLC chromatogram. These values were used to calculate the percentage of original nucleotide and unblocked nucleotide, which was presented graphically and used to compare the rate, efficiency and effectiveness of unblocking between samples. The comparative result is shown in FIG. 7. It was observed that deblocking of DMTC using NaIO 4 was not effective. However, the % of starting material remaining was significantly less for the nucleotide with the DMTC blocking group when cleaving DMTC using Oxone®. In conclusion, DMTC demonstrated superior deprotection rate (with Oxone®) over that of the standard azidomethyl blocking group.

Claims (65)

1. Нуклеотид, содержащий рибозу или дезоксирибозу, имеющую удаляемую 3’-ОН блокирующую группу ковалентно присоединенную к 3’-атому углерода.1. A nucleotide containing ribose or deoxyribose having a 3'-OH leaving blocking group covalently attached to the 3' carbon atom. 2. Нуклеотид по п. 1, содержащий 2’-дезоксирибозу.2. Nucleotide according to claim 1, containing 2’-deoxyribose. 3. Нуклеотид по п. 1 или 2, где указанный нуклеотид содержит трифосфат в 5’-положении рибозы или дезоксирибозы.3. A nucleotide according to claim 1 or 2, wherein said nucleotide contains a triphosphate at the 5' position of ribose or deoxyribose. 4. Нуклеотид по любому из пп. 1-3, где указанный нуклеотид ковалентно присоединен к выявляемой метке, возможно через расщепляемый линкер.4. Nucleotide according to any one of paragraphs. 1-3, where the specified nucleotide is covalently attached to the detectable label, possibly through a cleavable linker. 5. Нуклеотид по п. 4, в котором выявляемая метка ковалентно присоединена к азотистому основанию нуклеотида через расщепляемый линкер.5. The nucleotide according to claim 4, in which the detectable label is covalently attached to the nitrogenous base of the nucleotide through a cleavable linker. 6. Нуклеотид по п. 5, в котором указанный расщепляемый линкер содержит азидный фрагмент, -О-аллильный фрагмент, дисульфидный фрагмент, ацетальный фрагмент или тиокарбаматный фрагмент.6. The nucleotide of claim 5, wherein said cleavable linker contains an azide moiety, an -O-allyl moiety, a disulfide moiety, an acetal moiety, or a thiocarbamate moiety. 7. Нуклеотид по п. 5, где линкер содержит фрагмент, выбранный из группы, состоящей из:7. The nucleotide according to claim 5, where the linker contains a fragment selected from the group consisting of: где X выбран из группы, состоящей из О, S, NH и NQ, где Q представляет собой замещенную или незамещенную C1-10-алкильную группу, Y выбран из группы, включающей О, S, NH и N(аллил), Т представляет собой водород или замещенную или незамещенную C1-C10 алкильную группу, и символом «*» показано, где фрагмент соединен с остатком нуклеотида.where X is selected from the group consisting of O, S, NH and NQ, where Q is a substituted or unsubstituted C 1-10 -alkyl group, Y is selected from the group consisting of O, S, NH and N(allyl), T is represents hydrogen or a substituted or unsubstituted C 1 -C 10 alkyl group, and the symbol “*” indicates where the fragment is connected to a nucleotide residue. 8. Нуклеотид по п. 5, где линкер выбран из группы, состоящей из: 8. The nucleotide according to claim 5, where the linker is selected from the group consisting of: где B представляет собой азотистое основание; Z представляет собой -N3 (азидо), -O-C16 алкил, -O-С26 алкенил или -О-С26 алкинил; и FI содержит флуоресцентную метку, которая может содержать дополнительную линкерную структуру.where B represents a nitrogenous base; Z represents -N 3 (azido), -OC 1 -C 6 alkyl, -O-C 2 -C 6 alkenyl or -O-C 2 -C 6 alkynyl; and FI contains a fluorescent label, which may contain an additional linker structure. 9. Нуклеотид по любому из пп. 1-3, содержащий азотистое основание, выбранное из группы, состоящей из9. Nucleotide according to any one of paragraphs. 1-3 containing a nitrogenous base selected from the group consisting of 10. Нуклеотид по любому из пп. 1-8, содержащий азотистое основание, выбранное из группы, состоящей из10. Nucleotide according to any one of paragraphs. 1-8 containing a nitrogenous base selected from the group consisting of где L представляет собой линкер, a Dye представляет собой флуоресцентный краситель.where L is a linker and Dye is a fluorescent dye. 11. Нуклеотид по любому из пп. 1-8, имеющий структуру, выбранную из группы, состоящей из 11. Nucleotide according to any one of paragraphs. 1-8, having a structure selected from the group consisting of где L представляет собой линкер, Dye представляет собой флуоресцентный краситель, и R представляет собой рибозу или дезоксирибозу, имеющую удаляемую 3’-OH блокирующую группу, ковалентно присоединенную к 3’-атому углерода.where L is a linker, Dye is a fluorescent dye, and R is ribose or deoxyribose having a 3'-OH leaving a blocking group covalently attached to the 3' carbon atom. 12. Олигонуклеотид, включающий в себя нуклеотид по любому из пп. 1-11, причем фосфодиэфирная связь образована между 3’-атомом углерода олигонуклеотида и 5’-атомом углерода указанного нуклеотида.12. An oligonucleotide comprising a nucleotide according to any one of claims. 1-11, wherein the phosphodiester bond is formed between the 3' carbon atom of the oligonucleotide and the 5' carbon atom of the specified nucleotide. 13. Способ получения растущего полинуклеотида, комплементарного целевому одноцепочечному полинуклеотиду, в реакции секвенирования, включающий включение нуклеотида по любому из пп. 1-11 в растущий комплементарный полинуклеотид, где включение указанного нуклеотида предотвращает введение любого последующего нуклеотида в растущий комплементарный полинуклеотид.13. A method for producing a growing polynucleotide complementary to the target single-stranded polynucleotide in a sequencing reaction, including the inclusion of a nucleotide according to any one of claims. 1-11 into a growing complementary polynucleotide, wherein inclusion of said nucleotide prevents the introduction of any subsequent nucleotide into the growing complementary polynucleotide. 14. Способ по п. 13, при котором осуществляют включение нуклеотида по любому из пп. 3-11 в растущий комплементарный полинуклеотид.14. The method according to claim 13, in which the inclusion of a nucleotide according to any one of claims is carried out. 3-11 into growing complementary polynucleotide. 15. Способ по п. 13 или 14, в котором включение нуклеотида осуществляется полимеразой.15. The method according to claim 13 or 14, in which the incorporation of the nucleotide is carried out by a polymerase. 16. Способ определения последовательности целевого одноцепочечного полинуклеотида, включающий:16. A method for determining the sequence of a target single-stranded polynucleotide, comprising: (a) включение нуклеотида по любому из пп. 4-11 в копию полинуклеотидной цепи, комплементарной по меньшей мере части целевой полинуклеотидной цепи;(a) including a nucleotide according to any one of claims. 4-11 to a copy of a polynucleotide chain complementary to at least part of the target polynucleotide chain; (b) выявление идентичности нуклеотида, включенного в копию полинуклеотидной цепи; и(b) identifying the identity of a nucleotide included in a copy of the polynucleotide chain; And (c) химическое удаление метки и 3’-OH блокирующей группы из нуклеотида, включенного в копию полинуклеотидной цепи.(c) chemical removal of the tag and 3'-OH blocking group from a nucleotide included in a copy of the polynucleotide chain. 17. Способ по п. 16, в котором нуклеотид, включенный на стадии (а), представляет собой нуклеотид-5’-трифосфат.17. The method of claim 16, wherein the nucleotide included in step (a) is a nucleotide 5'-triphosphate. 18. Способ по п. 16 или 17, дополнительно включающий (d) отмывку копии полинуклеотидной цепи от химически удаленных метки и 3’-OH блокирующей группы.18. The method according to claim 16 or 17, further comprising (d) washing a copy of the polynucleotide chain from chemically removing the label and 3'-OH blocking group. 19. Способ по п. 18, в котором на стадии (d) используют палладиевый акцептор радикалов.19. The method according to claim 18, in which in step (d) a palladium radical scavenger is used. 20. Способ по п. 18 или 19, дополнительно включающий повторение стадий (a)-(d) до тех пор, пока не будет определена последовательность указанной части цепи полинуклеотида-матрицы.20. The method of claim 18 or 19, further comprising repeating steps (a)-(d) until the sequence of said portion of the template polynucleotide chain is determined. 21. Способ по любому из пп. 18-20, в котором стадии (a)-(d) повторяют по меньшей мере 50 раз, по меньшей мере 75 раз, по меньшей мере 100 раз, по меньшей мере 150 раз, по меньшей мере 200 раз, по меньшей мере 250 раз или по меньшей мере 300 раз.21. Method according to any one of paragraphs. 18-20, in which steps (a)-(d) are repeated at least 50 times, at least 75 times, at least 100 times, at least 150 times, at least 200 times, at least 250 times or at least 300 times. 22. Способ по любому из пп. 16-21, где метку и 3’-OH блокирующую группу удаляют с нуклеотида, включенного в копию полинуклеотидной цепи, в одной химической реакции.22. Method according to any one of paragraphs. 16-21, where the label and the 3'-OH blocking group are removed from a nucleotide included in a copy of the polynucleotide chain in a single chemical reaction. 23. Способ по п. 22, в котором стадия (с) включает приведение в контакт включенного нуклеотида с расщепляющим раствором, содержащим палладиевый катализатор.23. The method of claim 22, wherein step (c) comprises contacting the incorporated nucleotide with a cleavage solution containing a palladium catalyst. 24. Способ по любому из пп. 16-21, в котором метку и 3’-OH блокирующую группу удаляют с нуклеотида, включенного в копию полинуклеотидной цепи, в двух отдельных химических реакциях.24. Method according to any one of paragraphs. 16-21, in which the label and 3'-OH blocking group are removed from a nucleotide included in a copy of the polynucleotide chain in two separate chemical reactions. 25. Способ по п. 24, в котором стадия (с) включает приведение включенного нуклеотида в контакт с расщепляющим раствором, содержащим фосфин, и палладиевым катализатором.25. The method of claim 24, wherein step (c) comprises contacting the incorporated nucleotide with a cleavage solution containing phosphine and a palladium catalyst. 26. Способ по п. 25, в котором фосфин представляет собой трис(гидроксиметил)фосфин, трис(гидроксиэтил)фосфин или трис(гидроксипропил)фосфин.26. The method of claim 25, wherein the phosphine is tris(hydroxymethyl)phosphine, tris(hydroxyethyl)phosphine or tris(hydroxypropyl)phosphine. 27. Способ по любому из пп. 23, 25 или 26, в котором расщепляющий раствор, содержащий палладиевый катализатор, дополнительно содержит один или более чем один буферизующий реагент, выбранный из группы, состоящей из первичного амина, вторичного амина, третичного амина, карбонатной соли, фосфатной соли, боратной соли и их комбинаций.27. Method according to any one of paragraphs. 23, 25, or 26, wherein the cleavage solution containing the palladium catalyst further contains one or more buffering reagents selected from the group consisting of a primary amine, a secondary amine, a tertiary amine, a carbonate salt, a phosphate salt, a borate salt, and combinations. 28. Способ по п. 27, в котором буферизующие реагенты выбраны из группы, состоящей из этаноламина (ЕА), трис(гидроксиметил)аминометана (Tris), глицина, карбонатной соли, фосфатной соли, боратной соли, 2-диметиламиноэтанола (DMEA), 2-диэтиламинометанола (DEEA), N,N,N’,N’-тетраметилэтилендиамина (TEMED) и N,N,N’,N’-тетраэтилэтилендиамина (TEEDA) и их комбинаций.28. The method of claim 27, wherein the buffering reagents are selected from the group consisting of ethanolamine (EA), tris(hydroxymethyl)aminomethane (Tris), glycine, carbonate salt, phosphate salt, borate salt, 2-dimethylaminoethanol (DMEA), 2-diethylaminomethanol (DEEA), N,N,N',N'-tetramethylethylenediamine (TEMED) and N,N,N',N'-tetraethylethylenediamine (TEEDA) and combinations thereof. 29. Способ по любому из пп. 23 и 25-28, где расщепляющий раствор дополнительно содержит аскорбиновую кислоту или ее соль.29. Method according to any one of paragraphs. 23 and 25-28, where the splitting solution additionally contains ascorbic acid or its salt. 30. Способ по любому из пп. 16-29, осуществляемый в мультиплексном формате.30. Method according to any one of paragraphs. 16-29, carried out in multiplex format. 31. Способ по любому из пп. 16-30, осуществляемый в формате чипа с использованием связанных с поверхностью целевых нуклеиновых кислот, причем целевые нуклеиновые кислоты связаны с поверхностью пространственно различимым образом.31. Method according to any one of paragraphs. 16-30, carried out in a chip format using surface-bound target nucleic acids, wherein the target nucleic acids are bound to the surface in a spatially distinguishable manner. 32. Способ по п. 31, где чип включает множество копий, имеющих одну и ту же последовательность целевых нуклеиновых кислот в каждом сайте.32. The method of claim 31, wherein the chip includes multiple copies having the same target nucleic acid sequence at each site. 33. Способ по п. 32, где множество копий целевых нуклеиновых кислот образуется в результате мостиковой амплификации.33. The method according to claim 32, wherein multiple copies of the target nucleic acids are formed as a result of bridging amplification. 34. Способ по п. 32, где множество копий целевых нуклеиновых кислот присутствует в конкатемерах.34. The method of claim 32, wherein multiple copies of the target nucleic acids are present in the concatemers. 35. Способ по любому из пп. 31-34, где чип имеет плотность по меньшей мере примерно 10 элементов/см2, 100 элементов/см2, 500 элементов/см2, 1000 элементов/см2, 5000 элементов/см2, 10000 элементов/см2, 50000 элементов/см2, 100000 элементов/см2, 1000000 элементов/см2 или 5000000 элементов/см2.35. Method according to any one of paragraphs. 31-34, where the chip has a density of at least about 10 elements/cm 2 , 100 elements/cm 2 , 500 elements/cm 2 , 1000 elements/cm 2 , 5000 elements/cm 2 , 10,000 elements/cm 2 , 50,000 elements /cm 2 , 100,000 elements/cm 2 , 1,000,000 elements/cm 2 or 5,000,000 elements/cm 2 . 36. Способ по любому из пп. 16-35, отличающийся тем, что в способе используют первый тип нуклеотидов - который выявляется в первом канале, второй тип нуклеотидов - который выявляется во втором канале, третий тип нуклеотидов - который выявляется как в первом, так и во втором канале, и четвертый тип нуклеотидов - у которого отсутствует метка, и который не выявляется или минимально выявляется в обоих каналах.36. Method according to any one of paragraphs. 16-35, characterized in that the method uses the first type of nucleotides - which is detected in the first channel, the second type of nucleotides - which is detected in the second channel, the third type of nucleotides - which is detected in both the first and second channels, and the fourth type nucleotides - which lacks a label and is not detected or minimally detected in both channels. 37. Способ по любому из пп. 16-35, отличающийся тем, что в способе используют четыре разных типа нуклеотидов, причем каждый тип нуклеотидов имеет спектрально отличающуюся метку.37. Method according to any one of paragraphs. 16-35, characterized in that the method uses four different types of nucleotides, each type of nucleotide having a spectrally different label. 38. Способ по любому из пп. 16-37, где включение нуклеотида осуществляют с помощью ДНК-полимеразы.38. Method according to any one of paragraphs. 16-37, where the incorporation of the nucleotide is carried out using DNA polymerase. 39. Набор для применения в мультиплексном секвенировании путем синтеза, содержащий один или более чем один нуклеотид по любому из пп. 1-11.39. A kit for use in multiplex sequencing by synthesis, containing one or more than one nucleotide according to any one of paragraphs. 1-11. 40. Набор по п. 39, в котором по меньшей мере один нуклеотид представляет собой нуклеотид-5’-трифосфат, имеющий 3’-OH блокирующую группу структуры ковалентно присоединенную к 3’-углероду 2’ дезоксирибозы.40. The set of claim 39, wherein at least one nucleotide is a nucleotide 5'-triphosphate having a 3'-OH blocking group structure covalently attached to the 3' carbon of the 2' deoxyribose. 41. Набор по п. 39 или 40, дополнительно содержащий фермент и буфер, подходящий для действия фермента.41. The kit according to claim 39 or 40, further containing an enzyme and a buffer suitable for the action of the enzyme. 42. Набор по п. 41, в котором фермент представляет собой полимеразу.42. The kit according to claim 41, wherein the enzyme is a polymerase. 43. Набор по п. 42, в котором полимераза представляет собой ДНК-полимеразу.43. The kit according to claim 42, wherein the polymerase is a DNA polymerase. 44. Набор по любому из пп. 39-43, содержащий по меньшей мере один нуклеотид, меченный выявляемой меткой, по любому из пп. 4-11.44. Set according to any one of paragraphs. 39-43, containing at least one nucleotide labeled with a detectable label according to any one of paragraphs. 4-11. 45. Набор по любому из пп. 39-43, содержащий два, три или четыре типа нуклеотидов, меченных выявляемой меткой, по любому из пп. 4-11.45. Set according to any one of paragraphs. 39-43, containing two, three or four types of nucleotides labeled with a detectable label, according to any one of paragraphs. 4-11. 46. Набор по п. 45, дополнительно содержащий «темный» нуклеотид, не имеющий выявляемой метки.46. The set according to claim 45, additionally containing a “dark” nucleotide that does not have a detectable label. 47. Набор по п. 45 или 46, в котором разные типы меченых нуклеотидов мечены спектрально отличающимися красителями.47. The kit of claim 45 or 46, wherein the different types of labeled nucleotides are labeled with spectrally different dyes. 48. Набор по любому из пп. 45-47, где по меньшей мере один тип нуклеотидов является меченным по азотистому основанию двумя или более разными красителями.48. Set according to any one of paragraphs. 45-47, wherein at least one type of nucleotide is labeled at the nitrogenous base with two or more different dyes. 49. Набор по любому из пп. 45-48, где первый тип нуклеотидов является меченным первым красителем, второй тип нуклеотидов является меченным вторым красителем, спектрально отличающимся от первого красителя, третий тип нуклеотидов является меченным в виде смеси первого и второго красителей или смеси первого, второго и третьего красителей, и четвертый нуклеотид не содержит метки.49. Set according to any one of paragraphs. 45-48, where the first type of nucleotides is labeled with a first dye, the second type of nucleotides is labeled with a second dye spectrally different from the first dye, the third type of nucleotides is labeled as a mixture of the first and second dyes or a mixture of the first, second and third dyes, and the fourth the nucleotide does not contain a label. 50. Набор по п. 45, содержащий четыре типа нуклеотидов, меченных выявляемой меткой, причем нуклеотиды, меченные выявляемой меткой, представляют собой А, С, Т и G, причем каждый тип нуклеотидов имеет флуоресцентную метку с заметным максимумом флуоресценции, и каждая из флуоресцентных меток отличается от трех других флуоресцентных меток.50. The kit of claim 45, comprising four types of nucleotides labeled with a detectable label, wherein the nucleotides labeled with the detectable label are A, C, T and G, wherein each type of nucleotide has a fluorescent label with a noticeable fluorescence maximum, and each of the fluorescent tags is different from the other three fluorescent tags. 51. Набор по любому из пп. 39-50, дополнительно содержащий расщепляющий раствор, включающий в себя трис(гидроксипропил)фосфин, палладиевый (Pd) катализатор, аскорбиновую кислоту или ее соль, и буферизирующий реагент, выбранный из группы, состоящей из этаноламина (ЕА), трис(гидроксиметил)аминометана (Tris), глицина, карбонатной соли, фосфатной соли, боратной соли, 2-диметиламиноэтанола (DMEA), 2-диэтиламинометанола (DEEA), N,N,N’,N’-тетраметилэтилендиамина (TEMED) и N,N,N’,N’-тетраэтилэтилендиамина (TEEDA) и их комбинаций.51. Set according to any one of paragraphs. 39-50, further containing a cleavage solution including tris(hydroxypropyl)phosphine, palladium (Pd) catalyst, ascorbic acid or a salt thereof, and a buffering reagent selected from the group consisting of ethanolamine (EA), tris(hydroxymethyl)aminomethane (Tris), glycine, carbonate salt, phosphate salt, borate salt, 2-dimethylaminoethanol (DMEA), 2-diethylaminomethanol (DEEA), N,N,N',N'-tetramethylethylenediamine (TEMED) and N,N,N' ,N'-tetraethylethylenediamine (TEEDA) and combinations thereof. 52. Набор по любому из пп. 39-51, дополнительно содержащий промывочный раствор, содержащий палладиевый акцептор радикалов.52. Set according to any one of paragraphs. 39-51, additionally containing a washing solution containing a palladium radical scavenger. 53. Применение нуклеотида по любому из пп. 1-11 в мультиплексном секвенировании путем синтеза.53. Use of a nucleotide according to any one of paragraphs. 1-11 in multiplex sequencing by synthesis. 54. Применение по п. 53, где стадии секвенирования повторяют по меньшей мере 50 раз, по меньшей мере 75 раз, по меньшей мере 100 раз, по меньшей мере 150 раз, по меньшей мере 200 раз, по меньшей мере 250 раз или по меньшей мере 300 раз.54. Use according to claim 53, where the sequencing steps are repeated at least 50 times, at least 75 times, at least 100 times, at least 150 times, at least 200 times, at least 250 times or at least at least 300 times.
RU2020141465A 2018-12-26 2019-12-23 Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in methods of sequencing polynucleotides RU2818762C2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62/784,970 2018-12-26
US62/784,994 2018-12-26

Publications (2)

Publication Number Publication Date
RU2020141465A RU2020141465A (en) 2023-01-26
RU2818762C2 true RU2818762C2 (en) 2024-05-06

Family

ID=

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002029003A2 (en) * 2000-10-06 2002-04-11 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding dna and rna
WO2004018497A2 (en) * 2002-08-23 2004-03-04 Solexa Limited Modified nucleotides for polynucleotide sequencing
RU2563808C2 (en) * 2007-01-11 2015-09-20 Новартис Аг Modified capsular saccharide, method for production and use thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002029003A2 (en) * 2000-10-06 2002-04-11 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding dna and rna
WO2004018497A2 (en) * 2002-08-23 2004-03-04 Solexa Limited Modified nucleotides for polynucleotide sequencing
RU2563808C2 (en) * 2007-01-11 2015-09-20 Новартис Аг Modified capsular saccharide, method for production and use thereof

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
METZKER M.L. et al. Termination of dna synthesis by novel 3'-modified-deoxyribonucleoside 5'-triphosphates // Nucleic acids research, 1994, vol. 22, no. 20, p. 4259-4267. *

Similar Documents

Publication Publication Date Title
US11827931B2 (en) Methods of preparing growing polynucleotides using nucleotides with 3′ AOM blocking group
US11787831B2 (en) Nucleosides and nucleotides with 3′ acetal blocking group
US20220195517A1 (en) Long stokes shift chromenoquinoline dyes and uses in sequencing applications
US20220380389A1 (en) Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing
US20220195196A1 (en) Alkylpyridinium coumarin dyes and uses in sequencing applications
RU2818762C2 (en) Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in methods of sequencing polynucleotides
US20240182963A1 (en) Methods of sequencing using 3' blocked nucleotides
US20230313292A1 (en) Chromenoquinoline dyes and uses in sequencing
NZ770894A (en) Nucleosides and nucleotides with 3'-hydroxy blocking groups and their use in polynucleotide sequencing methods
WO2023232829A1 (en) Compositions and methods for nucleic acid sequencing
JP2024519372A (en) Compositions and methods for sequencing by synthesis
WO2024003087A1 (en) Fluorescent dyes containing fused tetracyclic bis-boron heterocycle and uses in sequencing