JP2021523133A - ケトキサール誘導体に関連する組成物および方法 - Google Patents

ケトキサール誘導体に関連する組成物および方法 Download PDF

Info

Publication number
JP2021523133A
JP2021523133A JP2020562567A JP2020562567A JP2021523133A JP 2021523133 A JP2021523133 A JP 2021523133A JP 2020562567 A JP2020562567 A JP 2020562567A JP 2020562567 A JP2020562567 A JP 2020562567A JP 2021523133 A JP2021523133 A JP 2021523133A
Authority
JP
Japan
Prior art keywords
rna
kethoxal
azidoethoxy
cdna
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020562567A
Other languages
English (en)
Other versions
JPWO2019217533A5 (ja
Inventor
チュアン ヘ
チュアン ヘ
シャオチェン ウェン
シャオチェン ウェン
トン ウー
トン ウー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Chicago
Original Assignee
University of Chicago
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Chicago filed Critical University of Chicago
Publication of JP2021523133A publication Critical patent/JP2021523133A/ja
Publication of JPWO2019217533A5 publication Critical patent/JPWO2019217533A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C247/00Compounds containing azido groups
    • C07C247/02Compounds containing azido groups with azido groups bound to acyclic carbon atoms of a carbon skeleton
    • C07C247/04Compounds containing azido groups with azido groups bound to acyclic carbon atoms of a carbon skeleton being saturated
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C69/00Esters of carboxylic acids; Esters of carbonic or haloformic acids
    • C07C69/003Esters of saturated alcohols having the esterified hydroxy group bound to an acyclic carbon atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/46Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/518Detection characterised by immobilisation to a surface characterised by the immobilisation of the nucleic acid sample or target

Abstract

態様は、生細胞中の一本鎖核酸の迅速かつ可逆的な標識を可能にする、N3-ケトキサール試薬およびその誘導体、ならびに関連方法を目的とする。例として、一局面は、生細胞中の一本鎖グアニン塩基の可逆的な標識のためのプロセスを目的とし、これは、トランスクリプトーム全体のRNA二次構造マッピングおよびRNA G-四重鎖予測についての有効なインビボ方法をもたらす。

Description

関連出願の相互参照
本出願は、2018年5月8日に出願された米国仮特許出願第62/668,543号および2018年5月9日に出願された米国仮特許出願第62/668,994号に対する優先権の恩典を主張し、これらの全ては参照によりそれらの全体が本明細書に組み入れられる。
連邦政府支援研究に関する声明
本発明は、国立衛生研究所によって与えられたHG008935の下で政府の支援によってなされた。政府は本発明において一定の権利を有する。
A.発明の分野
態様は概して、分子生物学および細胞生物学に関する。特に、態様は、核酸を標識するための方法および組成物を目的とする。
B.関連技術の説明
RNAフォールディングの知識は様々なRNA種の機能を理解するために不可欠である(Wan et al., Nat. Rev. Genet. 12:641-55, 2011(非特許文献1))。化学プローブはトランスクリプトーム全体のRNA二次構造研究において重要な役割を果たしてきた(Kubota et al., Nat. Chem. Biol. 11:933-41, 2015(非特許文献2))。ハイスループットRNA構造マッピングについてのますます増加する方法が近年開発されている(Kertesz et al., Nature 467:103-7, 2010(非特許文献3); Underwood et al., Nat. Methods 7:995-1001, 2010(非特許文献4); Lucks et al., P. Natl. Acad. Sci. USA 108:11063-68, 2011(非特許文献5); Rouskin et al., Nature 505:701-5, 2014(非特許文献6); Ding et al., Nature 505:696-700, 2014(非特許文献7); Talkish et al., RNA 20:713-20, 2014(非特許文献8); Wan et al., Nature 505:706-9, 2014(非特許文献9); Spitale et al., Nature 519:486-90, 2015(非特許文献10); Zubradt et al., Nat. Methods 14:75-82, 2016(非特許文献11); Siegfried et al., Nat. Methods 11:959-65, 2014(非特許文献12); Lee et al., RNA 23:169-74, 2017(非特許文献13); Feng et al., Nat. Chem. Biol. 14:276-83, 2018(非特許文献14))。化学プローブの2つの注目すべきクラスであるDMSおよびSHAPEは、トランスクリプトーム全体のインビボRNAストラクチュロームマッピングを可能にする(Lu and Chang, Curr. Opin. Struct. Biol. 36:142-48, 2016(非特許文献15))。方法は両方とも非常に有効であるが、改善の余地が依然としてかなりあり;DMSは、非常に有毒であり、非特異的であり、m1Aだけでなくm7Gおよびm3Aもメチル化することができ、これは構造決定を潜在的に複雑にし、一方、SHAPE分子は、加水分解的に不安定であり、塩基の代わりに糖2’-OHを標識する(NTP (National Toxicology Program) 2016, Report on Carcinogens, Fourteenth Edition.; Research Triangle Park, NC: U.S. Department of Health and Human Services, Public Health Service.URL ntp.niehs.nih.gov/go/roc/(非特許文献16); Merino et al., J. Am. Chem. Soc. 127:4223-31, 2005(非特許文献17))。
RNA塩基対形成および二次構造のインビボプロービングのために温和な条件下でワトソン-クリック塩基対形成界面を迅速に標識するためのさらなる特異的な非毒性試薬が依然として必要とされている。
Wan et al., Nat. Rev. Genet. 12:641-55, 2011 Kubota et al., Nat. Chem. Biol. 11:933-41, 2015 Kertesz et al., Nature 467:103-7, 2010 Underwood et al., Nat. Methods 7:995-1001, 2010 Lucks et al., P. Natl. Acad. Sci. USA 108:11063-68, 2011 Rouskin et al., Nature 505:701-5, 2014 Ding et al., Nature 505:696-700, 2014( Talkish et al., RNA 20:713-20, 2014 Wan et al., Nature 505:706-9, 2014 Spitale et al., Nature 519:486-90, 2015 Zubradt et al., Nat. Methods 14:75-82, 2016 Siegfried et al., Nat. Methods 11:959-65, 2014 Lee et al., RNA 23:169-74, 2017 Feng et al., Nat. Chem. Biol. 14:276-83, 2018 Lu and Chang, Curr. Opin. Struct. Biol. 36:142-48, 2016 NTP (National Toxicology Program) 2016, Report on Carcinogens, Fourteenth Edition.; Research Triangle Park, NC: U.S. Department of Health and Human Services, Public Health Service.URL ntp.niehs.nih.gov/go/roc/ Merino et al., J. Am. Chem. Soc. 127:4223-31, 2005
RNA二次構造はRNA調節および機能にとって重要である。本明細書に記載される組成物および方法は、例えば、RNA二次または三次構造をクエリーするために使用され得る、核酸のインビボ標識と関連する問題の解決法を提供する。特に、生細胞中の一本鎖核酸の迅速かつ可逆的な標識を可能にする試薬および方法を提供する。例として、本発明者らは、生細胞中の一本鎖グアニン塩基を可逆的に標識するためのプロセスを発見し、これは、トランスクリプトーム全体のRNA二次構造マッピングおよびRNA G-四重鎖予測のための有効なインビボ方法をもたらす。
グアニン塩基のワトソン-クリック界面と反応することによって生細胞中の一本鎖DNAおよび/またはRNAを効率的に標識する、N3-ケトキサールまたはクリックケミストリーケトキサール誘導体(「ケトキサール誘導体」)を開発した。標識プロダクトは、例えばビオチン/ビオチン結合性パートナーを使用して、さらに官能化および濃縮され得る。N3-ケトキサールまたはケトキサール誘導体標識DNAのシーケンシング(ssDNA-seq)は、初めて一本鎖DNAのゲノムワイドマップを提供し、これは広範囲の転写ダイナミクスを明らかにする。ssDNA-seqはまた、DNA複製およびDNA二本鎖切断(DSB)形成のような、ssDNAが関与する他の生物学的プロセスを研究するために使用される大きな可能性を有する。実験的に、ssDNA-seqは単純な3ステッププロトコルを採用し、このためユーザーフレンドリーであり、少量の投入材料で潜在的に機能する。N3-ケトキサールまたはケトキサール誘導体標識および架橋の組み合わせは、RNA二次構造、RNA-RNA相互作用、RNA-タンパク質相互作用などのような、RNA分子間または分子内相互作用の検出を可能にし、同様にRNA曝露情報を提供する。光活性化可能なDBCO分子を含めることは光によるインサイチュRNA標識を可能にし、これは関心対象の特定の位置中におけるRNA代謝を研究するのに役立つ。
N3-ケトキサール-またはケトキサール誘導体-補助核酸標識法は、転写、複製、RNA代謝などを含む、遺伝子発現プロセスを研究するためのツールとして役立ち得る。N3-ケトキサールまたはケトキサール誘導体はまた、ハイスループット様式および位置特異的様式の両方における他の核酸関連技術を開発するためのプラットフォームを提供し得る。ssDNAの標識および全ての活性転写のインサイチュ捕捉は、重要な研究試薬としてだけでなく臨床検査としての使用についても、考慮される。本明細書に記載される組成物および/または方法が全ての転写を捕捉するために使用される場合、RNA-seqは必要とされない場合があり、従って、RNA操作が臨床設定において要求されない。
生細胞中の一本鎖グアニン塩基の迅速かつ可逆的な標識を可能にするN3-ケトキサールまたはケトキサール誘導体試薬を本明細書に記載する。Keth-seqアプローチは、トランスクリプトーム全体のRNA二次構造マッピングおよびRNA G-四重鎖予測のための有効なインビボ方法を提供する。
ある態様は、一般式:
Figure 2021523133
を有する化合物に関し、式中、Yは、アルキン、アジド、歪みアルキン、ジエン、ジエンオフィル(dieneophile)、アルコキシアミン、カルボニル、ホスフィン、ヒドラジド、チオール、およびアルケンより選択されるクリックケミストリー部分であり得;かつ、Xはリンカーであり得る。ある局面において、クリックケミストリー部分(Y)はアジドである。リンカー(X)は、C1、C2、C3、C4、C5、C6、C7、C8、C9、〜C10アルキル(1つまたは複数の態様は具体的に除外され得る)またはポリエチレングリコールリンカーであり得る。ある局面において、リンカー(X)はCH2である。ある局面において、Xは、アルキン、アジド、歪みアルキン、ジエン、ジエンオフィル、アルコキシアミン、カルボニル、ホスフィン、ヒドラジド、チオール、およびアルケンより選択されるクリックケミストリー部分であり得;かつ、Yはリンカーであり得る。ある局面において、クリックケミストリー部分(X)はアジドである。リンカー(Y)は、C1、C2、C3、C4、C5、C6、C7、C8、C9、〜C10(1つまたは複数の態様は具体的に除外され得る)アルキルまたはポリエチレングリコールリンカーであり得る。ある局面において、リンカー(Y)はCH2である。
他の態様は、式:
Figure 2021523133
を有する化合物を目的とする。
ある態様は、グアニン塩基を標識するための方法であって、標識されるグアニンを式Iまたは式IIの化合物と接触させて反応混合物を形成する工程、および反応混合物を30、31、32、33、34、35、36、37、38、39〜40℃もしくはそれ以上でまたは約30、約31、約32、約33、約34、約35、約36、約37、約38、約39〜約40℃もしくはそれ以上で(1つまたは複数の態様は具体的に除外され得る)、少なくとも1、2、3、4、5、6、7、8、9、10分間またはそれ以上(1つまたは複数の態様は具体的に除外され得る)、インキュベートする工程を含む、前記方法を目的とする。ある局面において、化合物はN3-ケトキサール(式II)である。ある局面において、ポリヌクレオチド中にグアニンがさらに含まれている。ポリヌクレオチドはリボ核酸(RNA)またはデオキシリボ核酸(DNA)であり得る。ある局面において、RNAはRNA転写物である。
ある態様は、以下の1つを含む、細胞中の一本鎖核酸を標識するための方法を目的とする:(i)標的細胞を式Iまたは式IIの化合物と接触させて、ケトキサール誘導体標識グアニン塩基を有する核酸を含む処理細胞を形成する工程;(ii)処理細胞を少なくとも2つのクリックケミストリー反応性部分およびタグを含む架橋部分と接触させる工程であって、ここで、該架橋部分が、2つの近接ケトキサール誘導体標識グアニンを架橋して架橋核酸を形成する、工程;および(iii)断片化し、かつタグに対する親和性を有する試薬を使用して架橋核酸を単離する工程。ある局面において、タグはビオチンである。タグに対する親和性を有する試薬は、ストレプトアビジンであり得る。ある局面において、クリックケミストリー反応性部分は、ジベンゾシクロオクチン部分である。架橋核酸は2つ以上の核酸を含み得る。ある局面において、架橋核酸は、RNAまたはDNA、またはRNAおよびDNAの両方である。
態様は、以下のような、細胞中の一本鎖核酸を標識するための1、2、3またはそれ以上の工程を伴い得る:(i)標的細胞を式Iまたは式IIの化合物と接触させて、ケトキサール誘導体標識グアニン塩基を有する核酸を含む処理細胞を形成する工程;(ii)処理細胞を少なくとも2つのクリックケミストリー反応性部分およびタグを含む架橋部分と接触させる工程であって、ここで、該架橋部分が、2つの近接ケトキサール誘導体標識グアニンを架橋して架橋核酸を形成する、工程;および(iii)断片化し、かつタグに対する親和性を有する試薬を使用して架橋核酸を単離する工程。ある局面において、タグはビオチンである。タグに対する親和性を有する試薬は、ストレプトアビジンであり得る。ある局面において、クリックケミストリー反応性部分は、ジベンゾシクロオクチン部分である。架橋核酸は2つ以上の核酸を含み得る。ある局面において、架橋核酸は、RNAまたはDNA、またはRNAおよびDNAの両方である。
ある態様は、以下の工程を含む、インビボでのトランスクリプトーム全体のRNA二次構造マッピングおよびRNA G-四重鎖予測のための方法を目的とする:(a)インビボで核酸をケトキサールクリックケミストリー誘導体で標識する工程;(b)核酸をビオチン化する工程;(c)標識化されかつビオチン化された核酸を断片化する工程;(d)断片化/ビオチン化核酸から相補DNAを合成する工程;(e)ビオチン化核酸と結合したcDNAを単離する工程;(f)サイズに基づいてcDNAを分離する工程;(g)環化cDNAライブラリーを形成するためにcDNAの環化を行う工程;および(h)環化cDNAライブラリーを増幅する工程。ある局面において、cDNAの環化は、cDNAを一本鎖DNAリガーゼと接触させることによって行われる。さらなる局面において、環化cDNAライブラリーを増幅する工程は、ポリメラーゼ連鎖反応(PCR)または他の核酸増幅技術により得る。
態様は、以下のような、インビボでのトランスクリプトーム全体のRNA二次構造マッピングおよびRNA G-四重鎖予測のための1、2、3、4、5、6、7、またはそれ以上の工程(またはそれらの間の任意の範囲)を伴い得る:(a)インビボで核酸をケトキサールクリックケミストリー誘導体で標識する工程;(b)核酸ビオチン化する工程;(c)標識化されかつビオチン化された核酸を断片化する工程;(d)断片化/ビオチン化核酸から相補DNAを合成する工程;(e)ビオチン化核酸と結合したcDNAを単離する工程;(f)サイズに基づいてcDNAを分離する工程;(g)環化cDNAライブラリーを形成するためにcDNAの環化を行う工程;および(h)環化cDNAライブラリーを増幅する工程。ある局面において、cDNAの環化は、cDNAを一本鎖DNAリガーゼと接触させることによって行われる。さらなる局面において、環化cDNAライブラリーを増幅する工程は、ポリメラーゼ連鎖反応(PCR)または他の核酸増幅技術により得る。
ある態様は、RNAとのタンパク質相互作用を解析するための、ケトキサールまたはケトキサール誘導体クロマチン架橋、続いてのDNAシーケンシング(CLIP-seq法)を目的とする。ある局面において、方法は、以下を含む:(a)RNAに近接しているRNA結合性標的またはタンパク質標的を、任意でアビディティタグに直接または間接的に結合されているケトキサールまたはケトキサール誘導体と接触させる工程;(b)架橋を活性化するために標的/ケトキサールまたはケトキサール誘導体混合物を活性化因子へ曝露して、架橋された標的/ケトキサールまたはケトキサール誘導体複合体を形成する工程;(c)標的を、RNAに近接しているRNA結合性タンパク質またはタンパク質標的に結合する親和性物質と接触させる工程であって、ここで、親和性物質がアビディティタグ修飾物質に任意で結合されており、ここで、アビディティタグ修飾物質が、アビディティタグに接近するとアビディティタグを修飾して、単離可能なクロマチン/スキャフォールド複合体を形成する、工程;(d)標的/ケトキサールまたはケトキサール誘導体複合体をアビディティタグによって単離する工程;ならびに(e)単離可能な標的/ケトキサールまたはケトキサール誘導体複合体と会合連結しているRNAの部分を同定する工程。ある局面において、アビディティタグはビオチン化基質であり、アビディティタグ修飾物質はビオチン-タンパク質リガーゼである。
態様は、以下のような、1、2、3、4、5またはそれ以上の工程(1つまたは複数の工程は具体的に除外され得る)を伴い得る:(a)RNAに近接しているRNA結合性標的またはタンパク質標的を、任意でアビディティタグに直接または間接的に結合されているケトキサールまたはケトキサール誘導体と接触させる工程;(b)架橋を活性化するために標的/ケトキサールまたはケトキサール誘導体混合物を活性化因子へ曝露して、架橋された標的/ケトキサールまたはケトキサール誘導体複合体を形成する工程;(c)標的を、RNAに近接しているRNA結合性タンパク質またはタンパク質標的に結合する親和性物質と接触させる工程であって、ここで、親和性物質がアビディティタグ修飾物質に任意で結合されており、ここで、アビディティタグ修飾物質が、アビディティタグに接近するとアビディティタグを修飾して、単離可能なクロマチン/スキャフォールド複合体を形成する、工程;(d)標的/ケトキサールまたはケトキサール誘導体複合体をアビディティタグによって単離する工程;ならびに(e)単離可能な標的/ケトキサールまたはケトキサール誘導体複合体と会合連結しているRNAの部分を同定する工程。ある局面において、アビディティタグはビオチン化基質であり、アビディティタグ修飾物質はビオチン-タンパク質リガーゼである。
ある態様は、以下の工程を含む、アジド-ケトキサール(N3-ケトキサール)を合成するための方法を目的とする:
(a) (i)テトラヒドロフラン(THF)中で水素化ナトリウムを2-アジドエタノールと混ぜ合わせて第1の中間混合物を形成すること、
(ii)2-ブロモプロピオン酸エチルを第1の中間混合物へ添加して第1の反応混合物を形成すること、
(iii)第1の反応混合物を窒素(N2)雰囲気下で室温にてインキュベートして2-(2-アジドエトキシ)プロパン酸を形成すること、
(iv)反応を水でクエンチすること、(v)2-(2-アジドエトキシ)プロパン酸をLiOH水溶液へ添加し、室温でインキュベートすること、および
(vi)2-(2-アジドエトキシ)プロパン酸を洗浄し、単離し、無水Na2SO4で乾燥させること
によって、2-(2-アジドエトキシ)プロパン酸中間体を生成する工程;
(b) (i)2-(2-アジドエトキシ)プロパン酸を無水CH2Cl2およびジメチルホルムアミド(DMF)中に溶解すること、
(ii)塩化オキサリルを添加し、室温で撹拌すること、
(iii)溶媒および過剰な塩化オキサリルを除去して残留物を形成すること、
(iv)残留物を無水CH3CNおよび(トリメチルシリル)ジアゾメタン中に溶解すること、
(v)ジエチルエーテルを滴下して第2の反応混合物を形成すること、
(vi)第2の反応混合物を0℃で一晩撹拌すること、
(vii)溶媒を蒸発させて3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オンを単離すること
によって、3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オン中間体を生成する工程;ならびに
(c) (i)3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オンをアセトン中のジメチルジオキシラン(DMD-アセトン)へ添加して第3の反応混合物を形成すること、
(ii)第3の反応混合物を室温で撹拌してN3-ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを形成すること、および
(iii)N3-ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを単離すること
によって、N3-ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを生成する工程。
態様は、以下のような、1、2、3、4、5、6、7、8、9、10、11、12、またはそれ以上の工程(またはそれらの間の任意の範囲)を伴い得る:
(a) (i)テトラヒドロフラン(THF)中で水素化ナトリウムを2-アジドエタノールと混ぜ合わせて第1の中間混合物を形成すること、
(ii)2-ブロモプロピオン酸エチルを第1の中間混合物へ添加して第1の反応混合物を形成すること、
(iii)第1の反応混合物を窒素(N2)雰囲気下で室温にてインキュベートして2-(2-アジドエトキシ)プロパン酸を形成すること、
(iv)反応を水でクエンチすること、
(v)2-(2-アジドエトキシ)プロパン酸をLiOH水溶液へ添加し、室温でインキュベートすること、および
(vi)2-(2-アジドエトキシ)プロパン酸を洗浄し、単離し、無水Na2SO4で乾燥させること
によって、2-(2-アジドエトキシ)プロパン酸中間体を生成する工程;
(b) (i)2-(2-アジドエトキシ)プロパン酸を無水CH2Cl2およびジメチルホルムアミド(DMF)中に溶解すること、
(ii)塩化オキサリルを添加し、室温で撹拌すること、
(iii)溶媒および過剰な塩化オキサリルを除去して残留物を形成すること、
(iv)残留物を無水CH3CNおよび(トリメチルシリル)ジアゾメタン中に溶解すること、
(v)ジエチルエーテルを滴下して第2の反応混合物を形成すること、
(vi)第2の反応混合物を0℃で一晩撹拌すること、
(vii)溶媒を蒸発させて3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オンを単離すること
によって、3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オン中間体を生成する工程;ならびに
(c) (i)3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オンをアセトン中のジメチルジオキシラン(DMD-アセトン)へ添加して第3の反応混合物を形成すること、
(ii)第3の反応混合物を室温で撹拌してN3-ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを形成すること、および
(iii)N3-ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを単離すること
によって、N3-ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを生成する工程。
本明細書において使用される場合、用語「核酸塩基」は、ヌクレオチドまたはヌクレオチド類似体の窒素含有複素環式部分を指す。好適な核酸塩基の非限定的な例としては:天然および合成誘導体を含む、アデニン、シトシン、グアニン、チミン、ウラシル、5-プロピニル-ウラシル、2-チオ-5-プロピニル-ウラシル、5-メチルシトシン、プソイドイソシトシン、2-チオウラシル、2-チオチミン、2-アミノプリン、N9-(2-アミノ-6-クロロプリン)、N9-(2,6-ジアミノプリン)、ヒポキサンチン、N9-(7-デアザ-グアニン)、N9-(7-デアザ-8-アザ-グアニン)およびN8-(8-アザ-7-デアザアデニン)が挙げられる。記載される様々な態様において有用な核酸塩基は、RNA分子への結合およびRNA分子の転写を可能にし、さらに、転写されたRNAの検出および精製に有用なレポーター部分をそれらへ結合させていてもよい。当業者は、修飾形態および機能的類似体核酸塩基も具体的に考慮されることを認識するだろう。
用語「ヌクレオシド」および「ヌクレオチド」は、「天然糖」(即ち、-リボース、2′-デオキシリボースなど)またはその糖類似体(2′-デオキシおよび2′-ヒドロキシル形態を含む)のC-1′炭素へ連結された、ピリミジン核酸塩基、例えば、シトシン(C)、ウラシル(U)、もしくはチミン(T)、またはプリン核酸塩基、例えば、アデニン(A)もしくはグアニン(G)を有する化合物を指す。典型的に、核酸塩基がC、UまたはTである場合、ペントース糖は核酸塩基のN1位へ結合される。核酸塩基がAまたはGである場合、リボース糖は核酸塩基のN9位へ結合される(Kornberg and Baker, DNA Replication, 2nd Ed., Freeman, San Francisco, Calif., (1992))。用語「ヌクレオチド」は、本明細書において使用される場合、モノマー単位としてのまたはポリヌクレオチド内のヌクレオシドのリン酸エステル、例えば、三リン酸エステルを指し、ここで、エステル化の最も一般的な部位は、リボースのC-5′位に結合されたヒドロキシル基である。
「ヌクレオシド類似体」および「ヌクレオチド類似体」は、修飾核酸塩基部分(例えば、下記に記載されるピリミジン核酸塩基類似体およびプリン核酸塩基類似体)、修飾糖部分、および/または修飾リン酸エステル部分を有する化合物を指す(例えば、Scheit, Nucleoside Analogs, John Wiley and Sons, (1980); F. Eckstein, Ed., Oligonucleotides and Analogs, Chapters 8 and 9, IRL Press, (1991)を参照のこと)。リボースまたはリボース類似体は、置換または非置換であり得る。置換リボース糖としては、2′-炭素原子または3′-炭素原子のような、炭素原子のうちの1つまたは複数が、-R、-OR、-NRRまたはハロゲン(例えば、フルオロ、クロロ、ブロモ、もしくはヨード)のような、同じまたは異なる置換基のうちの1つまたは複数で置換され得る、リボースが挙げられるが、これらに限定されず、ここで、各R基は、独立して、-H、C1〜C6アルキルまたはC3〜C14アリールであり得る。特に、リボースは、リボース、2′-デオキシリボース、2′,3′-ジデオキシリボース、3′-ハロリボース(例えば、3′-フルオロリボースまたは3′-クロロリボース)および3′-アルキルリボース、アラビノース、2′-O-メチルリボース、ならびにロックドヌクレオシド類似体(例えば、PCT公開公報WO 99/14226を参照のこと)であり、しかし、多くの他の類似体がまた当技術分野において公知である。
用語「核酸」は、本明細書において使用される場合、核酸材料自体を指し得、特定の核酸、例えば、DNAまたはRNA分子を生化学的に特徴付ける配列情報(即ち、5個の塩基文字A、C、G、T、またはUの中から選択される文字の連続)に限定されない。本明細書に記載される核酸は、別段の指示がない限り、5′→3′配向で示される。
本明細書において使用される場合、用語「ポリヌクレオチド」は、二本鎖および一本鎖デオキシリボヌクレオチド、リボヌクレオチド、そのα-アノマー形態などを含む、天然ヌクレオチドモノマーまたはその類似体のポリマーを指す。用語「ポリヌクレオチド」、「オリゴヌクレオチド」および「核酸」は、交換可能に使用される。通常、ヌクレオシドモノマーはヌクレオチド間ホスホジエステル連結によって連結され、本明細書において使用される場合、用語「ホスホジエステル連結」は、ホスホジエステル結合、またはそのリン酸類似体を含む結合を指し、そのような対イオンが存在する場合、H+、NH4+、NR4+、Na+を含むがこれらに限定されない、会合対イオンを含む。ポリヌクレオチドは、完全にデオキシリボヌクレオチドから、完全にリボヌクレオチドから、またはそれらの混合物から構成され得る。
「RNA」は、リボ核酸を指し、遺伝子のコーディング、デコーディング、調節、および発現における様々な生物学的役割に関与するポリマー分子である。RNAは、生体反応を触媒し、遺伝子発現を制御し、または細胞シグナルに対する応答を感知および伝達することによって、細胞内で能動的な役割を果たす。メッセンジャーRNAは、リボソームへタンパク質のアミノ酸配列についての情報を運び、これを通してそれは翻訳され、タンパク質が合成される。
用語「クリックケミストリー」は、K. Barry Sharplessによって導入された化学的哲学を指し、反応基を一緒に含む小単位を連結することによって共有結合を迅速かつ確実に生成するように調整された化学現象を表す。クリックケミストリーは、特定の反応を指さず、しかし、自然界に見られる反応を模倣する反応を含む概念を指す。いくつかの態様において、クリックケミストリー反応は、モジュール式であり、範囲が広く、高化学収率を与え、無害な副生成物を生成し、立体特異的であり、>84 kJ/molの大きな熱力学的駆動力を示して単一の反応生成物を伴う反応を好み、かつ/または生理学的条件下で行うことができる。別の発熱反応は反応物を「スプリングローデッド」にする。いくつかの態様において、クリックケミストリー反応は、高い原子効率を示し、単純な反応条件下で行うことができ、容易に入手可能な出発原料および試薬を使用し、毒性溶媒を使用しないかまたは良性であるかもしくは容易に除去される溶媒(好ましくは水)を使用し、かつ/または非クロマトグラフ法(結晶化もしくは蒸留)による単純な生成物単離を提供する。
用語「クリックケミストリーハンドル」は、本明細書において使用される場合、クリックケミストリー反応に参加し得る、反応物、または反応基を指す。例えば、アジドはクリックケミストリーハンドルである。一般に、クリックケミストリー反応は、互いに反応し得る相補的なクリックケミストリーハンドルを含む少なくとも2つの分子を必要とする。互いに反応性であるそのようなクリックケミストリーハンドル対は、本明細書においてパートナークリックケミストリーハンドルと時には呼ばれる。例えば、アジドは、シクロオクチンまたは任意の他のアルキンに対するパートナークリックケミストリーハンドルである。本発明のいくつかの局面に従う使用に適した例示的なクリックケミストリーハンドルは、本明細書に記載される。他の好適なクリックケミストリーハンドルは当業者に公知である。
用語「リンカー」は、本明細書において使用される場合、別の分子へ共有結合された化学基または分子を指す。いくつかの態様において、リンカーは、2つの基、分子、または部分の間に位置するか、またはこれらに隣接し、共有結合を介してそれぞれに連結され、従ってこれら2つを連結する。いくつかの態様において、リンカーは、有機分子、基、または化学部分である。
本明細書において使用される場合、用語「タグ」または「親和性タグ」は、化合物、ヌクレオチド、またはヌクレオチド類似体へ結合され得、パートナー部分によって特異的に結合される部分を指す。親和性タグおよびそのパートナーの相互作用は、親和性タグを有する分子の検出、単離などを提供する。例としては、ビオチンまたはイミノビオチンおよびアビジンまたはストレプトアビジンが挙げられるが、これらに限定されない。親和性タグのサブクラスは「エピトープタグ」であり、これは、抗体またはその抗原結合性断片によって認識されそして特異的に結合されるタグを指す。好適なタグの例としては、アミノ酸、ペプチド、タンパク質、核酸、ポリヌクレオチド、糖、炭水化物、ポリマー、脂質、脂肪酸、および小分子が挙げられるが、これらに限定されない。他の好適なタグは、当業者に明らかであり、本発明はこの局面において限定されない。いくつかの態様において、タグは、標的を精製、発現、可溶化および/または検出するために有用な配列を含む。いくつかの態様において、タグは多機能に役立ち得る。いくつかの態様において、タグは、数例を挙げると、HA、TAP、Myc、6×His、Flag、またはGSTタグを含む。いくつかの態様において、タグは、切断可能であり、従ってそれは除去され得る。いくつかの態様において、これは、例えば、タグの機能的部分へ隣接したまたは連結された、プロテアーゼ切断部位をタグ中に含めることによって達成される。例示的なプロテアーゼは、例えば、トロンビン、TEVプロテアーゼ、第Xa因子、PreScissionプロテアーゼなどを含む。いくつかの態様において、「自己切断性」タグが使用される。
本発明の他の態様は本出願の全体にわたって議論される。本発明の一局面に関して議論される任意の態様が、同様に本発明の他の局面に適用され、逆も成立する。本明細書に記載される各態様は、本発明の全ての局面に適用可能である本発明の態様であると理解される。本明細書に議論される任意の態様が、本発明の任意の方法または組成物に関して実施され得、逆も成立することが考慮される。
単語「1つの(a)」または「1つの(an)」の使用は、特許請求の範囲および/または明細書中の用語「含む」と併用して使用される場合、「1つの」を意味し得るが、それはまた、「1つまたは複数の」、「少なくとも1つの」、および「1つのまたは1つを超える」の意味と一致する。
用語「約」または「およそ」は、当業者によって理解されるように近いことと定義される。一つの非限定的な態様において、用語は、10%以内、好ましくは5%以内、より好ましくは1%以内、最も好ましくは0.5%以内であるように定義される。
用語「実質的に」およびその変化形は、10%以内、5%以内、1%以内、または0.5%以内の範囲を含むように定義される。
用語「有効な」は、その用語が明細書および/または特許請求の範囲において使用される場合、所望の、期待される、または意図される結果を達成するために適切であることを意味する。
用語「wt. %」、「vol. %」、または「mol. %」は、それぞれ、構成要素を含む材料の総重量、総体積、または総モルに基づく、構成要素の重量、体積、またはモルパーセンテージを指す。非限定的な例において、100モルの材料中の10モルの構成要素は、10 mol. %の構成要素である。
特許請求の範囲中における用語「または」の使用は、本開示は選択肢のみおよび「および/または」を指す定義をサポートするが、選択肢のみを指すように明示的に示されない限りまたは選択肢が互いに排他的でない限り、「および/または」を意味するために使用される。
本明細書および特許請求の範囲において使用される場合、単語「含む(comprising)」(および含むの任意の形態、例えば、「含む(comprise)」および「含む(comprises)」)、「有する(having)」(および有するの任意の形態、例えば、「有する(have)」および「有する(has)」)、「包含する(including)」(および包含するの任意の形態、例えば、「包含する(includes)」および「包含する(include)」)、または「含有する(containing)」(および含有するの任意の形態、例えば、「含有する(contains)」および「含有する(contain)」)は、包含的またはオープンエンドであり、追加の、未記載の要素または方法工程を除外しない。
本発明の組成物ならびに同じものを製造および使用する方法は、本明細書の全体にわたって開示される特定の成分、構成要素、ブレンド、方法工程など「を含む」、「から本質的になる」、または「からなる」ことができる。
本発明の他の目的、特徴および利点は、以下の詳細な説明から明らかとなるだろう。しかし、詳細な説明および具体的な実施例は、本発明の具体的な態様を示しているが、説明のために与えられるに過ぎないことが理解されるべきであり、何故ならば、本発明の精神および範囲内の様々な変更および改変が、この詳細な説明から当業者に明らかとなるだろうためである。
本明細書に開示される任意の態様が、本明細書に開示される任意の他の態様と実施されまたは組み合わされ得、例えば、化合物についての態様の局面は、組み合わされかつ/または置き換えられ得、ありとあらゆる化合物が、本明細書に記載される任意の方法の文脈において実施され得る。同様に、任意の方法態様の局面が、本明細書に開示される任意の他の方法態様と組み合わされかつ/または置き換えられ得る。さらに、本明細書に開示される任意の方法が、方法を達成するための「組成物の使用」の形態で記載され得る。本発明の一態様に関して議論される任意の限定が、本発明の任意の他の態様へ適用され得ることが、具体的に考慮される。さらに、本発明の任意の組成物が本発明の任意の方法において使用され得、本発明の任意の方法が、本発明の組成物を製造または利用するために使用され得る。
以下の図面は、本明細書の部分を形成し、本発明のある局面をさらに説明するために含まれる。本発明は、本明細書に示される仕様態様の詳細な説明と組み合わせてこれらの図面の1つまたは複数を参照することによって、よりよく理解され得る。
(図1)図1A〜F:N3-ケトキサールならびにその選択性、細胞浸透性および可逆性の実験評価。(a)N3-ケトキサールの構造およびグアニンとの反応。(b)N3-ケトキサールは一本鎖RNA(ssRNA)のみと反応することを実証する変性ゲル電気泳動。(c)N3-ケトキサールと反応するRNAオリゴの質量スペクトル分析。4つのグアニンを有するRNA 1において、全てのグアニンかつグアニンのみがN3-ケトキサールで標識された。グアニンを有さないRNA 2において、N3-ケトキサール標識化は観察されなかった。(d)上部:ケトキサールおよびN3-ケトキサールとFAM-RNAオリゴ
Figure 2021523133
との標識化反応ならびにビオチン-DBCOでのビオチン化(レーン5、6)の変性ゲル電気泳動分析。N3-ケトキサール標識RNAのみがビオチン化され得る(レーン6)。下部:標識化およびビオチン化反応後のRNAのドットブロット。メチレンブルードット結果が対照として列挙される。(e)異なる期間、1、5、10、15、20分でN3-ケトキサールによって処理された、mES細胞由来の単離された全RNAのドットブロット。(f)95℃にて50 mM GTPの存在下でのN3-ケトキサール標識mRNAの可逆性のドットブロット分析。mRNA中のN3-ケトキサール修飾は、10分間インキュベーション後に完全に除去された。
(図2)図2A〜F:(a)2つの個々のssDNA-seqライブラリー間のピアソン相関。(b)ピーク数および2つの個々のssDNA-seqライブラリー間のそれらの重複。(c)異なるゲノム特徴上のssDNAピークの分布。(d)同じ遺伝子座での対応するATAC-seq、H3K4me3 ChIP-seq、H3K36mes ChIP-seq、GRO-seqおよびPol II ChIP-seqプロフィールを伴った、UCSCゲノムブラウザ上での整列されたssDNA-seqリードのスナップショット。(e)ATAC-seq、H3K36me3 ChIP-seq、R-ChIPおよびGRO-seqと比較した、遺伝子コーディング領域上のssDNA-seqピークの分布。(f)ssDNA-seqと他の転写関連ゲノムワイドシーケンシングアッセイとの相関。
(図3)図3A〜E:(a)全ての発現遺伝子を、高、中または低RNAレベルを有する3つの群へ分類する。(b)(a)に示される3つの群中のssDNA、ATAC-seq H3K36me3およびH3K27acシグナル。(c)対照、DRB処理およびトリプトライド処理細胞中のssDNAピーク数(各条件について2つのレプリケートを行った、Trip = トリプトライド)。(d)対照、DRB処理およびトリプトライド処理条件における、遺伝子コーディング領域上のssDNA-seqピークの分布。(e)全ての遺伝子を、対照およびDRB処理条件下でのそれらのssDNA形成に従って異なるPol II休止および活性を有する4つの群へ分類した。各群中の一例をUCSCゲノムブラウザ上に示した。
(図4)図4A〜G:(a)ケトキサール補助RNA-RNA相互作用(KARRI)のスキーム。ボールはPAMAMデンドリマーを表す。ドットおよびロッドは、それぞれ、ビオチンおよびDBCO部分を表す。(b)〜(c)N3-ケトキサール標識RNAに対するDBCOおよびビオチン装飾PAMAMデンドリマーによる架橋の効率のゲル電気泳動(b)およびドットブロット(c)分析。(d)2つの個々のKARRIライブラリー間のピアソン相関。(e)デンドリマーを添加しなかったまたは近接ライゲーションを行わなかった2つの対照実験を伴う、KARRIによって明らかにされた45S rRNAの相互作用マップ。(f)PARISによって明らかにされた45S rRNAの相互作用マップ。(g)KARRIはRPL17 mRNAの2つの代替コンフォメーションを明らかにする。
(図5)図5A〜C:(a)KARRIがインビトロおよびインビボでのRNA二次構造間の差異を検出することを示す2つの例。ハリングトニン処理細胞において、インビボ特異的構造は損なわれ、一方、いくつかのインビトロ特異的特徴が現われた。関心対象の領域は円である。(b)インビトロ、インビボ、CHXおよびHT処理サンプル中の分子内mRNA二次構造のメタジーンプロフィール(metagene profile)。(c)HepG2 mRNAの全てのキメラリードのモチーフ解析結果。AGAGAAはeIF4AIIIの公知の結合モチーフと同様である。
(図6)図6A〜C:(a)光補助RNA標識化のスキーム。365 nm UVは光脱ケージ化反応を誘発し、生成物は、「クリック」ケミストリーを通してN3-ケトキサール標識核酸へ捕捉およびコンジュゲートされ得る。(b)光補助RNA標識化の質量スペクトル分析。(c)フォト-DBCO-OHの2つの潜在的な官能化戦略ならびにインサイチュRNAシーケンシングおよびイメージングにおけるそれらの潜在的な適用。
(図7)図7A〜F:Keth-seq法およびrG4領域周りのプロフィール。(a)keth-seqのライブラリー調製のための戦略の図。(b)N3-ケトキサールサンプルについてのレプリケート間の逆転写(RT)停止リード分布の散布図。挿入円グラフは、レプリケート2(左上)およびレプリケート1(右下)についてのRT停止塩基分布を示す。(c)全ての転写物についてのketh-seqおよびicSHAPE間の相関係数の累積プロット。各々の共通の転写物について、ピアソン相関係数をグアニン塩基の構造シグナルについて計算する。(d)予測される18SリボソームRNA構造およびプロービング構造プロフィール間の比較。予測される18S rRNA構造はRNA STRANDデータベース(id: CRW_00356)に由来する。(e)PDSおよび対照サンプル間の一般に知られているrG4領域のGINI指数。rG4領域はKit et.al., 2016, Nature methodに由来する(n = 13,423)。105個の領域が構造情報を有し、プロットされている(50ヌクレオチド長へ延長される)。(f)以前に同定されたインビトロrG4領域周りの構造プロフィールの2つの例。
(図8)4種類のRNA核塩基とのN3-ケトキサールのHPLC結果。N3-ケトキサールはグアニン(G)のみと反応することができ、A、C、およびUでは不活性であったことが示された。
(図9)N3-ケトキサールおよびSHAPE分子NAIのRNA反応性の比較。NAIを以前の報告された方法に従って合成した(Spitale et al., Nature Chemical Biology 9:18, 2012)。上部のグラフ:12 mer RNAオリゴの分子量(MW)。中央のグラフ:12 mer RNAオリゴとN3-ケトキサールとの反応の生成物のMW。下部のグラフ:RNAオリゴとNAIとの反応の生成物のMW。結果は、全てのグアニン(4つのグアニン)がN3-ケトキサールによって修飾されたことを示した。NAI反応について、いくつかのオリゴは1個のNAIによってのみ反応され、いくつかは2または3個によって標識された。原則として、RNAオリゴのリボース(12個のリボース)中の全ての2’-OH基がNAIの標的である。従って、N3-ケトキサールはRNAへのより高い反応性を示した。
(図10)RNA中におけるN3-ケトキサール標識化およびビオチン化反応のスキーム(上部)および質量スペクトル(下部)分析。4つのグアニンを有する10mer RNAをこの実験において使用した。
(図11)細胞状況におけるN3-ケトキサールによるG標識化の時間依存。1分間および5分間のN3-ケトキサールによる処理後、mES細胞のRNAを単離し、keth-seqを行い、これは、G停止部位が1分間から5分間へ向かって増加したことを示す。
(図12)図12A〜C:N3-ケトキサール標識RNAの可逆性。(a)スキームは、過剰なGTPの存在下でのN3-ケトキサール-グアニン反応の平衡変化を示す。N3-ケトキサール-グアニンは、過剰なGTPを用いて元の未反応RNAへ解離するのが遥かにより容易である。(b)MALDI-TOFモニタリングによるN3-ケトキサール標識RNAの可逆性。ケトキサール修飾は、37℃で中性緩衝液中で50 mM GTPと共に2時間インキュベーション後、大部分が除去され、6時間まで延長された場合はほぼ除去された。(c)上部:異なるインキュベーション期間中のPBS緩衝液(pH = 7.4)中95℃での50 mM GTPと共のN3-ケトキサール標識mRNAのドットブロット結果。下部:上部ドットブロットサンプルと同じ異なるインキュベーション条件下でのRNA断片の変性ゲル電気泳動。断片化RNAの長さは、過剰なGTPの存在下での10分間以内の95℃にてほとんど影響を受けなかった。
(図13)図13A〜C:ホウ酸緩衝液によるケトキサール標識RNAの固定。(a)グアニン-ケトキサールの付加物の隣接ジオール基は、ケトキサール修飾を固定するためにボレート分子と結合させることができる。(b)MALDI-TOF検出によるグアニン-ケトキサール-ホウ素複合体の形成。グアニン-ケトキサールの付加物を4-(アミノメチル)ベンゼンボロン酸と共にインキュベートした。(c)ホウ酸緩衝液の存在下でのグアニン-ケトキサール-ホウ素複合体の安定性試験。大部分のグアニン-ケトキサール付加物がホウ酸緩衝液固定によって保持され、一方、ホウ酸緩衝液の非存在下では全てのグアニン-ケトキサール付加物が消滅した。
(図14)図14A〜D:keth-seq法の品質管理。(a)N3-ケトキサール(左)および未処理対照(右)サンプルについてのレプリケート間のRPKM相関。(b)RTは、N3-ケトキサール、N3-ケトキサール除去サンプル、および未処理対照サンプルについてのレプリケートのリード分布を止めた。(c)インビボおよびインビトロmRNAサンプルの構造シグナル。(d)構造情報を有するmRNAおよび+PDSサンプル中の公知のrG4領域の重複。
(図15)異なるサンプル間のリード分布の例。タンパク質をコードするRNA mt-Atp8について、末端が97から108までの位置内にあった全てのマッピングされたリードを示す。リードは末端位置によってグループ化および着色されている。ここで、N3-ケトキサールサンプルにおいて、リードの大部分はグアニンで止まり、一方、N3-ケトキサール除去および未処理対照サンプルにおいて、リードは遥かにより均一に分布し、従って、N3-ケトキサール分子の高特異性を示唆している。リード群の大部分について、対照よりも除去サンプルにおいて同じ末端でより多くのより長いリードがある(例えば、強調された青緑色および赤色リード群)。対照サンプルに対する除去サンプル中の完全長リード突出のより高い比率は、より高い信頼性を有するRT停止部位を示し得る。
(図16)天然および+PDS条件の両方の下でのケトキサールおよび対照サンプルの潜在的なrG4領域周りのカバレッジトラックを示す2つの例。
(図17)N3-ケトキサールサンプル、N3-ケトキサール除去サンプル、および未処理対照サンプルのライブラリー調製の詳細なフローチャート。
(図18)図18A〜B:(a)ケトキサール-Daz CLIPの略図。RNAは、インキュベーションおよび365 nm UV照射後にインサイチュでRNA結合性タンパク質へ共有結合的に架橋される。これに、細胞溶解、および架橋された複合体の精製が続く。タンパク質を消化し、精製されたRNAを逆転写し(retrotranscribe)、次世代シーケンシングへ供した。(b)ケトキサール-Dazの分子構造。
発明の詳細な説明
核酸の化学的標識化は、核酸構造、核酸位置、核酸近接情報、転写および翻訳のプロービングのような、様々な適用に極めて有用である。典型的な標識化戦略は、修飾ヌクレオチドがDNA/RNA合成中にポリメラーゼによって酵素的に組み込まれる代謝標識、および、既存のDNA/RNAと反応するために合成小分子を採用する合成後標識を含む。代謝標識は、古いDNA/RNAと新しく合成されたDNA/RNAとを識別し、一方、合成後標識は、異なる微小環境を有するDNA/RNAへの選択性を得ることができる。効率的なDNA/RNAインサイチュ標識化を開発することは、依然として重要な課題ある。
ある態様は、核酸標識試薬としてのN3-ケトキサールまたはその誘導体の開発を目的とする。データは、N3-ケトキサールに基づく核酸標識と次世代シーケンシングとの組み合わせが、ゲノムワイド一本鎖DNAマッピング、インサイチュでのRNAの標識および捕捉、ならびにRNA-RNA近接情報のプロービングを可能にすることを示す。N3-ケトキサール標識化は、空間特異的インサイチュ標識化および超解像イメージング、ならびにRNAへ選択的に結合する小分子についてのスクリーンのような、他の技術と組み合わされる大きな可能性を有する。
一本鎖DNA(ssDNA)形成は、転写、複製、およびDNA二本鎖切断(DSB)のような、様々な生物学的プロセスに関与する。ssDNAのゲノムワイドマッピングは、プロモーター、遺伝子本体、およびエンハンサーでの活性転写の正確かつ有効な捕捉を可能にする。それはエンハンサーをアノテートし、インサイチュで転写バブルを発生させる転写事象を捕捉することができる。
一本鎖DNAおよびDNA:RNAハイブリッドで構成された独特な三本鎖構造は、Rループと命名されている(Santos-Pereira and Aguilera, Nat. Rev. Genet. 16:583-97, 2015)。Rループは、モノクローナル抗体(S9.6)を使用する免疫沈降(Boguslawski et al., J. Immunol. Methods 89:123-30, 1986)または触媒不活性RNアーゼH (Chen et al., Mol. Cell 68:745-57, 2017)によってマッピングされ得る。マッピング結果は、Rループが、生理学的状態および病理学的状態の両方において、ゲノム安定性に影響を与えることができ(Hamperl et al., Cell 170:774-86, 2017)、転写および複製を調節する(Boque-Sastre et al., Proc Natl Acad Sci U S A. 112:5785-90, 2015)ことを解明するのに役立つ。しかし、Rループ中のssDNAのマッピングおよび他のプロセスは、通常、抗体に依存し、かなりの量の生物学的材料を必要とする。本明細書に記載される態様は、ssDNAマッピングを行い、Rループを捕捉することができる。
RNA構造および相互作用ネットワークは、RNA機能と密接な関係があり、従って、関心が高まっている。RNA標識化およびハイスループットシーケンシングの組み合わせはDMS-seq(Strobel et al., Nat. Rev. Genet. 19:615-34, 2018; Rouskin et al., Nature 505:701-05, 2014; Ding et al., Nature 505:696-700, 2014)およびicSHAPE(Spitale et al., Nature 519:486-90, 2015)をもたらし、これらは生細胞中のRNA二次構造のトランスクリプトーム全体の決定を開拓した。RNA架橋および近接ライゲーションは、インビボRNA-RNA相互作用マッピングを可能にする(Ramani et al., Nat. Biotechnol. 33:980-84, 2015; Lu et al., Cell 165:1267-79, 2016; Sharma et al., Mol. Cell 62:618-26, 2016; Aw et al., Mol. Cell 62, 603-17, 2016)。これらの方法は、どのようにRNAが2次元で形作られているか、およびどのようにこれらの構造がRNA機能に影響を与えるかという質問に部分的に答える。
A.標識試薬、ケトキサール誘導体
本明細書に記載されるように、N3-ケトキサール(ケトキサール誘導体を代表する)は、一本鎖DNAおよびRNAにてグアニンと選択的に反応することが示される。これらの反応は、穏やかな標準細胞培養条件下で高効率的であり、組織へ直接適用され得る。細胞ベースの標識化は1、2、3、4、5、6、7、8、9、10分間以内で(1つまたは複数の態様は具体的に除外され得る)完了し得、このプローブを、現在まで当技術分野において見られたことがない独特のプローブとすることが分かった。DNAに対するその反応性は、一本鎖DNAのゲノムワイドマッピングを初めて可能にする。遺伝子コーディング領域上での一本鎖DNAの形成は遺伝子転写と強く相関する。N3-ケトキサール補助RNA標識は、RNA二次構造およびRNA-RNA相互作用決定をもたらす。インビトロおよびインビボでのRNA構造を比較することは、遺伝子翻訳およびRNA結合性タンパク質のような、生細胞中におけるRNA構造ダイナミクスを媒介する因子を同定する。さらに、N3-ケトキサールを他の技術と組み合わせることによる、N3-ケトキサール光制御インサイチュRNA標識、曝露RNAマッピング、単一分子DNA/RNAイメージング、小分子RNA結合剤スクリーニングなどのようなさらなる適用。任意の化学部分が、本明細書に記載される方法を使用して、ケトキサール誘導体上に取り付けられ得る。本発明のいくつかの局面に従う特定の使用の中には、クリックケミストリーハンドルがある。クリックケミストリーハンドルは、クリックケミストリー反応に参加し得る反応基を提供する化学部分である。クリックケミストリー反応およびクリックケミストリー反応のための好適な化学基は、当業者に周知であり、末端アルキン、アジド、歪みアルキン、ジエン、ジエンオフィル、アルコキシアミン、カルボニル、ホスフィン、ヒドラジド、チオール、およびアルケンを含むが、これらに限定されない。例えば、いくつかの態様において、アジドおよびアルキンがクリックケミストリー反応において使用される。ある局面において、「クリックケミストリー適合性」化合物またはクリックケミストリーハンドルは、末端アジド官能基を含む。
Figure 2021523133
ある局面において、Yは、保護チオール、アルケン(TCOを含む)およびテトラジン逆要請型Diels-Alder、テトラゾールフォトクリック反応、ビニルチオエーテルアルキン、アジド、歪みアルキン、ジエン、ジエンオフィル、アルコキシアミン、カルボニル、ホスフィン、ヒドラジド、チオール、およびアルケンより選択されるクリックケミストリー適合性反応基であり;かつ、Xは、リンカー(C1、C2、C3、C4、C4、C5、C6、C7、C8、C9〜C10アルキルまたはそれ以上(1つまたは複数の態様は具体的に除外され得る)、ポリエチレングリコールなど)である。他の局面において、Xは、保護チオール、アルケン(TCOを含む)およびテトラジン逆要請型Diels-Alder、テトラゾールフォトクリック反応、ビニルチオエーテルアルキン、アジド、歪みアルキン、ジエン、ジエンオフィル、アルコキシアミン、カルボニル、ホスフィン、ヒドラジド、チオール、およびアルケンより選択されるクリックケミストリー適合性反応基であり;かつ、Yは、リンカー((C1、C2、C3、C4、C4、C5、C6、C7、C8、C9〜C10アルキルまたはそれ以上(1つまたは複数の態様は具体的に除外され得る)、ポリエチレングリコールなど)である。
特定の官能基および化学用語の定義を下記により詳細に説明する。本発明の目的について、化学元素は、元素周期表、CAS版、Handbook of Chemistry and Physics, 75th Ed.、内表紙に従って特定され、特定の官能基は、その中に記載されるように一般に定義される。加えて、有機化学の一般原則、ならびに特定の官能部分および反応性は、Organic Chemistry, Thomas Sorrell, University Science Books, Sausalito, 1999; Smith and March March's Advanced Organic Chemistry, 5th Edition, John Wiley & Sons, Inc., New York, 2001; Larock, Comprehensive Organic Transformations, VCH Publishers, Inc., New York, 1989; Carruthers, Some Modern Methods of Organic Synthesis, 3rd Edition, Cambridge University Press, Cambridge, 1987に記載されている。
用語「脂肪族」は、本明細書において使用される場合、1つまたは複数の官能基で置換されていてもよい、飽和および不飽和の両方の、非芳香族、直鎖(即ち、非分岐)、分岐、非環式、および環式(即ち、炭素環式)炭化水素を含む。当業者によって認識されるように、「脂肪族」は、アルキル、アルケニル、アルキニル、シクロアルキル、シクロアルケニル、およびシクロアルキニル部分を含むように本明細書において意図されるが、これらに限定されない。従って、本明細書において使用される場合、用語「アルキル」は、直鎖、分岐および環式アルキル基を含む。同様の慣習が「アルケニル」、「アルキニル」などのような他の総称に当てはまる。さらに、本明細書において使用される場合、用語「アルキル」、「アルケニル」、「アルキニル」などは、置換された基および非置換基の両方を包含する。ある態様において、本明細書において使用される場合、「脂肪族」は、1〜20個の炭素原子(C1〜20脂肪族)を有する脂肪族基(環式、非環式、置換、非置換、分岐または非分岐)を示すために使用される。ある態様において、脂肪族基は1〜10個の炭素原子を有する(C1〜10脂肪族)。ある態様において、脂肪族基は1〜6個の炭素原子を有する(C1〜6脂肪族)。ある態様において、脂肪族基は1〜5個の炭素原子を有する(C1〜5脂肪族)。ある態様において、脂肪族基は1〜4個の炭素原子を有する(C1〜4脂肪族)。ある態様において、脂肪族基は1〜3個の炭素原子を有する(C1〜3脂肪族)。ある態様において、脂肪族基は1〜2個の炭素原子を有する(C1〜2脂肪族)。脂肪族基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「アルキル」は、本明細書において使用される場合、単一の水素原子の除去によって、1〜20個の炭素原子を含有する炭化水素部分から誘導された飽和、直鎖または分岐鎖炭化水素ラジカルを指す。いくつかの態様において、本発明において用いられるアルキル基は1〜20個の炭素原子を含有する(C1〜20アルキル)。別の態様において、用いられるアルキル基は1〜15個の炭素原子を含有する(C1〜15アルキル)。別の態様において、用いられるアルキル基は1〜10個の炭素原子を含有する(C1〜10アルキル)。別の態様において、用いられるアルキル基は1〜8個の炭素原子を含有する(C1〜8アルキル)。別の態様において、用いられるアルキル基は1〜6個の炭素原子を含有する(C1〜6アルキル)。別の態様において、用いられるアルキル基は1〜5個の炭素原子を含有する(C1〜5アルキル)。別の態様において、用いられるアルキル基は1〜4個の炭素原子を含有する(C1〜4アルキル)。別の態様において、用いられるアルキル基は1〜3個の炭素原子を含有する(C1〜3アルキル)。別の態様において、用いられるアルキル基は1〜2個の炭素原子を含有する(C1〜2アルキル)。アルキルラジカルの例としては、1つまたは複数の置換基を有し得る、メチル、エチル、n-プロピル、イソプロピル、n-ブチル、iso-ブチル、sec-ブチル、sec-ペンチル、iso-ペンチル、tert-ブチル、n-ペンチル、ネオペンチル、n-ヘキシル、sec-ヘキシル、n-ヘプチル、n-オクチル、n-デシル、n-ウンデシル、ドデシルなどが挙げられるが、これらに限定されない。アルキル基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。用語「アルキレン」は、本明細書において使用される場合、2つの水素原子の除去によって、本明細書に定義されるようなアルキル基から誘導されたビラジカルを指す。アルキレン基は、環式または非環式、分岐または非分岐、置換または非置換であり得る。アルキレン基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「アルケニル」は、本明細書において使用される場合、単一の水素原子の除去によって、少なくとも1つの炭素-炭素二重結合を有する直鎖または分岐鎖炭化水素部分から誘導された一価基を意味する。ある態様において、本発明におい用いられるアルケニル基は、2〜20個の炭素原子を含有する(C2〜20アルケニル)。いくつかの態様において、本発明におい用いられるアルケニル基は、2〜15個の炭素原子を含有する(C2〜15アルケニル)。別の態様において、用いられるアルケニル基は、2〜10個の炭素原子を含有する(C2〜10アルケニル)。さらに他の態様において、アルケニル基は2〜8個の炭素原子を含有する(C2〜8アルケニル)。なお他の態様において、アルケニル基は2〜6個の炭素を含有する(C2〜6アルケニル)。なお他の態様において、アルケニル基は2〜5個の炭素を含有する(C2〜5アルケニル)。なお他の態様において、アルケニル基は2〜4個の炭素を含有する(C2〜4アルケニル)。なお他の態様において、アルケニル基は2〜3個の炭素を含有する(C2〜3アルケニル)。なお他の態様において、アルケニル基は2個の炭素を含有する(C2アルケニル)。アルケニル基としては、例えば、1つまたは複数の置換基を有し得る、エテニル、プロペニル、ブテニル、1-メチル-2-ブテン-1-イルなどが挙げられる。アルケニル基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。用語「アルケニレン」は、本明細書において使用される場合、2つの水素原子の除去によって、本明細書に定義されるようなアルケニル基から誘導されたビラジカルを指す。アルケニレン基は、環式または非環式、分岐または非分岐、置換または非置換であり得る。アルケニレン基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「アルキニル」は、本明細書において使用される場合、単一の水素原子の除去によって、少なくとも1つの炭素-炭素三重結合を有する直鎖または分岐鎖炭化水素から誘導された一価基を指す。ある態様において、本発明において用いられるアルキニル基は、2〜20個の炭素原子を含有する(C2〜20アルキニル)。いくつかの態様において、本発明において用いられるアルキニル基は、2〜15個の炭素原子を含有する(C2〜15アルキニル)。別の態様において、用いられるアルキニル基は、2〜10個の炭素原子を含有する(C2〜10アルキニル)。さらに他の態様において、アルキニル基は2〜8個の炭素原子を含有する(C2〜8アルキニル)。さらに他の態様において、アルキニル基は2〜6個の炭素原子を含有する(C2〜6アルキニル)。さらに他の態様において、アルキニル基は2〜5個の炭素原子を含有する(C2〜5アルキニル)。さらに他の態様において、アルキニル基は2〜4個の炭素原子を含有する(C2〜4アルキニル)。さらに他の態様において、アルキニル基は2〜3個の炭素原子を含有する(C2〜3アルキニル)。さらに他の態様において、アルキニル基は2個の炭素原子を含有する(C2アルキニル)。代表的なアルキニル基としては、1つまたは複数の置換基を有し得る、エチニル、2-プロピニル(プロパルギル)、1-プロピニルなどが挙げられるが、これらに限定されない。アルキニル基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。用語「アルキニレン」は、本明細書において使用される場合、2つの水素原子の除去によって、本明細書に定義されるようなアルキニレン基から誘導されたビラジカルを指す。アルキニレン基は、環式または非環式、分岐または非分岐、置換または非置換であり得る。アルキニレン基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「炭素環式」または「カルボシクリル」は、本明細書において使用される場合、3〜10個の炭素環原子を含有する環式脂肪族基を指す(C3〜10炭素環式)。炭素環式基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「ヘテロ脂肪族」は、本明細書において使用される場合、1つまたは複数の官能基で置換されていてもよく、かつ、炭素原子間に1つまたは複数のヘテロ原子(例えば、酸素、硫黄、窒素、リン、またはケイ素原子)をさらに含有する、飽和および不飽和の両方の、非芳香族、直鎖(即ち、非分岐)、分岐、非環式、環式(即ち、複素環式)、または多環式炭化水素を含む、本明細書に定義されるような、脂肪族部分を指す。ある態様において、ヘテロ脂肪族部分は、1つまたは複数の置換基でのその上の水素原子のうちの1つまたは複数の独立した置き換えによって置換される。当業者によって認識されるように、「ヘテロ脂肪族」は、ヘテロアルキル、ヘテロアルケニル、ヘテロアルキニル、ヘテロシクロアルキル、ヘテロシクロアルケニル、およびヘテロシクロアルキニル部分を含むように本明細書において意図されるが、これらに限定されない。従って、用語「ヘテロ脂肪族」は、用語「ヘテロアルキル」、「ヘテロアルケニル」、「ヘテロアルキニル」などを含む。さらに、本明細書において使用される場合、用語「ヘテロアルキル」、「ヘテロアルケニル」、「ヘテロアルキニル」などは、置換された基および非置換基の両方を包含する。ある態様において、本明細書において使用される場合、「ヘテロ脂肪族」は、1〜20個の炭素原子および1〜6個のヘテロ原子(C1〜20ヘテロ脂肪族)を有するヘテロ脂肪族基(環式、非環式、置換、非置換、分岐または非分岐)を示すために使用される。ある態様において、ヘテロ脂肪族基は、1〜10個の炭素原子および1〜4個のヘテロ原子を含有する(C1〜10ヘテロ脂肪族)。ある態様において、ヘテロ脂肪族基は、1〜6個の炭素原子および1〜3個のヘテロ原子を含有する(C1〜6ヘテロ脂肪族)。ある態様において、ヘテロ脂肪族基は、1〜5個の炭素原子および1〜3個のヘテロ原子を含有する(C1〜5ヘテロ脂肪族)。ある態様において、ヘテロ脂肪族基は、1〜4個の炭素原子および1〜2個のヘテロ原子を含有する(C1〜4ヘテロ脂肪族)。ある態様において、ヘテロ脂肪族基は、1〜3個の炭素原子および1個のヘテロ原子を含有する(C1〜3ヘテロ脂肪族)。ある態様において、ヘテロ脂肪族基は、1〜2個の炭素原子および1個のヘテロ原子を含有する(C1〜2ヘテロ脂肪族)。ヘテロ脂肪族基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「ヘテロアルキル」は、本明細書において使用される場合、炭素原子間に1つまたは複数のヘテロ原子(例えば、酸素、硫黄、窒素、リン、またはケイ素原子)を含有する、本明細書に定義されるような、アルキル部分を指す。ある態様において、ヘテロアルキル基は、1〜20個の炭素原子および1〜6個のヘテロ原子を含有する(C1〜20ヘテロアルキル)。ある態様において、ヘテロアルキル基は、1〜10個の炭素原子および1〜4個のヘテロ原子を含有する(C1〜10ヘテロアルキル)。ある態様において、ヘテロアルキル基は、1〜6個の炭素原子および1〜3個のヘテロ原子を含有する(C1〜6ヘテロアルキル)。ある態様において、ヘテロアルキル基は、1〜5個の炭素原子および1〜3個のヘテロ原子を含有する(C1〜5ヘテロアルキル)。ある態様において、ヘテロアルキル基は、1〜4個の炭素原子および1〜2個のヘテロ原子を含有する(C1〜4ヘテロアルキル)。ある態様において、ヘテロアルキル基は、1〜3個の炭素原子および1個のヘテロ原子を含有する(C1〜3ヘテロアルキル)。ある態様において、ヘテロアルキル基は、1〜2個の炭素原子および1個のヘテロ原子を含有する(C1〜2ヘテロアルキル)。用語「ヘテロアルキレン」は、本明細書において使用される場合、2つの水素原子の除去によって、本明細書に定義されるようなヘテロアルキル基から誘導されたビラジカルを指す。ヘテロアルキレン基は、環式または非環式、分岐または非分岐、置換または非置換であり得る。ヘテロアルキレン基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「ヘテロアルケニル」は、本明細書において使用される場合、炭素原子間に1つまたは複数のヘテロ原子(例えば、酸素、硫黄、窒素、リン、またはケイ素原子)をさらに含有する、本明細書に定義されるような、アルケニル部分を指す。ある態様において、ヘテロアルケニル基は、2〜20個の炭素原子および1〜6個のヘテロ原子を含有する(C2〜20ヘテロアルケニル)。ある態様において、ヘテロアルケニル基は、2〜10個の炭素原子および1〜4個のヘテロ原子を含有する(C2〜10ヘテロアルケニル)。ある態様において、ヘテロアルケニル基は、2〜6個の炭素原子および1〜3個のヘテロ原子を含有する(C2〜6ヘテロアルケニル)。ある態様において、ヘテロアルケニル基は、2〜5個の炭素原子および1〜3個のヘテロ原子を含有する(C2〜5ヘテロアルケニル)。ある態様において、ヘテロアルケニル基は、2〜4個の炭素原子および1〜2個のヘテロ原子を含有する(C2〜4ヘテロアルケニル)。ある態様において、ヘテロアルケニル基は、2〜3個の炭素原子および1個のヘテロ原子を含有する(C2〜3ヘテロアルケニル)。用語「ヘテロアルケニレン」は、本明細書において使用される場合、2つの水素原子の除去によって、本明細書に定義されるようなヘテロアルケニル基から誘導されたビラジカルを指す。ヘテロアルケニレン基は、環式または非環式、分岐または非分岐、置換または非置換であり得る。
用語「ヘテロアルキニル」は、本明細書において使用される場合、炭素原子間に1つまたは複数のヘテロ原子(例えば、酸素、硫黄、窒素、リン、またはケイ素原子)をさらに含有する、本明細書に定義されるような、アルキニル部分を指す。ある態様において、ヘテロアルキニル基は、2〜20個の炭素原子および1〜6個のヘテロ原子を含有する(C2〜20ヘテロアルキニル)。ある態様において、ヘテロアルキニル基は、2〜10個の炭素原子および1〜4個のヘテロ原子を含有する(C2〜10ヘテロアルキニル)。ある態様において、ヘテロアルキニル基は、2〜6個の炭素原子および1〜3個のヘテロ原子を含有する(C2〜6ヘテロアルキニル)。ある態様において、ヘテロアルキニル基は、2〜5個の炭素原子および1〜3個のヘテロ原子を含有する(C2〜5ヘテロアルキニル)。ある態様において、ヘテロアルキニル基は、2〜4個の炭素原子および1〜2個のヘテロ原子を含有する(C2〜4ヘテロアルキニル)。ある態様において、ヘテロアルキニル基は、2〜3個の炭素原子および1個のヘテロ原子を含有する(C2〜3ヘテロアルキニル)。用語「ヘテロアルキニレン」は、本明細書において使用される場合、2つの水素原子の除去によって、本明細書に定義されるようなヘテロアルキニル基から誘導されたビラジカルを指す。ヘテロアルキニレン基は、環式または非環式、分岐または非分岐、置換または非置換であり得る。
用語「複素環式」、「ヘテロ環」、または「ヘテロシクリル」は、本明細書において使用される場合、環式ヘテロ脂肪族基を指す。複素環式基は、非芳香族、部分的不飽和または完全飽和、3〜10員の環系を指し、これは、サイズが3〜8原子の単環、ならびに二および三環式環系を含み、これは、非芳香環へ縮合された芳香族5または6員アリールまたはヘテロアリール基を含み得る。これらの複素環は、酸素、硫黄、および窒素より独立して選択される1〜3個のヘテロ原子を有するものを含み、ここで、窒素および硫黄ヘテロ原子は任意で酸化されていてもよく、窒素ヘテロ原子は任意で四級化されていてもよい。ある態様において、複素環式という用語は、非芳香族5-、6-、もしくは7員環または多環式基を指し、ここで、少なくとも1つの環原子は、O、S、およびN(ここで、窒素および硫黄ヘテロ原子は任意で酸化されていてもよい)より選択されるヘテロ原子であり、残りの環原子は炭素であり、ラジカルは環原子のいずれかを介して分子の残りへ連結される。ヘテロシクリル基としては、酸素、硫黄、および窒素より独立して選択される1〜3個のヘテロ原子を有する縮合された5、6、または7員環を含む、二または三環式基が挙げられるが、これらに限定されず、ここで、(i)各5員環は0〜2個の二重結合を有し、各6員環は0〜2個の二重結合を有し、各7員環は0〜3個の二重結合を有し、(ii)窒素および硫黄ヘテロ原子は任意で酸化されていてもよく、(iii)窒素ヘテロ原子は任意で四級化されていてもよく、かつ、(iv)上記複素環のいずれもがアリールまたはヘテロアリール環へ縮合されていてもよい。例示的なヘテロ環としては、1つまたは複数の置換基を有し得る、アザシクロプロパニル、アザシクロブタニル、1,3-ジアザチジニル(1,3-diazatidinyl)、ピペリジニル、ピペラジニル、アゾカニル(azocanyl)、チアラニル(thiaranyl)、チエタニル、テトラヒドロチオフェニル、ジチオラニル、チアシクロヘキサニル、オキシラニル、オキセタニル、テトラヒドロフラニル、テトラヒドロプラニル、ジオキサニル、オキサチオラニル、モルホリニル、チオキサニル、テトラヒドロナフチルなどが挙げられる。置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「アリール」は、本明細書において使用される場合、全ての環原子が炭素であり、置換または非置換であり得る、3〜20個の環原子を有する芳香族単環式または多環式環系を指す。本発明のある態様において、「アリール」は、1、2、または3個の芳香環を有する単環式、二環式、または三環式C4〜C20芳香族環系を指し、これらとしては、1つまたは複数の置換基を有し得る、フェニル、ビフェニル、ナフチルなどが挙げられるが、これらに限定されない。アリール置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。用語「アリーレン」は、本明細書において使用される場合、2つの水素原子の除去によって、本明細書に定義されるようなアリール基から誘導されたアリールビラジカルを指す。アリーレン基は置換または非置換であり得る。アリーレン基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。加えて、アリーレン基は、本明細書に定義されるような、アルキレン、アルケニレン、アルキニレン、ヘテロアルキレン、ヘテロアルケニレン、またはヘテロアルキニレン基中へリンカー基として組み入れられ得る。
用語「ヘテロアリール」は、本明細書において使用される場合、3〜20個の環原子を有する芳香族単環式または多環式環系を指し、これらのうちの1つの環原子がS、O、およびNより選択され;0、1、または2個の環原子が、S、O、およびNより独立して選択される追加のヘテロ原子であり;かつ、残りの環原子が炭素であり、ラジカルは環原子のいずれかを介して分子の残りへ連結される。ヘテロアリールの例としては、1つまたは複数の置換基を有し得る、ピロリル、ピラゾリル、イミダゾリル、ピリジニル、ピリミジニル、ピラジニル、ピリダジニル、トリアジニル、テトラジニル、ピロリジニル、インドリル、キノリニル、イソキノリニル、ベンゾイミダゾリル、インダゾリル、キノリニル、イソキノリニル、キノリジニル、シンノリニル、キナゾリニル、フタラジニル、ナフトリジニル、キノキサリニル、チオフェニル、チアナフテニル、フラニル、ベンゾフラニル、ベンゾチアゾリル、チアゾリニル、イソチアゾリル、チアジアゾリニル)、オキサゾリル、イソオキサゾリル、オキサジアジオリル、オキサジアジオリルなどが挙げられるが、これらに限定されない。ヘテロアリール置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。用語「ヘテロアリーレン」は、本明細書において使用される場合、2つの水素原子の除去によって、本明細書に定義されるようなヘテロアリール基から誘導されたビラジカルを指す。ヘテロアリーレン基は置換または非置換であり得る。加えて、ヘテロアリーレン基は、本明細書に定義されるような、アルキレン、アルケニレン、アルキニレン、ヘテロアルキレン、ヘテロアルケニレン、またはヘテロアルキニレン基中へリンカー基として組み入れられ得る。ヘテロアリーレン基置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「アシル」は、本明細書において使用される場合、置換アルキル基のサブセットであり、一般式-C(=O)RA、-C(=O)ORA、-C(=O)-O-C(=O)RA、-C(=O)SRA、-C(=O)N(RA)2、-C(=S)RA、-C(=S)N(RA)2、および-C(=S)S(RA)、-C(=NRA)RA、-C(=NRA)ORA、-C(=NRA)SRA、および-C(=NRA)N(RA)2を有する基を指し、式中、RAは、水素;ハロゲン;置換もしくは非置換ヒドロキシル;置換もしくは非置換チオール;置換もしくは非置換アミノ;アシル;置換されていてもよい脂肪族;置換されていてもよいヘテロ脂肪族;置換されていてもよいアルキル;置換されていてもよいアルケニル;置換されていてもよいアルキニル;置換されていてもよいアリール、置換されていてもよいヘテロアリール、脂肪族オキシ、ヘテロ脂肪族オキシ、アルキルオキシ、ヘテロアルキルオキシ、アリールオキシ、ヘテロアリールオキシ、脂肪族チオキシ、ヘテロ脂肪族チオキシ、アルキルチオキシ、ヘテロアルキルチオキシ、アリールチオキシ、ヘテロアリールチオキシ、モノ-もしくはジ-脂肪族アミノ、モノ-もしくはジ-ヘテロ脂肪族アミノ、モノ-もしくはジ-アルキルアミノ、モノ-もしくはジ-ヘテロアルキルアミノ、モノ-もしくはジ-アリールアミノ、またはモノ-もしくはジヘテロアリールアミノであり;または、2つのRAが、一緒になって、5〜6員の複素環を形成する。例示的なアシル基としては、アルデヒド(-CHO)、カルボン酸(-CO2H)、ケトン、ハロゲン化アシル、エステル、アミド、イミン、カーボネート、カルバメート、および尿素が挙げられる。アシル置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「アシレン」は、本明細書において使用される場合、置換アルキレン、置換アルケニレン、置換アルキニレン、置換ヘテロアルキレン、置換ヘテロアルケニレン、または置換ヘテロアルキニレン基のサブセットであり、一般式-R0-(C=X1)-R0-、-R-X2(C=X1)-R0-、または-R0-X2(C=X1)X3-R0-を有するアシル基を指し、式中、X1、X2、およびX3は、独立して、酸素、硫黄、またはNRrであり、ここで、Rrは、水素または置換されていてもよい脂肪族であり、R0は、本明細書に定義されるような、置換されていてもよいアルキレン、アルケニレン、アルキニレン、ヘテロアルキレン、ヘテロアルケニレン、またはヘテロアルキニレン基である。R0がアルキレンである例示的なアシレン基としては、1つまたは複数の置換基を有し得る、-(CH2)T-O(C=O)-(CH2)T-;-(CH2)T-NRr(C=O)-(CH2)T-;-(CH2)T-O(C=NRr)-(CH2)T-;-(CH2)T-NRr(C=NRr)-(CH2)T-;-(CH2)T-(C=O)-(CH2)T-;-(CH2)T-(C=NRr)-(CH2)T-;-(CH2)T-S(C=S)-(CH2)T-;-(CH2)T-NRr(C=S)-(CH2)-;-(CH2)T-S(C=NRr)-(CH2)T-;-(CH2)T-O(C=S)-(CH2)T-;-(CH2)T-(C=S)-(CH2)T-;または-(CH2)T-S(C=O)-(CH2)T-などが挙げられ;ここで、Tの各例は、独立して、0〜20の整数である。アシレン置換基としては、安定した部分の形成をもたらす、本明細書に記載される置換基のいずれもが挙げられるが、これらに限定されない。
用語「アミノ」は、本明細書において使用される場合、式(-NH2)の基を指す。「置換アミノ」は、一置換アミン(-NHRh)または(of)二置換アミン(-NRh2)のいずれかを指し、ここで、Rh置換基は、安定した部分の形成をもたらす本明細書に記載されるような任意の置換基である(例えば、アミノ保護基;脂肪族、アルキル、アルケニル、アルキニル、ヘテロ脂肪族、複素環式、アリール、ヘテロアリール、アシル、アミノ、ニトロ、ヒドロキシル、チオール、ハロ、脂肪族アミノ、ヘテロ脂肪族アミノ、アルキルアミノ、ヘテロアルキルアミノ、アリールアミノ、ヘテロアリールアミノ、アルキルアリール、アリールアルキル、脂肪族オキシ、ヘテロ脂肪族オキシ、アルキルオキシ、ヘテロアルキルオキシ、アリールオキシ、ヘテロアリールオキシ、脂肪族チオキシ、ヘテロ脂肪族チオキシ、アルキルチオキシ、ヘテロアルキルチオキシ、アリールチオキシ、ヘテロアリールチオキシ、アシルオキシなど;これらの各々はさらに置換されても置換されなくてもよい)。ある態様において、二置換アミノ基(-NRh2)のRh置換基は、5〜6員の複素環を形成する。
用語「ヒドロキシ」または「ヒドロキシル」は、本明細書において使用される場合、式(-OH)の基を指す。「置換ヒドロキシル」は、式(-ORi)の基を指し、式中、Riは、安定した部分をもたらす任意の置換基であり得る(例えば、ヒドロキシル保護基;脂肪族、アルキル、アルケニル、アルキニル、ヘテロ脂肪族、複素環式、アリール、ヘテロアリール、アシル、ニトロ、アルキルアリール、アリールアルキルなど;これらの各々はさらに置換されても置換されなくてもよい)。
用語「チオ」または「チオール」は、本明細書において使用される場合、式(-SH)の基を指す。「置換チオール」は、式(-SRr)の基を指し、式中、Rrは、安定した部分の形成をもたらす任意の置換基であり得る(例えば、チオール保護基;脂肪族、アルキル、アルケニル、アルキニル、ヘテロ脂肪族、複素環式、アリール、ヘテロアリール、アシル、スルフィニル、スルホニル、シアノ、ニトロ、アルキルアリール、アリールアルキルなど;これらの各々はさらに置換されても置換されなくてもよい)。
用語「イミノ」は、本明細書において使用される場合、式(=NRr)の基を指し、式中、Rrは、水素、または、安定した部分の形成をもたらす、本明細書に定義されるような任意の置換基に対応する(例えば、アミノ保護基;脂肪族、アルキル、アルケニル、アルキニル、ヘテロ脂肪族、複素環式、アリール、ヘテロアリール、アシル、アミノ、ヒドロキシル、アルキルアリール、アリールアルキルなど;これらの各々はさらに置換されても置換されなくてもよい)。
用語「アジド(azide)」または「アジド(azido)」は、本明細書において使用される場合、式(-N3)の基を指す。
用語「ハロ」および「ハロゲン」は、本明細書において使用される場合、フッ素(フルオロ、-F)、塩素(クロロ、-Cl)、臭素(ブロモ、-Br)、およびヨウ素(ヨード、-I)より選択される原子を指す。
ケトキサール誘導体の合成
ケトキサールおよびその類似体は、1950年代以来、RNAウイルスと反応しこれを不活性化することが初めて報告された(Staehelin, Biochimca Biophysica Acta 31:448-54, 1959)。ケトキサールの1,2-ジカルボニル基はグアニンに対して高特異性を示し、このため、それはRNA二次構造のプロービングにおいて非常に有用である。さらに、他のケトキサール誘導体、例えば、ケトキサールビス(チオセミカルバゾン)(KTS)(Booth and Sartorelli, Nature 210:104-5, 1966)は有望な抗癌活性を示し、ビケトキサール(Brewer et al., Biochemistry 22:4303-9, 1983)は、インタクトなリボソーム30Sおよび50Sサブユニット内のRNAおよびタンパク質を架橋する能力を示した。しかし、ケトキサールおよびその誘導体の合成はめったに報告されないことは驚くべきである。文献のレビューは、ケトキサール調製は、二酸化セレンによる酸化、続いての減圧蒸留による精製に大部分は基づいたことを示す(Brewer et al., Biochemistry 22:4303-9, 1983; Tiffany et al., Journal of the American Chemical Society 79:1682-87, 1957; Lo et al., Journal of Labelled Compounds and Radiopharmaceuticals 44:S654-S656, 2001)。この方法はいくつかの制限を有する。第一に、金属酸化反応は常に副生成物を生じさせる。第二に、過剰なセレンは除去するが困難であった。第三に、他の官能基を有するケトキサール誘導体の合成は困難であり、何故ならば、官能基を有する試薬は、還流条件下で二酸化セレンと共には存続しない場合があるためである。例えば、研究は、アジド-およびチオール-修飾ケトキサールが二酸化セレン酸化によっては調製できないことを示す。最後に、減圧蒸留精製は、高分子量を有するケトキサール誘導体に適していない。
グリオキサールおよびその類似体は空気に敏感であり、従って、クロマトグラフィーによって精製することができない(Jiang et al., Organic Letters 3:4011-13, 2001)。新たに調製されたジメチルジオキシラン(DMD)によるジアゾケトンの穏やかな酸化は、定量的収率でグリオキサール官能基を生成することができる(Jiang et al., Organic Letters 3:4011-13, 2001)。この研究において、アジド-ケトキサールは、3ステップ合成(スキームS1)に従う新規の合成戦略によって調製された。合成プロセスの利点は、その操作のしやすさ、および高収率である。その上、この戦略はまた、様々な官能基を有する他のケトキサール誘導体の調製に都合が良い。
Figure 2021523133
スキームS1 - 様々な官能基(R基)からのケトキサール誘導体の合成
B.ケトキサール誘導体適用および使用
N3-ケトキサールは一本鎖DNAおよびRNA中のグアニンと反応する
ケトキサール(1,1-ジヒドロキシ-3-エトキシ-2-ブタノン)は、ワトソン-クリック界面にて特にN1およびN2位でグアニンと反応することが公知である(Shapiro et al., Biochemistry 8:238-45, 1969)。合成における課題に起因して、以前、ケトキサールはさらに官能化されず、核酸標識へ広く適用されてこなかった。N3-ケトキサール(図1a)の開発を本明細書に記載し、これは、その親分子からグアニンに対する反応性を受け継ぐだけでなく、「クリック」ケミストリーを通してさらに官能化される生体直交型ハンドルとして役立つアジド基も含有する。MALDI-TOF分析を用いて、N3-ケトキサールはRNA上のグアニンを効率的に標識し、一方、他の塩基において反応性は観察されなかったことが示された。ゲル電気泳動を使用することによって、一本鎖DNA/RNAに対するN3-ケトキサールの選択性がさらに実証された。N3-ケトキサールと共のインキュベーション後、ゲル上の一本鎖RNAにおいてシフトが観察され、これはRNA-ケトキサール複合体の形成を示しており、一方、二本鎖RNAではそのようなシフトは検出されなかった。N3-ケトキサールは高細胞浸透性であり、5分以内に生細胞中のDNAおよびRNAを標識することができることも示され、このためそれはさらなる適用に適している。
1.インビボでのトランスクリプトーム全体のRNA構造マッピングのためのKeth-seq
N3-ケトキサール分子(図1a)は、一本鎖RNA(ssRNA)中のグアニンのワトソン-クリック界面でのN1およびN2位の特異的標識化についての要件を満たす;上記を参照のこと。ケトキサールは、ケトキサール誘導体の合成における課題に部分的に起因して、トランスクリプトーム全体のプロービングについてさらに修飾されたことがなく;多くの官能基がケトキサール合成の比較的厳しい条件に耐えることができなかった。本明細書に記載される新しい合成スキーム設計を用いて、アジド-ケトキサール(N3-ケトキサール)は、市販の出発原料から3ステップで首尾よく調製することができる。アジド基は、ビオチンまたは濃縮もしくは他の適用のための任意の色素で容易に修飾され得る生体直交型ハンドルを提供する(Spitale et al. Nature 519:486-90, 2015)。さらに、アルカリ性または加熱条件下でのケトキサール-グアニン付加物の可逆性は公知であり(Xu and Culver, Method. Enzymol. 468:147-65, Academic Press, 2009)、ケトキサール標識の除去後にリードスルー対照を生成することを介してRT停止に基づくRNA構造マッピングにおける追加の利点を提供する。
先ず、N3-ケトキサールは、以下の実験結果によればRNA構造マッピングの能力があることが示される。N3-ケトキサールはssRNA中のグアニンとのみ反応し、他の核塩基では不活性である(図1a、1b;図8)。RNAオリゴ中の全てのグアニンが、MALDI-TOF分析によればN3-ケトキサールによって標識された(図1c)。比較すると、プローブは、一般的に使用されるSHAPE試薬、NAIよりも高い標識活性を有することが分かった(図9)。ゲル電気泳動、ドットブロット、および質量スペクトル実験によって容易に観察され得るように、修飾は銅フリークリックケミストリーによってビオチン化された(図1dおよび図10)。ビオチン化は、次いで、ストレプトアビジンコンジュゲート化ビーズによって修飾ヌクレオチドを濃縮するために使用され得、これは信号対雑音比を増加するように設計されている。他のグリオキサール誘導体と同様に、N3-ケトキサールは細胞膜に侵入することができ、これはインビボRNA構造検出の実行可能性のために重要である。インビボ標識効率は、細胞に対していかなる事前操作もなしで、生きているマウス胚性幹細胞(mESC)の培養培地中へのN3-ケトキサールの直接添加を通じて評価した。異なる期間でのN3-ケトキサールでの処理後、RNAを単離し、ビオチン化を行うためにクリック反応を続けた。ドットブロットアッセイは、N3-ケトキサールが1分間インキュベーション中でさえ効率的に生細胞に浸透することができたことを示した。シグナルは、インキュベーションの5分間以内で飽和となり、これは、N3-ケトキサールの迅速な細胞侵入および標識効率を示唆している(図1e)。ハイスループットシーケンシング結果はこの現象を確認し、これは、G停止部位が1分間から5分間インキュベーションへ向かって増加していることを示している(図11)。迅速な標識能力は、N3-ケトキサールが、長時間インキュベーションに耐えることができないストレス反応、細胞周期振動などのような高速事象において使用され得ることを示唆している。
ケトキサール-グアニン付加物はアルカリ性条件下で不安定であるため(図1a)、この標識付加物は、追加のリードスルー対照を提供するための有用なインジケーターであり得、これは、酵素ターンオーバーによる偽のRT停止部位またはランダムなRNA断片末端を除去するのに役立ち得る。過剰なグアニンモノマーを添加して解離N3-ケトキサールを捕捉することによってN3-ケトキサール修飾を完全に逆転させるするために、条件を最適化し、これは、中性緩衝液中でかつより短い期間内にN3-ケトキサール-RNA付加物から未修飾RNAへ平衡をシフトさせる(図12a)。過剰なGTPは、37℃で6時間以内に(図12b)または95℃で10分間以内に(図1f、図12c)、標識RNA上のN3-ケトキサール修飾をほぼ完全に除去することができた。N3-ケトキサール標識RNAはまた、以前報告されたように、ホウ酸緩衝液中で安定化され得(図13)、これは、RNA上のN3-ケトキサール付加物を操作するための柔軟性を提供する。
N3-ケトキサールプロービングをディープシーケンシングと組み合わせ、Keth-seqを確立し、マウスES細胞中のRNA二次構造を測定した(図7a)。各実験において、3つの異なるRNAライブラリーを構築した:N3-ケトキサールサンプルは、N3-ケトキサール修飾を有するRNAから生成される;N3-ケトキサール-除去サンプルは、ライブラリー構築中の逆転写(RT)工程前にN3-ケトキサール標識を消去することによって作製される;および、第3の未処理対照サンプルは、N3-ケトキサール修飾の効率を評価するためのインタクトなRNAに由来する。リード存在度およびRT停止分布を、2つのレプリケート間で比較した。高い相関性がRPKM(図14a)およびRTレベル(図7b)の両方で観察され、これは本発明者らのシーケンシングデータの高い品質を示している。加えて、N3-ケトキサールサンプルについて、グアニン(>80%)は全てのリードの中でRT停止部位を支配し、しかし、未処理対照サンプルは4つ全ての塩基にわたってRT停止バイアスを示さなかった(図14b)。結果は、N3-ケトキサール分子はグアニンのみを修飾することを確認した。N3-ケトキサール-除去サンプル(N3-ケトキサール修飾を消去する)からの結果は、このサンプルのグアニンにおけるRT停止リードが、未処理対照と同様のレベルまで劇的に減少したことを示し、これは、N3-ケトキサール修飾が逆転プロセスにおいてほぼ完全に除去されたことを示している(図14b)。プルダウン後の修飾N3-ケトキサール分子の完全な消去は、真のRT停止部位を回復させることができ、これは、Keth-seqについての潜在的によりよく一致したバックグラウンドを提供する。実際、ミトコンドリアATPシンターゼ膜サブユニット8をコードする、mRNA mt-Atp8は、未処理対照サンプルおよびN3-ケトキサール処理サンプルと比較して、N3-ケトキサール-除去サンプルにおいてより多くの完全長RNA断片を示したことが認められ、これは、RT停止部位が、対照としてN3-ケトキサール-除去サンプルを使用して、より確信して同定され得ることを示唆している(図15)。
Keth-seqを立証するために、Keth-seqからのグアニンシグナルを、icSHAPEと比較し、トランスクリプトームレベルで解析した。各転写物についてのピアソン相関係数を、Keth-seqおよびicSHAPE技術間で全てのグアニンシグナルに基づいて計算した。転写物の約80%が正相関を示し(ピアソン相関係数 >= 0.4、図7c)、これは、Keth-seqが、確立されたicSHAPE技術とよく合致することを示している。RNA構造を決定することにおけるKeth-seqのより直接的な評価のために、18SリボソームRNAの反応性プロフィールを、RNA STRANDデータベース(id: CRW_00356)からの構造モデルと比較した。N3-ケトキサールはグアニンのみを修飾するので、全てのグアニン塩基が保持され、構造モデルに基づいて正確度を測定した。それは、Keth-seq反応性プロフィールは、18SリボソームRNAのモデルと高度に一致していることを示す(AUC = 0.81) (図7d)。さらに、Keth-seqを適用し、マウスES細胞についてインビボおよびインビトロの両方でRNA構造をプローブした。GINI指数を使用し、RNAが、より構造化されているかまたはあまり構造化されていないかどうかを測定した。GINI指数が高いほど、RNAはより構造化されている。以前の知見と一致して、本発明者らは、インビトロでのRNAはそのインビボと比べて全体的により構造化されていることを観察し(図14c)、従って、細胞RNAのフォールディング複雑性およびインビボ検出のためにKeth-seqが実行可能であることを立証している。
インビボでのRNA G-四重鎖(rG4)の特徴付けは困難なままである。グアニンに対するその高い特異性から、rG4構造は、N3-ケトキサールがプローブするためのよい対象である。免疫蛍光イメージングに基づいて、PDS処理が細胞内部でrG4の形成を誘導し得ることが報告された。細胞内部でPDSによって誘導されたrG4構造を同定する能力について、Keth-seqを試験した。Keth-seqライブラリーを、PDS処理有りまたは無しで、HeLa細胞から単離されたmRNAを使用して調製した。以前に同定されたrG4構造領域(インビトロプロービングからn = 13,423)を、Keth-seqデータにおいて解析し、潜在的な二次構造を有する何百もの領域を検出した(図14d)。さらに、PDSおよび対照サンプルを比較し、両方のサンプル中のrG4の形成を伴う105個の領域が明らかとなった(図16において2つのケース)。インビボでrG4を形成する領域はより二本鎖化されているため、それらの構造をGINI指数によって比較した。概して、PDSサンプルは対照サンプルよりも高いGINI指数を有し、これは、いくつかのインビトロrG4領域はPDS処理下でより構造化されており、従って、インビボでrG4構造を潜在的に形成することを示唆している(図7e)。2つの例を含め、ここで、PDSサンプル中の規定rG4領域中のシグナルは、対照サンプル中のそれよりも低い(図7f)。
要約すれば、N3-ケトキサールはRNAを容易に標識し、優れた細胞浸透性を有することが示された。生物細胞中におけるトランスクリプトーム全体のRNA二次構造マッピングのための新しい方法としてKeth-seqが確立された。一本鎖RNA中のグアニンに対するN3-ケトキサールの高い選択性および反応性という理由から、Keth-seqは、PDSによって誘導された細胞内部の潜在的なrG4領域を発見することができる。しかし、本明細書中の知見は、PDS誘導によるrG4構造形成にのみ注目した。
2.一本鎖DNAマッピング(ssDNA-seq)
N3-ケトキサールはゲノムワイド一本鎖DNAマッピング(ssDNA-seq)を可能にする
一本鎖核酸に対するN3-ケトキサールの感受性および選択性の利点を活かし、本発明者らは、先ず、ゲノムの一本鎖領域をマッピングするためにN3-ケトキサールを適用し、これは以前に達成されたことがなかった。採取前に、標識化を促進するために、ヒト胎児由来腎臓(HEK)細胞を、10分間N3-ケトキサール含有培地中で培養した。ゲノムDNAを次いで精製し、「クリック」ケミストリーを通じてビオチン化反応へ供した。ビオチン化DNAを精製し、断片化し、続いてストレプトアビジンコートビーズで免疫沈降した。濃縮されたDNAおよびそれらの対応のインプットを使用してライブラリーを作製し、これを次いで配列決定および整列させた。
独立したssDNA-seqライブラリーは高い一致を示した(R2= 0.97、図2a)。40,000を超えるピークが両方のレプリケートにおいて検出され、レプリケート間で70%を超える(33,041)重複があった(図2b)。マッピングされたリードは、遺伝子コーディング領域で濃縮され、遺伝子間領域で相対的に激減した(図2c)。さらに、ssDNAリードは、転写開始点(TSS)付近で鋭く強いピークを形成し;対照的に、遺伝子本体でのピークはより弱く、均一に分布しており;広範なピークが遺伝子の3’末端付近に形成し、+1.5 kbで最大値を伴い、転写終了点(TES)で少し低下した(図2d)。
遺伝子コーディング領域でのssDNAピークの濃縮および独特な分布パターンは、転写とのその相関性をもっと詳しく検証することを促した。本発明者らは、遺伝子コーディング領域上のssDNAピークを、他の転写関連アッセイによって明らかにされたピーク、ならびに転写状態を規定するPol IIおよびヒストン修飾と比較した。ssDNAピークは、グローバルランオンシーケンシング(GRO-seq)(Core et al., Science 322:1845-48, 2008)およびPol II ChIP-seqによって検出されたピークと正に相関することが示された(図2d、2e)。具体的には、近位プロモーター領域でのssDNAピークは、RループおよびH3K4me3とよく重複し、一方、遺伝子本体でのピークは、活性伸長マークH3K36me3と重複する(図2d、2e)。ヒストン修飾の遺伝子位置を正確に示す、トランスポザーゼ-アクセシブルクロマチン使用シーケンシング(ATAC-seq)(Buenrostro et al., Nat. Methods. 10:1213-18, 2013)を、ヒストン修飾とのそれらの相関性についてssDNA-seqと比較した。ssDNA-seqは、H3K4me3、H3K36me3およびH3K27acのような、活性転写をマークするヒストン修飾とATAC-seqよりもよく相関したが、ヘテロクロマチンマークH3K9me3との弱い相関を示した(図2f)。まとめると、これらの結果は、遺伝子コーディング領域上のssDNAピークが転写状態と相関することを示している。
ssDNA-seqは広範囲の転写ダイナミクスを明らかにする
ssDNA形成および転写間の関係を立証するために、同じ細胞株に対してRNA-seqを行い、全ての発現遺伝子をそれらのRNAレベルに従って3つの群に分類した(高、中および低、図3a)。ssDNAピークは、中または低RNAレベルを有するものと比べて、高RNAレベルを有する遺伝子において有意により強いと分かった(図3b)。RNA-seqは定常状態RNAレベルのみを反映し、しかしリアルタイム転写状態を明らかにすることができないため、次の2つのPol II阻害剤、トリプトライドおよび5,6-ジクロロ-1-β-D-リボフラノシルベンゾイミダゾール(DRB)を適用して、対応のssDNA変化を研究した。トリプトライドはPol II分解を誘発し、一方、DRBは、Pol II CTD脱リン酸化を阻害し、従って、Pol II伸長を妨げる(Bensaude, Transcription 2:103-08, 2011)。DRB処理後、ssDNAピーク数は、43,000超から約16,000へ減少した(図3c)。より強いピークがTSSで観察され、一方、遺伝子本体およびTES上のピークは排除され、これは、増加したPol II休止および弱いPol II伸長と一致する(図3d)。トリプトライドは、約3,700への劇的なssDNAピーク数減少をもたらした(図3c)。予想通りに、遺伝子コーディング領域上の大部分のピークが、全体的なPol II分解に起因して消滅した(図3d)。
これらの結果は、遺伝子コーディング領域上のssDNAは、Pol II誘導DNA二本鎖開放のアウトカムであることを立証した。ssDNAピークの強さはPol II密度を明らかにする。TSS付近の強く鋭いピークはPol II休止を示し;遺伝子本体での弱く、均一に分布したリードはPol II伸長を示し;3’末端付近の広範なピークはプレ終止およびポリ(A)切断を示す。これらの結果は、ssDNAプロフィールが、4つのクラスへの遺伝子の転写状態の決定を可能にすることを示す:クラスI、活性かつ休止;クラスII、不活性かつ休止;クラスIII、活性かつ非休止;クラスIV、不活性かつ非休止(図3e)。
エンハンサーのごく一部が一本鎖であり、一方、残りは一本鎖でないことも認められた。これらの「一本鎖エンハンサー」は転写を活性化するより多くの能力を処理すると仮定された。
一本鎖DNA(ssDNA)マッピングについての代表的な手順
ssDNAについての一つの手順は以下の工程のうちの1つまたは複数を含み得る。第1の工程は、N3-ケトキサールまたはケトキサール誘導体を細胞培養培地へ添加することによって標識培地を調製することであり得る。所望の時間の間、所望の温度で、所望の条件下にて、細胞を標識培地中でインキュベートする。転写阻害研究は、N3-ケトキサールまたはケトキサール誘導体含有培地中でインキュベートする前に、DRBまたはトリプトライドまたは等価な試薬下で細胞を処理することによって行うことができる。インキュベーション後、細胞を採取し、細胞から全DNAを単離する。DNAをH2O中にかつDBCO-PEG4-ビオチン(DMSO溶液)の存在下で懸濁し、適切な温度で適切な時間の間、例えば、37℃で2時間、インキュベートすることができる。RNアーゼAを反応混合物へ添加し、混合物を、適切な温度で適切な時間の間、例えば、37℃で15分間、インキュベートすることができる。7.DNAを反応混合物から回収し、ライブラリーを構築するために使用することができる。ライブラリーは、様々な商業的ライブラリー構築キット、例えば、Accel-NGS Methyl-seq DNAライブラリーキット(Swift)またはKapa Hyper Plusキット(Kapa Biosystems)を使用して構築することができる。次の工程は、例えばNextseq SR80モードにおいてライブラリーを配列決定することを含み、下流の解析を行うことができる。
3.ケトキサール補助RNA-RNA相互作用マッピング(KARRI)
RNAに対するN3-ケトキサールの反応性を考慮して、ケトキサール補助RNA-RNA相互作用マッピング(KARRI)を、相互作用RNA-RNAのN3-ケトキサール標識およびデンドリマー架橋に基づいて開発した。KARRIマッピングを実証するために、ホルムアルデヒド固定マウス胚性幹細胞(mESC)をN3-ケトキサールで処理し、次いで、表面にて2つのジベンゾシクロオクチン(DBCO)分子および1つのビオチン分子で装飾されたPAMAMデンドリマー(Esfand and Tomalia, (2001) Drug Discov. Today 6:427-36)と共にインキュベートした(図4a)。各PAMAMデンドリマーは、「クリック」反応を通じて2つの近接N3-ケトキサール標識グアニンを化学的に架橋し、その上のビオチン部分を通じて濃縮のためのハンドルを提供する。架橋後、RNAを単離し、断片化し、ストレプトアビジンビーズによる免疫沈降へ供した(図4a)。近接ライゲーションを次いでビーズ上において行い、生成物RNAをライブラリー構築のために使用した(図4a)。シーケンシングリードを、RNA-RNA相互作用解析のために使用されたキメラリードとのみ整列させた。
ゲル電気泳動(図4b)およびドットブロット(図4c)は、デンドリマーおよびRNA間の架橋反応が効率的かつ特異的であることを確認した。KARRIは高度に再現性があり(図4d)、RNA二次構造および3次元RNA-RNA相互作用の両方を検出する。例えば、rRNA-rRNAキメラリードを見ることによって、KARRIは、45S rRNAの2次元相互作用マップを再構成し(図4e)、これは、以前報告されたソラレンに基づくRNA-RNA相互作用マッピング法(PARIS、図4f)(Lu et al., Cell 165:1267-79, 2016)と同様である。デンドリマー架橋無しでまたは近接ライゲーション無しで調製されたサンプルは、非常に弱いかまたは検出不能なシグナルを示した(図4e)。KARRIはまた代替のRNA構造を検出する。例えば、2つの二重鎖グループ(DG)がRPL17 mRNAにおいて検出され、Boltzmannアンサンブルから生じた2つのコンフリクトコンフォーメーションに対応する、2つのアーム(構成、代替)と排他的に相互作用する1つの共通アームを有した(図4f)。
KARRIはインビボRNA構造寄与因子を解読する
インビトロRNAフォールディングと比較して、RNA二次構造および分子間RNA-RNA相互作用は、非常に複雑な様式でRNA修飾およびRNA結合性タンパク質(RBP)のような様々な細胞因子によって調節される(Lewis et al., Nat. Rev. Mol. Cell Bio. 18:202-10, 2017)。追加の研究を行い、どのようにRNA構造および相互作用が生細胞において形成および調節されるかを研究した。精製されたRNAをインビトロでリフォールディングし、KARRIを行い、インビボKARRI結果と比較した。予想通りに、インビボで検出されたいくつかの構造特徴が消滅し、一方、いくつかの新しい構造が熱力学的に安定なRNA自己フォールディングコンフォメーションとして出現した(図5a)。
RBP結合および翻訳が、これらの差異を生じさせる重要な寄与因子であると考えられる。これを試験するために、2つの広く使用される翻訳阻害剤であるハリングトニン(HT)およびシクロヘキシミド(CHX)(Ingolia et al., Cell 147:789-802, 2011)で細胞を処理し、KARRI実験を行った。翻訳阻害は、損なわれたインビボ特異的構造を生じさせ、インビトロ特徴を増加させ(図5a)、これは、翻訳が生細胞中のRNA二次構造形成に寄与することを示している。これはメタジーン分析によってさらに立証される。メタジーンプロフィールは、インビボでのmRNAが、CDSでのインビトロリフォールディングされたmRNAと比べて概してあまり構造化されておらず、細胞を翻訳阻害剤で処理することが生細胞中のmRNA構造を「インビトロ様」にすることを示した(図5b)。翻訳阻害後、インビボでのmRNAは、RBPのような他の因子からの寄与に潜在的に起因して、インビトロリフォールディングされたmRNAと比べて依然としてあまり構造化されていない。実際、キメラmRNAリードのモチーフ解析は、哺乳動物エクソンジャンクション複合体(EJC)中のコアタンパク質である、eIF4AIIIのような公知のRBPの結合モチーフに対応するモチーフを同定する(図5c)(Sauliere et al., Nat. Struct. Mol. Bio. 19:1124-31, 2012)。ENCODEからの公表されたeCLIPデータ(The ENCODE Project Consortium, Nature 489:57-74, 2012)とのこれらのモチーフの統合的な比較は、継続中である。
ケトキサール補助RNA-RNA相互作用(KARRI)についての手順
KARRI法は以下の工程のうちの1つまたは複数を含み得る。細胞を、固定剤、例えば、ホルムアルデヒド溶液中に懸濁し、軽く回転させながら室温でインキュベートすることができる。反応は、例えばグリシンを添加することによって、クエンチすることができる。翻訳阻害剤処理について、細胞をシクロヘキシミドまたはハリングトニンで処理する。細胞を収集し小分けする。N3-ケトキサールまたはケトキサール誘導体を、適切な溶媒、例えばDMSOを使用して、1:5に希釈し、標識緩衝液(N3-ケトキサールまたはケトキサール誘導体、溶解緩衝液(10 mM Tris-HCl pH 8.0, 10 mM NaCl, 0.2 IGEPAL CA630)およびプロテイナーゼ阻害剤カクテル)中へ組み入れることができる。細胞を標識緩衝液中に懸濁し、インキュベーション後に細胞を収集することができる。収集された細胞を、氷冷溶解緩衝液中で1、2、3回またはそれ以上洗浄することができる。細胞ペレットを、架橋剤を含有するMeOH中に懸濁し、細胞を収集することができる。RNAを抽出し、精製することができる。RNAペレットを、DNアーゼI緩衝液(100 mM Tris-HCl pH 7.4, 25 mM MgCl2, 1 mM CaCl2)、DNアーゼI、RNアーゼ阻害剤と共に、H2O中に懸濁し、軽く振盪しながらインキュベートすることができる。混合物を次いでプロテイナーゼKへ曝露する。RNAをフェノール-クロロホルムで抽出し、RNAをEtOH沈降によって精製する。RNAペレットをH2O、およびRNアーゼ阻害剤を含む断片化緩衝液に懸濁し、インキュベートする。断片化を断片化停止緩衝液の添加によって停止し、サンプルを氷上に置いて反応をクエンチする。架橋されたRNAを、洗浄済みストレプトアビジンビーズを使用することによって濃縮する。ビーズをDNAと混合し、混合物を軽く回転させながら室温でインキュベートした。インキュベーション後、ビーズを洗浄した。洗浄されたビーズを、PNK緩衝液およびT4 PNK、RNアーゼ阻害剤を含むH2O中に懸濁し、第1インキュベーション期間の間振盪し、次いで、別のアリコートのT4 PNKおよびATPを添加し、第2インキュベーション期間の間振盪する。ビーズを洗浄し、リガーゼ溶液中に懸濁する。リガーゼ溶液中におけるインキュベーション後、ビーズを洗浄する。RNAを加熱によって溶出し、RNAを回収する。回収されたRNAの半分をライブラリー構築のために使用する。ライブラリーを配列決定し、下流の解析を行う。
4.光活性化N3-ケトキサール標識
N3-ケトキサールは光によってインサイチュ核酸標識を可能にする
N3-ケトキサール標識DNA/RNAのさらなる官能化は、アジド基を有するDNA/RNAとDBCOコンジュゲート化分子との間の「クリック」反応に依存する。「クリック」ケミストリーは光によって制御され得、従って、生細胞中における部位特異的DNA/RNA標識化を達成する。原理の証明として、DBCO分子のケージ化形態(フォト-DBCO-OH)(Nainar et al., J. Am. Chem. Soc. 139:8090-93, 2017)を含め、これは、その天然状態ではアジド基と反応することができないが、UV光へ曝露されると、活性化形態(DBCO-OH)へ変換され、N3-ケトキサール標識核酸と反応する(図6a)。9-mer合成RNAオリゴを、まずN3-ケトキサールと共にインキュベートし、精製し、次いで365 nm UV曝露下で10分間、フォト-DBCO-OHと共にインキュベートした。質量スペクトル分析は、首尾よい光脱ケージ化および続いての「クリック」反応を示した(図6b)。ビオチンまたはローダミンBとコンジュゲートされたフォト-DBCOを合成し、これらは、光制御インサイチュ空間特異的RNAシーケンシングおよびイメージングのために潜在的に使用され得る(図6c)。
5.タンパク質-RNA架橋免疫沈降シーケンシング(CLIP-seq)
関心対象のタンパク質へ結合するRNAをプルダウンして、それらのRNAのライブラリーを作製する、およびタンパク質が結合および/または修飾されるRNAの領域を同定するための方法を、本明細書に記載する。タンパク質に近接しているRNAへのタンパク質の有効な架橋が、CLIP-seqを行い、タンパク質-RNA相互作用を研究するために使用され得る。細胞をインサイチュで固定し、ケトキサール誘導体を細胞中へ導入し、続いてタンパク質架橋剤を活性化する。細胞中で架橋されたタンパク質-RNA複合体を、次いで、断片化し、免疫沈降させ、かつ/または分析することができる(図18)。
いくつかの態様において、方法は以下のうちの一部または全部を含む:複合体を単離すること;RNAに相補的なDNAを合成してcDNAの初期集団を提供すること;必要に応じて、鎖特異的プライマーを使用して、PCR増幅すること;cDNAの初期集団を精製して、cDNAの精製集団を得ること;およびcDNAの精製集団をハイスループットシーケンシングすること。
一般に、dCLIP-seqライブラリーを構築するために、標準技術を使用してRNAをゲルから抽出する。全てのRNA(ポリA RNAのみではない)を捕捉し、鎖情報を保存するために、3′末端特異的アダプターを抽出されたRNA断片へライゲーションし、続いて、3′末端アダプターに特異的な逆転写プライマーとハイブリダイズさせ、5′末端に特異的な第2のアダプターをライゲーションすることができる。その後の逆転写工程は、3′および5′アダプターに相補的な配列を含有するファーストストランドcDNA配列を作る。プライマー対に特異的な3′-および5′-アダプターを使用する、結果として生じるPCRを、次いで行い、cDNAを増幅させ、産物をハイスループットシーケンシングの標準方法によって配列決定する。シーケンシング前に、サイズ選択工程を使用することができ、ここで、所望のサイズの増幅されたPCR産物を、ゲル電気泳動による分離後に切除し、アダプター二量体のような望ましくない副産物を除去する。
ケトキサール誘導体は、ジアジリンまたはベンゾフェノンのようなタンパク質架橋剤を含むように修飾され得る。現在のCLIP-seqプロトコルは、RNA塩基への、芳香族側鎖を含む、アミノ酸側鎖のUV開始架橋を伴う。これらの架橋反応は極めて低い効率に苦しむ。本明細書に記載されるケトキサール二官能性分子は、効率的なRNA標識を可能にするケトキサールと、ジアジリンまたはベンゾフェノンのような効率的なタンパク質架橋剤とから構成される。ジアザリン(diazarine)およびベンゾフェノンは、UV照射時にラジカルを形成する。架橋剤は、近くに任意の近接第1級炭素を捕捉して、共有結合を形成することができ、従って、それをタンパク質架橋のための適切な試薬にする。ジアジリンまたはベンゾフェノンをケトキサール誘導体へ結合することは、それらの弱いタンパク質相互作用の安定化を可能にする。このようにして、関心対象のタンパク質に特異的な抗体を用いてのプルダウンを介して、標的タンパク質に対して相互作用するかまたは近接配置されたRNAのプールを釣ることができる。
核酸とタンパク質とを架橋するケトキサール誘導体を調製することができる。このようにして、それは、動的な核酸-相互作用タンパク質複合体の安定性を可能にする。特異的抗体でのプルダウン後、核酸を次いで精製し、異なるライブラリー構築または他の検出手段へ供する。これらの方法は、高い信号対雑音比を有する現在のCLIPの改良版として役立ち得る。
タンパク質架橋剤としては、グルタル酸ジスクシンイミジル、スベリン酸ジスクシンイミジル、酒石酸ジスクシンイミジル、アジプイミド酸ジメチル、ピメルイミド酸ジメチル、スベルイミド酸ジメチル、1,5-ジフルオロ-2,4-ジニトロベンゼン、N-マレイミドプロピオン酸ヒドラジド、3-(2-ピリジルジチオ)プロピオニルヒドラジド、ビスマレイミドエタン、ジアザリン、ヨード酢酸スクシンイミジル、N-マレイミドアセトキシスクシンイミドエステル、3-(2-ピリジルジチオ)プロピオン酸スクシンイミジル、およびベンゾフェノンが挙げられるが、これらに限定されない。
以下の実施例ならびに図は本発明の好ましい態様を実証するために含まれる。実施例または図中に開示される技術は、本発明の実施において十分に機能することが本発明者らによって見出された技術を示し、従って、その実施のための好ましいモードを構成すると考えられ得ることが、当業者によって認識されるべきである。しかし、当業者は、本開示を考慮して、多くの変更が開示される特定の態様において行われ得、本発明の精神および範囲から逸脱することなく同様または類似の結果を依然として得ることができることを認識するべきである。
実施例1
ケトキサール誘導体の合成
N3-ケトキサールの合成経路。
Figure 2021523133
2-(2-アジドエトキシ)プロパン酸2:
水素化ナトリウム(鉱油中60%分散液, 6 g, 0.15 mol)を250 mL二つ口フラスコへ添加し、次いで無水THF 50 mLをN2条件下で添加した。懸濁液を激しく撹拌し、0℃へ冷却した。20 mL無水THF中の2-アジドエタノール(8.7 g, 0.1 mol)を20分間にわたって滴下した。溶液を周囲温度で15分間撹拌し、次いで再び0℃へ冷却した。10 mL THF中の2-ブロモプロピオン酸エチル(27.15 g, 0.15 mol)を滴下した。反応混合物を室温へ加温し、N2雰囲気下で一晩撹拌した。100 mL水を使用して反応をクエンチし、結果として生じた混合物をジエチルエーテルによって3回(3 × 100 mL)洗浄した。合わせた有機層を無水Na2SO4で乾燥させた。粗製生成物を50 ml THF中に溶解し、LiOH水溶液(40 ml, 1 M)へ添加した。混合物を室温で16時間撹拌した。THFを除去し、HCl (2 M)をpH 2まで添加した。次いで、THFをジエチルエーテルによって3回(3 × 100 ml)抽出した。合わせた有機層を無水NaSO4で乾燥させた。濃縮およびシリカゲルクロマトグラフィー(酢酸エチル:石油エーテル = 1:7)後、生成物2が無色オイル(6.67 g, 26 %)として収集された。
Figure 2021523133
Figure 2021523133
3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オン3:
N2条件下で、2 (1.59 g, 10 mmol)を15 mL無水CH2Cl2および1滴のDMF中に溶解した。塩化オキサリル(926μL, 15 mmol)を溶液へ添加し、室温で2時間撹拌した。その後、溶媒および過剰な塩化オキサリルを除去した。残留物を無水CH3CN 50 mL中に溶解し、0℃へ冷却し、ジエチルエーテル(4 mL, 10 mmol)中の(トリメチルシリル)ジアゾメタン溶液2 Mを滴下した。反応混合物を0℃で一晩撹拌した。溶媒を蒸発させ、シリカゲルクロマトグラフィー(酢酸エチル:石油エーテル = 1 : 7)を行い、生成物3が黄色オイル(620 mg, 33.8 %)として得られた。
Figure 2021523133
Figure 2021523133
アジド-ケトキサール1 (N3-ケトキサール)、または3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オン(4):
Adamの手順に従って、アセトン溶液中のジメチルジオキシラン(DMD)を調製した。化合物3 (183 mg, 1 mmol)へ、11 mL DMD-アセトンをいくつかの部分に分けて添加した。明らかなガス発生が観察された。反応混合物を、TLCモニター下で反応が完全になるまで室温で撹拌し、アジド-ケトキサール1およびそのハイディエート(hydyate)4が黄色オイルとして得られた。
Figure 2021523133
概括的な化学的および生物学的材料
N3-ケトキサール合成のための全ての化学試薬を商業的供給源から購入した。RNAオリゴを、Integrated DNA Technologies, Inc. (IDT)およびTakara Biomedical Technology Co., Ltd.から購入した。N3-ケトキサール合成のための緩衝塩および化学試薬を商業的供給源から購入した。Superscript III、Dynabeads(登録商標)MyOne(商標)ストレプトアビジンC1をLife technologiesから購入した。T4 PNK、T4 RNL2tr K227Q、5’-デアデニラーゼ、RecJfを、New England Biolabsから購入した。CircLigaseIIをEpicenter社から購入した。DBCO-ビオチンをClick Chemistry Tools LLC (A116-10)から購入した。全てのRNアーゼフリー溶液をDEPC処理MilliQ水から調製した。
実施例2
グアニンとのN3-ケトキサール反応の立証
N3-ケトキサールおよびグアニン反応を立証した。グアニン(100μM, 2μL)、N3-ケトキサール(DMSO中1 M, 1μL)、カコジル酸ナトリウム緩衝液(0.1 M, pH = 7.0, 1μL)および6μL ddH2Oを、37℃で10分間、1.5 mL微小遠心管中へ一緒に添加した。HRMS C11H14N8O4 +[M+H]+calculated 323.1216, found 323.1203。
Figure 2021523133
実施例3
N3-ケトキサールおよびRNAの反応
N3-ケトキサールおよびRNAの反応を概して以下のプロトコルで行った:100 pmol RNAオリゴおよび1μmol N3-ケトキサールを、37℃で10分間、PBS緩衝液中合計10μL溶液中でインキュベートした。修飾RNAをMicro Bio-Spin(商標)P-6ゲルカラム(Biorad, 7326222)によって精製し、残存する化学物質を除去した。精製された標識RNAは、質量分析、ゲル電気泳動、およびビオチン-DBCOとの銅フリークリック反応のような、さらなる研究のために使用され得る。
N3-ケトキサール標識RNAからのN3-ケトキサール修飾の除去
N3-ケトキサール修飾消去の詳細なプロトコルを、keth-seqプロトコル中の下記「N3-ケトキサール除去サンプル調製」に記載する。概して、精製されたN3-ケトキサール修飾RNAを、37℃で6時間または95℃で10分間、高濃度のGTP (1/2体積の反応溶液、最終濃度50 mM)と共にインキュベートした。より高い温度がN3-ケトキサール修飾の除去に役立つ。
RNA中のN3-ケトキサール修飾の固定
RNA中の不安定なN3-ケトキサール修飾をホウ酸緩衝液の存在下で固定することができる。N3-ケトキサール標識RNAの溶液を、1/10体積のストックホウ酸緩衝液と混合した(最終濃度: 50 mM; ストックホウ酸緩衝液: 500 mMホウ酸カリウム, pH 7.0;500 mMホウ酸へ水酸化カリウムペレットを添加しながら、pHをモニターした)。ホウ酸緩衝液固定をketh-seqプロトコルの様々な工程において使用した;下記を参照のこと。
N3-ケトキサール標識RNAオリゴのMALDI-TOF-MS分析
N3-ケトキサール標識RNAをMicro Bio-Spin(商標)P-6ゲルカラムによって精製した。合間に、PBS緩衝液から、これは追加の脱塩工程無しでMALDI-TOF-MS実験において直接使用することができるトリス緩衝液へ緩衝液を交換した。1マイクロリットルの生成物溶液を、8:1体積比の2'4'6'-トリヒドロキシアセトフェノン(THAP、50% CH3CN/H2O中10 mg/mL):クエン酸アンモニウム(H2O中50 mg/mL)を含む1マイクロリットルのマトリックスと混合した。次いで、混合物をMALDIサンプルプレート上にスポットし、乾燥させ、Bruker Ultraflextreme MALDI-TOF-TOF質量分析計によって分析した。
実施例4
ゲル電気泳動によるSSRNAへのN3-ケトキサールの選択性
相補的RNAオリゴ
Figure 2021523133
を、全てのFS1がdsRNAの形成に関与することを確実にするために、FS1:S2 = 1.2:1の比率で二本鎖RNA(dsRNA)へハイブリダイズさせた。N3-ケトキサールとの反応後、Micro Bio-Spin(商標)P-6ゲルカラムによる精製生成物を、変性ゲル電気泳動(Novex(商標)TBE-尿素ゲル, 15%, Invitrogen, EC6885BOX)によって分析した。ゲルイメージングをPharos FX Molecularイメージャー(Bio-Rad, USA)において収集した。
4種類のRNA核塩基とのN3-ケトキサールの生成物を、Inertsil ODS-SPカラム(5μm, 250×4.6 mm) (GL Science lnc. Japan)を備えたLC-6AD (Shimadzu, Japan) HPLC機器を使用して分析した。相A (100 mM TEAA緩衝液, pH=7.0)および相B (CH3CN)を、35℃にて1mL/分の流量で溶離剤として使用した(B濃度: 5-5-30% / 0-5-30分)。
実施例5
N3-ケトキサール標識RNAのビオチン化
インビトロ研究:
精製されたN3-ケトキサールRNAを、RNアーゼ阻害剤、ホウ酸緩衝液の存在下で37℃にて2時間、DBCO-ビオチンと共にインキュベートした(下記keth-seqプロトコルのビオチン化を参照のこと)。RNAオリゴについて、ビオチン化された生成物を、Micro Bio-Spin(商標)P-6ゲルカラムによって精製し、ドットブロットアッセイおよびMALDI-TOF-MS検出へ供し;全RNAまたはmRNAについて、生成物を、RNA clean & concentrator 5 (Zymo Research, R1015)によって精製した。
インビボ研究:
10μL N3-ケトキサールを、ほぼ80%コンフルエントなmES細胞を含む100 mm細胞培養皿中の細胞培養培地中へ添加した。特定の時間の間、CO2インキュベーター中37℃でのインキュベーション後、培地を吸引し、細胞をPBSによって3回洗浄した。全RNAをトリゾール(商標)試薬(Invitrogen, 15596026)またはQiagen RNeasy(商標)plus miniキット(Qiagen, 74134)によって単離した。mRNAをDynabeads(商標)mRNA DIRECT(商標)精製キット(Invitrogen, 61011)によって単離した。ビオチン化工程はインビトロ研究と同じであった。ビオチン化RNAをRNA clean & concentratorによって精製した。
ドットブロットアッセイ:
1マイクロリットルのRNA (100 ng/uL)サンプルを、Amersham Hybond-N+膜(RPN119B, GE Healthcare)上へスポットし、UVP HL-2000 HybriLinkerによって膜へUV架橋した。膜を、1 x PBST (0.1% tween-20)を使用して洗浄し、4℃にて一晩、1 x PBST中5%脱脂粉乳でブロッキングした。10分間隔で1x PBSTを使用して4回洗浄後、3% BSAを含む1x PBST中のストレプトアビジン-ホースラディシュペルオキシダーゼ(1:15000希釈、ストレプトアビジン-HRP, Life Technologies, S-911)を添加し、室温で40分間インキュベートした。次いで、再び10分間隔で1x PBSTを使用して膜を洗浄し、SuperSignal(商標)West Pico PLUS化学発光基質(Thermo Scientific, 34577)によって現像した。膜を再び1x PBSTによって洗浄し、メチレンブルー溶液(0.3 M酢酸ナトリウムpH 5.2中0.02%メチレンブルー)によって染色した。
実施例6
KETH-SEQライブラリー調製
わずかな変更を伴ってicSHAPEプロトコルに従って、ライブラリーを調製した(Spitale et al., Nature 519:486-90, 2015)。詳細なプロトコルを下記に記載する。インビトロライブラリー調製について、RNAを単離し、先ずRNAフォールディングミックス緩衝液(100 mM HEPES, pH 8.0, 100 mM NaCl, 10 mM MgCl2)中でリフォールディングした。リフォールディングされたRNAをN3-ケトキサールで処理し、次いでライブラリー構築のために利用した。インビボ研究について、N3-ケトキサールをmES細胞の培養培地中へ添加し、RNAを単離し、ライブラリー構築のために利用した。
シーケンシングデータ処理
ライブラリー構造はicSHAPE技術と類似しているため、同様の戦略を使用してシーケンシングリードを前処理した。icSHAPEプロトコルからのパイプラインを使用してデータ解析を行い、全てのスクリプトは、URL github.com/qczhang/icSHAPEでアクセスすることができる。最初に、スクリプトreadCollapse.plを使用し、デフォルトパラメーターでリードをコラプスした。次いで、trimming.plを使用し、可能性のあるアダプター配列を切断した(-l 13 -t 0 -c phred33 -a adapter.fa -m 0, アダプター配列:
Figure 2021523133
次に、クリーンリードをリボソームRNAへマッピングし、マッピングされないリードを、デフォルトパラメーターでBowtieを使用して全トランスクリプトーム(Gencode、マウスについてのmm10およびヒトについてのhg38)へマッピングした。逆転写(RT)停止シグナルを、スクリプトcalcRT.plを使用して計算した。異なるレプリケート間の相関を評価した(correlationRT.pl)後、後の解析のためにレプリケートのRTシグナルを組み合わせた(combineRTreplicates.pl)。個々にケトキサールおよび対照サンプルの両方について、RTシグナルを正規化する(normalizeRTfile.pl -m mean:vigintile2 -d 32 -l 32)。各転写物についての強化された反応性を、スクリプトcalcEnrich.pl (-w factor5:scaling1 -x 0.25)を使用してケトキサールサンプル(フォアグラウンド)対対照サンプル(バックグラウンド)を比較することによって計算した。最後に、特定の基準を使用し、より確信的なシグナルを保持した(filterEnrich.pl -T 2 -t 200 -s 5 -e 30)。
N3-ケトキサールおよびN3-ケトキサール除去ライブラリー調製
N3-ケトキサールインビボ標識
mES細胞を50%コンフルエンシーで10 cmプレート中に前日に継代する。2日目の午前は、ほぼ約80%コンフルエンシーである。5 mL培地を除去し、次いで10μLのN3-ケトキサールを添加する。37℃で様々な時間(分)にわたってインキュベートする。培地を吸引し、PBS洗浄を2回使用し、1mL PBSを添加し、細胞を1.5 mLチューブ中へ掻き集める。4℃にて5分間2000 rpmで遠心沈殿する。上澄みを吸引する。Qiagen RNeasy plus miniキットを使用して全RNAを単離し、次いで、Dynabeads(登録商標)mRNA精製キットを使用し、全RNAサンプルからmRNAを単離する。
ビオチン化
(a)ほぼ2μgの全RNAまたはmRNAを取り、20 mM WS DBCO-ビオチン(Click Chemistry tool, A116)を1.5 mLチューブに添加し、37℃で2時間水浴を行う。10 x PBS (10μL)、500 mMホウ酸緩衝液(5μL)、20mM WS DBCO-ビオチン(5μL)、SUPERase In RNアーゼ阻害剤(2μL)、RNA溶液 + H2O (78μL)。反応物は合計100μLとなり、37℃で2時間インキュベートする。(ホウ酸緩衝液:500 mMホウ酸カリウム(pH 7.0);500 mMホウ酸への水酸化カリウムペレットを用いてのpH) (b)100μL RNA反応溶液についてのRNA回収。Qiagen RNeasy MinEluteキット。350μL緩衝液RLTを100μL反応溶液へ添加し、次いで900μL 100 %エタノールを混合物へ添加する。溶液をQiagen MinEluteカラムへロードし、2回の500μL RPE洗浄を行い、1回の無緩衝液スピンを行い、カラムを乾燥させる。2つの50μL RNアーゼフリー水はRNA溶液を溶出する。(任意選択)ドットブロットを使用し、ビオチン化の効率を確認する。
断片化(超音波処理)
(a)RNA溶液をBioruptor NGS 0.65 mL Microtubeへ移す。30秒オン/30秒オフを含む30サイクルの超音波処理をする。(b)3μLまで凍結乾燥し、ライゲーションを行う。
T4 PNK RNA末端修復、3’-末端ライゲーションおよび3’-アダプター除去
(a)T4 PNK末端修復(PCRチューブ、サーモサイクル):RNAサンプル(3μL)、10 x T4 PNK緩衝液(1μL)、SUPERase In RNアーゼ阻害剤(1μL)、ホウ酸緩衝液(1μL)、10 mM ATP (1μL)、T4 PNK酵素(2μL)、およびFastAP (1μL)。合計10μLとなり、37℃で1時間インキュベートし、3’-末端ライゲーションを直接行う。
(b)3’-末端ライゲーション:T4 PNK修復後のRNA溶液(10μL)、3’-アダプター20μM (1μL)、10 x T4RNL2tr緩衝液(1μL)、100 mM DTT (1μL)、50% PEG8000 (6μL)、およびT4 RNL2tr K227Q (1.5μL)。合計20.5μLとなり、16℃で一晩インキュベートする。
(c)29.5μL H2Oを各サンプルへ添加し、RNAをZymo RNA clean & concentrator 5キットで精製する。7μL H2Oによって2回溶出し、約13μL RNA溶液を得る。(i)100μL RNA結合緩衝液を50μL反応溶液へ添加し、次いで、150μL 100 %エタノールを混合物へ添加する。(ii)カラムへ溶液、400μL RNA prep緩衝液、700μL RNA洗浄緩衝液をロードし、次いで1回の無緩衝液スピンを行い、カラムを乾燥させる。(iii)2つの7μL RNアーゼフリー水はRNA溶液を溶出する。
(d)過剰な3’-アダプター除去:RNA溶液(13μL)、NEB緩衝液2 (2μL)、5’-デアデニラーゼ(2μL)、およびホウ酸緩衝液(1μL)。合計18μLとなり、30℃で30分間インキュベートする。次いで、RecJf2μLを添加し、合計20μLとなり、37℃で1時間インキュベートする。30μL H2Oを各サンプルへ添加し、RNAをZymo RNA clean & concentrator 5キットで精製する。7および6μL H2Oによって2回溶出し、約12μL RNA溶液を得る。
(e)RNA溶液を2つのフラクションへ分ける。(1)N3-ケトキサールサンプルについて10.5μLを維持し、cDNA合成工程へ直接移る。(2)N3-ケトキサール除去サンプル工程におけるN3-ケトキサール除去サンプル調製について残りの1.5μL。
N3-ケトキサール除去サンプル調製:
GTP溶液を添加し、N3-ケトキサール修飾を除去し、N3-ケトキサール除去サンプルを生成する。RNA溶液(1.5μL)、SUPERase In RNアーゼ阻害剤(1μL)、100mM dGTP (5μL)、およびH2O (2.5μL)。95℃で10分間インキュベートする。次いで、40μL H2Oを添加し、RNAをZymo RNA clean & concentrator 5キットによって回収する。6μL H2Oで2回溶出し、次いでcDNA合成工程へ移る。(i)100μL RNA結合緩衝液を50μL反応溶液へ添加し、次いで150μL 100%エタノールを混合物へ添加し、混合する。(ii)カラムへ溶液、400μL RNA prep緩衝液、700μL RNA洗浄緩衝液をロードし、次いで1回の無緩衝液スピンを行い、カラムを乾燥させる。(iii)2つの6μL RNアーゼフリー水はRNA溶液を溶出する。
cDNA合成
(a)RNAサンプルをPCRチューブへ移す。1μL 5μM RTプライマーを添加し、混合する。N3-ケトキサール除去:RNA溶液(10.5μL)、5μM RTプライマー(1μL)、およびH2O (1μL)。N3-ケトキサール:RNA溶液(10.5μL)、5μM RTプライマー(1μL)、およびホウ酸緩衝液(1μL)。合計12.5μL混合物をサーモサイクルにおいて70℃で5分間加熱し、次いで25℃へ徐々に冷却し(1秒当たり1℃、45ステップ)、25℃で1分間保持する。
(b)プライマーアニーリング後、以下を添加した:5x First Strand緩衝液(4μL)、SUPERase In RNアーゼ阻害剤(0.5μL)、100 mM DTT (1μL)、dNTP 10 mM各々(1μL)、およびSuperScript III (1μL)。合計20μL混合物を25℃で3分間、42℃で7分間、および最後に52℃で30分間インキュベートし、4℃で保持する。cDNA伸長後、混合物を氷または4℃上に置き、変性条件を回避するために、サンプルを37℃超にしない。
ストレプトアビジン捕捉、cDNA溶出(N3-ケトキサール除去サンプルについてではなく、N3-ケトキサールサンプルのみについてのストレプトアビジン捕捉)
ビオチン結合緩衝液:100 mM Tris-HCl pH 7.0、10 mM EDTA、1 M NaCl。ビオチン洗浄緩衝液:10 mM Tris-HCl pH 7.0、1 mM EDTA、4 M NaCl、0.2 % Tween。10x RNアーゼH緩衝液:500 mM HEPES、750 mM NaCl、30 mM MgCl2、1.25 %サルコシル、0.25 %デオキシコール酸ナトリウム、50 mM DTT。
(a)1サンプルにつき、20μL Dynabeads(登録商標)MyOne(商標)ストレプトアビジンC1を1mLビオチン結合緩衝液で2回洗浄した。洗浄後、ビーズを10μLビーズ結合緩衝液および1μL SUPERase In RNアーゼ阻害剤中に再懸濁する。次いで、必要とされるまで氷上に保存する。(b)10μLの洗浄済みビーズを各逆転写ケトキサールサンプル(20μL)へ添加し、回転しながら室温で45分間インキュベートする。(c)ストレプトアビジン捕捉後、100μLビオチン洗浄緩衝液を添加し、1.5 mLチューブへ移す。追加の400μLビオチン洗浄緩衝液(合計500μL)を添加し、チューブを4回反転させ、混合する。(d)サンプルをマグネットラックへ適用する。上澄みを除去する。次いで、500μLビオチン洗浄緩衝液を使用し、さらに4回洗浄する。(合計5回洗浄)。(e)500μL 1 x PBSを使用してサンプルを2回洗浄する。(f)cDNA溶出(ケトキサールサンプルについて):(i)cDNAを、以下の溶液を添加することによって溶出する:10 x RNアーゼH緩衝液(5μL)、RNアーゼA/T1カクテル(1μL)、RNアーゼH (1μL)、50mM D-ビオチン(12.5μL)、およびH2O (30.5μL)。合計50μL溶液を、サーモミキサー中で1000 r.p.mで37℃にて30分間インキュベートした。(ii)サンプルを1μL 100 % DMSOと混合し、95℃へ4分間加熱し、マグネットラック上に置き、50μL cDNA溶出を新しいチューブへ移す。(g)cDNAを、改変法でDNA Clean & Concentrator-5キットを使用して精製する:50μL cDNA溶出溶液、350μlのDNA結合緩衝液および350μlの100 %エタノールを添加する。よく混合する。製造業者の説明書に従って精製を継続する(200μL洗浄緩衝液洗浄2回、次いで空のスピン1回)。cDNAを10μL H2Oで2回溶出する。合計約20μL cDNA溶液を得る。約5μL溶液まで凍結乾燥する。
cDNA溶出(N3-ケトキサールサンプルについてではなく、N3-ケトキサール除去サンプルのみについて)
(a)N3-ケトキサール除去サンプルのcDNAを、以下の溶液を20μL RT反応溶液へ添加することによって溶出する:10 x RNアーゼH緩衝液(5μL)、RNアーゼA/T1カクテル(2μL)、RNアーゼH (2μL)、およびH2O (21μL)。合計50μL溶液を37℃で30分間インキュベートした。(b)cDNAを、改変法でDNA Clean & Concentrator-5キットを使用して精製する:50μL cDNA溶出溶液、350μlのDNA結合緩衝液および350μlの100%エタノールを添加する。よく混合する。製造業者の説明書に従って精製を継続する(200μL洗浄緩衝液洗浄2回、次いで空のスピン1回)。cDNAを10μL H2Oで2回溶出する。合計約20μL cDNA溶液を得る。約5μL溶液まで凍結乾燥する。
cDNAサイズ選択
5μL TBU 2Xローディング色素を添加し、サイズ選択のために6% TBE-尿素ゲルへロードし、ならびにサンプルを95℃へ2分間加熱し、PAGE分離(180 V, 40分間)の直前に氷中に挿入する。Sybr Gold染色し、画像化し、ゲル中の> 70ヌクレオチド(70〜500)を切断する。cDNAをゲルから精製する。各ゲル切片を、無菌の注射針を使用して、底部に開けられた穴を有する0.5 ml微小遠心管へ移し、チューブキャップを閉める。1.5 mlチューブの内側に各0.5 mlチューブを置き、微量遠心機中で約12,000 × gで2分間遠心分離し、ゲル切片を細切れにする。0.5 mlチューブを除去し、廃棄する。各1.5 ml収集チューブへ、ヌクレアーゼフリー水(400μL)、5 M酢酸アンモニウム(40μL)、および10 % SDS (2μL)を添加する。サンプルを50℃で3時間超穏やかに揺り動かし、破壊されたゲル切片からcDNAを溶出する。スラリーを新しい1.5 mlフィルターチューブへ移し、マキシ速度で約2分間遠心分離し、溶出されたcDNA溶液から破壊されたゲル片を分離する。各水溶液へ、2μlのグリコーゲンおよび700μlの100 %イソプロパノールを添加する。-80℃で> 1時間保存する。チューブを4℃にて30分間 > 12,000 gで遠心分離し、cDNAをペレット化する。ペレットを氷冷80 %エタノールで洗浄し、空気乾燥させる。ペレットを14μlのヌクレアーゼフリー水中に再懸濁する。
cDNA環化
(a)14μL cDNA溶液をPCRチューブへ移し、次いで以下の通りに試薬を添加する:cDNA/H2O (14μL)、10 x CircLigaseII緩衝液(2μL)、1 mM ATP (1μL)、50 mM MnCl2(1μL)、およびCircLigase I (2μL)。合計20μLを60℃で2時間インキュベートする。(b) CircDNAを、改変法でDNA Clean & Concentrator-5キットを使用して精製する:30μL H2OをcDNA溶液へ添加し、50μL溶液を得、次いで、350μlのDNA結合緩衝液および350μlの100 %エタノールを添加する。よく混合する。製造業者の説明書に従って精製を継続する(200μL洗浄緩衝液洗浄2回、次いで空のスピン1回)。cDNAを10μL H2Oで2回溶出する。合計約20μL CircDNA溶液を得る。
ライブラリーPCR
(a)1μL CircDNAをqPCRモニタリングのために使用し、PCRサイクル数を最適化する。RP/RPIショートプライマー20mer 5μM (1μL)、cDNA環化工程からのCircDNA(1μL)、H2O (8μL)、およびqPCR 2 x Masterミックス(10μL)。示唆されたサイクル数は、シグモイド曲線の半分に位置するものである。(b)ショートプライマーによるPCR(RP/RPIショート20 mer)。Phusion MM (25μL)、RP/RPIショートプライマー20mer 5μM (1μL)、CircDNA溶液(5μL)、およびH2O (19μL)。合計50μL、PCRパラメーター:98℃30秒、次いで98℃10秒/60℃30秒/72℃30秒 各サイクル。(c)Bio-rad Greenスピンカラムを使用してPCR産物を精製する。5μLまで凍結乾燥し、2μL DNA 6Xローディング色素を添加し、サイズ選択のために6% TBEゲルへロードする(180 V, 30分間)。Sybr-Gold染色し、画像化し、ゲル中の> 80ヌクレオチド(80〜300)を切断する。cDNAを工程8中のプロトコル通りに精製する。ペレットを20μlのヌクレアーゼフリー水中に再懸濁する。(d)シーケンシングプライマーによるPCR(RP/RPIインデックスX、3〜5サイクル)。Phusion MM (25μL)、RPプライマー10μM (1μL)、RPIインデックスx 10μM (1μL)、精製されたDNA (20μL)、およびH2O (3μL)。合計50μL、PCRパラメーター:98℃30秒、次いで98℃10秒/60℃30秒/72℃30秒、3〜5サイクル。(e)シーケンシングPCR後、3%低融点アガロースゲルを使用し、PCR産物を精製し(プライマー二量体を除去する、90 V, 45分間)、Qiagen QIAquickゲル抽出キットによって回収する。DNAライブラリーを20μL H2Oによって溶出する。
実施例7
一本鎖DNA(SSDNA)マッピングのための実験手順
ssDNAを以下によって行う:(1)各10 cm皿について5 mL予熱細胞培養培地へ5μL純粋N3-ケトキサールを添加することによって、標識培地を調製する。(2)細胞を標識培地中で37℃、5% CO2で10分間インキュベートする。(3)転写阻害実験について、細胞を100μM DRBまたは1μMトリプトライド下で2時間処理し、その後、N3-ケトキサール含有培地中でインキュベートした。(4)10分間インキュベーション後に細胞を採取し、製造業者のプロトコルに従ってPureLinkゲノムDNAミニキットによって細胞から全DNAを単離する。(5)85μL H2O中に5μg全DNAを懸濁させ、次いで、10μL 10x PBSおよび5μL 20 mM DBCO-PEG4-ビオチン(DMSO溶液)を添加し、混合物を37℃で2時間インキュベートする。(6)5μL RNアーゼAを反応混合物へ添加し、混合物を37℃でさらに15分間インキュベートする。(7)製造業者のプロトコルに従ってDNA Clean & Concentratorキットによって反応混合物からDNAを回収する。
ライブラリーを異なる商業的ライブラリー構築キットによって構築し、同様の結果が得られた。2つの例は以下を含む:
(8a)Accel-NGS Methyl-seq DNAライブラリーキット(Swift)の使用:(i)工程7からの2μgの回収DNAを、30サイクルについて30秒オン/30秒オフ設定下での超音波処理によって断片化する。(ii)断片化DNAの5%をインプットのためにセーブし、残りの95%を使用し、僅かな変更を伴って製造業者のプロトコルに従って10μL洗浄済みストレプトアビジンC1ビーズによってビオチンタグ化DNAを濃縮する。ビーズを、0.05% tween-20を含む1x結合および洗浄緩衝液中で3回洗浄し、その後、0.1% tween-20を含む95μL 2x結合および洗浄緩衝液中に再懸濁させた。ビーズをDNAと混合し、混合物を軽く回転させながら室温で15分間インキュベートした。インキュベーション後、ビーズを、0.05% tween-20を含む1x結合および洗浄緩衝液で5回洗浄した。(iii)濃縮されたDNAを、ビーズを30μL H2O中で95℃で10分間加熱することによって溶出する。セーブされたインプットを同時に95℃で10分間処理する。インプットおよびIPサンプルの両方を直ちに氷上に置く。(iv)Accel-NGS Methyl-seq DNAライブラリーキットからのプロトコルに従ってライブラリー構築へ進む。
(8b)Kapa Hyper Plusキット(Kapa Biosystems)の使用:(i)1μg全DNAを35μL H2O中に懸濁し、5μL Kapa断片化緩衝液および10μL Kapa断片化酵素を添加する。混合物を37℃で30分間インキュベートする。(ii)断片化DNAを製造業者のプロトコルに従ってDNA Clean & Concentratorキットによって回収する。(iii)Kapa Hyper Plusキットからのプロトコルに従ってA-テーリングおよびアダプターライゲーションを行う。(iv)DNAの5%をインプットのためにセーブし、残りの95%を使用し、僅かな変更を伴って製造業者のプロトコルに従って10μL洗浄済みストレプトアビジンC1ビーズによってビオチンタグ化DNAを濃縮する。ビーズを、0.05% tween-20を含む1x結合および洗浄緩衝液中で3回洗浄し、その後、0.1% tween-20を含む95μL 2x結合および洗浄緩衝液中に再懸濁させた。ビーズをDNAと混合し、混合物を、軽く回転させながら室温で15分間インキュベートした。インキュベーション後、ビーズを、0.05% tween-20を含む1x結合および洗浄緩衝液で5回洗浄した。(v)濃縮されたDNAを、ビーズを25μL H2O中で95℃で10分間加熱することによって溶出する。(vi)Kapa Hyper Plusキットからのプロトコルに従ってインプットおよびIPサンプルの両方についてライブラリーをPCR増幅する。(9)Nextseq SR80モードにおいてライブラリーを配列決定し、下流の解析を行う。
実施例8
ケトキサール補助RNA-RNA相互作用(KARRI)についての実験手順
KRRIを以下によって行う:(1)1x106/mLで1%ホルムアルデヒド溶液中に生細胞を懸濁させ、軽く回転させながら室温で10分間インキュベートする。次いで、グリシンを125 mMの最終濃度まで添加することによってこの反応をクエンチし、混合物を室温で5分間回転させる。翻訳阻害剤処理について、細胞を、37℃にて10分間、100μg/mLシクロヘキシミドまたは3μg/mLハリングトニンで処理した。(2)2x106細胞を収集および採取する。N3-ケトキサールを、DMSOを使用して1:5に希釈する。3μL 100xプロテイナーゼ阻害剤カクテルを含む290μL溶解緩衝液(10 mM Tris-HCl pH 8.0, 10 mM NaCl, 0.2 IGEPAL CA630)中へ10μL N3-ケトキサールを添加することによって、標識緩衝液を作る。(3)細胞を標識緩衝液中に懸濁させ、室温で30分間回転させ、次いで、4℃にて5分間2500 gで遠心分離し、細胞を収集する。(4)細胞ペレットを500μL氷冷溶解緩衝液で3回洗浄する。(5)10μMデンドリマーを含有する500μL MeOH中にペレットを懸濁させ、37℃で1時間回転させる。次いで、4℃にて5分間2500 gで遠心分離し、細胞を収集する。(6)細胞ペレットを500μL氷冷溶解緩衝液で2回洗浄する。(7)細胞を385μL溶解緩衝液中に再懸濁し、50μL 10% SDS、30μLプロテイナーゼK、10μL RNアーゼ阻害剤、25μL 500 mM K3BO3を添加し、65℃で2時間振盪する。(8)500μLフェノール-クロロホルムを添加し、RNAを抽出し、RNAをEtOH沈降によって精製する。(9)RNAペレットを104μL H2O中に懸濁させ、12μL 10x DNアーゼI緩衝液(100 mM Tris-HCl pH 7.4, 25 mM MgCl2, 1 mM CaCl2)、2μL DNアーゼI (Thermo)、2μL RNアーゼ阻害剤を添加し、軽く振盪しながら37℃で30分間インキュベートする。(10)130μL 2xプロテイナーゼK緩衝液(100 mM Tris-HCl pH 7.5, 200 mM NaCl, 2 mM EDTA, 1% SDS)、10μLプロテイナーゼKを反応へ添加し、振盪しながら65℃で30分間インキュベートする。(11)RNAを300μLフェノール-クロロホルムで抽出し、RNAをEtOH沈降によって精製する。(12)RNAペレットを61μL H2O中に懸濁させ、7μL 10x断片化緩衝液(Thermo)、2μL RNアーゼ阻害剤を添加し、70℃で15分間インキュベートし、次いで、8μL断片化停止緩衝液(Thermo)を添加し、サンプルを直ちに氷上に置いて反応をクエンチする。(13)僅かな変更を伴って製造業者のプロトコルに従って30μL洗浄済みストレプトアビジンC1ビーズを使用することによって、架橋されたRNAを濃縮する。ビーズを、0.05% tween-20を含む1x結合および洗浄緩衝液で3回洗浄し、その後、0.1% tween-20を含む80μL 2x結合および洗浄緩衝液中に再懸濁させた。ビーズをDNAと混合し、混合物を、軽く回転させながら室温で30分間インキュベートした。インキュベーション後、ビーズを、0.05% tween-20を含む1x結合および洗浄緩衝液で3回、1x PNK緩衝液(NEB)で1回洗浄した。(14)ビーズを、41μL H2O、5μL 10x PNK緩衝液(NEB)、3μL T4 PNK (NEB)、1μL RNアーゼ阻害剤中に懸濁させ、37℃で30分間振盪し、次いで、別の3μL T4 PNKおよび6μL 10 mM ATPを添加し、37℃でさらに30分間振盪する。(15)ビーズを、0.05% tween-20を含む1x結合および洗浄緩衝液で2回、1xライゲーション緩衝液(NEB)で1回洗浄する。(16)ビーズを、668μL H2O、100μL 10xリガーゼ緩衝液(NEB)、10μL RNアーゼ阻害剤、2μL 10 mM ATP、20μL T4 RNAリガーゼ2 (高濃度) (NEB)、200μL 50% PEG 8000中に懸濁させ、16℃で16時間回転させる。(17)ビーズを、0.05% tween-20を含む1x結合および洗浄緩衝液で2回、H2Oで1回洗浄する。次いで、ビーズを30μL H2O中で加熱しそしてビーズを95℃で10分間振盪することによって、RNAを溶出する。(18)製造郷社からのプロトコルに従うことによってSMARTer Stranded Total RNA-seq Kit v2 - Pico Input (Takara)を使用して、回収されたRNAの半分をライブラリー構築のために取る。(19)Novaseq PE150モードにおいてライブラリーを配列決定し、下流の解析を行う。
本明細書に開示される任意の態様が、本明細書に開示される任意の他の態様と実施されまたは組み合わされ得、例えば、化合物についての態様の局面は、組み合わされかつ/または置き換えられ得、ありとあらゆる化合物が、本明細書に記載される任意の方法の文脈において実施され得る。同様に、任意の方法態様の局面が、本明細書に開示される任意の他の方法態様と組み合わされかつ/または置き換えられ得る。さらに、本明細書に開示される任意の方法が、方法を達成するための「組成物の使用」の形態で記載され得る。本発明の一態様に関して議論される任意の限定が、本発明の任意の他の態様へ適用され得ることが、具体的に考慮される。さらに、本発明の任意の組成物が本発明の任意の方法において使用され得、本発明の任意の方法が、本発明の組成物を製造または利用するために使用され得る。
[本発明1001]
式:
Figure 2021523133
を有する化合物であって、
式中、Yが、アルキン、アジド、歪みアルキン、ジエン、ジエンオフィル(dieneophile)、アルコキシアミン、カルボニル、ホスフィン、ヒドラジド、チオール、およびアルケンより選択されるクリックケミストリー部分であり;かつ、Xがリンカーである、
前記化合物。
[本発明1002]
Xがアジドである、本発明1001の化合物。
[本発明1003]
リンカーが、C1〜C10アルキルまたはポリエチレングリコールリンカーである、本発明1001または1002の化合物。
[本発明1004]
YがCH 2 である、本発明1001〜1003のいずれかの化合物。
[本発明1005]
式:
Figure 2021523133
を有する化合物。
[本発明1006]
グアニン塩基を標識するための方法であって、
反応混合物を形成するために、標識されるグアニンを本発明1001の化合物と接触させる工程、および
反応混合物を30〜40℃で少なくとも5分間インキュベートする工程
を含む、前記方法。
[本発明1007]
前記化合物がN 3 -ケトキサールである、本発明1006の方法。
[本発明1008]
ポリヌクレオチド中にグアニンがさらに含まれている、本発明1006または1007の方法。
[本発明1009]
前記ポリヌクレオチドがリボ核酸(RNA)である、本発明1008の方法。
[本発明1010]
前記ポリヌクレオチドがデオキシリボ核酸(DNA)である、本発明1008の方法。
[本発明1011]
RNAがRNA転写物である、本発明1009の方法。
[本発明1012]
細胞中の一本鎖核酸を標識するための方法であって、
(i)ケトキサール誘導体標識グアニン塩基を有する核酸を含む処理細胞を形成するために、標的細胞を本発明1001の化合物と接触させる工程;
(ii)処理細胞を少なくとも2つのクリックケミストリー反応性部分およびタグを含む架橋部分と接触させる工程であって、ここで、該架橋部分が、2つの近接ケトキサール誘導体標識グアニンを架橋して架橋核酸を形成する、工程;および
(iii)断片化し、かつ該タグに対する親和性を有する試薬を使用して架橋核酸を単離する工程
を含む、前記方法。
[本発明1013]
前記タグがビオチンである、本発明1012の方法。
[本発明1014]
前記タグに対する親和性を有する試薬が、ストレプトアビジンである、本発明1013の方法。
[本発明1015]
クリックケミストリー反応性部分が、ジベンゾシクロオクチン部分である、本発明1012〜1014のいずれかの方法。
[本発明1016]
架橋核酸が2つ以上の核酸を含む、本発明1012〜1015のいずれかの方法。
[本発明1017]
架橋核酸がRNAである、本発明1012〜1016のいずれかの方法。
[本発明1018]
インビボでのトランスクリプトーム全体のRNA二次構造マッピングおよびRNA G-四重鎖予測のための方法であって、
(a)インビボで核酸をケトキサールクリックケミストリー誘導体で標識する工程;
(b)標識核酸をビオチン化する工程;
(c)標識化されかつビオチン化された核酸を断片化する工程;
(d)断片化/ビオチン化核酸から相補DNA(cDNA)を合成する工程;
(e)ビオチン化核酸と結合した合成cDNAを単離する工程;
(f)サイズに基づいてcDNAを分離する工程;
(g)環化cDNAライブラリーを形成するために、分離されたcDNAの環化を行う工程;および
(h)環化cDNAライブラリーを増幅する工程
を含む、前記方法。
[本発明1019]
cDNAの環化が、一本鎖DNAリガーゼでのcDNAのライゲーションを含む、本発明1018の方法。
[本発明1020]
環化cDNAライブラリーを増幅する工程が、ポリメラーゼ連鎖反応(PCR)を含む、本発明1018の方法。
[本発明1021]
ケトキサール誘導体タンパク質架橋に対するRNA/タンパク質相互作用を解析するための方法であって、
(a)RNAに近接しているタンパク質標的を、活性化可能なタンパク質架橋性部分に結合されたケトキサール誘導体と接触させて、標的/ケトキサール誘導体混合物を形成する工程;
(b)タンパク質架橋性部分を活性化するために標的/ケトキサール誘導体混合物を活性化因子へ曝露して、架橋された標的/ケトキサール誘導体複合体を形成する工程;
(c)架橋された標的/ケトキサール誘導体複合体を、タンパク質標的に結合する親和性物質を使用して単離する工程;および
(d)標的/ケトキサール誘導体複合体と共に単離されたRNAを同定する工程
を含む、前記方法。
[本発明1022]
前記活性化可能な架橋性部分が、グルタル酸ジスクシンイミジル、スベリン酸ジスクシンイミジル、酒石酸ジスクシンイミジル、アジプイミド酸ジメチル、ピメルイミド酸ジメチル、スベルイミド酸ジメチル、1,5-ジフルオロ-2,4-ジニトロベンゼン、N-マレイミドプロピオン酸ヒドラジド、3-(2-ピリジルジチオ)プロピオニルヒドラジド、ビスマレイミドエタン、ジアザリン(diazarine)、ヨード酢酸スクシンイミジル、N-マレイミドアセトキシスクシンイミドエステル、3-(2-ピリジルジチオ)プロピオン酸スクシンイミジルまたはベンゾフェノンである、本発明1021の方法。
[本発明1023]
活性化因子が光である、本発明1021〜1022のいずれかの方法。
[本発明1024]
光が紫外線である、本発明1023の方法。
[本発明1025]
光が約350〜375 nmの波長を有する、本発明1024の方法。
[本発明1026]
光が365 nmの波長を含む、本発明1025の方法。
[本発明1027]
アジド-ケトキサール(N 3 -ケトキサール)を合成するための方法であって、
(a) (i)テトラヒドロフラン(THF)中で水素化ナトリウムを2-アジドエタノールと混ぜ合わせて第1の中間混合物を形成すること、
(ii)2-ブロモプロピオン酸エチルを第1の中間混合物へ添加して第1の反応混合物を形成すること、
(iii)第1の反応混合物を窒素(N 2 )雰囲気下で室温にてインキュベートして2-(2-アジドエトキシ)プロパン酸を形成すること、
(iv)反応を水でクエンチすること、
(v)2-(2-アジドエトキシ)プロパン酸をLiOH水溶液へ添加し、室温でインキュベートすること、および
(vi)2-(2-アジドエトキシ)プロパン酸を洗浄し、単離し、無水Na 2 SO 4 で乾燥させること
によって、2-(2-アジドエトキシ)プロパン酸中間体を生成する工程;
(b) (i)2-(2-アジドエトキシ)プロパン酸を無水CH 2 Cl 2 およびジメチルホルムアミド(DMF)中に溶解すること、
(ii)塩化オキサリルを添加し、室温で撹拌すること、
(iii)溶媒および過剰な塩化オキサリルを除去して残留物を形成すること、
(iv)残留物を無水CH 3 CNおよび(トリメチルシリル)ジアゾメタン中に溶解すること、
(v)ジエチルエーテルを滴下して第2の反応混合物を形成すること、
(vi)第2の反応混合物を0℃で一晩撹拌すること、
(vii)溶媒を蒸発させて3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オンを単離すること
によって、3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オン中間体を生成する工程;ならびに
(c) (i)3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オンをアセトン中のジメチルジオキシラン(DMD-アセトン)へ添加して第3の反応混合物を形成すること、
(ii)第3の反応混合物を室温で撹拌してN 3 -ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを形成すること、および
(iii)N 3 -ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを単離すること
によって、N 3 -ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを生成する工程
を含む、前記方法。
(図1)図1A〜F:N3-ケトキサールならびにその選択性、細胞浸透性および可逆性の実験評価。(a)N3-ケトキサールの構造およびグアニンとの反応。(b)N3-ケトキサールは一本鎖RNA(ssRNA)のみと反応することを実証する変性ゲル電気泳動。(c)N3-ケトキサールと反応するRNAオリゴの質量スペクトル分析。4つのグアニンを有するRNA 1において、全てのグアニンかつグアニンのみがN3-ケトキサールで標識された。グアニンを有さないRNA 2において、N3-ケトキサール標識化は観察されなかった。(d)上部:ケトキサールおよびN3-ケトキサールとFAM-RNAオリゴ
Figure 2021523133
との標識化反応ならびにビオチン-DBCOでのビオチン化(レーン5、6)の変性ゲル電気泳動分析。N3-ケトキサール標識RNAのみがビオチン化され得る(レーン6)。下部:標識化およびビオチン化反応後のRNAのドットブロット。メチレンブルードット結果が対照として列挙される。(e)異なる期間、1、5、10、15、20分でN3-ケトキサールによって処理された、mES細胞由来の単離された全RNAのドットブロット。(f)95℃にて50 mM GTPの存在下でのN3-ケトキサール標識mRNAの可逆性のドットブロット分析。mRNA中のN3-ケトキサール修飾は、10分間インキュベーション後に完全に除去された。
(図2)図2A〜F:(a)2つの個々のssDNA-seqライブラリー間のピアソン相関。(b)ピーク数および2つの個々のssDNA-seqライブラリー間のそれらの重複。(c)異なるゲノム特徴上のssDNAピークの分布。(d)同じ遺伝子座での対応するATAC-seq、H3K4me3 ChIP-seq、H3K36mes ChIP-seq、GRO-seqおよびPol II ChIP-seqプロフィールを伴った、UCSCゲノムブラウザ上での整列されたssDNA-seqリードのスナップショット。(e)ATAC-seq、H3K36me3 ChIP-seq、R-ChIPおよびGRO-seqと比較した、遺伝子コーディング領域上のssDNA-seqピークの分布。(f)ssDNA-seqと他の転写関連ゲノムワイドシーケンシングアッセイとの相関。
(図3)図3A〜E:(a)全ての発現遺伝子を、高、中または低RNAレベルを有する3つの群へ分類する。(b)(a)に示される3つの群中のssDNA、ATAC-seq H3K36me3およびH3K27acシグナル。(c)対照、DRB処理およびトリプトライド処理細胞中のssDNAピーク数(各条件について2つのレプリケートを行った、Trip = トリプトライド)。(d)対照、DRB処理およびトリプトライド処理条件における、遺伝子コーディング領域上のssDNA-seqピークの分布。(e)全ての遺伝子を、対照およびDRB処理条件下でのそれらのssDNA形成に従って異なるPol II休止および活性を有する4つの群へ分類した。各群中の一例をUCSCゲノムブラウザ上に示した。
(図4)図4A〜G:(a)ケトキサール補助RNA-RNA相互作用(KARRI)のスキーム。ボールはPAMAMデンドリマーを表す。ドットおよびロッドは、それぞれ、ビオチンおよびDBCO部分を表す。(b)〜(c)N3-ケトキサール標識RNAに対するDBCOおよびビオチン装飾PAMAMデンドリマーによる架橋の効率のゲル電気泳動(b)およびドットブロット(c)分析。(d)2つの個々のKARRIライブラリー間のピアソン相関。(e)デンドリマーを添加しなかったまたは近接ライゲーションを行わなかった2つの対照実験を伴う、KARRIによって明らかにされた45S rRNAの相互作用マップ。(f)PARISによって明らかにされた45S rRNAの相互作用マップ。(g)KARRIはRPL17 mRNAの2つの代替コンフォメーションを明らかにする。
(図5)図5A〜C:(a)KARRIがインビトロおよびインビボでのRNA二次構造間の差異を検出することを示す2つの例。ハリングトニン処理細胞において、インビボ特異的構造は損なわれ、一方、いくつかのインビトロ特異的特徴が現われた。関心対象の領域は円である。(b)インビトロ、インビボ、CHXおよびHT処理サンプル中の分子内mRNA二次構造のメタジーンプロフィール(metagene profile)。(c)HepG2 mRNAの全てのキメラリードのモチーフ解析結果。AGAGAAはeIF4AIIIの公知の結合モチーフと同様である。
(図6)図6A〜C:(a)光補助RNA標識化のスキーム。365 nm UVは光脱ケージ化反応を誘発し、生成物は、「クリック」ケミストリーを通してN3-ケトキサール標識核酸へ捕捉およびコンジュゲートされ得る。(b)光補助RNA標識化の質量スペクトル分析。(c)フォト-DBCO-OHの2つの潜在的な官能化戦略ならびにインサイチュRNAシーケンシングおよびイメージングにおけるそれらの潜在的な適用。
(図7)図7A〜F:Keth-seq法およびrG4領域周りのプロフィール。(a)keth-seqのライブラリー調製のための戦略の図。(b)N3-ケトキサールサンプルについてのレプリケート間の逆転写(RT)停止リード分布の散布図。挿入円グラフは、レプリケート2(左上)およびレプリケート1(右下)についてのRT停止塩基分布を示す。(c)全ての転写物についてのketh-seqおよびicSHAPE間の相関係数の累積プロット。各々の共通の転写物について、ピアソン相関係数をグアニン塩基の構造シグナルについて計算する。(d)予測される18SリボソームRNA構造およびプロービング構造プロフィール間の比較。予測される18S rRNA構造はRNA STRANDデータベース(id: CRW_00356)に由来する。(e)PDSおよび対照サンプル間の一般に知られているrG4領域のGINI指数。rG4領域はKit et.al., 2016, Nature methodに由来する(n = 13,423)。105個の領域が構造情報を有し、プロットされている(50ヌクレオチド長へ延長される)。(f)以前に同定されたインビトロrG4領域周りの構造プロフィールの2つの例。
(図8)4種類のRNA核塩基とのN3-ケトキサールのHPLC結果。N3-ケトキサールはグアニン(G)のみと反応することができ、A、C、およびUでは不活性であったことが示された。
(図9)N3-ケトキサールおよびSHAPE分子NAIのRNA反応性の比較。NAIを以前の報告された方法に従って合成した(Spitale et al., Nature Chemical Biology 9:18, 2012)。上部のグラフ:12 mer RNAオリゴの分子量(MW)。中央のグラフ:12 mer RNAオリゴとN3-ケトキサールとの反応の生成物のMW。下部のグラフ:RNAオリゴとNAIとの反応の生成物のMW。結果は、全てのグアニン(4つのグアニン)がN3-ケトキサールによって修飾されたことを示した。NAI反応について、いくつかのオリゴは1個のNAIによってのみ反応され、いくつかは2または3個によって標識された。原則として、RNAオリゴのリボース(12個のリボース)中の全ての2’-OH基がNAIの標的である。従って、N3-ケトキサールはRNAへのより高い反応性を示した。
(図10)RNA中におけるN3-ケトキサール標識化およびビオチン化反応のスキーム(上部)および質量スペクトル(下部)分析。4つのグアニンを有する10mer RNAをこの実験において使用した。
(図11)細胞状況におけるN3-ケトキサールによるG標識化の時間依存。1分間および5分間のN3-ケトキサールによる処理後、mES細胞のRNAを単離し、keth-seqを行い、これは、G停止部位が1分間から5分間へ向かって増加したことを示す。
(図12)図12A〜C:N3-ケトキサール標識RNAの可逆性。(a)スキームは、過剰なGTPの存在下でのN3-ケトキサール-グアニン反応の平衡変化を示す。N3-ケトキサール-グアニンは、過剰なGTPを用いて元の未反応RNAへ解離するのが遥かにより容易である。(b)MALDI-TOFモニタリングによるN3-ケトキサール標識RNAの可逆性。ケトキサール修飾は、37℃で中性緩衝液中で50 mM GTPと共に2時間インキュベーション後、大部分が除去され、6時間まで延長された場合はほぼ除去された。(c)上部:異なるインキュベーション期間中のPBS緩衝液(pH = 7.4)中95℃での50 mM GTPと共のN3-ケトキサール標識mRNAのドットブロット結果。下部:上部ドットブロットサンプルと同じ異なるインキュベーション条件下でのRNA断片の変性ゲル電気泳動。断片化RNAの長さは、過剰なGTPの存在下での10分間以内の95℃にてほとんど影響を受けなかった。
(図13)図13A〜C:ホウ酸緩衝液によるケトキサール標識RNAの固定。(a)グアニン-ケトキサールの付加物の隣接ジオール基は、ケトキサール修飾を固定するためにボレート分子と結合させることができる。(b)MALDI-TOF検出によるグアニン-ケトキサール-ホウ素複合体の形成。グアニン-ケトキサールの付加物を4-(アミノメチル)ベンゼンボロン酸と共にインキュベートした。(c)ホウ酸緩衝液の存在下でのグアニン-ケトキサール-ホウ素複合体の安定性試験。大部分のグアニン-ケトキサール付加物がホウ酸緩衝液固定によって保持され、一方、ホウ酸緩衝液の非存在下では全てのグアニン-ケトキサール付加物が消滅した。
(図14)図14A〜D:keth-seq法の品質管理。(a)N3-ケトキサール(左)および未処理対照(右)サンプルについてのレプリケート間のRPKM相関。(b)RTは、N3-ケトキサール、N3-ケトキサール除去サンプル、および未処理対照サンプルについてのレプリケートのリード分布を止めた。(c)インビボおよびインビトロmRNAサンプルの構造シグナル。(d)構造情報を有するmRNAおよび+PDSサンプル中の公知のrG4領域の重複。
(図15)異なるサンプル間のリード分布の例。タンパク質をコードするRNA mt-Atp8について、末端が97から108までの位置内にあった全てのマッピングされたリードを示す。リードは末端位置によってグループ化および着色されている。ここで、N3-ケトキサールサンプルにおいて、リードの大部分はグアニンで止まり、一方、N3-ケトキサール除去および未処理対照サンプルにおいて、リードは遥かにより均一に分布し、従って、N3-ケトキサール分子の高特異性を示唆している。リード群の大部分について、対照よりも除去サンプルにおいて同じ末端でより多くのより長いリードがある(例えば、強調された青緑色および赤色リード群)。対照サンプルに対する除去サンプル中の完全長リード突出のより高い比率は、より高い信頼性を有するRT停止部位を示し得る。
(図16)天然および+PDS条件の両方の下でのケトキサールおよび対照サンプルの潜在的なrG4領域周りのカバレッジトラックを示す2つの例。
(図17)N3-ケトキサールサンプル、N3-ケトキサール除去サンプル、および未処理対照サンプルのライブラリー調製の詳細なフローチャート。
(図18)図18A〜B:(a)ケトキサール-Daz CLIPの略図。RNAは、インキュベーションおよび365 nm UV照射後にインサイチュでRNA結合性タンパク質へ共有結合的に架橋される。これに、細胞溶解、および架橋された複合体の精製が続く。タンパク質を消化し、精製されたRNAを逆転写し(retrotranscribe)、次世代シーケンシングへ供した。(b)ケトキサール-Dazの分子構造。

Claims (27)

  1. 式:
    Figure 2021523133
    を有する化合物であって、
    式中、Yが、アルキン、アジド、歪みアルキン、ジエン、ジエンオフィル(dieneophile)、アルコキシアミン、カルボニル、ホスフィン、ヒドラジド、チオール、およびアルケンより選択されるクリックケミストリー部分であり;かつ、Xがリンカーである、
    前記化合物。
  2. Xがアジドである、請求項1記載の化合物。
  3. リンカーが、C1〜C10アルキルまたはポリエチレングリコールリンカーである、請求項1または2記載の化合物。
  4. YがCH2である、請求項1〜3のいずれか一項記載の化合物。
  5. 式:
    Figure 2021523133
    を有する化合物。
  6. グアニン塩基を標識するための方法であって、
    反応混合物を形成するために、標識されるグアニンを請求項1記載の化合物と接触させる工程、および
    反応混合物を30〜40℃で少なくとも5分間インキュベートする工程
    を含む、前記方法。
  7. 前記化合物がN3-ケトキサールである、請求項6記載の方法。
  8. ポリヌクレオチド中にグアニンがさらに含まれている、請求項6または7記載の方法。
  9. 前記ポリヌクレオチドがリボ核酸(RNA)である、請求項8記載の方法。
  10. 前記ポリヌクレオチドがデオキシリボ核酸(DNA)である、請求項8記載の方法。
  11. RNAがRNA転写物である、請求項9記載の方法。
  12. 細胞中の一本鎖核酸を標識するための方法であって、
    (i)ケトキサール誘導体標識グアニン塩基を有する核酸を含む処理細胞を形成するために、標的細胞を請求項1記載の化合物と接触させる工程;
    (ii)処理細胞を少なくとも2つのクリックケミストリー反応性部分およびタグを含む架橋部分と接触させる工程であって、ここで、該架橋部分が、2つの近接ケトキサール誘導体標識グアニンを架橋して架橋核酸を形成する、工程;および
    (iii)断片化し、かつ該タグに対する親和性を有する試薬を使用して架橋核酸を単離する工程
    を含む、前記方法。
  13. 前記タグがビオチンである、請求項12記載の方法。
  14. 前記タグに対する親和性を有する試薬が、ストレプトアビジンである、請求項13記載の方法。
  15. クリックケミストリー反応性部分が、ジベンゾシクロオクチン部分である、請求項12〜14のいずれか一項記載の方法。
  16. 架橋核酸が2つ以上の核酸を含む、請求項12〜15のいずれか一項記載の方法。
  17. 架橋核酸がRNAである、請求項12〜16のいずれか一項記載の方法。
  18. インビボでのトランスクリプトーム全体のRNA二次構造マッピングおよびRNA G-四重鎖予測のための方法であって、
    (a)インビボで核酸をケトキサールクリックケミストリー誘導体で標識する工程;
    (b)標識核酸をビオチン化する工程;
    (c)標識化されかつビオチン化された核酸を断片化する工程;
    (d)断片化/ビオチン化核酸から相補DNA(cDNA)を合成する工程;
    (e)ビオチン化核酸と結合した合成cDNAを単離する工程;
    (f)サイズに基づいてcDNAを分離する工程;
    (g)環化cDNAライブラリーを形成するために、分離されたcDNAの環化を行う工程;および
    (h)環化cDNAライブラリーを増幅する工程
    を含む、前記方法。
  19. cDNAの環化が、一本鎖DNAリガーゼでのcDNAのライゲーションを含む、請求項18記載の方法。
  20. 環化cDNAライブラリーを増幅する工程が、ポリメラーゼ連鎖反応(PCR)を含む、請求項18記載の方法。
  21. ケトキサール誘導体タンパク質架橋に対するRNA/タンパク質相互作用を解析するための方法であって、
    (a)RNAに近接しているタンパク質標的を、活性化可能なタンパク質架橋性部分に結合されたケトキサール誘導体と接触させて、標的/ケトキサール誘導体混合物を形成する工程;
    (b)タンパク質架橋性部分を活性化するために標的/ケトキサール誘導体混合物を活性化因子へ曝露して、架橋された標的/ケトキサール誘導体複合体を形成する工程;
    (c)架橋された標的/ケトキサール誘導体複合体を、タンパク質標的に結合する親和性物質を使用して単離する工程;および
    (d)標的/ケトキサール誘導体複合体と共に単離されたRNAを同定する工程
    を含む、前記方法。
  22. 前記活性化可能な架橋性部分が、グルタル酸ジスクシンイミジル、スベリン酸ジスクシンイミジル、酒石酸ジスクシンイミジル、アジプイミド酸ジメチル、ピメルイミド酸ジメチル、スベルイミド酸ジメチル、1,5-ジフルオロ-2,4-ジニトロベンゼン、N-マレイミドプロピオン酸ヒドラジド、3-(2-ピリジルジチオ)プロピオニルヒドラジド、ビスマレイミドエタン、ジアザリン(diazarine)、ヨード酢酸スクシンイミジル、N-マレイミドアセトキシスクシンイミドエステル、3-(2-ピリジルジチオ)プロピオン酸スクシンイミジルまたはベンゾフェノンである、請求項21記載の方法。
  23. 活性化因子が光である、請求項21〜22のいずれか一項記載の方法。
  24. 光が紫外線である、請求項23記載の方法。
  25. 光が約350〜375 nmの波長を有する、請求項24記載の方法。
  26. 光が365 nmの波長を含む、請求項25記載の方法。
  27. アジド-ケトキサール(N3-ケトキサール)を合成するための方法であって、
    (a) (i)テトラヒドロフラン(THF)中で水素化ナトリウムを2-アジドエタノールと混ぜ合わせて第1の中間混合物を形成すること、
    (ii)2-ブロモプロピオン酸エチルを第1の中間混合物へ添加して第1の反応混合物を形成すること、
    (iii)第1の反応混合物を窒素(N2)雰囲気下で室温にてインキュベートして2-(2-アジドエトキシ)プロパン酸を形成すること、
    (iv)反応を水でクエンチすること、
    (v)2-(2-アジドエトキシ)プロパン酸をLiOH水溶液へ添加し、室温でインキュベートすること、および
    (vi)2-(2-アジドエトキシ)プロパン酸を洗浄し、単離し、無水Na2SO4で乾燥させること
    によって、2-(2-アジドエトキシ)プロパン酸中間体を生成する工程;
    (b) (i)2-(2-アジドエトキシ)プロパン酸を無水CH2Cl2およびジメチルホルムアミド(DMF)中に溶解すること、
    (ii)塩化オキサリルを添加し、室温で撹拌すること、
    (iii)溶媒および過剰な塩化オキサリルを除去して残留物を形成すること、
    (iv)残留物を無水CH3CNおよび(トリメチルシリル)ジアゾメタン中に溶解すること、
    (v)ジエチルエーテルを滴下して第2の反応混合物を形成すること、
    (vi)第2の反応混合物を0℃で一晩撹拌すること、
    (vii)溶媒を蒸発させて3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オンを単離すること
    によって、3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オン中間体を生成する工程;ならびに
    (c) (i)3-(2-アジドエトキシ)-1-ジアゾペンタン-2-オンをアセトン中のジメチルジオキシラン(DMD-アセトン)へ添加して第3の反応混合物を形成すること、
    (ii)第3の反応混合物を室温で撹拌してN3-ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを形成すること、および
    (iii)N3-ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを単離すること
    によって、N3-ケトキサールまたは3-(2-アジドエトキシ)-1,1-ジヒドロキシブタン-2-オンを生成する工程
    を含む、前記方法。
JP2020562567A 2018-05-08 2019-05-08 ケトキサール誘導体に関連する組成物および方法 Pending JP2021523133A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862668543P 2018-05-08 2018-05-08
US62/668,543 2018-05-08
US201862668994P 2018-05-09 2018-05-09
US62/668,994 2018-05-09
PCT/US2019/031287 WO2019217533A1 (en) 2018-05-08 2019-05-08 Compositions and methods related to kethoxal derivatives

Publications (2)

Publication Number Publication Date
JP2021523133A true JP2021523133A (ja) 2021-09-02
JPWO2019217533A5 JPWO2019217533A5 (ja) 2022-05-16

Family

ID=68467084

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020562567A Pending JP2021523133A (ja) 2018-05-08 2019-05-08 ケトキサール誘導体に関連する組成物および方法

Country Status (6)

Country Link
US (2) US20210214773A1 (ja)
EP (2) EP3790544A4 (ja)
JP (1) JP2021523133A (ja)
CN (2) CN112384524A (ja)
AU (1) AU2019265569A1 (ja)
WO (2) WO2019217533A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114269332A (zh) * 2019-05-22 2022-04-01 芝加哥大学 涉及拴系的乙氧二羟丁酮衍生物的组合物和方法
WO2022216555A1 (en) * 2021-04-09 2022-10-13 The Board Of Trustees Of The Leland Stanford Junior University Methods for assessing specificity of crispr-mediated genome editing
WO2022257354A1 (zh) * 2021-06-11 2022-12-15 北京大学 检测核酸分子中n6-甲基腺嘌呤的方法及试剂盒
CN114990145B (zh) * 2022-06-21 2024-01-19 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 一种高亲和力动态捕获dna双链断裂修复相关蛋白的方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2889243A (en) * 1956-04-30 1959-06-02 Upjohn Co Virucidal compositions and method
JPH02150299A (ja) * 1988-07-13 1990-06-08 Bioprobe Syst 核ゾンデの標識付け方法及びそれを実施するための試薬キット

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5385933A (en) * 1989-02-27 1995-01-31 The United States Of America As Represented By The Department Of Health And Human Services Method for the treatment of cancer by use of the copper complex of S-(methylthio)-DL-homocysteine or the L-enantiomorph thereof
US20050227251A1 (en) * 2003-10-23 2005-10-13 Robert Darnell Method of purifying RNA binding protein-RNA complexes
US8603792B2 (en) * 2009-03-27 2013-12-10 Life Technologies Corporation Conjugates of biomolecules to nanoparticles
AU2017223600B2 (en) * 2016-02-23 2023-08-03 Dovetail Genomics Llc Generation of phased read-sets for genome assembly and haplotype phasing
EP3507297A4 (en) * 2016-09-02 2020-05-27 Ludwig Institute for Cancer Research Ltd GENOM-WIDE IDENTIFICATION OF CHROMATIN INTERACTIONS

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2889243A (en) * 1956-04-30 1959-06-02 Upjohn Co Virucidal compositions and method
JPH02150299A (ja) * 1988-07-13 1990-06-08 Bioprobe Syst 核ゾンデの標識付け方法及びそれを実施するための試薬キット

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ROBERT SHAPIRO ET AL.: "On the Reaction of Guanine with Glyoxal, Pyruvaldehyde, and Kethoxal, and the Structure of the Acylg", BIOCHEMISTRY, vol. Volume 8, Issue 1, JPN6023019173, 1 January 1969 (1969-01-01), pages 238 - 245, ISSN: 0005057117 *

Also Published As

Publication number Publication date
CN112384524A (zh) 2021-02-19
CN112367988A (zh) 2021-02-12
US20210317506A1 (en) 2021-10-14
WO2019217549A1 (en) 2019-11-14
EP3790544A4 (en) 2022-04-27
AU2019265569A1 (en) 2020-12-24
US20210214773A1 (en) 2021-07-15
WO2019217533A1 (en) 2019-11-14
EP3790544A1 (en) 2021-03-17
EP3790887A4 (en) 2022-02-16
EP3790887A1 (en) 2021-03-17

Similar Documents

Publication Publication Date Title
JP2021523133A (ja) ケトキサール誘導体に関連する組成物および方法
US11965209B2 (en) Method for obtaining structural information concerning an encoded molecule and method for selecting compounds
Silverman DNA as a versatile chemical component for catalysis, encoding, and stereocontrol
US10011868B2 (en) Reactivity-dependent and interaction-dependent PCR
Becker et al. Selective ribosome profiling as a tool for studying the interaction of chaperones and targeting factors with nascent polypeptide chains and ribosomes
Wang et al. C9orf72 and triplet repeat disorder RNAs: G-quadruplex formation, binding to PRC2 and implications for disease mechanisms
CA2934126C (en) Production of encoded chemical libraries
Lu et al. Transposase-assisted tagmentation of RNA/DNA hybrid duplexes
KR20020007332A (ko) 일 단계 샘플 제조 및 복합적인 생물학적 샘플에서 핵산의검출
JP6243013B2 (ja) 5−ホルミルシトシン特異的な化学標識法及びその利用
US20090163371A1 (en) Anchor-Assisted Fragment Selection and Directed Assembly
CN107760686B (zh) Dkk-1蛋白的核酸适配体及其应用
JP2012198225A (ja) 標的分子の検出法
US20150045237A1 (en) Method for identification of the sequence of poly(a)+rna that physically interacts with protein
SG185239A1 (en) Method for identifying nucleic acids bound to an analyte
JP2008253176A (ja) 高親和性分子取得のためのリンカー
JP2004097213A (ja) 核酸および/またはタンパク質の選択方法
CA3195218A1 (en) Methods of identifying protein binding sites on rna
Davydova et al. Reporter-recruiting bifunctional aptasensor for bioluminescent analytical assays
Peralta et al. Molecular recognition of HIV-1 RNAs with branched peptides
JP2022532796A (ja) 係留ケトキサール誘導体に関連する組成物および方法
US11060129B2 (en) Aptamer digestion method
Strobel et al. Chemical transcription roadblocking for nascent RNA display
Sutandy Deciphering the binding regulation of the core splicing factor U2AF65 using in vitro iCLIP
JP2021122218A (ja) 対象核酸の塩基配列を1細胞レベルで並列に検出する方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20210129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220506

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220506

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230515

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20230612

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20231211