JP2024500804A - Compositions and methods for their identification for use in the treatment of CHD2 haploinsufficiency - Google Patents

Compositions and methods for their identification for use in the treatment of CHD2 haploinsufficiency Download PDF

Info

Publication number
JP2024500804A
JP2024500804A JP2023537335A JP2023537335A JP2024500804A JP 2024500804 A JP2024500804 A JP 2024500804A JP 2023537335 A JP2023537335 A JP 2023537335A JP 2023537335 A JP2023537335 A JP 2023537335A JP 2024500804 A JP2024500804 A JP 2024500804A
Authority
JP
Japan
Prior art keywords
nucleic acid
acid agent
sequence
sequences
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023537335A
Other languages
Japanese (ja)
Inventor
ウリツキー、イゴル
ジェーン ロス、キャロライン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yeda Research and Development Co Ltd
Original Assignee
Yeda Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yeda Research and Development Co Ltd filed Critical Yeda Research and Development Co Ltd
Publication of JP2024500804A publication Critical patent/JP2024500804A/en
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/11Antisense
    • C12N2310/113Antisense targeting other non-coding nucleic acids, e.g. antagomirs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/323Chemical structure of the sugar modified ring structure
    • C12N2310/3231Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/34Spatial arrangement of the modifications
    • C12N2310/341Gapmers, i.e. of the type ===---===

Abstract

神経細胞内のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)の量を増加させる方法を提供する。前記方法は、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤を前記細胞に導入することを含み、前記核酸剤は、ヒトChaserrの最終エクソンへと指向しており、それによって、前記神経細胞内のCHD2の量を増加させる。A method of increasing the amount of chromodomain helicase DNA binding protein 2 (CHD2) in neuronal cells is provided. The method includes introducing into the cell a nucleic acid agent that down-regulates the activity or expression of human Chaser, the nucleic acid agent being directed to the final exon of human Chaser, thereby causing the neural cell to increases the amount of CHD2 in

Description

関連出願の相互参照
本出願は、2020年12月18日に出願された米国仮特許出願第63/127,212号明細書の優先権の利益を主張し、その全体を本明細書に組み込む。
CROSS-REFERENCE TO RELATED APPLICATIONS This application claims the benefit of priority to U.S. Provisional Patent Application No. 63/127,212, filed December 18, 2020, which is incorporated herein in its entirety.

(配列表の記載)
本出願の出願と同時に提出された、61,440バイトを含む、2021年12月19日に作成された89180SequenceListing.txtという名称のASCIIファイルは、参照により本明細書に組み込まれる。
(Description of sequence listing)
89180SequenceListing.Created on December 19, 2021, containing 61,440 bytes, filed at the same time as the filing of this application. The ASCII file named .txt is incorporated herein by reference.

本発明は、そのいくつかの実施形態では、CHD2ハプロ不全の処置に使用するための組成物、及びその同定方法に関する。 The present invention, in some embodiments thereof, relates to compositions for use in treating CHD2 haploinsufficiency, and methods for identifying the same.

クロモドメインヘリカーゼDNA結合タンパク質2(Chd2)遺伝子は、CHD1とともにクロモドメインヘリカーゼDNA結合(CHD)タンパク質ファミリーのサブファミリーIに属するATP依存性クロマチンリモデリング酵素をコードする。このサブファミリーのメンバーは、N末端領域に位置する2つのクロモドメインと、中央に位置するSNF2様ATPアーゼドメインとを特徴とし[Tajul-Arifin,K.et al.Identification and analysis of chromodomain-containing proteins encoded in the mouse transcriptome.Genome Res.13,1416-1429(2003)]、ヌクレオソームの分解、排除、スライド及びスペーシングを促進する[Narlikar,G.J.,Sundaramoorthy,R.&Owen-Hughes,T.Mechanisms and functions of ATP-dependent chromatin-remodeling enzymes.Cell 154,490-503(2013)]。 The chromodomain helicase DNA binding protein 2 (Chd2) gene encodes an ATP-dependent chromatin remodeling enzyme that, together with CHD1, belongs to subfamily I of the chromodomain helicase DNA binding (CHD) protein family. Members of this subfamily are characterized by two chromodomains located in the N-terminal region and a centrally located SNF2-like ATPase domain [Tajul-Arifin, K.; et al. Identification and analysis of chromodomain-containing proteins encoded in the mouse transcriptome. Genome Res. 13, 1416-1429 (2003)], promoting nucleosome disassembly, expulsion, sliding and spacing [Narlikar, G. J. , Sundaramoorthy, R. &Owen-Hughes, T. Mechanisms and functions of ATP-dependent chromatin-remodeling enzymes. Cell 154, 490-503 (2013)].

ヒトでは、CHD2ハプロ不全は、神経発達遅延、知的障害、てんかん及び問題行動に関連する[Lamar,K.-M.J.&Carvill,G.L.Chromatin remodeling proteins in epilepsy:lessons from CHD2-associated epilepsy.Front.Mol.Neurosci.11,208(2018)に概説されている]。マウスモデル及び細胞株を対象とした試験もまた、ニューロン機能不全にChd2が関与することを示している。 In humans, CHD2 haploinsufficiency is associated with neurodevelopmental delay, intellectual disability, epilepsy, and behavioral problems [Lamar, K.; -M. J. & Carvill, G. L. Chromatin remodeling proteins in epilepsy: lessons from CHD2-associated epilepsy. Front. Mol. Neurosci. 11, 208 (2018)]. Studies in mouse models and cell lines have also implicated Chd2 in neuronal dysfunction.

記載されている症例ではいずれも、これらの個体はCHD2に関してハプロ不全であり、したがって、CHD2のインタクトなWTコピーを有する。したがって、例えば、アンチセンスオリゴヌクレオチドを使用することによるChaserrの乱れを介したCHD2発現の増加は、治療上の利益を有する可能性がある。 In all of the cases described, these individuals are haploinsufficient for CHD2 and therefore have an intact WT copy of CHD2. Therefore, increasing CHD2 expression through perturbation of Chaser, for example by using antisense oligonucleotides, may have therapeutic benefits.

複数の証拠の系統が、長い非コードRNA(lncRNA)機能とクロマチン修飾複合体の機能との間に強い関連があることを指し示している[Han,P.&Chang,C.-P.Long non-coding RNA and chromatin remodeling.RNA Biol.12,1094-1098(2015)]。多数のクロマチン修飾因子がlncRNAと相互作用することが報告されている[Han et al.、上記]。さらに、脊椎動物ゲノム内のlncRNAは、多数のクロマチン関連タンパク質を含む転写関連因子をコードする遺伝子の近傍で富化されているが[Ulitsky,I.,Shkumatava,A.,Jan,C.H.,Sive,H.&Bartel,D.P.Conserved function of lincRNAs in vertebrate embryonic development despite rapid sequence evolution.Cell 147,1537-1550(2011)]、これらのlncRNAの大部分の機能は未知のままである。 Multiple lines of evidence point to a strong link between long noncoding RNA (lncRNA) function and the function of chromatin modification complexes [Han, P.; &Chang, C. -P. Long non-coding RNA and chromatin remodeling. RNA Biol. 12, 1094-1098 (2015)]. A number of chromatin modifiers have been reported to interact with lncRNA [Han et al. ,the above]. Furthermore, lncRNAs within vertebrate genomes are enriched near genes encoding transcription-related factors, including numerous chromatin-associated proteins [Ulitsky, I.; , Shkumatava, A. , Jan, C. H. , Sive, H. & Bartel, D. P. Conserved function of lincRNAs in vertebrate embryonic development destination rapid sequence evolution. Cell 147, 1537-1550 (2011)], the functions of most of these lncRNAs remain unknown.

本発明者らによる以前の研究は、マウスではChd2(Rom et al.Nature Communications 2019 10:5092):1810026B05Rik(Chaserrとして示される、CHD2隣接抑制調節RNA(CHD2 adjacent,suppressive regulatory RNA)について)及びヒトではLINC01578/LOC100507217(CHASERR)の上流に位置する保存されたlncRNAであるChaserrの存在を開示しており、Chd2と同じ鎖の上流に見出され、Chd2と同じ鎖から転写される、ほぼまったく特徴解析されていないlncRNAである。 Previous studies by the inventors have shown that in mice, the CHD2 adjacent, suppressive regulatory RNA (CHD2 adjacent, suppressi ve regulatory RNA) and humans discloses the existence of Chaserr, a conserved lncRNA located upstream of LINC01578/LOC100507217 (CHASERR), which is found upstream of and transcribed from the same strand as Chd2, and is almost completely uncharacteristic. This is an unanalyzed lncRNA.

Chaserrは、CHD2タンパク質と協調して作用して、適切なChd2発現レベルを維持する。マウスにおけるChaserrの喪失は、ホモ接合マウスでは早期の出生後致死、及びヘテロ接合体では重度の成長遅延をもたらす。機構的には、Chaserrの喪失は、Chd2 mRNA及びタンパク質のレベルを実質的に増加させ、これにより、高度に発現された遺伝子の下流に見出されるプロモーターを阻害することによる転写干渉がもたらされる。Chaserr産生は、シスのみでChd2発現を抑制し、Chd2が乱された場合にもChaserr喪失の表現型結果が救済される。したがって、Chaserrを標的とすることは、ハプロ不全個体では、CHD2レベルを増加させるための戦略になる可能性がある。 Chaserr acts in concert with the CHD2 protein to maintain appropriate Chd2 expression levels. Loss of Chaserr in mice results in early postnatal lethality in homozygous mice and severe growth retardation in heterozygotes. Mechanistically, loss of Chaserr substantially increases Chd2 mRNA and protein levels, leading to transcriptional interference by inhibiting promoters found downstream of highly expressed genes. Chaserr production suppresses Chd2 expression only in cis, and the phenotypic consequences of Chaserr loss are also rescued when Chd2 is perturbed. Therefore, targeting Chaserr may be a strategy to increase CHD2 levels in haploinsufficient individuals.

追加の背景技術には、以下が含まれる。
www(dot)iscb(dot)org/cms_addon/conferences/ismb2020/postersdotphp?track=RegSys%20COSI&session=Bgithub(dot)com/lncLOOM/lncLOOM
Additional background techniques include:
www(dot)iscb(dot)org/cms_addon/conferences/ismb2020/postersdotphp? track=RegSys%20COSI&session=Bgithub(dot)com/lncLOOM/lncLOOM

本発明のいくつかの実施形態の一態様によれば、神経細胞内のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)の量を増加させる方法であって、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤(nucleic acid agent)を細胞に導入することを含み、前記核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、神経細胞内のCHD2の量を増加させる方法が提供される。 According to one aspect of some embodiments of the invention, there is provided a method of increasing the amount of chromodomain helicase DNA binding protein 2 (CHD2) in a neuronal cell, the method comprising downregulating the activity or expression of human Chaserr. A method is provided for increasing the amount of CHD2 in a neuronal cell, the method comprising introducing into a cell a nucleic acid agent, said nucleic acid agent being directed to the final exon of human Chaserr. Ru.

本発明のいくつかの実施形態の一態様によれば、クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状の処置が必要な対象における、前記疾患又は病状を処置する方法であって、治療有効量のヒトChaserrの活性又は発現をダウンレギュレートする核酸剤を前記対象に投与することを含み、前記核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、前記CHD2ハプロ不全に関連する疾患又は病状を処置する方法が提供される。 According to one aspect of some embodiments of the invention, a method of treating a disease or condition associated with chromodomain helicase DNA binding protein 2 (CHD2) haploinsufficiency in a subject in need thereof. administering to said subject a therapeutically effective amount of a nucleic acid agent that down-regulates the activity or expression of human Chaser, said nucleic acid agent being directed to the final exon of human Chaser, thereby comprising: A method of treating a disease or condition associated with said CHD2 haploinsufficiency is provided.

本発明のいくつかの実施形態の一態様によれば、クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状の処置が必要な対象においての前記疾患又は病状の処置における使用のための、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤であって、ヒトChaserrの最終エクソンへと指向した核酸剤が提供される。 According to one aspect of some embodiments of the present invention, chromodomain helicase DNA binding protein 2 (CHD2) for use in the treatment of a disease or condition associated with haploinsufficiency in a subject in need of such treatment. Provided are nucleic acid agents for down-regulating the activity or expression of human Chaser, the nucleic acid agents being directed to the final exon of human Chaser.

本発明のいくつかの実施形態によれば、前記ヒトChaserrは、配列番号11(NR_037600)、配列番号12(NR_037601)、及び配列番号13(NR_037602)からなる群より選択される選択的にスプライシングされた変異体(alternatively spliced variant)を含む。 According to some embodiments of the invention, said human Chaserr is an alternatively spliced protein selected from the group consisting of SEQ ID NO: 11 (NR_037600), SEQ ID NO: 12 (NR_037601), and SEQ ID NO: 13 (NR_037602). including alternatively spliced variants.

本発明のいくつかの実施形態によれば、前記核酸剤は、配列番号2(AUGG)を含む核酸配列エレメントにハイブリダイズする。 According to some embodiments of the invention, the nucleic acid agent hybridizes to a nucleic acid sequence element comprising SEQ ID NO: 2 (AUGG).

本発明のいくつかの実施形態によれば、前記核酸剤は、AAGAUG(配列番号5)及びAAAUGGA(配列番号6)からなる群より選択される核酸配列エレメントにハイブリダイズする。 According to some embodiments of the invention, the nucleic acid agent hybridizes to a nucleic acid sequence element selected from the group consisting of AAGAUG (SEQ ID NO: 5) and AAAUGGA (SEQ ID NO: 6).

本発明のいくつかの実施形態によれば、前記核酸剤は、AAGAUG(配列番号5)及び/又はAAAUGGA(配列番号6)を含む核酸配列エレメントにハイブリダイズする。 According to some embodiments of the invention, the nucleic acid agent hybridizes to a nucleic acid sequence element comprising AAGAUG (SEQ ID NO: 5) and/or AAAUGGA (SEQ ID NO: 6).

本発明のいくつかの実施形態によれば、前記核酸剤は、ChaserrへのDHX36の結合を阻害する。 According to some embodiments of the invention, the nucleic acid agent inhibits DHX36 binding to Chaserr.

本発明のいくつかの実施形態によれば、前記核酸剤はアンチセンスオリゴヌクレオチドである。 According to some embodiments of the invention, the nucleic acid agent is an antisense oligonucleotide.

本発明のいくつかの実施形態によれば、前記アンチセンスオリゴヌクレオチドは、配列番号92~99(ここで、TはUによって置換されている)に記載の核酸塩基配列を有する。 According to some embodiments of the invention, the antisense oligonucleotide has a nucleobase sequence set forth in SEQ ID NOs: 92-99 (where T is replaced by U).

本発明のいくつかの実施形態によれば、前記核酸剤はRNAサイレンシング剤である。 According to some embodiments of the invention, the nucleic acid agent is an RNA silencing agent.

本発明のいくつかの実施形態によれば、前記核酸剤はゲノム編集剤(genome editing agent)である。 According to some embodiments of the invention, the nucleic acid agent is a genome editing agent.

本発明のいくつかの実施形態によれば、前記核酸剤は、誘導可能に活性である(is active in an inducible manner)。 According to some embodiments of the invention, the nucleic acid agent is active in an inducible manner.

本発明のいくつかの実施形態によれば、前記核酸剤は、組織特異的又は細胞特異的に活性である(is active in a tissue or cell-specific manner)。 According to some embodiments of the invention, the nucleic acid agent is active in a tissue or cell-specific manner.

本発明のいくつかの実施形態によれば、前記クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状は、知的障害、自閉症、てんかん及びレノックス・ガストー症候群(LGS)からなる群より選択される。 According to some embodiments of the invention, the diseases or conditions associated with chromodomain helicase DNA binding protein 2 (CHD2) haploinsufficiency include intellectual disability, autism, epilepsy, and Lennox-Gastaut syndrome (LGS). selected from the group consisting of.

本発明のいくつかの実施形態の一態様によれば、複数の相同なポリヌクレオチドを記述する配列のセットを分析する方法であって、
層に配置された複数のノードと、連続する層のノード同士を連結する複数のエッジとを有するグラフを構築すること、ここで、第1の層がクエリポリヌクレオチドを記述する配列を表し、各ノードがそれぞれの配列内のk量体を表し、各エッジが同一の又は相同なk量体を表すノード同士を連結し、kが6~12であるように、各層が前記セットのうちのある配列(a sequence of the set)を表す;
前記グラフのエッジに沿った連続的な非交差経路を求めて前記グラフを検索すること;及び
機能に関心が持たれる核酸配列として、少なくとも1つの経路に対応するk量体を同定する出力を生成すること、を含む方法が提供される。
According to one aspect of some embodiments of the invention, a method of analyzing a set of sequences describing a plurality of homologous polynucleotides comprises:
constructing a graph having a plurality of nodes arranged in layers and a plurality of edges connecting the nodes of successive layers, where the first layer represents a sequence describing the query polynucleotide; Each layer consists of one of said sets, such that the nodes represent k-mers in each array, each edge connects nodes representing the same or homologous k-mers, and k is between 6 and 12. represents a sequence of the set;
searching the graph for continuous non-intersecting paths along edges of the graph; and producing an output identifying k-mers corresponding to at least one path as nucleic acid sequences of functional interest; A method is provided comprising:

本発明のいくつかの実施形態によれば、前記方法は、前記出力を生成することの前に、毎回より短くなるk量体について、前記構築すること及び前記検索することを反復的に繰り返すことを含む。 According to some embodiments of the invention, the method includes iteratively repeating the building and searching for shorter k-mers each time before generating the output. including.

本発明のいくつかの実施形態によれば、前記方法は、各反復サイクルで、前記検索のための制約として、前の反復サイクルで得られた経路を適用することを含む。 According to some embodiments of the invention, the method comprises, at each iteration cycle, applying the path obtained in the previous iteration cycle as a constraint for the search.

本発明のいくつかの実施形態によれば、前記検索することは、浅い方の経路よりも深い方の経路に対して検索が優先的であるように、前記検索のための制約として経路深度による基準を適用することを含む。 According to some embodiments of the invention, the searching depends on path depth as a constraint for the searching, such that searching is preferentially performed for deeper paths than for shallower paths. Including applying standards.

本発明のいくつかの実施形態によれば、前記検索することは、整数線形計画法(Integer Linear Program:ILP)を前記グラフに適用することを含む。 According to some embodiments of the invention, the searching includes applying an Integer Linear Program (ILP) to the graph.

本発明のいくつかの実施形態によれば、前記相同なポリヌクレオチドはDNA配列である。 According to some embodiments of the invention, the homologous polynucleotide is a DNA sequence.

本発明のいくつかの実施形態によれば、前記相同なポリヌクレオチドはRNA配列である。 According to some embodiments of the invention, said homologous polynucleotide is an RNA sequence.

本発明のいくつかの実施形態によれば、前記方法は、複数のアライメント層を有するマルチプルアライメントを提供するように、前記セット内の前記配列を所定の順序に従ってアライメントすることを含み、ここで第1の層は、前記複数の相同なポリヌクレオチドのうちの前記クエリポリヌクレオチドであり、前記複数のアライメント層は、前記グラフのそれぞれの層に対応する。 According to some embodiments of the invention, the method includes aligning the sequences in the set according to a predetermined order to provide multiple alignment with multiple alignment layers, wherein One layer is the query polynucleotide among the plurality of homologous polynucleotides, and the plurality of alignment layers correspond to each layer of the graph.

本発明のいくつかの実施形態によれば、前記所定の順序は、進化によって決定され(evolution-dictated)、任意に、前記クエリは、前記相同なポリヌクレオチドにおいて最も進化が進んだものである。 According to some embodiments of the invention, said predetermined order is evolution-dictated, optionally said query being the most evolved of said homologous polynucleotides.

本発明のいくつかの実施形態によれば、前記相同なk量体の間の相同性は70%以上である。 According to some embodiments of the invention, the homology between said homologous k-mers is 70% or more.

本発明のいくつかの実施形態によれば、前記相同なポリヌクレオチドは、部分配列を含む。 According to some embodiments of the invention, said homologous polynucleotides include subsequences.

本発明のいくつかの実施形態によれば、前記相同なポリヌクレオチドは、3’UTR、lncRNA及びエンハンサーからなる群より選択される。 According to some embodiments of the invention, said homologous polynucleotide is selected from the group consisting of 3'UTR, lncRNA and enhancer.

他に定義されない限り、本明細書で使用されるすべての技術用語及び/又は科学用語は、本発明が属する技術分野の当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載の方法及び材料と類似又は同等の方法及び材料を本発明の実施形態の実施又は試験に使用することができるが、例示的な方法及び/又は材料を以下に記載する。矛盾する場合、定義を含む特許明細書が優先する。さらに、材料、方法及び例は例示にすぎず、必ずしも限定することを意図するものではない。 Unless defined otherwise, all technical and/or scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Although methods and materials similar or equivalent to those described herein can be used in the practice or testing of embodiments of the invention, exemplary methods and/or materials are described below. In case of conflict, the patent specification, including definitions, will control. Additionally, the materials, methods, and examples are illustrative only and not necessarily intended to be limiting.

本発明のいくつかの実施形態は、添付の図面を参照して、単なる例として本明細書に記載されている。ここで図面を詳細に具体的に参照すると、示されている詳細は例としてのものであり、本発明の実施形態の例示的な説明のためのものであることが強調される。この点に関して、図面を用いて行われる説明は、本発明の実施形態がどのように実施されうるかを当業者に明らかにする。 Some embodiments of the invention are described herein, by way of example only, with reference to the accompanying drawings. With specific reference now to the drawings, it is emphasized that the details shown are by way of example and are for illustrative illustrations of embodiments of the invention. In this regard, the description given with the help of the drawings makes it clear to those skilled in the art how the embodiments of the invention can be implemented.

図1A~Bは、「LncLOOM」フレームワークと呼ばれる核酸配列エレメントを発見するための実施形態の概要を提供する。(A)LncLOOM法の概要。LncLOOMは、配列の順序付きリストを処理し、miRNA結合部位又はRBP結合部位としてさらにアノテーションされうる、様々な深度まで保存された順序付きモチーフのセットを回収(recover)する。FIGS. 1A-B provide an overview of an embodiment for discovering nucleic acid sequence elements called the "LncLOOM" framework. (A) Outline of the LncLOOM method. LncLOOM processes an ordered list of sequences and recovers a set of ordered motifs conserved to various depths that can be further annotated as miRNA binding sites or RBP binding sites. (B)長い非交差経路を見つけるための整数線形計画法(ILP)を使用したグラフ構築及びモチーフ発見の概略図。配列は、最上層(ヒト)からの進化距離が単調に増加するように順序付けられる。エッジの配置を制約するために使用されうるBLAST高スコアリングペア(BLAST high-scoring pair(HSP))(「方法」を参照)は、各配列の下にピンク色及び赤色のブロックとして示されている。グラフをILP問題の構築に使用し、その解を、保存されたシンテニーモチーフ(配列番号29~32)に対応する長い経路のセットの構築に使用する。(B) Schematic of graph construction and motif discovery using integer linear programming (ILP) to find long non-intersecting paths. Sequences are ordered such that their evolutionary distance from the top layer (human) increases monotonically. BLAST high-scoring pairs (HSPs) (see Methods) that can be used to constrain edge placement are shown as pink and red blocks below each sequence. There is. The graph is used to construct an ILP problem and the solution is used to construct a set of long paths corresponding to conserved syntenic motifs (SEQ ID NOs: 29-32). 図2A~Fは、Cyrano lncRNAにおける保存されたエレメントの発見を示す。(A)選択された種におけるCyranoエクソンのゲノム構成の概要。Figures 2A-F show the discovery of conserved elements in Cyrano lncRNAs. (A) Overview of the genomic organization of Cyrano exons in selected species. (B)LncLOOMによって、少なくとも17種のCyranoにおいて保存されていると同定された配列エレメント。ヒトCyrano配列とゼブラフィッシュCyrano配列との間でBLASTによってアライメント可能な領域に見られるエレメントを含有する領域を丸で囲んでいる。エレメント間の数字は、18種のエレメント間の範囲距離を示す。各エレメントの上の丸数字は、本文及び他のパネルで使用されるエレメント番号を示す。(B) Sequence elements identified by LncLOOM as conserved in at least 17 Cyranos. Regions containing elements found in regions that can be aligned by BLAST between human and zebrafish Cyrano sequences are circled. Numbers between elements indicate range distances between the 18 elements. The circled number above each element indicates the element number used in the main text and other panels. (C)Cyranoにおける予測された結合エレメントと、miR-25/92 miRNA及びmiR-7 miRNAとの間の対合。(C) Pairing between predicted binding elements in Cyrano and miR-25/92 miRNA and miR-7 miRNA. (D)ヒトゲノムにおけるUGUAUAGモチーフ(網掛け領域)へのPUM1及びPUM2の結合の証拠。ENCODEプロジェクトCLIPデータ(上部、K562細胞)及び22(下部、HCT116細胞)。網掛けは、ENCODEプロジェクトによって定義された結合証拠の強度に基づく。(D) Evidence for binding of PUM1 and PUM2 to the UGUAUAG motif (shaded region) in the human genome. ENCODE project CLIP data (top, K562 cells) and 22 (bottom, HCT116 cells). Shading is based on the strength of the combined evidence as defined by the ENCODE project. (E)Pum1/2及びRbfox1/2によるマウスCyrano配列の結合及び調節。上部:マウス脳及びmESCからのPum1/2 CLIP及びRNA-seqデータ。中央:マウス脳及びmESCからのRbfox1 CLIP。Pumilio及びRbfoxの結合モチーフは、それぞれ黄色及び青色で強調されている。PhyloP配列保存スコアは、UCSCゲノムブラウザからのものである。下部:Cyranoの3’末端付近のmiR-153結合部位の領域へのマウス脳におけるAgo2の結合。(E) Binding and regulation of mouse Cyrano sequences by Pum1/2 and Rbfox1/2. Top: Pum1/2 CLIP and RNA-seq data from mouse brain and mESCs. Center: Rbfox1 CLIP from mouse brain and mESC. Pumilio and Rbfox binding motifs are highlighted in yellow and blue, respectively. PhyloP sequence conservation scores are from the UCSC genome browser. Bottom: Ago2 binding in mouse brain to the region of the miR-153 binding site near the 3' end of Cyrano. (F)からのCLIPデータ 左上:Cyranoの5’末端付近の保存されたAUGGCGモチーフを囲む領域のアライメント。右上及び下部:キュレートされた複数のデータセットからの複合Ribo-seq及びRNA-seqデータ。ENCODEプロジェクトからのK562細胞株におけるYY1のChip-seqデータ。読出しカバレッジ及びIDRピークが示されている。パネルに示される配列は、配列番号33~42及び53~67としてマークされている。CLIP data from (F) Top left: Alignment of the region surrounding the conserved AUGGCG motif near the 5' end of Cyrano. Top right and bottom: Combined Ribo-seq and RNA-seq data from multiple curated datasets. Chip-seq data for YY1 in K562 cell line from the ENCODE project. Read coverage and IDR peaks are shown. The sequences shown in the panels are marked as SEQ ID NOS: 33-42 and 53-67. 同上。Same as above. 図3A~Eは、CHASERR lncRNAにおける保存されたエレメントの発見を示す。(A)保存の深度によって色分けされた少なくとも4種で保存されたモチーフとともに、ヒトCHASERR遺伝子構造が示されている。最終エクソンの領域が拡大され、本文で説明されるモチーフが強調されている。Figures 3A-E show the discovery of conserved elements in CHASERR lncRNA. (A) The human CHASERR gene structure is shown, with motifs conserved in at least four species color-coded by depth of conservation. The region of the final exon has been expanded to highlight the motifs described in the text. (B)共有AARAUGRモチーフを網掛けした、2つの最も保存されたモチーフに隣接する配列の配列ロゴ(パネルに示されている配列は、配列番号68としてマークされている)。(B) Sequence logo of the sequences flanking the two most conserved motifs, with the shared AARAUGR motif shaded (the sequence shown in the panel is marked as SEQ ID NO: 68). (C)上部:qRT-PCRに使用したプライマーペアの位置と、GapmeR(で使用したものと同じもの)及びASOによって標的とされた領域とを強調したマウスChaserr遺伝子座。下部:示された試薬を用いて処理したN2a細胞内のChaserrエクソン(上部に示す)又はChd2エクソンを標的とするプライマーを用いたqRT-PCR、ASO処理についてはn=4、GapmeRについてはn=5。(C) Top: Mouse Chaserr locus highlighting the positions of primer pairs used for qRT-PCR and regions targeted by GapmeR (same as used in) and ASO. Bottom: qRT-PCR using primers targeting Chaserr exon (shown at top) or Chd2 exon in N2a cells treated with indicated reagents, n=4 for ASO treatment, n=4 for GapmeR. 5. (D)Chaserr最終エクソンのWT配列を有するプルダウンと、保存されたエレメントが変異した最終エクソンとの間のMS強度の比較のためのボルケーノプロット(図8A)。(D) Volcano plot for comparison of MS intensity between pulldown with WT sequence of Chaserr final exon and final exon with mutated conserved elements (Fig. 8A). (E)示された抗体によるIP後の示された領域を標的とするプライマーを使用するqRT-PCR、n=4。右上:示された試料に対して抗DHX36抗体を使用したウエスタンブロット。図に示される配列は、配列番号68としてマークされている。(E) qRT-PCR using primers targeting the indicated regions after IP with the indicated antibodies, n=4. Top right: Western blot using anti-DHX36 antibody on the indicated samples. The sequence shown in the figure is marked as SEQ ID NO: 68. 図4は、PUM1及びPUM2の3’UTRにおける保存されたエレメントの同定を示す。ヒト配列が示されており、少なくとも7つの種において保存されたモチーフは、それらの保存に基づいて色分けされている。超保存UGUACAUU(配列番号14)モチーフの出現がボックス内にある。パネルに示される配列は、配列番号69~70としてマークされている。Figure 4 shows the identification of conserved elements in the 3'UTR of PUM1 and PUM2. The human sequence is shown and motifs conserved in at least seven species are color coded based on their conservation. Occurrences of the ultra-conserved UGUACAUU (SEQ ID NO: 14) motif are in boxes. The sequences shown in the panels are marked as SEQ ID NOS: 69-70. 同上。Same as above. 図5A~Iは、LncLOOMを用いた3’UTRにおける保存されたモチーフのGlobal分析を示す。(A)ヒト配列(黒色)に対して、又はマウス、イヌ及びニワトリ配列(灰色)に対して有意なアライメントを有しなかった様々な数のオルソログ配列を有する遺伝子の数。Figures 5A-I show Global analysis of conserved motifs in the 3'UTR using LncLOOM. (A) Number of genes with varying numbers of orthologous sequences that had no significant alignment to human sequences (black) or to mouse, dog and chicken sequences (gray). (B)ヒト3’UTR配列にアライメントしなかった、示された数の配列内において保存されている固有のk量体の組合せの分布。(B) Distribution of unique k-mer combinations conserved within the indicated number of sequences that did not align to human 3'UTR sequences. (C)種当たりのLncLOOMが同定した固有のk量体(ピンク色)の総数及びそれらの全例(暗赤色)の定量。広く保存されたmiRNA結合部位の総数が緑色で示され、これらの部位に対応する固有のk量体の数が黄色で示されている。いずれかのk量体を含有した遺伝子の数が灰色で示され、miRNA部位に対応する少なくとも1つのk量体を含有した遺伝子の数が黒色で示されている。(C) Quantification of the total number of unique k-mers (pink) and their total examples (dark red) identified by LncLOOM per species. The total number of widely conserved miRNA binding sites is shown in green, and the number of unique k-mers corresponding to these sites is shown in yellow. The number of genes that contained any k-mer is shown in gray, and the number of genes that contained at least one k-mer corresponding to the miRNA site is shown in black. (D)上部:複数の遺伝子においてヒトにアライメント不可能な第1の配列において同定された固有のk量体の分布(灰色)。少なくとも1つの遺伝子において無脊椎動物種で検出されたk量体の数が黒色で示されている。下部:少なくとも50個の遺伝子に共通し、無脊椎動物配列で検出された固有のk量体。AREに似たk量体は赤色に着色され、PASに似たk量体は青色、PREに似たk量体は緑色に着色されている。(D) Top: Distribution of unique k-mers identified in the first human unalignable sequences in multiple genes (gray). The number of k-mers detected in invertebrate species in at least one gene is shown in black. Bottom: Unique k-mers common to at least 50 genes and detected in invertebrate sequences. ARE-like k-mers are colored red, PAS-like k-mers are colored blue, and PRE-like k-mers are colored green. (E)分析した遺伝子のヒト配列内でLncLOOM及びTargetScanによって検出された、広く保存されたmiRNA結合部位を含有する遺伝子の比較。(E) Comparison of genes containing widely conserved miRNA binding sites detected by LncLOOM and TargetScan within the human sequences of analyzed genes. (F)LncLOOMによって検出された広く保存されたmiRNA結合の数/アライメント不可能な配列の数;検出されたmiRNA部位を有する遺伝子のパーセンテージ/アライメント不可能な層の数(黒色)、及びmiRNA結合部位に対応する固有のk量体の数(黄色)。(F) Number of widely conserved miRNA bindings/number of unalignable sequences detected by LncLOOM; percentage of genes with detected miRNA sites/number of unalignable layers (black), and miRNA binding. Number of unique k-mers corresponding to the site (yellow). (G)上部:ヒト配列における、LncLOOMによって予測された広く保存されたmiRNA結合部位。TargetScanによって予測され、LncLOOMによって回収された部位は赤色で示され、新たな部位は青色で示されている。下部:これらの部位の保存/種の数。(G) Top: widely conserved miRNA binding sites predicted by LncLOOM in human sequences. Sites predicted by TargetScan and recovered by LncLOOM are shown in red, new sites are shown in blue. Bottom: Conservation of these parts/number of species. (H)TargetScan及びLncLOOMによって、示された種において検出された少なくとも1つのmiRNA部位を有する遺伝子の画分の比較。TargetScanHumanに見られる部位のみを使用した。(H) Comparison of the fraction of genes with at least one miRNA site detected in the indicated species by TargetScan and LncLOOM. Only the sites found in TargetScanHuman were used. (I)LncLOOMによって検出されたmiRNA部位を含有する遺伝子のパーセンテージ/アライメント不可能な配列の数:(赤色)ヒト配列においてTargetScanによって以前に予測され、TargetScanによって使用されたMSAの一部ではない追加の配列においてLncLOOMによって回収されたmiRNA部位;(青色)LncLOOMによって予測されたが、ヒト配列においてTargetScanによって以前に予測されなかった新たなmiRNA部位。(I) Percentage of genes containing miRNA sites detected by LncLOOM/number of unalignable sequences: (red) additions previously predicted by TargetScan in human sequences and not part of the MSA used by TargetScan miRNA sites recovered by LncLOOM in sequences; (blue) New miRNA sites predicted by LncLOOM but not previously predicted by TargetScan in human sequences. 図6は、libra lncRNA内で保存されたエレメントを示す。ヒト配列が示されており、少なくとも5つの種において保存されたモチーフは、それらの保存に基づいて色分けされている。縦線の対はイントロンの位置を表す。miRNAシード部位と一致するモチーフは、モチーフの上のmiRNAファミリー名によって示されている。ヒト配列とスポッテッドガー配列との間のBLASTNアライメント(E<0.001)の一部である領域に下線が引かれている。パネルに示される配列は、配列番号71としてマークされている。Figure 6 shows conserved elements within libra lncRNA. The human sequence is shown and motifs conserved in at least five species are color coded based on their conservation. Pairs of vertical lines represent intron positions. Motifs matching miRNA seed sites are indicated by the miRNA family name above the motif. Regions that are part of the BLASTN alignment (E<0.001) between the human and spotted gar sequences are underlined. The sequence shown in the panel is marked as SEQ ID NO:71. 図7は、Chaserr lncRNA遺伝子座の第1のエクソンの周りのゲノムアセンブリ内のギャップを示す。各種について、RNA-seq読出しカバレッジがゲノムアセンブリ内のギャップと並んで示されている(UCSCブラウザから)。Figure 7 shows gaps in the genome assembly around the first exon of the Chaserr lncRNA locus. For each species, RNA-seq read coverage is shown alongside gaps in the genome assembly (from the UCSC browser). 図8A~Dは、Chaserr lncRNAにおける保存されたエレメントの機能的特性評価を示す。(A)マウスChaserrの最終エクソンの配列。深く保存されたエレメントは共有されている。MSベイトにおいて変異した保存されたAUGG例は青色であり、他の全AUGG例は緑色である。ASOによって標的とされる領域がマークされている。Figures 8A-D show functional characterization of conserved elements in Chaserr lncRNA. (A) Sequence of the final exon of mouse Chaserr. Deeply conserved elements are shared. The conserved AUGG examples mutated in the MS bait are in blue, and all other AUGG examples are in green. The area targeted by ASO is marked. (B)示されているASO処理について、図3Cにおけると同様。(B) Same as in FIG. 3C for the ASO processing shown. (C)示された遺伝子型を有する、HEK293細胞内の示された遺伝子の発現のRNA-seq定量、(C) RNA-seq quantification of expression of the indicated genes in HEK293 cells with the indicated genotypes. (D)非標的化shRNA(shNT)、又はZFRを標的とするshRNAを用いて処理したTHP1細胞内の示された遺伝子の発現のRNA-seq定量からのデータ。8Aに示される配列からのデータは、配列番号72としてマークされている。(D) Data from RNA-seq quantification of expression of the indicated genes in THP1 cells treated with non-targeting shRNAs (shNTs) or ZFR-targeted shRNAs. Data from the sequence shown in 8A is marked as SEQ ID NO: 72. 図9は、DICER 3’UTRにおける保存されたエレメントの同定を示す。ヒト配列が示されており、少なくとも8つの脊椎動物種において保存されたモチーフが、それらの保存に基づいて色分けされている(9種-ナメクジウオにおいて保存;10種-ナメクジウオ及びウニにおいて保存)。配列同一性を維持する100個のランダム配列がこの長さのモチーフを含有しないモチーフの領域は、淡黄色で網掛けされている。ランダム配列内で正確なモチーフが見出されないモチーフの領域は、淡いシアン色で網掛けされている。パネルに示される配列は、配列番号73としてマークされている。Figure 9 shows the identification of conserved elements in the DICER 3'UTR. The human sequence is shown and motifs conserved in at least eight vertebrate species are color coded based on their conservation (9 species - conserved in amphioxus; 10 species - conserved in amphioxus and sea urchins). Regions of the motif where 100 random sequences that maintain sequence identity do not contain a motif of this length are shaded in light yellow. Regions of motifs where no exact motif is found within the random sequence are shaded in light cyan. The sequence shown in the panel is marked as SEQ ID NO:73. 同上。Same as above. 図10A~Fは、3’UTR内で同定されたLncLOOMモチーフの追加の分析を示す。(A)オルソログ3’UTR配列の分布。左上:様々な深度で分析された遺伝子の頻度。右上:3’UTR配列データセットに含まれた非有羊膜類配列の様々な組合せの分布。右下:示された種において分析された遺伝子の総数。Figures 10A-F show additional analysis of LncLOOM motifs identified within the 3'UTR. (A) Distribution of orthologous 3′UTR sequences. Top left: Frequency of genes analyzed at various depths. Top right: Distribution of different combinations of non-amniote sequences included in the 3'UTR sequence dataset. Bottom right: total number of genes analyzed in the indicated species. (B)3’UTRデータセットにおける、保存された固有のk量体の組合せ/アライメント不可能な配列の数の分布。ヒト、マウス、イヌ及びニワトリへのアライメントを検討した。(B) Distribution of the number of conserved unique k-mer combinations/unalignable sequences in the 3'UTR dataset. We examined alignments to humans, mice, dogs, and chickens. (C)有羊膜類を超えて同定され、複数の遺伝子間で共有されていた固有のk量体の分布。UUU(赤色の線)、AUAA(緑色の線)を含有するか、又は広く保存されたmiRNA部位と一致した(黄色の線)k量体の数を示す。(C) Distribution of unique k-mers identified across amniotes and shared among multiple genes. The number of k-mers containing UUU (red line), AUAA (green line) or matched to widely conserved miRNA sites (yellow line) is shown. (D)TargetScanが何ら予測を報告しなかった遺伝子内でLncLOOMによって検出された広く保存されたmiRNA部位の保存。(上部)検出されたmiRNA部位を有する遺伝子の数/種の数(左)、及びアライメント不可能な配列の数(右)。(左下)検出されたmiRNA部位を有する遺伝子の数/種。(中央)検出された新たなmiRNA部位の数/種。(右)検出された新たなmiRNA部位の数/アライメント不可能な配列の数。(D) Conservation of widely conserved miRNA sites detected by LncLOOM within genes for which TargetScan reported no predictions. (Top) Number of genes/species with detected miRNA sites (left) and number of unalignable sequences (right). (Bottom left) Number/species of genes with detected miRNA sites. (Middle) Number/species of new miRNA sites detected. (Right) Number of new miRNA sites detected/number of unalignable sequences. (E)TargetScan及びLncLOOMによる、種当たりの検出された保存を有するmiRNA部位の比較。TargetScanHumanによって以前に同定された部位のみを比較した。(E) Comparison of miRNA sites with detected conservation per species by TargetScan and LncLOOM. Only sites previously identified by TargetScanHuman were compared. (F)ヒト配列に対するアライメントを有しない配列内の、LncLOOMによって検出されたmiRNA部位の保存。ヒト配列においてTargetScanによって以前に予測された部位は赤色に着色され、新たなLncLOOM予測は青色に着色されている。(F) Conservation of miRNA sites detected by LncLOOM within sequences without alignment to human sequences. Sites previously predicted by TargetScan in the human sequence are colored red and new LncLOOM predictions are colored blue. 図11A~Dは、LncLOOMグラフに課される制約を示す。(A)LncLOOMグラフのシナリオの例、及びそれらがILPでどのように表されるか。11A-D illustrate the constraints imposed on the LncLOOM graph. (A) Examples of scenarios for LncLOOM graphs and how they are represented in ILP. (B)交差エッジに対する条件付き制約。すべての交差が制約されている場合に起こり得る後続の反復における精密化中の複雑な経路における繰り返されるk量体の準最適除外の一例。(B) Conditional constraints on intersecting edges. An example of repeated suboptimal exclusion of k-mers in a complex path during refinement in subsequent iterations, which can occur if all intersections are constrained. (C)交差エッジに対する条件付き制約を定義するためのフロー図:一対の交差エッジは、いずれかのエッジと交差する固有の経路からの少なくとも1つの他のエッジが存在する場合にのみ制約される。(C) Flow diagram for defining conditional constraints on intersecting edges: a pair of intersecting edges is constrained only if there is at least one other edge from a unique path that intersects either edge . (D)交差に対する条件付き制約が、タンデムに繰り返されるk量体の準最適除外をどのように緩和することができるかを示す例。パネルに示される配列は、配列番号74としてマークされている。(D) Example showing how conditional constraints on intersection can relax suboptimal exclusion of tandemly repeated k-mers. The sequence shown in the panel is marked as SEQ ID NO:74. 図12は、LncLOOMグラフの分割、及び選択された繰り返されるk量体の反復精密化を示す。モチーフ発見は、グラフ内の最も深い層から始まって、各工程が、次第に浅くなる深度で保存されているモチーフを検索する反復プロセスによって行われる。ここには、5層のグラフで始まるモチーフ発見の一例が示されている。グラフが解かれ、解で得られた単純な経路(緑色で示されている)が、グラフを次の反復で個々に解かれるサブグラフに分割するために使用され、次の反復はグラフの上位4層に対して行われる。各単純な経路は最終解に直ちに追加されるが、複雑な経路(青色及び赤色で示されている)はモチーフ発見の後続の反復中に精密化される。この場合、最適化中に除去される繰り返されるk量体は、ピンク色で囲まれている。FIG. 12 shows the partitioning of the LncLOOM graph and iterative refinement of selected iterative k-mers. Motif discovery is performed by an iterative process, starting from the deepest layer in the graph, with each step searching for conserved motifs at progressively shallower depths. Here is an example of motif discovery starting with a five-layer graph. The graph is solved and the simple paths obtained at the solution (shown in green) are used to split the graph into subgraphs that are solved individually in the next iteration, and the next iteration is the top four of the graph. It is done for layers. Each simple path is immediately added to the final solution, while complex paths (shown in blue and red) are refined during subsequent iterations of motif discovery. In this case, the repeated k-mers that are removed during optimization are circled in pink. 同上。Same as above. 図13A~Bは、LncLOOMフレームワークにおける処理工程を示す。(A)5’及び3’グラフの構築。LncLOOMは、(各配列の全長が検討される)一次ILPにおいて同定された第1のモチーフ及び最終モチーフの中央位置を使用して、グラフ内の他の配列と比較して伸長された個々の配列の5’及び3’末端を予測し、抽出する。次いで、LncLOOMモチーフ発見が、抽出された5’及び3’領域のサブセットに対して行われる。この例では、最小深度3が課されているため、上位2つの配列のみにおいて保存されているAUUGCU(配列番号15、青色)モチーフは無視され、CAUCCA(配列番号16、暗赤色及び下線)が、代わりに第1のノードとして検討される。13A-B illustrate the processing steps in the LncLOOM framework. (A) Construction of 5' and 3' graphs. LncLOOM uses the central position of the first motif and final motif identified in the primary ILP (the entire length of each sequence is considered) to calculate the elongated individual sequences compared to other sequences in the graph. Predict and extract the 5' and 3' ends of LncLOOM motif discovery is then performed on a subset of the extracted 5' and 3' regions. In this example, a minimum depth of 3 is imposed, so the AUUGCU (SEQ ID NO: 15, blue) motif, which is conserved in only the top two sequences, is ignored, and CAUCCA (SEQ ID NO: 16, dark red and underlined) is Instead, it is considered as the first node. (B)モチーフ近傍の図解。各近傍の参照配列は、アンカー配列内のすべての重複するk量体を組み合わせることによって決定される。次いで、グラフ内のそれぞれの深度に保存され、参照配列内の重複するk量体のうちの1つに連結されているすべてのk量体が、近傍内に含まれる。パネルに示される配列は、配列番号75~87としてマークされている。(B) Illustration of the vicinity of the motif. The reference sequence for each neighborhood is determined by combining all overlapping k-mers within the anchor sequence. All k-mers stored at their respective depths in the graph and connected to one of the overlapping k-mers in the reference sequence are then included within the neighborhood. The sequences shown in the panels are marked as SEQ ID NOS: 75-87. 図14は、本発明の様々な例示的な実施形態による、配列のセットを分析するのに適した方法のフローチャート図である。FIG. 14 is a flowchart illustration of a method suitable for analyzing a set of sequences, according to various exemplary embodiments of the invention. 図15は、本発明の様々な例示的な実施形態による、配列のセットを分析するように構成されたコンピューティングプラットフォームの概略図である。FIG. 15 is a schematic diagram of a computing platform configured to analyze a set of sequences, according to various exemplary embodiments of the invention. 図16は、示されたASO(配列番号128及び134)のトランスフェクション後のCHASERR、CHD2及びp21(CDKN1A)の、トランスフェクトされていないSH-SY5Y細胞と比較した遺伝子発現の変化のグラフ表示である。FIG. 16 is a graphical representation of gene expression changes of CHASERR, CHD2 and p21 (CDKN1A) after transfection of the indicated ASOs (SEQ ID NOs: 128 and 134) compared to untransfected SH-SY5Y cells. be. 図17は、示されたASO(配列番号128及び134)のトランスフェクション後のCHASERR及びCHD2の、トランスフェクトされていないMCF7細胞及びSH-SY5Y細胞と比較した遺伝子発現の変化のグラフ表示である。FIG. 17 is a graphical representation of gene expression changes of CHASERR and CHD2 after transfection of the indicated ASOs (SEQ ID NOs: 128 and 134) compared to untransfected MCF7 and SH-SY5Y cells.

本発明は、そのいくつかの実施形態では、CHD2ハプロ不全の処置に使用するための組成物、及びその同定方法に関する。 The present invention, in some embodiments thereof, relates to compositions for use in treating CHD2 haploinsufficiency, and methods for identifying the same.

本発明の少なくとも1つの実施形態を詳細に説明する前に、本発明は、その適用において、以下の説明に記載されるか又は実施例によって例示される詳細に必ずしも限定されないことを理解されたい。本発明は、他の実施形態が可能であるか、又は様々な方法で実施若しくは実行することができる。 Before describing at least one embodiment of the invention in detail, it is to be understood that the invention is not necessarily limited in its application to the details set forth in the following description or illustrated by the examples. The invention is capable of other embodiments or of being practiced or carried out in various ways.

CHD2ハプロ不全は、神経発達遅延、知的障害、てんかん及び問題行動に関連する。以前の結果は、CHD2発現が、Chd2の上流に位置する保存されたlncRNAであるChaserrによって厳密に調節されることを示している。Chaserrの喪失は、Chd2 mRNA及びタンパク質のレベルを実質的に増加させ、これにより、高度に発現された遺伝子の下流に見出されるプロモーターを阻害することによる転写干渉を含む、遺伝子発現の変化がもたらされる。 CHD2 haploinsufficiency is associated with neurodevelopmental delay, intellectual disability, epilepsy, and behavioral problems. Previous results indicate that CHD2 expression is tightly regulated by Chaserr, a conserved lncRNA located upstream of Chd2. Loss of Chaserr substantially increases Chd2 mRNA and protein levels, leading to changes in gene expression, including transcriptional interference by inhibiting promoters found downstream of highly expressed genes. .

本発明の実施形態の着想中に、本発明者は、アライメント可能性を超えて発散した、及び/又は転移因子などの実質的な系統特異的配列を蓄積した、配列内の保存されたエレメントを検出するための新規アルゴリズムを考案した。このアルゴリズム、又は「LncLOOM」と呼ばれるその実施形態を使用して、本発明者らは、機能的に関連する相互作用因子とのCheserrの相互作用を特異的に阻害し、CHD2ハプロ不全を最終的に補償するように優先的に変異されうる/標的とされうる、Chaserrの保存された領域を同定及び検証した。 During the conception of embodiments of the present invention, the inventor identified conserved elements within the sequences that have diverged beyond alignment possibilities and/or have accumulated substantial lineage-specific sequences such as transposable elements. We devised a new algorithm for detection. Using this algorithm, or an embodiment thereof called “LncLOOM,” we specifically inhibited Cheserr interaction with functionally relevant interactors and ultimately inhibited CHD2 haploinsufficiency. We have identified and verified conserved regions of Chaserr that can be preferentially mutated/targeted to compensate for.

したがって、本発明の一態様によれば、神経細胞内のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)の量を増加させる方法であって、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤を細胞に導入することを含み、核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、神経細胞内のCHD2の量を増加させる方法が提供される。 Accordingly, in accordance with one aspect of the invention, there is provided a method for increasing the amount of chromodomain helicase DNA binding protein 2 (CHD2) in a neuronal cell, the method comprising: administering a nucleic acid agent that down-regulates the activity or expression of human Chaserr to a neuronal cell. introducing a nucleic acid agent to the final exon of human Chaserr, thereby providing a method of increasing the amount of CHD2 in neuronal cells.

本明細書で使用される場合、「ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤」は、ヒトChaserrの活性を阻害するか、又はヒトChaserrの量を減少させる核酸分子を指す。 As used herein, "a nucleic acid agent that downregulates the activity or expression of human Chaser" refers to a nucleic acid molecule that inhibits the activity or decreases the amount of human Chaser.

いくつかの実施形態によれば、「ヒトChaserrの活性をダウンレギュレートする核酸剤」は、CHD2の発現(タンパク質及び任意にmRNA)を増加させる核酸剤、CHD2 mRNAの安定性を増加させる核酸剤、CHD2 mRNAの発現を誘導する核酸剤、及びCHD2の翻訳を誘導する核酸剤のうちのいずれか1又は複数を含む。 According to some embodiments, a "nucleic acid agent that downregulates the activity of human Chaserr" includes a nucleic acid agent that increases the expression (protein and optionally mRNA) of CHD2, a nucleic acid agent that increases the stability of CHD2 mRNA. , a nucleic acid agent that induces expression of CHD2 mRNA, and a nucleic acid agent that induces translation of CHD2.

したがって、本発明の一態様によれば、ヒトChaserrの活性又はダウンレギュレートする核酸剤であって、ヒトChaserrの最終エクソンにハイブリダイズする(すなわち、ヒトChaserrの最終エクソン内のヌクレオチド配列に相補的である)核酸配列を含む核酸剤が提供される。 Accordingly, in accordance with one aspect of the invention, there is provided a nucleic acid agent for the activity or downregulation of human Chaser that hybridizes to the final exon of human Chaser (i.e., is complementary to a nucleotide sequence within the final exon of human Chaser). Nucleic acid agents are provided that include a nucleic acid sequence).

本明細書で使用される場合、「クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)」は、ヒトではCHD2遺伝子によってコードされる酵素を指す。ヒトにおけるCHD2スプライス変異体の例には、NCBI参照配列:NM_001271.4及びNM_001042572が挙げられる。 As used herein, "chromodomain helicase DNA binding protein 2 (CHD2)" refers to the enzyme encoded by the CHD2 gene in humans. Examples of CHD2 splice variants in humans include the NCBI reference sequences: NM_001271.4 and NM_001042572.

スプライス変異体タンパク質産物は、NCBI参照配列:NP_001262.3又はNP_001036037に記載されている通りである。 Splice variant protein products are as described in NCBI reference sequence: NP_001262.3 or NP_001036037.

本明細書で使用される場合、「ハプロ不全」は、2倍体生物における優性遺伝子作用のモデルを指し、このモデルでは、変異体対立遺伝子とヘテロ接合で組み合わせた遺伝子座にある標準(いわゆる野生型)対立遺伝子の単一コピーは、標準的な表現型をもたらすには不十分である。典型的には、両対立遺伝子が野生型である健康な状態と比較して、タンパク質の量の約半分が産生されるにすぎない。 As used herein, "haploinsufficiency" refers to a model of dominant gene action in diploid organisms in which the standard (so-called wild type) A single copy of the allele is insufficient to produce the standard phenotype. Typically, only about half the amount of protein is produced compared to a healthy state in which both alleles are wild type.

本明細書で使用される場合、「量を増加させる」は、関心対象のタンパク質又はRNAの量を統計的に有意な量だけ、及び関心対象のタンパク質又はRNAのハプロ不全を処置するための有用性を有する量だけ増加させることを指す。様々な実施形態では、関心対象のタンパク質又はRNAの「量を増加させる」は、少なくとも10%、又はいくつかの実施形態では、少なくとも約20%、少なくとも20%、20~150%、50~150%、例えば、少なくとも50%、60%、70%、80%、90%、少なくとも1.2倍1.4倍1.5倍若しくはそれ以上、例えば、少なくとも2倍の増加を伴う。特定の実施形態によれば、CHD2レベルは、同じタイプ(すなわち、神経の)及び発達段階の正常細胞(ハプロ不全を有しない)内で見出される量まで回復される。 As used herein, "increase the amount" of increasing the amount of the protein or RNA of interest by a statistically significant amount and the usefulness of the protein or RNA for treating haploinsufficiency of the protein or RNA of interest. It refers to increasing the amount that has a certain characteristic. In various embodiments, "increasing the amount" of the protein or RNA of interest is at least 10%, or in some embodiments at least about 20%, at least 20%, 20-150%, 50-150 %, such as at least 50%, 60%, 70%, 80%, 90%, at least 1.2 times 1.4 times 1.5 times or more, such as at least 2 times. According to certain embodiments, CHD2 levels are restored to amounts found in normal cells of the same type (ie, neural) and developmental stage (not having haploinsufficiency).

本明細書で使用される場合、「神経細胞」は、対象の体内(インビボ)又は体外に見出される細胞、例えば、組織生検材料、細胞株及び初代培養物を指す。 As used herein, "neuronal cell" refers to cells found within or outside a subject, such as tissue biopsies, cell lines, and primary cultures.

他の細胞、すなわち、非神経細胞も企図される。 Other cells, ie, non-neuronal cells, are also contemplated.

神経細胞は、遺伝子改変されていてもよいか、又は遺伝子改変されていなくてもよく、例えば、ナイーブでありうる。 Neuronal cells may or may not be genetically modified, eg, naïve.

特定の実施形態によれば、神経細胞は、中枢神経系に位置する。 According to certain embodiments, the neuronal cells are located in the central nervous system.

CHD2のレベルが本発明のいくつかの実施形態に従って改変されるか又は改変された細胞を識別する方法は、当技術分野で周知である。 Methods of identifying cells whose levels of CHD2 are altered or have been altered according to some embodiments of the invention are well known in the art.

細胞と前記剤との接触は、例えば、前記剤が細胞と直接接触するように、前記剤を対象に由来する細胞(例えば、初代細胞培養物、細胞株)に、又はそれを含む生物学的試料(例えば、細胞を含む流体、液体)に加えることを含む、いずれかのインビボ条件又はインビトロ条件によって行われ得る。本発明のいくつかの実施形態によれば、対象の細胞は、前記剤とともにインキュベートされる。細胞をインキュベートするために使用される条件は、薬物がCHD2のレベル(量)の増加などの細胞変化を誘導するか、又は特定の遺伝子の転写及び/若しくは翻訳速度、増殖速度、分化、細胞死、壊死、アポトーシスなどの変化などの関連する変化を誘導することを可能にする期間/細胞の濃度/前記剤の濃度/細胞と前記剤との比などのために選択される。 Contacting the agent with a cell may include, for example, applying the agent to a cell derived from the subject (e.g., primary cell culture, cell line) or into a biological cell containing the same, such that the agent is in direct contact with the cell. This can be done by any in vivo or in vitro conditions, including adding to a sample (eg, a fluid, liquid containing cells). According to some embodiments of the invention, the subject's cells are incubated with the agent. The conditions used to incubate cells determine whether the drug induces cellular changes, such as increased levels (amount) of CHD2, or the rate of transcription and/or translation of a particular gene, proliferation rate, differentiation, or cell death. selected for the period/concentration of cells/concentration of said agent/ratio of cells to said agent etc. which makes it possible to induce relevant changes such as changes such as , necrosis, apoptosis etc.

CHD2(mRNA及び/又はタンパク質)のレベルは、前記剤を細胞に導入する前、それと同時に及び/又はそれに続いて分析されうる。追加的又は代替的に、ゲノムDNAは、ゲノム編集の場合など、本明細書中下記にさらに記載されるように、前記剤によって導入された修飾について分析される。 Levels of CHD2 (mRNA and/or protein) may be analyzed prior to, simultaneously with and/or subsequent to introducing the agent into the cells. Additionally or alternatively, genomic DNA is analyzed for modifications introduced by the agent, such as in the case of genome editing, as described further herein below.

核酸レベルでのダウンレギュレーション(すなわち、核酸の存在量の減少)は、典型的には、核酸骨格、DNA、RNA、それらの模倣物又はそれらの組合せを有する核酸剤を使用して行われる。核酸剤は、DNA分子からコードされうるか、又は細胞自体に提供されうる。 Downregulation at the nucleic acid level (ie, reduction in the abundance of nucleic acids) is typically performed using nucleic acid agents having a nucleic acid backbone, DNA, RNA, mimetics thereof, or combinations thereof. Nucleic acid agents can be encoded from DNA molecules or provided on the cell itself.

特定の実施形態によれば、ダウンレギュレーション剤はポリヌクレオチドである。 According to certain embodiments, the down-regulating agent is a polynucleotide.

核酸剤は、それ自体が本明細書で企図され、核酸構築物から、又は医薬組成物の一部としてコードされることが理解される。 It is understood that the nucleic acid agents are contemplated herein per se and encoded from a nucleic acid construct or as part of a pharmaceutical composition.

特定の実施形態によれば、ダウンレギュレーション剤は、CHD2をコードする遺伝子又はmRNAにハイブリダイズすることができるポリヌクレオチド又はオリゴヌクレオチドである。 According to certain embodiments, the down-regulating agent is a polynucleotide or oligonucleotide capable of hybridizing to the gene or mRNA encoding CHD2.

特定の実施形態によれば、ダウンレギュレーション剤は、CHD2の遺伝子と、又はRNA転写産物と直接相互作用する。 According to certain embodiments, the down-regulating agent interacts directly with the gene or with the RNA transcript of CHD2.

特定の実施形態によれば、前記剤は、Chaserrの最終エクソン内の核酸配列に直接結合する。 According to certain embodiments, the agent binds directly to a nucleic acid sequence within the final exon of Chaserr.

本明細書で使用される場合、「Chaserr」は、CHD2隣接抑制調節RNAを指す。HGNC:48626 Entrez Gene:100507217 As used herein, "Chaserr" refers to CHD2 adjacent suppressive regulatory RNA. HGNC:48626 Entrez Gene:100507217

Chaserrのエクソン構成は、EXON1:ヌクレオチド1..344;EXON2:ヌクレオチド345..538;EXON3:ヌクレオチド539...608;EXON4:ヌクレオチド609...694;EXON5:ヌクレオチド695...763;EXON6:ヌクレオチド764...1787であり、ここでChaserrの最終エクソンとは、配列番号3(NR_037601)のヌクレオチド764..1787を指す。 The exon structure of Chaserr is EXON1: nucleotide 1. .. 344; EXON2: nucleotide 345. .. 538; EXON3: nucleotide 539. .. .. 608; EXON4: nucleotide 609. .. .. 694; EXON5: nucleotide 695. .. .. 763; EXON6: nucleotide 764. .. .. 1787, where the final exon of Chaserr is nucleotide 764.1 of SEQ ID NO: 3 (NR_037601). .. Points to 1787.

特定の実施形態によれば、核酸剤は、配列番号1(AUG)を含む核酸配列エレメントにハイブリダイズする。 According to certain embodiments, the nucleic acid agent hybridizes to a nucleic acid sequence element comprising SEQ ID NO: 1 (AUG).

別の実施形態によれば、核酸剤は、配列番号2(AUGG)を含む核酸配列エレメントにハイブリダイズする。 According to another embodiment, the nucleic acid agent hybridizes to a nucleic acid sequence element comprising SEQ ID NO: 2 (AUGG).

特定の実施形態によれば、核酸剤は、AAGAUGG(配列番号4)、AAGAUG(配列番号5)又はAAAUGGA(配列番号6)を含む核酸配列エレメントにハイブリダイズする。 According to certain embodiments, the nucleic acid agent hybridizes to a nucleic acid sequence element comprising AAGAUGG (SEQ ID NO: 4), AAGAUG (SEQ ID NO: 5) or AAAUGGA (SEQ ID NO: 6).

別の実施形態によれば、核酸剤は、配列番号3(aauaaa)を含む核酸配列エレメントにハイブリダイズする。 According to another embodiment, the nucleic acid agent hybridizes to a nucleic acid sequence element comprising SEQ ID NO: 3 (aauaaa).

特定の実施形態によれば、核酸剤は、ChaserrへのDHX36の結合を阻害する。 According to certain embodiments, the nucleic acid agent inhibits DHX36 binding to Chaserr.

本明細書で使用される場合、「DHX36」は、DEAHボックスタンパク質36(DHX36)若しくはMLE様タンパク質1(MLEL1)若しくはG4リゾルベース1(G4R1)としても知られる、可能性の高いATP依存性RNAヘリカーゼDHX36を指すか、又はAU-リッチエレメント(RHAU)に関連するRNAヘリカーゼは、ヒトではDHX36遺伝子によってコードされる酵素である。 As used herein, "DHX36" refers to a likely ATP-dependent RNA helicase, also known as DEAH box protein 36 (DHX36) or MLE-like protein 1 (MLEL1) or G4 resolvase 1 (G4R1). RNA helicase, which refers to DHX36 or associated with AU-rich element (RHAU), is an enzyme encoded by the DHX36 gene in humans.

特定の実施形態によれば、核酸剤は、UUUUUACCU(配列番号122)に相補的なヌクレオチド配列を含む According to certain embodiments, the nucleic acid agent comprises a nucleotide sequence complementary to UUUUUACCU (SEQ ID NO: 122)

特定の実施形態によれば、核酸剤は、ChaserrへのCHD2の結合を阻害する。 According to certain embodiments, the nucleic acid agent inhibits CHD2 binding to Chaserr.

特定の実施形態によれば、ダウンレギュレーション剤は、アンチセンス、RNAサイレンシング剤又はゲノム編集剤である。 According to certain embodiments, the down-regulating agent is an antisense, RNA silencing agent or genome editing agent.

特定の実施形態によれば、ダウンレギュレーション剤はアンチセンスである。 According to certain embodiments, the down-regulating agent is antisense.

アンチセンスオリゴヌクレオチド-アンチセンスオリゴヌクレオチドは、標的RNAにハイブリダイズし、それによって、その機能又はレベルを阻害するように設計された一本鎖オリゴヌクレオチドである。Chaserr RNAのダウンレギュレーション又は阻害は、例えば、配列番号1、2、4又は6を含むChaserr転写物と特異的にハイブリダイズすることができるアンチセンスオリゴヌクレオチドを使用して行われ得る。好ましくは、アンチセンスオリゴヌクレオチドのハイブリダイゼーションは、Chaserrへのエフェクターエレメントの結合を防止するが、その他の点ではChaserr RNAをインタクトのままにする。特定の実施形態によれば、核酸剤は、RNaseHを動員しない。 Antisense Oligonucleotides - Antisense oligonucleotides are single-stranded oligonucleotides designed to hybridize to target RNA and thereby inhibit its function or level. Downregulation or inhibition of Chaserr RNA can be performed using, for example, antisense oligonucleotides that can specifically hybridize to Chaserr transcripts comprising SEQ ID NO: 1, 2, 4, or 6. Preferably, hybridization of the antisense oligonucleotide prevents binding of effector elements to Chaser, but otherwise leaves Chaserr RNA intact. According to certain embodiments, the nucleic acid agent does not recruit RNaseH.

いくつかの実施形態では、アンチセンスオリゴヌクレオチドは、RNaseHを動員しない。例えば、アンチセンスオリゴヌクレオチドは、RNAヌクレオチドを実質的に含み得る。さらに他の実施形態では、アンチセンスオリゴヌクレオチドは、RNaseHを動員し、したがって、少なくとも一続きのDNAヌクレオチドを含む。例えば、アンチセンスオリゴヌクレオチドはギャップマーであってよい。 In some embodiments, the antisense oligonucleotide does not recruit RNaseH. For example, an antisense oligonucleotide can substantially include RNA nucleotides. In yet other embodiments, the antisense oligonucleotide recruits RNase H and therefore comprises at least a stretch of DNA nucleotides. For example, an antisense oligonucleotide may be a gapmer.

特定の実施形態によれば、下記の実施例の項でマウスについて例示されるアンチセンスオリゴヌクレオチド(ASO)に対応するアンチセンス配列には、限定するものではないが、AAGATGGCAGTCTACTATGG(配列番号12)を標的とするCCATAGTAGACTGCCATCTT(配列番号7)、及びCACAAATGGACAGTGGAT(配列番号10)を標的とするATCCACTGTCCATTTGTG(配列番号9)が含まれる。ヌクレオチド配列は、便宜上、ここでは完全なDNA配列又はRNA配列として表されているが、アンチセンスオリゴヌクレオチドは、RNAヌクレオチド若しくはDNAヌクレオチド、又はそれらの混合物として構築されうることが理解される。すなわち、オリゴヌクレオチドがヌクレオチドチミン(T)を示す場合、ヌクレオチドは、そのRNA対応物(ウリジン、すなわち、U)によって置換することができ、逆もまた同様であることが理解される。さらに、当技術分野で周知のものなどのDNAヌクレオチド修飾及びRNAヌクレオチド修飾を使用して、アンチセンスオリゴヌクレオチドを構築することができることが理解される。 According to a particular embodiment, antisense sequences corresponding to the antisense oligonucleotides (ASOs) exemplified for mouse in the Examples section below include, but are not limited to, AAGATGGCAGTCTACTATGG (SEQ ID NO: 12). Included are ATCCACTGTCCATTTGTG (SEQ ID NO: 9), which targets CCATAGTAGACTGCCATCTT (SEQ ID NO: 7), and CACAAATGGACAGTGGAT (SEQ ID NO: 10). Although nucleotide sequences are conveniently presented herein as complete DNA or RNA sequences, it is understood that antisense oligonucleotides can be constructed as RNA or DNA nucleotides, or mixtures thereof. That is, it is understood that if an oligonucleotide exhibits the nucleotide thymine (T), the nucleotide can be replaced by its RNA counterpart (uridine, ie, U), and vice versa. Additionally, it is understood that antisense oligonucleotides can be constructed using DNA and RNA nucleotide modifications such as those well known in the art.

特定の実施形態によれば、核酸剤は、UUUUUACCU(配列番号122)に相補的なヌクレオチド配列を含む。本明細書で使用される場合、用語「相補的」は、カノニカルな(A/T、A/U、及びG/C)塩基対合を指す。 According to certain embodiments, the nucleic acid agent comprises a nucleotide sequence complementary to UUUUUACCU (SEQ ID NO: 122). As used herein, the term "complementary" refers to canonical (A/T, A/U, and G/C) base pairing.

特定の実施形態によれば、核酸剤は、ChaserrへのCHD2の結合を阻害する。 According to certain embodiments, the nucleic acid agent inhibits CHD2 binding to Chaserr.

特定の実施形態によれば、アンチセンスオリゴヌクレオチドは、配列番号140~143(A40、50、51、52に対応)に記載の核酸塩基配列を有する。その修飾版では、アンチセンスオリゴヌクレオチドは、配列番号128、131、132及び133として提供される。 According to a particular embodiment, the antisense oligonucleotide has a nucleobase sequence set forth in SEQ ID NOs: 140-143 (corresponding to A40, 50, 51, 52). In modified versions thereof, antisense oligonucleotides are provided as SEQ ID NOs: 128, 131, 132 and 133.

Chaserrの量を効率的に阻害するか又は減少させるために使用されうるアンチセンス分子の設計は、アンチセンス手法にとって重要な2つの態様を考慮しながら行われなければならない。第1の態様は、適切な細胞の核へのオリゴヌクレオチドの送達であり、第2の態様は、所望の機能を阻害するように細胞内の指定されたRNAに特異的に結合するオリゴヌクレオチドの設計である。 The design of antisense molecules that can be used to efficiently inhibit or reduce the amount of Chaserr must be done keeping in mind two aspects important to antisense approaches. The first aspect is the delivery of the oligonucleotide to the nucleus of the appropriate cell, and the second aspect is the delivery of the oligonucleotide to the nucleus of the appropriate cell, and the second aspect is the delivery of the oligonucleotide to the nucleus of the appropriate cell. It's by design.

先行技術は、オリゴヌクレオチドを多種多様な細胞型に効率的に送達するために使用されうるいくつかの送達戦略を教示している[例えば、Jaaskelainen et al.Cell Mol Biol Lett.(2002)7(2):236-7;Gait,Cell Mol Life Sci.(2003)60(5):844-53;Martino et al.J Biomed Biotechnol.(2009)2009:410260;Grijalvo et al.Expert Opin Ther Pat.(2014)24(7):801-19;Falzarano et al,Nucleic Acid Ther.(2014)24(1):87-100;Shilakari et al.Biomed Res Int.(2014)2014:526391;Prakash et al.Nucleic Acids Res.(2014)42(13):8796-807及びAsseline et al.J Gene Med.(2014)16(7-8):157-65を参照] The prior art teaches several delivery strategies that can be used to efficiently deliver oligonucleotides to a wide variety of cell types [eg, Jaaskelainen et al. Cell Mol Biol Lett. (2002) 7(2):236-7; Gait, Cell Mol Life Sci. (2003) 60(5):844-53; Martino et al. J Biomed Biotechnol. (2009) 2009:410260; Grijalvo et al. Expert Opin Ther Pat. (2014) 24(7):801-19; Falzarano et al, Nucleic Acid Ther. (2014) 24(1):87-100; Shilakari et al. Biomed Res Int. (2014) 2014:526391; Prakash et al. Nucleic Acids Res. (2014) 42(13):8796-807 and Asseline et al. J Gene Med. (2014) 16(7-8):157-65]

さらに、標的RNA及びオリゴヌクレオチドの両方の構造変化のエネルギー機構を説明する熱力学的サイクルに基づいて、それらの標的RNAに対して最も高い予測結合親和性を有する配列を同定するためのアルゴリズムも利用可能である[例えば、Walton et al.Biotechnol Bioeng 65:1-9(1999)を参照]。そのようなアルゴリズムは、細胞内でアンチセンス手法を実施するために首尾よく使用されている。 Additionally, an algorithm is utilized to identify sequences with the highest predicted binding affinity for target RNAs based on thermodynamic cycles that account for the energetic mechanisms of conformational changes in both target RNAs and oligonucleotides. possible [e.g. Walton et al. Biotechnol Bioeng 65:1-9 (1999)]. Such algorithms have been successfully used to implement antisense techniques in cells.

さらに、インビトロ系を使用して特定のオリゴヌクレオチドを設計し、その効率を予測するためのいくつかの手法も公開されている(Matveeva et al.,Nature Biotechnology 16:1374-1375(1998)]。 Additionally, several methods have been published for designing specific oligonucleotides and predicting their efficiency using in vitro systems (Matveeva et al., Nature Biotechnology 16:1374-1375 (1998)).

例えば、Chaserr RNAを標的とする好適なアンチセンスオリゴヌクレオチドは、後掲の表3に列挙され(かつ本明細書の不可欠な部分と見なされ)る配列のものであるか、又は配列番号140~143に記載のアンチセンスオリゴヌクレオチドのいずれか、若しくはA40、50、51、52に対応する配列番号128、131、132若しくは133に記載の修飾を有するアンチセンスオリゴヌクレオチドのいずれかである。 For example, suitable antisense oligonucleotides targeting Chaserr RNA are of the sequences listed in Table 3 below (and considered an integral part of this specification), or SEQ ID NOs: 140- 143, or an antisense oligonucleotide having a modification as set forth in SEQ ID NO: 128, 131, 132, or 133 corresponding to A40, 50, 51, 52.

様々な実施形態によれば、アンチセンスオリゴヌクレオチドは、完全RNAヌクレオチドを含むことができる。そのようなアンチセンスオリゴヌクレオチドはRNaseHを動員しないため、Chaserrは、そのアンチセンス阻害によって分解されないはずである。さらに他の実施形態では、アンチセンスオリゴヌクレオチドは、RNaseHを動員し、Chaserr RNAを分解することができるDNAヌクレオチドとRNAヌクレオチドとの混合物(例えば、ギャップマー)を含む。 According to various embodiments, antisense oligonucleotides can include complete RNA nucleotides. Since such antisense oligonucleotides do not recruit RNaseH, Chaserr should not be degraded by its antisense inhibition. In yet other embodiments, the antisense oligonucleotide comprises a mixture of DNA and RNA nucleotides (eg, a gapmer) capable of recruiting RNaseH and degrading Chaser RNA.

いくつかの実施形態では、アンチセンスオリゴヌクレオチドは、2’から4’への架橋を含有する1又は複数のヌクレオチド、例えば、ロックドヌクレオチド(LNA)又は拘束エチル(cEt)、及び本明細書に記載の他の架橋ヌクレオチドを含む。 In some embodiments, the antisense oligonucleotide contains one or more nucleotides containing a 2' to 4' bridge, such as a locked nucleotide (LNA) or a constrained ethyl (cEt), and herein Contains other bridging nucleotides as described.

いくつかの実施形態では、アンチセンスオリゴヌクレオチドは、2’-OMe又は2’-O-メトキシエチル(2’-O-MOE)などの2’-O修飾を有するヌクレオチドのうちの1又は複数(又はいくつかの実施形態では全部)を含む。 In some embodiments, the antisense oligonucleotide contains one or more of the nucleotides with a 2'-O modification, such as 2'-OMe or 2'-O-methoxyethyl (2'-O-MOE). or in some embodiments all).

いくつかの実施形態では、アンチセンスオリゴヌクレオチドは、ホスホロチオエート又はホスホロジチオエートなどの修飾骨格を含む。さらに他の実施形態では、アンチセンスオリゴヌクレオチドは、モルホリノ骨格を含む。 In some embodiments, antisense oligonucleotides include modified backbones such as phosphorothioate or phosphorodithioate. In yet other embodiments, the antisense oligonucleotide comprises a morpholino backbone.

いくつかの実施形態では、アンチセンスオリゴヌクレオチドは、5-メチルシトシンなどの修飾塩基を有する1又は複数のヌクレオチドを含む。 In some embodiments, antisense oligonucleotides include one or more nucleotides with modified bases, such as 5-methylcytosine.

使用されうる他のヌクレオチド修飾は、本明細書の他の箇所に記載されている。 Other nucleotide modifications that may be used are described elsewhere herein.

あるいは、CHD2のダウンレギュレーションは、RNAサイレンシングによって達成されうる。本明細書で使用される場合、「RNAサイレンシング」という語句は、RNAの活性又はアベイラビリティの阻害又は「サイレンシング」をもたらすRNA分子によって媒介される調節機構[例えば、RNA干渉(RNAi)、転写遺伝子サイレンシング(TGS)、転写後遺伝子サイレンシング(PTGS)、クエリング及び共抑制]の群を指す。RNAサイレンシングは、植物、動物及び真菌を含む多くの種類の生物において観察されている。 Alternatively, downregulation of CHD2 can be achieved by RNA silencing. As used herein, the phrase "RNA silencing" refers to regulatory mechanisms mediated by RNA molecules that result in inhibition or "silencing" of the activity or availability of RNA [e.g., RNA interference (RNAi), transcription gene silencing (TGS), post-transcriptional gene silencing (PTGS), querying and co-suppression]. RNA silencing has been observed in many types of organisms including plants, animals and fungi.

本明細書で使用される場合、用語「RNAサイレンシング剤」は、標的遺伝子の発現を特異的に阻害又は「サイレンシング」することができるRNAを指す。ある特定の実施形態では、RNAサイレンシング剤は、転写後サイレンシング機構を介してmRNA分子の完全なプロセシング(例えば、完全な翻訳及び/又は発現)を防止することができる。RNAサイレンシング剤には、非コードRNA分子、例えば、対の鎖を含むRNA二重鎖、及びそのような小さい非コードRNAを生成することができる前駆体RNAが含まれる。例示的なRNAサイレンシング剤には、siRNA、miRNA及びshRNAなどのdsRNAが含まれる。 As used herein, the term "RNA silencing agent" refers to an RNA that can specifically inhibit or "silence" the expression of a target gene. In certain embodiments, an RNA silencing agent can prevent complete processing (eg, complete translation and/or expression) of an mRNA molecule via a post-transcriptional silencing mechanism. RNA silencing agents include non-coding RNA molecules, such as RNA duplexes that include paired strands, and precursor RNAs that can generate such small non-coding RNAs. Exemplary RNA silencing agents include dsRNA, such as siRNA, miRNA and shRNA.

一実施形態では、RNAサイレンシング剤は、RNA干渉を誘導することができる。 In one embodiment, the RNA silencing agent is capable of inducing RNA interference.

本発明の一実施形態によれば、RNAサイレンシング剤は、標的RNAに特異的であり、Chaserrの最終エクソン(以下のエレメント:例えば、配列番号1、2、4又は6を用いて本明細書で上述したように)を含み、PCR、ウエスタンブロット、免疫組織化学的検査及び/又はフローサイトメトリーによって決定された場合に、標的遺伝子に対して99%以下の全体的相同性、例えば、標的遺伝子に対して98%未満、97%未満、96%未満、95%未満、94%未満、93%未満、92%未満、91%未満、90%未満、89%未満、88%未満、87%未満、86%未満、85%未満、84%未満、83%未満、82%未満、81%未満の全体的相同性を示す他の標的(又は同じ標的内の他のエクソン)を交差阻害又はサイレンシングしない核酸領域に実際に特異的である。 According to one embodiment of the invention, the RNA silencing agent is specific for the target RNA and is specific for the final exon of Chaserr (the following elements: e.g. as described above) and an overall homology of 99% or less to the target gene as determined by PCR, Western blot, immunohistochemistry and/or flow cytometry, e.g. Less than 98%, less than 97%, less than 96%, less than 95%, less than 94%, less than 93%, less than 92%, less than 91%, less than 90%, less than 89%, less than 88%, less than 87% , cross-inhibiting or silencing other targets (or other exons within the same target) that exhibit less than 86%, less than 85%, less than 84%, less than 83%, less than 82%, less than 81% overall homology It is actually specific for nucleic acid regions that do not.

RNA干渉とは、低分子干渉RNA(siRNA)によって媒介される、動物における配列特異的転写後遺伝子サイレンシングのプロセスを指す。 RNA interference refers to the process of sequence-specific post-transcriptional gene silencing in animals that is mediated by small interfering RNA (siRNA).

以下は、本発明の特定の実施形態に従って使用されうるRNAサイレンシング剤に関する詳細な説明である。 The following is a detailed description of RNA silencing agents that may be used in accordance with certain embodiments of the invention.

dsRNA、siRNA及びshRNA-細胞内の長いdsRNAの存在は、ダイサーと呼ばれるリボヌクレアーゼIII酵素の活性を刺激する。ダイサーは、低分子干渉RNA(siRNA)として知られる、dsRNAの短い断片へのdsRNAのプロセシングに関与する。ダイサー活性に由来する低分子干渉RNAは、典型的には約21~約23ヌクレオチド長であり、約19塩基対の二重鎖を含む。RNAi応答はまた、siRNA二重鎖のアンチセンス鎖に相補的な配列を有する一本鎖RNAの切断を媒介する、RNA誘導サイレンシング複合体(RISC)と一般に呼ばれるエンドヌクレアーゼ複合体を特徴とする。標的RNAの切断は、siRNA二重鎖のアンチセンス鎖に相補的な領域の中央で起こる。 dsRNA, siRNA and shRNA - The presence of long dsRNA in cells stimulates the activity of a ribonuclease III enzyme called Dicer. Dicer is involved in the processing of dsRNA into short fragments of dsRNA known as small interfering RNA (siRNA). Small interfering RNAs derived from Dicer activity are typically about 21 to about 23 nucleotides in length and include duplexes of about 19 base pairs. The RNAi response is also characterized by an endonuclease complex commonly referred to as the RNA-induced silencing complex (RISC) that mediates the cleavage of single-stranded RNA with sequences complementary to the antisense strand of the siRNA duplex. . Cleavage of the target RNA occurs in the middle of the region complementary to the antisense strand of the siRNA duplex.

したがって、本発明のいくつかの実施形態は、mRNAからのタンパク質発現をダウンレギュレートするためのdsRNAの使用を企図する。 Accordingly, some embodiments of the invention contemplate the use of dsRNA to downregulate protein expression from mRNA.

一実施形態によれば、30bpよりも長いdsRNAが使用される。様々な試験により、長いdsRNAを使用して、ストレス応答を誘導することなく、又は顕著なオフターゲット効果を引き起こすことなく、遺伝子発現をサイレンシングすることができることが実証されている。例えば、[Strat et al.,Nucleic Acids Research,2006,Vol.34,No.13 3803-3810;Bhargava A et al.Brain Res.Protoc.2004;13:115-125;Diallo M.,et al.,Oligonucleotides.2003;13:381-392;Paddison P.J.,et al.,Proc.Natl Acad.Sci.USA.2002;99:1443-1448;Tran N.,et al.,FEBS Lett.2004;573:127-134]を参照されたい。 According to one embodiment, dsRNAs longer than 30 bp are used. Various studies have demonstrated that long dsRNAs can be used to silence gene expression without inducing stress responses or causing significant off-target effects. For example, [Strat et al. , Nucleic Acids Research, 2006, Vol. 34, No. 13 3803-3810; Bhargava A et al. Brain Res. Protoc. 2004;13:115-125;Diallo M. , et al. , Oligonucleotides. 2003;13:381-392;Paddison P. J. , et al. , Proc. Natl Acad. Sci. USA. 2002;99:1443-1448;Tran N. , et al. , FEBS Lett. 2004;573:127-134].

本発明のいくつかの実施形態によれば、dsRNAは、インターフェロン経路が活性化されていない細胞内に提供される。例えば、Billy et al.,PNAS 2001,Vol 98,pages 14428-14433及びDiallo et al,Oligonucleotides,October 1,2003,13(5):381-392.doi:10.1089/154545703322617069を参照されたい。 According to some embodiments of the invention, dsRNA is provided within a cell in which the interferon pathway is not activated. For example, Billy et al. , PNAS 2001, Vol 98, pages 14428-14433 and Diallo et al, Oligonucleotides, October 1, 2003, 13(5): 381-392. See doi:10.1089/154545703322617069.

本発明の一実施形態によれば、長いdsRNAは、遺伝子発現をダウンレギュレートするためのインターフェロン経路及びPKR経路を誘導しないように特に設計される。例えば、Shinagwa及びIshii[Genes&Dev.17(11):1340-1345,2003]は、RNAポリメラーゼII(Pol II)プロモーターから長い二本鎖RNAを発現させるためのpDECAPと呼ばれるベクターを開発している。pDECAPからの転写物は、細胞質へのds-RNAの輸送を促進する5’-キャップ構造及び3’-ポリ(A)テールの両方を欠くため、pDECAPからの長いds-RNAはインターフェロン応答を誘導しない。 According to one embodiment of the invention, the long dsRNA is specifically designed not to induce the interferon and PKR pathways to downregulate gene expression. For example, Shinagwa and Ishii [Genes&Dev. 17(11):1340-1345, 2003] have developed a vector called pDECAP for expressing long double-stranded RNA from an RNA polymerase II (Pol II) promoter. Long ds-RNAs from pDECAP induce interferon responses because the transcripts from pDECAP lack both the 5'-cap structure and the 3'-poly(A) tail that facilitate transport of ds-RNA into the cytoplasm. do not.

哺乳動物系におけるインターフェロン経路及びPKR経路を回避する別の方法は、トランスフェクション又は内因性発現のいずれかによる低分子阻害RNA(siRNA)の導入によるものである。 Another way to circumvent the interferon and PKR pathways in mammalian systems is through the introduction of small inhibitory RNAs (siRNAs) either by transfection or endogenous expression.

用語「siRNA」は、RNA干渉(RNAi)経路を誘導する低分子阻害RNA二重鎖(一般に18~30塩基対)を指す。典型的には、siRNAは、中央の19bp二重鎖領域と末端に対称的な2塩基3’オーバーハングとを有する21量体として化学合成されるが、近年では、25~30塩基長の化学合成されたRNA二重鎖が、同じ位置の21量体と比較して効力の100倍もの増加を有し得ることが記載されている。RNAiの誘発時にさらに長いRNAを使用して得られた観察された効力の増加は、産物(21量体)の代わりに基質(27量体)をダイサーに提供することに起因すること、及びこれによりRISCへのsiRNA二重鎖の進入の速度又は効率が改善されることが示唆されている。 The term "siRNA" refers to small inhibitory RNA duplexes (generally 18-30 base pairs) that induce RNA interference (RNAi) pathways. Typically, siRNAs are chemically synthesized as 21-mers with a central 19 bp duplex region and symmetrical 2-base 3' overhangs at the ends, but in recent years siRNAs have been chemically synthesized as 21-mers with a central 19 bp duplex region and symmetrical 2-base 3' overhangs at the ends. It has been described that synthesized RNA duplexes can have as much as a 100-fold increase in potency compared to a 21-mer at the same position. The observed increased potency obtained using longer RNAs when inducing RNAi is due to providing Dicer with substrate (27-mer) instead of product (21-mer) and that this has been suggested to improve the speed or efficiency of entry of siRNA duplexes into RISC.

3’-オーバーハングの位置がsiRNAの効力に影響を及ぼし、アンチセンス鎖上に3’-オーバーハングを有する非対称二重鎖が、センス鎖上に3’-オーバーハングを有するものよりも一般に強力であることが見出されている(Rose et al.,2005)。これは、アンチセンス転写物を標的とする際に反対の有効性パターンが観察されることから、RISCへの非対称鎖負荷に起因する可能性がある。 The position of the 3'-overhang influences siRNA potency, with asymmetric duplexes with a 3'-overhang on the antisense strand generally being more potent than those with a 3'-overhang on the sense strand. (Rose et al., 2005). This may be due to asymmetric strand loading on RISC, as an opposite efficacy pattern is observed when targeting antisense transcripts.

二本鎖干渉RNA(例えば、siRNA)の鎖は、ヘアピン又はステム-ループ構造(例えば、shRNA)を形成するように連結されうる。したがって、言及されたように、本発明のいくつかの実施形態のRNAサイレンシング剤はまた、ショートヘアピンRNA(shRNA)でありうる。 Strands of double-stranded interfering RNA (eg, siRNA) can be linked to form hairpin or stem-loop structures (eg, shRNA). Thus, as mentioned, the RNA silencing agents of some embodiments of the invention can also be short hairpin RNAs (shRNAs).

本明細書で使用される用語「shRNA」は、相補的配列の第1及び第2の領域を含むステム-ループ構造を有するRNA剤(RNA agent)を指し、領域の相補性及び配向の程度は、領域間で塩基対合が起こるのに十分であり、第1及び第2の領域は、ループ領域によって連結され、ループは、ループ領域内のヌクレオチド(又はヌクレオチド類似体)間の塩基対合の欠如から生じる。ループ内のヌクレオチドの数は、3~23、又は5~15、又は7~13、又は4~9、又は9~11の数である。ループ内のヌクレオチドの一部は、ループ内の他のヌクレオチドとの塩基対相互作用に関与し得る。ループを形成するために使用されうるオリゴヌクレオチド配列の例には、国際特許出願番号WO2013126963及びWO2014107763に列挙されているものが挙げられる。得られた一本鎖オリゴヌクレオチドは、RNAi機構と相互作用することができる二本鎖領域を含むステム-ループ構造又はヘアピン構造を形成することが当業者によって認識されるであろう。 The term "shRNA" as used herein refers to an RNA agent that has a stem-loop structure that includes first and second regions of complementary sequence, the degree of complementarity and orientation of the regions being , is sufficient for base pairing to occur between the regions, and the first and second regions are connected by a loop region, the loop being sufficient for base pairing to occur between the nucleotides (or nucleotide analogs) within the loop region. arises from lack. The number of nucleotides within the loop is a number from 3 to 23, or from 5 to 15, or from 7 to 13, or from 4 to 9, or from 9 to 11. Some of the nucleotides within the loop may participate in base pairing interactions with other nucleotides within the loop. Examples of oligonucleotide sequences that can be used to form loops include those listed in International Patent Application Nos. WO2013126963 and WO2014107763. It will be appreciated by those skilled in the art that the resulting single-stranded oligonucleotide will form a stem-loop or hairpin structure that includes a double-stranded region that can interact with the RNAi machinery.

本発明のいくつかの実施形態とともに使用するのに適したRNAサイレンシング剤の合成は、以下のように行うことができる。第1に、Chaserr mRNA配列をAAジヌクレオチド配列についてスキャンする。各AA及び3’隣接19ヌクレオチドの存在を潜在的なsiRNA標的部位として記録する。 Synthesis of RNA silencing agents suitable for use with some embodiments of the invention can be performed as follows. First, the Chaserr mRNA sequence is scanned for AA dinucleotide sequences. Record the presence of each AA and the 3' adjacent 19 nucleotides as potential siRNA target sites.

第2に、潜在的な標的部位を、NCBIサーバーから入手可能なBLASTソフトウェア(www(dot)ncbi.nlm.nih(dot)gov/BLAST/)などのいずれかの配列アライメントソフトウェアを使用して、適切なゲノムデータベース(例えば、ヒト、マウス、ラットなど)と比較する。 Second, potential target sites are identified using any sequence alignment software such as BLAST software available from NCBI servers (www(dot)ncbi.nlm.nih(dot)gov/BLAST/). Compare to appropriate genomic databases (e.g., human, mouse, rat, etc.).

適格な標的配列をsiRNA合成の鋳型として選択する。好ましい配列は、G/C含有量が低い配列であり、これは、これらが、55%超のG/C含有量を有する配列よりも、遺伝子サイレンシングを媒介する点で効果的であることが証明されているためである。いくつかの標的部位が、評価のために標的遺伝子の長さに沿って選択されることが好ましい。選択されたsiRNAのさらに良好な評価のために、陰性対照を併用することが好ましい。陰性対照siRNAは、siRNAと同じヌクレオチド組成を含むことが好ましいが、ゲノムとの有意な相同性を欠く。したがって、どのような他の遺伝子に対しても有意な相同性を何ら示さないならば、siRNAのスクランブルされたヌクレオチド配列が使用されることが好ましい。 A qualified target sequence is selected as a template for siRNA synthesis. Preferred sequences are those with low G/C content, as these are likely to be more effective at mediating gene silencing than sequences with G/C content greater than 55%. This is because it has been proven. Preferably, several target sites are selected along the length of the target gene for evaluation. For better evaluation of the selected siRNA, it is preferable to use a negative control in combination. Preferably, the negative control siRNA comprises the same nucleotide composition as the siRNA, but lacks significant homology with the genome. Therefore, it is preferred that scrambled nucleotide sequences of siRNA are used, provided they do not show any significant homology to any other genes.

本発明のいくつかの実施形態のRNAサイレンシング剤は、本明細書中上記で言及されるように、RNAのみを含有する分子に限定される必要はなく、化学的に修飾されたヌクレオチド及び非ヌクレオチドをさらに包含することが理解されるであろう。 The RNA silencing agents of some embodiments of the invention need not be limited to molecules containing only RNA, but also chemically modified nucleotides and non-containing molecules, as mentioned herein above. It will be understood that nucleotides are further included.

miRNA及びmiRNA模倣物-別の実施形態によれば、RNAサイレンシング剤はmiRNAでありうる。 miRNA and miRNA mimetics - According to another embodiment, the RNA silencing agent can be a miRNA.

用語「マイクロRNA」、「miRNA」及び「miR」は、同義であり、遺伝子発現を調節する約19~28ヌクレオチド長の非コード一本鎖RNA分子の集合体を指す。miRNAは、広範囲の生物に見出され(viruses(dot)fwdarw(dot)humans)、発生、恒常性及び疾患病因に何らかの役割を果たすことが示されている。 The terms "microRNA", "miRNA" and "miR" are synonymous and refer to a collection of non-coding single-stranded RNA molecules approximately 19-28 nucleotides in length that regulate gene expression. miRNAs are found in a wide range of organisms (viruses (dot) fwdarw (dot) humans) and have been shown to play roles in development, homeostasis and disease pathogenesis.

miRNA模倣物の調製は、当技術分野で公知のいずれかの方法、例えば、化学合成又は組換え法によって行われ得る。 Preparation of miRNA mimetics can be performed by any method known in the art, such as chemical synthesis or recombinant methods.

本明細書中上記で提供される記載から、細胞をmiRNAと接触させることが、例えば、成熟二本鎖miRNA、pre-miRNA又はpri-miRNAにより細胞をトランスフェクションすることによって行われ得ることが理解されるであろう。 From the description provided hereinabove, it is understood that contacting a cell with a miRNA can be performed, for example, by transfecting the cell with a mature double-stranded miRNA, pre-miRNA or pri-miRNA. will be done.

本明細書では、バイオアベイラビリティ、親和性、安定性又はそれらの組合せを改善するために核酸配列修飾も企図される。 Nucleic acid sequence modifications are also contemplated herein to improve bioavailability, affinity, stability, or combinations thereof.

一実施形態によれば、核酸剤は、少なくとも1つの塩基(例えば、核酸塩基)修飾又は置換を含む。 According to one embodiment, the nucleic acid agent includes at least one base (eg, nucleobase) modification or substitution.

本明細書で使用される場合、「非修飾」又は「天然」塩基には、プリン塩基のアデニン(A)及びグアニン(G)、並びにピリミジン塩基のチミン(T)、シトシン(C)及びウラシル(U)が含まれる。「修飾」塩基には、限定するものではないが、他の合成塩基及び天然塩基、例えば、5-メチルシトシン(5-me-C);5-ヒドロキシメチルシトシン;キサンチン;ヒポキサンチン;2-アミノアデニン;アデニン及びグアニンの6-メチル及び他のアルキル誘導体;アデニン及びグアニンの2-プロピル及び他のアルキル誘導体;2-チオウラシル、2-チオチミン及び2-チオシトシン;5-ハロウラシル及びシトシン;5-プロピニルウラシル及びシトシン;6-アゾウラシル、シトシン及びチミン;5-ウラシル(プソイドウラシル);4-チオウラシル;8-ハロ、8-アミノ、8-チオール、8-チオアルキル、8-ヒドロキシル及び他の8-置換アデニン及びグアニン;5-ハロ、特に5-ブロモ、5-トリフルオロメチル及び他の5-置換ウラシル及びシトシン;7-メチルグアニン及び7-メチルアデニン;8-アザグアニン及び8-アザアデニン;7-デアザグアニン及び7-デアザアデニン;並びに3-デアザグアニン及び3-デアザアデニンが含まれる。追加の修飾塩基には、米国特許第3,687,808号明細書;Kroschwitz,J.I.,ed.(1990),“The Concise Encyclopedia Of Polymer Science And Engineering,” pages 858-859,John Wiley&Sons;Englisch et al.(1991),“Angewandte Chemie,” International Edition,30,613;及びSanghvi,Y.S.,“Antisense Research and Applications,” Chapter 15,pages 289-302,S.T.Crooke and B.Lebleu,eds.,CRC Press,1993に開示されているものが含まれる。このような修飾塩基は、本発明のオリゴマー化合物の結合親和性を増加させるのに特に有用である。これらには、2-アミノプロピルアデニン、5-プロピニルウラシル及び5-プロピニルシトシンを含む5-置換ピリミジン、6-アザピリミジン並びにN-2、N-6及びO-6-置換プリンが含まれる。5-メチルシトシン置換は、核酸二重鎖の安定性を0.6~1.2℃増加させることが示されており(Sanghvi,Y.S.et al.(1993),“Antisense Research and Applications,” pages 276-278,CRC Press,Boca Raton)、現時点で好ましい塩基置換であり、2’-O-メトキシエチル糖修飾と組み合わせた場合にさらになお特に好ましい。追加の塩基修飾は、参照により本明細書に組み込まれるDeleavey and Damha,Chemistry and Biology(2012)19:937-954に記載されている。 As used herein, "unmodified" or "natural" bases include the purine bases adenine (A) and guanine (G), and the pyrimidine bases thymine (T), cytosine (C), and uracil ( U) is included. "Modified" bases include, but are not limited to, other synthetic and natural bases such as 5-methylcytosine (5-me-C); 5-hydroxymethylcytosine; xanthine; hypoxanthine; 2-amino Adenine; 6-methyl and other alkyl derivatives of adenine and guanine; 2-propyl and other alkyl derivatives of adenine and guanine; 2-thiouracil, 2-thiothymine and 2-thiocytosine; 5-halouracil and cytosine; 5-propynyluracil and cytosine; 6-azouracil, cytosine and thymine; 5-uracil (pseudouracil); 4-thiouracil; 8-halo, 8-amino, 8-thiol, 8-thioalkyl, 8-hydroxyl and other 8-substituted adenines and guanines 5-halo, especially 5-bromo, 5-trifluoromethyl and other 5-substituted uracils and cytosines; 7-methylguanine and 7-methyladenine; 8-azaguanine and 8-azaadenine; 7-deazaguanine and 7-deazaadenine ; and 3-deazaguanine and 3-deazaadenine. Additional modified bases include those described in U.S. Pat. No. 3,687,808; Kroschwitz, J.; I. , ed. (1990), “The Concise Encyclopedia Of Polymer Science And Engineering,” pages 858-859, John Wiley &Sons; Englisch et al. (1991), “Angewandte Chemie,” International Edition, 30, 613; and Sanghvi, Y. S. , “Antisense Research and Applications,” Chapter 15, pages 289-302, S. T. Crooke and B. Lebleu, eds. , CRC Press, 1993. Such modified bases are particularly useful in increasing the binding affinity of oligomeric compounds of the invention. These include 5-substituted pyrimidines, including 2-aminopropyladenine, 5-propynyluracil and 5-propynylcytosine, 6-azapyrimidine and N-2, N-6 and O-6-substituted purines. 5-Methylcytosine substitution has been shown to increase the stability of nucleic acid duplexes by 0.6-1.2°C (Sanghvi, Y.S. et al. (1993), “Antisense Research and Applications ," pages 276-278, CRC Press, Boca Raton), are presently preferred base substitutions, and even more particularly preferred when combined with the 2'-O-methoxyethyl sugar modification. Additional base modifications are described in Deleavey and Damha, Chemistry and Biology (2012) 19:937-954, which is incorporated herein by reference.

一実施形態によれば、修飾は、骨格に(すなわち、ヌクレオチド間結合及び/又は糖部分に)ある。 According to one embodiment, the modification is in the backbone (ie in the internucleotide linkages and/or sugar moieties).

核酸分子の糖修飾は、当技術分野で広く記載されている(いずれも参照により本明細書に組み込まれるPCT国際公開番号WO92/07065、WO93/15187、WO98/13526及びWO97/26270;米国特許第5,334,711号明細書;米国特許第5,716,824号明細書;及び米国特許第5,627,053号明細書;Perrault et al.,1990;Pieken et al.,1991;Usman&Cedergren,1992;Beigelman et al.,1995;Karpeisky et al.,1998;Earnshaw&Gait,1998;Verma&Eckstein,1998;Burlina et al.,1997を参照)。そのような刊行物は、触媒作用を調節することなく核酸分子への糖、塩基及び/又はリン酸修飾などの取込みの位置を決定するための一般的な方法及び戦略を記載している。例示的な糖修飾には、限定するものではないが、2’修飾ヌクレオチド、例えば、2’-デオキシ、2’-フルオロ(2’-F)、2’-デオキシ-2’-フルオロ、2’-O-メチル(2’-O-Me)、2’-O-メトキシエチル(2’-O-MOE)、2’-O-アミノプロピル(2’-O-AP)、2’-O-ジメチルアミノエチル(2’-O-DMAOE)、2’-O-ジメチルアミノプロピル(2’-O-DMAP)、2’-O-ジメチルアミノエチルオキシエチル(2’-O-DMAEOE)、2’-フルオロアラビノオリゴヌクレオチド(2’-F-ANA)、2’-O--N-メチルアセトアミド(2’-O-NMA)、2’-NH2又はロックド核酸(LNA)が含まれる。追加の糖修飾は、参照により本明細書に組み込まれるDeleavey and Damha,Chemistry and Biology(2012)19:937-954に記載されている。 Sugar modification of nucleic acid molecules has been widely described in the art (PCT International Publication Nos. WO92/07065, WO93/15187, WO98/13526 and WO97/26270, all of which are incorporated herein by reference; U.S. Pat. No. 5,334,711; U.S. Pat. No. 5,716,824; and U.S. Pat. No. 5,627,053; Perrault et al., 1990; Pieken et al., 1991; Usman & Cedergren, 1992; Beigelman et al., 1995; Karpeisky et al., 1998; Earnshaw & Gait, 1998; Verma & Eckstein, 1998; Burlina et al., 1997). Such publications describe general methods and strategies for determining the location of incorporation of sugar, base and/or phosphate modifications, etc. into nucleic acid molecules without modulating catalysis. Exemplary sugar modifications include, but are not limited to, 2' modified nucleotides, such as 2'-deoxy, 2'-fluoro (2'-F), 2'-deoxy-2'-fluoro, 2' -O-methyl (2'-O-Me), 2'-O-methoxyethyl (2'-O-MOE), 2'-O-aminopropyl (2'-O-AP), 2'-O- Dimethylaminoethyl (2'-O-DMAOE), 2'-O-dimethylaminopropyl (2'-O-DMAP), 2'-O-dimethylaminoethyloxyethyl (2'-O-DMAEOE), 2' - Fluoroarabino oligonucleotide (2'-F-ANA), 2'-O--N-methylacetamide (2'-O-NMA), 2'-NH2 or locked nucleic acid (LNA). Additional sugar modifications are described in Deleavey and Damha, Chemistry and Biology (2012) 19:937-954, which is incorporated herein by reference.

したがって、例えば、オリゴヌクレオチドは、ヌクレアーゼ耐性基による修飾によってそれらの安定性を増強し、及び/又は生物学的活性を増強するように修飾され得、例えば、本発明の核酸剤は、2’-O-メチル、2’-フッ素、2’-O-メトキシエチル、2’-O-アミノプロピル、2’-アミノ、及び/又はホスホロチオエート結合を含むことができる。ロックド核酸(LNA)を含めると、例えば、リボース環が2’-O原子と4’-C原子とを連結するメチレン架橋によって「ロック」されている核酸類似体、エチレン核酸(ENA)、例えば、2’-4’-エチレン架橋核酸、及び特定の核酸塩基修飾、例えば、2-アミノ-A、2-チオ(例えば、2-チオ-U)、G-クランプ修飾を含めると、標的に対する結合親和性を増加させることもできる。オリゴヌクレオチド骨格にピラノース糖を含めると、エンドヌクレアーゼ切断を減少させることもできる。結合アームは、DNA内のデオキシリボース(又はリボース)リン酸骨格がポリアミド骨格によって置換されているペプチド核酸(PNA)をさらに含んでもよいか、又はポリマー骨格、環状骨格若しくは非環状骨格を含んでもよい。結合領域は、糖模倣物を組み込んでもよく、望ましくない分解を防止するために(以下に説明されるように)、特にその末端に保護基をさらに含んでもよい。 Thus, for example, oligonucleotides can be modified to enhance their stability and/or enhance biological activity by modification with nuclease-resistant groups; for example, the nucleic acid agents of the invention may be It can include O-methyl, 2'-fluorine, 2'-O-methoxyethyl, 2'-O-aminopropyl, 2'-amino, and/or phosphorothioate linkages. Locked nucleic acids (LNAs) include, for example, nucleic acid analogs in which the ribose ring is "locked" by a methylene bridge connecting the 2'-O and 4'-C atoms, ethylene nucleic acids (ENA), e.g. The inclusion of 2'-4'-ethylene bridged nucleic acids and certain nucleobase modifications, such as 2-amino-A, 2-thio (e.g., 2-thio-U), G-clamp modifications, improves the binding affinity for the target. It can also increase sex. Including pyranose sugars in the oligonucleotide backbone can also reduce endonucleolytic cleavage. The binding arm may further include a peptide nucleic acid (PNA) in which the deoxyribose (or ribose) phosphate backbone in the DNA is replaced by a polyamide backbone, or may include a polymer backbone, a cyclic backbone, or an acyclic backbone. . The binding region may incorporate a sugar mimetic and may further include a protecting group, particularly at its terminus, to prevent undesired degradation (as explained below).

例示的なヌクレオチド間結合修飾には、限定するものではないが、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アミノアルキルホスホトリエステル、メチルホスホネート、アルキルホスホネート(3’-アルキレンホスホネートを含む)、キラルホスホネート、ホスフィネート、ホスホルアミデート(3’-アミノホスホルアミデートを含む)、アミノアルキルホスホルアミデート、チオノホスホルアミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、ボラノホスフェート(通常の3’-5’結合を有するもの、これらの2’-5’結合類似体、及び隣接するヌクレオシド単位対が3’-5’から5’-3’へ、又は2’-5’から5’-2’へ結合している逆極性を有するものなど)、ボロンホスホネート、ホスホジエステル、ホスホノアセテート(PACE)、モルホリノ、アミデートカルバメート、カルボキシメチル、アセトアミデート、ポリアミド、スルホネート、スルホンアミド、スルファメート、ホルムアセタール、チオホルムアセタール、アルキルシリル、置換、ペプチド核酸(PNA)及び/又はトレオース核酸(TNA)が含まれる。上記の修飾の様々な塩形態、混合塩形態及び遊離酸形態も使用することができる。追加のヌクレオチド間結合修飾は、いずれも参照により本明細書に組み込まれるDeleavey and Damha,Chemistry and Biology(2012)19:937-954;及びHunziker&Leumann,1995 and De Mesmaeker et al.,1994に記載されている。 Exemplary internucleotide bond modifications include, but are not limited to, phosphorothioates, chiral phosphorothioates, phosphorodithioates, phosphotriesters, aminoalkylphosphotriesters, methylphosphonates, alkylphosphonates (including 3'-alkylenephosphonates). ), chiral phosphonates, phosphinates, phosphoramidates (including 3'-aminophosphoramidates), aminoalkylphosphoramidates, thionophosphoramidates, thionoalkylphosphonates, thionoalkylphosphotriesters, Boranophosphates (those with the usual 3'-5' linkage, their 2'-5' linked analogs, and those with adjacent nucleoside unit pairs 3'-5' to 5'-3' or 2' boron phosphonate, phosphodiester, phosphonoacetate (PACE), morpholino, amidate carbamate, carboxymethyl, acetamidate, polyamide, Included are sulfonates, sulfonamides, sulfamates, formacetals, thioformacetals, alkylsilyls, substituted, peptide nucleic acids (PNAs) and/or threose nucleic acids (TNAs). Various salt forms, mixed salt forms and free acid forms of the above modifications may also be used. The additional nucleotide interconnection modifiers are DELEAVEY AND DAMHA, CHEMISTRY AND BIOLOGY (2012) 19: 937-954; and HUNZIKER & LEUMANN ND DE MESMAEKER ET AL. , 1994.

特定の実施形態によれば、修飾は、修飾ヌクレオシド三リン酸(dNTP)を含む。 According to certain embodiments, the modifications include modified nucleoside triphosphates (dNTPs).

一実施形態によれば、修飾は、エッジ-ブロッカーオリゴヌクレオチド(edge-blocker oligonucleotide)を含む。 According to one embodiment, the modification includes an edge-blocker oligonucleotide.

特定の実施形態によれば、エッジ-ブロッカーオリゴヌクレオチドは、ホスフェート、逆位dT及びアミノ-C7を含む。 According to certain embodiments, the edge-blocker oligonucleotide includes phosphate, inverted dT and amino-C7.

一実施形態によれば、核酸剤は、1又は複数の保護基、例えば、5’及び/又は3’キャップ構造を含むように修飾される。 According to one embodiment, the nucleic acid agent is modified to include one or more protecting groups, eg, 5' and/or 3' cap structures.

本明細書で使用される場合、「キャップ構造」という語句は、オリゴヌクレオチドのいずれかの末端に組み込まれている化学修飾を指すことを意味する(例えば、参照により本明細書に組み込まれる米国特許第5,998,203号明細書を参照)。これらの末端修飾は、核酸分子をエキソヌクレアーゼ分解から保護し、細胞内での送達及び/又は局在化を助けることができる。キャップ修飾は、5’末端(5’-キャップ)若しくは3’末端(3’-キャップ)に存在し得るか、又は両末端に存在し得る。非限定的な例では、5’-キャップは、逆位脱塩基残基(inverted abasic residue)(部分);4’,5’-メチレンヌクレオチド;1-(ベータ-D-エリスロフラノシル)ヌクレオチド、4’-チオヌクレオチド;炭素環ヌクレオチド;1,5-アンヒドロヘキシトールヌクレオチド;L-ヌクレオチド;アルファ-ヌクレオチド;修飾塩基ヌクレオチド;ホスホロジチオエート結合;トレオ-ペントフラノシルヌクレオチド;非環状3’,4’-secoヌクレオチド;非環状3,4-ジヒドロキシブチルヌクレオチド;非環状3,5-ジヒドロキシペンチルヌクレオチド、3’-3’-逆位ヌクレオチド部分;3’-3’-逆位脱塩基部分;3’-2’-逆位ヌクレオチド部分;3’-2’-逆位脱塩基部分;1,4-ブタンジオールホスフェート;3’-ホスホルアミデート;ヘキシルホスフェート;アミノヘキシルホスフェート;3’-ホスフェート;3’-ホスホロチオエート;ホスホロジチオエート;又は架橋若しくは非架橋メチルホスホネート部分を含む群から選択される。 As used herein, the phrase "cap structure" is meant to refer to chemical modifications that are incorporated into either terminus of an oligonucleotide (e.g., U.S. Pat. No. 5,998,203). These terminal modifications can protect the nucleic acid molecule from exonucleolytic degradation and aid in intracellular delivery and/or localization. Cap modifications may be present at the 5' end (5'-cap) or the 3' end (3'-cap), or at both ends. In non-limiting examples, the 5'-cap is an inverted abasic residue (part); 4',5'-methylene nucleotide; 1-(beta-D-erythrofuranosyl) nucleotide; 4'-thionucleotide; carbocyclic nucleotide; 1,5-anhydrohexitol nucleotide; L-nucleotide; alpha-nucleotide; modified base nucleotide; phosphorodithioate linkage; threo-pentofuranosyl nucleotide; acyclic 3' , 4'-seco nucleotide; acyclic 3,4-dihydroxybutyl nucleotide; acyclic 3,5-dihydroxypentyl nucleotide, 3'-3'-inverted nucleotide moiety; 3'-3'-inverted abasic moiety; 3'-2'-reverse nucleotide moiety; 3'-2'-reverse abasic moiety; 1,4-butanediol phosphate; 3'-phosphoramidate; hexyl phosphate; aminohexyl phosphate; 3'-phosphate ; 3'-phosphorothioate; phosphorodithioate; or a bridged or unbridged methylphosphonate moiety.

いくつかの実施形態では、3’-キャップは、逆位デオキシヌクレオチド、例えば、逆位デオキシチミジン、4’,5’-メチレンヌクレオチド;1-(ベータ-D-エリスロフラノシル)ヌクレオチド;4’-チオヌクレオチド、炭素環ヌクレオチド;5’-アミノ-アルキルホスフェート;1,3-ジアミノ-2-プロピルホスフェート;3-アミノプロピルホスフェート;6-アミノヘキシルホスフェート;1,2-アミノドデシルホスフェート;ヒドロキシプロピルホスフェート;1,5-アンヒドロヘキシトールヌクレオチド;L-ヌクレオチド;アルファ-ヌクレオチド;修飾塩基ヌクレオチド;ホスホロジチオエート;トレオ-ペントフラノシルヌクレオチド;非環状3’,4’-secoヌクレオチド;3,4-ジヒドロキシブチルヌクレオチド;3,5-ジヒドロキシペンチルヌクレオチド、5’-5’-逆位ヌクレオチド部分;5’-5’-逆位脱塩基部分;5’-ホスホルアミデート;5’-ホスホロチオエート;1,4-ブタンジオールホスフェート;5’-アミノ;架橋及び/又は非架橋5’-ホスホルアミデート、ホスホロチオエート及び/又はホスホロジチオエート、架橋又は非架橋メチルホスホネート並びに5’-メルカプト部分などを含む群から選択される(参照により本明細書に組み込まれるBeaucage&Iyer,1993を一般に参照)。 In some embodiments, the 3'-cap is an inverted deoxynucleotide, such as an inverted deoxythymidine, a 4',5'-methylene nucleotide; a 1-(beta-D-erythrofuranosyl) nucleotide; a 4'- Thionucleotide, carbocyclic nucleotide; 5'-amino-alkyl phosphate; 1,3-diamino-2-propyl phosphate; 3-aminopropyl phosphate; 6-aminohexyl phosphate; 1,2-aminododecyl phosphate; hydroxypropyl phosphate; 1,5-anhydrohexitol nucleotide; L-nucleotide; alpha-nucleotide; modified base nucleotide; phosphorodithioate; threo-pentofuranosyl nucleotide; acyclic 3',4'-seco nucleotide; 3,4- Dihydroxybutyl nucleotide; 3,5-dihydroxypentyl nucleotide, 5'-5'-reverse nucleotide moiety; 5'-5'-reverse abasic moiety; 5'-phosphoramidate; 5'-phosphorothioate; 1, 4-butanediol phosphate; 5'-amino; a group containing bridged and/or unbridged 5'-phosphoramidates, phosphorothioates and/or phosphorodithioates, bridged or unbridged methylphosphonates, and 5'-mercapto moieties, etc. (see generally Beaucage & Iyer, 1993, incorporated herein by reference).

核酸剤は、3’カチオン性基を含ませることによって、又は3’-3’結合によって末端のヌクレオシドを逆向きにすることによって、さらに修飾されうる。別の代替では、3’末端は、アミノアルキル基、例えば、3’ C5-アミノアルキルdTによってブロックされうる。他の3’コンジュゲートは、3’-5’エキソヌクレアーゼ切断を阻害することができる。理論に拘束されるものではないが、ナプロキセン又はイブプロフェンなどの3’コンジュゲートは、エキソヌクレアーゼがオリゴヌクレオチドの3’末端に結合するのを立体的にブロックすることによってエキソヌクレアーゼ切断を阻害し得る。小さなアルキル鎖、アリール基、又は複素環コンジュゲート若しくは修飾糖(D-リボース、デオキシリボース、グルコースなど)も、3’-5’-エキソヌクレアーゼをブロックすることができる。 Nucleic acid agents can be further modified by including a 3' cationic group or by reversing the terminal nucleoside through a 3'-3' linkage. In another alternative, the 3' end can be blocked by an aminoalkyl group, eg 3' C5-aminoalkyl dT. Other 3' conjugates can inhibit 3'-5' exonuclease cleavage. Without wishing to be bound by theory, 3' conjugates such as naproxen or ibuprofen may inhibit exonuclease cleavage by sterically blocking exonuclease binding to the 3' end of the oligonucleotide. Small alkyl chains, aryl groups, or heterocyclic conjugates or modified sugars (such as D-ribose, deoxyribose, glucose, etc.) can also block 3'-5'-exonucleases.

一実施形態によれば、5’末端は、アミノアルキル基、例えば、5’-O-アルキルアミノ置換基によってブロックされうる。他の5’コンジュゲートは、5’-3’エキソヌクレアーゼ切断を阻害することができる。理論に拘束されるものではないが、ナプロキセン又はイブプロフェンなどの5’コンジュゲートは、エキソヌクレアーゼがオリゴヌクレオチドの5’末端に結合するのを立体的にブロックすることによってエキソヌクレアーゼ切断を阻害し得る。小さなアルキル鎖、アリール基、又は複素環コンジュゲート若しくは修飾糖(D-リボース、デオキシリボース、グルコースなど)も、3’-5’-エキソヌクレアーゼをブロックすることができる。 According to one embodiment, the 5' end may be blocked by an aminoalkyl group, such as a 5'-O-alkylamino substituent. Other 5' conjugates can inhibit 5'-3' exonuclease cleavage. Without wishing to be bound by theory, 5' conjugates such as naproxen or ibuprofen may inhibit exonuclease cleavage by sterically blocking exonuclease binding to the 5' end of the oligonucleotide. Small alkyl chains, aryl groups, or heterocyclic conjugates or modified sugars (such as D-ribose, deoxyribose, glucose, etc.) can also block 3'-5'-exonucleases.

特定の実施形態によれば、修飾は、ロックド核酸(LNA)、若しくはcEtなどの他の架橋ヌクレオチド、及び/又は2’-O-(2-メトキシエチル)(2’MOEと略される)若しくは2’-OMe修飾を含めることを含み、それによって、配列の少なくとも一部又は全部は、各ヌクレオチドの2’位で修飾される。例えば、限定するものではないが、A40、A50、A51、A35、A49及びA52が挙げられる。 According to certain embodiments, the modifications include locked nucleic acids (LNAs), or other bridging nucleotides such as cEt, and/or 2'-O-(2-methoxyethyl) (abbreviated as 2'MOE) or including a 2'-OMe modification whereby at least a portion or all of the sequence is modified at the 2' position of each nucleotide. Examples include, but are not limited to, A40, A50, A51, A35, A49, and A52.

本明細書では、ギャップマーも企図される(下記の実施例の項を参照、表5を参照)。ギャップマーは、RNase H切断を誘導するのに十分な長さのデオキシヌクレオチドモノマーの中央ブロックを含有するキメラアンチセンスオリゴヌクレオチドである。 Gapmers are also contemplated herein (see Examples section below, Table 5). Gapmers are chimeric antisense oligonucleotides that contain a central block of deoxynucleotide monomers of sufficient length to induce RNase H cleavage.

核酸剤(及び上記のその修飾)はまた、以下に要約されるようにDNAレベルで作用することができる。 Nucleic acid agents (and their modifications described above) can also act at the DNA level as summarized below.

Chaserrのダウンレギュレーションはまた、遺伝子構造内の機能喪失変化(例えば、点変異、欠失及び挿入)を伴う標的化変異を導入することによって遺伝子(例えば、Chaserr)を不活性化することによって達成されうる。 Down-regulation of Chaserr can also be achieved by inactivating the gene (e.g. Chaser) by introducing targeted mutations with loss-of-function changes within the gene structure (e.g. point mutations, deletions and insertions). sell.

本明細書で使用される場合、「機能喪失変化(loss-of-function alterations)」という語句は、発現されたlncRNA産物の発現レベル及び/又は活性のダウンレギュレーションをもたらす、遺伝子のDNA配列内(例えば、Chaserrの最終エクソン内)のいずれかの変異を指す。そのような機能喪失変化の非限定的な例には、すなわち、特定の遺伝子産物のダウンレギュレーションをもたらす、通常は遺伝子の転写開始部位の5’側の、プロモーター配列内の変異;調節変異、すなわち、遺伝子産物の発現に影響を及ぼす、遺伝子の上流若しくは下流の領域内、又は遺伝子内の領域内の変異;欠失変異、すなわち、遺伝子配列内のいずれかの核酸を欠失させる変異;挿入変異、すなわち、遺伝子配列に核酸を挿入し、転写終結配列の挿入をもたらし得る変異;逆位、すなわち、逆位配列をもたらす変異;スプライス変異、すなわち、異常なスプライシング又は不十分なスプライシングをもたらす変異;及び重複変異、すなわち、フレーム内でありうるか又はフレームシフトを引き起こし得る重複配列をもたらす変異が挙げられる。 As used herein, the phrase "loss-of-function alterations" refers to alterations (loss-of-function alterations) within the DNA sequence of a gene that result in down-regulation of the expression level and/or activity of the expressed lncRNA product. For example, it refers to any mutation in the final exon of Chaserr). Non-limiting examples of such loss-of-function changes include, i.e., mutations within the promoter sequence, usually 5' to the transcription start site of the gene, resulting in down-regulation of a particular gene product; regulatory mutations, i.e. , mutations in regions upstream or downstream of a gene or within a gene that affect the expression of the gene product; deletion mutations, i.e. mutations that delete any nucleic acid within the gene sequence; insertion mutations; , i.e. mutations that may result in the insertion of a nucleic acid into the gene sequence and the insertion of a transcription termination sequence; inversions, i.e. mutations resulting in an inverted sequence; splice mutations, i.e. mutations resulting in aberrant splicing or insufficient splicing; and overlapping mutations, ie, mutations that result in overlapping sequences that may be in frame or cause a frame shift.

特定の実施形態によれば、遺伝子の機能喪失変化は、遺伝子の少なくとも1つの対立遺伝子を含み得る。 According to certain embodiments, a loss-of-function change in a gene may involve at least one allele of the gene.

本明細書で使用される用語「対立遺伝子」は、遺伝子座の1又は複数の代替形態のいずれかを指し、その対立遺伝子はいずれも、形質又は特徴に関連する。2倍体細胞又は2倍体生物では、所与の遺伝子の2つの対立遺伝子は、相同染色体対上の対応する遺伝子座を占める。 The term "allele" as used herein refers to any one or more alternative forms of a genetic locus, any allele of which is associated with a trait or characteristic. In diploid cells or organisms, the two alleles of a given gene occupy corresponding loci on a pair of homologous chromosomes.

他の特定の実施形態によれば、遺伝子の機能喪失変化は、遺伝子の両対立遺伝子を含む。そのような場合、例えば、Chaserrの最終エクソン内の変異は、ホモ接合型又はヘテロ接合型でありうる。 According to other specific embodiments, the loss-of-function alteration of a gene includes both alleles of the gene. In such cases, for example, mutations within the final exon of Chaserr may be homozygous or heterozygous.

関心対象の遺伝子に核酸変化を導入する方法は、当技術分野で周知であり[例えば、Menke D.Genesis(2013)51:-618;Capecchi,Science(1989)244:1288-1292;Santiago et al.Proc Natl Acad Sci USA(2008)105:5809-5814;国際特許出願番号WO2014085593、WO2009071334及びWO2011146121;米国特許第8771945号明細書、米国特許第8586526号明細書、米国特許第6774279号明細書及び米国特許出願公開第20030232410号明細書、米国特許出願公開第20050026157号明細書、米国特許出願公開第20060014264号明細書を参照、標的化相同組換え、部位特異的リコンビナーゼ、PBトランスポザーゼ、及び操作されたヌクレアーゼによるゲノム編集を含む。関心対象の遺伝子に核酸変化を導入するための剤は、公的に入手可能な供給源によって設計することができるか、又はTransposagen、Addgene及びSangamo Biosciencesから商業的に入手することができる。 Methods of introducing nucleic acid changes into genes of interest are well known in the art [see, eg, Menke D.; Genesis (2013) 51:-618; Capecchi, Science (1989) 244:1288-1292; Santiago et al. Proc Natl Acad Sci USA (2008) 105:5809-5814; International Patent Application Numbers WO2014085593, WO2009071334 and WO2011146121; US Patent No. 8771945, US Patent No. 8586526, US Patent No. 6774279 Specification and U.S. Patent See Published Application No. 20030232410, Published Patent Application No. 20050026157, Published Patent Application No. 20060014264, by targeted homologous recombination, site-specific recombinases, PB transposases, and engineered nucleases. Including genome editing. Agents for introducing nucleic acid changes into genes of interest can be designed by publicly available sources or commercially obtained from Transposagen, Addgene and Sangamo Biosciences.

例えば、ゲノム編集剤、例えば、CRISPR-Cas、メガヌクレアーゼ、ジンクフィンガーヌクレアーゼ(ZFN)、TALEN、トランスポゾンの使用などが挙げられる。 Examples include the use of genome editing agents such as CRISPR-Cas, meganucleases, zinc finger nucleases (ZFNs), TALENs, transposons, and the like.

組換えアデノ随伴ウイルス(rAAV)プラットフォームを使用したゲノム編集-このゲノム編集プラットフォームは、哺乳動物生細胞のゲノム内のDNA配列の挿入、欠失又は置換を可能にするrAAVベクターに基づく。rAAVゲノムは、陽性センス又は陰性センスのいずれかである一本鎖デオキシリボ核酸(ssDNA)分子であり、約4.7kbの長さである。これらの一本鎖DNAウイルスベクターは、高い形質導入率を有し、ゲノム内で二本鎖DNA切断の非存在下で内因性相同組換えを刺激するという固有の特性を有する。当業者であれば、所望のゲノム遺伝子座を標的とし、細胞内で全体の及び/又は微妙な内因性遺伝子変化の両方を行うためのrAAVベクターを設計することができる。rAAVゲノム編集は、単一の対立遺伝子を標的とし、いかなるオフターゲットゲノム変化ももたらさないという利点を有する。rAAVゲノム編集技術は、例えば、Horizon(商標)(Cambridge,UK)からrAAV GENESIS(商標)システムとして市販されている。 Genome Editing Using a Recombinant Adeno-Associated Virus (rAAV) Platform - This genome editing platform is based on rAAV vectors that allow the insertion, deletion, or replacement of DNA sequences within the genome of living mammalian cells. The rAAV genome is a single-stranded deoxyribonucleic acid (ssDNA) molecule that is either positive sense or negative sense and is approximately 4.7 kb long. These single-stranded DNA viral vectors have high transduction rates and have the unique property of stimulating endogenous homologous recombination in the absence of double-stranded DNA breaks within the genome. Those skilled in the art can design rAAV vectors to target desired genomic loci and make both global and/or subtle endogenous genetic changes within cells. rAAV genome editing has the advantage of targeting a single allele and not resulting in any off-target genomic changes. rAAV genome editing technology is commercially available, for example, as the rAAV GENESIS™ system from Horizon™ (Cambridge, UK).

有効性を識別し、配列変化を検出する方法は、当技術分野で周知であり、DNA配列決定、電気泳動、酵素に基づくミスマッチ検出アッセイ、及びハイブリダイゼーションアッセイ、例えば、PCR、RT-PCR、RNase保護、インサイチュハイブリダイゼーション、プライマー伸長、サザンブロット、ノーザンブロット及びドットブロット分析を含むが、これらに限定されない。 Methods for identifying efficacy and detecting sequence variations are well known in the art and include DNA sequencing, electrophoresis, enzyme-based mismatch detection assays, and hybridization assays such as PCR, RT-PCR, RNase Including, but not limited to, protection, in situ hybridization, primer extension, Southern blot, Northern blot and dot blot analysis.

特定の遺伝子内の配列変化はまた、例えば、クロマトグラフィー、電気泳動法、ELISAなどの免疫検出アッセイ、及びウエスタンブロット分析、並びに免疫組織化学的検査を使用して、タンパク質レベルで決定されうる。 Sequence changes within particular genes can also be determined at the protein level using, for example, chromatography, electrophoresis, immunodetection assays such as ELISA, and Western blot analysis, as well as immunohistochemistry.

さらに、当業者であれば、構築物との相同組換え事象を受けた形質転換細胞を効率的に選択するための陽性及び/又は陰性選択マーカーを含むノックイン/ノックアウト構築物を容易に設計することができる。陽性選択は、外来DNAを取り込んだクローン集団を濃縮する手段を提供する。そのような陽性マーカーの非限定的な例には、グルタミンシンテターゼ、ジヒドロ葉酸レダクターゼ(DHFR)、ネオマイシン、ハイグロマイシン、ピューロマイシン及びブラストサイジンS耐性カセットなどの抗生物質耐性を付与するマーカーが挙げられる。陰性選択マーカーは、マーカー配列(例えば、陽性マーカー)のランダムな組込み及び/又は排除に対して選択するために必要である。そのような陰性マーカーの非限定的な例には、ガンシクロビル(GCV)を細胞傷害性ヌクレオシド類似体に変換する単純ヘルペス-チミジンキナーゼ(HSV-TK)、ヒポキサンチンホスホリボシルトランスフェラーゼ(HPRT)、及びアデニンホスホリボシルトランスフェラーゼ(ARPT)が挙げられる。 Additionally, those skilled in the art can readily design knock-in/knock-out constructs containing positive and/or negative selection markers to efficiently select transformed cells that have undergone a homologous recombination event with the construct. . Positive selection provides a means to enrich the clonal population that has incorporated foreign DNA. Non-limiting examples of such positive markers include markers that confer antibiotic resistance such as glutamine synthetase, dihydrofolate reductase (DHFR), neomycin, hygromycin, puromycin and blasticidin S resistance cassettes. . Negative selection markers are required to select against random integration and/or exclusion of marker sequences (eg, positive markers). Non-limiting examples of such negative markers include herpes simplex-thymidine kinase (HSV-TK), which converts ganciclovir (GCV) into cytotoxic nucleoside analogs, hypoxanthine phosphoribosyltransferase (HPRT), and adenine Examples include phosphoribosyltransferase (ARPT).

一実施形態によれば、本技術は、一過性DNA又はDNA不含法(RNAトランスフェクションなど)を使用してRNAサイレンシング分子を導入することに関する。 According to one embodiment, the technology relates to introducing RNA silencing molecules using transient DNA or DNA-free methods (such as RNA transfection).

一実施形態によれば、RNAサイレンシング分子(例えば、アンチセンス分子)は、「裸の」オリゴヌクレオチドとして、すなわち、追加の送達ビヒクルを用いず送達される。一実施形態によれば、「裸の」オリゴヌクレオチドは、その組織送達を促進するための化学修飾を含む(例えば、上記のように、逆位ヌクレオチド、ホスホロチオエート結合、又はロックド核酸の組込みを利用する)。 According to one embodiment, the RNA silencing molecule (eg, antisense molecule) is delivered as a "naked" oligonucleotide, ie, without an additional delivery vehicle. According to one embodiment, a "naked" oligonucleotide includes chemical modifications to facilitate its tissue delivery (e.g., utilizing inverted nucleotides, phosphorothioate linkages, or incorporation of locked nucleic acids, as described above). ).

RNA又はDNAのトランスフェクションのための当技術分野で公知のいずれかの方法、例えば、限定するものではないが、マイクロインジェクション、エレクトロポレーション、例えば、リポソームを使用するか又はカチオン性分子若しくはナノ材料を使用する脂質媒介トランスフェクションを本教示に従って使用することができる(以下に説明され、参照により本明細書に組み込まれるRoberts et al.Nature Reviews Drug Discovery(2020)19:673-694にさらに説明されている)。 Any method known in the art for transfection of RNA or DNA, such as, but not limited to, microinjection, electroporation, using liposomes or cationic molecules or nanomaterials. Lipid-mediated transfection can be used in accordance with the present teachings (described below and further described in Roberts et al. Nature Reviews Drug Discovery (2020) 19:673-694, incorporated herein by reference). ing).

一実施形態によれば、上記で言及されるように、RNAサイレンシング分子(例えば、アンチセンス)が化学修飾を含まない場合、RNAサイレンシング分子は、発現構築物の一部として標的細胞(例えば、老化細胞)に投与されうる。この場合、RNAサイレンシング分子(例えば、アンチセンス分子)は、標的細胞(例えば、神経細胞)内でRNAサイレンシング分子(例えば、アンチセンス)の発現を構成的又は誘導的に導くことができるシス作用性調節エレメント(例えば、プロモーター)の制御下で核酸構築物(本明細書では「発現ベクター」とも呼ばれる)にライゲーションされる。 According to one embodiment, as mentioned above, if the RNA silencing molecule (e.g. antisense) does not contain chemical modifications, the RNA silencing molecule is used as part of the expression construct in the target cell (e.g. senescent cells). In this case, the RNA silencing molecule (e.g. antisense molecule) is a system capable of constitutively or inducibly directing the expression of the RNA silencing molecule (e.g. antisense) in the target cell (e.g. neuron). ligated into a nucleic acid construct (also referred to herein as an "expression vector") under the control of an operative regulatory element (eg, a promoter).

本発明の発現構築物はまた、発現構築物を真核生物における複製及び組込みに適したものにする追加の配列(例えば、シャトルベクター)を含み得る。典型的なクローニングベクターは、転写開始配列及び翻訳開始配列(例えば、プロモーター、エンハンサー)並びに転写ターミネーター及び翻訳ターミネーター(例えば、ポリアデニル化シグナル)を含有する。本発明の発現構築物は、エンハンサーをさらに含むことができ、エンハンサーは、プロモーター配列に隣接していてもよいか、又はプロモーター配列から離れていてもよく、プロモーター配列からの転写のアップレギュレート時に機能することができる。また、ポリアデニル化配列は、発現の効率を増加させるために、本発明の発現構築物に付加されうる。 Expression constructs of the invention may also contain additional sequences (eg, shuttle vectors) that make the expression construct suitable for replication and integration in eukaryotes. A typical cloning vector contains transcription and translation initiation sequences (eg, promoters, enhancers) and transcription and translation terminators (eg, polyadenylation signals). Expression constructs of the invention may further include an enhancer, which may be adjacent to the promoter sequence or remote from the promoter sequence, and which functions upon upregulation of transcription from the promoter sequence. can do. Polyadenylation sequences can also be added to the expression constructs of the invention to increase the efficiency of expression.

既に記載された実施形態に加えて、本発明の発現構築物は、クローニングされた核酸の発現レベルを増加させること、又はRNAサイレンシング分子(例えば、アンチセンス)を有する細胞の同定を容易にすることを意図した他の特殊化されたエレメントを典型的に含有しうる。本発明の発現構築物は、真核生物レプリコンを含んでも含まなくてもよい。 In addition to the embodiments already described, the expression constructs of the invention can increase the expression level of cloned nucleic acids or facilitate the identification of cells with RNA silencing molecules (e.g., antisense). Other specialized elements intended for use may typically be included. Expression constructs of the invention may or may not include eukaryotic replicons.

核酸構築物は、適切な遺伝子送達ビヒクル/方法(トランスフェクション、形質導入など)及び適切な発現系を使用して、本発明の標的細胞(例えば、神経細胞)に導入されうる。そのような方法は、Sambrook et al.,Molecular Cloning:A Laboratory Manual,Cold Springs Harbor Laboratory,New York(1989,1992),Ausubel et al.,Current Protocols in Molecular Biology,John Wiley and Sons,Baltimore,Md.(1989),Chang et al.,Somatic Gene Therapy,CRC Press,Ann Arbor,Mich.(1995),Vega et al.,Gene Targeting,CRC Press,Ann Arbor Mich.(1995),Vectors:A Survey of Molecular Cloning Vectors and Their Uses,Butterworths,Boston Mass.(1988)及びGilboa et at.[Biotechniques 4(6):504-512,1986]に一般に記載されており、例えば、安定な又は一過性のトランスフェクション、リポフェクション、エレクトロポレーション、及び組換えウイルスベクターによる感染を含む。さらに、陽性-陰性選択法に関して、米国特許第5,464,764号明細書及び米国特許第5,487,992号明細書を参照されたい。 Nucleic acid constructs can be introduced into target cells (eg, neural cells) of the invention using appropriate gene delivery vehicles/methods (transfection, transduction, etc.) and appropriate expression systems. Such a method is described by Sambrook et al. , Molecular Cloning: A Laboratory Manual, Cold Springs Harbor Laboratory, New York (1989, 1992), Ausubel et al. , Current Protocols in Molecular Biology, John Wiley and Sons, Baltimore, Md. (1989), Chang et al. , Somatic Gene Therapy, CRC Press, Ann Arbor, Mich. (1995), Vega et al. , Gene Targeting, CRC Press, Ann Arbor Mich. (1995), Vectors: A Survey of Molecular Cloning Vectors and Their Uses, Butterworths, Boston Mass. (1988) and Gilboa et at. [Biotechniques 4(6):504-512, 1986] and include, for example, stable or transient transfection, lipofection, electroporation, and infection with recombinant viral vectors. Additionally, see US Pat. No. 5,464,764 and US Pat. No. 5,487,992 regarding positive-negative selection methods.

追加的又は代替的に、脂質に基づく系が、それによってコードされる構築物又は核酸剤を本発明の標的細胞(例えば、老化細胞又は癌細胞)に送達するために使用されうる。脂質に基づく系には、例えば、リポソーム、リポプレックス及び脂質ナノ粒子(LNP)が含まれる。いくつかの実施形態では、アンチセンスオリゴヌクレオチド又はsiRNAは、コンジュゲートされた脂質又はコレステリル部分を含む、 Additionally or alternatively, lipid-based systems can be used to deliver constructs or nucleic acid agents encoded thereby to target cells of the invention (eg, senescent cells or cancer cells). Lipid-based systems include, for example, liposomes, lipoplexes and lipid nanoparticles (LNPs). In some embodiments, the antisense oligonucleotide or siRNA comprises a conjugated lipid or cholesteryl moiety.

神経細胞特異的プロモーターを使用して、方法の特異性を改善することができる。神経細胞特異的プロモーターの例には、限定するものではないが、シナプシンが挙げられる。シナプシンは、ニューロン特異的タンパク質であると考えられているため(DeGennaro et al.,1983 Cold Spring Harb.Symp.Quant.Biol.1,337-345)、そのニューロン特異的発現パターンを活用して、導入遺伝子をニューロン特異的に発現させることができる。局所注射のためのアデノウイルスベクター及びAAVベクターでは、最小限のヒトシナプシンプロモーターが使用されている(Kugler et al.2003 Human synapsin 1 gene promoter confers highly neuron-specific long-term transgene expression from an adenoviral vector in the adult rat brain depending on the transduced area.Gene Ther.10,337-347)。末梢投与後にCNSに到達することができるAAVキャプシド、例えば、AAV9又は他の天然AAV血清型は、大規模発現をもたらす比較的非侵襲的な投与に有利である。現時点で、神経細胞形質導入効率が増加したいくつかの操作されたキャプシドが存在する。E/SYNプロモーターを有するレンチウイルスは、ニューロン内で強力な持続的発現を示すことが報告されている(Hioki et al.Gene Therapy volume 14,pages872-882(2007))。 Neuronal cell-specific promoters can be used to improve the specificity of the method. Examples of neuron-specific promoters include, but are not limited to, synapsin. Since synapsin is considered to be a neuron-specific protein (DeGennaro et al., 1983 Cold Spring Harb. Symp. Quant. Biol. 1, 337-345), we utilized its neuron-specific expression pattern to Transgenes can be expressed specifically in neurons. Adenovirus and AAV vectors for local injection use the minimal human synapsin promoter (Kugler et al. 2003 Human synapsin 1 gene promoter confers highly neuron-specific long-term transg ene expression from an adenoviral vector in the adult rat brain dependent on the transduced area. Gene Ther. 10, 337-347). AAV capsids that can reach the CNS after peripheral administration, such as AAV9 or other native AAV serotypes, are advantageous for relatively non-invasive administration resulting in large scale expression. At present, several engineered capsids exist with increased neuronal transduction efficiency. It has been reported that a lentivirus having an E/SYN promoter shows strong and sustained expression in neurons (Hioki et al. Gene Therapy volume 14, pages 872-882 (2007)).

本教示は、CHD2ハプロ不全に関連する関連疾患、症候群、障害及び病状を処置する点で、診療所向けに活用されうる。 The present teachings can be utilized in the clinic in treating related diseases, syndromes, disorders and conditions associated with CHD2 haploinsufficiency.

したがって、本発明の一態様によれば、処置が必要な対象のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状を処置する方法であって、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤の治療有効量を対象に投与することを含み、核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、CHD2ハプロ不全に関連する疾患又は病状を処置する方法が提供される。 Accordingly, one aspect of the invention provides a method of treating a disease or condition associated with chromodomain helicase DNA binding protein 2 (CHD2) haploinsufficiency in a subject in need thereof, the method comprising: administering to the subject a therapeutically effective amount of a nucleic acid agent that down-regulates the final exon of human Chaser, thereby treating a disease or condition associated with CHD2 haploinsufficiency. A method is provided.

代替的又は追加的な態様によれば、処置が必要な対象のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状を処置するのに使用するための、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤であって、ヒトChaserrの最終エクソンへと指向した核酸剤が提供される。 According to alternative or additional aspects, the activity of human Chaser or Nucleic acid agents that downregulate expression are provided that are directed to the final exon of human Chaserr.

本明細書で使用される場合、「クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状」は、CHD2の発現(タンパク質及び任意にmRNA)の減少を特徴とする、又は発症若しくは進行がCHD2の発現(タンパク質及び任意にmRNA)の減少に関連する病原性状態を指す。 As used herein, "a disease or condition associated with chromodomain helicase DNA-binding protein 2 (CHD2) haploinsufficiency" is characterized by a decrease in the expression (protein and optionally mRNA) of CHD2, or the onset of or refers to a pathogenic condition whose progression is associated with a decrease in the expression (protein and optionally mRNA) of CHD2.

特定の実施形態によれば、CHD2ハプロ不全に関連する疾患又は病状とは、早期発症てんかん性脳症(すなわち、頻繁な進行中のてんかん様の活動に関連する難治性発作及び認知の緩慢化又は後退)を典型的に特徴とするCHD2関連神経発達障害を指す。発作の発症は、典型的には6ヶ月齢~4歳である。発作型には、転倒発作、ミオクローヌス、及びEEG上の全般性スパイク波に関連する複数の発作型の急速な発症、アトニー性ミオクローヌス欠神発作(atonic-myoclonic-absence seizure)、並びに臨床的光線過敏が典型的に含まれる。知的障害及び/又は自閉症スペクトラム障害が一般的である。 According to certain embodiments, a disease or condition associated with CHD2 haploinsufficiency is early-onset epileptic encephalopathy (i.e., intractable seizures associated with frequent ongoing epileptiform activity and cognitive slowing or regression). ) refers to a CHD2-related neurodevelopmental disorder typically characterized by Onset of seizures is typically between 6 months and 4 years of age. Seizure types include fall seizures, myoclonus, and rapid onset of multiple seizure types associated with generalized spike waves on the EEG, atonic-myoclonic-absence seizures, and clinical photosensitivity. are typically included. Intellectual disability and/or autism spectrum disorder are common.

特定の実施形態によれば、病状は、レノックス・ガストー症候群(LGS)、ミオクローヌス欠神てんかん(MAE)、ドラベ症候群、てんかんを伴う知的障害、自閉症スペクトラム障害(ASD)からなる群より選択される。 According to certain embodiments, the medical condition is selected from the group consisting of Lennox-Gastaut syndrome (LGS), myoclonic absence epilepsy (MAE), Dravet syndrome, intellectual disability with epilepsy, and autism spectrum disorder (ASD). be done.

CHD2関連神経発達障害の診断は、分子遺伝子検査で検出されたヘテロ接合CHD2単一ヌクレオチド病原性変異体、小型インデル(挿入/欠失)病原性変異体、又は部分的若しくは全体的な遺伝子欠失を有する被験者を対象に確立される。 Diagnosis of CHD2-associated neurodevelopmental disorders is based on heterozygous CHD2 single nucleotide pathogenic variants, small indel (insertion/deletion) pathogenic variants, or partial or total gene deletions detected by molecular genetic testing. Established for subjects with

CHD2遺伝子の変異は、生殖系列変異又はデノボ体細胞変異の結果でありうる。 Mutations in the CHD2 gene can be the result of germline mutations or de novo somatic mutations.

用語「処置する」は、病態(疾患、障害又は状態)の発生を阻害、予防若しくは阻止すること、及び/又は病態の低減、寛解若しくは退行を引き起こすことを指す。当業者であれば、様々な方法及びアッセイを使用して病態の発生を評価することができ、同様に、様々な方法及びアッセイを使用して病態の低減、寛解又は退行を評価してもよいことを理解するであろう。 The term "treating" refers to inhibiting, preventing or preventing the occurrence of a pathology (disease, disorder or condition) and/or causing reduction, amelioration or regression of the pathology. Those skilled in the art can use a variety of methods and assays to assess the occurrence of a disease state, and may similarly use a variety of methods and assays to assess reduction, remission, or regression of a disease state. You will understand that.

本明細書で使用される場合、用語「予防する」は、疾患、障害又は状態が、疾患のリスクがある可能性があるが、疾患を有すると未だ診断されていない対象に発生するのを防ぐことを指す。 As used herein, the term "prevent" means to prevent a disease, disorder or condition from occurring in a subject who may be at risk for the disease but has not yet been diagnosed as having the disease. refers to something.

本明細書で使用される場合、用語「対象」は、哺乳動物、好ましくは病態に罹患しているいずれかの年齢のヒトを含む。好ましくは、この用語は、病態を発生するリスクがある個体を包含する。哺乳動物は胚又は胎児であってもよいことが理解されるであろう。あるいは、対象は、15歳又は18歳までの小児又は青少年でありうる。 As used herein, the term "subject" includes mammals, preferably humans of any age suffering from a disease condition. Preferably, the term encompasses individuals at risk of developing the condition. It will be appreciated that the mammal may be an embryo or a fetus. Alternatively, the subject may be a child or adolescent up to 15 or 18 years of age.

インビボ治療のために、核酸剤は、それ自体で、又は医薬組成物の一部として対象に投与される。 For in vivo therapy, the nucleic acid agent is administered to a subject by itself or as part of a pharmaceutical composition.

本明細書で使用される場合、「医薬組成物」は、生理学的に好適な担体及び賦形剤などの他の化学成分を含む、本明細書に記載の活性成分のうちの1又は複数の調製物を指す。医薬組成物の目的は、生物への化合物の投与を容易にすることである。 As used herein, "pharmaceutical composition" means a composition containing one or more of the active ingredients described herein, including other chemical ingredients such as physiologically suitable carriers and excipients. Refers to a preparation. The purpose of pharmaceutical compositions is to facilitate the administration of compounds to living organisms.

本明細書では、用語「活性成分」は、生物学的効果の主な原因となることができる核酸剤を指す。 As used herein, the term "active ingredient" refers to a nucleic acid agent that is capable of being primarily responsible for a biological effect.

以下、区別なく使用されうる「生理学的に許容される担体」及び「薬学的に許容される担体」という語句は、生物に対して顕著な刺激を引き起こさず、投与された化合物の生物学的活性及び特性を無効にしない担体又は希釈剤を指す。アジュバントは、これらの語句の下に含まれる。 Hereinafter, the phrases "physiologically acceptable carrier" and "pharmaceutically acceptable carrier", which may be used interchangeably, mean a carrier that does not cause significant irritation to living organisms and that does not cause biological activity of the administered compound. and carriers or diluents that do not negate the properties. Adjuvants are included under these terms.

本明細書では、用語「賦形剤」は、活性成分の投与をさらに容易にするために医薬組成物に加えられる不活性物質を指す。賦形剤の例には、限定するものではないが、炭酸カルシウム、リン酸カルシウム、様々な糖、及びデンプンの種類、セルロース誘導体、ゼラチン、植物油、並びにポリエチレングリコールが挙げられる。 As used herein, the term "excipient" refers to an inert substance added to a pharmaceutical composition to further facilitate administration of the active ingredient. Examples of excipients include, but are not limited to, calcium carbonate, calcium phosphate, various sugars and types of starch, cellulose derivatives, gelatin, vegetable oils, and polyethylene glycols.

薬物の製剤化及び投与のための技術は、参照により本明細書に組み込まれる“Remington’s Pharmaceutical Sciences,” Mack Publishing Co.,Easton,PA,latest editionに見出されうる。 Techniques for the formulation and administration of drugs are described in "Remington's Pharmaceutical Sciences," Mack Publishing Co., which is incorporated herein by reference. , Easton, PA, latest edition.

好適な投与経路には、例えば、全身、経口、直腸、経粘膜、特に経鼻、腸又は非経口送達、例えば、筋肉内、皮下及び髄内注射、並びに髄腔内、直接脳室内、心臓内、例えば、右又は左心室内腔内、総冠動脈(common coronary artery)内、静脈内、腹腔内、鼻腔内、腫瘍内又は眼内注射が含まれ得る。 Suitable routes of administration include, for example, systemic, oral, rectal, transmucosal, especially nasal, intestinal or parenteral delivery, such as intramuscular, subcutaneous and intramedullary injection, as well as intrathecal, directly intraventricular, intracardiac. may include, for example, intraluminal injection into the right or left ventricle, into the common coronary artery, intravenous, intraperitoneal, intranasal, intratumoral or intraocular injection.

特定の実施形態によれば、前記組成物は吸入投与様式用である。 According to certain embodiments, the composition is for an inhalation mode of administration.

特定の実施形態によれば、前記組成物は鼻腔内投与用である。 According to certain embodiments, the composition is for intranasal administration.

特定の実施形態によれば、前記組成物は脳室内投与用である。 According to certain embodiments, the composition is for intraventricular administration.

特定の実施形態によれば、前記組成物は髄腔内投与用である。 According to certain embodiments, the composition is for intrathecal administration.

特定の実施形態によれば、前記組成物は腫瘍内投与用である。 According to certain embodiments, the composition is for intratumoral administration.

特定の実施形態によれば、前記組成物は経口投与用である。 According to certain embodiments, the composition is for oral administration.

特定の実施形態によれば、前記組成物は局所注射用である。 According to certain embodiments, the composition is for local injection.

特定の実施形態によれば、前記組成物は全身投与用である。 According to certain embodiments, the composition is for systemic administration.

特定の実施形態によれば、前記組成物は静脈内投与用である。 According to certain embodiments, the composition is for intravenous administration.

中枢神経系(CNS)への薬物送達のための従来の手法には、神経外科的戦略(例えば、脳内注射又は脳室内注入);BBBの内因性輸送経路の1つを利用するための前記剤の分子操作(例えば、それ自体がBBBを通過することができない剤と組み合わせて、内皮細胞表面分子に対して親和性を有する輸送ペプチドを含むキメラ融合タンパク質の産生);剤の脂質溶解度を増加させるように設計された薬理学的戦略(例えば、水溶性剤と脂質担体又はコレステロール担体とのコンジュゲーション);及び(頸動脈へのマンニトール溶液の注入、又はアンジオテンシンペプチドなどの生物学的に活性な剤の使用に起因する)高浸透圧破壊によるBBBの完全性の一時的な破壊が含まれる。しかし、これらの戦略の各々は、侵襲的外科処置に関連する固有のリスク、内因性輸送系に固有の制限によって課されるサイズ制限、CNSの外側で活性でありうる担体モチーフから構成されるキメラ分子の全身投与に関連する潜在的に望ましくない生物学的副作用、及びBBBが破壊される脳の領域内の脳損傷のリスクの可能性などの制限を有し、これにより、これらの戦略の各々は準最適な送達方法になる。 Conventional approaches for drug delivery to the central nervous system (CNS) include neurosurgical strategies (e.g., intracerebral injection or intraventricular injection); Molecular engineering of agents (e.g., production of chimeric fusion proteins containing transit peptides with affinity for endothelial cell surface molecules in combination with agents that cannot cross the BBB by themselves); increasing the lipid solubility of agents; (e.g., conjugation of water-soluble agents with lipid or cholesterol carriers); temporary disruption of BBB integrity due to hyperosmolar disruption (resulting from the use of agents). However, each of these strategies suffers from the inherent risks associated with invasive surgical procedures, size limitations imposed by limitations inherent in endogenous transport systems, and the potential for chimeras composed of carrier motifs that can be active outside the CNS. Each of these strategies has limitations, such as potentially undesirable biological side effects associated with systemic administration of the molecule, and the possible risk of brain damage in areas of the brain where the BBB is disrupted. would be a suboptimal delivery method.

あるいは、例えば、医薬組成物を患者の組織領域に直接注射することによって、全身的ではなく局所的に医薬組成物を投与してもよい。 Alternatively, the pharmaceutical composition may be administered locally rather than systemically, for example, by injecting the pharmaceutical composition directly into a tissue area of the patient.

本発明のいくつかの実施形態の医薬組成物は、当技術分野で周知のプロセスによって、例えば、従来の混合、溶解、造粒、糖衣錠作製、湿式粉砕、乳化、カプセル化、捕捉又は凍結乾燥プロセスによって製造されうる。 The pharmaceutical compositions of some embodiments of the invention are prepared by processes well known in the art, such as conventional mixing, dissolving, granulating, dragee-making, wet milling, emulsifying, encapsulating, entrapping or lyophilizing processes. can be manufactured by.

したがって、本発明のいくつかの実施形態に従って使用するための医薬組成物は、賦形剤及び助剤を含む1又は複数の生理学的に許容される担体を使用して従来のように製剤化され得、これにより、活性成分を薬学的に使用されうる調製物に加工するのが容易になる。適切な製剤は、選択される投与経路に依存する。 Accordingly, pharmaceutical compositions for use in accordance with some embodiments of the invention may be conventionally formulated using one or more physiologically acceptable carriers including excipients and auxiliaries. This facilitates the processing of the active ingredient into preparations that can be used pharmaceutically. Proper formulation is dependent upon the route of administration chosen.

注射の場合、医薬組成物の活性成分は、水溶液、好ましくは生理学的に適合性の緩衝液、例えば、ハンクス液、リンガー液又は生理食塩緩衝液中で製剤化されうる。経粘膜投与の場合、浸透されるバリアにとって適切な浸透剤が製剤に使用される。そのような浸透剤は、当技術分野で一般に公知である。 For injection, the active ingredient of the pharmaceutical composition may be formulated in an aqueous solution, preferably in a physiologically compatible buffer, such as Hank's solution, Ringer's solution or saline buffer. For transmucosal administration, penetrants appropriate to the barrier to be penetrated are used in the formulation. Such penetrants are generally known in the art.

経口投与の場合、医薬組成物は、活性化合物を当技術分野で周知の薬学的に許容される担体と組み合わせることによって容易に製剤化されうる。そのような担体は、患者による経口摂取のために、医薬組成物を錠剤、丸剤、糖衣錠、カプセル、液体、ゲル、シロップ、スラリー、懸濁液などとして製剤化することを可能にする。経口使用のための薬理学的調製物は、錠剤又は糖衣錠コアを得るために、所望であれば好適な助剤を加えた後に、固体賦形剤を使用し、得られた混合物を任意に粉砕し、顆粒の混合物を加工して作製されうる。好適な賦形剤には、特に、ラクトース、スクロース、マンニトール若しくはソルビトールを含む糖などの充填剤;例えば、トウモロコシデンプン、コムギデンプン、コメデンプン、バレイショデンプン、ゼラチン、トラガカントゴム、メチルセルロース、ヒドロキシプロピルメチルセルロース、カルボメチルセルロースナトリウムなどのセルロース調製物;及び/又はポリビニルピロリドン(PVP)などの生理学的に許容されるポリマーがある。所望であれば、架橋ポリビニルピロリドン、寒天、又はアルギン酸若しくはその塩、例えば、アルギン酸ナトリウムなどの崩壊剤を加えてもよい。 For oral administration, pharmaceutical compositions can be readily formulated by combining the active compound with pharmaceutically acceptable carriers well known in the art. Such carriers enable the pharmaceutical composition to be formulated as tablets, pills, dragees, capsules, liquids, gels, syrups, slurries, suspensions, etc. for oral ingestion by a patient. Pharmacological preparations for oral use can be prepared by using solid excipients and optionally grinding the resulting mixture, if desired after adding suitable auxiliaries, in order to obtain tablets or dragee cores. and can be made by processing a mixture of granules. Suitable excipients include fillers such as sugars, including lactose, sucrose, mannitol or sorbitol; for example, corn starch, wheat starch, rice starch, potato starch, gelatin, gum tragacanth, methylcellulose, hydroxypropylmethylcellulose, carboxylic acid. Cellulose preparations such as sodium methylcellulose; and/or physiologically acceptable polymers such as polyvinylpyrrolidone (PVP). If desired, a disintegrant such as cross-linked polyvinylpyrrolidone, agar, or alginic acid or a salt thereof, eg, sodium alginate, may be added.

糖衣錠コアには、好適なコーティングが施される。この目的のために、アラビアゴム、タルク、ポリビニルピロリドン、カルボポールゲル、ポリエチレングリコール、二酸化チタン、ラッカー溶液及び好適な有機溶媒又は溶媒混合物を任意に含有しうる濃縮糖溶液を使用してもよい。識別のために、又は活性化合物用量の様々な組合せを特徴付けるために、染料又は顔料を錠剤又は糖衣錠コーティングに加えてもよい。 Dragee cores are provided with suitable coatings. For this purpose, concentrated sugar solutions may be used which may optionally contain gum arabic, talc, polyvinylpyrrolidone, carbopol gel, polyethylene glycol, titanium dioxide, lacquer solution and suitable organic solvents or solvent mixtures. Dyestuffs or pigments may be added to the tablets or dragee coatings for identification or to characterize different combinations of active compound doses.

経口的に使用されうる医薬組成物には、ゼラチン製の押込み式カプセル、並びにゼラチン及び可塑剤、例えば、グリセロール又はソルビトール製の軟密封カプセルが含まれる。押込み式カプセルは、ラクトースなどの充填剤、デンプンなどの結合剤、タルク又はステアリン酸マグネシウムなどの潤滑剤、及び任意に安定剤と混合して活性成分を含有しうる。軟カプセルでは、活性成分は、脂肪油、流動パラフィン又は液体ポリエチレングリコールなどの好適な液体に溶解又は懸濁されてもよい。さらに、安定剤を加えてもよい。経口投与のための製剤はいずれも、選択された投与経路に適した投与量であるべきである。 Pharmaceutical compositions that can be used orally include push-fit capsules made of gelatin, as well as soft, sealed capsules made of gelatin and a plasticizer, such as glycerol or sorbitol. The push-fit capsules can contain active ingredients in admixture with filler such as lactose, binders such as starches, lubricants such as talc or magnesium stearate, and, optionally, stabilizers. In soft capsules, the active ingredients may be dissolved or suspended in suitable liquids, such as fatty oils, liquid paraffin, or liquid polyethylene glycols. Additionally, stabilizers may be added. All formulations for oral administration should be in dosages appropriate for the chosen route of administration.

頬側投与の場合、組成物は、従来のように製剤化された錠剤又はトローチ剤の形態をとってもよい。 For buccal administration, the compositions may take the form of conventionally formulated tablets or lozenges.

経鼻吸入による投与の場合、本発明のいくつかの実施形態による使用のための活性成分は、好適な噴射剤、例えば、ジクロロジフルオロメタン、トリクロロフルオロメタン、ジクロロ-テトラフルオロエタン又は二酸化炭素を使用して、加圧パック又はネブライザーからエアロゾルスプレー体裁の形態で都合よく送達される。加圧エアロゾルの場合、投与量単位は、計量された量を送達するための弁を設けることによって決定されうる。ディスペンサーで使用するための、例えば、ゼラチンのカプセル及びカートリッジは、化合物とラクトース又はデンプンなどの好適な粉末基剤との粉末混合物を含有して製剤化されうる。 For administration by nasal inhalation, the active ingredient for use according to some embodiments of the invention may be administered using a suitable propellant, such as dichlorodifluoromethane, trichlorofluoromethane, dichloro-tetrafluoroethane or carbon dioxide. It is conveniently delivered in the form of an aerosol spray from a pressurized pack or nebulizer. In the case of pressurized aerosols, the dosage unit can be determined by providing a valve to deliver a metered amount. Capsules and cartridges of, for example, gelatin for use in a dispenser may be formulated containing a powder mix of the compound and a suitable powder base such as lactose or starch.

本明細書に記載の医薬組成物は、例えば、ボーラス注射又は連続注入による非経口投与のために製剤化されうる。注射用製剤は、単位剤形で、例えば、アンプルで、又は任意に保存剤を加えた複数回投与容器で提供されうる。組成物は、油性又は水性ビヒクル中の懸濁液、溶液又はエマルジョンであってよく、懸濁化剤、安定化剤及び/又は分散剤などの配合剤を含有してもよい。 The pharmaceutical compositions described herein can be formulated for parenteral administration, eg, by bolus injection or continuous infusion. Formulations for injection may be presented in unit dosage form, eg, in ampoules or in multi-dose containers, optionally with an added preservative. The compositions may be suspensions, solutions, or emulsions in oily or aqueous vehicles and may contain formulating agents such as suspending, stabilizing, and/or dispersing agents.

非経口投与のための医薬組成物は、水溶性形態の活性調製物の水溶液を含む。さらに、活性成分の懸濁液は、適切な油性又は水性注射懸濁液として調製されうる。好適な親油性の溶媒又はビヒクルには、ゴマ油などの脂肪油、又はオレイン酸エチル、トリグリセリド若しくはリポソームなどの合成脂肪酸エステルが含まれる。水性注射懸濁液は、懸濁液の粘度を増加させる物質、例えば、カルボキシメチルセルロースナトリウム、ソルビトール又はデキストランを含有しうる。任意に、懸濁液はまた、高濃度溶液の調製を可能にするために、活性成分の溶解度を増加させる好適な安定剤又は剤を含有しうる。 Pharmaceutical compositions for parenteral administration include aqueous solutions of the active preparations in water-soluble form. Additionally, suspensions of the active ingredients may be prepared as appropriate oily or aqueous injection suspensions. Suitable lipophilic solvents or vehicles include fatty oils such as sesame oil, or synthetic fatty acid esters such as ethyl oleate, triglycerides or liposomes. Aqueous injection suspensions may contain substances that increase the viscosity of the suspension, such as sodium carboxymethyl cellulose, sorbitol, or dextran. Optionally, the suspension may also contain suitable stabilizers or agents that increase the solubility of the active ingredients to allow for the preparation of highly concentrated solutions.

あるいは、活性成分は、使用前に好適なビヒクル、例えば、滅菌パイロジェンフリー水性溶液を用いて構成するための粉末形態であってよい。 Alternatively, the active ingredient may be in powder form for constitution with a suitable vehicle, eg, a sterile pyrogen-free aqueous solution, before use.

本発明のいくつかの実施形態の医薬組成物はまた、例えば、カカオバター又は他のグリセリドなどの従来の坐剤基剤を使用して、坐剤又は停留浣腸などの直腸組成物に製剤化されうる。 The pharmaceutical compositions of some embodiments of the invention can also be formulated into rectal compositions, such as suppositories or retention enemas, using, for example, conventional suppository bases such as cocoa butter or other glycerides. sell.

本発明のいくつかの実施形態に関連して使用するのに適した医薬組成物には、活性成分が意図された目的を達成するのに有効な量で含有される組成物が含まれる。さらに具体的には、治療有効量とは、障害(例えば、CHD2ハプロ不全に関連する)の症状を予防、緩和若しくは改善するため、又は処置されている対象の生存期間を延長するために有効な、活性成分(例えば、核酸剤)の量を意味する。 Pharmaceutical compositions suitable for use in connection with some embodiments of the present invention include compositions in which the active ingredients are contained in an amount effective to achieve the intended purpose. More specifically, a therapeutically effective amount is an amount effective to prevent, alleviate, or ameliorate the symptoms of a disorder (e.g., associated with CHD2 haploinsufficiency) or to prolong the survival of the subject being treated. , refers to the amount of active ingredient (eg, nucleic acid agent).

処置有効量の決定は、特に本明細書で提供される詳細な開示に照らして、十分に当業者の能力の範囲内である。 Determination of a therapeutically effective amount is well within the ability of one of ordinary skill in the art, especially in light of the detailed disclosure provided herein.

本発明の方法で使用されるいずれかの調製物では、治療有効量又は治療有効用量は、インビトロアッセイ及び細胞培養アッセイから最初に推定されうる。例えば、何らかの用量が、所望の濃度又は力価を達成するために動物モデルを対象に製剤化されうる。そのような情報は、ヒトに対する有用な用量をさらに正確に決定するために使用することができる。 For any preparation used in the methods of the invention, the therapeutically effective amount or dose can be estimated initially from in vitro and cell culture assays. For example, any dose can be formulated for animal models to achieve a desired concentration or potency. Such information can be used to more accurately determine useful doses for humans.

本明細書に記載の活性成分の毒性及び治療有効性は、インビトロで標準的な薬学的手順によって、細胞培養又は実験動物を対象とした標準的な薬学的手順によって決定されうる。これらのインビトロアッセイ及び細胞培養アッセイ並びに動物試験から得られたデータは、ヒトに使用するための様々な投与量を製剤化するのに使用されうる。投与量は、使用される剤形及び利用される投与経路に応じて変化し得る。正確な製剤、投与経路及び投与量は、患者の状態を考慮して個々の医師によって選択されうる。(例えば、Fingl,et al.,1975,in “The Pharmacological Basis of Therapeutics”,Ch.1 p.1を参照)。 Toxicity and therapeutic efficacy of the active ingredients described herein can be determined by standard pharmaceutical procedures in vitro, in cell cultures, or in experimental animals. The data obtained from these in vitro and cell culture assays and animal studies can be used in formulating various dosages for use in humans. The dosage may vary depending on the dosage form used and the route of administration utilized. The precise formulation, route of administration and dosage may be selected by the individual physician taking into account the patient's condition. (See, eg, Fingl, et al., 1975, in "The Pharmacological Basis of Therapeutics", Ch. 1 p. 1).

投与量及び間隔は、生物学的効果を誘導又は抑制するのに十分なレベル(最小有効濃度、MEC)の活性成分を提供するように個別に調整されうる。MECは、調製物ごとに変化するが、インビトロデータから推定することができる。MECを達成するために必要な投与量は、個々の特徴及び投与経路に依存する。検出アッセイを使用して血漿濃度を決定することができる。 Dosage amount and interval can be individually adjusted to provide a sufficient level (minimum effective concentration, MEC) of the active ingredient to induce or suppress a biological effect. The MEC varies from preparation to preparation, but can be estimated from in vitro data. The dosage required to achieve the MEC depends on individual characteristics and the route of administration. Detection assays can be used to determine plasma concentrations.

処置される状態の重症度及び応答性に応じて、投薬は、単回又は複数回の投与であってよく、一連の処置は、数日から数週間、又は治癒がもたらされるまで、若しくは疾患状態の縮小が達成されるまで続く。 Depending on the severity and responsiveness of the condition being treated, dosing may be in single or multiple administrations, with a series of treatments lasting from days to weeks, or until cure or disease state is achieved. continues until a reduction in is achieved.

投与される組成物の量は、当然のことながら、処置される対象、苦痛の重症度、投与様式、処方医師の判断などに依存する。 The amount of composition administered will, of course, be dependent on the subject being treated, the severity of the affliction, the manner of administration, the judgment of the prescribing physician, and the like.

本発明のいくつかの実施形態の組成物は、所望であれば、活性成分を含有する1又は複数の単位剤形を含有しうるパック又はディスペンサー装置、例えば、FDAによって承認されたキットで提供されうる。パックは、例えば、ブリスターパックなどの金属又はプラスチック箔を含み得る。パック又はディスペンサー装置は、投与のための説明書を伴ってもよい。パック又はディスペンサーはまた、医薬品の製造、使用又は販売を規制する政府機関によって規定された形態の容器に関連する通知によって対応されてもよく、この通知は、組成物の形態、又はヒト投与若しくは獣医学的投与に関する機関による承認を反映している。そのような通知は、例えば、処方薬について米国食品医薬品局によって承認されたラベル、又は承認された製品インサートであってよい。適合性医薬担体中に製剤化された本発明の調製物を含む組成物もまた、上記でさらに詳述されるように、調製され得、適切な容器に入れられ得、示された状態の処置のためにラベル付けされうる。 The compositions of some embodiments of the invention are provided, if desired, in a pack or dispenser device, e.g., an FDA-approved kit, which may contain one or more unit dosage forms containing the active ingredient. sell. The pack may, for example, include metal or plastic foil, such as a blister pack. The pack or dispenser device may be accompanied by instructions for administration. The pack or dispenser may also be supported by a notice relating to the container in the form prescribed by the government agency regulating the manufacture, use or sale of pharmaceutical products, which notice may be in the form of the composition or for human or veterinary administration. reflects institutional approval for clinical administration. Such notice may be, for example, a label approved by the US Food and Drug Administration for prescription drugs, or an approved product insert. Compositions comprising a preparation of the invention formulated in a compatible pharmaceutical carrier may also be prepared and placed in a suitable container, as detailed further above, for the treatment of the indicated condition. can be labeled for.

本発明の核酸剤による処置は、当技術分野で公知の他の管理プロトコルを用いて増強されうる。例えば、抗てんかん薬(AED)。 Treatment with the nucleic acid agents of the invention can be enhanced using other management protocols known in the art. For example, antiepileptic drugs (AEDs).

図14は、本発明の様々な例示的な実施形態による、配列のセットを分析するのに適した方法のフローチャート図である。別段の定義がない限り、本明細書中下記に記載される動作は、多くの組合せ又は実行順序で同時に又は順次に実行することができることを理解されたい。具体的には、フローチャート図の順序は、限定と考えられるべきではない。例えば、以下の説明又はフローチャート図に特定の順序で出現する2つ以上の動作は、異なる順序(例えば、逆順)で、又は実質的に同時に実行することができる。さらに、以下に記載するいくつかの動作は、任意選択であり、実行されなくてもよい。 FIG. 14 is a flowchart illustration of a method suitable for analyzing a set of sequences, according to various exemplary embodiments of the invention. It is to be understood that, unless otherwise defined, the operations described herein below can be performed simultaneously or sequentially in many combinations or orders of performance. In particular, the order of flowchart illustrations should not be considered limiting. For example, two or more acts that appear in a particular order in the following description or flowchart illustrations may be performed in a different order (eg, in reverse order) or substantially simultaneously. Additionally, some operations described below are optional and may not be performed.

本明細書に記載の動作の少なくとも一部は、データを受信し、以下に記載される動作を実行するように構成されたデータ処理システム、例えば、専用回路又は汎用コンピュータによって実施することができる。動作の少なくとも一部は、遠隔地のクラウドコンピューティング施設によって実施することができる。 At least some of the operations described herein may be performed by a data processing system, e.g., special purpose circuitry or a general purpose computer, configured to receive data and perform the operations described below. At least some of the operations may be performed by a remote cloud computing facility.

本実施形態の方法を実施するコンピュータプログラムは、通信ネットワークによって、又は限定するものではないが、フロッピーディスク、CD-ROM、フラッシュメモリ装置及びポータブルハードドライブなどの提供媒体上で、ユーザに一般に提供されうる。通信ネットワーク又は提供媒体から、コンピュータプログラムをハードディスク又は同様の中間記憶媒体にコピーすることができる。コンピュータプログラムは、それらの提供媒体又はそれらの中間記憶媒体のいずれかからコンピュータの実行メモリにコード命令をロードし、本発明の方法に従って動作するようにコンピュータを構成することによって実行されうる。動作中、コンピュータは、中間計算によって得られたデータ構造又は値をメモリに記憶することができ、後続の動作で使用するためにこれらのデータ構造又は値を引き出す。これらの動作はいずれも、コンピュータシステムの当業者に周知である。 A computer program implementing the methods of the present embodiments is typically provided to a user over a communications network or on a presentation medium such as, but not limited to, a floppy disk, a CD-ROM, a flash memory device, and a portable hard drive. sell. A computer program can be copied from a communication network or provisioning medium to a hard disk or similar intermediate storage medium. Computer programs may be executed by loading code instructions into an executable memory of a computer from either their provisioning medium or their intermediate storage medium and configuring the computer to operate according to the methods of the invention. During operation, the computer may store data structures or values obtained by intermediate calculations in memory and retrieve these data structures or values for use in subsequent operations. All of these operations are well known to those skilled in the art of computer systems.

本明細書に記載の処理動作は、DSP、マイクロコントローラ、FPGA、ASICなどのプロセッサ回路、又はいずれかの他の従来の及び/若しくは専用のコンピューティングシステムによって行われ得る。 The processing operations described herein may be performed by a processor circuit such as a DSP, microcontroller, FPGA, ASIC, or any other conventional and/or special purpose computing system.

本実施形態の方法は、多くの形態で具現化されうる。例えば、本実施形態の方法は、方法動作を行うためのコンピュータなどの有形媒体上で具現化されうる。本実施形態の方法は、方法動作を行うためのコンピュータ可読命令を備えるコンピュータ可読媒体上で具現化されうる。また、本実施形態の方法は、有形媒体上でコンピュータプログラムを実行するか、又はコンピュータ可読媒体上で命令を実行するように構成されたデジタルコンピュータ機能を有する電子装置で具現化されうる。 The method of this embodiment can be implemented in many forms. For example, the methods of the present embodiments may be embodied on a tangible medium such as a computer for performing method operations. The methods of the present embodiments may be embodied on a computer-readable medium comprising computer-readable instructions for performing method operations. Additionally, the methods of the present embodiments may be implemented in an electronic device having digital computer functionality configured to execute a computer program on a tangible medium or to execute instructions on a computer-readable medium.

ここで図14を参照すると、前記方法は、10で開始し、任意に、かつ好ましくは、配列のセットが受信される11に続く。典型的には、セット内の各配列は、限定するものではないが、DNA又はRNAなどのポリヌクレオチドを記述し、ここでセット内の様々な配列によって記述されるポリヌクレオチドは互いに相同であることが、本明細書中下記に、及び下記の実施例の項にさらに記載されるように、手作業で、又は当業者に公知のBlastn、FASTAなどの生物情報学ツールを使用して決定される。特定の実施形態によれば、DNAはゲノムDNAである。別の実施形態によれば、DNAは、cDNA又はライブラリーDNAである。特定の実施形態によれば、DNAは、遺伝子座を表す。別の実施形態によれば、DNAは、コードDNA又は非コードDNAである。特定の実施形態によれば、DNAは、エクソン、イントロン又はそれらの組合せを含む。特定の実施形態によれば、配列はRNA配列である。特定の実施形態によれば、RNAはコードRNAである。別の実施形態によれば、RNAは非コードRNAである。 Referring now to FIG. 14, the method begins at 10 and optionally and preferably continues at 11 where a set of sequences is received. Typically, each sequence within the set describes a polynucleotide, such as, but not limited to, DNA or RNA, wherein the polynucleotides described by the various sequences within the set are homologous to each other. is determined manually or using bioinformatics tools such as Blastn, FASTA, etc. known to those skilled in the art, as further described herein below and in the Examples section below. . According to certain embodiments, the DNA is genomic DNA. According to another embodiment, the DNA is cDNA or library DNA. According to certain embodiments, the DNA represents a genetic locus. According to another embodiment, the DNA is coding DNA or non-coding DNA. According to certain embodiments, the DNA includes exons, introns, or a combination thereof. According to certain embodiments, the sequence is an RNA sequence. According to certain embodiments, the RNA is code RNA. According to another embodiment, the RNA is non-coding RNA.

本発明のいくつかの実施形態では、相同なポリヌクレオチドは、3’UTR、lncRNA及びエンハンサーからなる群より選択される。 In some embodiments of the invention, homologous polynucleotides are selected from the group consisting of 3'UTRs, lncRNAs, and enhancers.

セット内のポリヌクレオチドは、完全配列又は部分配列でありうる。 The polynucleotides within a set can be complete sequences or partial sequences.

本発明のいくつかの実施形態では、前記方法は12に進み、ここで、セット内の配列が、所定の順序、例えば、進化によって決定された順序に従ってアライメントされて、複数のアライメント層を有するマルチプルアライメントを提供する。 In some embodiments of the invention, the method proceeds to 12, where the sequences in the set are aligned according to a predetermined order, e.g. Provide alignment.

アライメントは、複数のアライメントとして、又は系統樹表現-樹状図を使用して順序付けられうる。典型的には、複数のアライメントでは、第1のアライメント層は、クエリポリヌクレオチドを記述する配列である。アライメントが進化によって決定される場合、第1の層は、任意に、かつ好ましくは、関心対象の種を記述する配列である。例えば、ポリヌクレオチドの1つがヒトポリヌクレオチドである場合、第1のアライメント層は、ヒトポリヌクレオチドの配列でありうる。 Alignments can be ordered as multiple alignments or using a phylogenetic tree representation-dendrogram. Typically, in multiple alignments, the first alignment layer is a sequence that describes the query polynucleotide. If the alignment is determined by evolution, the first layer is optionally and preferably a sequence that describes the species of interest. For example, if one of the polynucleotides is a human polynucleotide, the first alignment layer can be a sequence of human polynucleotides.

アライメントは、当技術分野で公知のいずれかの技術によるものでありうる。典型的には、アライメント技術はスコアを提供し、順序はスコアに従う。例えば、BLASTを使用して配列の順序を決定することができる。アライメント技術がスコアを提供する場合、第2のアライメント層は、第1のアライメント層に対して最も高いアライメントスコアを有する配列であることが好ましく、第3のアライメント層は、第1のアライメント層に対して次に高いアライメントスコアを有する配列であることが好ましく、以下同様である。これにより、各層内の配列が前の層内の配列に対して最良のアライメントスコアを有するものであるアライメントが提供される。アライメント技術が特定のアライメント層に対して有意なアライメントを提供しない場合、その特定のアライメント層の後にある層は、受信されたセットの順序に従って次に利用可能な配列を含む。 Alignment can be by any technique known in the art. Typically, the alignment technique provides a score and the order follows the score. For example, BLAST can be used to determine the order of the array. If the alignment technique provides a score, the second alignment layer is preferably the sequence with the highest alignment score relative to the first alignment layer, and the third alignment layer is preferably the sequence with the highest alignment score relative to the first alignment layer. It is preferable that the sequence has the next highest alignment score, and the same applies hereinafter. This provides an alignment in which the sequences in each layer are the ones with the best alignment scores relative to the sequences in the previous layer. If the alignment technique does not provide significant alignment for a particular alignment layer, the layers after that particular alignment layer include the next available sequence according to the order of the received set.

ただし、動作12を実行する必要はないことを理解されたい。例えば、前記方法は、受信されたセットの時点で順序を使用することができる。あるいは、前記方法は、ユーザが、例えば、ユーザインターフェース装置によって、前記方法によって使用されるべき順序を選択又は入力することを可能にすることができる。 However, it should be understood that act 12 need not be performed. For example, the method may use an order at the time of the received set. Alternatively, the method may allow a user to select or input, for example by a user interface device, the order to be used by the method.

前記方法は、グラフが構築される13に続くことが好ましい。本発明者らは、さらに構造化された前記方法で問題の制約を定義することを可能にするため、配列分析の問題をグラフをトラバースする問題に変換することが有利であることを見出した。グラフは、階層化及び連結されたグラフであることが好ましく、グラフの各エッジは、連続する層のノード同士を連結する。グラフの層は、配列を表すことが好ましく、層内のノードは、それぞれの配列内のk量体を表す。したがって、例えば、グラフのi番目の層がセットの特定の配列(例えば、イヌ生物の配列)を表すと仮定する。この場合、i番目の層の各ノードは、特定の配列のk量体を表す。例えば、i番目の層の第1のノードは、その特定の配列内の第1のk量体(例えば、配列の塩基1~k)を表すことができ、i番目の層の第2のノードは、その特定の配列内の第2のk量体(例えば、配列の塩基2~k+1)を表すことができ、以下同様である。本発明の様々な例示的な実施形態では、6≦k≦12である。 Preferably, the method continues at 13 where a graph is constructed. The inventors have found that it is advantageous to transform the sequence analysis problem into a graph traversal problem in order to allow defining the problem constraints in a more structured manner. Preferably, the graph is a layered and connected graph, with each edge of the graph connecting nodes of successive layers. The layers of the graph preferably represent arrays, and the nodes within the layers represent the k-mers within the respective array. Thus, for example, assume that the i-th layer of the graph represents a particular arrangement of the set (eg, the arrangement of dog organisms). In this case, each node of the i-th layer represents a particular arrangement of k-mers. For example, the first node of the i-th layer can represent the first k-mer in that particular sequence (e.g., bases 1-k of the sequence), and the second node of the i-th layer can represent the second k-mer within that particular sequence (eg, bases 2 to k+1 of the sequence), and so on. In various exemplary embodiments of the invention, 6≦k≦12.

動作12が実行されず、前記方法が順序に関するユーザ入力を受信しない場合、前記方法は、受信されたセット内の配列の順序に従ってグラフの層を構築する。具体的には、グラフの第1の層は、受信されたセット内の第1の配列を表し、グラフの第2の層は、受信されたセット内の第2の配列を表し、以下同様である。前記方法が順序に関するユーザ入力を受信すると、前記方法は、ユーザ入力に従ってグラフの層を構築する。具体的には、グラフの第1の層は、ユーザ入力に従って順序が1番目となる配列を表し、グラフの第2の層は、ユーザ入力に従って順序が2番目となる配列を表し、以下同様である。動作12が実行されると、前記方法は、アライメントに従ってグラフの層を構築する。具体的には、グラフの第1の層は第1のアライメント層の配列を表し、グラフの第2の層は第2のアライメント層の配列を表し、以下同様である。 If act 12 is not performed and the method does not receive user input regarding order, then the method builds the layers of the graph according to the order of the arrays in the received set. Specifically, the first layer of the graph represents the first array in the received set, the second layer of the graph represents the second array in the received set, and so on. be. When the method receives user input regarding the order, the method builds the layers of the graph according to the user input. Specifically, the first layer of the graph represents the array that is first in order according to user input, the second layer of the graph represents the array that is second in order according to user input, and so on. be. When act 12 is performed, the method builds the layers of the graph according to the alignment. Specifically, the first layer of the graph represents the arrangement of the first alignment layer, the second layer of the graph represents the arrangement of the second alignment layer, and so on.

本発明の様々な例示的な実施形態では、グラフの第1の層は、クエリポリヌクレオチドを記述する配列を表す。 In various exemplary embodiments of the invention, the first layer of the graph represents sequences that describe the query polynucleotide.

グラフは、各エッジが同一又は相同なk量体を表すノード同士を連結するように、任意に、かつ好ましくは構築される。この実施形態の利点は、複数のポリヌクレオチドにわたって保存されているか又は実質的に保存されているモチーフを同定することができることである。 The graph is optionally and preferably constructed such that each edge connects nodes representing the same or homologous k-mer. An advantage of this embodiment is that motifs that are conserved or substantially conserved across multiple polynucleotides can be identified.

本発明のいくつかの実施形態によれば、グラフのエッジによって連結される相同なk量体間の相同性は、少なくとも60%、さらに好ましくは少なくとも70%、さらに好ましくは少なくとも80%、さらに好ましくは少なくとも90%、95%又はそれ以上である。 According to some embodiments of the invention, the homology between homologous k-mers connected by edges of the graph is at least 60%, more preferably at least 70%, even more preferably at least 80%, even more preferably is at least 90%, 95% or more.

本発明のいくつかの実施形態による典型的な階層化されたグラフの代表的な例を図11B、図11D及び図12に示す。これらの図では、ノードはk量体を形成するヌクレオチド塩基に対応するストリングとして示され、エッジは直線実線として示され、層はL、Lなどによって示されている。 Representative examples of typical layered graphs according to some embodiments of the invention are shown in FIGS. 11B, 11D, and 12. In these figures, nodes are shown as strings corresponding to nucleotide bases forming k-mers, edges are shown as straight solid lines, and layers are indicated by L 1 , L 2 , etc.

前記方法は、グラフがグラフのエッジに沿った連続的な非交差経路を求めて検索される14に続く。検索は、限定するものではないが、線形計画法(例えば、整数線形計画法)、混合線形計画法などのいずれかの公知の最適化技術、又は局所的に最大の解を見つけるためのいずれかの他の手法、例えば、貪欲法アルゴリズムを使用することができる。 The method continues at 14 where the graph is searched for continuous non-intersecting paths along the edges of the graph. The search may be performed using any known optimization technique such as, but not limited to, linear programming (e.g., integer linear programming), mixed linear programming, or any method to find a locally maximal solution. Other techniques can be used, such as greedy algorithms.

経路は、1つの特定のk量体を表すノード同士を連結するエッジが、その特定のk量体と同一又は相同ではないk量体を表すノード同士を連結するエッジと交差しないという意味で非交差である。ただし、特定のk量体を表し、2つの連続する層に属するノード同士を連結する複数のエッジエッジが存在する場合、これらのエッジは交差してもよいが、必ずしも交差しなくてもよいことに留意されたい。例えば、図11Dの下部の簡略化されたグラフを参照すると、グラフは、2つのk量体、すなわち、7量体AGAAUCGを表す8つのノードと、6量体CCGUACを表す5つのノードとを含む。(同一又は相同な)7量体を連結するエッジは、(同一又は相同な)6量体を連結するエッジと交差しない。一方、7量体を連結し、互いに交差するエッジが存在する(例えば、層Lの第4のノードを層Lの第4のノードに連結するエッジ、及び層Lの第5のノードを層Lの第3のノードに連結するエッジを参照)。それでも、7量体を連結するエッジのいくつかは、他のエッジと交差しない(例えば、層Lの第4のノードを層Lの第3のノードに連結するエッジは、層Lの第5のノードを層Lの第4のノードに連結するエッジと交差しないことを参照)。 A path is non-conforming in the sense that edges connecting nodes representing one particular k-mer do not intersect edges connecting nodes representing k-mers that are not the same or homologous to that particular k-mer. It is an intersection. However, if there are multiple edges that represent a specific k-mer and connect nodes belonging to two consecutive layers, these edges may intersect, but do not necessarily need to intersect. Please note that. For example, referring to the simplified graph at the bottom of FIG. 11D, the graph includes two k-mers, eight nodes representing the heptamer AGAAUCG and five nodes representing the hexamer CCGUAC. . Edges connecting heptamers (same or homologous) do not intersect edges connecting hexamers (same or homologous). On the other hand, there are edges connecting the heptamers and intersecting each other (e.g. an edge connecting the fourth node of layer L 2 to the fourth node of layer L 3 and the fifth node of layer L 2 (see the edge connecting L3 to the third node of layer L3 ). Still, some of the edges connecting the heptamers do not intersect other edges (e.g., the edge connecting the fourth node of layer L 2 to the third node of layer L 3 (see not intersecting the edge connecting the fifth node to the fourth node of layer L3 ).

本発明のいくつかの実施形態では、検索は、浅い方の経路(すなわち、グラフの少ない方の層を通過する経路)よりも深い方の経路(すなわち、グラフの多い方の層を通過する経路)に対して検索が優先的であるように、検索のための制約として経路深度による基準を適用することを含む。 In some embodiments of the present invention, the search involves searching for deeper paths (i.e., paths that traverse more graph-rich layers) than shallower paths (i.e., paths that traverse graph-less layers). ), including applying criteria by path depth as a constraint for the search, such that the search is preferential for the search.

前記方法は、14から、任意に、かつ好ましくは、15に続き、15では、kの値が(好ましくは1だけ)減少し、次いで、13に折り返して、グラフに既に存在するノードによって既に表されているk量体よりも短いk量体を表すノードをグラフに含めることによって、kの減少した値に従ってグラフを再構築する。好ましくは、再構築は、既存のノードの少なくとも一部を維持しながら、より短いk量体に対応するノードを追加することを含み、したがって、グラフの順序(ノードの数)を増加させる。図11Dの簡略化された場合を再び参照すると、この図の最上部のグラフは、7量体を表す8つのノードを有し、k<7のk量体を表すノードを含まない。図11Dの中央のグラフは、グラフの順序が8から8+5=13に増加するように、6量体を表す5つのノードを追加することによるグラフの再構築を示す。 From 14, the method optionally and preferably continues to 15, in which the value of k is decreased (preferably by 1), and then wraps around to 13 to remove nodes already represented by nodes already present in the graph. Restructure the graph according to the reduced value of k by including nodes in the graph that represent k-mers that are shorter than the k-mer that is being used. Preferably, the reconstruction includes adding nodes corresponding to shorter k-mers while preserving at least some of the existing nodes, thus increasing the order (number of nodes) of the graph. Referring again to the simplified case of FIG. 11D, the top graph of this figure has eight nodes representing heptamers and no nodes representing k-mers with k<7. The middle graph in FIG. 11D shows the reconstruction of the graph by adding 5 nodes representing hexamers so that the order of the graph increases from 8 to 8+5=13.

より短いk量体を表すノードがグラフに含まれると、前記方法は、連続する層の同一又は相同なk量体を連結するように、グラフのエッジを任意に、かつ好ましくは更新する。これは、図11Dの中央のグラフに例示されており、ここで、6量体を表す新たに追加されたノード同士を連結するためにグラフにエッジが追加された。特定のk量体を表す、層L内のいずれかのノードが、同じ特定のk量体を表す、層Li+1内のあらゆるノードに連結されるように、を組み合わせて追加することができる。 When nodes representing shorter k-mers are included in the graph, the method optionally and preferably updates the edges of the graph to connect the same or homologous k-mers of successive layers. This is illustrated in the middle graph of FIG. 11D, where edges were added to the graph to connect the newly added nodes representing hexamers. can be added in combination such that any node in layer L i representing a particular k-mer is connected to any node in layer L i+1 representing the same particular k-mer. .

グラフの各再構築後、前記方法は、任意に、かつ好ましくは、動作14を再実行して、再構築されたグラフのエッジに沿って連続的な非交差経路を提供する。そのような再実行は、例えば、以前に取得された経路が新たに追加されたエッジと交差することが判明した場合に、以前に取得された経路の除外をもたらし得る。これは、図11Dの上部及びグラフに例示されており、ここで、例えば、層Lの左端のノードで始まり、層Lの右端のノードで終わる経路は、図11Dの上部グラフ(再構築前)に含まれるが、再構築中に追加された、6量体を連結するエッジと交差することが判明したため、図11Dの下部グラフ(再構築後)には含まれない。 After each reconstruction of the graph, the method optionally and preferably re-performs act 14 to provide continuous non-intersecting paths along the edges of the reconstructed graph. Such re-execution may result in the exclusion of a previously obtained path, for example, if it is found to intersect a newly added edge. This is illustrated in the top graph of FIG. 11D, where, for example, a path that starts at the leftmost node of layer L1 and ends at the rightmost node of layer L3 is shown in the top graph of FIG. (before), but is not included in the lower graph of FIG. 11D (after reconstruction) because it was found to intersect with an edge connecting the hexamers that was added during reconstruction.

15を介した14から13への折返しは、任意に、かつ好ましくは反復的に継続される。好ましくは、各反復サイクルで、前記方法は、検索のための制約として、前の反復サイクルで得られた経路を適用する。制約のそのような適用の代表例は、図12に示され、以下の実施例の項でさらに例示される。反復は、追加されるk量体がなくなるまで、又は見つけられる新たな非交差経路がなくなるまで、又は何らかの他の所定の停止基準が満たされるまで、任意に、かつ好ましくは繰り返される。 The folding back from 14 to 13 via 15 is optionally and preferably repeated repeatedly. Preferably, in each iteration cycle, the method applies the paths obtained in the previous iteration cycle as constraints for the search. A representative example of such application of constraints is shown in FIG. 12 and further illustrated in the Examples section below. Iterations are optionally and preferably repeated until no more k-mers are added or no new non-crossing paths are found, or until some other predetermined stopping criterion is met.

16では、出力が生成される。出力は、経路のうちの少なくとも1つに対応するk量体を機能的に関心対象の核酸配列として同定することが好ましい。出力は、表示装置上にグラフィック若しくはテキストで表示されうるか、又はその後の使用のためにコンピュータ可読記憶媒体に記憶されうる。 At 16, output is generated. Preferably, the output identifies a k-mer corresponding to at least one of the pathways as a nucleic acid sequence of functional interest. The output may be displayed graphically or textually on a display device, or may be stored on a computer-readable storage medium for subsequent use.

前記方法は、17で終了する。 The method ends at 17.

図15は、入力/出力(I/O)回路134と、ハードウェア中央処理装置(CPU)136(例えば、ハードウェアマイクロプロセッサ)と、揮発性メモリ及び不揮発性メモリの両方を典型的に含むハードウェアメモリ138とを典型的に備えるハードウェアプロセッサ132を有するクライアントコンピュータ130の概略図である。CPU136は、I/O回路134及びメモリ138と通信する。クライアントコンピュータ130は、プロセッサ132と通信するグラフィカルユーザインターフェース(GUI)142を備えることが好ましい。I/O回路134は、適切に構造化された形式でGUI142との間で情報を通信することが好ましい。ハードウェアプロセッサ152、I/O回路154、ハードウェアCPU156、ハードウェアメモリ158を同様に含むことができるサーバコンピュータ150も示されている。クライアントコンピュータ130及びサーバコンピュータ150のI/O回路134及び154は、有線通信又は無線通信を介して互いに情報を通信する送受信器として動作することができる。例えば、クライアントコンピュータ130及びサーバコンピュータ150は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)又はインターネットなどのネットワーク140を介して通信することができる。サーバコンピュータ150は、いくつかの実施形態では、ネットワーク140を介してクライアントコンピュータ130と通信するクラウドコンピューティング設備のクラウドコンピューティングリソースの一部でありうる。 FIG. 15 illustrates hardware that typically includes an input/output (I/O) circuit 134, a hardware central processing unit (CPU) 136 (e.g., a hardware microprocessor), and both volatile and nonvolatile memory. 1 is a schematic diagram of a client computer 130 having a hardware processor 132 that typically includes a hardware memory 138. FIG. CPU 136 communicates with I/O circuitry 134 and memory 138. Client computer 130 preferably includes a graphical user interface (GUI) 142 that communicates with processor 132. I/O circuitry 134 preferably communicates information to and from GUI 142 in a suitably structured format. Also shown is a server computer 150, which may also include a hardware processor 152, an I/O circuit 154, a hardware CPU 156, and a hardware memory 158. I/O circuits 134 and 154 of client computer 130 and server computer 150 can operate as transceivers that communicate information with each other via wired or wireless communications. For example, client computer 130 and server computer 150 may communicate via network 140, such as a local area network (LAN), wide area network (WAN), or the Internet. Server computer 150 may be part of the cloud computing resources of a cloud computing facility that communicates with client computer 130 via network 140 in some embodiments.

GUI142及びプロセッサ132は、同じハウジング内に一体化されてもよいか、又は互いに通信する別個のユニットであってよい。 GUI 142 and processor 132 may be integrated within the same housing or may be separate units that communicate with each other.

GUI142は、任意に、かつ好ましくは、GUI142がプロセッサ132と通信することを可能にする専用のCPU及びI/O回路(図示せず)を含むシステムの一部でありうる。プロセッサ132は、CPU136によって生成されたグラフィック出力及びテキスト出力をGUI142に発する。プロセッサ132はまた、ユーザ入力に応答してGUI142によって生成された制御命令に関係する信号をGUI142から受信する。GUI142は、当技術分野で公知のいずれかの種類のもの、例えば、限定するものではないが、キーボード及びディスプレイ、タッチスクリーンなどでありうる。好ましい実施形態では、GUI142は、スマートフォン、タブレット、スマートウォッチなどのモバイル装置のGUIである。GUI142がモバイル装置、プロセッサ132のGUIである場合、モバイル装置のCPU回路は、プロセッサ132として機能することができ、本明細書に記載のコード命令を実行することができる。 GUI 142 may optionally and preferably be part of a system that includes dedicated CPU and I/O circuitry (not shown) that allows GUI 142 to communicate with processor 132. Processor 132 issues graphical and textual output generated by CPU 136 to GUI 142 . Processor 132 also receives signals from GUI 142 related to control instructions generated by GUI 142 in response to user input. GUI 142 may be of any type known in the art, such as, but not limited to, a keyboard and display, a touch screen, and the like. In a preferred embodiment, GUI 142 is a GUI of a mobile device, such as a smartphone, tablet, or smartwatch. If GUI 142 is a GUI of a mobile device, processor 132, the mobile device's CPU circuitry can function as processor 132 and can execute the code instructions described herein.

クライアントコンピュータ130及びサーバコンピュータ150は、それぞれ、1又は複数のコンピュータ可読記憶媒体144、164をさらに備えることができる。媒体144及び164は、本明細書でさらに詳述される方法を実行するためのコンピュータコード命令を記憶する非一時的記憶媒体であることが好ましく、プロセッサ132及び152は、これらのコード命令を実行する。コード命令は、それぞれのコード命令をそれぞれのプロセッサ132及び152のそれぞれの実行メモリ138及び158にロードすることによって実行されうる。 Client computer 130 and server computer 150 may further include one or more computer-readable storage media 144, 164, respectively. Media 144 and 164 are preferably non-transitory storage media that store computer code instructions for performing the methods further detailed herein, and processors 132 and 152 execute these code instructions. do. Code instructions may be executed by loading respective code instructions into respective execution memories 138 and 158 of respective processors 132 and 152.

記憶媒体144及び164の各々は、それぞれのプロセッサによって読み取られるとプロセッサに本明細書に記載の方法を実行させるプログラム命令を記憶することができる。本発明のいくつかの実施形態では、複数の相同なポリヌクレオチドを記述する配列のセットが、I/O回路134によってプロセッサ132によって受信される。プロセッサ132は、本明細書中上記でさらに詳述されるように、グラフを構築し、連続的な非交差経路を求めてグラフを検索し、少なくとも1つの経路に対応するk量体を機能的に関心対象の核酸配列として同定する出力を生成する。あるいは、プロセッサ132は、ネットワーク140を介してサーバコンピュータ150に配列のセットを送信することができる。コンピュータ150は、本明細書中上記でさらに詳述されるように、配列のセットを受信し、グラフを構築し、連続的な非交差経路を求めてグラフを検索し、少なくとも1つの経路に対応するk量体を機能的に関心対象の核酸配列として同定する。コンピュータ150は、ネットワーク140を介してコンピュータ130に機能的に関心対象の核酸配列を送信し返す。コンピュータ130は、核酸配列を受信し、それをGUI142上に表示する。 Each of storage media 144 and 164 can store program instructions that, when read by a respective processor, cause the processor to perform the methods described herein. In some embodiments of the invention, a set of sequences describing a plurality of homologous polynucleotides is received by processor 132 by I/O circuit 134. Processor 132 constructs a graph, searches the graph for continuous non-intersecting paths, and functionalizes the k-mer corresponding to at least one path, as further detailed herein above. generate an output that identifies the nucleic acid sequence of interest. Alternatively, processor 132 can send the set of sequences to server computer 150 via network 140. Computer 150 receives the set of sequences, constructs a graph, and searches the graph for continuous non-intersecting paths, as described in further detail hereinabove. functionally identify the k-mer as the nucleic acid sequence of interest. Computer 150 functionally transmits the nucleic acid sequence of interest back to computer 130 via network 140 . Computer 130 receives the nucleic acid sequence and displays it on GUI 142.

モチーフが同定されると、分子生物学的手法を使用して、例えば、レポーター配列を典型的に有する発現ベクターへのクローニングによってモチーフを検証することができる。 Once a motif is identified, molecular biology techniques can be used to verify the motif, eg, by cloning into an expression vector, which typically carries a reporter sequence.

本明細書で使用される場合、用語「約」は、±10%を指す。 As used herein, the term "about" refers to ±10%.

用語「含む(comprises)」、「含む(comprising)」、「含む(includes)」、「含む(including)」、「有する(having)」及びそれらの同根語は、「を含むが、これらに限定されない」を意味する。 The terms "comprises," "comprising," "includes," "including," "having," and their root words include, but are not limited to. It means "not done".

用語「からなる(consisting of)」は、「含み、それらに限定される(including and limited to)」を意味する。 The term "consisting of" means "including and limited to."

用語「から本質的になる(consisting essentially of)」は、組成物、方法又は構造が追加の成分、工程及び/又は部分を含み得るが、追加の成分、工程及び/又は部分が、特許請求される組成物、方法又は構造の基本的かつ新規な特徴を実質的に変化させない場合に限ることを意味する。 The term "consisting essentially of" means that the composition, method, or structure may include additional ingredients, steps, and/or parts, but that the additional ingredients, steps, and/or parts are not claimed. This means only if the fundamental and novel characteristics of the composition, method, or structure being used do not materially change.

本明細書で使用される場合、単数形「a」、「an」及び「the」は、文脈上他に明確に指示されない限り、複数の言及を含む。例えば、用語「化合物」又は「少なくとも1つの化合物」は、それらの混合物を含む複数の化合物を含み得る。 As used herein, the singular forms "a," "an," and "the" include plural references unless the context clearly dictates otherwise. For example, the term "compound" or "at least one compound" can include multiple compounds, including mixtures thereof.

本出願を通して、本発明の様々な実施形態は、範囲形式で提示されうる。範囲形式での説明は、単に便宜及び簡潔さのためのものであり、本発明の範囲に対する柔軟性のない限定として解釈されるべきではないことを理解されたい。したがって、範囲の説明は、すべての可能な部分範囲、及びその範囲内の個々の数値を具体的に開示したと見なされるべきである。例えば、1~6などの範囲の説明は、1~3、1~4、1~5、2~4、2~6、3~6などの部分範囲、並びにその範囲内の個々の数、例えば、1、2、3、4、5及び6を具体的に開示していると見なされるべきである。これは、範囲の幅に関係なく適用される。 Throughout this application, various embodiments of the invention may be presented in a range format. It should be understood that the description in range format is merely for convenience and brevity and is not to be construed as an inflexible limitation on the scope of the invention. Accordingly, range descriptions should be considered to specifically disclose all possible subranges and individual numerical values within that range. For example, a description of a range such as 1 to 6 includes subranges such as 1 to 3, 1 to 4, 1 to 5, 2 to 4, 2 to 6, 3 to 6, etc., as well as individual numbers within that range, e.g. , 1, 2, 3, 4, 5 and 6. This applies regardless of the width of the range.

本明細書において数値範囲が示される場合はいつでも、示された範囲内のいずれかの引用された数字(分数又は整数)を含むことを意味する。第1の指示数と第2の指示数との「間の範囲(ranging/ranges between)」という語句と、第1の指示数「から(from)」第2の指示数「まで(to)の範囲(ranging/ranges)」という語句とは、本明細書では区別なく使用され、第1及び第2の指示数並びにそれらの間のすべての分数及び整数を含むことを意味する。 Whenever a numerical range is indicated herein, it is meant to include any recited number (fraction or integer) within the indicated range. The phrase "ranging/ranges between" the first number and the second number, and the phrase "from" the first number and "to" the second number. The phrase "ranging/ranges" is used interchangeably herein and is meant to include the first and second indicated numbers and all fractions and integers therebetween.

本明細書で使用される場合、用語「方法」は、限定するものではないが、化学、薬理学、生物学、生化学及び医学の分野の当業者に公知であるか、又は当業者に公知の様式、手段、技術及び手順から容易に開発される様式、手段、技術及び手順を含む、所与のタスクを達成するための様式、手段、技術及び手順を指す。 As used herein, the term "method" refers to, but is not limited to, methods known to or known to those skilled in the art of chemistry, pharmacology, biology, biochemistry, and medicine. refers to the manners, means, techniques, and procedures for accomplishing a given task, including manners, means, techniques, and procedures readily developed from the manner, means, techniques, and procedures of

RNAアンチセンス配列は、UがTによって置換されているDNA配列として本明細書に提供されうることが理解される。 It is understood that an RNA antisense sequence may be provided herein as a DNA sequence in which a U is replaced by a T.

特定の配列表を参照する場合、そのような参照は、例えば、配列決定エラー、クローニングエラー、又は塩基置換、塩基欠失若しくは塩基付加をもたらす他の変化から生じる小さな配列変異を含むものとして、その相補的配列に実質的に対応する配列も包含すると理解されるべきであり、ただし、そのような変異の頻度は、50ヌクレオチド中1個未満、あるいは100ヌクレオチド中1個未満、あるいは200ヌクレオチド中1個未満、あるいは500ヌクレオチド中1個未満、あるいは1000ヌクレオチド中1個未満、あるいは5,000ヌクレオチド中1個未満、あるいは10,000ヌクレオチド中1個未満である。 When referring to a particular sequence listing, such reference includes minor sequence variations resulting from, for example, sequencing errors, cloning errors, or other changes resulting in base substitutions, base deletions, or base additions. It should be understood to include sequences that substantially correspond to complementary sequences, provided that the frequency of such mutations is less than 1 in 50 nucleotides, or less than 1 in 100 nucleotides, or less than 1 in 200 nucleotides. or less than 1 in 500 nucleotides, or less than 1 in 1000 nucleotides, or less than 1 in 5,000 nucleotides, or less than 1 in 10,000 nucleotides.

明確にするために別個の実施形態の文脈で説明されている本発明の特定の特徴は、単一の実施形態では組み合わせて提供されてもよいことが理解される。逆に、簡潔にするために単一の実施形態の文脈で説明されている本発明の様々な特徴も、別個に、若しくはいずれかの好適な部分的組合せで、又は本発明のいずれかの他の記載された実施形態で好適であるように提供されてもよい。様々な実施形態の文脈で説明される特定の特徴は、実施形態がそれらの要素なしでは動作不能でない限り、それらの実施形態の本質的な特徴と見なされるべきではない。 It will be understood that certain features of the invention, which are, for clarity, described in the context of separate embodiments, may also be provided in combination in a single embodiment. Conversely, various features of the invention that are, for brevity, described in the context of a single embodiment may also be used separately or in any suitable subcombination or together with any other features of the invention. may be provided as suitable in the described embodiments. Certain features described in the context of various embodiments should not be considered essential features of those embodiments unless the embodiments are inoperable without those elements.

本明細書中上記で描写され、以下の特許請求の範囲の項で特許請求される本発明の様々な実施形態及び態様は、以下の実施例において実験の裏付けを見出す。 The various embodiments and aspects of the invention described hereinabove and claimed in the following claims section find experimental support in the following examples.

ここで、上記の説明とともに本発明のいくつかの実施形態を非限定的に示す以下の実施例を参照する。 Reference is now made to the following examples which, together with the above description, illustrate in a non-limiting manner some embodiments of the invention.

材料及び方法
LncLOOMへの入力
LncLOOMは、様々な種から得られた配列のセットに対して機能する。典型的には、各配列は、様々な種から得られた配列の推定ホモログに対応する。現在、本発明者らは、種当たり1つの配列アイソフォームのみを用いて研究しているが、種当たり複数の配列が存在する場合、例えば、選択的スプライシング産物への適応が可能である。入力配列は、RNA-seq及びESTデータ並びに既存のアノテーションの手動検査によって典型的に構築される。入力配列のいくつかは不完全である可能性があり、本発明のいくつかの実施形態によれば、本フレームワークは、そのようなシナリオに対応するための特定の工程を含むことに留意されたい。グラフ構築の前に、同一の配列を除去するためにセットがフィルタリングされる。これは、閾値を超えるパーセンテージ同一性を有する配列を除去するためにユーザによってさらに調整され得、この場合、LncLOOMは、MAFFT MSAを使用して各配列ペア間のパーセンテージ同一性を計算し、入力データセット内に最初に出現する配列を保持する。
Materials and Methods Input to LncLOOM LncLOOM operates on a set of sequences obtained from different species. Typically, each sequence corresponds to a putative homolog of the sequence obtained from various species. Currently we are working with only one sequence isoform per species, but accommodation is possible if multiple sequences per species exist, for example to alternatively spliced products. Input sequences are typically constructed by manual inspection of RNA-seq and EST data and existing annotations. It is noted that some of the input sequences may be incomplete and, according to some embodiments of the invention, the present framework includes specific steps to accommodate such scenarios. sea bream. Before graph construction, the set is filtered to remove identical sequences. This may be further adjusted by the user to remove sequences with percentage identity above a threshold, in which case LncLOOM calculates the percentage identity between each pair of sequences using MAFFT MSA and calculates the percentage identity between each pair of sequences using the input data Keep the first occurrence of the array in the set.

配列の順序付け
LncLOOMフレームワークは、理想的にはアンカー配列に対して単調に増加する進化距離を有する種(この原稿では、いずれの例でもヒトである)由来であるべきである配列の順序付きセットの周りに構築される。配列の順序は、ユーザによって提供されうるか、又はBLASTを使用することによって決定されうる。BLASTが使用される場合、アンカー配列は、データセット内の第1の配列であると定義される。第2の配列は、アンカー配列に対するアライメントスコアが最も高い配列である。その後の各配列は、未だ順序付けられていない配列の中で、前の配列に対する最良のアライメントスコアを有する配列である。有意なアライメントが見つからない場合、元の入力内で次の利用可能な配列が選択される。
Sequence Ordering The LncLOOM framework generates an ordered set of sequences that ideally should be from a species (human in both examples in this manuscript) with monotonically increasing evolutionary distances to the anchor sequence. built around. The order of the sequences can be provided by the user or determined by using BLAST. When BLAST is used, the anchor sequence is defined to be the first sequence in the dataset. The second sequence is the sequence with the highest alignment score to the anchor sequence. Each subsequent sequence is the one with the best alignment score to the previous sequence among the as yet unordered sequences. If no significant alignment is found, the next available sequence within the original input is selected.

LncLOOM法の概要
配列の順序が確立されると、LncLOOMは、各ヌクレオチド配列をグラフ内ノードによってそれぞれ表されるk量体の配列へと還元することによって、kの様々な値に対する短い保存されたk量体の組合せのセットを同定する。隣接する配列内にある同一のk量体が、追加の制約(図11A~D)及び整数線形計画法(ILP)の使用によってグラフ内で連結されて、これらのグラフ内で長い非交差経路のセットを見つける。各グラフ内で識別された経路のセットは、後続の反復でグラフに対する制約を定義し、グラフを分割するために使用される(グラフ分割の例を図12に示す)。最大のkから開始し、それを反復的に減少させると、LncLOOMは、指定された範囲内のあらゆるk量体長について初期主グラフを構築する。主グラフは、データセット内のあらゆる順序付けられた配列上で構築され、次いで、(上位2つの配列のみが残るまで)層ごとに一連のサブグラフにプルーニングされ、各サブグラフのILP問題が独立して解かれる。いずれかの所与の深度では、サブグラフは、前の反復で見つかった経路に基づいて、さらに小さいサブグラフの追加のセットに分割されうる。実際には、この手法は、より短くあまり保存されていないモチーフよりも深く保存されたより長いモチーフの同定を優先することを可能にし、ILPプログラムのサイズを、迅速に解かれ得る1,000エッジ未満に維持し、数十の長い配列に適用された場合であってもLncLOOMの全体的な実行時間を数分に維持することも可能にする。
Overview of the LncLOOM Method Once the sequence order is established, LncLOOM calculates short conserved values for various values of k by reducing each nucleotide sequence to an array of k-mers, each represented by a node in the graph. Identify a set of k-mer combinations. Identical k-mers in adjacent sequences are connected in graphs by additional constraints (Figures 11A-D) and the use of integer linear programming (ILP) to eliminate long non-intersecting paths in these graphs. Find a set. The set of paths identified within each graph is used in subsequent iterations to define constraints on the graph and partition the graph (an example of graph partitioning is shown in Figure 12). Starting from the largest k and decreasing it iteratively, LncLOOM constructs an initial principal graph for every k-mer length within the specified range. The main graph is constructed over every ordered array in the dataset, then pruned layer by layer into a series of subgraphs (until only the top two arrays remain), and the ILP problem for each subgraph is solved independently. It will be destroyed. At any given depth, the subgraph may be partitioned into additional sets of smaller subgraphs based on the paths found in previous iterations. In practice, this approach makes it possible to prioritize the identification of deeply conserved longer motifs over shorter, less conserved motifs, reducing the size of the ILP program to less than 1,000 edges that can be rapidly solved. It also makes it possible to maintain LncLOOM's overall execution time to a few minutes even when applied to tens of long arrays.

グラフ構築
D種由来のlncRNA配列のデータセットと、k量体の長さk(k-mer length k)(6~15nt)とを考慮すると、LncLOOMは有向グラフG=(V,E)を構築し、ここで、Vはグラフ内の全ノードのセットであり、Eはエッジのセットである。グラフはD層から構成され、ここでDはデータセット内の配列の数である。各配列は、層(L、L...L)としてモデル化され、層L(長さN(i)の配列に対応)はノード(v、v...vN(i)-k+1)から構成され、ここで各ノードvは、i番目の配列内の位置nにあるk量体を表す(図1B)。同じk量体を表し、連続する層(j=i+1の場合、L及びL)に見られるノードの全ペアが、エッジxuv=(u,v)によって連結され、ここで、u∈Li■かつv∈Lj■である。各サブストリングは、典型的には1つの配列内に複数回出現するため、エッジの数は、グラフ内のノードの数を大幅に超える可能性がある。深く保存されているk量体の順序付きの組合せは、交差せず(すなわち、
Graph Construction Considering the data set of lncRNA sequences derived from species D and the k-mer length k (6 to 15 nt), LncLOOM constructs a directed graph G = (V, E). , where V is the set of all nodes in the graph and E is the set of edges. The graph is composed of D layers, where D is the number of arrays in the dataset. Each array is modeled as a layer (L 1 , L 2 ...L D ), and a layer L i (corresponding to an array of length N(i)) is a node (v 1 , v 2 ...v N (i)−k+1 ), where each node v n represents the k-mer at position n in the i-th array (FIG. 1B). All pairs of nodes representing the same k-mer and found in successive layers (L i and L j for j=i+1) are connected by edges x uv = (u, v), where u∈ L i■ and v∈L j■ . Since each substring typically occurs multiple times within an array, the number of edges can significantly exceed the number of nodes in the graph. Ordered combinations of deeply conserved k-mers are nonintersecting (i.e.,

)であり、Lにノードを有する、G内の長い経路に対応する。したがって、目標は、各エッジがS内にあるエッジを介してLから到達可能であり、S内の2つのエッジが交差しないように、E内のセットSを見つけることである。理想的には、潜在的な追加の制約を受ける最大のSを見つけることが望ましい。例えば、短い経路は望ましくない場合があり、したがって、これは、S内のエッジがいずれも、特定の層に到達する経路上に見つけられることを必要とする。 ), which corresponds to a long path in G with a node at L1 . Therefore, the goal is to find a set S in E such that each edge is reachable from L1 via an edge that is in S, and no two edges in S intersect. Ideally, it would be desirable to find the largest S subject to potential additional constraints. For example, short paths may not be desirable, so this requires that any edges in S are found on the path to reach a particular layer.

ILPを使用した長い非交差経路の同定
ILP問題では、G内の各エッジは、(u,v)がS内にある場合に1の値が割り当てられる変数xuvによって表される。目的関数は、下記|S|を最大化するように定義される。
Identification of Long Non-Intersecting Paths Using ILP In the ILP problem, each edge in G is represented by a variable x uv that is assigned a value of 1 if (u,v) is in S. The objective function is defined to maximize |S| below.

このモデルに課される追加の制約は、いくつかの考慮事項から導出される。第1に、LncLOOMは、LncRNA配列内に同じ順序で出現する短い保存されたk量体を同定することを目的とする。しかし、k量体が各配列内に一度しか出現しない可能性は低い。したがって、ILPモデルに適用される制約は、同じ深度を有しない一致しないk量体の経路と交差しない限り、1又は複数の層に単一のk量体の複数の繰返しを含む複雑な経路を可能にするはずである(図1B及び図11A)。非交差経路の選択を確実にするために、2つの連続する層の間で交差するいずれかのエッジペアに以下の制約が課される: Additional constraints placed on this model derive from several considerations. First, LncLOOM aims to identify short conserved k-mers that occur in the same order within LncRNA sequences. However, it is unlikely that a k-mer occurs more than once within each sequence. Therefore, the constraints applied to the ILP model are that complex paths containing multiple repeats of a single k-mer in one or more layers must not intersect paths of unmatched k-mers that do not have the same depth. (FIGS. 1B and 11A). To ensure the selection of non-intersecting paths, the following constraints are imposed on any pair of edges that intersect between two consecutive layers:

上記の制約は各ノードの開始位置のみを考慮するため、2つの連続する層内で繰り返される同一のk量体を連結する交差エッジも除外する。k量体が両方の連続する層内で繰り返される場合、各繰返し-繰返し連結からエッジのネットワークが構築される(図11B)。エッジのこのネットワークは、等しく保存されているが連結するk量体がより少ない他の経路の選択を無効にし得る。したがって、この制約は、固有に存在するk量体の経路によって散在させられる複数の非交差経路への複雑な経路の分割を促進するため、同一のk量体を連結するエッジにこの制約を課すことが重要である。しかし、同一の繰返しを連結するエッジのネットワークが、他の経路が存在しない場合にのみ互いに制約される場合、ILPソルバは、複数の繰返し-繰返し連結からエッジのいずれかの可能な解を選択することができる。これは、グラフ精密化の後続の反復中に、繰り返されるk量体の準最適除外につながる可能性がある(図13Bに示されるシナリオ)。このシナリオを回避するために、繰り返されるk量体のネットワークと交差する、等しい深度を有する少なくとも1つの他の経路が存在する場合、交差制約は、同一のk量体を連結するエッジにのみ課される。 Since the above constraint only considers the starting position of each node, it also excludes intersecting edges connecting the same k-mers that are repeated in two consecutive layers. If the k-mer is repeated in both successive layers, a network of edges is constructed from each repeat-repeat connection (FIG. 11B). This network of edges may override the selection of other paths that are equally conserved but have fewer k-mers connecting them. Therefore, we impose this constraint on edges connecting identical k-mers because this constraint facilitates the splitting of complex paths into multiple non-intersecting paths interspersed by paths of uniquely existing k-mers. This is very important. However, if the network of edges connecting identical iterations is constrained to each other only if no other path exists, then the ILP solver selects any possible solution of the edge from multiple iteration-iteration connections. be able to. This can lead to repeated suboptimal exclusion of k-mers during subsequent iterations of graph refinement (the scenario shown in Figure 13B). To avoid this scenario, crossing constraints are only imposed on edges connecting the same k-mers if there is at least one other path with equal depth that intersects the network of repeated k-mers. be done.

ここで、Z及びPは、ノードvのすべての直接の後続ノード及び先行ノードのそれぞれのサブセットを示し、yは最小深度要件であり、Mは十分に大きい定数である(実際には100が使用された)。この制約の下では、Lから少なくともLまで連続した連結を有する経路のみが選択される。同時に、この制約は、1又は複数の層内でタンデムに繰り返されるk量体を含む連結された複雑な経路の選択を可能にする(図1B)。 where Z and P denote the respective subsets of all immediate successors and predecessors of node v, y is the minimum depth requirement, and M is a sufficiently large constant (in practice 100 is used). ). Under this constraint, only paths with continuous connections from L 1 to at least L y are selected. At the same time, this constraint allows the selection of connected complex pathways involving tandemly repeated k-mers within one or more layers (Fig. 1B).

グラフGでは、各層Lは、配列内の連続するあらゆる位置で始まり、k塩基の長さを有するノード(v1、...vN(i)-k+1)からなる。これは、セットSから、セットSunionが、互いに重複する隣接ノードを連結するエッジをマージすることによって形成されうることに従う。ILPが解かれると、これらの重複するノードは、単一のさらに長いk量体に組み合わされる。この工程は、隣接k量体のセットが、単一の繰り返される塩基のストリングを含む、配列の領域を表すシナリオに遭遇し得る(一例については図1Bを参照)。次いで、得られたマージされたk量体に層特異的挿入が含まれる可能性がある。これを克服するために、重複領域の開始及び長さが各層内の2つの隣接ノード間で等しくなるように、L又はLのいずれかで重複する隣接k量体を連結するいずれかのエッジペアに以下の制約が課される。 In the graph G, each layer L i consists of nodes (v 1 , v 2 . . . v N(i)−k+1 ) starting at every consecutive position in the sequence and having a length of k bases. This follows from the set S that a set S union can be formed by merging edges connecting neighboring nodes that overlap with each other. When the ILP is solved, these overlapping nodes are combined into a single longer k-mer. This step may encounter scenarios in which a set of contiguous k-mers represents a region of a sequence that contains a single repeated string of bases (see FIG. 1B for an example). The resulting merged k-mer may then contain layer-specific insertions. To overcome this, we can use either L i or L j to connect overlapping adjacent k-mers such that the start and length of the overlap region is equal between the two adjacent nodes in each layer. The following constraints are imposed on edge pairs.

ILPは、非常に長い配列又は大きなデータセットに対するLncLOOMのスケーラビリティに対して大きな課題を提起する周知のNP難問である。この制限を克服するために、各グラフのILPの複雑さを低減し、また、深く保存されたk量体の選択を優先するいくつかの工程がフレームワークに含まれている。これらには、グラフプルーニング、単純な経路に基づくグラフの分割、エッジ構築に対する追加の制約、及び複雑な非交差経路の反復的な精密化が含まれる。 ILP is a well-known NP challenge that poses major challenges to the scalability of LncLOOM for very long arrays or large data sets. To overcome this limitation, several steps are included in the framework to reduce the ILP complexity of each graph and also favor the selection of deeply conserved k-mers. These include graph pruning, partitioning the graph based on simple paths, additional constraints on edge construction, and iterative refinement of complex non-intersecting paths.

グラフプルーニング
LncLOOMフレームワークでは、2つのプルーニング工程が使用される。第1の工程は、1又は複数の層内で過剰に繰り返されるk量体に対応するノードの除外を伴う。層ごとに許容される繰返しの数は、ユーザによって調整され得、小さいk(例えば、6)が使用される場合、さらに長い配列内のエッジの密度を大幅に減少させることができる。所与のk量体長について、この工程は、データセット内の全配列に対して初期グラフの構築中に行われ、次いで、除外されたノードは、あらゆる結果として得られるサブグラフから除外される。第2のプルーニング工程は、所与のレベルでサブグラフ構築の反復ごとに行われ、Lからその時点の深度までの連結された経路を有しないあらゆるノードを除外する。
Graph Pruning Two pruning steps are used in the LncLOOM framework. The first step involves excluding nodes corresponding to over-repeated k-mers within one or more layers. The number of repetitions allowed per layer can be adjusted by the user, and if a small k (eg, 6) is used, the density of edges in even longer arrays can be significantly reduced. For a given k-mer length, this step is performed during initial graph construction for all sequences in the data set, and the excluded nodes are then excluded from any resulting subgraph. A second pruning step is performed at each iteration of subgraph construction at a given level to exclude any nodes that do not have a connected path from L1 to the current depth.

計算の複雑さを低減するためにグラフを分割する
ILP問題に課される制約は、単純な経路又は複雑な経路の選択を可能にし、ここで、単純な経路は、層ごとにただ1つのノードを含む経路として定義される。単純な経路は、さらに浅い経路と交差すべきではなく、したがって、グラフが、独立して解かれ得るさらに小さいサブグラフに分割されうる境界を提示する、確定的に選択されたエッジからなる(図12)。現在、これらのグラフは連続的に解かれているが、将来的には、少なくとも1つの単純な経路が見つかるならば、さらに大きなデータセットを処理するために並列計算を使用する余地がある。分割は、層ごとの反復では、各レベルで見つけられるその時点のk量体長の単純な経路に基づく。各サブグラフは、深度=yを有する2つの単純な経路τとτとの間に位置する、ノードのサブセットを選択することによって構築され、ここで、境界は、各層LからLy-1について、各経路内のノードの終了位置及び開始位置として定義される:W={v|q+k-1<n,n+k-1<r,v∈τ,v∈τ}(最終層は、次の反復のために除去される)。隣接する単純な経路のk量体が重複する場合、k量体は最初に組み合わされ、境界は組み合わされた長い方のk量体の開始位置及び終了位置で定義される。
Partitioning the graph to reduce computational complexity The constraints imposed on the ILP problem allow the choice of simple or complex paths, where a simple path consists of only one node per layer. is defined as a route that includes A simple path should not intersect with a shallower path and therefore consists of deterministically selected edges that present boundaries at which the graph can be divided into even smaller subgraphs that can be solved independently (Fig. 12 ). Currently, these graphs are solved serially, but in the future there is scope to use parallel computing to process even larger data sets, provided at least one simple path is found. The partitioning is based on a simple path of the current k-mer length found at each level in layer-by-layer iterations. Each subgraph is constructed by selecting a subset of nodes that are located between two simple paths τ a and τ b with depth = y, where the boundaries are for each layer L 1 to L y− 1 , defined as the ending and starting positions of the nodes in each path: W={v n |q+k−1<n, n+k−1<r, v q ∈τ a , v r ∈τ b }( The final layer is removed for the next iteration). If the k-mers of adjacent simple paths overlap, the k-mers are combined first and boundaries are defined by the start and end positions of the longer combined k-mers.

複雑な非交差経路の精密化
単純な経路とは対照的に、複雑な経路は、特に、グラフが制約されていない場合に早期反復で選択される経路では、繰り返されるk量体を連結する分岐を含むことができる。制約のないグラフでは、どの繰返しが各層に偶然出現するかを解読することはできない。したがって、複雑な経路は、後続の反復では、グラフにおけるエッジ選択を制約するために使用されない。代わりに、各反復で見つけられるセットSは、1)分割及びエッジ制約定義に使用される単純な経路のサブセットと、2)後続の反復で別個に記憶され連続的に精密化される複雑な経路のサブセットとに分割される。精密化中、複雑な経路は、新たに発見された経路と交差する分岐を除去するために最適化される(図12)。複雑な経路の精密化は、層ごとの除外中に2段階で行われる。第1に、y層にまたがるサブグラフを解く前に、複雑な経路のみの個々のグラフが、深度=yを有するより長いk量体のサブセットLCd=yと、最小深度y+1を有するその時点のk量体長の経路(その時点のk量体長での前の反復で選択された複雑な経路)からのサブセットCd>yとから構築される。次いで、上記のILP問題に従って、精密化された複雑な経路のサブセットCrefinedが見つけられる。ただし、LCd=y内のいずれかのより浅い経路にわたってCd>y内のあらゆる複雑な経路の選択を保証するために、以下の追加の制約が課される。
Refinement of complex non-intersecting paths. In contrast to simple paths, complex paths have many branches connecting repeated k-mers, especially for paths chosen in early iterations when the graph is unconstrained. can include. In an unconstrained graph, it is impossible to decipher which iterations happen to appear in each layer. Therefore, complex paths are not used to constrain edge selection in the graph in subsequent iterations. Instead, the set S found at each iteration consists of 1) a subset of simple paths used for partitioning and edge constraint definition, and 2) complex paths that are stored separately and continuously refined in subsequent iterations. is divided into a subset of During refinement, the complex path is optimized to remove branches that intersect the newly discovered path (Fig. 12). The refinement of complex paths is done in two steps during layer-by-layer exclusion. First, before solving a subgraph spanning y layers, each graph of complex paths only is divided into a longer k-mer subset LC d=y with depth=y and a point in time with a minimum depth y+1. It is constructed from a subset C d>y of the k-mer length path (the complex path selected in the previous iteration at the current k-mer length). Then, a subset of the refined complex paths C refined is found according to the above ILP problem. However, to ensure the selection of any complex path in C d>y over any shallower path in LC d=y , the following additional constraints are imposed.

この制約の下で、Cd>y内の各経路τについて、少なくとも1つの繰り返されるk量体がLから選択される。この制約が上記の制約とともに課される場合、少なくともy層にまたがる精密化された経路が解に含まれる。セットCrefinedが見つけられると、その時点の長さ及び深度のあらゆるk量体のサブグラフが構築される。次いで、Crefined内のあらゆる経路がその時点のサブグラフに追加され、Crefined内の各経路τの選択を優先するように課された追加の制約によってILP問題が解かれる。次いで、この解は、次の反復のために単純な経路のセットと複雑な経路のセットとに分割される。LncLOOMはまた、深度が大きくより短いk量体の単純な経路がより長くより浅いk量体よりも優先されるように、単純な経路を記憶及び精密化するオプションを含む。ただし、このオプションが適用される場合、グラフは分割されず、後続の反復ではエッジ構築に制約は課されない。したがって、このオプションは計算コストが高く、短い配列の小さなデータセットを分析するためにのみ使用されうる。 Under this constraint, for each path τ in C d>y , at least one repeated k-mer is selected from L 1 . If this constraint is imposed along with the above constraints, the solution includes a refined path that spans at least y layers. Once the set C refined is found, a subgraph of every k-mer of that point in time and depth is constructed. Every path in C refined is then added to the current subgraph, and the ILP problem is solved with additional constraints imposed to favor the selection of each path τ in C refined . This solution is then split into a set of simple paths and a set of complex paths for the next iteration. LncLOOM also includes an option to store and refine simple paths, such that simple paths with larger depths and shorter k-mers are preferred over longer, shallower k-mers. However, when this option is applied, the graph is not partitioned and no constraints are imposed on edge construction in subsequent iterations. Therefore, this option is computationally expensive and can only be used to analyze small datasets of short sequences.

グラフの複雑さを低減するためのBLAST高スコアリングペア(HSP)の使用
BLASTは、LncLOOMグラフ構築のプロセスでは、所望により存在する工程として使用されうる。BLAST HSPは、連続する層に見られる配列の、有意な類似性を有するセグメント間の局所的な非ギャップアライメントである。本発明者らは、2つの連続する層の間の同じHSP内に含まれないノードのいずれかのペアが連結されないように、これらのHSPを使用してエッジ構築を制約する。BLASTによって見出されるHSPは、HSPが互いに重複し得、いずれかのセグメントが標的配列内の複数のセグメントに一致し得るという点で冗長である。互いに重複するHSPのいずれかのセットに関して、グラフ構築に使用されるHSPには最も有意なペアのみが含まれる。同様に、1つのセグメントが標的配列内の複数のセグメントとアライメントする場合、最も高いスコアリングアライメントのみが含まれる。BLAST分析から導出されるこれらの制約は、グラフ内の可能な経路の数を効果的に減少させることができ、配列の一部が不完全である層間のエッジの正しい配置を促進することができる(図1A)。
Using BLAST High Scoring Pairs (HSP) to Reduce Graph Complexity BLAST may be used as an optional step in the process of LncLOOM graph construction. BLAST HSP is a local ungapped alignment between segments of sequences found in successive layers that have significant similarity. We use these HSPs to constrain edge construction such that any pair of nodes that are not contained within the same HSP between two consecutive layers are not connected. HSPs found by BLAST are redundant in that HSPs can overlap with each other and any segment can match multiple segments within the target sequence. For any set of HSPs that overlap with each other, only the most significant pairs are included in the HSPs used for graph construction. Similarly, if one segment aligns with multiple segments within the target sequence, only the highest scoring alignment is included. These constraints derived from BLAST analysis can effectively reduce the number of possible paths in the graph and can facilitate correct placement of edges between layers where part of the alignment is incomplete. (Figure 1A).

グラフサイズ制限
ILP問題の複雑さを低減するための工程が含まれているが、いくつかのシナリオでは、グラフが大きすぎて妥当な時間内に解くことができない。このボトルネックに対処するために、グラフ内のエッジの総数が制限される。デフォルトでは、ILP問題で許容されるエッジの最大数は1200であるが、これは50を超えるいずれかの数に設定することができる。いずれかの反復中に、グラフG内のエッジの数が最大限度を超える場合、グラフは、ILP問題が個別に解かれる一連のサブクラスタに分割される。最も少ないエッジ(最も少ない繰り返されるk量体)を有する経路から開始して、個々のグラフは、G内の各経路τ、及びそれと交差するCrefined内の経路のみから構築される。次いで、ILPを使用してGのこのサブクラスタ内の許容されるエッジが最適化され、次いで、Crefinedがこれらのエッジを含むように更新され、経路τがGから除去される。このプロセスは、全経路がCrefinedに対して個別に最適化されるか、又はG内のエッジの数が最大限度になるまで、G内に残っている各経路に対して繰り返され、その時点で、G内のあらゆる残りの経路が単一のILP問題で互いに最適化される。交差する経路の個々のサブクラスタから構築されたグラフ内のエッジの数が最大限度を超える場合、ILPは進行せず、Crefinedからの経路のみが解に保持される。
Graph Size Limits Although steps are included to reduce the complexity of ILP problems, in some scenarios the graph is too large to be solved in a reasonable time. To address this bottleneck, the total number of edges in the graph is limited. By default, the maximum number of edges allowed in an ILP problem is 1200, but this can be set to any number greater than 50. During any iteration, if the number of edges in the graph G exceeds a maximum limit, the graph is divided into a series of subclusters where the ILP problem is solved individually. Starting from the path with the fewest edges (fewest repeated k-mers), an individual graph is constructed from each path τ in G and only the paths in C refined that intersect it. The allowed edges within this subcluster of G are then optimized using ILP, and then C refined is updated to include these edges and the path τ is removed from G. This process is repeated for each remaining path in G until either all paths are individually optimized for C refined , or the number of edges in G is maximized, at which point , all remaining paths in G are mutually optimized in a single ILP problem. If the number of edges in the graph constructed from individual subclusters of intersecting paths exceeds the maximum limit, ILP does not proceed and only paths from C_refined are kept in the solution.

配列の伸長された5’及び3’領域内のモチーフの発見
LncLOOMへの入力は、5’又は3’が不完全な配列を時折含み得る。データセットは相同性によって順序付けられ、完全性ではないため、これらの配列はグラフ内のいずれかの層に見出され得、これらの領域内のノードの層ごとの連結を妨げる可能性がある。このシナリオで、保存されたモチーフが失われる可能性を低減するために、モチーフ発見は3段階で行われる。第1の段階では、LncLOOMは、データセット内の全配列(Dsequenceの合計)上に構築された一次グラフからモチーフを同定する。次いで、LncLOOMは、全配列にわたる中央位置に対する各配列内の第1のモチーフ及び最終モチーフの位置を考慮することによって、どの配列が潜在的に伸長された5’又は3’末端を有するかを決定する(図13A)。これに基づいて、LncLOOMは、データセット内のさらに完全な配列の伸長された5’及び3’領域の個々のグラフを構築し、解く。5’伸長グラフを構築するために、LncLOOMは、各層L~L内の第1のノード
Finding Motifs within Extended 5' and 3' Regions of Sequences The input to LncLOOM may occasionally contain 5' or 3' incomplete sequences. Because the dataset is ordered by homology and not completeness, these sequences can be found in any layer in the graph, potentially preventing layer-by-layer connection of nodes within these regions. In this scenario, motif discovery is performed in three stages to reduce the possibility of losing conserved motifs. In the first stage, LncLOOM identifies motifs from a primary graph built over all sequences (sum of Dsequences) in the dataset. LncLOOM then determines which sequences potentially have extended 5' or 3' ends by considering the position of the first and final motif within each sequence relative to the central position across the entire sequence. (Figure 13A). Based on this, LncLOOM constructs and solves individual graphs of the extended 5' and 3' regions of the more complete sequences in the dataset. To construct the 5' elongated graph, LncLOOM selects the first node in each layer L 1 to L D

の開始位置の中央位置Mをまず計算する。次いで、q>t・Mの場合、ノードW={v|n+k-1<q}のサブセットが各層Lから抽出され、ここで、tはユーザによって定義されたいくらかの許容誤差である。伸長3’グラフのノードは、各配列の長さに対する最終モチーフの終了位置に基づいて抽出される。具体的には、LncLOOMは、各層L~L内の最終ノード First, calculate the center position Mq of the starting position. Then, a subset of nodes W ={v n |n+k−1<q i } is extracted from each layer L i if q i >t·M q , where t is some tolerance defined by the user. It is. The nodes of the extended 3' graph are extracted based on the ending position of the final motif relative to the length of each sequence. Specifically, LncLOOM is the final node in each layer L 1 to L D

の終了位置の中央相対位置MReを計算し、ここで、 Calculate the median relative position M Re of the end position of , where:

である。次いで、Re<MRe・(1+t)の場合、ノードW={v|n<r+k-1}のサブセットが各層Lから抽出される。デフォルトでは、5’及び3’の両グラフの抽出についてはt=0.5であるが、各グラフに対して許容誤差を独立して定義することができる。モチーフ発見のこの工程は、アンカー配列の伸長された領域からのノードがグラフに含まれている場合にのみ進行する。例えば、5’末端の近くに見出されるモチーフが最初の2つの層内でのみ保存されているために、浅く保存されたモチーフがさらに深い層内での5’又は3’切断の同定を妨げるシナリオを回避するために、「最小深度」パラメータを適用して、指定された深度まで保存されたモチーフのサブセットから各配列内の第1のモチーフ及び最終モチーフの位置を選択することができる。最小深度パラメータが適用される場合、指定された深度要件を満たさないあらゆるモチーフも解から除去される。 It is. Then, if Re i <M Re ·(1+t), a subset of nodes W={v n |n<r i +k−1} is extracted from each layer L i . By default, t=0.5 for both 5' and 3' graph extraction, but the tolerance can be defined independently for each graph. This step of motif discovery only proceeds if the graph contains nodes from the extended region of the anchor sequence. For example, a scenario in which shallowly conserved motifs prevent the identification of 5' or 3' truncations within deeper layers, because motifs found near the 5' end are conserved only within the first two layers. To avoid this, a "minimum depth" parameter can be applied to select the positions of the first motif and the final motif within each sequence from a subset of motifs that are conserved to a specified depth. If a minimum depth parameter is applied, any motifs that do not meet the specified depth requirement are also removed from the solution.

モチーフモジュール及び近傍の計算
フレームワーク内のあらゆるサブグラフについてILP問題が解かれると、一次グラフ、5’伸長グラフ及び3’伸長グラフから選択された非交差経路の各セットは、モチーフモジュール及び近傍に処理される。モチーフモジュールは、配列のセット内に保存されている少なくとも2つの固有のモチーフの順序付きの組合せとして定義され、ここで、各モチーフは、いずれかの数のタンデム繰返しを有することができる。デフォルトでは、モジュールは、LからLまでの全層にまたがる経路を抽出することによって、グラフのあらゆる層、L|2≦i≦Dで計算される。パラメータに最小深度dが指定されている場合、モジュールはあらゆる層L|d≦i≦Dで計算される。上記のように、モチーフ発見は、層ごとの除外の反復プロセスによって行われる。これにより、より密接に関連する配列を含むように配列のセットが連続的に減少するにつれて、より長い同一性領域が選択される。その結果、より深く保存されたより短いモチーフは、最上層間でのみ保存されたより長いモチーフに埋め込まれることが多い(図13B)。本発明者らは、グラフ内のこれらの領域をモチーフ近傍として定義し、ここで、各近傍は、各層内の各ノードの隣接領域とともに、Lの重複するノードの単一領域に連結された、グラフ内の全ノードを含む。モチーフ近傍を計算するために、LncLOOMは、L内のあらゆる重複するノードを最初に組み合わせて、各近傍を表す参照k量体のセットを形成する。各参照k量体について、参照k量体内に埋め込まれている各より短いk量体に連結されている全経路が、その近傍に含まれる。各層内の各モチーフについて、参照k量体内のモチーフの位置に対して、隣接領域の長さが計算される(図13B)。一次グラフ、5’伸長グラフ及び3’伸長グラフの各々からのモチーフモジュール及び近傍は、HTML及びプレーンテキストファイルフォーマットで提示される。
Calculation of Motif Modules and Neighborhoods Once the ILP problem is solved for every subgraph in the framework, each set of non-intersecting paths selected from the linear, 5' elongated, and 3' elongated graphs is processed into motif modules and neighborhoods. be done. A motif module is defined as an ordered combination of at least two unique motifs conserved within a set of sequences, where each motif can have any number of tandem repeats. By default, the module is computed at every layer of the graph, L i |2≦i≦D, by extracting paths that span all layers from L 1 to L i . If a minimum depth d is specified in the parameters, the module is computed for every layer L i |d≦i≦D. As mentioned above, motif discovery is performed by an iterative process of layer-by-layer exclusion. This selects for longer regions of identity as the set of sequences is successively reduced to include more closely related sequences. As a result, shorter motifs that are more deeply conserved are often embedded in longer motifs that are conserved only among the top layers (Fig. 13B). We define these regions in the graph as motif neighborhoods, where each neighborhood, along with the neighboring regions of each node in each layer, is connected to a single region of L 1 overlapping nodes. , including all nodes in the graph. To compute motif neighborhoods, LncLOOM first combines every overlapping node in L 1 to form a set of reference k-mers representing each neighborhood. For each reference k-mer, all paths connected to each shorter k-mer embedded within the reference k-mer are included in its neighborhood. For each motif within each layer, the length of the flanking region is calculated relative to the motif's position within the reference k-mer (FIG. 13B). Motif modules and neighborhoods from each of the primary, 5' elongated, and 3' elongated graphs are presented in HTML and plain text file formats.

モチーフ有意性の計算
モチーフ有意性は、ランダムデータセットの2つのジャンル内の各モチーフの経験的p値を計算することによって推測される。第1に、Lに保存された長さkのモチーフについて、本発明者らは、入力配列内に観察される連続する層の間で同じパーセンテージ同一性を有するランダム配列のセットのL内で少なくとも1回、実際のデータセット、及び同じ長さ又はそれ以上の同じ数のいずれかのモチーフのいずれかの組合せに見出される正確なモチーフを見出す経験的確率を決定する。これは、入力配列のMSAを生成するためにMAFFTを使用し、次いで、MSAの列がランダムにシャッフルされるLncLOOM反復の複数の反復(この原稿に記載されている分析については100)を実行することによって達成される。第2に、本発明者らは、各層が入力配列内の対応する層の同じ長さ及び同じジヌクレオチド組成を有するように生成されたランダム配列のセットのL内で少なくとも1回、正確なモチーフ、及び同じ長さの同じ数のいずれかのモチーフのいずれかの組合せを見出す経験的確率を決定する(ただし、層の間の%同一性を保存しない)。この原稿に記載されている分析では、前者のP値のみを使用した。反復を並列に実行するために、マルチプロセッシングが実施されている。
Calculating Motif Significance Motif significance is inferred by calculating the empirical p-value of each motif within the two genres of the random data set. First, for a motif of length k conserved in Li , we find that within Li a set of random sequences with the same percentage identity between successive layers observed in the input sequence. Determine the empirical probability of finding the exact motif found at least once in any combination of the actual data set and any motifs of the same length or greater and the same number. It uses MAFFT to generate the MSAs of the input array, then performs multiple iterations (100 for the analysis described in this manuscript) of LncLOOM iterations in which the columns of the MSA are randomly shuffled. This is achieved by Second, we determined that the exact Determine the empirical probability of finding any combination of a motif and any motif of the same number of the same length (but not preserving the % identity between layers). Only the former P value was used in the analyzes described in this manuscript. Multiprocessing is implemented to perform iterations in parallel.

モチーフの機能的アノテーション
LncLOOMは、2つの所望により存在するアノテーション機能を有する。第1に、発見されたモチーフは、保存された(哺乳動物全体にわたって保存された)miRNA及び広く保存された(脊椎動物全体にわたって典型的に見出される)miRNAのシード領域との完全な塩基対合をTargetScanから同定することによって、miRNAの結合部位にマッピングされうる。各モチーフについて、対合のタイプ(6量体、7量体、7量体-A1、7量体-M8、又は8量体)は、モチーフの両側から直接隣接する塩基とモチーフを一緒に考慮することによって、各配列において決定される。完全なシード領域(6量体)がモチーフと直接一致する場合にのみ一致が見出される。第2に、HepG2又はK562細胞株内で発現される遺伝子に見られるモチーフも、ENCODEプロジェクトにおいてeCLIPによって同定されたRBPの結合部位にマッピングされうる。選択されたクエリ配列内の各モチーフの染色体座標を決定するために、LncLOOMは、BLAT(Kent,2002)を使用して配列をゲノムにアライメントし、次いで、pyBigWigパッケージを使用してENCODE bigBedファイルから抽出された、RBPの結合部位の座標との重複を計算する。あるいは、ユーザは、クエリ配列内の各エクソンの染色体座標及び長さを指定するベッドファイルをアップロードすることもできる。抽出されたeCLIPデータは、モック入力を超えてエンリッチメント<2のあらゆるピークを除外するようにフィルタリングされる。アンカー配列の大部分に結合するRBPは、それらの結合ピークといずれかの保存されたモチーフとの重複がその特定のモチーフに機能的に関連する可能性が低いため、マークされる。
Functional Annotation of Motifs LncLOOM has two optional annotation functions. First, the discovered motifs ensure perfect base pairing with the seed region of conserved (conserved across mammals) and widely conserved (typically found across vertebrates) miRNAs. can be mapped to the binding site of miRNA by identifying it from TargetScan. For each motif, the type of pairing (hexamer, heptamer, heptamer-A1, heptamer-M8, or octamer) considers the motif together with the immediately adjacent bases from both sides of the motif. is determined for each sequence by A match is only found if the complete seed region (hexamer) matches the motif directly. Second, motifs found in genes expressed in HepG2 or K562 cell lines can also be mapped to RBP binding sites identified by eCLIP in the ENCODE project. To determine the chromosomal coordinates of each motif within the selected query sequence, LncLOOM aligns the sequences to the genome using BLAT (Kent, 2002) and then extracts the chromosomal coordinates from the ENCODE bigBed file using the pyBigWig package. The overlap with the extracted coordinates of the binding site of RBP is calculated. Alternatively, the user can upload a bed file that specifies the chromosomal coordinates and length of each exon within the query sequence. The extracted eCLIP data is filtered to exclude any peaks with enrichment <2 beyond the mock input. RBPs that bind to a large portion of the anchor sequence are marked because the overlap of their binding peak with any conserved motif is unlikely to be functionally related to that particular motif.

LncLOOMの実施及び可用性
networkxパッケージを使用してグラフ構築が行われる。整数計画問題は、PuLPを使用してモデル化され、オープンソースのCOIN-OR Branch-及び-Cutソルバ(CBC)(www(dot)coin-or(dot)org/)又は市販のGurobiソルバ(www(dot)gurobi(dot)com/)のいずれかによって解かれる。LncLOOMは、グラフ構築、モチーフアノテーション、及びモチーフ有意性の経験的評価中に、以下のアライメントプログラム、すなわち、BLAST、BLAT及びMAFFTを利用する。統計的反復を並列に計算するためにマルチプロセッシングパイソンパッケージが使用される。
LncLOOM Implementation and Availability Graph construction is performed using the networkx package. The integer programming problem was modeled using PuLP and either the open source COIN-OR Branch-and-Cut solver (CBC) (www(dot)coin-or(dot)org/) or the commercially available Gurobi solver (www (dot) gurobi (dot) com/). LncLOOM utilizes the following alignment programs: BLAST, BLAT and MAFFT during graph construction, motif annotation, and empirical evaluation of motif significance. A multiprocessing Python package is used to compute statistical iterations in parallel.

モチーフエンリッチメントの計算
配列内の特定のモチーフのエンリッチメントを評価するために、本発明者らは、入力配列のジヌクレオチド組成と一致するランダム配列の1,000セットを生成し、モチーフの出現をカウントして、モチーフの予測される数と、経験的p値とを計算した。
Calculation of Motif Enrichment To assess the enrichment of a particular motif within a sequence, we generated 1,000 sets of random sequences that matched the dinucleotide composition of the input sequence and calculated the occurrence of motifs. The expected number of motifs and empirical p-values were calculated by counting.

lncRNA及び3’UTRのLncLOOM分析
LncLOOMを使用して、18種からのCyrano配列、8種からのlibra(哺乳動物ではNrep)、16種からのChaserr配列、12種からのDICER1配列、並びに16種からのPUM1配列及びPUM2配列を分析した。全遺伝子について、15~6塩基長のk量体を検索するようにLncLOOMパラメータを設定し、各々の場合にアンカー配列として定義されるヒト配列を用いてBLASTによって配列を再順序付けした。HSPの制約は課さなかった。モチーフ有意性を100回の反復にわたって計算した。LncLOOMフレームワークにおける表現としての各遺伝子の配列の順序を表1に示す。
LncLOOM analysis of lncRNA and 3'UTR Using LncLOOM, Cyrano sequences from 18 species, libra (Nrep in mammals) from 8 species, Chaserr sequences from 16 species, DICER1 sequences from 12 species, and analyzed the PUM1 and PUM2 sequences from. For all genes, the LncLOOM parameters were set to search for k-mers of 15-6 bases in length, and the sequences were reordered by BLAST with the human sequence defined as the anchor sequence in each case. No HSP restrictions were imposed. Motif significance was calculated over 100 iterations. Table 1 shows the sequence order of each gene as represented in the LncLOOM framework.

また、2,439個の3’UTR遺伝子を分析するためにLncLOOMを使用した。TargetScan7.2 miRNA標的部位予測スイート10によって生成された3’UTR MSAからデータセットを構築し、データセットは、300~3,000ntであった、ヒト、マウス、イヌ及びニワトリの配列を含んでいた。可用性及び長さ(>200塩基)に応じて、カエル、サメ、ゼブラフィッシュ、ガー及びヤツメウナギ、シオアン(cioan)及びハエ由来の配列をEnsemblから入手し、それらのそれぞれの遺伝子データセットに加えた。各データセットについて、BLASTNを0.05のカットオフE値で使用して、それぞれの種の各々のどの配列がそれらのヒトオルソログに対する検出可能なアライメントを有しなかったか、並びにマウス、イヌ及びニワトリにもアライメントしなかった配列を分類する。LncLOOMによって同定されたk量体を、TargetScanHumanがhsa-miRNAを報告した広く保存されたmiRNAファミリーのシードに適合させた。LncLOOMの感度を評価するために、LncLOOMによって同定された広く保存されたmiRNA結合部位と、TargetScan(www(dot)targetscan(dot)org/cgi-bin/targetscan/data_download.vert72.cgi)によって報告された予測とを比較した。具体的には、本発明者らは、TargetScanが本LncLOOMデータセット内で使用される同一の代表的なヒト転写物における部位を報告した遺伝子由来のmiRNA部位のみを比較した。合計で、これは2,439個の遺伝子のうち2,359個に相当した。 Also, LncLOOM was used to analyze 2,439 3'UTR genes. The dataset was constructed from 3'UTR MSA generated by TargetScan7.2 miRNA Target Site Prediction Suite 10 and included human, mouse, dog and chicken sequences that were between 300 and 3,000 nt. . Depending on availability and length (>200 bases), sequences from frog, shark, zebrafish, gar and lamprey, cioan and fly were obtained from Ensembl and added to their respective genetic datasets. For each dataset, we used BLASTN with a cutoff E value of 0.05 to determine which sequences in each of each species had no detectable alignment to their human orthologs, as well as mouse, dog, and chicken. Also classify sequences that were not aligned. The k-mers identified by LncLOOM were matched to the seeds of a widely conserved miRNA family for which TargetScanHuman reported hsa-miRNA. To evaluate the sensitivity of LNCLOOM, to evaluate the sensitivity of LNCLOOM, the widely preserved MIRNA binding site identified by LNCLOOM and TARGETSCAN (WWW (DOT) TargetScan (DOT) ORG / CGI -BIN / TARGETSCAN / DATA / DATA / DATA Reported by _download. vert72.cgi) The results were compared with the predictions. Specifically, we only compared miRNA sites from genes for which TargetScan reported sites in the same representative human transcripts used within the present LncLOOM dataset. In total, this represented 2,359 out of 2,439 genes.

組織培養
10%ウシ胎児血清と100Uペニシリン/0.1mg ml-1ストレプトマイシンとを含有するDMEM中、37℃、5%COの加湿インキュベーター内で、Neuro2a細胞(ATCC)を常用的に培養した。細胞はマイコプラズマ汚染について常用的に試験し、検証(authenticate)はしなかった。
Tissue Culture Neuro2a cells (ATCC) were routinely cultured in DMEM containing 10% fetal bovine serum and 100 U penicillin/0.1 mg ml −1 streptomycin in a humidified incubator at 37° C. and 5% CO 2 . Cells were routinely tested and not authenticated for mycoplasma contamination.

質量分析試料調製
以前に記載されたように47、懸濁液トラッピング(suspension trapping)(S-trap)を使用して試料を溶液中トリプシン消化に供した。要約すると、50mM Tris-HCl中の5%SDSを使用して、ビーズからプルダウンタンパク質を溶出した。溶出したタンパク質を5mMジチオスレイトールを用いて還元し、暗所で10mMヨードアセトアミドを用いてアルキル化した。製造業者の指示に従って、各試料をS-Trapマイクロカラム(Protifi,USA)にロードした。ロード後、90:10%メタノール/50mM重炭酸アンモニウムを用いて試料を洗浄した。次いで、47℃で1.5時間かけてトリプシンを用いて試料を消化した。50mM重炭酸アンモニウムを使用して、消化されたペプチドを溶出した。トリプシンをこの画分に加え、37℃で一晩インキュベートした。0.2%ギ酸と50%アセトニトリル中0.2%ギ酸とを使用して、さらに2回の溶出を行った。3つの溶出液を一緒にプールし、真空遠心分離して乾燥させた。さらに分析するまで試料を-80℃に保った。
Mass Spectrometry Sample Preparation Samples were subjected to in-solution trypsin digestion using suspension trapping (S-trap) as previously described 47 . Briefly, pull-down proteins were eluted from beads using 5% SDS in 50mM Tris-HCl. Eluted proteins were reduced with 5mM dithiothreitol and alkylated with 10mM iodoacetamide in the dark. Each sample was loaded onto an S-Trap microcolumn (Protifi, USA) according to the manufacturer's instructions. After loading, samples were washed with 90:10% methanol/50mM ammonium bicarbonate. Samples were then digested with trypsin for 1.5 hours at 47°C. Digested peptides were eluted using 50mM ammonium bicarbonate. Trypsin was added to this fraction and incubated overnight at 37°C. Two further elutions were performed using 0.2% formic acid and 0.2% formic acid in 50% acetonitrile. The three eluates were pooled together and vacuum centrifuged to dryness. Samples were kept at -80°C until further analysis.

液体クロマトグラフィー
全クロマトグラフィー工程にULC/MSグレードの溶媒を使用した。乾燥消化試料を97:3%HO/アセトニトリル+0.1%ギ酸に溶解した。スプリットレスナノ-Ultra Performance Liquid Chromatography(10kpsi nanoAcquity;Waters,Milford,MA,USA)を使用して各試料をロードした。移動相は、A)HO+0.1%ギ酸、及びB)アセトニトリル+0.1%ギ酸であった。逆相Symmetry C18トラッピングカラム(内径180μm、長さ20mm、粒径5μm;Waters)を使用して、試料の脱塩をオンラインで行った。次いで、T3 HSSナノカラム(内径75μm、長さ250mm、粒径1.8μm;Waters)を0.35μL/分で使用して、ペプチドを分離した。以下の勾配を使用して、ペプチドをカラムから質量分析計に溶出した:55分で4%から30%B、5分で30%から90%B、5分間90%に維持し、次いで、初期条件に戻した。
Liquid Chromatography ULC/MS grade solvents were used for all chromatography steps. The dried digested sample was dissolved in 97:3% H 2 O/acetonitrile + 0.1% formic acid. Each sample was loaded using a splitless nano-Ultra Performance Liquid Chromatography (10 kpsi nanoAcquity; Waters, Milford, Mass., USA). Mobile phases were A) H 2 O + 0.1% formic acid, and B) acetonitrile + 0.1% formic acid. Desalting of the samples was performed online using a reverse phase Symmetry C18 trapping column (180 μm inner diameter, 20 mm length, 5 μm particle size; Waters). Peptides were then separated using a T3 HSS nanocolumn (75 μm inner diameter, 250 mm length, 1.8 μm particle size; Waters) at 0.35 μL/min. Peptides were eluted from the column into the mass spectrometer using the following gradient: 4% to 30% B in 55 min, 30% to 90% B in 5 min, held at 90% for 5 min, then initial Returned to condition.

質量分析
FlexIonナノスプレー装置(Proxeon)を使用して、nanoESIエミッター(10μmチップ;New Objective;Woburn,MA,USA)を介して四重極オービトラップ質量分析計(Q Exactive HF、Thermo Scientific)にnanoUPLCをオンラインで結合した。
Mass spectrometry A FlexIon nanospray device (Proxeon) was used to transfer nano to a quadrupole orbitrap mass spectrometer (Q Exactive HF, Thermo Scientific) via a nanoESI emitter (10 μm tip; New Objective; Woburn, MA, USA). UPLC were combined online.

Top10法を使用して、データ依存型取得(DDA)モードでデータを取得した。MS1分解能を120,000(200m/z)、質量範囲を375~1650m/z、AGCを3e6に設定し、最大注入時間を60ミリ秒に設定した。MS2分解能を15,000、四重極単離を1.7m/z、AGCを1e5、ダイナミックエクスクルージョンを20秒、最大注入時間を60ミリ秒に設定した。 Data were acquired using the Top 10 method in data-dependent acquisition (DDA) mode. MS1 resolution was set to 120,000 (200 m/z), mass range was set to 375-1650 m/z, AGC was set to 3e6, and maximum injection time was set to 60 ms. MS2 resolution was set to 15,000, quadrupole isolation to 1.7 m/z, AGC to 1e5, dynamic exclusion to 20 seconds, and maximum injection time to 60 ms.

質量分析データの処理及び分析
MaxQuant v1.6.6.0を用いて生データを処理した。Uniprot(www(dot)uniprot(dot)com)からダウンロードしたマウス(マウス(Mus musculus))タンパク質データベースに対してAndromeda検索エンジンを用いてデータを検索し、一般的な実験タンパク質汚染物質を付加(append)した。酵素特異性をトリプシンに設定し、最大2回の切断ミスを許容した。固定修飾をシステインのカルバミドメチル化に設定し、可変修飾をメチオニンの酸化、及びタンパク質N末端アセチル化に設定した。ペプチド前駆体イオンを4.5ppmの最大質量偏差で、フラグメントイオンを20ppmの最大質量偏差で検索した。デコイデータベース戦略(MaxQuantの「Revert」モジュール)を使用して、ペプチド及びタンパク質の同定を1%のFDRでフィルタリングした。最小ペプチド長は7アミノ酸であり、修飾ペプチドの最小Andromedaスコアは40であった。実行間の一致オプションをチェックして、ペプチド同定を試料全体にわたって反映させた。無標識定量オプションを選択して検索を行った。Perseus v1.6.0.7を使用して定量的比較を計算した。デコイヒットを除外した。対数変換後にスチューデントのt検定を使用して、生物学的レプリカにわたる実験群間の有意差を識別した。異なる実験群の幾何平均の比に基づいて倍率変化を計算した。
Mass spectrometry data processing and analysis Raw data were processed using MaxQuant v1.6.6.0. Data were searched using the Andromeda search engine against the mouse (Mus musculus) protein database downloaded from Uniprot (www(dot)uniprot(dot)com) and appended with common experimental protein contaminants. )did. Enzyme specificity was set to trypsin and a maximum of two missed cleavages were allowed. Fixed modifications were set to carbamidomethylation of cysteine, and variable modifications were set to oxidation of methionine and protein N-terminal acetylation. Peptide precursor ions were searched with a maximum mass deviation of 4.5 ppm and fragment ions with a maximum mass deviation of 20 ppm. Peptide and protein identifications were filtered at 1% FDR using a decoy database strategy (MaxQuant's "Revert" module). The minimum peptide length was 7 amino acids and the minimum Andromeda score of the modified peptide was 40. The run-to-run match option was checked to ensure that peptide identifications were reflected across samples. The search was performed with the label-free quantitation option selected. Quantitative comparisons were calculated using Perseus v1.6.0.7. Excludes decoy hits. Student's t-test was used after logarithmic transformation to identify significant differences between experimental groups across biological replicas. The fold change was calculated based on the ratio of the geometric means of different experimental groups.

RNA-プルダウンアッセイ
合成オリゴ(Twist Bioscience)を増幅し、T7プロモーターをセンス配列では5’末端に、アンチセンス対照配列(完全な配列については表2を参照)では3’末端に付加することによって、インビトロ転写のための鋳型を生成した。MEGAscript T7インビトロ転写反応キット(Ambion)及びビオチンRNA標識混合物(Roche)を使用して、ビオチン化転写物を生成した。DNaseI(Quanta)を用いて処理することによって、鋳型DNAを除去した。Neuro2a細胞(ATCC)を、プロテアーゼ阻害剤カクテル(Sigma-Aldrich、#P8340)+100U/ml RNase阻害剤(#E4210-01)と1mM DTTとを補充したRIPAを用いて氷上で15分間かけて溶解した。溶解物を21130×gで20分間にわたる4℃での遠心分離によって清澄化した。ストレプトアビジン磁気ビーズ(NEB #S1420S)を緩衝液A(NaOH 0.1M及びNaCl 0.05M)で2回洗浄し、緩衝液B(NaCl 0.05M)で1回洗浄し、次いで、結合/洗浄の2本のチューブ内で再懸濁した(PI+100U/ml RNase阻害剤と1mM DTTとを含むNaCl 1M、5mM Tris-HCl pH7.5及び0.5mM EDTA補足物質)。ビーズの1本のチューブを、PI及びDTT 1mMを補充したRIPA中で3回洗浄し、その後、細胞溶解物を加え、4℃で30分間上方に回転させて事前に清澄化した。第2のチューブを各RNAプローブの個々のチューブに等しく分割した。次いで、2~10pmolのビオチン化転写物をそれぞれのチューブに加え、4℃で30分間上方に回転させた。次いで、ビーズを結合/洗浄緩衝液で3回洗浄し、その後、等量の事前に清澄化された細胞溶解物をビーズ及びRNAプローブの各試料に加えた。次いで、試料を4℃で30分間上方に回転させた。回転後、ビーズを高塩CEB(10mM HEPES pH7.5、3mM MgCl、250mM NaCl、1mM DTT及び10%グリセロール)を用いて3回洗浄した。次いで、室温で10分間かけて、50mM Tris pH7.4中の5%SDS中でタンパク質をビーズから溶出した。
RNA-pulldown assay By amplifying synthetic oligos (Twist Bioscience) and adding the T7 promoter to the 5' end for the sense sequence and to the 3' end for the antisense control sequence (see Table 2 for complete sequence). Templates for in vitro transcription were generated. Biotinylated transcripts were generated using the MEGAscript T7 in vitro transcription reaction kit (Ambion) and biotin RNA labeling mixture (Roche). Template DNA was removed by treatment with DNase I (Quanta). Neuro2a cells (ATCC) were lysed using RIPA supplemented with protease inhibitor cocktail (Sigma-Aldrich, #P8340) + 100U/ml RNase inhibitor (#E4210-01) and 1mM DTT for 15 minutes on ice. . The lysate was clarified by centrifugation at 21,130 xg for 20 minutes at 4°C. Streptavidin magnetic beads (NEB #S1420S) were washed twice with buffer A (NaOH 0.1M and NaCl 0.05M) and once with buffer B (NaCl 0.05M), then binding/washing. (NaCl 1M with PI+100U/ml RNase inhibitor and 1mM DTT, 5mM Tris-HCl pH 7.5 and 0.5mM EDTA supplement). One tube of beads was washed three times in RIPA supplemented with PI and DTT 1 mM, then the cell lysate was added and pre-clarified by upward rotation for 30 min at 4°C. The second tube was divided equally into individual tubes for each RNA probe. 2-10 pmol of biotinylated transcript was then added to each tube and rotated upwards for 30 minutes at 4°C. The beads were then washed three times with binding/wash buffer, after which equal volumes of pre-clarified cell lysate were added to each sample of beads and RNA probes. The sample was then rotated upwards for 30 minutes at 4°C. After spinning, the beads were washed three times with high salt CEB (10mM HEPES pH 7.5, 3mM MgCl2 , 250mM NaCl, 1mM DTT and 10% glycerol). Proteins were then eluted from the beads in 5% SDS in 50 mM Tris pH 7.4 for 10 minutes at room temperature.

アンチセンスオリゴヌクレオチド及びLNA GapmeRトランスフェクション
マウスChaserrの最終エクソンでLncLOOMによって同定された保存されたATGG部位を標的とするように、ASO(Integrated DNA Technologies)を設計した(図8A)。全ASOを2’-O-メトキシ-エチル塩基によって修飾した。Chaserrイントロンを標的とするLNAギャップマー(Qiagen)をChaserrノックダウンに使用した(完全なオリゴ配列については表3を参照)。トランスフェクション:2×10個のNeuro2A細胞を6ウェルプレートに播種し、LNA1~4の混合物を用いて、若しくはASO1、ASO2、ASO3を用いて、又はASO1とASO3との混合物、若しくはASO1~3の混合物を用いて、25nMの最終濃度まで、製造業者のプロトコルに従ってリポフェクタミン3000(Life Technologies、L3000-008)を使用してトランスフェクトした。全実験の終了点はトランスフェクションの48時間後であり、その後、RNA抽出、及びRT-qPCR分析による評価のために、TRIZOLを用いて細胞を回収した。
Antisense Oligonucleotides and LNA GapmeR Transfection ASO (Integrated DNA Technologies) was designed to target the conserved ATGG site identified by LncLOOM in the final exon of mouse Chaser (Figure 8A). All ASOs were modified with 2'-O-methoxy-ethyl base. LNA gapmers (Qiagen) targeting the Chaserr intron were used for Chaserr knockdown (see Table 3 for complete oligo sequences). Transfection: 2 x 10 Neuro2A cells were seeded in a 6-well plate with a mixture of LNA1-4, or with ASO1, ASO2, ASO3, or with a mixture of ASO1 and ASO3, or ASO1-3. was transfected using Lipofectamine 3000 (Life Technologies, L3000-008) according to the manufacturer's protocol to a final concentration of 25 nM. The end point for all experiments was 48 hours after transfection, after which cells were harvested using TRIZOL for RNA extraction and evaluation by RT-qPCR analysis.

RNA免疫沈降(RIP)
Neuro2a細胞(ATCC)を回収し、94×gで5分間、4℃で遠心分離し、リボヌクレアーゼ阻害剤(100U/mL、#E4210-01)とプロテアーゼ阻害剤カクテル(Sigma-Aldrich、#P8340)とを補充した氷冷リン酸緩衝生理食塩水(PBS)を用いて2回洗浄した。次に、氷上で10分間かけて、1mLの溶解緩衝液(プロテアーゼ阻害剤カクテル+100U/ml RNase阻害剤と1mM DTTとを補充した5mM PIPES、200mM KCl、1mM CaCl、1.5mM MgCl、5%スクロース、0.5%NP-40)中で細胞を溶解した。溶解物を1秒間ON、30秒間OFFで30%振幅で3回超音波処理し(Vibra-cell VCX-130)、続いて、21130×gで10分間4℃で遠心分離した。次いで、上清を新しい2mLチューブに移し、1mLのIP結合/洗浄緩衝液(プロテアーゼ阻害剤カクテル+100U/ml RNase阻害剤と0.25mM DTTとを補充した150mM KCl、25mM Tris(pH7.5)、5mM EDTA、0.5%NP-40)を補充した。次いで、反応1回当たり5μgの抗体を用いて、試料を4℃で2~4時間回転させた。反応1回当たり50μlのビーズGenScript A/Gビーズ(#L00277)をIP結合/洗浄緩衝液を用いて3回洗浄し、続いて、溶解物に加えて一晩回転させながらインキュベートした。インキュベーション後、ビーズをIP結合/洗浄緩衝液で3回洗浄した。各試料の10%を回収し、ウエスタンブロットによるその後の分析のために95℃で5分間煮沸した。RNA抽出、及びRT-qPCR分析による評価のために、残りのビーズを0.5mLのTRIZOLに再懸濁し、免疫沈降材料を細胞溶解物全体に対して正規化した。
RNA immunoprecipitation (RIP)
Neuro2a cells (ATCC) were collected, centrifuged at 94 × g for 5 min at 4 °C, and treated with ribonuclease inhibitor (100 U/mL, #E4210-01) and protease inhibitor cocktail (Sigma-Aldrich, #P8340). The cells were washed twice with ice-cold phosphate-buffered saline (PBS) supplemented with Next, add 1 mL of lysis buffer (protease inhibitor cocktail + 5 mM PIPES, 200 mM KCl, 1 mM CaCl 2 , 1.5 mM MgCl 2 , 5 mM PIPES supplemented with 100 U/ml RNase inhibitor and 1 mM DTT for 10 min on ice) . % sucrose, 0.5% NP-40). Lysates were sonicated three times at 30% amplitude with 1 s ON and 30 s OFF (Vibra-cell VCX-130), followed by centrifugation at 21,130 xg for 10 min at 4°C. The supernatant was then transferred to a new 2 mL tube and 1 mL of IP binding/wash buffer (protease inhibitor cocktail + 150 mM KCl, 25 mM Tris (pH 7.5) supplemented with 100 U/ml RNase inhibitor and 0.25 mM DTT; 5mM EDTA, 0.5% NP-40). Samples were then rotated for 2-4 hours at 4° C. using 5 μg of antibody per reaction. 50 μl of beads per reaction GenScript A/G beads (#L00277) were washed three times with IP binding/wash buffer and then added to the lysate and incubated overnight with rotation. After incubation, beads were washed three times with IP binding/wash buffer. 10% of each sample was collected and boiled for 5 minutes at 95°C for subsequent analysis by Western blot. For RNA extraction and evaluation by RT-qPCR analysis, the remaining beads were resuspended in 0.5 mL of TRIZOL and the immunoprecipitated material was normalized to the total cell lysate.

ウエスタンブロット
RIPから収集したタンパク質試料を8~10%SDS-PAGEゲル上で分離し、ポリフッ化ビニリデン(PVDF)メンブレンに転写した。0.1%Tween-20(PBST)を含むPBS中の5%脱脂乳を用いてブロッキングした後、メンブレンを一次抗体、続いて、西洋ワサビペルオキシダーゼとコンジュゲートした二次抗体とインキュベートした。Image Labソフトウェアを用いてブロットを定量した。一次抗体抗Dhx36(Bethyl、#A300-525A、1:1,000希釈)と、二次抗体抗ウサギ(JIR#111-035、1:10,000希釈)とを使用した。
Western Blot Protein samples collected from RIP were separated on 8-10% SDS-PAGE gels and transferred to polyvinylidene difluoride (PVDF) membranes. After blocking with 5% nonfat milk in PBS containing 0.1% Tween-20 (PBST), membranes were incubated with primary antibodies followed by secondary antibodies conjugated with horseradish peroxidase. Blots were quantified using Image Lab software. Primary antibody anti-Dhx36 (Bethyl, #A300-525A, 1:1,000 dilution) and secondary antibody anti-rabbit (JIR #111-035, 1:10,000 dilution) were used.

qRT-PCR
製造業者のプロトコルに従って、TRIREAGENT(MRC)を使用して、トランスフェクトされたN2a細胞から全RNAを抽出した。ランダムプライマーを用いたqScript Flex cDNA合成キット(95049、Quanta)を使用してcDNAを合成した。Fast SYBR Greenマスターミックス(4385614)をqPCRに使用した。遺伝子発現レベルをハウスキーピング遺伝子Actin及びGapdhに対して正規化した。
qRT-PCR
Total RNA was extracted from transfected N2a cells using TRIREAGENT (MRC) according to the manufacturer's protocol. cDNA was synthesized using the qScript Flex cDNA synthesis kit (95049, Quanta) with random primers. Fast SYBR Green master mix (4385614) was used for qPCR. Gene expression levels were normalized to the housekeeping genes Actin and Gapdh.

実施例1
LncLOOMフレームワーク
LncLOOMは、関心対象のゲノム配列の推定的に相同な配列の集合体を受信する。一実施形態では、lncRNA及び3’UTRに焦点を当てているが、エンハンサーなどの他のエレメントも同様に容易に使用することができる。lncRNAの場合、エクソン配列のみがモチーフ同定のために使用されるが、LncLOOMはエクソン-エクソン接合部の位置を可視化する。入力配列は、種間の進化距離と理想的には一致し、配列類似性に基づいて自動的に設定されうる特定の順序で提供される(図1A)。LncLOOMで使用されるデータ構造及びアルゴリズムの正確な定義は、「材料及び方法」に登場し、フレームワークの概要は、図1A~Bに示されている。LncLOOMは、ネットワークグラフ(図1B)内のノードの「層」としての各RNA配列を表し、各ノードは、短いk量体(例えば、6~15のk)を表す。層の順序は、グラフの第1の層(本明細書に記載の分析ではヒト)に配置されるクエリ配列からの入力配列の進化距離を反映し、他の種からの配列は、グラフの追加の連続層に配置される。グラフ内のエッジは、連続する層内の同一のk量体を有するノード間を連結する。「類似の」k量体を連結することも可能であることが理解される。これらの定義の下で、目的は、互いに交差しない、グラフ内の長い「経路」の組合せを同定し、したがって、様々な配列内で同じ順序を維持する短いモチーフを連結することである。関心対象は、典型的には、最上層に存在するモチーフであるため、経路がその中で始まることが必要条件である。k=1の場合、最長共通部分列問題と同じであるため、そのような経路の最大セットを同定するという問題は計算的に困難であるが、現時点の結果は、整数線形計画法(ILP)を解くという問題に変換することができることを示しており、整数線形計画法(ILP)に対して最適解を見つけることは計算的に困難であるが、効率的なソルバが利用可能である(図1B及び「方法」)。
Example 1
LncLOOM Framework LncLOOM receives a collection of putatively homologous sequences of a genomic sequence of interest. Although one embodiment focuses on lncRNAs and 3'UTRs, other elements such as enhancers can be easily used as well. For lncRNAs, only exon sequences are used for motif identification, but LncLOOM visualizes the location of exon-exon junctions. Input sequences are provided in a specific order that ideally matches the evolutionary distance between species and can be automatically set based on sequence similarity (Fig. 1A). The exact definition of the data structures and algorithms used in LncLOOM appears in "Materials and Methods" and an overview of the framework is shown in Figures 1A-B. LncLOOM represents each RNA sequence as a "layer" of nodes in the network graph (FIG. 1B), where each node represents a short k-mer (eg, k of 6-15). The order of the layers reflects the evolutionary distance of the input sequence from the query sequence, which is placed in the first layer of the graph (human in the analysis described herein), and sequences from other species are added to the graph. arranged in successive layers. Edges in the graph connect nodes with the same k-mer in successive layers. It is understood that it is also possible to link "similar" k-mers. Under these definitions, the goal is to identify combinations of long "paths" within the graph that do not intersect with each other, and thus connect short motifs that maintain the same order within the various sequences. Since the object of interest is typically a motif present in the top layer, it is a requirement that the path begins within it. For k = 1, the problem of identifying the maximal set of such paths is computationally difficult, as it is the same as the longest common subsequence problem, but current results suggest that the integer linear programming (ILP) Although it is computationally difficult to find an optimal solution for integer linear programming (ILP), efficient solvers are available (Fig. 1B and “Method”).

グラフが構築されると、プロセスは、最大k値の経路を同定することから始まり、次いで、これらの経路を使用して(見つかった場合)、さらに小さいkの経路の可能な位置を制約する。この手法は、より長い保存されたエレメントを優先することを可能にするが、有意に保存された短いk量体を同定することも可能にする。あらゆるk値が試験されると、得られたグラフは、モチーフとそれらが保存されている深度との組合せを得るためにマージされる。モチーフ保存の統計的有意性を計算するために、入力配列のMSAが生成され、アライメントカラムがシャッフルされて、入力配列と類似の内部類似性構造を有するランダム配列を導出する。次いで、完全なLncLOOMパイプラインがこれらの配列に適用され、層Dに保存される元の入力配列に見られる各モチーフについて、層Dに保存された正確に同じモチーフ、又は同じ数のその長さのいずれかのモチーフの組合せを同定する経験的確率が適用される。追加のP値は、同じジヌクレオチド組成を有するランダム配列が生成され、配列間類似性構造が保存されていない、それほどストリンジェントでない対照について計算される。 Once the graph is constructed, the process begins by identifying the paths with the largest k values, and then uses these paths (if found) to constrain the possible locations of even smaller k paths. This approach allows favoring longer conserved elements, but also allows identifying short k-mers that are significantly conserved. Once every k value is tested, the resulting graphs are merged to obtain combinations of motifs and the depths at which they are conserved. To calculate the statistical significance of motif conservation, an MSA of the input sequence is generated and alignment columns are shuffled to derive random sequences with similar internal similarity structure to the input sequence. The complete LncLOOM pipeline is then applied to these sequences, and for each motif found in the original input sequence stored in layer D, the exact same motif stored in layer D, or the same number of its length An empirical probability of identifying any combination of motifs is applied. Additional P values are calculated for less stringent controls in which random sequences with the same dinucleotide composition are generated and no intersequence similarity structures are conserved.

リッチHTMLベースのスイートが、例えば、保存の深度に基づいてそれらを色分けし、クエリ配列及び他の配列の両方でモチーフを強調する様々な方法でこれらのモチーフを視覚化するために使用される(LncLOOM出力の例については、図3A~E及び図4を参照)。LncLOOM出力はまた、UCSCゲノムブラウザで見ることができる、クエリ配列内で同定されたモチーフの色分けされたカスタムトラックを含む。モチーフは、保存されたマイクロRNAのシード部位のセット(TargetScanから)と、ENCODEプロジェクトからのeCLIPデータに見出されるRBP結合部位とを使用してアノテーションされる。 A rich HTML-based suite is used to visualize these motifs in various ways, e.g. color-coding them based on depth of conservation and highlighting motifs both in the query sequence and in other sequences ( See Figures 3A-E and Figure 4 for examples of LncLOOM output). The LncLOOM output also includes color-coded custom tracks of motifs identified within the query sequence that can be viewed in the UCSC Genome Browser. Motifs are annotated using a set of conserved microRNA seed sites (from TargetScan) and RBP binding sites found in eCLIP data from the ENCODE project.

実施例2
LncLOOMは、Cyrano lncRNA内の深く保存されたエレメントを同定する
Cyrano lncRNAは、広くかつ高度に発現されるlncRNAである12、13。脊椎動物全体にわたって保存されているにもかかわらず、Cyranoは、エクソン配列長全体で約5倍の変動を示す(メダカの2,340ntからオポッサムの10,155ntまで、図2A)。Cyranoの以前に同定された67ntの高度に拘束されたエレメントは、ゼブラフィッシュ配列とヒト配列とを比較した場合にBLASTが有意な類似性を報告する唯一の領域である。さらに、Cyrano遺伝子座全体は、100ウェイ全ゲノムアライメント(100-way whole genome alignment)(UCSCゲノムブラウザ)では、哺乳動物と魚との間でアライメント不可能である。高度に保存されたエレメントは、CyranoによるmiR-7の分解に必要とされる非常に広範囲に相補的なmiR-7結合部位を含有する。
Example 2
LncLOOM identifies deeply conserved elements within Cyrano lncRNAs Cyrano lncRNAs are widely and highly expressed lncRNAs 12,13 . Despite being conserved across vertebrates, Cyrano exhibits approximately 5-fold variation across exon sequence lengths (from 2,340 nt in medaka to 10,155 nt in opossum, Fig. 2A). Cyrano's previously identified 67 nt highly constrained element is the only region where BLAST reports significant similarity when comparing zebrafish and human sequences. Furthermore, the entire Cyrano locus cannot be aligned between mammals and fish by 100-way whole genome alignment (UCSC Genome Browser). The highly conserved element contains the very extensively complementary miR-7 binding site required for miR-7 degradation by Cyrano.

追加の保存されたエレメントを同定するために、8種の哺乳動物、ニワトリ、X.トロピカリス(X.tropicalis)、7種の脊椎動物魚種、及びゾウザメ(図示せず)を含む、使用可能なRNA-seqデータが位置し得る18種からCyrano配列をキュレートした。LncLOOMは、全種で保存された7つのエレメントと、サメを除く全種で保存された9つのエレメント(図2B)と、哺乳動物全体にわたって保存された37個のモチーフとを同定した。以下の研究は、サメを除く全種で保存された9つのエレメントに焦点を当てている(図2Bでは番号1~9)。 To identify additional conserved elements, eight mammalian species, chicken, X. Cyrano sequences were curated from 18 species where usable RNA-seq data could be located, including X. tropicalis, seven vertebrate fish species, and elephant shark (not shown). LncLOOM identified 7 elements conserved across all species, 9 elements conserved across all species except sharks (Figure 2B), and 37 motifs conserved across mammals. The following study focuses on nine elements (numbered 1-9 in Figure 2B) that are conserved across all species except sharks.

AUGGCG(配列番号17)
UGUGCAAUA(配列番号18)
ACAAGU(配列番号19)
CAACAAAAU(配列番号20)
GUCUUCCAUU(配列番号21)
UGUAUAG(配列番号22)
UGCAUGA(配列番号23)
CUAUGCA(配列番号24)
GCAAUAAA(配列番号25)
AUGGCG (SEQ ID NO: 17)
UGUGCAAUA (SEQ ID NO: 18)
ACAAGU (SEQ ID NO: 19)
CAACAAAAU (SEQ ID NO: 20)
GUCUUCCAUU (SEQ ID NO: 21)
UGUAUAG (SEQ ID NO: 22)
UGCAUGA (SEQ ID NO: 23)
CUAUGCA (SEQ ID NO: 24)
GCAAUAAA (SEQ ID NO: 25)

これらのうちの7つは、両LncLOOM検定によって統計的に有意であることが見出された(P<0.01)(材料及び方法に記載)。エレメント3~6のみが、miR-7の5’及び3’との対合に対応する2つ(図2C)、並びにPumilio Recognition Element(PRE、エレメント#6)に似たもう1つUGUAUAG(配列番号22)を含む、BLASTによって同定可能な67ntの保存された領域内に入る。このエレメントは、実際に、ヒト及びマウスからのCLIPデータにおいてPUM1及びPUM2に結合し(図2D~E)、Cyranoレベルが比較的高いマウス新生児の脳では、Pum1及びPum2の枯渇は、RNA崩壊におけるこれらのタンパク質の機能と一致して15、Cyrano発現の増加をもたらす(調整済みP値3.49×10-314からのデータ、図2E)。この抑制は、この高度に保存されたPREと他のものとの複合効果によるものである可能性が高い。異なる種由来の18個のCyrano配列は、平均して3.2個のコンセンサスPREを有した(マウス配列内の2つを含む、1,000のランダムシャッフル配列内の平均1.3と比較して、P<0.001、「方法」を参照)。 Seven of these were found to be statistically significant (P<0.01) by both LncLOOM tests (described in Materials and Methods). Only elements 3-6 were present, two corresponding to pairing with miR-7 5' and 3' (Fig. 2C), and another UGUAUAG (sequence) similar to Pumilio Recognition Element (PRE, element #6). No. 22) within a 67 nt conserved region identifiable by BLAST. This element indeed binds PUM1 and PUM2 in CLIP data from humans and mice (Fig. 2D-E), and in neonatal mouse brains where Cyrano levels are relatively high, depletion of Pum1 and Pum2 inhibits RNA decay. Consistent with the function of these proteins, 15 leads to increased Cyrano expression (adjusted P value 3.49 × 10 −3 , data from 14 , Figure 2E). This suppression is likely due to the combined effects of this highly conserved PRE and others. The 18 Cyrano sequences from different species had an average of 3.2 consensus PREs (compared to an average of 1.3 within 1,000 randomly shuffled sequences, including 2 within the mouse sequences). P < 0.001, see Methods).

LncLOOMによって同定される、Cyrano配列内のいくつかの追加の保存されたエレメントに、推定される生物学的機能を割り当てることができる。18個全部のインプット種で保存されている9量体UGUGCAAUA(図2Bのエレメント#2、配列番号35)が、miR-7結合部位の約60nt上流に、BLASTによってアライメント可能な領域の外側に見出される。このエレメントは、miR-25/92ファミリーのシードマッチに対応し(図2C)、マウス胎児心臓では、miR-25/92ファミリーのメンバーによって結合及び調節されることが近年示された16。Cyranoの3’末端では、1つの保存されたエレメント(配列番号25、GCAAUAAA)が、Cyranoポリアデニル化シグナル(PAS)及びmiR-137部位に対応する。PASの約100nt上流に見出される別の配列CUAUGCA(配列番号24)は、miR-153のシードマッチに対応し、この領域は、マウス脳ではAgo2によって結合される(図2E)。興味深いことに、HeLa細胞内のCyranoレベルは、miR-137及びmiR-153のトランスフェクション後にそれぞれ41%及び11%低下する17。したがって、Cyranoは、miR-7及びmiR-25/92との報告された相互作用を超えて、追加のマイクロRNAによる高度に保存された調節下にある。 Several additional conserved elements within the Cyrano sequence identified by LncLOOM can be assigned putative biological functions. A nonamer UGUGCAAUA (element #2 in Figure 2B, SEQ ID NO: 35), conserved in all 18 input species, was found approximately 60 nt upstream of the miR-7 binding site, outside the region that could be aligned by BLAST. It will be done. This element corresponds to a seed match for the miR-25/92 family (Fig. 2C) and was recently shown to be bound and regulated by members of the miR-25/92 family in the mouse fetal heart . At the 3' end of Cyrano, one conserved element (SEQ ID NO: 25, GCAAUAAA) corresponds to the Cyrano polyadenylation signal (PAS) and miR-137 site. Another sequence CUAUGCA (SEQ ID NO: 24), found approximately 100 nt upstream of PAS, corresponds to the seed match of miR-153, and this region is bound by Ago2 in mouse brain (FIG. 2E). Interestingly, Cyrano levels in HeLa cells are reduced by 41% and 11% after miR-137 and miR-153 transfection, respectively 17 . Thus, Cyrano is under highly conserved regulation by additional microRNAs beyond its reported interactions with miR-7 and miR-25/92.

保存されたPumilio結合部位の約55nt下流には、Rbfox RBPのコンセンサス結合モチーフと一致する保存されたWGCAUGAモチーフ(W=A/U、配列番号27)が存在する。このモチーフは、Cyranoの3’ハーフにWGCAUGAの例を含有する追加の領域と同様に、マウスではRbfox1/2によって結合される(図2E)。実際、18個のCyrano種の分析は、WGCAUGAの有意なエンリッチメントを示した(偶然予測された9.8例対4.5例、P<0.001、「方法」を参照)。miRNA結合部位及びPumilio結合部位とは対照的に、Rbfox1/2機能喪失の様々なRNA-seqデータセットの検査では、Cyranoレベルに対する影響は同定されず(図示せず)、Rbfox1/2による広範囲かつ保存された結合が、発現ではなく、Cyranoの機能性に影響を及ぼし得ることが示唆された。 Approximately 55 nt downstream of the conserved Pumilio binding site is the conserved WGCAUGA motif (W=A/U, SEQ ID NO: 27), which matches the consensus binding motif of Rbfox RBP. This motif, as well as an additional region containing examples of WGCAUGA in the 3' half of Cyrano, are bound by Rbfox1/2 in mice (Fig. 2E). Indeed, analysis of 18 Cyrano species showed a significant enrichment of WGCAUGA (9.8 vs. 4.5 expected by chance, P<0.001, see Methods). In contrast to miRNA-binding sites and Pumilio-binding sites, examination of various RNA-seq datasets of Rbfox1/2 loss of function did not identify any effects on Cyrano levels (not shown), suggesting that Rbfox1/2-induced widespread and It was suggested that conserved binding, but not expression, may influence Cyrano functionality.

別の高度に保存された6量体AUGGCG(配列番号17)は、Cyranoのまさに5’に見出される。ヒト、マウス及びゼブラフィッシュ由来のCyrano配列及びRibo-seqデータの検査により、この6量体が、保存された短い2~3aa ORFの最初の2つのコドンに対応することが明らかにされた(図2F)。明確なリボソーム会合がこのORFでのCyranoの5’末端に見られ、非常に限られた数のリボソーム保護断片がヒト及びゼブラフィッシュの両方でこのエレメントの下流に観察され(図2F)、この短いORFでの効率的な翻訳及びリボソーム放出を示唆している。ORF内のAUG開始コドンの状況は、転写及び翻訳の両方に影響を及ぼす調節エレメントであるTISUモチーフの12塩基に完全に一致する。TISUは、転写物の5’末端に位置し、転写開始部位を決定し得るYY1結合部位として、及びスキャニングを伴わず動作する、翻訳のための非常に効率的かつ正確なキャップ依存性翻訳イニシエーターエレメントとして作用する18、19。このモチーフのゲノム領域は、DNAへの強いYY1結合を示す(図2F)。このモチーフは、他のlncRNAについて示唆されるように、Cyrano発現を調節するYY1エレメントとして、及びCyrano機能に寄与し得る短いORFの始まりとして二重の機能を有し得ることが示唆されている20。全体として、推定される生物学的機能は、Cyranoでは9つの保存されたエレメントのうちの8つ、すなわち、miRNA結合部位としての4つ、RBP結合部位としての2つ、保存された短いORFとしての1つ、及びPASとしての1つに対して仮定されうる。これらのエレメントは、保存されていない配列の長いストレッチによって分離されており(図2B)、これにより、lncRNA生物学を明らかにするためにLncLOOMをアノテーション及び直交データと組み合わせる能力が強調される。 Another highly conserved hexamer AUGGCG (SEQ ID NO: 17) is found just 5' of Cyrano. Examination of Cyrano sequences and Ribo-seq data from human, mouse, and zebrafish revealed that this hexamer corresponds to the first two codons of a conserved short 2-3 aa ORF (Figure 2F). Clear ribosome association is seen at the 5' end of Cyrano in this ORF, and a very limited number of ribosome-protected fragments are observed downstream of this element in both human and zebrafish (Fig. 2F), indicating that this short This suggests efficient translation and ribosome release at the ORF. The context of the AUG start codon within the ORF perfectly matches the 12 bases of the TISU motif, a regulatory element that affects both transcription and translation. TISU is a highly efficient and accurate cap-dependent translation initiator for translation that is located at the 5' end of the transcript and acts as a YY1 binding site that can determine the transcription start site and without scanning. acting as an element 18,19 . The genomic region of this motif shows strong YY1 binding to DNA (Fig. 2F). It has been suggested that this motif may have a dual function as a YY1 element regulating Cyrano expression and as the beginning of a short ORF that may contribute to Cyrano function, as suggested for other lncRNAs . . Overall, the putative biological functions are as follows: 8 out of 9 conserved elements in Cyrano, 4 as miRNA binding sites, 2 as RBP binding sites, and 2 as conserved short ORFs. and one as PAS. These elements are separated by long stretches of non-conserved sequence (Fig. 2B), highlighting the ability to combine LncLOOM with annotation and orthogonal data to reveal lncRNA biology.

実施例3
LncLOOMは、libra lncRNA内の深く保存されたエレメントを同定する
LncLOOMの、miRNA生物学に関連することが知られている転写物中の保存されたエレメントを見出す能力の、別の例として、これをゼブラフィッシュにおけるlibra lncRNAの8つのホモログと、哺乳動物におけるNrepタンパク質とに適用した。これは、その3’領域内で実質的な配列相同性を保持しながら、可能性のある祖先lncRNAからタンパク質コード遺伝子に変化した遺伝子の数少ない例のうちの1つである12、21。libraは、高度に保存されかつ高度に相補的な部位を介して、ゼブラフィッシュ及びマウスではmiR-29bの分解を引き起こす21。BLASTNを使用してゼブラフィッシュlibraとヒト及びマウスの配列とを比較すると、約2.2kbのヒト配列から約250ntのアライメントが回収され、スポッテッドガーでは、さらに短い有意なアライメントがある(E値<0.001)。LncLOOMは、全種間で保存された17個のエレメントと、ゼブラフィッシュを除く全種で保存された>25個のエレメントとを見出した(図6)。これらには、miR-29部位、及び8つの追加のmiRNAに関する保存された結合部位が含まれ、3つは、BLASTによって哺乳動物種と魚種との間のアライメント領域の外側に見出された(図6)。したがって、標的特異的miRNA分解(target-directed miRNA degradation)(TDMD)を効果的に誘発することが示された2つのlncRNAであるCyrano及びlibraは、いくつかの追加の高度に保存されたmiRNA結合部位を有するが、TDMD媒介部位とは対照的に、これらはmiRNAではなくlncRNAレベルに影響を及ぼし得る「規則的な」シード部位であると思われる。
Example 3
LncLOOM identifies deeply conserved elements within libra lncRNAs As another example of LncLOOM's ability to find conserved elements in transcripts known to be relevant to miRNA biology, we It was applied to eight homologs of libra lncRNA in zebrafish and Nrep protein in mammals. This is one of the few examples of a gene that changed from a possible ancestral lncRNA to a protein-coding gene while retaining substantial sequence homology within its 3′ region. libra triggers miR-29b degradation in zebrafish and mice through a highly conserved and highly complementary site 21 . Comparing zebrafish libra with human and mouse sequences using BLASTN, an alignment of approximately 250 nt was recovered from the approximately 2.2 kb human sequence, with an even shorter significant alignment in spotted gar (E value < 0.001). LncLOOM found 17 elements conserved across all species and >25 elements conserved across all species except zebrafish (Figure 6). These include the miR-29 site and conserved binding sites for eight additional miRNAs, three found outside the alignment region between mammalian and fish species by BLAST. (Figure 6). Therefore, Cyrano and libra, two lncRNAs that have been shown to effectively induce target-directed miRNA degradation (TDMD), are linked to several additional highly conserved miRNA binding mechanisms. sites, but in contrast to TDMD-mediated sites, these appear to be “regular” seed sites that may influence lncRNA levels rather than miRNAs.

実施例4
LncLOOMは、CHASERR lncRNA内の保存されたモチーフを同定する
BLAST比較に適していない、配列内の保存されたモジュールを同定するLncLOOMの能力を試験するために、本発明者らは、マウス生存率に必須であると近年特徴解析されたlncRNAであるCHASERRに注目した27。CHASERRホモログは、CHD2の転写開始部位への近接度(<2kb)、及びそれらの特徴的な5-エクソン遺伝子構造に基づいて、様々な種において容易に同定可能である27。本発明者らは、CHASERRの極端にG/Cリッチなプロモーター及び第1のエクソンの周りのゲノムアセンブリのいくつかにギャップがあるために、長さが579~1313ntであり、そのうちの4つが5’不完全である可能性が高い、16種の脊椎動物由来のCHASERR配列を手作業でキュレートした27(図7)。BLASTNは、ヒトCHASERRと、有羊膜類由来の9つの配列との間に有意な(E値<0.01)アライメントを見出したが、他の6種の脊椎動物のいずれにも見出さなかった。逆に、ゼブラフィッシュ配列をクエリとして使用した場合、BLASTは、他の魚種及びオポッサムにおいてのみ相同性を見出した。CHASERR配列がClustalO MSAに供給されると28、3つの同一の位置のみが見出される。したがって、CHASERRの保存が限られていることは、比較ゲノミクスのために一般的に使用されるツールを使用した分析の課題である。
Example 4
LncLOOM identifies conserved motifs within the CHASERR lncRNA To test the ability of LncLOOM to identify conserved modules within sequences that are not amenable to BLAST comparisons, we We focused on CHASERR, an lncRNA that has recently been characterized as essential27 . CHASERR homologs are easily identifiable in various species based on their proximity (<2 kb) to the transcription start site of CHD2 and their characteristic 5-exon gene structure 27 . We found that due to some gaps in the genome assembly around the extremely G/C-rich promoter and first exon of CHASERR, the length ranged from 579 to 1313 nt, four of which 'We manually curated CHASERR sequences from 16 vertebrate species that are likely to be incomplete27 (Fig. 7). BLASTN found significant (E value <0.01) alignments between human CHASERR and nine sequences from amniotes, but none of the other six vertebrate species. Conversely, when using zebrafish sequences as queries, BLAST found homology only in other fish species and opossums. When the CHASERR sequence is fed into the ClustalO MSA, only three identical positions are found. Therefore, the limited conservation of CHASERR is a challenge for analysis using commonly used tools for comparative genomics.

LncLOOMは、全層で保存されている2つのk量体、すなわち、PASに対応する3’末端の:AAUAAA(配列番号3)、及び全CHASERR配列の最終エクソンに1回又は2回見出されるAAGAUG(配列番号2)(図3Aのモチーフ1)を同定した。AAUAAA(配列番号1モチーフは、CHASERRの3’末端付近に見出され、ポリアデニル化シグナル(PAS)に対応する可能性が最も高く、それ以上試験しなかった。CHASERR配列の検査により、AAGAUG モチーフ(配列番号5)が実質的に過剰提示されていることが見出された。CHASERRホモログは、偶然予測されたわずか0.45と比較して、平均で2.1例のモチーフを有した(P<0.01)。モチーフの状況もまた、これらの34例にわたって典型的に同様であり、モチーフにはプリンが典型的に続いた(図3B)。明らかに関連するモチーフAUGG(図3Aのモチーフ2)(配列番号2)は、11個の配列で保存されていた。隣接配列を含めて、モチーフ2は、モチーフ1とARAUGRコアを共有する(図3B)。これらの配列は、いかなるRBPの既知の結合優先性とも一致しなかったことが示唆され、eCLIPデータの検査では、バインダーの明らかな候補は明らかにされなかった。したがって、これらの配列の機能性を実験的にさらに探索した。 LncLOOM has two k-mers that are conserved in all layers, namely: AAUAAA (SEQ ID NO: 3) at the 3' end corresponding to PAS, and AAGAUG found once or twice in the final exon of all CHASERR sequences. (SEQ ID NO: 2) (motif 1 in Figure 3A) was identified. The AAUAAA (SEQ ID NO: 1 motif) was found near the 3' end of CHASERR and most likely corresponds to a polyadenylation signal (PAS) and was not tested further. Examination of the CHASERR sequence revealed that the AAGAUG motif ( SEQ ID NO: 5) was found to be substantially over-represented. CHASERR homologs had an average of 2.1 instances of the motif, compared to only 0.45 predicted by chance (P Motif context was also typically similar across these 34 cases, with motifs typically followed by purines (Figure 3B). 2) (SEQ ID NO: 2) was conserved in 11 sequences. Including flanking sequences, motif 2 shares an ARAUGR core with motif 1 (Figure 3B). These sequences are unique to any RBP. Inspection of the eCLIP data did not reveal any obvious candidates for binders, suggesting that there was no agreement with known binding preferences either. Therefore, the functionality of these sequences was further explored experimentally.

保存されたエレメントの機能的有意性を試験するために、マウスChaserrにおける保存されたモチーフの3つの例に相補的なアンチセンスオリゴヌクレオチド(ASO)を設計し(図8A)、マウスNeuro2a(N2a)細胞にトランスフェクトした。Chaserrの枯渇がChd2 RNA及びタンパク質のレベルの増加をもたらすことが以前に示された27。これらのASOに対応するヒト配列は、AAGATGGCAGTCTACTATGG(配列番号12)を標的とするCCATAGTAGACTGCCATCTT(配列番号7)、及びCACAAATGGACAGTGGAT(配列番号10)を標的とするATCCACTGTCCATTTGTG(配列番号9)である。 To test the functional significance of conserved elements, we designed antisense oligonucleotides (ASOs) complementary to three examples of conserved motifs in mouse Chaserr (Fig. 8A) and mouse Neuro2a (N2a). cells were transfected. It was previously shown that Chaserr depletion results in increased levels of Chd2 RNA and protein27 . The human sequences corresponding to these ASOs are CCATAGTAGACTGCCATCTT (SEQ ID NO: 7), which targets AAGATGGCAGTCTACTATGG (SEQ ID NO: 12), and ATCCACTGTCCATTTGTG (SEQ ID NO: 9), which targets CACAAATGGACAGTGGAT (SEQ ID NO: 10).

ASO1及びASO3を個別に又は混合してトランスフェクションすると、Chaserrのノックダウンによって引き起こされるものと同等のChd2レベルの有意な増加がもたらされた(図3C)。興味深いことに、ASO処理は、ASO標的化領域の上流又は下流のいずれかに見出されるRT-PCRプライマーペアによって評価されるように、Chaserrレベルの増加をもたらした(図3C)。 Transfection of ASO1 and ASO3 individually or in combination resulted in a significant increase in Chd2 levels comparable to that caused by Chaserr knockdown (Fig. 3C). Interestingly, ASO treatment resulted in increased Chaserr levels as assessed by RT-PCR primer pairs found either upstream or downstream of the ASO targeting region (Fig. 3C).

保存された領域に潜在的に結合するタンパク質を同定するために、本発明者らは、インビトロ転写を使用して、Chaserrの最終エクソンのWT配列と、4つの保存されたモチーフにAUGG→UACC変異を有する同じ配列と、最終エクソン内のAUGG部位の7つ全部がUACCに変異した第2の変異体とを含有するビオチン化RNAを作製した(図8A)。これらの配列をそれらのアンチセンス対照と一緒にN2a細胞由来の溶解物とともにインキュベートし、様々なRNA変異体に関連するタンパク質を質量分析を使用して単離及び同定した。これらの実験で典型的であるように、938個という多数のタンパク質がWT配列と関連していると同定され(図示せず)、これらのうちの74個がアンチセンス配列の3倍以上エンリッチメントされたが、これらのうちの9個のみが、WT配列を使用した場合に両変異体の2倍以上の回収を有した(図3D)。次いで、本発明者らは、公開されているRNA-seqデータセットを調査し、これらのタンパク質が乱された場合のChd2及び/又はChaserrレベルの変化の証拠を探した。このような証拠は、DHX36及びZFRについて利用可能であった(図8B~C)。RNA免疫沈降(RIP)及び特異的抗体を使用して、ChaserrとDHX36(変異配列と比較して最も高いエンリッチメントを示したタンパク質)との有意な関連を検証した(図3D)。興味深いことに、DHX36はG-四重鎖配列に結合することが知られており29、30、保存されたエレメントはGG対を実際に含有するが、それらは互いにかなり遠く、典型的なG-四重鎖は少なくとも3Gのラン(run)を含有する。QGRSマッパ31は、Chaserrの最終エクソン内に1つのG四重鎖を予測するが(図8A)、異なるスコアリングシステムを組み込んだG4RNAスキャナ32を含む他のツールは、Chaserrの最終エクソン内に高スコアのG-四重鎖を何ら見出さなかった。非カノニカルG四重鎖形成がこの配列内で形成されること、又はDHX36による異なる認識様式を有する可能性もある。 To identify proteins that potentially bind to the conserved region, we used in vitro transcription to synthesize the WT sequence of the final exon of Chaserr and the AUGG→UACC mutation in four conserved motifs. A biotinylated RNA was generated containing the same sequence with the same sequence and a second mutant in which all seven of the AUGG sites in the final exon were mutated to UACC (FIG. 8A). These sequences were incubated with lysates from N2a cells along with their antisense controls, and proteins associated with the various RNA variants were isolated and identified using mass spectrometry. As is typical in these experiments, a large number of proteins, 938, were identified as associated with the WT sequence (not shown), and 74 of these were more than 3-fold enriched with the antisense sequence. however, only nine of these had more than twice the recovery of both mutants when using the WT sequence (Fig. 3D). We then investigated publicly available RNA-seq datasets and looked for evidence of changes in Chd2 and/or Chaserr levels when these proteins are perturbed. Such evidence was available for DHX36 and ZFR (Fig. 8B-C). RNA immunoprecipitation (RIP) and specific antibodies were used to verify the significant association of Chaserr with DHX36, the protein that showed the highest enrichment compared to the mutant sequence (Fig. 3D). Interestingly, DHX36 is known to bind G-quadruplex sequences29,30, and although the conserved elements do contain GG pairs, they are quite far from each other and are typical of G-quadruplex sequences. The quadruplex contains at least 3G runs. Although the QGRS mapper 31 predicts one G-quadruplex within the final exon of Chaserr (Fig. 8A), other tools, including the G4 RNA scanner 32 that incorporate different scoring systems, predict a high G-quadruplex within the final exon of Chaserr. No scoring G-quadruplexes were found. It is also possible that non-canonical G-quadruplex formations are formed within this sequence or have a different mode of recognition by DHX36.

したがって、LncLOOMは、lncRNAの機能を乱すための標的試薬の設計の基礎として役立ちうる、lncRNA内の機能的に関連するエレメントを同定することができ、特異的であり機能的に関連するlncRNA相互作用パートナーを同定するためのプロテオーム法の使用を可能にする。 Therefore, LncLOOM can identify functionally relevant elements within lncRNAs that can serve as a basis for the design of targeting reagents to disrupt lncRNA function, and can identify specific and functionally relevant lncRNA interactions. Enables the use of proteomic methods to identify partners.

実施例5
DICER1 mRNA及びPumilio mRNAの3’UTR内の深く保存されたエレメント
本発明者らは、次に、lncRNAを超え、さらに長い進化距離にわたって配列を比較するためのLncLOOMの適用性を評価することを求めた。3’UTRは、mRNAのRNA安定性と翻訳効率とを決定することができ、他のmRNA領域よりもはるかに迅速に典型的に進化する34。3’UTR間のオルソロジーは、非常に長い進化距離にわたって容易に比較可能であることが多いそれらの隣接するコード配列に基づいて定義することがかなり容易である。しかし、脊椎動物と無脊椎動物との間の3’UTR内の機能的エレメントの長距離保存に関する既知の事例はほとんどない。LncLOOMを使用して3’UTRの保存を試験するために、本発明者らは、特に複雑な転写後調節を典型的に受けるため、転写後調節時に作用する遺伝子に最初に注目した。利用可能なRNA-seq及び発現配列タグ(EST)データを使用して、本発明者らは、8つの脊椎動物、ナメクジウオ、ヤツメウナギ、ウニ、C.インテスティナリス(C.intestinalis)、及びショウジョウバエにおける2つのDICERを含む12種から、miRNA経路の重要な成分をコードするDICER1の3’UTR配列の集合体を編集した。BLASTNによって、ヒトDICER1を脊椎動物種由来の3’UTRにアライメントすることができたが、それを超えることはできなかった。LncLOOMは、全脊椎動物配列内で保存された15個のエレメントを同定し、そのうちの6個は、ランダム配列内では見出されなかった長さであった(P<0.01、図9)。保存されたモチーフのうちの8つは脊椎動物を超えて保存され(かつMSA又はBLASTによって評価することができなかった)、保存されたmiR-219に関する結合部位に対応する1つは、ハエDicer2 3’UTRを含む全種に見出された。
Example 5
Deeply conserved elements within the 3'UTR of DICER1 and Pumilio mRNAs. We next sought to evaluate the applicability of LncLOOM for comparing sequences over longer evolutionary distances beyond lncRNAs. Ta. The 3'UTR can determine the RNA stability and translation efficiency of an mRNA and typically evolves much more rapidly than other mRNA regions. Orthology between 3'UTRs is fairly easy to define based on their adjacent coding sequences, which are often easily comparable over very long evolutionary distances. However, there are few known cases of long-range conservation of functional elements within the 3'UTR between vertebrates and invertebrates. To test 3'UTR conservation using LncLOOM, we first focused on genes that act during post-transcriptional regulation, particularly as they typically undergo complex post-transcriptional regulation. Using available RNA-seq and expressed sequence tag (EST) data, we identified eight vertebrates, amphioxus, lamprey, sea urchin, C. We compiled a collection of DICER1 3'UTR sequences encoding key components of the miRNA pathway from 12 species, including C. intestinalis and two DICERs in Drosophila. BLASTN was able to align human DICER1 to, but not beyond, the 3'UTR from vertebrate species. LncLOOM identified 15 elements conserved within all vertebrate sequences, 6 of which were of lengths not found within random sequences (P<0.01, Figure 9) . Eight of the conserved motifs are conserved across vertebrates (and could not be assessed by MSA or BLAST), and one, corresponding to the conserved binding site for miR-219, is found in fly Dicer2. Found in all species containing the 3'UTR.

次いで、本発明者らは、遺伝子発現を転写後に抑制するPumilioタンパク質をコードするPUM1 mRNA及びPUM2 mRNAの3’UTRに注目した。Pumilioタンパク質は深く保存されており、脊椎動物にはPUM1及びPUM2の2つのPumilioタンパク質が存在し、他の脊索動物及びハエでは単一のオルソログが存在する。12の脊椎動物及び4つの無脊椎動物(ヤツメウナギ、ナメクジウオ、C.インテスティナリス及びショウジョウバエ)由来の3’UTR配列をキュレートした。ヒト及びゼブラフィッシュの3’UTRは、BLASTNによって容易にアライメント可能であり、ヒトPUM1の3’UTRと、ヤツメウナギ及びナメクジウオPumilio mRNAの3’UTRとの間には有意な相同性さえあるが、ハエ及びC.インテスティナリスのものとは有意な相同性はない。LncLOOMは、脊椎動物PUM1 3’UTR全体にわたって保存された8つのエレメントを同定し、そのうちの1つUGUACAUU(配列番号14)は、分析された16個の3’UTRではいずれも、ハエpum 3’UTRまで保存された(図4、上部)。PUM2では、全配列に見出されたUGUACAUUも含めて、脊椎動物全体にわたって保存された3つのエレメントが存在した(図4、下部)。興味深いことに、このUGUACAUUモチーフはPREコンセンサスUGUANAUA(配列番号28)と部分的に一致し、ヒトENCODEデータではPUM1及びPUM2の両方によって結合され、この古来のエレメントが、Pumilio mRNAに存在することが知られている自己調節プログラムの一部であることを示唆している15。したがって、LncLOOMは、利用可能なツールが有意な配列保存を検出しない場合、5億年超離れたものを含めて、3’UTR配列内で深く保存されたエレメントを同定することができる。 Next, the present inventors focused on the 3'UTR of PUM1 mRNA and PUM2 mRNA, which encode Pumilio proteins that post-transcriptionally suppress gene expression. Pumilio proteins are deeply conserved, with two Pumilio proteins, PUM1 and PUM2, existing in vertebrates and a single ortholog in other chordates and flies. We curated 3'UTR sequences from 12 vertebrates and 4 invertebrates (lamprey, amphioxus, C. intestinalis and Drosophila). The human and zebrafish 3'UTRs can be easily aligned by BLASTN, and there is even significant homology between the 3'UTR of human PUM1 and that of the lamprey and amphioxus Pumilio mRNA, whereas the fly and C. There is no significant homology to that of Intestinalis. LncLOOM identified eight elements conserved across the vertebrate PUM1 3'UTR, one of which, UGUACAUU (SEQ ID NO: 14), was found in all 16 3'UTRs analyzed in the fly pum 3' It was preserved up to the UTR (Figure 4, top). In PUM2, there were three elements conserved across vertebrates, including UGUACAUU, which was found in the entire sequence (Fig. 4, bottom). Interestingly, this UGUACAUU motif partially matches the PRE consensus UGUANAUA (SEQ ID NO: 28), which is bound by both PUM1 and PUM2 in human ENCODE data, and this ancient element is known to be present in Pumilio mRNA. This suggests that it is part of a self-regulatory program that is associated with Thus, LncLOOM can identify deeply conserved elements within 3'UTR sequences, including those separated by more than 500 million years, when available tools do not detect significant sequence conservation.

実施例6
3’UTR内の保存されたモチーフの体系的な分析は、深く保存されたエレメントを明らかにする
LncLOOMの予測力を広く評価するために、3’UTR配列の包括的分析を行った。本発明者らは、数億年の進化に及ぶ高信頼性入力データセットを構築することを可能にし、そこからLncLOOMを使用して数千のエレメントを体系的に試験することが可能であった、3’UTRに隣接する高度に保存されたコード配列に基づいて明確に定義された3’UTRに注目した。データセットは、TargetScan7.2 miRNA標的部位予測スイートの一部として生成された3’UTR MSAを有する2,439個の遺伝子に基づいた10。各遺伝子について、4つの種(ヒト、マウス、イヌ及びニワトリ)の各々では、それらが300~3,000nt長であった場合にのみ、TargetScan MSAからのアライメントされた配列を含むLncLOOM分析のために、3’UTR配列のデータセットを生成した。いくつかの3’UTRアイソフォームを有する遺伝子について、本発明者らは、最長の3’UTRを選択した。次いで、本発明者らは、追加の種においてEnsemblでアノテーションされた3’UTRの配列を、それらが200塩基よりも長い場合、利用可能であればデータセットに追加した。これらには、5つの非有羊膜類脊椎動物種(カエル、サメ、ゼブラフィッシュ、ガー及びヤツメウナギ)及び2つの無脊椎動物(ユウレイボヤ及びハエ)由来の配列を含めた。主な目的は、LncLOOMが深く保存されたエレメントを同定する能力を評価することであり、そのため、少なくとも1つの非有羊膜類由来の好適な配列を有する遺伝子のみを使用した。様々な深度で分析されうる配列の数を図10Aに示す。2,439個の3’UTRデータセットのうち、2,117個は、BLASTNがヒト配列に対する有意なアライメントを何ら報告していない(E値<0.05)少なくとも1つの配列を含み、2,031個のデータセットは、4つの種のいずれに対しても有意なアライメントを有しなかった少なくとも1つの配列を含んでいた(図5A)。したがって、MSAに基づく手法が保存の全深度を潜在的に調べることができなかった多数の配列を分析することが可能であった。
Example 6
Systematic analysis of conserved motifs within the 3'UTR reveals deeply conserved elements To broadly assess the predictive power of LncLOOM, we performed a comprehensive analysis of the 3'UTR sequences. We were able to build a high-confidence input dataset spanning hundreds of millions of years of evolution, from which we were able to systematically test thousands of elements using LncLOOM. , focused on a well-defined 3'UTR based on highly conserved coding sequences flanking the 3'UTR. The dataset was based on 2,439 genes with 3'UTR MSAs generated as part of the TargetScan7.2 miRNA target site prediction suite10 . For each gene, in each of the four species (human, mouse, dog and chicken), for LncLOOM analysis containing aligned sequences from TargetScan MSA only if they were between 300 and 3,000 nt long. , generated a dataset of 3'UTR sequences. For genes with several 3'UTR isoforms, we selected the longest 3'UTR. We then added sequences of 3'UTRs annotated with Ensembl in additional species to the data set if they were longer than 200 bases, if available. These included sequences from five non-amniote vertebrate species (frogs, sharks, zebrafish, gars and lampreys) and two invertebrates (snails and flies). The main objective was to evaluate the ability of LncLOOM to identify deeply conserved elements, so only genes with suitable sequences from at least one non-amniote were used. The number of sequences that can be analyzed at various depths is shown in Figure 10A. Of the 2,439 3'UTR datasets, 2,117 contained at least one sequence for which BLASTN did not report any significant alignment to the human sequence (E value <0.05); 031 datasets contained at least one sequence that did not have a significant alignment to any of the four species (Fig. 5A). It was therefore possible to analyze a large number of sequences for which MSA-based approaches could not potentially explore the full depth of conservation.

LncLOOMを使用して、全LncLOOM試験において、最小長が6塩基であり、P<0.05である保存されたモチーフを検索した。LncLOOMは、ヒト配列では150,000個を超える有意なモチーフを検出し、そのうち27,826個(18.3%)は、広く保存されたmiRNAファミリーのシード部位に対応した(TargetScanによって定義した場合)。11,725個のk量体が有羊膜類を超えて保存され、少なくとも1つのアライメント不可能な配列では、そのうち3,897個が検出された(図5A~I及び図10)。LncLOOMは、それらのそれぞれのヒトオルソログにアライメントしなかった配列を含有する2,117個の遺伝子のうちの1,640個の第1のアライメント不可能な層では少なくとも1つの固有のk量体を検出し、少なくとも3つの固有のk量体の組合せが1,088個の遺伝子に見出された(図5B)。4つの有羊膜類種のいずれにもアライメントしなかった配列のみを考慮すると、少なくとも1つの固有のk量体が、1,529個のデータセット内の第1のアライメント不可能な配列内で検出された(図10A~F)。114個の遺伝子では、保存は脊椎動物を超えて見出され、97個では、保存はヒトからショウジョウバエまで見出された。合計170個の固有のk量体(265例)がハエ遺伝子では見出され、そのうち2つのみが広く保存されたmiRNA結合部位と一致した(図5C)。 LncLOOM was used to search for conserved motifs with a minimum length of 6 bases and P<0.05 in all LncLOOM tests. LncLOOM detected over 150,000 significant motifs in human sequences, of which 27,826 (18.3%) corresponded to seed sites of widely conserved miRNA families (as defined by TargetScan). ). 11,725 k-mers are conserved across amniotes, 3,897 of which were detected in at least one unalignable sequence (Figures 5A-I and Figure 10). LncLOOM identified at least one unique k-mer in the first unalignable layer of 1,640 of the 2,117 genes containing sequences that did not align to their respective human orthologs. detected and at least three unique k-mer combinations were found in 1,088 genes (Fig. 5B). Considering only sequences that did not align to any of the four amniote species, at least one unique k-mer was detected within the first unalignable sequence in the 1,529 datasets. (Figures 10A-F). In 114 genes, conservation was found across vertebrates, and in 97, conservation was found from humans to Drosophila. A total of 170 unique k-mers (265 cases) were found in the fly genes, of which only two matched widely conserved miRNA binding sites (Fig. 5C).

本発明者らは、次に、複数の遺伝子の3’UTR間で共有される特定の保存されたk量体を検討した。アライメント不可能な配列内で検出されたk量体の中で、42個が少なくとも50個の遺伝子に共通であり、少なくとも50個の遺伝子のうち2個のみが広く保存されたmiRNA結合部位に対応し、30個が無脊椎動物配列内で保存された(図5D)。これらの30個のうち、AU-リッチエレメント(ARE)に似たA/Uリッチな状況でUUU配列を含有した18個のk量体、及びPASに似たAUAAを含有した5個のk量体。他のk量体は、PREに似たUGUAコアを含有した。したがって、miRNA非関連エレメントのこれらの3つの群はまた、3’UTR内で非常に深く保存されていることが多く、これらの保存された出現がLncLOOMによって検出されうる。 We next investigated certain conserved k-mers shared between the 3'UTRs of multiple genes. Among the k-mers detected within unalignable sequences, 42 are common to at least 50 genes, and only 2 of the at least 50 genes correspond to widely conserved miRNA binding sites. and 30 were conserved within the invertebrate sequences (Fig. 5D). Of these 30, 18 k-mers contained UUU sequences in an A/U-rich context similar to AU-rich elements (AREs), and 5 k-mers contained AUAAs similar to PAS. body. Other k-mers contained a PRE-like UGUA core. Therefore, these three groups of miRNA-unrelated elements are also often highly conserved within the 3'UTR, and their conserved occurrences can be detected by LncLOOM.

LncLOOMの感度を評価するために、LncLOOMによって同定された広く保存されたmiRNAの結合部位と、2,439個の遺伝子の各々に関するTargetScan予測とを比較し、そのうちの2,121個では、TargetScanはヒト配列内の結合部位を予測した。lncLOOMは、TargetScanアライメントが広く保存された部位を同定しなかった217個を含む2,330個の遺伝子内の結合部位を予測した(図5E)。lncLOOMによって予測された全miRNA部位の概要は、github(dot)com/LncLOOM/LncLOOMに見出すことができる。かなりの数の例(2,117個の遺伝子の29%)では、LncLOOMは、MSAでは3’UTRがヒト配列にアライメント不可能な種において有意に保存されたmiRNA結合部位を見出した(図5F)。lncLOOM予測とTargetScan予測とをさらに正確に比較するために、本発明者らは、TargetScanがlncLOOM分析に使用された同一のヒト転写物中の結合部位を予測した2,359個の遺伝子に注目し(図5E)、そのうち、lncLOOMは、ヒト配列内のTargetScanによって予測されたあらゆる広く保存された部位の90.24%を回収した(図5G)。217個の遺伝子の中で、42個は哺乳動物を超えて保存された部位を有し、いくつかの遺伝子では、魚種及びショウジョウバエ種で保存が見られた(図10A~F)。回収されたmiRNA部位に加えて、lncLOOMは、以前には予測されなかったさらなる21,615個の広く保存された部位を同定した。保存の深度を比較すると、lncLOOMは、さらに遠位の種においてTargetScanによって回収された部位を多くの場合検出した(図5G及び図10A~F)。重要なことに、それぞれ遺伝子の24%及び13%では、831個の回収された予測及び331個の新たな予測が、アライメント不可能な配列内で検出された。 To assess the sensitivity of LncLOOM, we compared the widely conserved miRNA binding sites identified by LncLOOM with TargetScan predictions for each of the 2,439 genes, and for 2,121 of them, TargetScan The binding site within the human sequence was predicted. lncLOOM predicted binding sites in 2,330 genes, including 217 for which the TargetScan alignment did not identify widely conserved sites (Fig. 5E). An overview of all miRNA sites predicted by lncLOOM can be found at github(dot)com/LncLOOM/LncLOOM. In a significant number of cases (29% of 2,117 genes), LncLOOM found miRNA binding sites that were significantly conserved in species whose 3'UTRs could not be aligned to the human sequence in MSA (Fig. 5F ). To more accurately compare lncLOOM and TargetScan predictions, we focused on the 2,359 genes for which TargetScan predicted binding sites in the same human transcripts used for lncLOOM analysis. (Fig. 5E), of which lncLOOM recovered 90.24% of all widely conserved sites predicted by TargetScan within the human sequence (Fig. 5G). Among the 217 genes, 42 had conserved sites across mammals, and some genes showed conservation in fish and Drosophila species (FIGS. 10A-F). In addition to the recovered miRNA sites, lncLOOM identified an additional 21,615 widely conserved sites that were not previously predicted. Comparing the depth of conservation, lncLOOM often detected sites recovered by TargetScan in more distal species (Fig. 5G and Fig. 10A-F). Importantly, 831 recovered predictions and 331 new predictions were detected within unalignable sequences for 24% and 13% of genes, respectively.

このように、LncLOOMは、3’UTR配列の分析のための強力なツールでもあり、MSAに基づく手法によって可能であるよりも、miRNA又は他の機能的結合部位の保存の大きな深度を明らかにしながら、感度については限られた妥協しか有しない。 Thus, LncLOOM is also a powerful tool for the analysis of 3'UTR sequences, while revealing greater depth of conservation of miRNAs or other functional binding sites than is possible by MSA-based approaches. , has only limited compromises in sensitivity.

実施例7
CHASERRの標的化は、神経芽細胞内でCHD2のアップレギュレーションを引き起こす
以下に配列を提供する。
Example 7
Targeting of CHASERR causes upregulation of CHD2 in neuroblasts. Sequences are provided below.

(CHASERRを標的とするASO:)
A35:マウスに使用したものと同じASO。このASOは、マウス配列に相補的である。
A40:マウスではASO1と同じ領域を標的とするが、ヒト配列に完全に相補的なASO。
A49:A35及びA40に類似するが、G-U対合を使用してヒト配列及びマウス配列の両方と塩基対合する可能性を有するASO。
A50:A40と同一であるが、2’MOEの代わりに2’MO修飾を有し、3’末端で2塩基だけ切断されている
A51:A40と同一であるが、2’MOEの代わりに2’MO修飾を有し、5’末端で2塩基だけ切断されている
A52:A40と同一であるが、LNA修飾を含む
(ASO targeting CHASERR:)
A35: The same ASO used for the mouse. This ASO is complementary to mouse sequences.
A40: ASO that targets the same region as ASO1 in mouse but is fully complementary to the human sequence.
A49: ASO similar to A35 and A40, but with the potential to base pair with both human and mouse sequences using GU pairing.
A50: Same as A40, but with 2'MO modification instead of 2'MOE, and only 2 bases are truncated at the 3' end.A51: Same as A40, but with 2'MOE modification instead of 2'MOE. 'MO modification, truncated by 2 bases at 5' end A52: Same as A40, but includes LNA modification

結果
CHD2 mRNA及びタンパク質のレベルに対する効果と、非標的化ASO A27及びA28とを比較した。A28は、SH-SY5Y細胞内でp21のアップレギュレーションとストレス応答とを引き起こしているため(図16)、A27との比較を行った。
Results The effects on CHD2 mRNA and protein levels were compared with non-targeted ASOs A27 and A28. Since A28 causes p21 upregulation and stress response in SH-SY5Y cells (FIG. 16), a comparison was made with A27.

細胞を2.5×10/35mmプレートの密度でプレーティングした。DharmaFECT4トランスフェクション試薬(T-2004-03、horizon)を使用して、25nMのASOによって細胞をトランスフェクトした。トランスフェクションの48時間後にRNAを抽出した。 Cells were plated at a density of 2.5×10 5 /35 mm plate. Cells were transfected with 25 nM ASO using DharmaFECT4 transfection reagent (T-2004-03, horizon). RNA was extracted 48 hours after transfection.

ASO A40、A50、A51及びA52は、トランスフェクトされていない細胞、又は対照ASOによってトランスフェクトされた細胞と比較して、CHD2をアップレギュレートする点で最も強力であった(図16)。 ASOs A40, A50, A51 and A52 were the most potent in upregulating CHD2 compared to untransfected cells or cells transfected with control ASOs (Figure 16).

実施例8
CHASERRの標的化は、MCF7細胞及びSH-SY5Y内でCHD2のアップレギュレーションを引き起こす
アンチセンスオリゴヌクレオチド及びLNA GapmeRトランスフェクション
10%ウシ胎児血清と100Uペニシリン/0.1mg ml-1ストレプトマイシンとを含有するDMEM中で、MCF7細胞株(ATCCから入手)を培養した。10%ウシ胎児血清と、100Uペニシリン/0.1mg ml-1ストレプトマイシンと、2mM GlutaMAX(Thermofisher:35050061)とを含有するDMEM/Nutrient Mixture F-12 Ham(Sigma:D6421)中で、SH-SY5Y細胞株(ATCCから入手)を培養した。全細胞を、5%COの加湿インキュベーター内で37℃で培養し、マイコプラズマ汚染について常用的に試験した。ASOの第1のセット:ASO1(A40、配列番号128)及びASO3(A41、配列番号134)を2’-O-メトキシエチル塩基によって修飾した。ヒトChaserrの第2のイントロンを標的とするLNAギャップマーをChaserrノックダウンに使用した。トランスフェクション:2×10個のMCF7又はSH-SY5Yを6ウェルプレートに播種し、製造業者のプロトコルに従ってDharmafect4(Dharmacon)トランスフェクション試薬を使用して、最終濃度が50nMになるようにASO1(ASO40)とASO3(ASO41)との混合物、又はChaserr gapmeR(表5)を用いてトランスフェクトした。全実験の終了点はトランスフェクションの48時間後であり、その後、RNA抽出、及びRT-qPCR分析による評価のために、TRIZOLを用いて細胞を回収した。Chasser及びCHD2の発現に対する効果を図17に示す。
Example 8
Targeting of CHASERR causes upregulation of CHD2 in MCF7 cells and SH-SY5Y Antisense oligonucleotides and LNA GapmeR transfection DMEM containing 10% fetal calf serum and 100 U penicillin/0.1 mg ml -1 streptomycin The MCF7 cell line (obtained from ATCC) was cultured therein. SH-S in DMEM/Nutrient Mixture F-12 Ham (Sigma: D6421) containing 10% fetal bovine serum, 100 U penicillin/0.1 mg ml -1 streptomycin, and 2 mM GlutaMAX (Thermofisher: 35050061). Y5Y cell strain (obtained from ATCC) was cultured. All cells were cultured at 37°C in a humidified incubator with 5% CO2 and routinely tested for mycoplasma contamination. The first set of ASOs: ASO1 (A40, SEQ ID NO: 128) and ASO3 (A41, SEQ ID NO: 134) were modified with a 2'-O-methoxyethyl base. An LNA gapmer targeting the second intron of human Chaserr was used for Chaserr knockdown. Transfection: 2 × 10 MCF7 or SH-SY5Y were seeded in a 6-well plate and transfected with ASO1 (ASO40) to a final concentration of 50 nM using Dharmafect4 (Dharmacon) transfection reagent according to the manufacturer's protocol. ) and ASO3 (ASO41), or with Chaser gapmeR (Table 5). The end point for all experiments was 48 hours after transfection, after which cells were harvested using TRIZOL for RNA extraction and evaluation by RT-qPCR analysis. The effects on the expression of Chaser and CHD2 are shown in FIG. 17.

本発明をその特定の実施形態と併せて説明してきたが、多くの代替形態、修正形態及び変形形態が当業者には明らかであることは明白である。したがって、添付の特許請求の範囲の趣旨及び広い範囲に含まれるすべてのそのような代替形態、修正形態及び変形形態を包含することが意図されている。 Although the invention has been described in conjunction with specific embodiments thereof, it is evident that many alternatives, modifications, and variations will be apparent to those skilled in the art. Accordingly, it is intended to cover all such alternatives, modifications, and variations as fall within the spirit and broad scope of the appended claims.

本明細書で言及されるすべての刊行物、特許及び特許出願は、あたかも各個々の刊行物、特許又は特許出願が参照により本明細書に組み込まれることが言及される際に具体的かつ個別に言及されたかのように、参照によりその全体が本明細書に組み込まれることが本出願人の意図である。さらに、本出願におけるいずれかの参考文献の引用又は特定は、そのような参考文献が本発明の先行技術として利用可能であることの承認として解釈されるべきではない。項の見出しが使用される限り、それらは必ずしも限定的であると解釈されるべきではない。さらに、本出願のあらゆる優先権書類は、参照によりその全体が本明細書に組み込まれる。 All publications, patents, and patent applications mentioned herein are specifically and individually named as if each individual publication, patent, or patent application was incorporated by reference herein. It is the applicant's intention to incorporate herein by reference in its entirety as if mentioned. Furthermore, citation or identification of any reference in this application shall not be construed as an admission that such reference is available as prior art to the present invention. To the extent that section headings are used, they should not necessarily be construed as limiting. Additionally, any priority documents of this application are incorporated herein by reference in their entirety.

参照文献(本文にはその他の文献が含まれる)
1. Ulitsky, I. & Bartel, D. P. lincRNAs: genomics, evolution, and mechanisms. Cell 154, 26-46 (2013).
2. Iyer, M. K. et al. The landscape of long noncoding RNAs in the human transcriptome. Nat. Genet. 47, 199-208 (2015).
3. Ulitsky, I. Evolution to the rescue: using comparative genomics to understand long non-coding RNAs. Nat. Rev. Genet. (2016) doi:10.1038/nrg.2016.85.
4. Hezroni, H. et al. Principles of Long Noncoding RNA Evolution Derived from Direct Comparison of Transcriptomes in 17 Species. Cell Rep. (2015) doi:10.1016/j.celrep.2015.04.023.
5. Wang, A. X., Ruzzo, W. L. & Tompa, M. How accurately is ncRNA aligned within whole-genome multiple alignments? BMC Bioinformatics 8, 417 (2007).
6. Bartel, D. P. Metazoan MicroRNAs. Cell 173, 20-51 (2018).
7. Dominguez, D. et al. Sequence, Structure, and Context Preferences of Human RNA Binding Proteins. Mol. Cell 70, 854-867.e9 (2018).
8. Maier, D. The Complexity of Some Problems on Subsequences and Supersequences. (1978).
9. Atamturk, A. & Savelsbergh, M. W. P. Integer-Programming Software Systems. Ann. Oper. Res. 140, 67-124 (2005).
10. Agarwal, V., Bell, G. W., Nam, J.-W. & Bartel, D. P. Predicting effective microRNA target sites in mammalian mRNAs. Elife 4, e05005 (2015).
11. Van Nostrand, E. L. et al. A Large-Scale Binding and Functional Map of Human RNA Binding Proteins. bioRxiv 179648 (2017) doi:10.1101/179648.
12. Ulitsky, I., Shkumatava, A., Jan, C. H., Sive, H. & Bartel, D. P. Conserved function of lincRNAs in vertebrate embryonic development despite rapid sequence evolution. Cell 147, 1537-1550 (2011).
13. Kleaveland, B., Shi, C. Y., Stefano, J. & Bartel, D. P. A Network of Noncoding Regulatory RNAs Acts in the Mammalian Brain. bioRxiv (2018).
14. Zhang, M. et al. Post-transcriptional regulation of mouse neurogenesis by Pumilio proteins. Genes Dev. 31, 1354-1369 (2017).
15. Goldstrohm, A. C., Hall, T. M. T. & McKenney, K. M. Post-transcriptional Regulatory Functions of Mammalian Pumilio Proteins. Trends Genet. 34, 972-990 (2018).
16. Li, X., Pritykin, Y., Concepcion, C. P., Lu, Y. & La Rocca, G. High-resolution in vivo identification of miRNA targets by Halo-Enhanced Ago2 Pulldown. bioRxiv (2019).
17. McGeary, S. E., Lin, K. S., Shi, C. Y., Bisaria, N. & Bartel, D. P. The biochemical basis of microRNA targeting efficacy. doi:10.1101/414763.
18. Elfakess, R. & Dikstein, R. A translation initiation element specific to mRNAs with very short 5’UTR that also regulates transcription. PLoS One 3, e3094 (2008).
19. Elfakess, R. et al. Unique translation initiation of mRNAs-containing TISU element. Nucleic Acids Res. 39, 7598-7609 (2011).
20. Housman, G. & Ulitsky, I. Methods for distinguishing between protein-coding and long noncoding RNAs and the elusive biological purpose of translation of long noncoding RNAs. Biochim. Biophys. Acta (2015) doi:10.1016/j.bbagrm.2015.07.017.
21. Bitetti, A. et al. MicroRNA degradation by a conserved target RNA regulates animal behavior. Nat. Struct. Mol. Biol. 25, 244-251 (2018).
22. Munschauer, M. et al. The NORAD lncRNA assembles a topoisomerase complex critical for genome stability. Nature 561, 132-136 (2018).
23. Lovci, M. T. et al. Rbfox proteins regulate alternative mRNA splicing through evolutionarily conserved RNA bridges. Nat. Struct. Mol. Biol. 20, 1434-1442 (2013).
References (Other references are included in the text)
1. Ulitsky, I. & Bartel, DP lincRNAs: genomics, evolution, and mechanisms. Cell 154, 26-46 (2013).
2. Iyer, MK et al. The landscape of long noncoding RNAs in the human transcriptome. Nat. Genet. 47, 199-208 (2015).
3. Ulitsky, I. Evolution to the rescue: using comparative genomics to understand long non-coding RNAs. Nat. Rev. Genet. (2016) doi:10.1038/nrg.2016.85.
4. Hezroni, H. et al. Principles of Long Noncoding RNA Evolution Derived from Direct Comparison of Transcriptomes in 17 Species. Cell Rep. (2015) doi:10.1016/j.celrep.2015.04.023.
5. Wang, AX, Ruzzo, WL & Tompa, M. How accurately is ncRNA aligned within whole-genome multiple alignments? BMC Bioinformatics 8, 417 (2007).
6. Bartel, DP Metazoan MicroRNAs. Cell 173, 20-51 (2018).
7. Dominguez, D. et al. Sequence, Structure, and Context Preferences of Human RNA Binding Proteins. Mol. Cell 70, 854-867.e9 (2018).
8. Maier, D. The Complexity of Some Problems on Subsequences and Supersequences. (1978).
9. Atamturk, A. & Savelsbergh, MWP Integer-Programming Software Systems. Ann. Oper. Res. 140, 67-124 (2005).
10. Agarwal, V., Bell, GW, Nam, J.-W. & Bartel, DP Predicting effective microRNA target sites in mammalian mRNAs. Elife 4, e05005 (2015).
11. Van Nostrand, EL et al. A Large-Scale Binding and Functional Map of Human RNA Binding Proteins. bioRxiv 179648 (2017) doi:10.1101/179648.
12. Ulitsky, I., Shkumatava, A., Jan, CH, Sive, H. & Bartel, DP Conserved function of lincRNA embryos in vertebratenic development despite rapid sequence evolution. Cell 147, 1537-1550 (2011).
13. Kleaveland, B., Shi, CY, Stefano, J. & Bartel, DP A Network of Noncoding Regulatory RNAs Acts in the Mammalian Brain. bioRxiv (2018).
14. Zhang, M. et al. Post-transcriptional regulation of mouse neurogenesis by Pumilio proteins. Genes Dev. 31, 1354-1369 (2017).
15. Goldstrohm, AC, Hall, TMT & McKenney, KM Post-transcriptional Regulatory Functions of Mammalian Pumilio Proteins. Trends Genet. 34, 972-990 (2018).
16. Li, X., Pritykin, Y., Concepcion, CP, Lu, Y. & La Rocca, G. High-resolution in vivo identification of miRNA targets by Halo-Enhanced Ago2 Pulldown. bioRxiv (2019).
17. McGeary, SE, Lin, KS, Shi, CY, Bisaria, N. & Bartel, DP The biochemical basis of microRNA targeting efficacy. doi:10.1101/414763.
18. Elfakess, R. & Dikstein, R. A translation initiation element specific to mRNAs with very short 5'UTR that also regulates transcription. PLoS One 3, e3094 (2008).
19. Elfakess, R. et al. Unique translation initiation of mRNAs-containing TISU element. Nucleic Acids Res. 39, 7598-7609 (2011).
20. Housman, G. & Ulitsky, I. Methods for distinguishing between protein-coding and long noncoding RNAs and the elusive biological purpose of translation of long noncoding RNAs. Biochim. Biophys. Acta (2015) doi:10.1016/j.bbagrm. 2015.07.017.
21. Bitetti, A. et al. MicroRNA degradation by a conserved target RNA regulates animal behavior. Nat. Struct. Mol. Biol. 25, 244-251 (2018).
22. Munschauer, M. et al. The NORAD lncRNA assembles a topoisomerase complex critical for genome stability. Nature 561, 132-136 (2018).
23. Lovci, MT et al. Rbfox proteins regulate alternative mRNA splicing through evolutionarily conserved RNA bridges. Nat. Struct. Mol. Biol. 20, 1434-1442 (2013).

24. Jangi, M., Boutz, P. L., Paul, P. & Sharp, P. A. Rbfox2 controls autoregulation in RNA-binding protein networks. Genes Dev. 28, 637-651 (2014).
25. Chi, S. W., Zang, J. B., Mele, A. & Darnell, R. B. Argonaute HITS-CLIP decodes microRNA-mRNA interaction maps. Nature 460, 479-486 (2009).
26. Michel, A. M. et al. GWIPS-viz: development of a ribo-seq genome browser. Nucleic Acids Res. 42, D859-64 (2014).
27. Rom, A. et al. Regulation of CHD2 expression by the Chaserr long noncoding RNA gene is essential for viability. Nat. Commun. 10, 5092 (2019).
28. Sievers, F. et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol. Syst. Biol. 7, (2011).
29. Chen, M. C. et al. Structural basis of G-quadruplex unfolding by the DEAH/RHA helicase DHX36. Nature 558, 465-469 (2018).
30. Sauer, M. et al. DHX36 prevents the accumulation of translationally inactive mRNAs with G4-structures in untranslated regions. Nat. Commun. 10, 2421 (2019).
31. Kikin, O., D’Antonio, L. & Bagga, P. S. QGRS Mapper: a web-based server for predicting G-quadruplexes in nucleotide sequences. Nucleic Acids Res. 34, W676-82 (2006).
32. Garant, J.-M., Perreault, J.-P. & Scott, M. S. G4RNA screener web server: User focused interface for RNA G-quadruplex prediction. Biochimie vol. 151 115-118 (2018).
33. Haque, N., Ouda, R., Chen, C., Ozato, K. & Hogg, J. R. ZFR coordinates crosstalk between RNA decay and transcription in innate immunity. Nat. Commun. 9, 1145 (2018).
34. Shabalina, S. A., Ogurtsov, A. Y., Rogozin, I. B., Koonin, E. V. & Lipman, D. J. Comparative analysis of orthologous eukaryotic mRNAs: potential hidden functional signals. Nucleic Acids Res. 32, 1774-1782 (2004).
35. Kirk, J. M. et al. Functional classification of long non-coding RNAs by k-mer content. Nat. Genet. 50, 1474-1482 (2018).
36. Quinn, J. J. et al. Rapid evolutionary turnover underlies conserved lncRNA-genome interactions. Genes Dev. 30, 191-207 (2016).
37. Tycowski, K. T., Shu, M. D., Borah, S., Shi, M. & Steitz, J. A. Conservation of a triple-helix-forming RNA stability element in noncoding and genomic RNAs of diverse viruses. Cell Rep. 2, 26-32 (2012).
38. Deveson, I. W. et al. Universal Alternative Splicing of Noncoding Exons. Cell Syst 6, 245-255.e5 (2018).
39. Katoh, K., Misawa, K., Kuma, K.-I. & Miyata, T. MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform. Nucleic Acids Res. 30, 3059-3066 (2002).
40. Altschul, S. F., Gish, W., Miller, W., Myers, E. W. & Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215, 403-410 (1990).
41. Karp, R. M. Reducibility among Combinatorial Problems. in Complexity of Computer Computations: Proceedings of a symposium on the Complexity of Computer Computations, held March 20-22, 1972, at the IBM Thomas J. Watson Research Center, Yorktown Heights, New York, and sponsored by the Office of Naval Research, Mathematics Program, IBM World Trade Corporation, and the IBM Research Mathematical Sciences Department (eds. Miller, R. E., Thatcher, J. W. & Bohlinger, J. D.) 85-103 (Springer US, 1972).
42. Hagberg, A., Swart, P. & S Chult, D. Exploring network structure, dynamics, and function using NetworkX. www(dot)osti(dot)gov/biblio/960616 (2008).
43. Mitchell, S., OSullivan, M. & Dunning, I. PuLP: a linear programming toolkit for python. The University of Auckland, Auckland, New Zealand (2011).
44. Kent, W. J. BLAT-The BLAST-Like Alignment Tool. Genome Res. 12, 656-664 (2002).
45. Dobin, A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics 29, 15-21 (2013).
46. Li, B. & Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics 12, 323 (2011).
24. Jangi, M., Boutz, PL, Paul, P. & Sharp, PA Rbfox2 controls autoregulation in RNA-binding protein networks. Genes Dev. 28, 637-651 (2014).
25. Chi, SW, Zang, JB, Mele, A. & Darnell, RB Argonaute HITS-CLIP decodes microRNA-mRNA interaction maps. Nature 460, 479-486 (2009).
26. Michel, AM et al. GWIPS-viz: development of a ribo-seq genome browser. Nucleic Acids Res. 42, D859-64 (2014).
27. Rom, A. et al. Regulation of CHD2 expression by the Chaserr long noncoding RNA gene is essential for viability. Nat. Commun. 10, 5092 (2019).
28. Sievers, F. et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol. Syst. Biol. 7, (2011).
29. Chen, MC et al. Structural basis of G-quadruplex unfolding by the DEAH/RHA helicase DHX36. Nature 558, 465-469 (2018).
30. Sauer, M. et al. DHX36 prevents the accumulation of translationally inactive mRNAs with G4-structures in untranslated regions. Nat. Commun. 10, 2421 (2019).
31. Kikin, O., D'Antonio, L. & Bagga, PS QGRS Mapper: a web-based server for predicting G-quadruplexes in nucleotide sequences. Nucleic Acids Res. 34, W676-82 (2006).
32. Garant, J.-M., Perreault, J.-P. & Scott, MS G4RNA screener web server: User focused interface for RNA G-quadruplex prediction. Biochimie vol. 151 115-118 (2018).
33. Haque, N., Ouda, R., Chen, C., Ozato, K. & Hogg, JR ZFR coordinates crosstalk between RNA decay and transcription in innate immunity. Nat. Commun. 9, 1145 (2018).
34. Shabalina, SA, Ogurtsov, AY, Rogozin, IB, Koonin, EV & Lipman, DJ Comparative analysis of orthologous eukaryotic mRNAs: potential hidden functional signals. Nucleic Acids Res. 32, 1774-1782 (2004).
35. Kirk, JM et al. Functional classification of long non-coding RNAs by k-mer content. Nat. Genet. 50, 1474-1482 (2018).
36. Quinn, JJ et al. Rapid evolutionary turnover underlies conserved lncRNA-genome interactions. Genes Dev. 30, 191-207 (2016).
37. Tycowski, KT, Shu, MD, Borah, S., Shi, M. & Steitz, JA Conservation of a triple-helix-forming RNA stability element in noncoding and genomic RNAs of diverse viruses. Cell Rep. 2, 26- 32 (2012).
38. Deveson, IW et al. Universal Alternative Splicing of Noncoding Exons. Cell Syst 6, 245-255.e5 (2018).
39. Katoh, K., Misawa, K., Kuma, K.-I. & Miyata, T. MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform. Nucleic Acids Res. 30, 3059-3066 ( 2002).
40. Altschul, SF, Gish, W., Miller, W., Myers, EW & Lipman, DJ Basic local alignment search tool. J. Mol. Biol. 215, 403-410 (1990).
41. Karp, RM Reducibility among Combinatorial Problems. in Complexity of Computer Computations: Proceedings of a symposium on the Complexity of Computer Computations, held March 20-22, 1972, at the IBM Thomas J. Watson Research Center, Yorktown Heights, New York. , and sponsored by the Office of Naval Research, Mathematics Program, IBM World Trade Corporation, and the IBM Research Mathematical Sciences Department (eds. Miller, RE, Thatcher, JW & Bohlinger, JD) 85-103 (Springer US, 1972).
42. Hagberg, A., Swart, P. & S Chult, D. Exploring network structure, dynamics, and function using NetworkX. www(dot)osti(dot)gov/biblio/960616 (2008).
43. Mitchell, S., OSullivan, M. & Dunning, I. PuLP: a linear programming toolkit for python. The University of Auckland, Auckland, New Zealand (2011).
44. Kent, WJ BLAT-The BLAST-Like Alignment Tool. Genome Res. 12, 656-664 (2002).
45. Dobin, A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics 29, 15-21 (2013).
46. Li, B. & Dewey, CN RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinformatics 12, 323 (2011).

47. Elinger, D., Gabashvili, A. & Levin, Y. Suspension Trapping (S-Trap) Is Compatible with Typical Protein Extraction Buffers and Detergents for Bottom-Up Proteomics. J. Proteome Res. 18, 1441-1445 (2019).
48. Cox, J. & Mann, M. MaxQuant enables high peptide identification rates, individualized p.p.b.-range mass accuracies and proteome-wide protein quantification. Nat. Biotechnol. 26, 1367-1372 (2008).
47. Elinger, D., Gabashvili, A. & Levin, Y. Suspension Trapping (S-Trap) Is Compatible with Typical Protein Extraction Buffers and Detergents for Bottom-Up Proteomics. J. Proteome Res. 18, 1441-1445 (2019 ).
48. Cox, J. & Mann, M. MaxQuant enables high peptide identification rates, individualized ppb-range mass accuracies and proteome-wide protein quantification. Nat. Biotechnol. 26, 1367-1372 (2008).

Claims (33)

神経細胞内のクロモドメインヘリカーゼDNA結合タンパク質2(CHD2)の量を増加させる方法であって、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤を前記細胞に導入することを含み、前記核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、前記神経細胞内のCHD2の量を増加させる方法。 A method for increasing the amount of chromodomain helicase DNA binding protein 2 (CHD2) in a neuronal cell, the method comprising introducing into the cell a nucleic acid agent that downregulates the activity or expression of human Chaserr, the method comprising: to the final exon of human Chaserr, thereby increasing the amount of CHD2 in said neuronal cells. クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状の処置が必要な対象における、前記疾患又は病状を処置する方法であって、治療有効量のヒトChaserrの活性又は発現をダウンレギュレートする核酸剤を前記対象に投与することを含み、前記核酸剤が、ヒトChaserrの最終エクソンへと指向しており、それによって、前記CHD2ハプロ不全に関連する疾患又は病状を処置する方法。 A method of treating a disease or condition associated with chromodomain helicase DNA binding protein 2 (CHD2) haploinsufficiency in a subject in need thereof, the method comprising: reducing the activity or expression of human Chaser in a therapeutically effective amount. A method of treating a disease or condition associated with said CHD2 haploinsufficiency, comprising administering to said subject a nucleic acid agent that regulates said nucleic acid agent directed to the final exon of human Chaserr. クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状の処置が必要な対象においての前記疾患又は病状の処置における使用のための、ヒトChaserrの活性又は発現をダウンレギュレートする核酸剤であって、ヒトChaserrの最終エクソンへと指向した核酸剤。 A nucleic acid that downregulates the activity or expression of human Chaserr for use in the treatment of a disease or condition associated with chromodomain helicase DNA binding protein 2 (CHD2) haploinsufficiency in a subject in need of such treatment. A nucleic acid agent directed to the final exon of human Chaserr. ヒトChaserrの最終エクソンにハイブリダイズする核酸配列を含む核酸剤である、ヒトChaserrの活性又は発現の核酸剤。 A nucleic acid agent for the activity or expression of human Chaser, which is a nucleic acid agent comprising a nucleic acid sequence that hybridizes to the final exon of human Chaser. 前記ヒトChaserrが、配列番号11(NR_037600)、配列番号12(NR_037601)、及び配列番号13(NR_037602)からなる群より選択される選択的にスプライシングされた変異体(alternatively spliced variant)を含む、請求項1~請求項4のいずれか一項に記載の方法又は核酸剤。 The human Chaserr comprises an alternatively spliced variant selected from the group consisting of SEQ ID NO: 11 (NR_037600), SEQ ID NO: 12 (NR_037601), and SEQ ID NO: 13 (NR_037602). The method or nucleic acid agent according to any one of claims 1 to 4. 前記核酸剤が、配列番号2(AUGG)に相補的な配列を含む、請求項1~請求項5のいずれか一項に記載の方法又は核酸剤。 The method or nucleic acid agent according to any one of claims 1 to 5, wherein the nucleic acid agent comprises a sequence complementary to SEQ ID NO: 2 (AUGG). 前記核酸剤が、AAGAUG(配列番号5)又はAAAUGGA(配列番号6)に相補的な配列を含む、請求項1~請求項5のいずれか一項に記載の方法又は核酸剤。 The method or nucleic acid agent according to any one of claims 1 to 5, wherein the nucleic acid agent comprises a sequence complementary to AAGAUG (SEQ ID NO: 5) or AAAUGGA (SEQ ID NO: 6). 前記核酸剤が、UUUUUACCU(配列番号122)に相補的な配列を含む、請求項1~請求項5のいずれか一項に記載の方法又は核酸剤。 The method or nucleic acid agent according to any one of claims 1 to 5, wherein the nucleic acid agent comprises a sequence complementary to UUUUUACCU (SEQ ID NO: 122). 前記核酸剤が、ChaserrへのDHX36の結合を阻害する、請求項1~請求項8のいずれか一項に記載の方法又は核酸剤。 9. The method or nucleic acid agent of any one of claims 1 to 8, wherein the nucleic acid agent inhibits binding of DHX36 to Chaserr. 前記核酸剤が、ChaserrへのCHD2の結合を阻害する、請求項1~請求項8のいずれか一項に記載の方法又は核酸剤。 9. The method or nucleic acid agent according to any one of claims 1 to 8, wherein the nucleic acid agent inhibits binding of CHD2 to Chaserr. 前記核酸剤がアンチセンスオリゴヌクレオチドである、請求項1~請求項9のいずれか一項に記載の方法又は核酸剤。 The method or nucleic acid agent according to any one of claims 1 to 9, wherein the nucleic acid agent is an antisense oligonucleotide. 前記核酸剤が、2’から4’への架橋を含有する1又は複数のヌクレオチド、又は、2’-O修飾を有する1又は複数のヌクレオチドである、請求項1~請求項11のいずれか一項に記載の方法又は核酸剤。 Any one of claims 1 to 11, wherein the nucleic acid agent is one or more nucleotides containing a 2' to 4' bridge, or one or more nucleotides having a 2'-O modification. The method or nucleic acid agent described in section. 前記アンチセンスオリゴヌクレオチドが、配列番号92~99に示されるとおりである、請求項9に記載の方法又は核酸剤。 10. The method or nucleic acid agent of claim 9, wherein the antisense oligonucleotide is as shown in SEQ ID NOs: 92-99. 前記アンチセンスオリゴヌクレオチドが、配列番号128、131、132、133、140、141、142、又は143に示されるとおりである、請求項10又は請求項12に記載の方法又は核酸剤。 13. The method or nucleic acid agent of claim 10 or claim 12, wherein the antisense oligonucleotide is as shown in SEQ ID NO: 128, 131, 132, 133, 140, 141, 142, or 143. 前記アンチセンスオリゴヌクレオチドが、2種以上のアンチセンスオリゴヌクレオチドを含む、請求項11、請求項12、及び請求項13のいずれか一項に記載の方法又は核酸剤。 14. The method or nucleic acid agent according to any one of claims 11, 12, and 13, wherein the antisense oligonucleotide comprises two or more types of antisense oligonucleotides. 前記2種以上のアンチセンスオリゴヌクレオチドが、配列番号140又は配列番号128のASO40、及び配列番号144又は配列番号134のASO41を含む、請求項15に記載の方法又は核酸剤。 16. The method or nucleic acid agent according to claim 15, wherein the two or more antisense oligonucleotides include ASO40 of SEQ ID NO: 140 or SEQ ID NO: 128, and ASO41 of SEQ ID NO: 144 or SEQ ID NO: 134. 前記核酸剤がRNAサイレンシング剤(RNA silencing agent)である、請求項1~請求項10のいずれか一項に記載の方法又は核酸剤。 The method or nucleic acid agent according to any one of claims 1 to 10, wherein the nucleic acid agent is an RNA silencing agent. 前記核酸剤がゲノム編集剤(genome editing agent)である、請求項1~請求項10のいずれか一項に記載の方法又は核酸剤。 The method or nucleic acid agent according to any one of claims 1 to 10, wherein the nucleic acid agent is a genome editing agent. 前記核酸剤が、誘導可能に活性である(is active in an inducible manner)、請求項1~請求項18のいずれか一項に記載の方法又は核酸剤。 19. The method or nucleic acid agent of any one of claims 1 to 18, wherein the nucleic acid agent is active in an inducible manner. 前記核酸剤が、組織特異的又は細胞特異的に活性である(is active in a tissue or cell-specific manner)、請求項1~請求項10のいずれか一項に記載の方法又は核酸剤。 11. The method or nucleic acid agent according to any one of claims 1 to 10, wherein the nucleic acid agent is active in a tissue or cell-specific manner. 前記クロモドメインヘリカーゼDNA結合タンパク質2(CHD2)ハプロ不全に関連する疾患又は病状は、知的障害、自閉症、てんかん及びレノックス・ガストー症候群(LGS)からなる群より選択される、請求項2~請求項20のいずれか一項に記載の方法又は核酸剤。 The disease or condition associated with chromodomain helicase DNA binding protein 2 (CHD2) haploinsufficiency is selected from the group consisting of intellectual disability, autism, epilepsy, and Lennox-Gastaut syndrome (LGS). 21. The method or nucleic acid agent according to any one of claims 20. 複数の相同なポリヌクレオチドを記述する配列のセットを分析する方法であって、
層に配置された複数のノードと、連続する層のノード同士を連結する複数のエッジとを有するグラフを構築すること、ここで、第1の層がクエリポリヌクレオチドを記述する配列を表し、各ノードがそれぞれの配列内のk量体(k-mer)を表し、各エッジが同一の又は相同なk量体を表すノード同士を連結し、kが6~12であるように、各層が前記セットのうちのある配列(a sequence of the set)を表す;
前記グラフのエッジに沿った連続的な非交差経路を求めて前記グラフを検索すること;及び
機能に関心が持たれる核酸配列として、少なくとも1つの経路に対応するk量体を同定する出力を生成すること
を含む方法。
A method for analyzing a set of sequences describing a plurality of homologous polynucleotides, the method comprising:
constructing a graph having a plurality of nodes arranged in layers and a plurality of edges connecting the nodes of successive layers, where the first layer represents a sequence describing the query polynucleotide; Each layer consists of the above-mentioned elements, such that the nodes represent k-mers in each array, each edge connects nodes representing the same or homologous k-mers, and k is between 6 and 12. represents a sequence of the set;
searching the graph for continuous non-intersecting paths along edges of the graph; and producing an output identifying k-mers corresponding to at least one path as nucleic acid sequences of functional interest; A method that includes doing.
前記出力を生成することの前に、毎回より短くなるについて、前記構築すること及び前記検索することを反復的に繰り返すことを含む、請求項22に記載の方法。 23. The method of claim 22, comprising iteratively repeating the building and searching for a shorter length each time before generating the output. 前記方法が、各反復サイクルで、前記検索のための制約として、前の反復サイクルで得られた経路を適用することを含む、請求項23に記載の方法。 24. The method of claim 23, wherein the method comprises, at each iteration cycle, applying as a constraint for the search a path obtained in a previous iteration cycle. 前記検索することが、浅い方の経路よりも深い方の経路に対して検索が優先的であるように、前記検索のための制約として経路深度による基準を適用することを含む、請求項22~請求項24のいずれか一項に記載の方法。 Claims 22 to 22, wherein the searching includes applying a criterion based on path depth as a constraint for the search, such that searching is given priority to deeper routes than shallower routes. 25. A method according to any one of claims 24. 前記検索することが、整数線形計画法(Integer Linear Program:ILP)を前記グラフに適用することを含む、請求項22~請求項25のいずれか一項に記載の方法。 26. The method of any one of claims 22 to 25, wherein said searching comprises applying an Integer Linear Program (ILP) to said graph. 前記相同なポリヌクレオチドがDNA配列である、請求項22~請求項25のいずれか一項に記載の方法。 26. A method according to any one of claims 22 to 25, wherein the homologous polynucleotide is a DNA sequence. 前記相同なポリヌクレオチドがRNA配列である、請求項22~請求項25のいずれか一項に記載の方法。 26. A method according to any one of claims 22 to 25, wherein the homologous polynucleotide is an RNA sequence. 複数のアライメント層を有するマルチプルアライメントを提供するように、前記セット内の前記配列を所定の順序に従ってアライメントすることを含み、ここで第1の層は、前記複数の相同なポリヌクレオチドのうちの前記クエリポリヌクレオチドであり、前記複数のアライメント層は、前記グラフのそれぞれの層に対応する、請求項22~請求項28のいずれか一項に記載の方法。 aligning the sequences in the set according to a predetermined order to provide a multiple alignment having multiple alignment layers, wherein a first layer 29. The method of any one of claims 22 to 28, wherein the query polynucleotide is a query polynucleotide, and the plurality of alignment layers correspond to respective layers of the graph. 前記所定の順序は、進化によって決定され(evolution-dictated)、任意に(optionally)、前記クエリは、前記相同なポリヌクレオチドにおいて最も進化が進んだものである、請求項29に記載の方法。 30. The method of claim 29, wherein the predetermined order is evolution-dictated, and optionally, the query is the most evolved of the homologous polynucleotides. 前記相同なk量体の間の相同性が70%以上である、請求項22~請求項30のいずれか一項に記載の方法。 The method according to any one of claims 22 to 30, wherein the homology between the homologous k-mers is 70% or more. 前記相同なポリヌクレオチドが、部分配列を含む、請求項22~請求項31のいずれか一項に記載の方法。 32. The method of any one of claims 22 to 31, wherein the homologous polynucleotide comprises a partial sequence. 前記相同なポリヌクレオチドが、3’UTR、lncRNA及びエンハンサーからなる群より選択される、請求項22~請求項32のいずれか一項に記載の方法。
33. The method of any one of claims 22 to 32, wherein the homologous polynucleotide is selected from the group consisting of 3'UTR, lncRNA and enhancer.
JP2023537335A 2020-12-18 2021-12-19 Compositions and methods for their identification for use in the treatment of CHD2 haploinsufficiency Pending JP2024500804A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063127212P 2020-12-18 2020-12-18
US63/127,212 2020-12-18
PCT/IL2021/051503 WO2022130388A2 (en) 2020-12-18 2021-12-19 Compositions for use in the treatment of chd2 haploinsufficiency and methods of identifying same

Publications (1)

Publication Number Publication Date
JP2024500804A true JP2024500804A (en) 2024-01-10

Family

ID=79830820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023537335A Pending JP2024500804A (en) 2020-12-18 2021-12-19 Compositions and methods for their identification for use in the treatment of CHD2 haploinsufficiency

Country Status (9)

Country Link
US (1) US20240124881A1 (en)
EP (1) EP4263832A2 (en)
JP (1) JP2024500804A (en)
KR (1) KR20230132472A (en)
CN (1) CN116829715A (en)
AU (1) AU2021400235A1 (en)
CA (1) CA3202382A1 (en)
IL (1) IL303753A (en)
WO (1) WO2022130388A2 (en)

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US5464764A (en) 1989-08-22 1995-11-07 University Of Utah Research Foundation Positive-negative selection methods and vectors
PL169576B1 (en) 1990-10-12 1996-08-30 Max Planck Gesellschaft Method of obtaining rna molecule of catalytic activity
DE4216134A1 (en) 1991-06-20 1992-12-24 Europ Lab Molekularbiolog SYNTHETIC CATALYTIC OLIGONUCLEOTIDE STRUCTURES
US5652094A (en) 1992-01-31 1997-07-29 University Of Montreal Nucleozymes
US5627053A (en) 1994-03-29 1997-05-06 Ribozyme Pharmaceuticals, Inc. 2'deoxy-2'-alkylnucleotide containing nucleic acid
US5716824A (en) 1995-04-20 1998-02-10 Ribozyme Pharmaceuticals, Inc. 2'-O-alkylthioalkyl and 2-C-alkylthioalkyl-containing enzymatic nucleic acids (ribozymes)
US5998203A (en) 1996-04-16 1999-12-07 Ribozyme Pharmaceuticals, Inc. Enzymatic nucleic acids containing 5'-and/or 3'-cap structures
AU1430097A (en) 1996-01-16 1997-08-11 Ribozyme Pharmaceuticals, Inc. Synthesis of methoxy nucleosides and enzymatic nucleic acid molecules
US5849902A (en) 1996-09-26 1998-12-15 Oligos Etc. Inc. Three component chimeric antisense oligonucleotides
US6774279B2 (en) 1997-05-30 2004-08-10 Carnegie Institution Of Washington Use of FLP recombinase in mice
EP1504092B2 (en) 2002-03-21 2014-06-25 Sangamo BioSciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
MXPA06002962A (en) 2003-09-16 2006-06-14 Astrazeneca Ab Quinazoline derivatives.
US20060014264A1 (en) 2004-07-13 2006-01-19 Stowers Institute For Medical Research Cre/lox system with lox sites having an extended spacer region
EP2067402A1 (en) 2007-12-07 2009-06-10 Max Delbrück Centrum für Molekulare Medizin (MDC) Berlin-Buch; Transponson-mediated mutagenesis in spermatogonial stem cells
AU2011256838B2 (en) 2010-05-17 2014-10-09 Sangamo Therapeutics, Inc. Novel DNA-binding proteins and uses thereof
EP2819703A4 (en) 2012-02-29 2015-11-18 Benitec Biopharma Ltd Pain treatment
SG10202110062SA (en) 2012-11-27 2021-11-29 Childrens Medical Center Targeting Bcl11a Distal Regulatory Elements for Fetal Hemoglobin Reinduction
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP2943571A4 (en) 2013-01-08 2016-11-30 Benitec Biopharma Ltd Age-related macular degeneration treatment
WO2019060432A2 (en) * 2017-09-19 2019-03-28 Children's National Medical Center Gapmers and methods of using the same for treatment of muscular dystrophy

Also Published As

Publication number Publication date
AU2021400235A1 (en) 2023-07-20
KR20230132472A (en) 2023-09-15
WO2022130388A3 (en) 2022-11-10
EP4263832A2 (en) 2023-10-25
IL303753A (en) 2023-08-01
CA3202382A1 (en) 2022-06-23
CN116829715A (en) 2023-09-29
US20240124881A1 (en) 2024-04-18
WO2022130388A2 (en) 2022-06-23

Similar Documents

Publication Publication Date Title
US20220403380A1 (en) RNA Interactome of Polycomb Repressive Complex 1 (PRC1)
Kleaveland et al. A network of noncoding regulatory RNAs acts in the mammalian brain
Wilson et al. Dicer-TRBP complex formation ensures accurate mammalian microRNA biogenesis
JP6422463B2 (en) Natural antisense and non-coding RNA transcripts as drug targets
CN102239260B (en) Treatment of apolipoprotein-a1 related diseases by inhibition of natural antisense transcript to apolipoprotein-a1
JP6025567B2 (en) Treatment of MBTPS1-related diseases by inhibition of the natural antisense transcript against the membrane-bound transcription factor peptidase, site 1 (MBTPS1)
US20160264934A1 (en) METHODS FOR MODULATING AND ASSAYING m6A IN STEM CELL POPULATIONS
Wang et al. RNA-DNA differences are generated in human cells within seconds after RNA exits polymerase II
WO2016164463A1 (en) Methods for reactivating genes on the inactive x chromosome
US20220049255A1 (en) Modulating the cellular stress response
Quarles et al. Ensemble analysis of primary microRNA structure reveals an extensive capacity to deform near the Drosha cleavage site
Rai et al. Decoding the complexity of circular RNAs in cardiovascular disease
Min et al. Mechanisms of insertions at a DNA double-strand break
WO2021114137A1 (en) Long non-coding rna letn serving as tumor marker and therapeutic target point
US20240124881A1 (en) Compositions for use in the treatment of chd2 haploinsufficiency and methods of identifying same
US20200157537A1 (en) Modulating RNA Interactions with Polycomb Repressive Complex 1 (PRC1)
US10487328B2 (en) Blocking Hepatitis C Virus infection associated liver tumor development with HCV-specific antisense RNA
Toomer et al. Long Non-coding RNAs Diversity in Form and Function: From Microbes to Humans
Glenfield Alternative routes to optimal expression levels: evolutionary evidence for competitive endogenous RNAs and dosage compensation by gene duplication
Cheng et al. Genetics of Hypertension
Keightley et al. Experimental approaches to studying the nature and impact of splicing variation in zebrafish
Munn II Characterization of AGO3 Variants of Unknown Significance: Impact on Biophysical Properties and the Transcriptome
Putzbach Toxicity Mediated by Seed-Dependent Off-Target Effects in RNA Interference
Huelga Comprehensive discovery and analysis of RNA binding protein-dependent post-transcriptional events in mammalian systems
Best Identification and characterisation of RNA targets of the RNA binding proteins TRa2a and TRa2B

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20230620