KR102879552B1

KR102879552B1 - 티아민 유사체 및 유도체를 결합하는 압타머

Info

Publication number: KR102879552B1
Application number: KR1020227036795A
Authority: KR
Inventors: 쉬에퀴 궈; 알렉산드리아 포브스; 케빈 지. 리우; 지-인 김
Original assignee: 메이라지티엑스 진 레귤레이션 리미티드
Priority date: 2020-03-24
Filing date: 2021-03-24
Publication date: 2025-11-10
Anticipated expiration: 2041-03-24
Also published as: CA3172864A1; PH12022552557A1; US20230265441A1; JP7542644B2; IL296711A; AU2021243743B2; AU2021243743A1; WO2021191680A1; JP2023519266A; IL296711B2; EP4127176A1; BR112022019284A2; KR20230019816A; US12570988B2; CN115698292A; MX2022011940A; IL296711B1

Abstract

본 개시내용은 티아민 유사체 및 유도체를 포함하는 특정 소분자에 결합하는 올리고뉴클레오티드 압타머 및 소분자에 결합하는 압타머를 생성하는 방법에 관한 것이다. 또한, 본원에 개시된 압타머를 포함하는 리보스위치 및 폴리뉴클레오티드 카세트가 고려된다. 치료 유전자를 포함하는 표적 유전자의 조절을 위해 상기 압타머, 리보스위치, 및/또는 폴리뉴클레오티드를 사용하는 방법이 또한 제공된다. 표적 유전자 발현의 조절자인 소분자가 추가로 제공되는데, 여기서 표적 유전자는 본원에 기술된 압타머를 포함하는 리보스위치를 포함한다.

Description

티아민 유사체 및 유도체를 결합하는 압타머

관련 출원에 대한 상호참조

본 출원은 2020년 3월 24일자로 출원된 미국 출원 번호 제62/994,135호를 우선권으로 주장하며, 이는 그 전체 내용이 본원에 인용되어 포함된다.

기술분야

본 개시내용은 특정 소분자에 결합하는 올리고뉴클레오티드 압타머 및 그 소분자에 결합하는 압타머를 생성하는 방법에 관한 것이다. 또한, 표적 유전자의 발현을 조절하기 위한 리보스위치 및 폴리뉴클레오티드 카세트가 고려되며, 여기서 폴리뉴클레오티드 카세트는 본원에 개시된 압타머를 포함한다. 표적 유전자 발현의 조절자인 소분자가 추가로 제공되는데, 여기서 표적 유전자는 본원에 기술된 압타머를 포함하는 리보스위치를 함유한다.

압타머는 표적 리간드에 높은 친화도 및 특이도로 결합하는 올리고뉴클레오티드이다. 이들의 핵산 서열은 임상 파이프라인에서 첫 번째 압타머 약물 및 추가 약물의 최근 FDA 승인으로 높은 치료적 및 진단적 가치가 있는 것으로 입증되었다. 이들 높은 수준의 특이성과 다양성은 암, 바이러스 감염 및 기타 질병을 비롯한 인간 질병과의 싸움에서 신흥 RNA 나노기술 분야의 중추 도구 중 하나로서 RNA 압타머를 확립했다.

또한, 압타머는 압타머 리간드의 존재 또는 부재 하에서 특정 효과를 갖는 리보스위치의 일부로서 활용될 수 있다. 예를 들어, 리보스위치는 압타머 리간드의 존재 또는 부재에 대한 반응으로 유전자 발현을 조절하는 데 사용될 수 있다.

그러나, 원핵(prokaryotic) 공급원에서 유래되거나 시험관내 선택 방법을 사용하여 생성된 압타머는 종종 진핵(eukaryotic) 시스템에서 치료 표적 유전자의 발현에 요구되는 기능을 입증하지 못한다. 이와 같이, 소분자 리간드의 존재 또는 부재에 반응하여 유전자 발현을 조절할 수 있는 새로운 압타머 서열이 필요하다.

티아민 피로포스페이트(TPP; thiamine pyrophosphate) 및 그 유사체 또는 유도체와 같은 소분자에 결합하는 압타머 서열이 본원에 제공된다. 또한, 표적 유전자의 발현을 조절하기 위한 리보스위치 및 폴리뉴클레오티드 카세트가 고려되며, 여기서 폴리뉴클레오티드 카세트는 본원에 개시된 압타머를 포함한다. 치료 유전자를 포함하는 표적 유전자의 조절을 위해 상기 압타머, 리보스위치, 및/또는 폴리뉴클레오티드 카세트를 사용하는 방법이 또한 제공된다. 표적 유전자 발현의 조절자인 소분자가 추가로 제공되는데, 여기서 표적 유전자는 본원에 기술된 압타머를 포함하는 리보스위치를 함유한다.

일 양태에서, 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트가 제공되는데, 여기서 폴리뉴클레오티드 카세트는 소분자에 결합하는 압타머를 암호화하는 서열을 포함하고, 여기서 압타머 암호화 서열은 다음을 포함한다:

ACX₁GGGGTCCGGCX₂TX₃TTCATTTGGCX₄CCGGTGAGAX₅X₆AX₇ACCCTTX₈X₉X₁₀X₁₁CCTGTTX₁₂ACGGATAATGCCGCX₁₃GCAGGGAGT (서열 ID 번호:1),

상기 식 중,

X₁은 A 또는 G이고;

X₂는 C이거나 뉴클레오티드가 없고;

X₃은 T이거나 뉴클레오티드가 없고;

X₄는 A 또는 G이고;

X₅는 임의의 뉴클레오티드이고;

X₆은 임의의 뉴클레오티드이고;

X₇은 임의의 뉴클레오티드이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 C, G, 또는 T이고;

X₁₀은 임의의 뉴클레오티드이고;

X₁₁은 A 또는 T이고;

X₁₂는 C 또는 T이고; 그리고

X₁₃은 C 또는 T이다.

일 양태에서, 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트가 제공되며, 여기서 폴리뉴클레오티드 카세트는 소분자에 결합하는 압타머를 암호화하는 서열을 포함하고, 여기서 압타머 암호화 서열은 이하를 포함한다

ACX₁GGGGTCCGGCX₂TX₃TTCATTTGGCGCCGGTGAGAX₅X₆AX₇ACCCTTX₈X₉X₁₀X₁₁CCTGTTX₁₂ACGGATAATGCCGCX₁₃GCAGGGAGT (서열 ID 번호:2),

상기 식 중,

X₁은 A 또는 G이고;

X₂는 C이거나 뉴클레오티드가 없고;

X₃은 T이거나 뉴클레오티드가 없고;

X₅는 G 또는 T이고;

X₆은 C 또는 T이고;

X₇은 C 또는 T이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 G 또는 T이고;

X₁₀은 A, G 또는 T이고;

X₁₁은 A 또는 T이고;

X₁₂는 C 또는 T이고; 그리고

X₁₃은 C 또는 T이다.

ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTTGAACCTGTTX₁₂ACGGATAATGCCGCX₁₃GCAGGGAGT (서열 ID 번호:3),

상기 식 중,

X₁₂는 C 또는 T이고; 그리고

X₁₃은 C 또는 T이다.

ACX₁GGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTX₈X₉X₁₀X₁₁CCTGTTTACGGATAATGCCGCCGCAGGGAGT (서열 ID 번호:4),

상기 식 중,

X₁은 A 또는 G이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 G 또는 T이고;

X₁₀은 A, G 또는 T이고; 그리고

X₁₁은 A 또는 T이다.

ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAX₅X₆AX₇ACCCTTTGAACCTGTTTACGGATAATGCCGCCGCAGGGAGT (서열 ID 번호:5),

상기 식 중,

X₅는 G 또는 T이고;

X₆은 C 또는 T이고; 그리고

X₇은 C 또는 T이다.

ACAGGGGTCCGGCCTTTTCATTTGGCX₄CCGGTGAGAX₅X₆AX₇ACCCTTX₈X₉X₁₀ACCTGTTCACGGATAATGCCGCTGCAGGGAGT (서열 ID 번호:6),

상기 식 중,

X₄는 A 또는 G이고;

X₅는 임의의 뉴클레오티드이고;

X₆은 임의의 뉴클레오티드이고;

X₇은 임의의 뉴클레오티드이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 C 또는 G이고; 그리고

X₁₀은 임의의 뉴클레오티드이다.

일 양태에서, 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트가 제공되며, 여기서 폴리뉴클레오티드 카세트는 소분자에 결합하는 압타머를 암호화하는 서열을 포함하고, 여기서 압타머 암호화 서열은 서열 ID 번호:7-36로 구성된 그룹에서 선택된 서열과 적어도 95% 동일한 서열을 포함한다(표 1 참조). 일 양태에서, 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트가 제공되며, 여기서 폴리뉴클레오티드 카세트는 소분자에 결합하는 압타머를 암호화하는 서열을 포함하고, 여기서 압타머 암호화 서열은 서열 ID 번호:7-36로 구성된 그룹에서 선택된 서열을 포함한다(표 1 참조).

일 양태에서, 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트가 제공되며, 여기서 폴리뉴클레오티드 카세트는 소분자에 결합하는 압타머를 암호화하는 서열을 포함하고, 여기서 압타머 암호화 서열은 서열 ID 번호: 8, 9, 14-18, 21, 25, 26, 및 30으로 구성된 그룹에서 선택된 서열과 적어도 95% 동일한 서열을 포함한다. 일 양태에서, 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트가 제공되며, 여기서 폴리뉴클레오티드 카세트는 소분자에 결합하는 압타머를 암호화하는 서열을 포함하고, 여기서 압타머 암호화 서열은 서열 ID 번호: 8, 9, 14-18, 21, 25, 26, 및 30으로 구성된 그룹에서 선택된 서열을 포함한다.

바람직한 구현예에서, 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트가 제공되며, 여기서 폴리뉴클레오티드 카세트는 소분자에 결합하는 압타머를 암호화하는 서열을 포함하고, 여기서 압타머 암호화 서열은 서열 ID 번호: 9, 14 및 26으로 구성된 그룹에서 선택된 서열과 적어도 95% 동일한 서열을 포함한다. 더욱 바람직한 구현예에서, 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트가 제공되며, 여기서 폴리뉴클레오티드 카세트는 소분자에 결합하는 압타머를 암호화하는 서열을 포함하고, 여기서 압타머 암호화 서열은 서열 ID 번호: 9, 14 및 26으로 구성된 그룹에서 선택된 서열을 포함한다.

일 양태에서, 소분자에 결합하는 압타머를 암호화하는 서열이 제공되며, 여기서 압타머 암호화 서열은 이하를 포함한다:

상기 식 중,

X₁은 A 또는 G이고;

X₂는 C이거나 뉴클레오티드가 없고;

X₃은 T이거나 뉴클레오티드가 없고;

X₄는 A 또는 G이고;

X₅는 임의의 뉴클레오티드이고;

X₆은 임의의 뉴클레오티드이고;

X₇은 임의의 뉴클레오티드이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 C, G, 또는 T이고;

X₁₀은 임의의 뉴클레오티드이고;

X₁₁은 A 또는 T이고;

X₁₂는 C 또는 T이고; 그리고

X₁₃은 C 또는 T이다.

구현예에서, 압타머 암호화 서열은 하기의 속성 중 하나 이상을 갖는다: X₁은 A가 아님; X₂는 C가 아님; X₃은 T가 아님; X₄는 G가 아님; X₅는 G가 아님; X₆은 C가 아님; X₇은 C가 아님; X₈은 T가 아님; X₉는 G가 아님; X₁₀은 A가 아님; X₁₁은 A가 아님; X₁₂는 T가 아님; 및 X₁₃은 C가 아님.

구현예에서, 하기 모두는 압타머 암호화 서열에 동시에 존재하지 않는다: X₁은 A임; X₂는 C임; X₃은 T임; X₄는 G임; X₅는 G임; X₆은 C임; X₇은 C임; X₈은 T임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂는 T임; 및 X₁₃은 C임.

상기 식 중,

X₁은 A 또는 G이고;

X₂는 C이거나 뉴클레오티드가 없고;

X₃은 T이거나 뉴클레오티드가 없고;

X₅는 G 또는 T이고;

X₆은 C 또는 T이고;

X₇은 C 또는 T이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 G 또는 T이고;

X₁₀은 A, G 또는 T이고;

X₁₁은 A 또는 T이고;

X₁₂는 C 또는 T이고; 그리고

X₁₃은 C 또는 T이다.

구현예에서, 압타머 암호화 서열은 하기 속성 중 하나 이상을 갖는다: X₁은 A가 아님; X₂는 C가 아님; X₃은 T가 아님; X₄는 G가 아님; X₅는 G가 아님; X₆은 C가 아님; X₇은 C가 아님; X₈은 T가 아님; X₉는 G가 아님; X₁₀은 A가 아님; X₁₁은 A가 아님; X₁₂는 T가 아님; 및 X₁₃은 C가 아님. 구현예에서, 하기 모두는 압타머 암호화 서열에 동시에 존재하지 않는다: X₁은 A임; X₂는 C임; X₃은 T임; X₅는 G임; X₆은 C임; X₇은 C임; X₈은 T임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂는 T임; 및 X₁₃은 C임.

상기 식 중,

X₁₂는 C 또는 T이고; 그리고

X₁₃은 C 또는 T이다.

구현예에서, 압타머 암호화 서열은 하기 속성 중 하나 이상을 갖는다: X₁₂는 T가 아님; 및 X₁₃은 C가 아님. 구현예에서, 하기 모두는 압타머 암호화 서열에 동시에 존재하지 않는다: X₁₂는 T임 및 X₁₃은 C임.

상기 식 중,

X₁은 A 또는 G이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 G 또는 T이고;

X₁₀은 A, G 또는 T이고; 그리고

X₁₁은 A 또는 T이다.

구현예에서, 압타머 암호화 서열은 하기 속성 중 하나 이상을 갖는다: X₁은 A가 아님; X₈은 T가 아님; X₉는 G가 아님; X₁₀은 A가 아님; X₁₁은 A가 아님. 구현예에서, 하기 모두는 압타머 암호화 서열에 동시에 존재하지 않는다: X₁은 A임; X₈은 T임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂는 T임; 및 X₁₃은 C임.

상기 식 중,

X₅는 G 또는 T이고;

X₆은 C 또는 T이고; 그리고

X₇은 C 또는 T이다.

구현예에서, 압타머 암호화 서열은 하기 속성 중 하나 이상을 갖는다: X₅는 G가 아님; X₆은 C가 아님; 및 X₇은 C가 아님. 구현예에서, 하기 모두는 압타머 암호화 서열에 동시에 존재하지 않는다: X₅는 G임; X₆은 C임; 및 X₇은 C임.

상기 식 중,

X₄는 A 또는 G이고;

X₅는 임의의 뉴클레오티드이고;

X₆은 임의의 뉴클레오티드이고;

X₇은 임의의 뉴클레오티드이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 C 또는 G이고; 그리고

X₁₀은 임의의 뉴클레오티드이다.

일 양태에서, 소분자에 결합하는 압타머를 암호화하는 서열이 제공되며, 여기서 압타머 암호화 서열은 서열 ID 번호: 7-36으로 이루어진 그룹으로부터 선택된 서열과 적어도 95% 동일한 서열을 포함한다 (표 1 참조). 일부 구현예에서, 압타머 암호화 서열은 서열 ID 번호:8, 9, 14-18, 21, 25, 26 및 30으로 이루어진 그룹으로부터 선택된 서열을 포함한다. 일 구현예에서, 압타머 암호화 서열은 서열 9, 14 및 26으로 이루어진 그룹으로부터 선택된 서열을 포함한다.

일부 구현예에서, 압타머는 화학식 I-VIII에 따른 구조를 갖는 소분자를 포함하는 본원에 개시된 소분자에 결합하거나, 그렇지 않으면 그의 존재에 반응한다. 구현예에서, 소분자는 화학식 I에 따른 구조를 갖는다:

상기 식 중:

R¹은 OH, 아미노, F, Cl, Br, 포스페이트, 피로포스페이트,

-O-C(=O)-C₁-C₆ 알킬, -O-C(=O)-C₂-C₆ 알케닐, -O-C(=O)-페닐,

-O-C(=O)-헤테로시클, -O-C(=O)-O-C₁-C₆ 알킬, -O-C(=O)-O-C₂-C₆ 알케닐,

-O-C(=O)-O-페닐, 및 -O-C(=O)-O-헤테로시클로 이루어진 그룹으로부터 선택된다.

구현예에서, 소분자는 화학식 II에 따른 구조를 갖는다:

상기 식 중:

R²는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, -(CH₂) _n -R⁶,

-C(=O)-R⁴, -C(=O)-O-R⁴, -CHR⁵-O-C(=O)-R⁴, -S-C₁-C₆ 알킬, -S-C₂-C₆ 알케닐,

-S-헤테로시클, 및 -S-CH₂-헤테로시클로 이루어진 그룹으로부터 선택되고;

또는 R²는 화합물이 디설파이드(-S-S-) 결합을 통해 연결된 화학식 II의 두 분자의 이량체를 형성하도록 하는 -S-[화학식 II]이고;

R³은 OH, 아미노, F, Cl, Br, 포스페이트, 피로포스페이트,

-O-C(=O)-C₁-C₆ 알킬, -O-C(=O)-C₁-C₆ 알케닐, -O-C(=O)-페닐,

-O-C(=O)-헤테로시클, -O-C(=O)-O-C₁-C₆ 알킬, -O-C(=O)-O-C₁-C₆ 알케닐,

-O-C(=O)-O-페닐, -O-C(=O)-O-헤테로시클로 이루어진 그룹으로부터 선택되고;

R⁴는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₉-C₁₄ 트리시클릴, -(C₁-C₆ 알킬)-아릴, -(C₂-C₆ 알케닐)-아릴, 아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택되고;

R⁵는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, 아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택되고;

R⁶은 히드록실, 아미노, 아미도, C₁-C₆ 알콕시, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, 아릴, 헤테로아릴 및 헤테로시클릴이고; 그리고

n은 1 내지 8이며;

여기서, 각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 트리시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 또는 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로 -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택된 1 내지 3 치환기로 치환될 수 있다.

구현예에서, 상기 소분자는 화학식 II에 따른 구조를 갖고:

상기 식 중:

R²는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, -(CH₂) _n -R⁶,

R³¹은 OH 및 포스페이트로 이루어진 그룹으로부터 선택되고;

R⁶ 은 히드록실, 아미노, 아미도, C₁-C₆ 알콕시, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, 아릴, 헤테로아릴 및 헤테로시클릴이고; 그리고

n은 1 내지 8이며;

여기서, 각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 트리시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 또는 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-( C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택된 1 내지 3개의 치환기로 치환될 수 있다.

구현예에서, 소분자는 화학식 IV에 따른 구조를 갖는다:

상기 식 중:

여기서, 각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 트리시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택된 1 내지 3개의 치환기로 치환될 수 있다.

구현예에서, 소분자는 화학식 V에 따른 구조를 갖는다:

상기 식 중:

구현예에서, 소분자는 화학식 VI에 따른 구조를 갖는다:

상기 식 중:

일부 구현예에서, 소분자는 화학식 VII에 따른 구조를 갖는다:

상기 식 중,

각각의 R⁷은, 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬) , -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, - S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 독립적으로 선택되고;

추가적으로 또는 대안적으로, 2개의 인접한 R⁷ 그룹은 함께 취해져서 0 내지 2개의 고리 헤테로원자를 함유하고 비치환되거나 또는 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁- C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 선택된 최대 4개의 치환기로 치환된, 융합된 5원 또는 6원 방향족 또는 비방향족 고리를 형성할 수 있고; 그리고

m은 0, 1, 2, 3, 또는 4이다.

일부 구현예에서, 소분자는 화학식 VIII에 따른 구조를 갖는다:

상기 식 중:

각각의 R⁸은, 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬) , -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, - S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 독립적으로 선택되고;

추가적으로 또는 대안적으로, 2개의 인접한 R⁸ 그룹은 함께 취해져서 0 내지 2개의 고리 헤테로원자를 함유하고 비치환되거나 또는 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁- C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 선택된 최대 4개의 치환기로 치환된, 융합된 5원 또는 6원 방향족 또는 비방향족 고리를 형성할 수 있고; 그리고

각각의 R⁹는, 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬) , -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, - S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 독립적으로 선택되고;

추가적으로 또는 대안적으로, 2개의 인접한 R⁹ 그룹은 함께 취해져서 0 내지 2개의 고리 헤테로원자를 함유하고 비치환되거나 또는 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁- C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 선택된 최대 4개의 치환기로 치환된, 융합된 5원 또는 6원 방향족 또는 비방향족 고리를 형성할 수 있고; 그리고

x는 0, 1, 2, 또는 3이고; 그리고

y는 0, 1, 2, 3, 또는 4이다.

일부 구현예에서, 압타머는 아세푸르티아민, 아세티아민, 알리티아민, 암프롤륨, 베클로티아민, 벤포티아민, 벤티아민, 비스벤티아민, 세토티아민, 시클로티아민, 퍼술티아민, 모노포스포티아민, 옥토티아민, 옥시티아민, 프로술티아민, 술부티아민, 티아민, 티아민 피로포스페이트 및 빈티아몰로 이루어진 그룹으로부터 선택된 소분자에 결합하거나 또는 그렇지 않으면 이들의 존재에 반응한다. 바람직일 구현예에서, 압타머는 벤포티아민, 퍼술티아민 및 프로술티아민으로 이루어진 그룹으로부터 선택된 소분자에 결합하거나 그렇지 않으면 그 존재에 반응한다. 일부 구현예에서, 압타머는 벤포티아민에 결합하거나 그렇지 않으면 그 존재에 반응한다. 일부 구현예에서, 압타머는 퍼술티아민에 결합하거나 그렇지 않으면 그 존재에 반응한다. 일부 구현예에서, 압타머는 프로술티아민에 결합하거나 그렇지 않으면 그 존재에 반응한다.

일부 구현예에서, 압타머는 등몰량(equimolar amount)의 퍼술티아민, 벤포티아민 또는 프로술티아민에 비해 티아민 피로포스페이트(TPP)에 대한 감소된 결합 및/또는 감소된 반응을 나타낸다. 압타머가 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트의 일부로서 암호화된 리보스위치의 맥락에 있는 일부 구현예에서, 압타머는 등몰량의 퍼술티아민, 벤포티아민 또는 프로술티아민과 비교하여 TPP에 대한 감소된 반응을 갖는다.

또한, 소분자에 대한 반응으로 표적 유전자 발현을 조절하기 위한 리보스위치가 제공되며, 여기서 리보스위치는 본원에 개시된 압타머를 포함한다. 일 구현예에서, 리보스위치 암호화 서열은 서열 ID 번호: 37를 포함한다.

또한, 소분자에 반응하여 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트가 제공되며, 상기 폴리뉴클레오티드 카세트는 이하를 포함한다:

(a) 리보스위치; 및

(b) 5' 인트론 및 3' 인트론이 측면에 있는 대안적으로 스플라이싱된 엑손,

여기서, 리보스위치는 (i) 3' 인트론의 5' 스플라이스 부위 서열을 포함하는 스템을 포함하는 효과기 영역, 및 (ii) 본원에 개시된 압타머를 포함하고; 그리고

여기서, 대안적으로 스플라이싱된 엑손은, 대안적으로 스플라이싱된 엑손이 표적 유전자 mRNA로 스플라이싱될 때 표적 유전자와 인-프레임(in-frame)인 정지 코돈을 포함한다.

일 구현예에서, 폴리뉴클레오티드 카세트는 서열 ID 번호:37의 서열을 포함하고 압타머 암호화 서열을 추가로 포함하는 리보스위치 암호화 서열을 포함하고, 여기서 압타머 서열은 본원에 개시된 압타머 서열로부터 선택된다.

일 구현예에서, 본원에 개시된 압타머, 리보스위치, 및/또는 폴리뉴클레오티드 카세트를 포함하는 핵산 분자가 제공된다.또한, 본원에 개시된 리보스위치 또는 폴리뉴클레오티드 카세트를 함유하는 표적 유전자를 포함하는 핵산 분자가 제공된다. 일 구현예에서, 폴리뉴클레오티드 카세트는 표적 유전자의 단백질 암호화 서열에 위치된다. 일 구현예에서, 폴리뉴클레오티드 카세트는 표적 유전자의 비번역 영역 또는 표적 유전자의 인트론에 위치된다.

또한, 본원에 개시된 임의의 핵산 분자를 포함하는 벡터가 제공된다. 일 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, 바이러스 벡터는 아데노바이러스 벡터, 아데노-연관 바이러스 벡터, 및 렌티바이러스 벡터로 이루어진 그룹으로부터 선택된다.

일 양태에서, 관심 화합물(예를 들어, 티아민 유사체 또는 유도체, 예컨대 화학식 I-VIII에 따른 화합물)에 반응하여 표적 유전자 발현을 조절하는 압타머를 식별하는 방법이 제공되며, 상기 방법은 이하의 단계들을 포함한다:

(i) 부모 압타머 서열(parent aptamer sequence)을 선택하는 단계;

(ii) 단계 (i)에서 선택된 압타머의 전부 또는 일부를 암호화하는 서열을 포함하는 리보스위치 라이브러리를 생성하는 단계 - 압타머 암호화 서열은 압타머 내의 하나 이상의 쌍을 이루지 않은 영역에 하나 이상의 무작위로 돌연변이된 뉴클레오티드를 포함하고, 돌연변이된 압타머 서열은 리포터 유전자의 발현을 제어하는 리보스위치의 맥락에 있음 -;

(iii) 부모 압타머 서열과 비교하여, 관심 화합물에 대한 노출에 대한 반응으로 표적 유전자 발현의 증가된 조절(예를 들어, 더 높은 배수 유도 또는 억제)을 갖는 압타머에 대해 단계 (ii) 로부터의 라이브러리를 스크리닝하는 단계;

(iv) (단계 (i)에서 선택된 압타머 대신에 단계 (iii)에서 식별된 압타머에 대해) 선택적으로 단계 (ii) 및 (iii)을 반복하는 단계.

구현예에서, 부모 압타머 서열은 TTP 압타머(추정 TPP 압타머 또는 공지된 TPP 압타머 포함)이다. 구현예에서, 부모 압타머 서열은 Rfam TPP 리보스위치 패밀리 RF00059로부터 선택된다. 구현예에서, 압타머 서열의 하나 이상의 쌍을 이루지 않은 영역은 접합(J) 영역이다. 추가적으로 또는 대안적으로, 쌍을 이루지 않은 영역은 루프(L) 영역일 수 있다. 추가 구현예에서, 무작위로 돌연변이된 하나 이상의 쌍을 이루지 않은 영역에 하나 이상의 뉴클레오티드를 갖는 압타머를 암호화하는 서열은 또한 돌연변이된 쌍을 이룬(P) 영역에 하나 이상의 뉴클레오티드를 갖는다, 예를 들어 쌍을 이루지 않은 영역에 인접하는 하나 이상의 짝을 이룬 뉴클레오티드를 갖는다.

구현예에서, 관심 화합물은 티아민 유사체 또는 유도체이다. 구현예에서, 티아민 유사체는 퍼술티아민, 벤포티아민 또는 프로술티아민이다. 일 구현예에서, 압타머는 등몰량의 퍼술티아민, 벤포티아민 또는 프로술티아민에 비해 티아민 피로포스페이트(TPP)에 대한 감소된 결합 및/또는 감소된 반응을 나타낸다. 구현예에서, 관심 화합물은 화학식 I-VIII에 따른 화합물이다. 구현예에서, 관심 화합물은 화학식 I-III에 따른 화합물이다.

양태에서, 본 개시내용은 화학식 I-VIII의 화합물을 제공한다. 구현예에서, 본 개시내용은 약제학적 조성물 중의 화학식 I-VIII의 화합물을 제공한다.

도 1은, 각각 thiC 및 thiM TPP 압타머를 포함하는 합성 리보스위치 TPPz 또는 TPPm이 티아민 피로포스페이트(TPP) 또는 티아민 유사체로의 처리에 대한 반응으로 루시페라제 발현을 유도함을 예시한다. HEK 293 세포는 TPPz 또는 TPPm 리보스위치를 함유하는 루시페라제 유전자를 함유하는 구조물로 형질감염되었다. 형질감염된 세포는 TPP(도 1a), 퍼술티아민(도 1b), 프로술티아민(도 1c), 비스벤티아민, 베클로티아민 또는 설부티아민(도 1d)으로 표시된 용량으로 처리하거나 처리하지 않은 채로 남겨두었다. 루시페라제 활성은 평균 임의 광 단위(ALU) ± S.D.로 표현되었고, 배수 유도는 TPP 또는 티아민 유사체에 노출된 세포에 대해 기록된 루시페라제 활성을 TPP 또는 티아민 유사체에 노출되지 않은 세포에 대해 기록된 루시페라제 활성으로 나눈 몫으로 계산되었다.
도 2는 TPP 압타머 계열(Rfam 계열 RF00059)에서 빼낸 추정 압타머 서열(14G4)이 퍼술티아민에 대한 반응으로 루시페라제 발현을 조절함을 예시한다. 세포는 추정 TPP 압타머, 14G4(Rfam RF00059로부터의 수탁 번호 AACY023654033.1/903-800)를 포함하는 루시페라제-리보스위치 구조물로 형질감염되었다. 형질감염된 세포는 HEK 293 세포(도 2a) 또는 다른 유형의 인간 및 마우스 세포주(도 2b)에서 표시된 용량으로 퍼술티아민으로 처리되었다. 배수 유도는 퍼술티아민에 노출된 세포에 대해 기록된 루시페라제 활성의 몫을 퍼술티아민에 노출되지 않은 세포에 대해 기록된 루시페라제 활성으로 나눈 몫으로 계산되었다.
도 3은 천연 P1 줄기(서열 ID 번호:38)(도 3a) 및 압타머 14G4 암호화 서열 (서열 ID 번호:7) 및 그로부터 파생된 라이브러리(도 3b)를 갖는 부모 압타머 14G4의 예측된 구조를 나타낸다. 줄기 및 쌍을 이루지 않은 영역의 위치를 포함하는 14G4 압타머의 예측된 구조는 본원에 기재된 바와 같이 결정되었다. 각 염기 주위에 음영이 있는 구조는, 더 어두운 음영이 더 높은 확률을 나타내면서 자체 염기쌍 확률을 표시한다. 쌍을 이루지 않은 영역의 경우, 더 어두운 음영은 페어링되지 않을 확률을 나타낸다. 압타머 라이브러리 A1(서열 ID 번호:39), A2(서열 ID 번호:40), 또는 A3(서열 ID 번호:41)를 각각 얻기 위해 무작위로 돌연변이된 뉴클레오티드는 도 3b의 압타머 암호화 서열에서 "N"으로 표시 되고, 쌍을 이루지 않거나 쌍을 이루지 않은 영역에 인접한 뉴클레오티드에 해당한다.
도 4는 리보스위치에 포함된 압타머의 돌연변이 유발을 통한 유전자 조절 활성의 개선을 예시한다. 무작위로 돌연변이된 압타머(압타머 라이브러리 A1, A2 또는 A3에서 유래)를 포함하는 리보스위치 구조물은 HEK 세포에서 개선된 유전자 조절 활성에 대해 스크리닝되었다. 형질감염된 HEK 세포는 50 μM 퍼술티아민으로 처리되거나 처리되지 않은 채로 남겨두었다. 스크린에서 분리되고 리보스위치 14G4와 비교하여 개선된 유전자 조절 활성을 입증한 재설계된 압타머 서열을 포함하는 리보스위치의 예는 도 4a에 나타낸다. 도 4b는 재설계된 압타머 서열을 포함하는 리보스위치가 상이한 유형의 세포에서 표적 유전자의 용량 의존적 유도에 유용함을 예시한다. AML12, C2C12 및 ARPE-19 세포는 TransIT-X2 시약을 사용하여 재설계된 리보스위치 구조물로 형질감염되었다. 형질감염된 세포는 표시된 용량의 퍼술티아민으로 처리되었다. 도 4c는 재설계된 압타머 서열을 포함하는 리보스위치가 다른 TPP 유사체에 대한 반응으로 루시페라제 발현을 조절한다는 것을 예시한다. AML12 세포는 재설계된 압타머 서열을 포함하는 리보스위치로 형질감염되었고, 표시된 용량의 퍼술티아민, 벤포티아민 또는 프로술티아민으로 처리되었다. 도 4a-4c :배수 유도는 TPP 또는 티아민 유사체에 노출된 세포에 대해 기록된 루시페라제 활성의 몫을 TPP 또는 티아민 유사체에 노출되지 않은 세포에 대해 기록된 루시페라제 활성으로 나눈 값으로 계산되었다.
도 5는 14G4의 돌연변이 유발을 통해 얻은 3H4 압타머 암호화 서열의 염기 서열(서열 ID 번호:9)을 나타낸다. 압타머 라이브러리 A4(서열 ID 번호:42)를 얻기 위해 무작위로 돌연변이된 뉴클레오티드는 압타머 암호화 서열에서 "N"으로 표시된다.
도 6a는 압타머/리간드 결합에 관여하는 특정 압타머 뉴클레오티드의 돌연변이 유발이 포유동물 세포에서 압타머 기반 리보스위치의 유전자 조절 활성을 향상시킬 수 있음을 예시한다. HEK 293, ARPE-19 및 AML12 세포는 압타머 라이브러리 A4에서 분리된 재설계된 압타머 서열을 포함하는 리보스위치 구조물로 형질감염되었다. 형질감염된 세포는 표시된 용량의 퍼술티아민으로 처리하거나 처리하지 않은 채로 남겨두었다. 도 6b는 티아민과 화학적 구조적 특징을 공유하는 다른 티아민 유도체에 대한 반응으로 루시페라제의 발현을 유도하기 위해 재설계된 압타머 서열을 포함하는 리보스위치의 능력을 예시한다. AML12 세포는 표시된 리보스위치 구조물로 형질감염되고, 표시된 용량의 퍼술티아민, 벤포티아민 또는 프로술티아민으로 처리하거나 처리하지 않은 채로 남겨두었다. 배수 유도는 티아민 유사체 화합물로 처리된 세포에서 얻은 루시페라제 활성을 티아민 유사체 처리하지 않은 세포에서 얻은 루시페라제 활성으로 나눈 몫으로 계산되었다.
도 7은 리간드에 대한 반응으로 다양한 표적 유전자의 발현을 유도하기 위해 재설계된 압타머 서열을 포함하는 리보스위치의 능력을 예시한다. 도 7a 및 7b는 압타머 6B4를 포함하는 리보스위치가 퍼술티아민 처리에 대한 반응으로 강화된 녹색 형광 단백질(EGFP) 발현을 조절함을 예시한다. EGFP-6B4 구조물을 함유하는 안정적으로 형질감염된 HEK 293 세포는 50 μM(도 7a) 또는 표시된 용량(도 7b)의 퍼술티아민으로 24시간 동안 처리하거나 처리하지 않은 채로 남겨두었다. 도　7c 및 7d는, 3H4 또는 15D10을 각각 포함하는 리보스위치가 퍼술티아민 처리에 대한 반응으로 마우스 에리트로포이에틴(mEpo) 발현을 조절함을 예시한다. AML12 세포는 Epo-3H4 또는 Epo-15D10 구조물로 형질감염되었다. 형질감염된 세포는 표시된 용량의 퍼술티아민으로 처리하거나 처리하지 않은 채로 남겨두었다. mEpo의 발현은 mEpo ELISA를 사용하여 검출 및 정량화되었으며 평균 ± S.D.로 표현되었다(도 7c). 배수 유도는 퍼술티아민으로 처리된 세포로부터 생성된 mEpo의 양을 퍼술티아민 처리하지 않은 세포로부터 생성된 mEpo의 양으로 나눈 몫으로 계산되었다(도 7d).
도 8은 생체내에서 재설계된 압타머 서열을 포함하는 리보스위치에 의한 루시페라제의 유도성 발현을 예시한다. (1) 압타머가 없는 조절 불가능한 리보스위치("대조군 1"), (2) 압타머 3H4("스위치 3H4" 또는 "3H4")를 포함하는 리보스위치 카세트 또는 (3) 압타머 6B4("스위치 6B4" 또는 "6B4")를 포함하는 리보스위치 카세트를 갖는 인트론-대안 엑손-인트론 카세트를 함유하는 아데노 관련 AAV2/8 바이러스 입자가 생성되었다. Balb/c 마우스 (n=5 각 그룹)에 마우스당 1.0 x 10¹¹ (도 8a, 8b 및 8d) 또는 2.5 x 10¹¹(도 8c 및 8e) 바이러스 입자의 단일 꼬리 정맥 주사를 주사했다. AAV 전달 28일 후, 마우스에는 50 mg/kg 프로술티아민이 복강 내 주사되었다. 루시페라제 활성은 약물 투여 전날과, 약물 투여 후 6시간, 24시간, 48시간 및 72시간에 측정되었다. 프로술티아민의 첫 번째 투여 후, 마우스는 다음과 같이 3회의 추가 투여 및 영상화 주기를 받았다: (AAV 투여 후)36일차: 100 mg/kg; 43일차: 200 mg/kg; 및 51일차: 400 mg/kg. 도 8a는 재설계된 리보스위치 3H4 또는 6B4를 갖는 루시페라제 유전자를 포함하는 AAV 벡터로 형질감염된 마우스에 대해 표시된 시점 및 프로술티아민의 용량에 대한 루시페라제 발현을 나타낸다. 도 8b 및 8c는 약물 투여 전날 뿐만 아니라 투여 후 6시간, 24시간, 48시간 및 72시간에 상이한 그룹에 대해 관찰된 루시페라제 형광 강도를 나타낸다. 도 8d 및 8e는 상이한 약물 용량 및 그룹에 대한 약물 투여 후 프로술티아민 치료 시 루시페라제 발현의 상대적 증가를 나타낸다. 루시페라제 발현의 배수 유도는 프로술티아민으로 치료된 마우스로부터 얻은 광자/들을 프로술티아민 치료 하루 전에 마우스로부터 얻은 값으로 나눈 몫으로 계산되었다.
도 9는 화학식 IV, V 및 VI의 추가 티아민 유사체와 비교하여 퍼술티아민 또는 벤포티아민에 대한 반응으로 루시페라제 표적 유전자 발현의 유도를 나타낸다. 루시페라제 표적 유전자는 15D10 압타머를 포함하는 리보스위치를 암호화하는 서열을 함유했다. 그룹 IV 화합물은 HEK 293(도 9a) 및 AML 12(도 9b) 세포에서 루시페라제 발현을 유도하는 능력에 대해 테스트되었다. 그룹 V 및 그룹 VI 화합물은 HEK 293(도 9c) 및 AML 12(도 9d) 세포에서 루시페라제 발현을 유도하는 능력에 대해 테스트되었다. 가장 강력한 화합물은 ARPE-19(도 9e) 및 Hep G2(도 9f) 세포에서 루시페라제 발현을 유도하는 능력에 대해 추가로 테스트되었다.

본원에서는 티아민 또는 TPP와 같은 소분자 및 티아민 또는 TPP의 유사체 또는 유도체에 결합하거나 이들의 존재에 반응하는 압타머 서열이 제공된다. 일부 구현예에서, 본원에 제공된 압타머 서열은 티아민 또는 TPP의 유사체 또는 유도체에 반응하여 표적 유전자의 발현을 조절하는 데 유용하다. 본원에 개시된 압타머 서열을 포함하는 리보스위치 뿐만 아니라 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트가 또한 고려되며, 여기서 폴리뉴클레오티드 카세트는 본원에 개시된 리보스위치를 암호화하는 서열을 포함한다. 또한, 치료 유전자를 포함하는 표적 유전자의 조절 및 이를 필요로 하는 대상체의 치료를 위한 압타머, 리보스위치, 및/또는 폴리뉴클레오티드 카세트를 사용하는 방법이 제공된다.

압타머

압타머는 3차원 구조로 접혀 특정 리간드에 높은 친화도와 특이도로 비공유적으로 결합하는 단일 가닥 핵산 분자이다. 압타머 리간드는 이온, 소분자, 단백질, 바이러스 및 세포를 포함한다. 압타머 리간드는 예를 들어 유기 화합물, 아미노산, 스테로이드, 탄수화물 또는 뉴클레오티드일 수 있다. 소분자 압타머 리간드의 비제한적 예는, 항생제, 치료제, 염료, 보조인자, 대사산물, 분자 마커, 신경전달물질, 오염물질, 독소, 식품 불변물질, 발암물질, 남용 약물을 포함한다. 이와 같이, 압타머는 소분자 검출에 유용하다. 압타머에 의한 소분자 검출의 응용에는 환경 모니터링, 식품 안전, 의학(진단 포함), 미생물학, 분석 화학, 법의학, 농업 및 기초 생물학 연구가 포함된다.

본원에 사용된 용어 "압타머"는 리간드 부류에 특이적으로 결합하는 RNA 폴리뉴클레오티드(또는 RNA 폴리뉴클레오티드를 암호화하는 DNA 서열)를 지칭한다. "리간드"라는 용어는 압타머에 의해 특이적으로 결합된 분자를 지칭한다. 압타머는 의도한 표적 분자(즉, 리간드)와 복합체를 형성할 수 있는 결합 영역을 갖는다. 압타머는 전형적으로 길이가 약 15 내지 약 200개의 뉴클레오티드일 것이다. 보다 일반적으로, 압타머는 길이가 약 30개 내지 약 100개 뉴클레오티드, 예를 들어 길이가 70개 내지 90개 뉴클레오티드일 것이다. 압타머는 전형적으로 압타머가 줄기를 형성하는 다중 쌍을 이룬(P) 영역 및 압타머가 연결(J) 영역 또는 루프(L) 영역을 형성하는 쌍을 이루지 않은 영역을 포함한다. 쌍을 이룬 영역은 5' 말단(P1)에서 순차적으로 시작하여 각 줄기에 순차적으로 번호를 지정할 수 있다(P2, P3 등). 루프(L1, L2 등)는 인접한 쌍을 이룬 영역을 기준으로 번호가 지정되고, 연결 영역은 연결된 쌍을 이룬 영역에 따라 번호가 지정된다.

일 구현예에서, 압타머 암호화 서열은 이하를 포함한다

상기 식 중,

X₁은 A 또는 G이고;

X₂는 C이거나 뉴클레오티드가 없고;

X₃은 T이거나 뉴클레오티드가 없고;

X₄는 A 또는 G이고;

X₅는 임의의 뉴클레오티드이고;

X₆은 임의의 뉴클레오티드이고;

X₇은 임의의 뉴클레오티드이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 C, G, 또는 T이고;

X₁₀은 임의의 뉴클레오티드이고;

X₁₁은 A 또는 T이고;

X₁₂는 C 또는 T이고; 그리고

X₁₃은 C 또는 T이다.

구현예에서, 압타머 암호화 서열은 하기 속성 중 하나 이상을 갖는다: X₁은 A가 아님; X₂는 C가 아님; X₃은 T가 아님; X₄는 G가 아님; X₅는 G가 아님; X₆은 C가 아님; X₇은 C가 아님; X₈은 T가 아님; X₉는 G가 아님; X₁₀은 A가 아님; X₁₁은 A가 아님; X₁₂는 T가 아님; 및 X₁₃은 C가 아님. 실시예에서, 하기 모두는 압타머 암호화 서열에 동시에 존재하지 않는다: X₁은 A임; X₂는 C임; X₃은 T임; X₅는 G임; X₆은 C임; X₇은 C임; X₈은 T임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂는 T임; 및 X₁₃은 C임.

일 구현예에서, 압타머 암호화 서열은 이하를 포함한다

상기 식 중,

X₁은 A 또는 G이고;

X₂는 C이거나 뉴클레오티드가 없고;

X₃은 T이거나 뉴클레오티드가 없고;

X₅는 G 또는 T이고;

X₆은 C 또는 T이고;

X₇ 은 C 또는 T이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 G 또는 T이고;

X₁₀은 A, G 또는 T이고;

X₁₁은 A 또는 T이고;

X₁₂는 C 또는 T이고; 그리고

X₁₃은 C 또는 T이다.

구현예에서, 압타머 암호화 서열은 하기 속성 중 하나 이상을 갖는다: X₁은 A가 아님; X₂는 C가 아님; X₃은 T가 아님; X₄는 G가 아님; X₅는 G가 아님; X₆은 C가 아님; X₇은 C가 아님; X₈은 T가 아님; X₉는 G가 아님; X₁₀은 A가 아님; X₁₁은 A가 아님; X₁₂는 T가 아님; 및 X₁₃은 C가 아님. 실시예에서, 하기 모두는 압타머 서열에 동시에 존재하지 않는다: X₁은 A임; X₂는 C임; X₃은 T임; X₅는 G임; X₆은 C임; X₇은 C임; X₈은 T임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂는 T임; 및 X₁₃은 C임.

일 구현예에서, 압타머 암호화 서열은: ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTTGAACCTGTTX₁₂ACGGATAATGCCGCX₁₃GCAGGGAGT (서열 ID 번호:3)

상기 식 중,

X₁₂는 C 또는 T이고; 그리고

X₁₃은 C 또는 T이다.

구현예에서, 압타머 암호화 서열은 하기 속성 중 하나 이상을 갖는다: X₁₂는 T가 아님; 및 X₁₃은 C가 아님. 구현예에서, 하기 모두는 압타머 서열에 동시에 존재하지 않는다: X12 는 T임 및 X13 은 C임.

일 구현예에서, 압타머 암호화 서열은: ACX₁GGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTX₈X₉X₁₀X₁₁CCTGTTTACGGATAATGCCGCCGCAGGGAGT (서열 ID 번호:4)을 포함한다,

상기 식 중,

X₁은 A 또는 G이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 G 또는 T이고;

X₁₀은 A, G 또는 T이고; 그리고

X₁₁은 A 또는 T이다.

구현예에서, 압타머 암호화 서열은 하기 속성 중 하나 이상을 갖는다: X₁은 A가 아님; X₈은 T가 아님; X₉는 G가 아님; X₁₀은 A가 아님; X₁₁은 A가 아님. 구현예에서, 하기 모두는 압타머 서열에 동시에 존재하지 않는다: X₁은 A임; X₈은 T임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂는 T임; 및 X₁₃은 C임.

일 구현예에서, 압타머 암호화 서열은 이하를 포함한다:

상기 식 중,

X₅는 G 또는 T이고;

X₆은 C 또는 T이고; 그리고

X₇은 C 또는 T이다.

구현예에서, 압타머 암호화 서열은 하기 속성 중 하나 이상을 갖는다: X₅는 G가 아님; X₆은 C가 아님; 및 X₇은 C가 아님. 구현예에서, 하기 모두는 압타머 서열에 동시에 존재하지 않는다: X₅는 G임; X₆은 C임; 및 X₇은 C임.

일 구현예에서, 압타머 암호화 서열은: ACAGGGGTCCGGCCTTTTCATTTGGCX₄CCGGTGAGAX₅X₆AX₇ACCCTTX₈X₉X₁₀ACCTGTTCACGGATAATGCCGCTGCAGGGAGT (서열 ID 번호:6)를 포함한다,

상기 식 중,

X₄는 A 또는 G이고;

X₅는 임의의 뉴클레오티드이고;

X₆은 임의의 뉴클레오티드이고;

X₇은 임의의 뉴클레오티드이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 C 또는 G이고; 그리고

X₁₀은 임의의 뉴클레오티드이다.

일 구현예에서, 압타머 암호화 서열은 서열 ID 번호: 7-36으로 이루어진 그룹으로부터 선택된 서열을 포함한다(표 1 참조). 일 구현예에서, 압타머 암호화 서열은 서열 ID 번호: 7-36로 이루어진 그룹으로부터 선택된 서열과 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함한다. 표준 폴리펩티드 또는 핵산 서열과 관련하여 "퍼센트 서열 동일성(Percent sequence identity)"은, 서열을 정렬하고 필요한 경우 최대 퍼센트 서열 동일성을 성취하기 위해 갭을 도입한 후 표준 폴리펩티드 또는 핵산 서열내 아미노산 잔기 또는 뉴클레오티드와 동일한 후보 서열에서의 아미노산 잔기 또는 뉴클레오티드의 확률로서 정의된다. 퍼센트 아미노산 또는 핵산 서열 동일성을 결정하기 위한 목적으로의 정렬은, 예를 들어, BLAST, BLAST-2, ALIGN 또는 Megalign (DNASTAR) 소프트웨어를 비롯한 공개적으로 이용 가능한 컴퓨터 소프트웨어 프로그램을 사용하여 당업계에 공지된 다양한 방식으로 달성될 수 있다.

압타머 암호화 서열

서열 ID 번호:	압타머	압타머 암호화 서열
7	14G4(부모)	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTTGAACCTGTTTACGGATAATGCCGCCGCAGGGAGT
8	1D10	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGATTATACCCTTTGAACCTGTTTACGGATAATGCCGCCGCAGGGAGT
9	3H4	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTTGAACCTGTTCACGGATAATGCCGCTGCAGGGAGT
10	3F10	ACGGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTCGGACCTGTTTACGGATAATGCCGCCGCAGGGAGT
11	3H9	ACAGGGGTCCGGCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTATGACCTGTTTACGGATAATGCCGCCGCAGGGAGT
12	4G2	ACGGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTTGGACCTGTTTACGGATAATGCCGCCGCAGGGAGT
13	6D2	ACGGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTTGTTCCTGTTTACGGATAATGCCGCCGCAGGGAGT
14	6B4	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTGTGACCTGTTTACGGATAATGCCGCCGCAGGGAGT
15	4H2	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTCGGACCTGTTTACGGATAATGCCGCCGCAGGGAGT
16	6C4	ACGGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTCGAACCTGTTTACGGATAATGCCGCCGCAGGGAGT
17	6G12	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTTGGACCTGTTTACGGATAATGCCGCCGCAGGGAGT
18	8F1	ACGGGGGTCCGGCCTTTCATTTGGCGCCGGTGAGAGCACACCCTTCGGACCTGTTTACGGATAATGCCGCCGCAGGGAGT
19	10A7	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGATGATACCCTTTGGACCTGTTCACGGATAATGCCGCTGCAGGGAGT
20	12D5	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTTGGACCTGTTCACGGATAATGCCGCTGCAGGGAGT
21	12G7	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGATTATACCCTTCGGACCTGTTCACGGATAATGCCGCTGCAGGGAGT
22	12H3	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGATCACACCCTTACTACCTGTTCACGGATAATGCCGCTGCAGGGAGT
23	13H7	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAACAGACCCTTTGCACCTGTTCACGGATAATGCCGCTGCAGGGAGT
24	13B6	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAACACACCCTTTGTACCTGTTCACGGATAATGCCGCTGCAGGGAGT
25	15A5	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGATTATACCCTTACTACCTGTTCACGGATAATGCCGCTGCAGGGAGT
26	15D10	ACAGGGGTCCGGCCTTTTCATTTGGCACCGGTGAGAACATACCCTTCGGACCTGTTCACGGATAATGCCGCTGCAGGGAGT
27	15F9	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGATTACACCCTTAGCACCTGTTCACGGATAATGCCGCTGCAGGGAGT
28	16E5	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGATCAAACCCTTGGCACCTGTTCACGGATAATGCCGCTGCAGGGAGT
29	16G8	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGTACACCCTTCGCACCTGTTCACGGATAATGCCGCTGCAGGGAGT
30	16G6	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGATCACACCCTTGGTACCTGTTCACGGATAATGCCGCTGCAGGGAGT
31	17E2	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGATTACACCCTTTGGACCTGTTCACGGATAATGCCGCTGCAGGGAGT
32	17G1	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGATCACACCCTTGGAACCTGTTCACGGATAATGCCGCTGCAGGGAGT
33	17D3	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGGATACCCTTCGGACCTGTTCACGGATAATGCCGCTGCAGGGAGT
34	17F5	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGTATACCCTTAGTACCTGTTCACGGATAATGCCGCTGCAGGGAGT
35	17G3	ACAGGGGTCCGGCCTTTTCATTTGGCACCGGTGAGACAATACCCTTGGTACCTGTTCACGGATAATGCCGCTGCAGGGAGT
36	18G9	ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGAATACCCTTGGTACCTGTTCACGGATAATGCCGCTGCAGGGAGT

통상의 기술자는 본원에 기재된 압타머가 리보핵산(RNA) 분자일 수 있음을 이해할 것이다. 구현예에서, 본원에 기술된 압타머는 예를 들어, hnRNA, mRNA, siRNA 또는 miRNA를 포함하는 더 긴 RNA 폴리뉴클레오티드의 일부이다.

일 양태에서, 이하의 서열을 포함하는 압타머가 제공된다:

ACX₁GGGGUCCGGCX₂UX₃UUCAUUUGGCX₄CCGGUGAGAX₅X₆AX₇ACCCUUX₈X₉X₁₀X₁₁CCUGUUX₁₂ACGGAUAAUGCCGCX₁₃GCAGGGAGU (서열 ID 번호:43),

상기 식 중,

X₁은 A 또는 G이고;

X₂는 C이거나 뉴클레오티드가 없고;

X₃은 U이거나 뉴클레오티드가 없고;

X₄는 A 또는 G이고;

X₅는 임의의 뉴클레오티드이고;

X₆은 임의의 뉴클레오티드이고;

X₇은 임의의 뉴클레오티드이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 C, G, 또는 U이고;

X₁₀은 임의의 뉴클레오티드이고;

X₁₁은 A 또는 U이고;

X₁₂는 C 또는 U이고; 그리고

X₁₃은 C 또는 U이다.

구현예에서, 압타머 서열은 하기의 속성 중 하나 이상을 갖는다: X₁은 A가 아님; X₂는 C가 아님; X₃은 U가 아님; X₄는 G가 아님; X₅는 G가 아님; X₆은 C가 아님; X₇은 C가 아님; X₈은 U가 아님; X₉는 G가 아님; X₁₀은 A가 아님; X₁₁은 A가 아님; X₁₂는 U가 아님; 및 X₁₃은 C가 아님.

구현예에서, 하기 모두는 압타머 서열에 동시에 존재하지 않는다: X₁은 A임; X₂는 C임; X₃은 U임; X₄는 G임; X₅는 G임; X₆은 C임; X₇은 C임; X₈은 U임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂는 U임; 및 X₁₃은 C임.

일 양태에서, 이하의 서열을 포함하는 압타머가 제공된다:

ACX₁GGGGUCCGGCX₂UX₃UUCAUUUGGCGCCGGUGAGAX₅X₆AX₇ACCCUUX₈X₉X₁₀X₁₁CCUGUUX₁₂ACGGAUAAUGCCGCX₁₃GCAGGGAGU (서열 ID 번호:44),

상기 식 중,

X₁은 A 또는 G이고;

X₂는 C이거나 뉴클레오티드가 없고;

X₃은 U이거나 뉴클레오티드가 없고;

X₅는 G 또는 U이고;

X₆은 C 또는 U이고;

X₇은 C 또는 U이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 G 또는 U이고;

X₁₀은 A, G 또는 T이고;

X₁₁은 A 또는 U이고;

X₁₂는 C 또는 U이고; 그리고

X₁₃은 C 또는 U이다.

구현예에서, 압타머 서열은 하기 속성 중 하나 이상을 갖는다: X₁은 A가 아님; X₂는 C가 아님; X₃은 U가 아님; X₄는 G가 아님; X₅는 G가 아님; X₆은 C가 아님; X₇은 C가 아님; X₈은 U가 아님; X₉는 G가 아님; X₁₀은 A가 아님; X₁₁은 A가 아님; X₁₂는 U가 아님; 및 X₁₃은 C가 아님. 실시예에서, 하기 모두는 압타머 서열에 동시에 존재하지 않는다: X₁은 A임; X₂는 C임; X₃은 U임; X₅는 G임; X₆은 C임; X₇은 C임; X₈은 U임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂는 U임; 및 X₁₃은 C임.

일 양태에서, 이하의 서열을 포함하는 압타머가 제공된다:

ACAGGGGUCCGGCCUUUUCAUUUGGCGCCGGUGAGAGCACACCCUUUGAACCUGUUX₁₂ACGGAUAAUGCCGCX₁₃GCAGGGAGU (서열 ID 번호:45),

상기 식 중,

X₁₂는 C 또는 U이고; 그리고

X₁₃은 C 또는 U이다.

구현예에서, 압타머 열은 하기 속성 중 하나 이상을 갖는다: X₁₂는 U가 아님; 및 X₁₃은 C가 아님. 구현예에서, 하기 모두는 압타머 서열에 동시에 존재하지 않는다: X₁₂는 U임 및 X₁₃은 C임.

일 양태에서, 이하의 서열을 포함하는 압타머가 제공된다:

ACX₁GGGGUCCGGCCUUUUCAUUUGGCGCCGGUGAGAGCACACCCUUX₈X₉X₁₀X₁₁CCUGUUUACGGAUAAUGCCGCCGCAGGGAGU (서열 ID 번호:46),

상기 식 중,

X₁은 A 또는 G이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 G 또는 U이고;

X₁₀은 A, G 또는 U이고; 그리고

X₁₁은 A 또는 U이다.

구현예에서, 압타머 서열은 하기 속성 중 하나 이상을 갖는다: X₁은 A가 아님; X₈은 U가 아님; X₉는 G가 아님; X₁₀은 A가 아님; 및 X₁₁은 A가 아님. 구현예에서, 하기 모두는 압타머 서열에 동시에 존재하지 않는다: X₁은 A임; X₈은 U임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂는 U임; 및 X₁₃은 C임.

일 양태에서, 이하의 서열을 포함하는 압타머가 제공된다:

ACAGGGGUCCGGCCUUUUCAUUUGGCGCCGGUGAGAX₅X₆AX₇ACCCUUUGAACCUGUUUACGGAUAAUGCCGCCGCAGGGAGU (서열 ID 번호:47),

상기 식 중,

X₅는 G 또는 U이고;

X₆은 C 또는 U이고; 그리고

X₇은 C 또는 U이다.

구현예에서, 압타머 서열은 하기 속성 중 하나 이상을 갖는다: X₅는 G가 아님; X₆은 C가 아님; 및 X₇은 C가 아님. 구현예에서, 하기 모두는 압타머 서열에 동시에 존재하지 않는다: X₅는 G임; X₆ 은 C임; 및 X₇은 C임.

일 양태에서, 이하의 서열을 포함하는 압타머가 제공된다:

ACAGGGGUCCGGCCUUUUCAUUUGGCX₄CCGGUGAGAX₅X₆AX₇ACCCUUX₈X₉X₁₀ACCUGUUCACGGAUAAUGCCGCUGCAGGGAGU (서열 ID 번호:48),

상기 식 중,

X₄는 A 또는 G이고;

X₅는 임의의 뉴클레오티드이고;

X₆은 임의의 뉴클레오티드이고;

X₇은 임의의 뉴클레오티드이고;

X₈은 임의의 뉴클레오티드이고;

X₉는 C 또는 G이고; 그리고

X₁₀은 임의의 뉴클레오티드이다.

일 양태에서, 소분자에 결합하는 압타머가 제공되며, 여기서 압타머는 서열 ID 번호:49-78로 이루어진 그룹으로부터 선택된 서열과 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일한 서열을 포함한다. 일부 구현예에서, 압타머 서열은 서열 ID 번호:49-78로 이루어진 그룹으로부터 선택된 서열을 포함한다. 일부 구현예에서, 압타머 서열은 서열 ID 번호:51, 56 및 68로 이루어진 그룹으로부터 선택된 서열을 포함한다.

압타머 리간드

일 구현예에서, 압타머 리간드는 티아민(비타민 B1)이거나 티아민 유사체이고, 그리고/또는 티아민의 유도체이다. 본원에 사용된 바와 같이, 용어 "티아민 유사체"는 티아민과 비교하여 유사한 물리적, 화학적, 생화학적 또는 약리학적 특성을 갖는 분자를 지칭하며, 예를 들어 암프롤륨 또는 시코티아민을 포함한다. 티아민 유사체는 티아민 유도체일 수 있다. 본 명세서에 사용된 용어 "티아민 유도체"는 티아민 또는 이의 티아졸 개환 형태가 수정 또는 치환되어 유도된 화합물을 지칭한다. 티아민 유도체는 예를 들어, 아세푸르티아민, 아세티아민, 알리티아민, 베클로티아민, 벤포티아민, 벤티아민, 비스벤티아민, 세토티아민, 퍼술티아민, 모노포스포티아민, 옥토티아민, 프로술티아민, 술부티아민, 티아민, 티아민 피로몰포스페이트, 또는 빈티아몰을 포함할 수 있다.

일부 구현예에서, 압타머는 화학식 I-VIII에 따른 구조를 갖는 소분자를 포함하는 본원에 개시된 소분자에 결합하거나, 그렇지 않으면 그의 존재 또는 추가에 반응한다. 구현예에서, 소분자는 화학식 I에 따른 구조를 갖는다:

상기 식 중:

R¹은 OH, 아미노, F, Cl, Br, 포스페이트, 피로포스페이트,

-O-C(=O)-C₁-C₆ 알킬, -O-C(=O)-C₂-C₆ 알케닐, -O-C(=O)-페닐,

구현예에서, 소분자는 화학식 II에 따른 구조를 갖는다:

상기 식 중:

R²는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, -(CH₂) _n -R⁶,

R³은 OH, 아미노, F, Cl, Br, 포스페이트, 피로포스페이트,

-O-C(=O)-C₁-C₆ 알킬, -O-C(=O)-C₁-C₆ 알케닐, -O-C(=O)-페닐,

R⁴는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₉-C₁₄ 트리시클릴, -(C₁-C₆ 알킬)-아릴, -(C₂-C₆ 알케닐)-아릴, 아릴, 헤테로아릴 및 헤테로시클릴;

n은 1 내지 8이며;

여기서, 각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 또는 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-( C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택된 1 내지 3개의 치환기로 치환될 수 있다.

구현예에서, 소분자는 화학식 III에 따른 구조를 갖는다:

상기 식 중:

R²는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, -(CH₂) _n -R⁶,

n은 1 내지 8이며;

각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 트리시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-( C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택된 1 내지 3개의 치환기로 치환될 수 있다.

구현예에서, 소분자는 화학식 IV에 따른 구조를 갖는다:

상기 식 중:

구현예에서, 소분자는 화학식 V에 따른 구조를 갖는다:

상기 식 중:

여기서, 각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 트리시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-( C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 군으로부터 선택된 1 내지 3개의 치환기로 치환될 수 있다.

구현예에서, 소분자는 화학식 VI에 따른 구조를 갖는다:

상기 식 중:

구현예에서, 소분자는 화학식 VII에 따른 구조를 갖는다:

상기 식 중,

각각의 R⁷은, 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬) , -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, - S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 개별적으로 선택되고;

m은 0, 1, 2, 3, 또는 4이다.

상기 식 중:

각각의 R⁸은, 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬) , -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-( C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, - S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 독립적으로 선택되고;

x는 0, 1, 2, 또는 3이고; 그리고

y는 0, 1, 2, 3, 또는 4이다.

용어 "알킬"은 직쇄 알킬 기 및 분지쇄 알킬 기를 포함하는 포화 지방족 기의 라디칼을 지칭한다. 바람직한 구현예에서, 직쇄 또는 분지쇄 알킬은 백본에 6개 이하의 탄소 원자를 갖는다(예를 들어, 직쇄의 경우 C₁-C₆, 분지쇄의 경우 C₃-C₆) 알킬 기는 메틸, 에틸, 프로필, 이소프로필, n-부틸, 이소-부틸, tert-부틸, 펜틸, 이소펜틸, 헥실 등을 포함한다.

용어 "시클로알킬"은 고리에 3 내지 6개의 탄소를 갖는 포화된 탄소환식 기를 지칭한다. 시클로알킬 기는 시클로프로필, 시클로부틸, 시클로펜틸 및 시클로헥실을 포함한다.

용어 "비시클릴"은 융합되거나 가교될 수 있는 2개의 연결된 고리 시스템을 갖는 포화 탄소환식 기를 지칭한다. 비시클릭 기는 비시클[2.1.1]헥산, 비시클[2.2.1]헵탄, 데칼린 등을 포함한다. 용어 "트리시클릴"은 융합 및/또는 가교될 수 있는 3개의 연결된 고리 시스템을 갖는 포화 탄소환식 기를 지칭한다. 트리시클릭 기는 아다만탄 등을 포함한다.

용어 "알케닐"은 적어도 하나의 탄소-탄소 이중 결합을 갖는 직쇄 알케닐 기 및 분지쇄 알케닐 기를 포함하는 불포화 지방족 기를 지칭한다. 바람직일 구현예에서, 알케닐 기는 2 내지 6개의 탄소 원자를 갖는다(예를 들어, C₂-C₆ 알케닐).

본원에 사용된 용어 "할로겐" 또는 "할로"는 -F, -Cl, -Br 또는 -I, 바람직하게는 -F, -Cl 또는 -Br을 나타낸다.

본원에 사용된 용어 "알콕실" 또는 "알콕시"는, 산소 원자를 통해 부착된 상기 정의된 바와 같은 알킬 기를 지칭한다. 대표적인 알콕실 기는 메톡시, 에톡시, 프로필옥시, 및 tert-부톡시 등을 포함한다.

용어 "아민" 및 "아미노"는 비치환된 및 치환된 아민 둘 모두, 예를 들어, 이하의 일반식으로 나타낼 수 있는 모이어티를 의미한다:

여기서, R 및 R'는 각각 독립적으로 H 및 C₁-C₃ 알킬로부터 선택된다.

용어 "아미도"는 비치환된 및 치환된 아민 치환기 둘 모두, 예를 들면, 이하의 일반식으로 나타낼 수 있는 모이어티를 의미한다:

용어 "술폰아미드" 및 "술폰아미도"는 비치환된 및 치환된 술폰아미드 치환기 둘 모두, 예를 들어, 이하의 일반식으로 나타낼 수 있는 모이어티를 의미한다:

본원에 사용된 바와 같이 용어 "아릴"은, 0 내지 4개의 헤테로원자를 포함할 수 있는 5- 및 6-원 단일-고리 방향족 그룹, 예를 들어, 벤젠, 피렌, 피롤, 푸란, 티오펜, 이미다졸, 옥사졸, 티아졸, 트리아졸, 피라졸, 피리딘, 피라진, 피리다진 및 피리미딘을 포함한다. 고리 구조에서 헤테로원자를 갖는 해당 아릴기는 또한 "아릴 헤테로시클" 또는 "헤테로아릴" 기로 지칭될 수 있다. 용어 "아릴"은 또한, 2종 이상의 사이클릭 고리를 갖는 폴리사이클릭 고리계를 포함하고, 여기서 2종 이상의 탄소는 2개의 인접하는 고리에 공통이고(고리는 "융합 고리"임) 적어도 하나의 고리는 방향족이다. 따라서, 아릴은 0 내지 5개의 헤테로원자를 포함할 수 있는 8- 내지 10-원 융합된 이환 방향족 기를 포함하며, 여기서 하나 또는 둘 모두의 고리는 방향족, 예를 들어 나프틸렌, 퀴놀론, 이소퀴놀린, 벤조[b]티오펜, 테트라히드로나프텔렌 등을 포함한다. 각각의 아릴기는 미치환되거나 또는 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 선택된 1 내지 5개의 치환기들로 치환될 수 있다.

"헤테로시클릴"의 용어 "헤테로시클"은 1 내지 3개의 고리 헤테로원자를 갖는 비방향족 헤테로시클을 지칭한다. 바람직한 헤테로시클은 O, N 및 S로 이루어진 그룹으로부터 선택된 1 내지 3개의 헤테로원자를 갖는 5원 및 6원 헤테로시클릭 기이다.

용어 "헤테로원자"는, 본원에서 사용된 바와 같이, 탄소 또는 수소 이외의 임의의 원소의 원자를 의미한다. 바람직한 헤테로원자는 질소, 산소 및 황이다.

본원에 사용된 바와 같이, 임의의 구조에서 1회 이상 발생하는 경우, 각각의 표현, 예를 들어 알킬, R¹, R² 등의 정의는 동일한 구조의 다른 곳에서의 정의와는 독립적인 것으로 의도된다.

"치환" 또는 "로 치환된"은 이러한 치환이 치환된 원자및 치환체의 허용되는 원자가에 따르며 그리고 그 치환이, 예컨대, 재배열, 환화, 제거 등에 의해 변환을 자발적으로 받지 않는 안정적인 화합물을 내포된 조건을 포함하는 것이 이해될 것이다.

본원에 개시된 압타머 리간드는 특히 기하학적 또는 입체이성질체 형태 및 이들의 혼합물로 존재할 수 있다. 이러한 기하 또는 입체이성질체 형태는 시스- 및 트랜스-이성질체, R- 및 S-거울상이성질체, 부분입체이성질체, (D)-이성질체, (L)-이성질체, 이들의 라세미 혼합물, 및 이들의 다른 혼합물을 포함하지만, 이에 제한되지 않는다. 추가의 비대칭 탄소 원자는 알킬기와 같은 치환기에 존재할 수 있다.

화학식 I 내지 VIII에 따른 화합물은 산성 또는 염기성 작용기를 포함할 수 있으며, 이에 따라 염 형태로 존재할 수 있다. 바람직하게는, 염 형태는 약제학적으로 허용가능한 염이다. 용어 "약제학적으로 허용가능한 염"은 본원에 개시된 화합물의 상대적으로 비독성인, 무기 및 유기 산 및 염기 부가 염을 지칭한다.

화학식 I 내지 VIII에 따른 화합물은 아미노 또는 알킬아미노와 같은 하나 이상의 염기성 작용기를 함유할 수 있고, 이에 따라 약제학적으로 허용가능한 산과 약제학적으로 허용가능한 염을 형성할 수 있다. 이들 염은 투여 비히클 또는 투여 형태 제조 공정에서 인시츄로 제조되거나, 유리 염기 형태의 본원에 개시된 정제된 화합물을 적합한 유기 또는 무기산과 별도로 반응시킴으로써 그리고 이렇게 형성된 염을 후속 정제 동안 단리시킴으로써 제조될 수 있다. 대표적인 염은 브롬화수소산염, 염산염, 황산염, 중황산염, 인산염, 질산염, 아세트산염, 발레르산염, 올레산염, 팔미트산염, 스테아르산염, 라우르산염, 벤조산염, 락트산염, 인산염, 토실산염, 시트르산염, 말레산염, 푸마르산염, 숙신산염, 타르타르산염, 나프틸산염, 메실산염, 글루코헵톤산염, 락토비온산염 및 라우릴설폰산염 등(예를 들어, Berge et al. (1977) "Pharmaceutical Salts", J.Pharm. Sci. 66:1-19 참조)을 포함한다.

본 발명의 약제학적으로 허용가능한 염은, 예컨대, 비독성 무기 또는 유기 산으로부터 형성된 모 화합물의 비독성 염을 포함한다. 예를 들어, 이러한 기존의 무독성 염은, 무기 산, 예컨대, 염산염, 브롬화수소산, 황산, 설팜산, 인산, 질산 등으로부터 유도된 염; 및 유기 산, 예컨대, 아세트산, 프로피온산, 석신산, 글라이콜산, 스테아르산, 락트산, 말산, 타르타르산, 시트르산, 아스코르브산, 팔미트산, 말레산, 히드록시말레산, 페닐아세트산, 글루탐산, 벤조산, 살리실산, 설파닐산, 2-아세톡시벤조산, 푸마르산, 톨루엔설폰산, 메탄설폰산, 에탄 디설폰산, 옥살산, 이세티온산, 등으로부터 제조된 염을 포함한다.

일부 경우에서, 화학식 I 내지 VIII에 따른 화합물은 하나 이상의 산성 작용기를 포함할 수 있고, 이에 따라, 약제학적으로 허용가능한 염기와 함께 약제학적으로 허용가능한 염을 형성할 수 있다. 이들 염은 마찬가지로 투여 비히클 또는 제형 제조 공정에서 인시츄로, 또는 그의 유리 산 형태의 정제된 화합물을 적합한 염기, 예컨대 약제학적으로 허용가능한 금속 양이온의 수산화물, 탄산염 또는 중탄산염과, 암모니아와 또는 약제학적으로 허용가능한 유기 1차, 2차 또는 3차 아민과 별도로 반응시킴으로써 제조될 수 있다. 대표적인 알칼리 또는 알칼리토금속 염은 리튬, 나트륨, 칼륨, 칼슘, 마그네슘 및 알루미늄 염 등을 포함한다. 염기 부가염의 형성에 유용한 대표적인 유기 아민은 에틸아민, 다이에틸아민, 에틸렌다이아민, 에탄올아민, 다이에탄올아민, 피페라진 등(예를 들어, 상기 Berge et al., 참조)을 포함한다.

구현예에서, 본원에 제공된 압타머는 본원에 제공된 하나 이상의 티아민 또는 TPP 유사체에 결합하거나, 그렇지 않으면 그 존재에 반응하고, 그리고/또는 예를 들어 TPP 및/또는 티아민을 포함하는, 본원에 제공된 티아민 또는 TPP 유사체 또는 유도체의 대사산물에 결합하거나 그렇지 않으면 이에 반응한다.

그 리간드로의 압타머의 결합 특이성은 관련 없는 분자에 대한 압타머의 해리 상수와 비교하여 그 리간드에 대한 압타머의 비교 해리 상수(K_d)의 관점에서 정의될 수 있다. 따라서, 리간드는 관련 없는 물질보다 더 큰 친화력으로 압타머에 결합하는 분자이다. 전형적으로, 그 리간드와 관련된 압타머에 대한 K_d는 관련 없는 분자를 갖는 압타머에 대한 K_d보다 적어도 약 10배 작을 것이다. 다른 구현예에서, K_d는 관련 없는 분자를 갖는 압타머에 대한 K_d보다 적어도 약 20배, 적어도 약 50배, 적어도 약 100배, 및 적어도 약 200배, 적어도 약 500배, 적어도 약 1000배 또는 적어도 약 10,000배 작을 것이다.

일 구현예에서, 압타머는 화학식 I-VI1의 화합물 또는 아세푸르티아민, 아세티아민, 알리티아민, 베클로티아민, 벤포티아민, 벤티아민, 비스벤티아민, 세토티아민, 사이코티아민, 퍼술티아민, 모노포스포티아민, 옥토티아민, 프로술티아민, 술부티아민, 또는 빈티아몰에 대한 상기 압타머의 친화도 보다 적어도 5배, 적어도 10배, 적어도 약 20배, 적어도 50배, 적어도 100배, 적어도 500배, 적어도 1000배, 또는 적어도 10,000배의 친화도로 TPP에 결합한다. 일 구현예에서, 압타머는 화학식 I-VI1의 화합물 또는 아세푸르티아민, 아세티아민, 알리티아민, 베클로티아민, 벤포티아민, 벤티아민, 비스벤티아민, 세토티아민, 사이코티아민, 퍼술티아민, 모노포스포티아민, 옥토티아민, 프로술티아민, 술부티아민, 또는 빈티아몰에 대한 상기 압타머의 친화도 보다 적어도 5배, 적어도 10배, 적어도 약 20배, 적어도 50배, 적어도 100배, 적어도 500배, 적어도 1000배, 또는 적어도 10,000배의 친화도로 티아민에 결합한다.

유전자 발현 조절을 위한 압타머

일부 구현예에서, 본 개시내용에 의해 고려되는 압타머는 유전자 발현의 조절을 위해 사용된다. 표적 유전자(예를 들어, 치료적 전이유전자)의 발현 조절은 다양한 상황에서 유리하다. 예를 들어, 유전자의 치료적 발현의 맥락에서, 소분자의 존재에 대한 반응으로 전이유전자의 조절된 발현을 가능하게 하는 기술은 표적 유전자 발현 수준 및 그 타이밍의 조절을 허용함으로써 안전성과 효능을 향상시킬 수 있다. 연구 환경에서, 유전자 발현의 조절은 다양한 실험 조건의 체계적 조사를 허용한다.

구현예에서, 압타머를 암호화하는 서열은 본원에 기재된 소분자의 존재 또는 부재에 반응하여 표적 유전자의 발현 수준을 조절하는 능력을 제공하는 유전자 조절 카세트의 일부이다. 구현예에서, 유전자 조절 카세트는 표적 유전자를 추가로 포함한다. 본원에 사용된 바와 같이, "표적 유전자"는 본원에 개시된 압타머에 결합하는 소분자로 인해 본원에 개시된 소분자 리간드의 존재 또는 부재에 반응하여 발현되는 전이유전자를 지칭한다. 구현예에서, 표적 유전자는 단백질(예를 들어, 치료적 단백질), miRNA, 또는 siRNA에 대한 코딩 서열을 포함한다. 표적 유전자는 표적 유전자 발현 조절에 사용되는 압타머에 이종(heterologous)이며, 표적 유전자 조절에 사용되는 폴리뉴클레오티드 카세트에 이종이며, 및/또는 표적 유전자의 조절에 사용되는 폴리뉴클레오티드 카세트의 일부에 대한 이종이다.

리간드의 존재/부재에 반응하여 표적 유전자의 발현을 조절하기 위해 사용될 때, 본원에 기재된 압타머는 리보스위치의 일부로서 압타머를 암호화하는 폴리뉴클레오티드 카세트의 일부일 수 있다. "유전자 조절 카세트", "조절 카세트" 또는 "폴리뉴클레오티드 카세트"라는 용어는 본원에서 상호교환가능하게 사용된다.

구현예에서, 본원에 개시된 압타머에 결합하는 소분자의 존재는 소분자의 부재 하에서의 표적 유전자의 발현과 비교하여 표적 유전자의 발현의 증가를 유도한다. 이러한 실시예에서, 압타머는 "온" 스위치를 구성한다. 구현예에서, 표적 유전자의 발현은 소분자의 부재시와 비교하여 본원에 개시된 압타머에 결합하는 소분자의 존재시에 적어도 3배, 적어도 5배, 적어도 10배, 적어도 15배, 적어도 20배, 적어도 25배, 적어도 30배, 적어도 40배, 적어도 50배, 적어도 100배, 적어도 1000배, 또는 적어도 10,000배 증가된다. 구현예에서, 표적 유전자의 발현은 소분자의 부재시와 비교하여 본원에 개시된 압타머에 결합하는 소분자의 존재시에 2배 내지 10배, 5배 내지 10배, 5배 내지 15배, 5배 내지 20배, 5배 내지 25배, 5배 내지 30배, 10배 내지 20배, 10배 내지 30배, 10배 내지 40배, 10배 내지 50배, 10배 내지 100배, 10배 내지 500배, 10배 내지 1,000배, 50배 내지 100배, 50배 내지 500배, 50배 내지 100배, 50배 내지 1,000배, 100배 내지 1,000배, 또는 100배 내지 10,000배 증가된다.

구현예에서, 본원에 개시된 압타머에 결합하는 소분자의 존재는 소분자의 부재시에서의 표적 유전자의 발현과 비교하여 표적 유전자의 발현의 감소를 유도한다. 이러한 실시예에서, 압타머는 "오프" 스위치를 구성한다. 구현예에서, 표적 유전자의 발현은 소분자의 부재시와 비교하여 본원에 개시된 압타머에 결합하는 소분자의 존재시에 적어도 3배, 적어도 5배, 적어도 10배, 적어도 15배, 적어도 20배, 적어도 25배, 적어도 30배, 적어도 40배, 적어도 50배, 적어도 100배, 적어도 1000배, 또는 적어도 10,000배 감소된다. 일 구현예에서, 표적 유전자의 발현은 소분자의 부재시와 비교하여 본원에 개시된 압타머에 결합하는 소분자의 존재시에 2배 내지 10배, 5배 내지 10배, 5배 내지 15배, 5배 내지 20배, 5배 내지 25배, 5배 내지 30배, 10배 내지 20배, 10배 내지 30배, 10배 내지 40배, 10배 내지 50배, 10배 내지 100배, 10배 내지 500배, 10배 내지 1,000배, 50배 내지 100배, 50배 내지 500배, 50배 내지 100배, 50배 내지 1,000배, 100배 내지 1,000배, 또는 100배 내지 10,000배 감소된다.

구현예에서, 압타머는 리보스위치의 일부이다. 리보스위치는 RNA 폴리뉴클레오티드의 안정성을 조절하고 그리고/또는 압타머 특이적 리간드 분자의 존재 또는 부재에 대한 반응으로 RNA 폴리뉴클레오티드로부터 단백질의 생산을 조절하는 RNA 폴리뉴클레오티드의 조절 세그먼트이다. 구현예에서, 리보스위치는 리간드(예를 들어, 소분자)의 존재를 감지하고, 표적 유전자의 증가된 또는 감소된 발현을 유도하는 영향을 함께 야기하는 역할을 하는 센서 영역(예를 들어, 압타머 영역) 및 효과기 영역을 포함한다. 본원에 기재된 리보스위치는 2개 이상의 공급원으로부터의 폴리뉴클레오티드를 활용하는 재조합체(recombinant)이다. 구현예에서, 센서 및 효과기 영역은 폴리뉴클레오티드 링커에 의해 연결된다. 구현예에서, 폴리뉴클레오티드 링커는 RNA 줄기 또는 쌍을 이룬 영역(즉, 이중 가닥인 RNA 폴리뉴클레오티드의 영역)을 형성한다. 구현예에서, 압타머를 효과기 영역에 연결하는 쌍을 이룬 영역은 압타머 줄기의 전부 또는 일부(예를 들어, 압타머 P1 줄기의 전부 또는 일부)를 포함한다.

압타머 서열을 포함하는 리보스위치는, 예를 들어, 조기 전사 종결을 유도하는 rho-독립적 전사 종결 헤어핀의 형성을 제어하는 데 사용될 수 있다. 압타머 서열을 포함하는 리보스위치는 또한 RNA의 구조적 변화를 유도하여 리보솜 결합 부위에 대한 분리(sequestration) 및 번역 억제를 유발할 수 있다. 본원에 개시된 압타머 서열을 포함하는 대안적인 리보스위치 구조는 소분자 리간드의 존재에 대한 반응으로 mRNA의 스플라이싱에 추가로 영향을 미칠 수 있다.

대체 스플라이싱 리보스위치

일 구현예에서, 본원에 기재된 압타머는 결과 RNA(예를 들어, 프리-mRNA)의 압타머/리간드 매개 대체 스플라이싱에 의해 표적 유전자의 조절을 위한 유전자 조절 카세트의 일부로서 암호화된다. 이와 관련하여, 유전자 조절 카세트는 소분자 리간드의 존재를 감지하고 대안적인 엑손으로의 스플라이싱을 변경하는 역할을 함께 하는 센서 영역(예를 들어, 본원에 기재된 압타머) 및 효과기 영역을 포함하는 리보스위치를 포함한다. 스플라이싱은, 초기 프리-메신저 RNA(pre-mRNA)에서 인트론 서열이 제거되고 엑손이 함께 결합되어 mRNA를 형성하는 과정을 지칭한다. 스플라이스 부위는 엑손과 인트론 사이의 접합이며, 인트론의 5' 및 3' 말단(즉, 각각 스플라이스 공여체 및 스플라이스 수용체 부위)에서 서로 다른 공통 서열에 의해 정의된다. 스플라이싱은 작은 핵 리보핵단백질(snRNP)과 다양한 보조 단백질의 집합체인 스플라이세오솜(spliceosome)이라고 불리는 큰 다성분 구조에 의해 수행된다. 다양한 cis 조절 서열을 인식함으로써, 스플라이세오솜은 엑손/인트론 경계를 정의하고, 인트론 서열을 제거하고, 엑손을 함께 최종 메시지(예를 들어, mRNA)로 스플라이싱한다. 대안적 스플라이싱의 경우, 최종 코딩 메시지를 변경시켜 이로 인해 결과적으로 발현된 단백질을 변화시키기 위해 특정 엑손이 포함되거나 제외될 수 있다.

일 구현예에서, 표적 유전자 발현의 조절은 WO2016/126747에 개시된 임의의 DNA 구조물을 사용함으로써 달성되며, 이는 그 전체가 참조로 본 명세서에 포함된다. 본 개시내용의 구현예에서, WO2016/126747에 개시된 리보스위치 및 폴리뉴클레오티드 카세트는 WO2016/126747에 개시된 압타머 서열 대신에 본원에 기술된 압타머 암호화 서열을 포함한다.

일 구현예에서, 폴리뉴클레오티드 카세트는 (a) 리보스위치 및 (b) 5' 인트론 및 3' 인트론에 의해 플랭킹된 대안적으로 스플라이싱된 엑손을 포함하고, 여기서 리보스위치는 (i) 3' 인트론의 5' 스플라이스 부위 서열을 포함하는 줄기를 포함하는 효과기 영역, 및 (ii) 본원에 개시된 압타머를 포함한다. 구현예에서, 효과기 영역은 대안 엑손의 바로 3'인 인트론의 인트론 5' 스플라이스 부위("5' ss") 서열, 뿐만 아니라 3' 인트론의 5' ss 서열에 상보적인 서열을 포함한다. 압타머가 그 리간드와 결합하면, 효과기 영역은 줄기를 형성하여 대안 엑손의 3' 말단에 있는 스플라이스 공여체 부위로의 스플라이싱을 방지한다. 특정 조건(예를 들어, 압타머가 그 리간드에 결합되지 않은 경우)하에서, 효과기 영역은 대안 엑손의 3' 말단에 있는 스플라이스 공여체 부위에 대한 접근을 제공하여 표적 유전자 mRNA에 대안 엑손을 포함시키는 맥락에 있다. 일부 구현예에서, 폴리뉴클레오티드 카세트는 리간드에 반응하여 표적 유전자의 발현을 조절하기 위해 표적 유전자에 배치된다. 일 구현예에서, 대안적으로 스플라이싱된 엑손은, 대안적으로 스플라이싱된 엑손이 표적 유전자 mRNA로 스플라이싱될 때 표적 유전자와 인-프레임(in-frame)인 정지 코돈을 포함한다.

일 구현예에서, 유전자 조절 카세트는 서열 ID 번호:37의 서열을 포함하는데, 여기서 -X-는 본원에 개시된 압타머 암호화 서열을 나타낸다. 소문자는 압타머를 리보스위치의 나머지 부분에 연결하는 쌍을 이룬 줄기 서열을 나타낸다. 일 구현예에서, 대안 엑손(하기에서, 서열 ID 번호:37로 밑줄 침)은 다른 대안 엑손 서열로 대체된다.

서열 ID 번호:37 -

GTGAGTCTATGGGACCCTTGATGTTTTCTTTCCCCTTCTTTTCTATGGTTAAGTTCATGTCATAGGAAGGGGAGAAGTAACAGGGTACACATATTGACCAAATCAGGGTAATTTTGCATTTGTAATTTTAAAAAATGCTTTCTTCTTTTAATATACTTTTTTGTTTATCTTATTTCTAATACTTTCCCTAATCTCTTTCTTTCAGGGCAATAATGATACAATGTATCATGCCGAGTAACGCTGTTTCTCTAACTTGTAGGAATGAATTCAGATATTTCCAGAGAATGAAAAAAAAATCTTCAGTAGAAGgtaatgt-X-acattacGCACCATTCTAAAGAATAACAGTGATAATTTCTGGGTTAAGGCAATAGCAATATTTCTGCATATAAATATTTCTGCATATAAATTGTAACTGATGTAAGAGGTTTCATATTGCTAATAGCAGCTACAATCCAGCTACCATTCTGCTTTTATTTTATGGTTGGGATAAGGCTGGATTATTCTGAGTCCAAGCTAGGCCCTTTTGCTAATCATGTTCATACCTCTTATCTTCCTCCCACAG.

대안 엑손은 5' 및 3' 인트론 서열 옆에 배치된다. 본원에 개시된 유전자 조절 카세트에서 사용될 수 있는 5' 및 3' 인트론 서열은, 압타머에 결합하는 리간드의 존재 여부에 따라, 표적 유전자 mRNA 또는 mRNA에 대안 엑손을 포함하는 표적 유전자를 생성하는 표적 유전자로부터 스플라이싱될 수 있는 임의의 서열일 수 있다. 5' 및 3' 인트론 서열은 각각 스플라이싱이 일어나기 위해 필요한 서열, 즉 스플라이스 공여체, 스플라이스 수용체 및 분기점 서열을 갖는다. 일 구현예에서, 유전자 조절 카세트의 5' 및 3' 인트론 서열은 하나 이상의 자연 발생 인트론 또는 그의 일부로부터 유래된다. 일 구현예에서, 5' 및 3' 인트론 서열은 절단된 인간 베타-글로빈 인트론 2(IVS2△), 인간 03-글로빈 유전자의 인트론 2, SV40 mRNA 인트론(Clontech Laboratories, Inc. 사의 pCMV-LacZ 벡터에 사용됨), 인간 트리오스 포스페이트 이성화효소(TPI) 유전자의 인트론 6(Nott Ajit, et al. RNA. 2003, 9:6070617), 인간 인자 IX의 인트론(Sumiko Kurachi, et al. J. Bio. Chem. 1995, 270(10), 5276), 표적 유전자 자체의 내인성 인트론, 또는 임의의 게놈 단편 또는 조절된 스플라이싱(Thomas A. Cooper, Methods 2005 (37):331)에 충분한 엘리먼트들을 함유하는 합성 인트론(Yi Lai, et al. Hum Gene Ther. 2006:17(10): 1036)로부터 유래된다.

일 구현예에서, 대안 엑손 및 리보스위치는 표적 유전자의 내인성 인트론에 있도록 조작된다. 즉, 인트론(또는 실질적으로 유사한 인트론 서열)은 표적 유전자의 해당 위치에서 자연적으로 발생한다. 이 경우, 대안 엑손의 바로 상류에 있는 인트론 서열은 5' 인트론 또는 5' 인트론 서열이라 지칭되고, 대안 엑손의 바로 하류에 있는 인트론 서열은 3' 인트론 또는 3' 인트론 서열이라 지칭된다. 이 경우, 내인성 인트론은 대안 엑손의 5' 및 3' 말단 옆에 있는 스플라이스 수용체 서열 및 스플라이스 공여체 서열을 포함하도록 수정된다. 일 구현예에서, 5' 및/또는 3' 인트론은 표적 유전자에 대해 외인성이다.

대체 스플라이싱 유전자 조절 카세트의 스플라이스 공여체 및 스플라이스 수용체 부위는 강화되거나 약화되도록 수정될 수 있다. 즉, 스플라이스 부위는 표준 클로닝 방법, 부위 지정 돌연변이 유발 등에 의해 스플라이스 공여체 또는 수용체에 대한 컨센서스에 더 가깝도록 수정될 수 있다. 스플라이스 컨센서스와 더 유사한 스플라이스 부위는 스플라이싱을 촉진하는 경향이 있어 이에 따라 강화된다. 스플라이스 컨센서스와 덜 유사한 스플라이스 부위는 스플라이싱을 방해하는 경향이 있어 이에 따라 약화된다. 가장 일반적인 클래스의 인트론(U2)의 스플라이스 공여체에 대한 컨센서스는 A/C A G*G T A/G A G T (여기서, *는 엑손/인트론 경계를 나타냄)이다. 스플라이스 수용체에 대한 컨센서스는 C A G*G (여기서, *는 엑손/인트론 경계를 나타냄)이다. 스플라이스 공여체 및 수용체 부위에서 특정 뉴클레오티드의 빈도는 당업계에 기술되어 있다(예를 들어, Zhang, MQ, Hum Mol Genet. 1988. 7(5):919-932 참조). 5' 및 3' 스플라이스 부위의 강도는 대안 엑손의 스플라이싱을 조절하도록 조정될 수 있다.

스플라이싱을 조절하기 위해 만들어질 수 있는 대안적인 스플라이싱 유전자 조절 카세트에 존재하는 5' 및 3' 인트론에 대한 추가 수정은, 인트론 스플라이싱 인핸서 요소, 인트론 스플라이싱 억제자 요소 및/또는 스플라이스 부위의 수정, 삭제 및/또는 추가, 및/또는 분기 부위 서열의 수정을 포함한다.

일 구현예에서, 5' 인트론은 표적 유전자와 프레임 내에 있을 정지 코돈을 함유하도록 수정되었다. 5' 및 3' 인트론 서열은 또한 공개적으로 이용가능한 소프트웨어로 식별될 수 있는 암호 스플라이스 부위를 제거하도록 수정될 수 있다(예를 들어, Kapustin, Y. et al. Nucl. Acids Res. 2011. 1-8 참조).

5' 및 3' 인트론 서열의 길이는, 예를 들어, 바이러스 발현 구조물에 대한 크기 요건을 충족시키기 위해 조정될 수 있다. 일 구현예에서, 5' 및/또는 3' 인트론 서열은 그 길이가 약 50 내지 약 300개의 뉴클레오티드이다. 일 구현예에서, 5' 및/또는 3' 인트론 서열은 그 길이가 약 125 내지 약 240개의 뉴클레오티드이다.

효과기 영역의 줄기 부분은, 리간드가 압타머에 결합할 때 대안 엑손의 대안 스플라이싱을 실질적으로 방지하는 동시에 리간드가 충분한 양으로 존재하지 않을 때 스플라이스 부위에 대한 접근을 허용하기에 충분한 길이(및 GC 함량)여야 한다. 구현예에서, 효과기 영역의 줄기 부분은 3' 인트론의 5' 스플라이스 부위 서열 및 5' 스플라이스 부위 서열의 이의 상보적 서열에 추가로 줄기 서열을 포함한다. 구현예에서, 이 추가 줄기 서열은 압타머 줄기로부터의 서열을 포함한다. 줄기 부분의 길이 및 서열은, 리간드가 존재하지 않을 때 표적 유전자의 허용 가능한 배경 발현 및 리간드가 존재할 때 표적 유전자의 허용 가능한 발현 수준을 허용하는 줄기를 식별하기 위해 공지된 기술을 사용하여 수정될 수 있다. 일 구현예에서, 리보스위치의 효과기 영역 줄기는 그 길이가 약 7 내지 약 20개 염기쌍이다. 일 구현예에서, 효과기 영역 줄기는 그 길이가 8 내지 11개 염기쌍이다. 줄기의 길이 이외에도, 줄기의 GC 염기쌍 함량이 변경되여 줄기의 안정성을 수정할 수 있다.

일 구현예에서, 본원에 개시된 대안적 스플라이싱 유전자 조절 카세트의 일부인 대안 엑손은 프리-mRNA로 전사될 수 있고 대안적으로 표적 유전자의 mRNA로 스플라이싱될 수 있는 폴리뉴클레오티드 서열이다. 일 구현예에서, 대안 엑손은, 대안 엑손이 표적 유전자 mRNA에 포함될 때 그 mRNA로부터의 표적 유전자의 발현이 방지되거나 감소되도록 번역을 억제하는 적어도 하나의 서열을 함유한다. 바람직한 구현예에서, 대안 엑손은 스플라이싱에 의해 표적 유전자 mRNA에 대안 엑손이 포함될 때 표적 유전자와 프레임 내에 있는 정지 코돈(TGA, TAA, TAG)을 함유한다. 구현예에서, 대안 엑손은 정지 코돈에 더하여, 또는 정지 코돈에 대한 대안으로서, 대안 엑손이 예를 들어 이후 mRNA의 분해로 이어지는 microRNA 결합 부위를 포함하는 표적 유전자 mRNA에 스플라이싱함으로써 혼입될 때 번역을 감소시키거나 실질적으로 방지하는 또 다른 서열을 포함한다. 일 구현예에서, 대안 엑손은 mRNA의 분해를 초래하는 miRNA 결합 서열을 포함한다. 일 구현예에서, 대안 엑손은 이 폴리펩티드 서열을 함유하는 단백질의 안정성을 감소시키는 폴리펩티드 서열을 암호화한다. 일 구현예에서, 대안 엑손은 분해를 위해 이 폴리펩티드 서열을 함유하는 단백질을 지시하는 폴리펩티드 서열을 암호화한다.

ESE(엑손 스플라이스 인핸서) 서열과 ESS(엑손 스플라이스 억제인자) 서열을 변경함으로써 및/또는 ESE 또는 ESS 서열을 대안 엑손에 도입함으로써 대안 엑손의 기본 또는 배경 스플라이싱 수준이 최적화될 수 있다. 대안 엑손의 서열에 대한 이러한 변화는 부위 지정 돌연변이유발을 포함하지만 이에 제한되지 않는 당업계에 공지된 방법을 사용하여 달성될 수 있다. 대안적으로, 원하는 서열의 올리고뉴클레오티드(예를 들어, 대안 엑손의 전부 또는 일부를 포함함)는 상업적 공급원으로부터 얻어질 수 있고 유전자 조절 카세트 내로 클로닝될 수 있다. ESS 및 ESE 서열의 식별은, 예를 들어, ESEfinder 3.0(Cartegni, L. et al. ESEfinder: 엑손 스플라이싱 인핸서를 식별하기 위한 웹 리소스 핵산 연구, 2003, 31(13): 3568-3571) 및/또는 기타 사용 가능한 리소스를 사용하는 것을 포함하는 당업계에 공지된 방법에 의해 달성될 수 있다.

일 구현예에서, 대안 엑손은 자연 발생 엑손이다. 또 다른 구현예에서, 대안 엑손은 공지된 엑손의 전부 또는 일부로부터 유래된다. 이러한 맥락에서, "유래된"은 자연 발생 엑손 또는 이의 일부와 실질적으로 동종이지만 다양한 돌연변이들, 예컨대, 엑손 스플라이스 인핸서(ESE) 서열 및 엑손 스플라이스 억제기(ESS) 서열을 변경함으로써 및/또는 ESE 또는 ESS 서열을 대안 엑손에 도입함으로써 생성된 돌연변이들을 함유할 수 있는 대안 엑손 함유 서열을 지칭한다. 본원에 사용된 "상동성(homology)" 및 "동종성(homologous)"은 2개의 폴리뉴클레오티드 서열 사이 또는 2개의 폴리펩티드 서열 사이의 식별성의 퍼센트를 나타낸다. 일 서열과 다른 서열 사이의 대응성은 당업계에 공지된 기술에 의해 결정될 수 있다. 예를 들어, 상동성은 두 폴리펩티드 분자의 서열을 정렬하고 쉽게 사용할 수 있는 컴퓨터 프로그램을 사용하여 두 폴리펩티드 분자를 직접 비교함으로써 결정될 수 있다. 대안적으로, 상동성은 동종 영역 사이에 안정한 듀플렉스(duplex)를 형성할 수 있는 조건 하에서 폴리뉴클레오티드의 혼성화, 이후, 단일-가닥-특이적 뉴클레아제(들)로의 소화, 및 소화된 분절의 크기 결정에 의해 결정될 수 있다. 2개의 폴리뉴클레오티드 또는 2개의 폴리펩티드 서열은 적절한 삽입 또는 결실(deletion)로 최적으로 정렬된 후 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 및 적어도 약 95%의 뉴클레오티드 또는 아미노산 각각이 상기 방법을 사용하여 결정된 바와 같이 정의된 길이의 분자에 걸쳐 일치할 때 서로 "실질적으로 동종"이다.

일 구현예에서, 대안 엑손은 표적 유전자에 대해 외인성이지만, 표적 유전자가 발현될 유기체로부터 기원하는 서열로부터 유래될 수 있다. 본원에 사용된 바와 같이, "외인성(exogenous)"은 그것이 비교되거나 그것이 도입되거나 혼입되는 개체의 나머지 부분과 유전형적으로 구별되는 개체로부터 유래하는 것을 의미한다. 예를 들어, 유전 공학 기술에 의해 다른 세포 유형으로 도입된 폴리뉴클레오티드는 이종 폴리뉴클레오티드(발현될 때, 이종 폴리펩티드를 암호화할 수 있음)이다. 일 구현예에서, 대안적으로-스플라이싱된 엑손은 인간 디히드로폴레이트 환원효소 유전자(DHFR)의 엑손 2, 돌연변이 인간 Wilms 종양 1 엑손 5, 마우스 칼슘/칼모듈린 의존성 단백질 키나제 II 델타 엑손 16 또는 SIRT1 엑손 6로부터 유래된다. 구현예에서, 대안적으로-스플라이싱된 엑손은 서열 ID 번호:79(GAATGAATTCAGATATTTCCAGAGAATGAAAAAAAAATCTTCAGTAGAAG)에서 수정된 DHFR 엑손 2 이거나 이를 포함한다. 구현예에서, 대안적으로-스플라이싱된 엑손은 서열 ID 번호:98 GAATGAATTCAGATATTTCCAGAGAATGAAAAAAAATCTTCAGTAGAAG에서 수정된 DHFR 엑손 2이거나 이를 포함한다.

자가 절단 리보자임(self-cleaving ribozyme)에 의한 압타머 매개 절단

일 구현예에서, 표적 유전자의 압타머-매개 발현은 작은 세포내핵분해(endonucleolytic) 리보자임의 압타머-매개 조절에 의해 조절된다. 리보자임은 화학 반응을 촉매하는 RNA 효소이다. 본원에 개시된 핵산 및 방법에서, 리보자임은 귀상어, 헤어핀, 델타 간염 바이러스, 바쿠드(Varkud) 위성, 트위스터, 트위스터 시스터, 피스톨 또는 해쳇(hatchet) 리보자임를 포함하지만 이에 제한되지 않는 표적 세포 유형에서 자가-절단되는 임의의 작은 세포내핵분해 리보자임일 수 있다. 따라서, 일 구현예에서, 리보스위치, 및 본원에 개시된 압타머에 연결된 리보자임을 함유하는 리보스위치를 포함하는 유전자 발현 카세트가 제공된다.본 명세서에 그 전체가 참조로서 통합되는 WO2017/136608은, 압타머 리간드의 존재 하에 리보자임 자가 절단을 활성화하는 리보스위치("오프" 스위치) 또는 압타머의 존재 하에 리보자임 자가 절단을 억제하는 리보스위치("온" 스위치)를 설명한다.

"오프" 스위치 시나리오에서, 압타머/리간드 결합은 리보자임의 리보뉴클레아제 기능을 증가시켜 폴리뉴클레오티드 카세트를 포함하는 표적 유전자 RNA를 절단을 유도하며 이에 의해 표적 유전자 발현을 감소시킨다. 이러한 오프 스위치의 예는 줄기에 의해 압타머에 연결된 트위스터 리보자임을 포함하는 리보스위치를 포함하는 표적 유전자의 발현 조절을 위한 폴리뉴클레오티드 카세트를 포함하고, 여기서 트위스터 리보자임을 압타머에 연결하는 스템은 트위스터 리보자임의 P3 줄기의 위치에서 리보자임에 부착되고, 표적 유전자는 트위스터 리보자임의 P1 줄기에 연결된다(예를 들어, 참조로서 본원에 통합된 WO2017/136608 및 관련 텍스트의 도 1a, 도 1b 또는 도 3a 참조).

"온" 스위치 시나리오에서, 압타머/리간드 결합은 리보자임의 리보뉴클레아제 기능을 억제하고 폴리뉴클레오티드 카세트를 포함하는 표적 유전자 RNA의 절단을 감소시켜 리간드 존재 하에서 표적 유전자 발현을 증가시킨다. 온 스위치의 예는 압타머에 연결된 트위스터 리보자임을 포함하는 리보스위치를 포함하고, 여기서 압타머는 트위스터 리보자임 P1 줄기의 3' 또는 5' 말단에 연결되고, 압타머가 트위스터 리보자임 P1 줄기의 3' 말단에 연결될 때 트위스터 리보자임 P1 줄기의 3' 암(arm)의 일부는 대안적으로 압타머 P1 줄기의 5' 암이고, 압타머가 트위스터 리보자임 P1 스템의 5' 말단에 연결될 때, 트위스터 리보자임 P1 줄기의 5' 암의 일부는 대안적으로 압타머 P1 줄기의 3' 암이다(예를 들어, 본원에 참조로서 통합된 WO2017/136608 및 관련 텍스트의 도 6a 및 도 6b 참조).

폴리아데닐화의 압타머 조절

구현예에서, 표적 유전자의 발현은 압타머-조절된 폴리아데닐화에 의해 조절된다. 거의 모든 진핵생물 mRNA의 3' 말단은 폴리(A) 테일 - 20 내지 250개의 아데노신 잔기의 단일중합체(homopolymer)를 포함한다. mRNA에 폴리(A) 테일을 추가하면 분해로부터 보호하기 때문에, 유전자 발현은 해당 mRNA의 폴리아데닐화를 조절함으로써 영향을 받을 수 있다.

일 구현예에서, 표적 유전자의 발현은 그 전체가 참조로서 본원에 통합된 WO2018/156658에 기재된 바와 같은 폴리아데닐화 신호의 압타머-조절된 접근성을 통해 조절된다. 이러한 구현예에서, 리보스위치는 본원에 기재된 효과기 줄기-루프 및 압타머를 포함하고, 여기서 표과기 줄기-루프는 폴리아데닐화 신호를 포함하고, 압타머 및 효과기 줄기-루프는 압타머 줄기의 비공유 암과 효과기 줄기 루프의 비공유 암에 상보적인 서열을 포함하는 대안적으로 공유된 줄기 암에 의해 연결된다(예를 들어, 참조로서 본원에 포함된 WO2018/156658 및 관련 텍스트의 도 1a, 도 1b, 도 2a 및 도 5a 참조). 일 구현예에서, 효과기 줄기-루프는 대안적으로 공유된 줄기 암이 3' 압타머 줄기 암의 전체 또는 일부 및 효과기 줄기의 5' 암의 전부 또는 일부를 포함하도록 압타머의 3'에 위치된다. 일 구현예에서, 효과기 줄기-루프는 대안적으로 공유된 줄기 암이 5' 압타머 줄기 암의 전체 또는 일부 및 효과기 줄기의 3' 암의 전부 또는 일부를 포함하도록 압타머의 5'에 위치된다. 일 구현예에서, 폴리아데닐화 신호(polyadenylation signal)는 AATAAA 또는 ATTAAA이다. 일 구현예에서, 폴리아데닐화 신호는 다운스트림 요소(DSE)이다. 일 구현예에서, 폴리아데닐화 신호는 업스트림 서열 요소(USE)이다. 일 구현예에서, 폴리뉴클레오티드 카세트는 2개의 리보스위치를 포함하며, 여기서 제1 리보스위치의 효과기 줄기 루프는 폴리아데닐화 신호 AATAAA 또는 ATTAAA의 전부 또는 일부를 포함하고, 제2 리보스위치의 효과기 줄기 루프는 다운스트림 요소(DSE)의 전부 또는 일부를 포함한다. 일 구현예에서, 2개의 리보스위치 각각은 동일한 리간드에 결합하는 압타머를 포함한다. 일 구현예에서, 2개의 리보스위치는 상이한 리간드에 결합하는 상이한 압타머를 포함한다.

일부 구현예에서, 리보스위치는 감지 영역(예를 들어, 본원에 기재된 압타머) 및 스플라이세오솜의 일부인 소핵 리보핵단백질(snRNP) U1에 대한 결합 부위를 포함하는 효과기 영역을 포함한다. WO2017/136591은, 효과기 영역이 U1 snRNP 결합 부위를 포함하는 리보스위치를 설명하고, 그 전체가 참고로 본원에 포함된다. 압타머가 리간드에 결합하면, 효과기 영역은 줄기를 형성하고 U1 snRNP 결합 부위가 U1 snRNP에 결합하는 것을 차단한다. 특정 조건(예를 들어, 압타머가 자체 리간드에 결합되지 않은 경우)에서, 효과기 영역은 U1 snRNP 결합 부위에 대한 접근을 제공하여 U1 snRNP가 mRNA에 결합하고 메시지의 분해로 이어지는 폴리아데닐화를 억제하는 맥락에 있다. U1 snRNP 결합 부위는 U1 snRNP에 결합하여 U1 snRNP를 표적 유전자의 3' UTR에 모집하고 표적 유전자 메시지의 폴리아데닐화를 억제할 수 있는 임의의 폴리뉴클레오티드 서열일 수 있다. 일 구현예에서, U1 snRNP 결합 부위는 컨센서스 부위 CAGGTAAGTA(서열 ID 번호:80) (mRNA에 있을 때는 CAGGUAAGUA, 서열 ID 번호:81)이다. 일부 구현예에서, U1 snRNP 결합 부위는 예를 들어 더 짧거나 컨센서스 서열로부터 변경된 하나 이상의 뉴클레오티드를 갖는 서열을 포함하는 이 컨센서스 서열의 변형이다. 일 구현예에서, U1 snRNP 결합 부위는 서열 CAGGTAAG를 함유한다. 일부 구현예에서, 결합 부위는 CAGGTAAGTA(서열 ID 번호:80), CAGGTAAGT 및 CAGGTAAG로부터 선택된 서열에 의해 암호화된다. U1 snRNP 결합 부위는 유전자로부터의 임의의 5' 스플라이스 부위, 예를 들어 인간 DHFR 엑손 2로부터의 5' 스플라이스 부위일 수 있다.

리보뉴클레아제 절단의 압타머 매개 조절

일 구현예에서, 표적 유전자의 발현은 압타머-조절된 리보뉴클레아제 절단을 통해 조절된다. 리보뉴클레아제(RNase)는 특정 리보뉴클레아제 기질 서열을 인식하고 절단한다. 표적 유전자의 DNA에 혼입될 때, 결과 RNA의 압타머/리간드 매개 리보뉴클레아제 절단에 의해 표적 유전자의 발현을 조절하는 능력을 제공하는 재조합 DNA 구조물이 본원에 제공된다. 일부 구현예에서, 본원에 기재된 압타머 암호화 서열은, 압타머가 리간드에 결합할 때 표적 유전자 발현이 (본원에 그 전체가 참조로 포함된 WO2018/161053에 설명된 바와 같이) 발생하도록 리보뉴클레아제 기질 서열 및 효과기 영역과 압타머를 포함하는 리보스위치를 포함하거나 암호화하는 구조물의 일부이다. 구현예에서, RNase P 기질 서열은 리보스위치에 연결되며, 여기서 리보스위치는 본원에 설명된 효과기 영역 및 압타머를 포함하고, 여기서 효과기 영역은 RNase P 기질 서열의 일부에 상보적인 서열을 포함한다. 압타머에 대한 적절한 리간드의 결합은 압타머 및 효과기 영역에서 구조적 변화를 유도하여 리보뉴클레아제에 의한 절단을 위해 리보뉴클레아제 기질 서열의 접근성을 변경한다.

일 구현예에서, 압타머 서열은 RNase P 기질 서열에 대해 5'에 위치되고, 효과기 영역은 RNase P 기질 서열의 리더 서열의 전부 또는 일부 및 5' 수용체 줄기 서열의 전부 또는 일부를 포함한다. 예를 들어, 본원에 참조로서 포함된 WO2018/161053 및 관련 텍스트의 도 1a, 도1b 및 도 3b을 참조한다. 추가 구현예에서, RNase P 기질의 수용체 줄기 및 리보스위치 효과기 영역은 0, 1, 2, 3 또는 4개의 뉴클레오티드에 의해 분리된다. 다른 구현예에서, 효과기 영역 줄기는 리더 서열(및 그의 상보체)에 더하여, RNase P 기질의 수용체 줄기의 하나 이상의 뉴클레오티드, 및 수용체 줄기의 하나 이상의 뉴클레오티드에 상보적인 서열을 포함한다.

일 구현예에서, 폴리뉴클레오티드 카세트의 압타머 서열은 RNase P 기질 서열에 대해 3'에 위치하고 효과기 영역은 RNase P 기질 서열의 3' 수용체 줄기의 전부 또는 일부에 상보적인 서열을 포함한다. 예를 들어, 본원에 참조로서 포함된 WO2018/161053 및 관련 텍스트의 도 3a를 참조한다. 추가 구현예에서, RNase P 기질의 3' 수용체 줄기에 상보적인 효과기 영역 서열은 1 내지 7개의 뉴클레오티드이다. 다시 말해서, 효과기 영역 줄기는 수용체 줄기의 1 내지 7개의 뉴클레오티드를 포함하고 수용체 줄기의 이 1 내지 7개의 뉴클레오티드에 상보적인 서열을 포함한다. 구현예에서, 리보스위치는 RNase P 기질의 3'에 위치하므로 RNase P 기질의 효과기 영역 줄기와 수용체 줄기가 겹치지 않는다. 구현예에서, RNase P 기질의 효과기 영역과 수용체 줄기는 바로 인접하다(즉, 겹치지 않음). 추가 구현예에서, RNase P 기질의 수용체 줄기 및 효과기 영역은 0, 1, 2, 3, 4, 5 또는 그 이상의 뉴클레오티드에 의해 분리된다.

본원에 개시된 압타머 및 유전자 조절 카세트는 표적 세포, 조직 또는 유기체에서 발현될 수 있는 임의의 표적 유전자의 발현을 조절하는 데 사용될 수 있다. "표적 유전자"라는 용어는 세포에 도입되어 RNA로 전사되어 적절한 조건에서 번역 및/또는 표현될 수 있는 폴리뉴클레오티드를 지칭한다. 대안적으로, 표적 유전자는 표적 세포에 대해 내인성이고, 유전자 조절 카세트는 표적 유전자 내로(예를 들어, 내인성 표적 유전자의 기존 비번역 영역 또는 인트론 내로) 위치된다. 표적 유전자의 예는 치료용 폴리펩티드를 암호화하는 폴리뉴클레오티드이다. 일 구현예에서, 표적 유전자는 재조합 DNA 구조물이 전사될 세포에 대해 외인성이다. 다른 구현예에서, 표적 유전자는 재조합 DNA 구조물이 전사될 세포에 대해 내인성이다. 표적 유전자는 단백질을 암호화하는 유전자, 또는 비-단백질 코딩 RNA를 암호화하는 서열일 수 있다. 표적 유전자는, 예를 들어, 구조 단백질, 효소, 세포 신호 단백질, 미토콘드리아 단백질, 징크 핑거 단백질, 호르몬, 수송 단백질, 성장 인자, 사이토카인, 세포내 단백질, 세포외 단백질, 막관통 단백질, 세포질 단백질, 핵단백질, 수용체 분자, RNA 결합 단백질, DNA 결합 단백질, 전사 인자, 번역 기계, 채널 단백질, 운동 단백질, 세포 부착 분자, 미토콘드리아 단백질, 대사 효소, 키나제, 포스파타제, 교환 인자, 샤페론 단백질 및 이들 중 임의의 조절제를 암호화하는 유전자일 수 있다. 구현예에서, 표적 유전자는 에리트로포이에틴(Epo), 인간 성장 호르몬(hGH), 전사 활성제-유사 효과기 뉴클레아제(TALEN), 인간 인슐린, CRISPR 관련 단백질 9(cas9), 또는 예를 들어, 치료 항체를 포함하는 면역글로불린(또는 이의 일부)을 암호화한다.

구현예에서, 본원에 개시된 압타머 및 유전자 조절 카세트는 진핵 세포, 예를 들어 포유동물 세포 및 보다 구체적으로 인간 세포에서 표적 유전자의 발현을 조절하는 데 사용된다. 구현예에서, 본원에 개시된 압타머 및 유전자 조절 카세트는 눈(각막 및 망막 포함), 중추신경계(뇌 포함), 간, 신장, 췌장, 심장, 기도, 근육, 피부, 폐, 연골, 고환, 동맥, 흉선, 골수 또는 종양에서 표적 유전자의 발현을 조절하는 데 사용된다.

일 양태에서, 표적 유전자 및 유전자 조절 카세트를 포함하는 폴리뉴클레오티드의 도입을 위한 재조합 벡터 및 이들의 용도가 제공되며, 여기서 유전자 조절 카세트는 본원에 개시된 압타머를 포함한다. 일부 구현예에서, 재조합 DNA 구조물은 적절한 수준으로 숙주 세포에서 DNA의 복제 및 표적 세포에서 표적 유전자의 발현을 제공하는 DNA 분절을 포함하는 추가의 DNA 요소를 포함한다. 당업자는 발현 제어 서열(프로모터, 인핸서 등)이 표적 세포에서 표적 유전자의 발현을 촉진하는 능력에 기초하여 선택된다는 것을 인식한다. "벡터"는 시험관내 또는 생체내에서 숙주 세포로 전달될 폴리뉴클레오티드를 포함하는 재조합 플라스미드, 효모 인공 염색체(YAC), 미니 염색체, DNA 미니서클 또는 바이러스(바이러스 유래 서열 포함)를 의미한다. 일 구현예에서, 재조합 벡터는 바이러스 벡터 또는 다수의 바이러스 벡터의 조합이다.

표적 세포, 조직 또는 유기체에서 표적 유전자의 발현을 위한 바이러스 벡터는 당업계에 공지되어 있으며 아데노바이러스(AV) 벡터, 아데노-연관 바이러스(AAV) 벡터, 레트로바이러스 및 렌티바이러스 벡터, 및 단순 헤르페스 유형 1 (HSV1) 벡터를 포함한다.

아데노바이러스 벡터는, 예를 들어, E1 및 E3 영역에서 결실을 통해 복제 결함이 있는 인간 아데노바이러스 유형 2 및 인간 아데노바이러스 유형 5에 기초한 것들을 포함한다. 전사 카세트는 E1 영역에 삽입되어 재조합 E1/E3-결실 AV 벡터를 산출한다. 아데노바이러스 벡터는 또한 바이러스 암호화 서열을 포함하지 않는 헬퍼 의존성 고용량 아데노바이러스 벡터(고용량, "무장" 또는 "내장" 벡터로도 알려짐)를 포함한다. 이러한 벡터는 바이러스 DNA 복제 및 패키징에 필요한 cis-작용 요소, 주로 역 말단 반복 서열(ITR) 및 패키징 신호(CY)를 포함한다. 이러한 헬퍼 의존성 AV 벡터 게놈은 수백 염기쌍에서 최대 약 36kb의 외래 DNA를 운반할 가능성이 있다.

재조합 아데노 관련 바이러스 "rAAV" 벡터는 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-7 및 AAV-8, AAV-9, AAV-10 등을 포함하지만 이에 제한하지 않는 임의의 아데노-관련 바이러스 혈청형으로부터 유래된 임의의 벡터를 포함한다. rAAV 벡터는 전체적으로 또는 부분적으로, 결실된 하나 이상의 AAV 야생형 유전자, 바람직하게는 Rep 및/또는 Cap 유전자를 가질 수 있지만, 기능적 측면 ITR 서열은 유지한다. 기능적 ITR 서열은 AAV 게놈의 구조(rescue), 복제, 패키징 및 잠재적인 염색체 통합을 위해 유지된다. ITR은 야생형 뉴클레오티드 서열일 필요는 없고, 서열이 기능적 구조, 복제 및 패키징을 제공하는 한 (예를 들어, 뉴클레오티드의 삽입, 결실 또는 치환에 의해)변경될 수 있다.

대안적으로, 렌티바이러스 벡터와 같은 다른 시스템이 사용될 수 있다. 렌티바이러스 기반 시스템은 분열하지 않는 세포뿐만 아니라 분열 세포를 형질도입할 수 있을 뿐만 아니라 예를 들어 CNS의 분열하지 않는 세포를 표적으로 하는 애플리케이션에 유용하게 사용할 수 있게 한다. 렌티바이러스 벡터는 인간 면역결핍 바이러스에서 파생되며 그 바이러스와 마찬가지로 숙주 게놈에 통합되어 매우 장기적인 유전자 발현 가능성을 제공한다.

유전자 조절 카세트를 함유하는 표적 유전자를 운반하는 플라스미드, YAC, 미니염색체 및 미니서클을 포함하는 폴리뉴클레오티드는 또한 예를 들어, 양이온성 지질, 중합체 또는 둘 모두를 담체로 사용하는 비바이러스 벡터 시스템에 의해 세포 또는 유기체 내로 도입될 수 있다. 접합된 폴리-L-리신(PLL) 폴리머 및 폴리에틸렌이민(PEI) 폴리머 시스템이 벡터를 세포에 전달하는 데 사용될 수 있다. 벡터를 세포에 전달하는 다른 방법은 세포 배양 및 유기체 모두에 대한 유체역학적 주입 및 전기천공 및 초음파 사용을 포함한다. 유전자 전달을 위한 바이러스 및 비바이러스 전달 시스템의 검토는 본원에 참조로 포함된 Nayerossadat, N. et al. (Adv Biomed Res. 2012; 1:27)를 참고한다.

일 양태에서, 본 개시내용은 (a) 본원에 개시된 압타머를 포함하는 폴리뉴클레오티드 카세트를 표적 유전자에 삽입하는 단계, (b) 폴리뉴클레오티드 카세트를 포함하는 표적 유전자를 세포 내로 도입하는 단계, 및 (c) 표적 유전자의 발현을 유도하기에 효과적인 양으로 압타머에 특이적으로 결합하는 소분자 리간드에 세포를 노출시키는 단계를 포함하는 표적 유전자(예를 들어, 치료적 유전자)의 발현을 조절하는 방법을 제공한다. 양태에서, 표적 세포에서 표적 유전자의 발현은 그것이 도입된 세포에 원하는 특성을 부여하거나, 그렇지 않으면 원하는 치료 결과를 유도한다.

일 구현예에서, 본원에 개시된 압타머를 포함하는 유전자 조절 카세트는 (5' 또는 3' 비번역 영역이 아닌) 표적 유전자의 단백질 코딩 서열 내로 삽입된다. 일 구현예에서, 본원에 개시된 압타머를 포함하는 단일 유전자 조절 카세트는 표적 유전자에 삽입된다. 다른 구현예에서, 2, 3, 4개 이상의 유전자 조절 카세트가 표적 유전자에 삽입되고, 여기서 하나 이상의 유전자 조절 카세트는 본원에 개시된 압타머를 포함한다. 다른 구현예에서, 2개의 유전자 조절 카세트가 표적 유전자에 삽입되고, 여기서 하나 이상의 유전자 조절 카세트는 본원에 개시된 압타머를 포함한다. 다중 유전자 조절 카세트가 표적 유전자에 삽입될 때, 이들 각각은 단일 리간드가 표적 유전자 발현을 조절하는 데 사용될 수 있도록 동일한 압타머를 포함할 수 있다. 다른 구현예에서, 다중 유전자 조절 카세트는 표적 유전자에 삽입되고, 각각은 다중 상이한 소분자 리간드에 대한 노출이 표적 유전자 발현을 조절하도록 상이한 압타머를 함유할 수 있다.

치료 방법 및 약제학적 조성물

일 양태에서, 유전자 요법에 의해 전달되는 치료 단백질의 수준을 조절하는 방법이 제공된다. 본원에 개시된 압타머를 포함하는 조절 카세트를 함유하는 치료 유전자 서열은, 예를 들어, 벡터에 의해 체내 표적 세포에 전달된다. 표적 유전자 발현의 세포 특이성은 프로모터 및/또는 벡터 내의 다른 요소에 의해 그리고/또는 바이러스 벡터의 캡시드에 의해 제어될 수 있다. 표적 유전자를 포함하는 벡터 구조물의 전달, 및 조절된 표적 유전자의 안정적인 형질감염을 초래하는 표적 조직의 형질감염은 치료 단백질을 생산하는 제1 단계이다. 그러나, 표적 유전자 서열 내의 압타머로 인해, 표적 유전자는 유의미한 수준으로 발현되지 않는다, 즉, 조절 카세트 리보스위치에 포함된 압타머에 결합하는 특정 리간드가 없는 "오프 상태"에 있다. 압타머 특이적 리간드가 투여될 때만 표적 유전자 발현이 활성화된다.

표적 유전자를 포함하는 벡터 구조물의 전달과 활성화 리간드의 전달은 일반적으로 시간적으로 분리되어 있다. 활성화 리간드의 전달은 표적 유전자가 발현되는 시기뿐만 아니라 단백질 발현 수준도 제어할 것이다. 리간드는 유리체내, 안구내, 흡입, 피하, 근육내, 피내, 병변내, 국소, 복강내, 정맥내(IV), 동맥내, 혈관주위, 뇌내, 뇌실내, 경구, 설하, 순하, 협측, 비강, 흉강내, 심장내, 척추강내, 경막외, 골내 또는 관절내를 포함하지만 이에 제한되지 않는 다수의 경로로 전달될 수 있다.

리간드 전달 시기는 표적 유전자의 활성화 요건에 따라 달라질 것이다. 예를 들어, 표적 유전자에 의해 암호화된 치료 단백질이 지속적으로 요구되는 경우, 경구 소분자 리간드는 표적 유전자의 지속적인 활성화 및 이에 따른 치료 단백질의 지속적인 발현을 보장하기 위해 매일 또는 하루에 여러 번 전달될 수 있다. 표적 유전자가 장기간 작용하는 효과를 갖는 경우, 유도 리간드는 예를 들어 주 1회, 격주, 월 1회와 같이 덜 빈번하게 투여될 수 있다.

리보스위치를 포함하는 유전자 조절 카세트와 관련하여 본원에 기술된 이러한 압타머는 치료적 전이유전자의 발현이 압타머에 특이적인 리간드의 일시적 투여에 의해 결정되는 방식으로 시간적으로 제어되도록 허용한다. 리간드 투여 시에만 치료적 전이유전자의 발현은 리간드 부재하에서 표적 유전자가 오프되도록 함으로써 유전자 요법 치료의 안전성을 증가시킨다.

상이한 압타머는 상이한 리간드가 표적 유전자의 발현을 상향 조절 또는 하향 조절하도록 하기 위해 다중 리보스위치에서 사용될 수 있다. 특정 구현예에서, 조절 카세트를 함유하는 각각의 치료 유전자는 특정 소분자에 의해 활성화될 카세트 내에 특정 압타머를 가질 것이다. 이것은, 각 치료 유전자가 그 안에 수용된 압타머에 특이적인 리간드에 의해서만 활성화될 수 있음을 의미한다. 이러한 구현예에서, 각각의 리간드는 하나의 치료 유전자만을 활성화할 것이다. 이는, 여러 다른 "표적 유전자"가 한 개인에게 전달될 수 있고 각각이 각 표적 유전자에 수용된 조절 카세트 내에 포함된 압타머에 대한 특정 리간드의 전달 시 활성화될 가능성을 허용한다.

리보스위치와 관련하여 본원에 개시된 압타머는, 활성화 리간드가 전달될 때 그 유전자가 신체에 전달될 수 있는 임의의 치료 단백질(예를 들어, 에리트로포이에틴(EPO) 또는 치료 항체)이 신체에 의해 생성되도록 한다. 이러한 치료 단백질 전달 방법은 신체 외부에서 이러한 치료 단백질의 제조를 대체할 수 있으며, 이러한 단백질은 암에 사용되거나 염증성 또는 자가면역 질환을 차단하는 데 사용되는 항체와 같이 삽입되거나 주입된다. 조절된 표적 유전자를 포함하는 신체는 생물의약품 제조 공장이 되며, 이는 유전자 특이적 리간드가 투여될 때 스위치가 켜진다.

일 구현예에서, 표적 단백질은 특정 DNA 서열을 표적화하고 편집할 수 있는 뉴클레아제일 수 있다. 이러한 뉴클레아제는 Cas9, 뉴클레아제를 포함하는 징크 핑거, 또는 TALEN이 포함한다. 이러한 뉴클레아제의 경우, 뉴클레아제 단백질은 표적 내인성 유전자를 편집하기에 충분히 짧은 기간 동안만 요구될 수 있다. 그러나, 조절되지 않은 뉴클레아제 유전자가 신체에 전달되면, 이 단백질은 세포의 남은 생애 동안 존재할 수 있다. 뉴클레아제의 경우, 뉴클레아제가 더 오래 존재하면 표적을 벗어난 편집의 위험이 증가한다. 이러한 단백질의 발현 조절은 상당한 안전성 이점을 갖는다. 이 경우, 조절 카세트를 포함하는 뉴클레아제 표적 유전자를 포함하는 벡터는 체내의 적절한 세포에 전달될 수 있다. 표적 유전자는 카세트 특이적 리간드가 없는 상태에서 "오프" 상태이므로 뉴클레아제는 생성되지 않는다. 활성화 리간드가 투여된 경우에만 뉴클레아제가 생성된다. 충분한 편집이 일어나도록 충분한 시간이 경과하면, 리간드가 철회되고 다시 투여되지 않는다. 따라서, 뉴클레아제 유전자는 그 후 "오프" 상태에 있고, 더 이상 뉴클레아제가 생성되지 않고 편집이 중지된다. 이 접근법은 CEP290의 돌연변이로 인한 LCA10 및 ABCA4의 돌연변이로 인한 스타가르트병과 같은 다수의 유전적 망막병증을 비롯한 유전적 상태를 교정하는 데 사용될 수 있다.

특정 리간드 투여에 의해서만 활성화되는 치료 단백질을 암호화하는 조절된 표적 유전자의 투여는 많은 상이한 유형의 질병, 예를 들어, 치료 항체에 의한 암, 면역 조절 단백질 또는 항체에 의한 면역 장애, 대사성 질환, 조절 유전자로서 항-C5 항체 또는 항체 단편을 갖는 PNH와 같은 희귀 질환, 또는 치료 항체를 갖는 안구 혈관신생, 및 면역 조절 단백질을 갖는 건성 AMD을 치료하기 위해 치료 유전자를 조절하는 데 사용될 수 있다.

다양한 특정 질환 및 상태의 치료를 가능하게 하는 매우 다양한 특정 표적 유전자는 본원에 개시된 압타머/리간드를 사용하여 발현이 조절될 수 있는 표적 유전자로서 사용에 적합하다. 예를 들어, 인슐린 또는 인슐린 유사체(바람직하게는 인간 인슐린 또는 인간 인슐린 유사체)는 I형 당뇨병, II형 당뇨병 또는 대사 증후군을 치료하기 위한 표적 유전자로 사용될 수 있고; 인간 성장 호르몬은 성장 장애가 있는 어린이 또는 성장 호르몬 결핍 성인을 치료하기 위한 표적 유전자로 사용될 수 있으며; 에리트로포이에틴(바람직하게는 인간 에리트로포이에틴)은 만성 신장 질환으로 인한 빈혈, 골수이형성증으로 인한 빈혈 또는 암 화학요법으로 인한 빈혈을 치료하기 위한 표적 유전자로 사용될 수 있다. 본원에 개시된 압타머 및 유전자 발현 카세트와 양립가능한 추가 표적 유전자는, 색맹 치료를 위한 고리형 뉴클레오티드 개폐형 양이온 채널 알파-3(CNGA3) 및 고리형 뉴클레오티드 개폐형 양이온 채널 베타-3(CNGB3), 색소성 망막염 또는 레버의 선천성 흑암의 치료를 위한 레티노이드 이소메로하이드롤라제(RPE65), X-연관 색소성 망막염의 치료를 위한 X-연관 색소성 망막염 GTPase 조절자(RPGR), 파킨슨병 치료를 위한 글루탐산 탈탄산효소(GAD), 근위축성 측삭 경화증 치료를 위한 넌센스 전사체 1(UPF1)의 조절인자, 및 방사선 유발 구강건조증 및 쇼그렌 증후군의 치료를 위한 아쿠아포린을 포함하지만 이에 제한되지 않는다. 추가 표적 유전자는 ArchT(Halorubrum 균주 TP009의 아르케에로돕신), Jaws(Haloarcula　(Halobacterium)　salinarum(균주 상어)에서 파생된 크룩할로호돕신), iC1C2(채널 로돕신 ChR1과 Chlamydomonas reinhardtii로부터의 ChR2 사이의 C1C2 키메라의 변종) 또는 광변환 캐스케이드의 비활성화를 매개하는 GTPase 복합체의 중요한 구성요소인 Rgs9-앵커 단백질(R9AP)을 포함한다.

본원에 개시된 압타머를 포함하는 발현 구조물은 낭포성 섬유증, 혈우병, 근이영양증, 지중해빈혈 또는 겸상적혈구 빈혈과 같은 단일 유전자 결함에 의해 유발되는 질환을 치료하는데 특히 적합할 수 있다. 따라서, 인간 β-, γ-, δ-, 또는 ζ-글로빈은 β-지중해빈혈 또는 겸상적혈구빈혈을 치료하기 위한 표적 유전자로 사용될 수 있고; 인간 인자 VIII 또는 인자 IX는 혈우병 A 또는 혈우병 B를 치료하기 위한 표적 유전자로 사용될 수 있다.

본원에 기재된 소분자는 일반적으로 하나 이상의 약제학적으로 허용가능한 담체와 조합되어 환자에게 투여하기에 적합한 약제학적 조성물을 형성한다. 약제학적으로 허용가능한 담체는 일반적으로 제약 분야에서 사용되는 용매, 결합제, 희석제, 붕해제, 윤활제, 분산 매질, 코팅제, 항균제 및 항진균제, 등장제 및 흡수 지연제 등을 포함한다. 약제학적 조성물은 정제, 환제, 캡슐제, 트로키제 등의 형태일 수 있고, 이들의 의도된 투여 경로에 적합하도록 제형화된다. 투여 경로의 예는, 비경구, 예를 들어 정맥내, 피내, 비강내, 피하, 경구, 흡입, 경피(국소), 경점막을 포함한다.

티아민 유사체 또는 유도체를 포함하는 약제학적 조성물은, 표적 유전자를 바람직하게 조절하기에 충분한 양의 티아민 유사체 또는 유도체가 환자에게 전달되도록 하는 투여 일정으로 환자에게 투여된다. 투여 형태가 정제, 환제 등인 경우, 바람직하게는 약제학적 조성물은 0.1 mg 내지 10 g의 티아민 유사체 또는 유도체; 0.5 mg 내지 5 g의 티아민 유사체 또는 유도체; 1 mg 내지 1 g의 티아민 유사체 또는 유도체; 2 mg 내지 750 mg의 티아민 유사체 또는 유도체; 5 mg 내지 500 mg의 티아민 유사체 또는 유도체; 10 mg 내지 250 mg의 티아민 유사체 또는 유도체; 또는 150 mg 내지 300 mg의 티아민 유사체 또는 유도체를 포함한다.

약제학적 조성물은 1일 1회 또는 1일 수회(예를 들어, 1일 2, 3, 4, 5, 또는 그 이상) 투여될 수 있다. 대안적으로, 약제학적 조성물은 1일 1회 미만, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14일마다 1회, 또는 월 1회 또는 몇 개월에 1회 투여될 수 있다. 일부 구현예에서, 약제학적 조성물은 환자에게 단지 적은 횟수, 예를 들어, 1회, 2회, 3회 등으로 투여될 수 있다.

표적 유전자에 의해 암호화된 치료 단백질의 증가된 발현을 필요로 하는 환자를 치료하는 방법이 본원에 제공되는데, 이 방법은 본원에 개시된 압타머가 결합하거나 이와 달리 이에 반응하는 리간드를 포함하는 약제학적 조성물을 환자에게 투여하는 단계를 포함하고, 여기서 환자는 표적 유전자를 포함하는 재조합 DNA를 투여받았고, 표적 유전자는 압타머의 리간드에 의해 표적 유전자의 발현을 조절하는 능력을 제공하는 본원에 개시된 유전자 조절 카세트를 함유한다. 표적 유전자에 의해 암호화된 치료 단백질의 증가된 발현을 필요로 하는 환자를 치료하는 방법에 사용하기 위해, 본원에 개시된 압타머가 결합하거나 이와 달리 이에 반응하는 리간드를 포함하는 약제학적 조성물이 본원에 제공되고, 여기서 환자에게는 표적 유전자를 포함하는 재조합 DNA가 투여되었고, 표적 유전자는 압타머의 리간드에 의해 표적 유전자의 발현을 조절하기 위한 능력을 제공하는 본원에 개시된 유전자 조절 카세트를 포함한다.

검출 및/또는 진단용 압타머

광범위한 검출 및 진단제가 키메라 또는 물리적 접합을 통해 압타머에 연결될 수 있다. 또한, 압타머는 바이오센서, 미세유체 장치 및 기타 검출 플랫폼에 통합될 수 있다. 일부 구현예에서, 압타머는 폴리에틸렌 글리콜(PEG), 폴리프로필렌 글리콜(PPG), 폴리옥시에틸화 글리세롤(POG) 및 다른 폴리옥시에틸화 폴리올, 폴리비닐 알코올(PVA) 및 다른 폴리알킬렌 옥사이드, 폴리옥시에틸화 소르비톨, 또는 폴리옥시에틸화 글루코스를 포함하지만 이에 제한되지 않는 폴리알킬렌 글리콜 모이어티에 접합된다.

일부 구현예에서, 압타머는 형광성 모이어티 또는 라벨, 영상화제, 방사성동위원소 모이어티, 방사선 불투과성 모이어티 등을 포함하지만 이에 제한되지 않는 검출가능한 모이어티, 예를 들어 비오틴, 형광단, 발색단, 스핀 공명 프로브, 나노입자(금, 자성 및 초상자성 나노입자를 포함하지만 이에 제한되지 않음), 양자점, 방사성표지와 같은 검출가능한 라벨에 접합된다. 예시적인 형광단은 형광 염료(예를 들어, 플루오레세인, 로다민 등) 및 다른 발광 분자(예를 들어, 루미놀)를 포함한다. 형광단은 기질(예를 들어, 단실 프로브)에 결합할 때 구조적 변화를 겪는 변형된 단백질의 하나 이상의 잔기에 가까이 위치하면 형광이 변하도록 환경에 민감할 수 있다. 예시적인 방사성 표지는 하나 이상의 저감도 핵(¹³C, ¹⁵N, ²H, ¹²⁵I, ¹²³I, ⁹⁹Tc, ⁴³K, ⁵²Fe, ⁶⁷Ga, ⁶⁸Ga, ¹¹¹In 등)을 갖는 원자를 함유하는 소분자를 포함한다. 다른 유용한 모이어티는 당업계에 공지되어 있다.

일부 구현예에서, 압타머는 항염증제, 항암제, 항신경변성제, 항감염제, 또는 일반적으로 치료제를 포함하지만 이에 제한되지 않는 치료 모이어티에 접합된다.

화합물에 결합하는 압타머를 식별하는 방법

관심 화합물(예를 들어, 티아민 유사체, TPP 유사체, 또는 이의 유도체를 포함하는 소분자)의 추가, 또는 이에 대한 노출에 반응으로 리보스위치의 일부일 때 관심 화합물에 결합하거나 그렇지 않으면 표적 유전자 발현을 조절하는 압타머를 식별하는 방법이 본원에 개시된다. 일 구현예에서, 상기 방법은 하기 단계를 포함한다:

(i) 부모 압타머 서열(parent aptamer sequence)을 선택하는 단계;

(ii) 단계 (i)에서 선택된 압타머를 암호화하는 서열을 포함하는 압타머 라이브러리를 생성하는 단계, - 압타머 암호화 서열의 하나 이상의 뉴클레오티드는 압타머의 하나 이상의 쌍을 이루지 않은 영역에 해당하는 하나 이상의 위치에서 무작위로 돌연변이되고, 돌연변이된 압타머 서열은 리포터 유전자의 발현을 제어하는 리보스위치의 맥락에 있음 -;

(iii) 부모 압타머 서열과 비교하여, 티아민 유사체에 대한 반응으로 표적 유전자 발현의 증가된 조절(예를 들어, 더 높은 배수 유도 또는 억제)을 갖는 압타머에 대해 단계 (ii)로부터의 라이브러리를 스크리닝하는 단계;

(iv) 단계 (i)에서 선택된 압타머 대신에 단계 (iii)에서 식별된 압타머에 대해, 선택적으로 단계 (ii) 및 (iii)을 반복하는 단계.

부모 압타머 서열은 공지된 TPP 압타머 서열을 포함하는 TPP 압타머일 수 있거나, 이용가능한 데이터베이스에서 상동 서열을 검색하여 식별된 추정 TPP 압타머일 수 있다. 부모 압타머 서열은 본원에 개시된 압타머 서열일 수 있다.

부모 압타머 서열을 선택하는 단계는, 예를 들어, (i) 추정 TPP 압타머를 식별하는 단계; (ii) 표적 유전자(예를 들어, 리포터 유전자)의 발현을 조절하는 리보스위치에 압타머를 삽입하는 단계; 및 (iii) 티아민 또는 TPP 유사체 또는 유도체(예를 들어, 본원에 기재된 화합물)에 리보스위치/타겟 유전자 구조물을 노출하는 단계를 포함할 수 있다.

추정 TPP 압타머는, 각각 다중 서열 정렬, 컨센서스 2차 구조 및 공분산 모델(CM)로 표시되는 RNA 패밀리의 모음인 Rfam 데이터베이스와 같은 적절한 서열 데이터베이스에서 식별할 수 있습니다. 구현예에서, 추정 TPP 압타머는 Rfam TPP 리보스위치 패밀리 RF00059로부터 식별된다. 구현예에서, 추정 TPP 압타머는 서열 ID 번호:94 또는 서열 ID 번호:95(각각 줄기가 있는 thiC 또는 thiM 압타머)와 동일한 적어도 85%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98% 또는 적어도 99% 인 서열을 갖는다.

서열 ID 번호: 94

GUAAUGUGUCGGAGUGCCUUAGGGAUUAUUCCCCUAAAGCUGAGACCGCAUUGCGGGAUCCGUUGAACCUGAUCAGGCUAAUACCUGCGAAGGGAACACAUUAC

서열 ID 번호: 95

GUAAUGUCUCGGGGUGCCCUUCUGCGUGAAGGCUGAGAAAUACCCGUAUCACCUGAUCUGGAUAAUGCCAGCGUAGGGAAGACAUUAC

추정 TPP 압타머는 당업자에게 공지된 기술을 사용하여 리보스위치에 삽입될 수 있다. TPP 및 하나 이상의 티아민 또는 TPP 유사체 또는 유도체(예를 들어, 본원에 기재된 화합물)의 존재에 대한 압타머의 반응성은 세포 배양에서 및/또는 무세포 시스템에서 시험될 수 있다. 특히, 세포 배양 시스템은 예를 들어 포유동물, 식물, 또는 곤충 세포 배양을 포함하는 진핵 세포 배양이다.

티아민 또는 TPP 유사체 또는 유도체(예를 들어, 본원에 기재된 화합물)에 반응하는 압타머를 식별하기 위해, 압타머(즉, 부모 압타머)를 암호화하는 서열의 하나 이상의 뉴클레오티드 위치가 무작위화된다. 무작위화를 위한 뉴클레오티드 위치는 부모 압타머 서열의 구조에 기초하여 선택될 수 있다. 예측된 2차 구조는, RNAfold(http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi)와 같은 이용가능한 프로그램을 사용하여 그리고/또는 관련 압타머(예를 들어, the E. coli thiM riboswitch in Edwards, TE & Ferrе-D'Amarе, AR, Structure. 2006 Sep;14(9):1459-68)의 결정 구조와 비교하여 획득될 수 있다. 예를 들어, 루프(L) 영역(예를 들어, L3 및/또는 L5) 및 접합(J) 영역(예를 들어, J3-2(쌍을 이룬 영역 P3 및 P2 접합), J2-4, 및/또는 J4-5)을 포함하는 압타머의 쌍을 이루지 않은 영역이 식별될 수 있고, 하나 이상의 쌍을 이루지 않은 영역에서 하나 이상의 뉴클레오티드는 무작위화되어 압타머 라이브러리를 생성할 수 있다. 구현예에서, 하나 이상의 쌍을 이루지 않은 영역에 인접한 하나 이상의 뉴클레오티드가 무작위화됩니다. 추가로, 쌍을 이룬(P) 영역에서 하나 이상의 뉴클레오티드가 무작위화될 수 있다. 또한, 쌍을 이루지 않은 영역 또는 쌍을 이룬 영역에서 하나 이상의 뉴클레오티드가 추가되거나 결실될 수 있다. 돌연변이된 압타머 서열은 리보스위치의 맥락에서 압타머 서열의 라이브러리로서 제공될 수 있다. 구현예에서, 압타머 라이브러리는 본원에 개시된 유전자 발현 카세트의 일부로서 리보스위치의 맥락에서 제공된다.

하나 이상의 돌연변이를 함유하는 압타머 암호화 서열은 상기 기재된 바와 같이 TPP 또는 하나 이상의 티아민 또는 TPP 유사체 또는 유도체의 존재에 대한 반응성에 대해 시험될 수 있다. 구현예에서, 하나 이상의 돌연변이를 포함하는 압타머는 유사체 또는 유도체에 반응하지만, (동일한 리보스위치/유전자 발현 카세트의 맥락에서) 유래된 부모 압타머보다 티아민 및/또는 TPP에 대한 반응성이 감소했다.

원하는 화합물에 반응하는 압타머는 뉴클레오티드를 무작위화하여 추가로 돌연변이를 일으킬 수 있다. 선택된 위치의 뉴클레오티드, 예를 들어 쌍을 이루지 않은 영역은 무작위화될 수 있고 라이브러리는 위에서 설명한 대로 생성될 수 있다.

일부 구현예에서, 관심 화합물은 티아민 유사체, 예를 들어, 아세퍼티아민, 아세티아민, 알리티아민, 암프롤륨, 베클로티아민, 벤포티아민, 벤티아민, 비스벤티아민, 세토티아민, 시클로티아민, 퍼술티아민, 모노포스포티아민, 옥토티아민, 옥시티아민, 프로술티아민, 술빈부티아민, 또는 빈티아몰이다. 구현예에서, 티아민 또는 TPP 유사체는 화합물 M10-M99를 포함하지만 이에 제한되지 않는 화학식 I-VIII의 화합물이다. 구현예에서, 티아민 또는 TPP 유사체는 M10, M16, M18, M19, M21, M26, M27, M28, M29, M30, M31, M32, M33, 및 M34 중 하나이다.

본원에 개시된 방법에 사용된 리포터 유전자에 의해 암호화된 리포터 단백질은, 리포터 단백질의 특징, 예를 들어 효소 활성 또는 분광광도계 특징을 검출함으로써 또는 간접적으로, 예를 들어 항체-기반 검정으로 검정될 수 있는 단백질이다. 쉽게 검출가능한 리포터 유전자 생산물의 예는, 퓨로마이신 내성 마커(pac), 3-갈락토시다제, 루시페라제, 오로티딘 5'-포스페이트 데카르복실라제(URA3), 아르기닌 퍼미아제 CAN1, 갈락토키나제(GAL1), 베타-갈락토시다제(LacZ), 또는 클로람페니콜 아세틸 트랜스퍼라제(CAT)를 포함하지만 이에 제한되지 않는다. 검출가능한 신호의 다른 예는 CD4를 포함하지만 이에 제한되지 않는 세포 표면 마커를 포함한다. 본원에 개시된 압타머를 식별하기 위한 방법에 사용하기에 적합한 리포터 유전자는 또한 형광 단백질(예를 들어, 녹색 형광 단백질(GFP) 및 이의 유도체), 또는 형광 태그에 융합된 단백질을 포함한다. 형광 태그 및 단백질의 예는, (3-F)Tyr-EGFP, A44-KR, aacuGFP1, aacuGFP2, aceGFP, aceGFP-G222E-Y220L, aceGFP-h, AcGFP1, AdRed, AdRed-C148S, aeurGFP, afraGFP, alajGFP1, alajGFP2, alajGFP3, amCyan1, amFP486, amFP495, amFP506, amFP515, amilFP484, amilFP490, amilFP497, amilFP504, amilFP512, amilFP513, amilFP593, amilFP597, anm1GFP1, anm1GFP2, anm2CP, anobCFP1, anobCFP2, anobGFP, apulFP483, AQ14, AQ143, Aquamarine, asCP562, asFP499, AsRed2, asulCP, atenFP, avGFP, avGFP454, avGFP480, avGFP509, avGFP510, avGFP514, avGFP523, AzamiGreen, Azurite, BDFP1.6, bfloGFPa1, bfloGFPc1, BFP, BFP.A5, BFP5, bsDronpa (On), ccalGFP1, ccalGFP3, ccalOFP1, ccalRFP1, ccalYFP1, cEGFP, cerFP505, Cerulean, CFP, cFP484, cfSGFP2, cgfmKate2, CGFP, cgfTagRFP, cgigGFP, cgreGFP, CheGFP1, CheGFP2, CheGFP4, Citrine, Citrine2, Clomeleon, Clover, cp-mKate, cpCitrine, cpT-Sapphire174-173, CyOFP1, CyPet, CyRFP1 (CyRFP1), d-RFP618, D10, d1EosFP (녹색), d1EosFP (적색), d2EosFP (녹색), d2EosFP (적색), deGFP1, deGFP2, deGFP3, deGFP4, dendFP (녹색), dendFP (적색), Dendra (녹색), Dendra (적색), Dendra2 (녹색), Dendra2 (적색), Dendra2-M159A (녹색), Dendra2-M159A (주황색), Dendra2-T69A (녹색), Dendra2-T69A (주황색), dfGFP, dimer1, dimer2, dis2RFP, dis3GFP, dKeima, dKeima570, dLanYFP, DrCBD, Dreiklang (On), Dronpa (On), Dronpa-2 (On), Dronpa-3 (On), dsFP483, DspR1, DsRed, DsRed-Express, DsRed-Express2, DsRed-Max, DsRed.M1, DsRed.T3, DsRed.T4, DsRed2, DstC1, dTFP0.1, dTFP0.2, dTG, dTomato, dVFP, E2-Crimson, E2-Orange, E2-Red/Green, EaGFP, EBFP, EBFP1.2, EBFP1.5, EBFP2, ECFP, ECFPH148D, ECGFP, eechGFP1, eechGFP2, eechGFP3, eechRFP, efasCFP, efasGFP, eforCP, EGFP, eGFP203C, eGFP205C, Emerald, Enhanced Cyan-Emitting GFP, EosFP (녹색), EosFP (적색), eqFP578, eqFP611, eqFP611V124T, eqFP650, eqFP670, EYFP, EYFP-Q69K, fabdGFP, ffDronpa (On), FoldingReporterGFP, FP586, FPrfl2.3, FR-1, FusionRed, FusionRed-M, G1, G2, G3, Gamillus (On), Gamillus0.1, Gamillus0.2, Gamillus0.3, Gamillus0.4, GCaMP2, gfasGFP, GFP(S65T), GFP-151pyTyrCu, GFP-Tyr151pyz, GFPmut2, GFPmut3, GFPxm16, GFPxm161, GFPxm162, GFPxm163, GFPxm18, GFPxm181uv, GFPxm18uv, GFPxm19, GFPxm191uv, GFPxm19uv, H9, HcRed, HcRed-Tandem, HcRed7, hcriGFP, hmGFP, HriCFP, HriGFP, iFP1.4, iFP2.0, iLov, iq-EBFP2, iq-mApple, iq-mCerulean3, iq-mEmerald, iq-mKate2, iq-mVenus, iRFP670, iRFP682, iRFP702, iRFP713, iRFP720, IrisFP (녹색), IrisFP (주황색), IrisFP-M159A (녹색), Jred, Kaede (녹색), Kaede (적색), Katushka, Katushka-9-5, Katushka2S, KCY, KCY-G4219, KCY-G4219-38L, KCY-R1, KCY-R1-158A, KCY-R1-38H, KCY-R1-38L, KFP1 (On), KikGR1 (녹색), KikGR1 (적색), KillerOrange, KillerRed, KO, Kohinoor (On), laesGFP, laGFP, LanFP1, LanFP2, lanRFP-S83l, LanYFP, laRFP, LSS-mKate1, LSS-mKate2, LSSmOrange, M355NA, mAmetrine, mApple, Maroon0.1, mAzamiGreen, mBanana, mBeRFP, mBlueberry1, mBlueberry2, mc1, mc2, mc3, mc4, mc5, mc6, McaG1, McaG1ea, McaG2, mCardinal, mCarmine, mcavFP, mcavGFP, mcavRFP, mcCFP, mCerulean, mCerulean.B, mCerulean.B2, mCerulean.B24, mCerulean2, mCerulean2.D3, mCerulean2.N, mCerulean2.N(T65S), mCerulean3, mCherry, mCherry2, mCitrine, mClavGR2 (녹색), mClavGR2 (적색), mClover3, mCyRFP1, mECFP, meffCFP, meffGFP, meffRFP, mEGFP, meleCFP, meleRFP, mEmerald, mEos2 (녹색), mEos2 (적색), mEos2-A69T (녹색), mEos2-A69T (주황색), mEos3.1 (녹색), mEos3.1 (적색), mEos3.2 (녹색), mEos3.2 (적색), mEos4a (녹색), mEos4a (적색), mEos4b (녹색), mEos4b (적색), mEosFP (녹색), mEosFP (적색), mEosFP-F173S (녹색), mEosFP-F173S (적색), mEosFP-M159A (녹색), mEYFP, MfaG1, mGarnet, mGarnet2, mGeos-C (On), mGeos-E (On), mGeos-F (On), mGeos-L (On), mGeos-M (On), mGeos-S (On), mGinger1, mGinger2, mGrape1, mGrape2, mGrape3, mHoneydew, MiCy, mIFP, miniSOG, miniSOGQ103V, miniSOG2, miRFP, miRFP670, miRFP670nano, miRFP670v1, miRFP703, miRFP709, miRFP720, mIrisFP (녹색), mIrisFP (적색), mK-GO (Early), mK-GO (Late), mKalama1, mKate, mKateM41GS158C, mKateS158A, mKateS158C, mKate2, mKeima, mKelly1, mKelly2, mKG, mKikGR (녹색), mKikGR (적색), mKillerOrange, mKO, mKO2, mKO, mLumin, mMaple (녹색), mMaple (적색), mMaple2 (녹색), mMaple2 (적색), mMaple3 (녹색), mMaple3 (적색), mMaroon1, mmGFP, mMiCy, mmilCFP, mNectarine, mNeonGreen, mNeptune, mNeptune2, mNeptune2.5, mNeptune681, mNeptune684, Montiporasp.#20-9115, mOrange, mOrange2, moxBFP, moxCerulean3, moxDendra2 (녹색), moxDendra2 (적색), moxGFP, moxMaple3 (녹색), moxMaple3 (적색), moxNeonGreen, moxVenus, mPapaya, mPapaya0.7, mPlum, mPlum-E16P, mRaspberry, mRed7, mRed7Q1, mRed7Q1S1, mRed7Q1S1BM, mRFP1, mRFP1-Q66C, mRFP1-Q66S, mRFP1-Q66T, mRFP1.1, mRFP1.2, mRojoA, mRojoB, mRouge, mRtms5, mRuby, mRuby2, mRuby3, mScarlet, mScarlet-H, mScarlet-I, mStable, mStrawberry, mT-Sapphire, mTagBFP2, mTangerine, mTFP0.3, mTFP0.7 (On), mTFP1, mTFP1-Y67W, mTurquoise, mTurquoise2, muGFP, mUkG, mVenus, mVenus-Q69M, mVFP, mVFP1, mWasabi, Neptune, NijiFP (녹색), NijiFP (주황색), NowGFP, obeCFP, obeGFP, obeYFP, OFP, OFPxm, oxBFP, oxCerulean, oxGFP, oxVenus, P11, P4, P4-1, P4-3E, P9, PA-GFP (On), Padron (On), Padron(star) (On), Padron0.9 (On), PAmCherry1 (On), PAmCherry2 (On), PAmCherry3 (On), PAmKate (On), PATagRFP (On), PATagRFP1297 (On), PATagRFP1314 (On), pcDronpa (녹색), pcDronpa (적색), pcDronpa2 (녹색), pcDronpa2 (적색), PdaC1, pdae1GFP, phiYFP, phiYFPv, pHluorin,ecliptic, pHluorin,ecliptic (acidic), pHluorin,ratiometric (acidic), pHluorin,ratiometric (alkaline), pHluorin2 (acidic), pHluorin2 (alkaline), pHuji, PlamGFP, pmeaGFP1, pmeaGFP2, pmimGFP1, pmimGFP2, Pp2FbFP, Pp2FbFPL30M, ppluGFP1, ppluGFP2, pporGFP, pporRFP, PS-CFP (Cyan), PS-CFP (녹색), PS-CFP2 (Cyan), PS-CFP2 (녹색), psamCFP, PSmOrange (Far-red), PSmOrange (주황색), PSmOrange2 (Far-red), PSmOrange2 (주황색), ptilGFP, R3-2+PCB, RCaMP, RDSmCherry0.1, RDSmCherry0.2, RDSmCherry0.5, RDSmCherry1, rfloGFP, rfloRFP, RFP611, RFP618, RFP630, RFP637, RFP639, roGFP1, roGFP1-R1, roGFP1-R8, roGFP2, rrenGFP, RRvT, rsCherry (On), rsCherryRev (On), rsCherryRev1.4 (On), rsEGFP (On), rsEGFP2 (On), rsFastLime (On), rsFolder (녹색), rsFolder2 (녹색), rsFusionRed1 (On), rsFusionRed2 (On), rsFusionRed3 (On), rsTagRFP (ON), Sandercyanin, Sapphire, sarcGFP, SBFP1, SBFP2, SCFP1, SCFP2, SCFP3A, SCFP3B, scubGFP1, scubGFP2, scubRFP, secBFP2, SEYFP, sg11, sg12, sg25, sg42, sg50, SGFP1, SGFP2, SGFP2(206A), SGFP2(E222Q), SGFP2(T65G), SHardonnay, shBFP, shBFP-N158S/L173I, ShG24, Sirius, SiriusGFP, Skylan-NS (On), Skylan-S (On), smURFP, SNIFP, SOPP, SOPP2, SOPP3, SPOON (on), stylGFP, SuperfolderGFP, SuperfoldermTurquoise2, SuperfoldermTurquoise2ox, SuperNovaGreen, SuperNovaRed, SYFP2, T-Sapphire, TagBFP, TagCFP, TagGFP, TagGFP2, TagRFP, TagRFP-T, TagRFP657, TagRFP675, TagYFP, td-RFP611, td-RFP639, tdimer2(12), tdKatushka2, TDsmURFP, tdTomato, tKeima, Topaz, TurboGFP, TurboGFP-V197L, TurboRFP, Turquoise-GL, Ultramarine, UnaG, usGFP, Venus, VFP, vsfGFP-0, vsfGFP-9, W1C, W2, W7, WasCFP, Wi-Phy, YPet, zFP538, zoan2RFP, ZsGreen, ZsYellow1, αGFP, 10B, 22G, 5B, 6C, A1a, aacuCP, acanFP, ahyaCP, amilCP, amilCP580, amilCP586, amilCP604, apulCP584, BFPsol, Blue102, CFP4, cgigCP, CheGFP3, Clover1.5, cpasCP, Cy11.5, dClavGR1.6, dClover2, dClover2A206K, dhorGFP, dhorRFP, dPapaya0.1, Dronpa-C62S, DsRed-Timer, echFP, echiFP, EYFP-F46L, fcFP, fcomFP, Fpaagar, Fpag_frag, Fpcondchrom, FPmann, FPmcavgr7.7, Gamillus0.5, gdjiCP, gfasCP, GFPhal, gtenCP, hcriCP, hfriFP, KikG, LEA, mcFP497, mcFP503, mcFP506, mCherry1.5, mClavGR1, mClavGR1.1, mClavGR1.8, mClover1.5, mcRFP, meffCP, mEos2-NA, meruFP, mKate2.5, mOFP.T.12, mOFP.T.8, montFP, moxEos3.2, mPA-GFP, mPapaya0.3, mPapaya0.6, mRFP1.3, mRFP1.4, mRFP1.5, mTFP0.4, mTFP0.5, mTFP0.6, mTFP0.8, mTFP0.9, mTFP1-Y67H, mTurquoise-146G, mTurquoise-146S, mTurquoise-DR, mTurquoise-GL, mTurquoise-GV, mTurquoise-RA, mTurquoise2-G, NpR3784g, PDM1-4, psupFP, Q80R, rfloGFP2, RpBphP1, RpBphP2, RpBphP6, rrGFP, RSGFP1, RSGFP2, RSGFP3, RSGFP4, RSGFP6, RSGFP7, Rtms5, scleFP1, scleFP2, spisCP, stylCP, sympFP, TeAPCα, tPapaya0.01, Trp-lessGFP, vsGFP, Xpa, yEGFP, YFP3, zGFP, 및 zRFP을 포함하지만 이에 제한되지 않는다.

본원에 개시된 압타머 라이브러리를 스크리닝하는 방법은 압타머의 제어 하에 리포터 유전자의 활성을 측정하는 단계 및/또는 스크리닝에 사용된 티아민 또는 TPP 유사체의 부재 하에 리포터 유전자의 활성과 비교하여 스크리닝에 사용된 티아민 또는 TPP 유사체의 존재 하에 리포터 유전자의 활성을 비교하는 단계를 포함할 수 있다.

제조 물품 및 키트

또한, 본원에 기술된 방법으로 사용을 위해 키트 또는 제조 물품이 제공된다. 양태에서, 키트는 적절한 패키징에 본원에 기재된 조성물(예를 들어, 유전자 조절 카세트를 함유하는 표적 유전자를 포함하는 벡터의 전달을 위한 조성물)을 포함한다. 본원에 기재된 조성물(예를 들어, 주사용 안구 조성물)에 적합한 패키징은 당업계에 공지되어 있으며, 예를 들어 바이알(예를 들어, 밀봉된 바이알), 용기, 앰플, 병, 통(jar), 가요성 패키징(예를 들어, 밀봉된 Mylar 또는 비닐봉지) 등을 포함할 수 있다. 이러한 제조 물품은 추가로 멸균 및/또는 밀봉될 수 있다.

또한, 본원에 설명된 조성물을 포함하는 키트가 제공된다. 이들 키트는 본원에 기재된 용도와 같이 조성물을 사용하는 방법에 대한 지침(들)을 추가로 포함할 수 있다. 본원에 기재된 키트는 완충제, 희석제, 필터, 니들, 주사기 및 사용 지침서와 함께 조성물의 투여를 수행하거나 본원에 기재된 임의의 방법을 수행하기 위한 지침과 함께 패키지 삽입물을 포함하는, 상업적 및 사용자 견지에서 바람직할 수 있는 다른 물질을 추가로 포함할 수 있다. 예를 들어, 일부 구현예에서, 키트는 본원에 기재된 압타머 서열을 함유하는 유전자 조절 카세트, 주사에 적합한 약제학적으로 허용가능한 담체, 및 하나 이상의 완충제, 희석제, 필터, 니들, 주사기 및 주사를 수행하기 위한 지침을 갖는 패키지 삽입물을 포함하는 표적 유전자의 발현을 위한 rAAV를 포함한다. 일부 구현예에서, 키트는 안내 주사, 근육 주사, 정맥 주사 등에 적합하다.

본원에서 개시된 물질의 조성 및 방법의 변형이 당업자에 의해 실시될 수 있다는 것이 이해 및 예측되어야 하며, 상기 변형은 본 개시내용의 범위 내에 포함되도록 의도된다. 하기 실시예는 본 발명을 추가로 예시하지만, 어떤 식으로든 본 발명의 범위를 제한하도록 해석되지 않아야 한다.

본 명세서에서 인용된 모든 문헌은 그들의 전문이 참고로 본 명세서에 포함된다. 본원에 제공된 모든 뉴클레오티드 서열은 달리 명시되지 않는 한 5' 내지 3' 배향으로 되어 있다. 서열 목록이 여기에 제출되며, 그 전문은 그 전체가 참고로 본원에 포함된다.

실시예

실시예 1. 티아민 피로포스페이트(TPP)-반응성 압타머를 포함하는 합성 리보스위치는 TPP 및 티아민 유사체에 반응하여 유전자 발현을 조절할 수 있다.

실험적인 절차

리보스위치 구조물: 압타머는 Integrated DNA Technologies, Inc. 에 의해 합성되었으며, 골든 게이트 클로닝 전략(New England Biolabs, NEB)은 라보스위치 TPPz 및 TPPm을 각각 생성하는 Alishewanella tabrizica thiC gene (Microbiol Res. 2017년 1월; 195:71-80)로부터의 TPP 압타머 또는 Escherichia coli thiM gene (Structure. 2006년 9월; 14(9):1459-68)로부터의 TPP 압타머로 G17 리보스위치 카세트(그 전체가 본원에 포함된, WO 2016/126747에서 인용된 서열 ID 번호: 15 참조)에서의 구아닌 압타머를 대체하기 위해, 합성된 압타머 서열을 인트론-엑손-인트론 카세트에 클로닝하는 데 사용되었다.

서열 ID 번호:82는 TPPz 리보스위치를 루시페라제 리포터 유전자에 삽입함으로써 획득되었다. 대문자는 루시페라제 암호화 서열을 나타낸다. 소문자는 인트론/대안 엑손/인트론 및 리보스위치 서열을 나타낸다. thiC 압타머 암호화 서열(서열 ID 번호: 96)은 밑줄이 그어져 있다. 일 구현예에서, 서열 ID 번호: 82를 포함하는 리보스위치가 제공되며, 여기서 서열 ID 번호:82의 상기 압타머 암호화 서열(서열 ID 번호: 96)은 본원에 개시된 다른 압타머 서열로 대체된다.

서열 ID 번호:82

ATGGAAGACGCCAAAAACATAAAGAAAGGCCCGGCGCCATTCTATCCGCTGGAAGATGGAACCGCTGGAGAGCAACTGCATAAGGCTATGAAGAGATACGCCCTGGTTCCTGGAACAATTGCTTTTACAGATGCACATATCGAGGTGGACATCACTTACGCTGAGTACTTCGAAATGTCCGTTCGGTTGGCAGAAGCTATGAAACGATATGGGCTGAATACAAATCACAGAATCGTCGTATGCAGTGAAAACTCTCTTCAATTCTTTATGCCGGTGTTGGGCGCGTTATTTATCGGAGTTGCAGTTGCGCCCGCGAACGACATTTATAATGAACGTGAATTGCTCAACAGTATGGGCATTTCGCAGCCTACCGTGGTGTTCGTTTCCAAAAAGGGGTTGCAAAAAATTTTGAACGTGCAAAAAAAGCTCCCAATCATCCAAAAAATTATTATCATGGATTCTAAAACGGATTACCAGGGATTTCAGTCGATGTACACGTTCGTCACATCTCATCTACCTCCCGGTTTTAATGAATACGATTTTGTGCCAGAGTCCTTCGATAGGGACAAGACAATTGCACTGATCATGAACTCCTCTGGATCTACTGGTCTGCCTAAAGGTGTCGCTCTGCCTCATAGAACTGCCTGCGTGAGATTCTCGCATGCCAGAGATCCTATTTTTGGCAATCAAATCATTCCGGATACTGCGATTTTAAGTGTTGTTCCATTCCATCACGGTTTTGGAATGTTTACTACACTCGGATATTTGATATGTGGATTTCGAGTCGTCTTAATGTATAGATTTGAAGAAGAGCTGTTTCTGAGGAGCCTTCAGGATTACAAGATTCAAAGTGCGCTGCTGGTGCCAACCCTATTCTCCTTCTTCGCCAAAAGCACTCTGATTGACAAATACGATTTATCTAATTTACACGAAATTGCTTCTGGTGGCGCTCCCCTCTCTAAGGAAGTCGGGGAAGCGGTTGCCAAGAGGTTCCATCTGCCAGGTATCAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaaatcttcagtagaaggtaatgtgtcggagtgccttagggattattcccctaaagctgagaccgcattgcgggatccgttgaacctgatcaggctaatacctgcgaagggaacacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCAAGGATATGGGCTCACTGAGACTACATCAGCTATTCTGATTACACCCGAGGGGGATGATAAACCGGGCGCGGTCGGTAAAGTTGTTCCATTTTTTGAAGCGAAGGTTGTGGATCTGGATACCGGGAAAACGCTGGGCGTTAATCAAAGAGGCGAACTGTGTGTGAGAGGTCCTATGATTATGTCCGGTTATGTAAACAATCCGGAAGCGACCAACGCCTTGATTGACAAGGATGGATGGCTACATTCTGGAGACATAGCTTACTGGGACGAAGACGAACACTTCTTCATCGTTGACCGCCTGAAGTCTCTGATTAAGTACAAAGGCTATCAGGTGGCTCCCGCTGAATTGGAATCCATCTTGCTCCAACACCCCAACATCTTCGACGCAGGTGTCGCAGGTCTTCCCGACGATGACGCCGGTGAACTTCCCGCCGCCGTTGTTGTTTTGGAGCACGGAAAGACGATGACGGAAAAAGAGATCGTGGATTACGTCGCCAGTCAAGTAACAACCGCGAAAAAGTTGCGCGGAGGAGTTGTGTTTGTGGACGAAGTACCGAAAGGTCTTACCGGAAAACTCGACGCAAGAAAAATCAGAGAGATCCTCATAAAGGCCAAGAAGGGCGGAAAGATCGCCGTGTAA

서열 ID 번호:83은 TPPm 리보스위치를 루시페라제 리포터 유전자에 삽입함으로써 획득되었다. 대문자는 루시페라제 암호화 서열을 나타낸다. 소문자는 인트론/대안 엑손/인트론 및 리보스위치 서열을 나타낸다. thiM 압타머 암호화 서열(서열 ID 번호: 97)은 밑줄이 그어져 있다. 일 구현예에서, 서열 ID 번호: 83를 포함하는 리보스위치가 제공되며, 여기서 서열 ID 번호:83의 상기 압타머 암호화 서열(서열 ID 번호: 97)은 본원에 개시된 다른 압타머 서열로 대체된다.

서열 ID 번호: 83

ATGGAAGACGCCAAAAACATAAAGAAAGGCCCGGCGCCATTCTATCCGCTGGAAGATGGAACCGCTGGAGAGCAACTGCATAAGGCTATGAAGAGATACGCCCTGGTTCCTGGAACAATTGCTTTTACAGATGCACATATCGAGGTGGACATCACTTACGCTGAGTACTTCGAAATGTCCGTTCGGTTGGCAGAAGCTATGAAACGATATGGGCTGAATACAAATCACAGAATCGTCGTATGCAGTGAAAACTCTCTTCAATTCTTTATGCCGGTGTTGGGCGCGTTATTTATCGGAGTTGCAGTTGCGCCCGCGAACGACATTTATAATGAACGTGAATTGCTCAACAGTATGGGCATTTCGCAGCCTACCGTGGTGTTCGTTTCCAAAAAGGGGTTGCAAAAAATTTTGAACGTGCAAAAAAAGCTCCCAATCATCCAAAAAATTATTATCATGGATTCTAAAACGGATTACCAGGGATTTCAGTCGATGTACACGTTCGTCACATCTCATCTACCTCCCGGTTTTAATGAATACGATTTTGTGCCAGAGTCCTTCGATAGGGACAAGACAATTGCACTGATCATGAACTCCTCTGGATCTACTGGTCTGCCTAAAGGTGTCGCTCTGCCTCATAGAACTGCCTGCGTGAGATTCTCGCATGCCAGAGATCCTATTTTTGGCAATCAAATCATTCCGGATACTGCGATTTTAAGTGTTGTTCCATTCCATCACGGTTTTGGAATGTTTACTACACTCGGATATTTGATATGTGGATTTCGAGTCGTCTTAATGTATAGATTTGAAGAAGAGCTGTTTCTGAGGAGCCTTCAGGATTACAAGATTCAAAGTGCGCTGCTGGTGCCAACCCTATTCTCCTTCTTCGCCAAAAGCACTCTGATTGACAAATACGATTTATCTAATTTACACGAAATTGCTTCTGGTGGCGCTCCCCTCTCTAAGGAAGTCGGGGAAGCGGTTGCCAAGAGGTTCCATCTGCCAGGTATCAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaaatcttcagtagaaggtaatgtctcggggtgcccttctgcgtgaaggctgagaaatacccgtatcacctgatctggataatgccagcgtagggaagacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCAAGGATATGGGCTCACTGAGACTACATCAGCTATTCTGATTACACCCGAGGGGGATGATAAACCGGGCGCGGTCGGTAAAGTTGTTCCATTTTTTGAAGCGAAGGTTGTGGATCTGGATACCGGGAAAACGCTGGGCGTTAATCAAAGAGGCGAACTGTGTGTGAGAGGTCCTATGATTATGTCCGGTTATGTAAACAATCCGGAAGCGACCAACGCCTTGATTGACAAGGATGGATGGCTACATTCTGGAGACATAGCTTACTGGGACGAAGACGAACACTTCTTCATCGTTGACCGCCTGAAGTCTCTGATTAAGTACAAAGGCTATCAGGTGGCTCCCGCTGAATTGGAATCCATCTTGCTCCAACACCCCAACATCTTCGACGCAGGTGTCGCAGGTCTTCCCGACGATGACGCCGGTGAACTTCCCGCCGCCGTTGTTGTTTTGGAGCACGGAAAGACGATGACGGAAAAAGAGATCGTGGATTACGTCGCCAGTCAAGTAACAACCGCGAAAAAGTTGCGCGGAGGAGTTGTGTTTGTGGACGAAGTACCGAAAGGTCTTACCGGAAAACTCGACGCAAGAAAAATCAGAGAGATCCTCATAAAGGCCAAGAAGGGCGGAAAGATCGCCGTGTAA

형질감염: 3.5 x 10⁴ 인간 배아 신장(HEK) 293 세포는 형질감염 전날 96-웰(well) 평평한 바닥 플레이트에 플레이팅되었다. 플라스미드 DNA(500 ng)가 튜브 또는 96-웰 U-바닥 플레이트에 첨가되었다. 별도로, TransIT-293 시약(Mirus; 1.4 μL)이 50 μL Optimem I 배지(Life Technologies)에 첨가되고, 실온(RT)에서 5분 동안 방치되었다. 그런 다음, 이 희석된 형질감염 시약 50 μL가 DNA에 첨가되어 혼합되고 실온에서 20분 동안 배양되었다. 마지막으로, 이 용액 7 μL가 96-웰 플레이트의 세포 웰에 첨가되었다. 형질감염 4시간 후, 형질감염 용액을 함유하는 배지는 압타머 유도제로서 TPP, 퍼술티아민, 프로술티아민, 비스벤티아민, 베클로티아민 염산염 또는 설부티아민을 함유하는 배지로 교체되었다.

배양 세포의 반딧불이 루시페라제 검정: 배지 교체 24시간 후, 플레이트를 인큐베이터에서 제거하고 실험실 벤치에서 몇 분 동안 실온으로 평형화한 다음 흡인했다. Glo-lysis 완충제(Promega, 100μL, RT)가 첨가되고, 플레이트는 RT에서 최소 5분 동안 그대로 두었다. 그런 다음, 웰 내용물을 50μL 분쇄로 혼합하고, 각 시료 20μL를 글로-리시스 완충제에 10%로 희석한 브라이트-글로 시약(Promega) 20μL와 혼합하였다. 96개의 웰이 불투명한 흰색 384-웰 플레이트 상에서 이격되었다. 실온에서 5분 인큐베이션 후, 500ms 판독 시간으로 Tecan 기계를 사용하여 발광성을 측정했다. 루시페라제 활성은 평균 임의 광 단위(ALU) ± S.D.로 표현되었고, 배수 유도는 TPP 또는 유사체 처리가 있는 세포에서 얻은 루시페라제 활성을 TPP 또는 유사체 처리가 없는 세포에서 얻은 루시페라제 활성으로 나눈 몫으로 계산되었다.

결과

TPP 반응성 리보스위치를 포함하는 유전자 발현 카세트는 각각 A. tabrizica thiC 리보스위치(리보스위치 TPPz용) 또는 E. coli thiM 리보스위치(리보스위치 TPPm용)의 TPP 압타머를 합성 리보스위치 유전자 발현 카세트에 삽입함으로써 생성되었다. 여기서, 압타머 서열은 그 전체가 본원에 참조로서 포함된 WO2016/126747에 기술된 바와 같이 프레임-내 정지 코돈을 포함하는 대안 엑손의 하류에 있는 인트론에 삽입되었다. 압타머에 결합하는 리간드는 3' 인트론의 5' 스플라이스 부위의 접근성을 제어하므로, 대체 스플라이싱을 조절하여 표적 유전자의 발현을 조절할 수 있다.

도 1a에 도시된 바와 같이, 합성 리보스위치 TPPz 및 TPPm은 모두 TPP에 대한 반응으로 루시페라제 발현을 조절한다. TPPz는 TPPm보다 훨씬 낮은 농도에서 표적 유전자 발현을 유도하는데, 이는 A. tabrizica thiC 압타머가 E. coli thiM 압타머에 비해 포유동물 세포에서 더 높은 TPP 결합 친화도를 갖는다는 것을 나타낸다.

합성 리보스위치 TPPz 및 TPPm이 티아민 유사체에도 반응하는지 확인하기 위해, 티아민 유사체 그룹을 조사했다. 도 1b 및 1c에 나타낸 바와 같이, TPPz 및 TPPm은 둘 다 퍼술티아민 및 프로술티아민 처리에 대한 반응으로 루시페라제 발현을 유도하는 반면, 비스벤티아민, 베클로티아민 염산염 및 술부티아민을 사용한 처리는 루시페라제 발현에 대한 영향이 약하거나 전혀 없는 결과를 초래하였다( 도 1d참조). 모든 경우에, 리보스위치 TPPz는 TPPm보다 낮은 농도에서 표적 유전자 발현을 유도하였다.

이러한 데이터는, 이종 압타머 서열을 포함하는 합성 리보스위치가 포유동물 세포에서 용량 의존적 방식으로 다양한 티아민 관련 분자에 대한 반응으로 표적 유전자 발현을 효과적으로 유도할 수 있음을 나타낸다.

실시예 2. TPP 압타머 상동 서열은 티아민 유사체에 대한 반응으로 포유동물 세포에서 유전자 발현을 조절한다.

실험적 절차:

리보스위치 구성: TPP 압타머 상동 서열은 Rfam 12.0에서 획득(https://rfam.xfam.org/) 및 합성(Twister Biotech)되었다. TPP 압타머 상동 서열을 포함하는 리보스위치 구조물을 만들기 위해, 합성된 올리고가 PCR 주형으로서 사용되었고 골든 게이트 클로닝(NEB)을 사용하여 G17 리보스위치 구조물(WO 2016/126747)의 구아닌 압타머를 대체하였다.

형질감염 및 반딧불이 루시페라제 검정이 실시예 1에 기재된 바와 같이 수행되었다.

결과:

예를 들어, 인간 대상체에서 치료 목적을 위한 유전자의 조절을 위해, 치료할 대상에서 자연적으로 발생하지 않는 합성 화합물(예를 들어, 퍼술티아민)과 조합된 합성 리보스위치의 사용이 특히 유용하다. 이는, 환자에게 조절 화합물이 없기 때문에 치료 유전자의 발현을 엄격하게 제어할 수 있기 때문이다.

TPPz 및 TPPm과 비교하여 티아민 유사체에 반응하여 증가된 유전자 조절 활성을 갖는 압타머를 식별하기 위해, 상동 서열을 갖는 추정 TPP 압타머가 Rfam 12.0(RNA 패밀리 데이터베이스 RF00059, http://rfam.xfam.org/family/RF00059)로부터 획득되었다. 이 추정 TPP 압타머(수탁 번호 AACY023654033.1, 서열이 위치 895에서 시작하고 위치 815에서 종료됨; 본원에서 14G4로 지칭됨)가 실시예 1에 기재된 바와 같이 대안적 스플라이싱 기반 유전자 조절 카세트로 삽입되어 압타머 리보스위치 14G4를 생성하였다.

서열 ID 번호:84는 14G4 리보스위치를 루시페라제 리포터 유전자에 삽입함으로써 획득되었다. 대문자는 루시페라제 암호화 서열을 나타낸다. 소문자는 인트론/대안 엑손/인트론 및 리보스위치 서열을 나타낸다. 14G4 압타머 암호화 서열(서열 ID 번호: 7)은 밑줄이 그어져 있다. 일 구현예에서, 서열 ID 번호: 84를 포함하는 리보스위치가 제공되며, 여기서 서열 ID 번호:84의 상기 압타머 암호화 서열(서열 ID 번호: 7)은 본원에 개시된 다른 압타머 서열로 대체된다.

서열 번호: 84 ATGGAAGACGCCAAAAACATAAAGAAAGGCCCGGCGCCATTCTATCCGCTGGAAGATGGAACCGCTGGAGAGCAACTGCATAAGGCTATGAAGAGATACGCCCTGGTTCCTGGAACAATTGCTTTTACAGATGCACATATCGAGGTGGACATCACTTACGCTGAGTACTTCGAAATGTCCGTTCGGTTGGCAGAAGCTATGAAACGATATGGGCTGAATACAAATCACAGAATCGTCGTATGCAGTGAAAACTCTCTTCAATTCTTTATGCCGGTGTTGGGCGCGTTATTTATCGGAGTTGCAGTTGCGCCCGCGAACGACATTTATAATGAACGTGAATTGCTCAACAGTATGGGCATTTCGCAGCCTACCGTGGTGTTCGTTTCCAAAAAGGGGTTGCAAAAAATTTTGAACGTGCAAAAAAAGCTCCCAATCATCCAAAAAATTATTATCATGGATTCTAAAACGGATTACCAGGGATTTCAGTCGATGTACACGTTCGTCACATCTCATCTACCTCCCGGTTTTAATGAATACGATTTTGTGCCAGAGTCCTTCGATAGGGACAAGACAATTGCACTGATCATGAACTCCTCTGGATCTACTGGTCTGCCTAAAGGTGTCGCTCTGCCTCATAGAACTGCCTGCGTGAGATTCTCGCATGCCAGAGATCCTATTTTTGGCAATCAAATCATTCCGGATACTGCGATTTTAAGTGTTGTTCCATTCCATCACGGTTTTGGAATGTTTACTACACTCGGATATTTGATATGTGGATTTCGAGTCGTCTTAATGTATAGATTTGAAGAAGAGCTGTTTCTGAGGAGCCTTCAGGATTACAAGATTCAAAGTGCGCTGCTGGTGCCAACCCTATTCTCCTTCTTCGCCAAAAGCACTCTGATTGACAAATACGATTTATCTAATTTACACGAAATTGCTTCTGGTGGCGCTCCCCTCTCTAAGGAAGTCGGGGAAGCGGTTGCCAAGAGGTTCCATCTGCCAGGTATCAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcgccggtgagagcacaccctttgaacctgtttacggataatgccgccgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCAAGGATATGGGCTCACTGAGACTACATCAGCTATTCTGATTACACCCGAGGGGGATGATAAACCGGGCGCGGTCGGTAAAGTTGTTCCATTTTTTGAAGCGAAGGTTGTGGATCTGGATACCGGGAAAACGCTGGGCGTTAATCAAAGAGGCGAACTGTGTGTGAGAGGTCCTATGATTATGTCCGGTTATGTAAACAATCCGGAAGCGACCAACGCCTTGATTGACAAGGATGGATGGCTACATTCTGGAGACATAGCTTACTGGGACGAAGACGAACACTTCTTCATCGTTGACCGCCTGAAGTCTCTGATTAAGTACAAAGGCTATCAGGTGGCTCCCGCTGAATTGGAATCCATCTTGCTCCAACACCCCAACATCTTCGACGCAGGTGTCGCAGGTCTTCCCGACGATGACGCCGGTGAACTTCCCGCCGCCGTTGTTGTTTTGGAGCACGGAAAGACGATGACGGAAAAAGAGATCGTGGATTACGTCGCCAGTCAAGTAACAACCGCGAAAAAGTTGCGCGGAGGAGTTGTGTTTGTGGACGAAGTACCGAAAGGTCTTACCGGAAAACTCGACGCAAGAAAAATCAGAGAGATCCTCATAAAGGCCAAGAAGGGCGGAAAGATCGCCGTGTAA

이 리보스위치는 루시페라제 유전자 발현을 조절하는 능력에 대해 HEK 293 세포에서 테스트되었다. 도 2에 나타낸 바와 같이, 루시페라제 발현은 용량 의존적 방식으로 퍼술티아민으로 처리시 100배 증가하였다. 또한, 14G4 리보스위치는 여러 유형의 세포에서 퍼술티아민 처리에 대한 반응으로 루시페라제 유전자 발현을 조절했다.

이 실험은, 합성 소분자에 대한 반응으로 포유동물 세포에서 표적 유전자 발현을 현저하게 유도할 수 있는 압타머를 포함하는 포유동물 리보스위치의 성공적인 생성을 예시한다.

실시예 3. 티아민 유사체에 대한 민감도가 증가된 재설계된 압타머 서열을 포함하는 리보스위치의 생성.

Riboswitch 14G4는 TPP와 비교하여 퍼술티아민에 대한 자체 선택성으로 인해 추가 개선을 위해 선택되었다. E. coli thiM 리보스위치의 결정학적 구조와 14G4 리보스위치의 예측된 2차 구조(RNAfold, http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi)를 비교한 후, 리간드 결합 시 3차 구조에 참여할 수 있지만 나선 형성에 관여하지 않는 것으로 보이는 14G4 서열에서 3개의 영역이 식별되었다. 이들 3개 영역은, 활성이 개선된 재설계된 압타머 서열을 갖는 리보스위치를 생성하기 위한 서열 무작위화를 위해 선택되었다.

3개의 압타머 라이브러리 A1, A2 및 A3는 각각 영역 J4-5, J2-4 및 J3-2의 6개 위치에서 이들에 인접한 뉴클레오티드를 무작위화함으로써 생성되었다(도 3참조). 단일 박테리아 콜로니가 선택되었고, 리보스위치 구조물을 포함하는 플라스미드가 리보스위치 14G4와 비교하여 50 μM 퍼술티아민에 대한 반응으로 향상된 유전자 조절 활성에 대해 HEK 293 세포에서 스크리닝되었다. 도 4a에 나타낸 바와 같이, 1D10, 3H4, 4H2, 6B4, 6C4, 및 6G12를 포함하는 분리된 몇몇 압타머 구조물은 부모 구조물 14G4와 비교하여 퍼술티아민 의존성 유도의 증가를 나타낸다. 재설계된 압타머 서열을 포함하는 이러한 리보스위치는 또한 알파 마우스 간 12(AML12), C2C12(뮤린 근모세포 세포주) 및 성인 망막 색소 상피 세포주-19(ARPE -19)를 포함하는 다른 세포 유형에서 표적 유전자 발현의 현저한 강화를 유도한다(도 4b참조). 또한, 재설계된 압타머 서열을 포함하는 선택된 리보스위치는 또한 프로술티아민 및 벤포티아민(AML 12 세포에서) 처리에 대한 반응으로 표적 유전자 발현을 증가시켰다(도 4c참조).

이 데이터는, 재설계된 압타머 서열을 포함하는 분리된 리보스위치가 다양한 합성 소분자에 반응하여 다양한 세포 유형에서 표적 유전자 발현을 유도하는 데 유용하다는 것을 입증한다.

유전자 조절 활성을 더욱 강화하기 위해, 라이브러리 A4를 사용하여 제2 돌연변이 유발을 수행했다(도 5참조). 이 라이브러리의 경우, 3H4 변이 리보스위치 구조물의 압타머 서열은 6개의 뉴클레오티드 위치, 즉 3H4 압타머의 예측된 2차 구조의 J3-2 영역의 3개 염기 및 J2-4 영역의 3개 염기에서 무작위화되었다. 단일 박테리아 콜로니가 선택되었고, 리보스위치 구조물을 포함하는 플라스미드가 리보스위치 3H4와 비교하여 50 μM 퍼술티아민을 사용하여 향상된 유전자 조절 활성에 대해 HEK 293 세포에서 스크리닝되었다.

라이브러리 A4에서 분리되었던 상이한 압타머 변이체를 포함하는 여러 리보스위치는 14G4 및 3H4에 비해 퍼술티아민에 대한 추가적으로 개선된 민감도를 나타냈으며, 이는 압타머/리간드 결합에 관여하는 특정 뉴클레오티드 돌연변이 유발이 포유동물 세포에서 압타머 기반 리보스위치의 유전자 조절 활성을 향상시킬 수 있음을 입증한다(도 6a 참조).

다음으로, 티아민과 화학적 구조적 특징을 공유하는 다른 티아민 유사체에 반응하는 압타머 라이브러리 A4로부터 분리된 재설계된 압타머 서열을 포함하는 리보스위치의 능력이 결정되었다. 도 6b에 나타낸 바와 같이, 압타머 15A5 및 15D10을 포함하는 3H4 유래 리보스위치는 합성 분자 퍼술티아민, 프로술티아민 및 벤포티아민에 반응하여 루시페라제 발현을 강력하게 조절하지만, 자연 발생 TPP에는 매우 잘 반응하지 않는다. 또한, 재설계된 압타머 서열 15A5 및 15D10을 포함하는 리보스위치는, 부모 리보스위치 3H4와 비교하여, 퍼술티아민, 프로술티아민 및 벤포티아민에 반응하여 상당히 개선된 동적 범위를 나타낸다.

이 실시예는, 여러 차례의 돌연변이 유발을 통해, 여러 합성 티아민 유사체를 사용한 치료에 반응하여 표적 유전자 발현을 향상시키는 재설계된 압타머 서열을 포함하는 개선된 리보스위치가 생성될 수 있음을 예시한다.

실시예 4. 합성 티아민 유사체 리보스위치는 퍼술티아민에 반응하여 다양한 표적 유전자의 발현을 조절할 수 있다.

실시예 3에서 논의된 바와 같이, 재설계된 압타머 서열을 포함하는 분리된 리보스위치는 다양한 티아민 유사체에 반응하여 리포터 단백질 루시페라제의 발현을 효율적으로 유도한다. 분리된 압타머가 다른 표적 유전자의 발현을 조절하는 능력을 테스트하기 위해, 재설계된 압타머 서열을 포함하는 여러 리보스위치를 뮤린 에리트로포이에틴(mEpo)의 cDNA 서열 및 강화 녹색 형광 단백질(EGFP)의 cDNA 서열에 삽입했다.

실험적 절차:

리보스위치 구조물: 각각 압타머 3H4 또는 15D10을 함유하는 대체 스플라이싱 리보스위치가 구조물 Con8-Epo(서열 ID 번호:85), 구조물 Epo-3H4(서열 ID 번호:86) 및 Epo-15D10(서열 ID 번호:87)의 마우스 에리트로포이에틴 cDNA 서열에 위치 308에 삽입되었다. 에리트로포이에틴 유전자의 발현은 거대세포바이러스(CMV) 프로모터에 의해 구동되었다. 압타머 6B4를 포함하는 리보스위치 카세트는 벡터 pEGFP-C1의 강화된 녹색 형광 단백질(EGFP)을 암호화하는 cDNA 서열 내로 위치 276에 삽입되어 EGFP-6B4 구조물(서열 ID 번호:88)을 생성하였다. 압타머 서열이 없는 인트론-엑손-인트론 카세트가 Con8-Epo에 삽입되어 구조물 Epo-Con1(서열 ID 번호:89)를 생성하였으며, 이는 구성적 표적 유전자 발현을 위한 제어 역할을 한다.

3H4 리보스위치를 에리트로포이에틴 유전자에 삽입함으로써 서열 ID 번호:86을 획득하였다. 대문자는 에리트로포이에틴 암호화 서열을 나타낸다(서열 ID 번호:85 참조). 소문자는 인트론/대안 엑손/인트론 및 리보스위치 서열을 나타낸다. 3H4 압타머 암호화 서열(서열 ID 번호: 9)은 밑줄이 그어져 있다.

서열 ID 번호: 86 ATGGGGGTGCCCGAACGTCCCACCCTGCTGCTTTTACTCTCCTTGCTACTGATTCCTCTGGGCCTCCCAGTCCTCTGTGCTCCCCCACGCCTCATCTGCGACAGTCGAGTTCTGGAGAGGTACATCTTAGAGGCCAAGGAGGCAGAAAATGTCACGATGGGTTGTGCAGAAGGTCCCAGACTGAGTGAAAATATTACAGTCCCAGATACCAAAGTCAACTTCTATGCTTGGAAAAGAATGGAGGTGGAAGAACAGGCCATAGAAGTTTGGCAAGGCCTGTCCCTGCTCTCAGAAGCCATCCTGCAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcgccggtgagagcacaccctttgaacctgttcacggataatgccgctgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCCCAGGCCCTGCTAGCCAATTCCTCCCAGCCACCAGAGACCCTTCAGCTTCATATAGACAAAGCCATCAGTGGTCTACGTAGCCTCACTTCACTGCTTCGGGTACTGGGAGCTCAGAAGGAATTGATGTCGCCTCCAGATACCACCCCACCTGCTCCACTCCGAACACTCACAGTGGATACTTTCTGCAAGCTCTTCCGGGTCTACGCCAACTTCCTCCGGGGGAAACTGAAGCTGTACACGGGAGAGGTCTGCAGGAGAGGGGACAGGTGA

15D10 리보스위치를 에리트로포이에틴 유전자에 삽입함으로써 서열 ID 번호:87을 획득하였다. 대문자는 에리트로포이에틴 암호화 서열을 나타낸다(서열 ID 번호:85 참조). 소문자는 인트론/대안 엑손/인트론 및 리보스위치 서열을 나타낸다. 15D10 압타머 암호화 서열(서열 ID 번호: 26)은 밑줄이 그어져 있다.

서열 ID 번호:87

ATGGGGGTGCCCGAACGTCCCACCCTGCTGCTTTTACTCTCCTTGCTACTGATTCCTCTGGGCCTCCCAGTCCTCTGTGCTCCCCCACGCCTCATCTGCGACAGTCGAGTTCTGGAGAGGTACATCTTAGAGGCCAAGGAGGCAGAAAATGTCACGATGGGTTGTGCAGAAGGTCCCAGACTGAGTGAAAATATTACAGTCCCAGATACCAAAGTCAACTTCTATGCTTGGAAAAGAATGGAGGTGGAAGAACAGGCCATAGAAGTTTGGCAAGGCCTGTCCCTGCTCTCAGAAGCCATCCTGCAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcaccggtgagaacatacccttcggacctgttcacggataatgccgctgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCCCAGGCCCTGCTAGCCAATTCCTCCCAGCCACCAGAGACCCTTCAGCTTCATATAGACAAAGCCATCAGTGGTCTACGTAGCCTCACTTCACTGCTTCGGGTACTGGGAGCTCAGAAGGAATTGATGTCGCCTCCAGATACCACCCCACCTGCTCCACTCCGAACACTCACAGTGGATACTTTCTGCAAGCTCTTCCGGGTCTACGCCAACTTCCTCCGGGGGAAACTGAAGCTGTACACGGGAGAGGTCTGCAGGAGAGGGGACAGGTGA

서열 ID 번호: 88은 6B4 리보스위치를 EGFP 유전자에 삽입함으로써 획득되었다. 대문자는 EGFP 암호화 서열을 나타낸다. 소문자는 인트론/대안 엑손/인트론 및 리보스위치 서열을 나타낸다. 6B4 압타머 암호화 서열(서열 ID 번호: 14)은 밑줄이 그어져 있다.

서열 ID 번호: 88 ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcgccggtgagagcacacccttgtgacctgtttacggataatgccgccgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAA

에리트로포이에틴 유전자에 압타머 서열이 없는 인트론-엑손-인트론 카세트를 삽입함으로써 서열 ID 번호: 89가 획득되었다. 대문자는 에리트로포이에틴 암호화 서열을 나타낸다(서열 ID 번호:85 참조). 소문자는 인트론/대안 엑손/인트론 서열을 나타낸다.

서열 ID 번호: 89

ATGGGGGTGCCCGAACGTCCCACCCTGCTGCTTTTACTCTCCTTGCTACTGATTCCTCTGGGCCTCCCAGTCCTCTGTGCTCCCCCACGCCTCATCTGCGACAGTCGAGTTCTGGAGAGGTACATCTTAGAGGCCAAGGAGGCAGAAAATGTCACGATGGGTTGTGCAGAAGGTCCCAGACTGAGTGAAAATATTACAGTCCCAGATACCAAAGTCAACTTCTATGCTTGGAAAAGAATGGAGGTGGAAGAACAGGCCATAGAAGTTTGGCAAGGCCTGTCCCTGCTCTCAGAAGCCATCCTGCAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCCCAGGCCCTGCTAGCCAATTCCTCCCAGCCACCAGAGACCCTTCAGCTTCATATAGACAAAGCCATCAGTGGTCTACGTAGCCTCACTTCACTGCTTCGGGTACTGGGAGCTCAGAAGGAATTGATGTCGCCTCCAGATACCACCCCACCTGCTCCACTCCGAACACTCACAGTGGATACTTTCTGCAAGCTCTTCCGGGTCTACGCCAACTTCCTCCGGGGGAAACTGAAGCTGTACACGGGAGAGGTCTGCAGGAGAGGGGACAGGTGA.

마우스 에리트로포이에틴에 대한 효소 결합 면역흡착 검정(ELISA): AML12 세포는 실시예 1에 기재된 바와 같이 TransIT-X2 형질감염 시약(Mirus Bio)으로 형질감염되었다. 형질감염 4시간 후, AML12 세포가 표시된 용량으로 퍼술티아민으로 처리되거나 처리되지 않았다. 형질감염된 세포로부터의 상청액은 퍼술티아민 처리 24시간 후에 수집되었고, 제조자의 지시(R&D)에 따라 상청액 내 mEpo의 검출을 위해 ELISA가 수행되었다.

EGFP-6B4를 발현하는 세포주의 생성: Gene Pulser Xcell(Bio-Rad)을 사용하여 100ng 플라스미드 DNA로 HEK 293 세포를 전기천공하고 HEK 293 세포에 대한 기본 매개변수를 적용함으로써 EGFP-6B4 구조물을 포함하는 안정한 세포주가 생성되었다. 전기천공 48시간 후, 세포 배양액은 G418 내성 유전자를 운반하는 EGFP-6B4 카세트를 안정적으로 발현하는 세포를 선택하기 위해 2주 동안 800 μg/ml의 항생제 G418로 처리되었다. 세포는 트립신 처리되었다. 세포 현탁액에서 EGFP 형광의 강도는 Guava EasyCyte 8HT 기계를 사용하여 유세포 분석에 의해 결정되었다. 결과 데이터는 GuavaSoft 3.3을 사용하여 분석되었다. 유도 증가 배수는 퍼술티아민 처리 후 세포에서 얻은 평균 형광 강도(MFI)를 퍼술티아민 처리하지 않은 세포에서 얻은 MFI로 나눈 몫으로 계산되었다.

유세포 분석: EGFP-6B4 구조물로 안정적으로 형질도입된 1.5 x 10⁵ HEK 293 세포를 퍼술티아민 처리 하루 전에 24-웰 플레이트에 플레이팅했다. 세포를 퍼술티아민으로 24시간 동안 처리하였다. EGFP 형광의 강도는 위에서 설명한 대로 유세포 분석에 의해 결정되었다.

결과:

세포 발현 구조 EGFP-6B4는 퍼술티아민 처리의 부재 하에 리포터 단백질 EGFP의 낮은 발현을 나타내었지만, 퍼술티아민의 존재 하에 EGFP 발현의 14배 증가를 나타내었고(도 7a참조), 이는 합성 리간드 퍼술티아민에 대한 반응으로 루시페라제 이외의 리포터 단백질의 발현을 유도하는 재조작된 압타머 6B4를 포함하는 리보스위치의 능력을 예시한다. 또한, 퍼술티아민 처리에 대한 반응으로 EGFP 발현의 유도는 용량 의존적이었다(도 7b참조).

다음으로, mEpo의 유전자 발현을 조절하는 압타머 3H4 및 15D10을 포함하는 리보스위치의 능력이 조사되었다. 퍼술티아민이 없는 상태에서, mEpo-3H4 또는 mEpo-15D10을 포함하는 세포는 매우 낮은 수준의 mEpo를 발현했다. 그러나, 퍼술티아민 처리 시, mEpo-3H4 또는 mEpo-15D10 구조물을 포함하는 세포에서 mEpo의 발현이 용량 의존적 방식으로 향상되었다. 예상대로, 대조군 구조물 mEpo-Con1은 퍼술티아민의 존재 또는 부재에 관계없이 구성적으로 mEpo를 발현했다(도 7c참조). 12.5μM 퍼술티아민 처리에 대한 반응으로, mEpo의 발현은 퍼술티아민이 없는 발현(도 7d 참조)과 비교하여 약 40배(Epo-15D10) 또는 9배(Epo-3H4)에 의해 유도되었으며, 12.5 μM의 인듀서에서 mEpo-15D10의 mEpo 수준은 구성 및 비조절 mEpo-Con1 구조물의 mEpo 수준의 약 61.3%이다.

이러한 결과는, 소분자에 반응하여 유전자 발현을 유도하는 재조작된 압타머 서열을 포함하는 리보스위치의 능력이 특정 표적 유전자 서열에 제한되지 않는다는 것을 입증하며, 이는 표적 유전자 발현 조절에 있어서 이러한 압타머 리보스위치의 일반적인 적용가능성을 나타낸다.

실시예 5: 합성 리보스위치는 쥐의 생체 내에서 유전자 발현을 조절한다.

생체 내에서 유전자 발현을 유도하는 재설계된 압타머의 능력을 평가하기 위해, 쥐는 리포터 단백질 루시페라제 유전자에 삽입된 재설계된 리보스위치를 운반하는 아데노 관련 바이러스 벡터(AAV)로 형질감염되었다. 프로술티아민은 루시페라제 발현을 유도하기 위한 압타머 리간드로 사용되었다.

실험적 절차:

AAV2.8 바이러스 입자 생산: 쥐의 형질감염에 사용된 AAV2.8 입자는 AAV2로부터 유래된 바이러스 게놈 및 AAV8로부터 유래된 캡시드를 포함했다. (1) 압타머가 없는 조절 불가능한 리보스위치("luci-Con1", 서열 ID 번호:90), (2) 압타머 3H4를 포함하는 리보스위치 카세트("luci-3H4", 서열 ID 번호:91), 또는 (3) 압타머 6B4를 포함하는 리보스위치 카세트("luci-6B4", 서열 ID 번호:92)는 각각 AAV2 플라스미드 벡터로 클로닝되었다. 루시페라제 유전자의 발현은 CMV 및 유비퀴틴 C 인핸서 요소 및 닭 β-액틴 프로모터를 포함하는 CASI 프로모터에 의해 제어되었다. 바이러스 벡터가 AAV8 캡시드에 패키징되고 하기의 제조 프로토콜(Vigene Biosciences)에 따라 생산되었다.

루시페라제 리포터 유전자에 압타머 서열이 없는 인트론-엑손-인트론 카세트를 삽입하여 서열 ID 번호:90을 획득하였다. 대문자는 루시페라제 암호화 서열을 나타낸다. 소문자는 인트론/대안 엑손/인트론 서열을 나타낸다.

서열 ID 번호:90

ATGGAAGACGCCAAAAACATAAAGAAAGGCCCGGCGCCATTCTATCCGCTGGAAGATGGAACCGCTGGAGAGCAACTGCATAAGGCTATGAAGAGATACGCCCTGGTTCCTGGAACAATTGCTTTTACAGATGCACATATCGAGGTGGACATCACTTACGCTGAGTACTTCGAAATGTCCGTTCGGTTGGCAGAAGCTATGAAACGATATGGGCTGAATACAAATCACAGAATCGTCGTATGCAGTGAAAACTCTCTTCAATTCTTTATGCCGGTGTTGGGCGCGTTATTTATCGGAGTTGCAGTTGCGCCCGCGAACGACATTTATAATGAACGTGAATTGCTCAACAGTATGGGCATTTCGCAGCCTACCGTGGTGTTCGTTTCCAAAAAGGGGTTGCAAAAAATTTTGAACGTGCAAAAAAAGCTCCCAATCATCCAAAAAATTATTATCATGGATTCTAAAACGGATTACCAGGGATTTCAGTCGATGTACACGTTCGTCACATCTCATCTACCTCCCGGTTTTAATGAATACGATTTTGTGCCAGAGTCCTTCGATAGGGACAAGACAATTGCACTGATCATGAACTCCTCTGGATCTACTGGTCTGCCTAAAGGTGTCGCTCTGCCTCATAGAACTGCCTGCGTGAGATTCTCGCATGCCAGAGATCCTATTTTTGGCAATCAAATCATTCCGGATACTGCGATTTTAAGTGTTGTTCCATTCCATCACGGTTTTGGAATGTTTACTACACTCGGATATTTGATATGTGGATTTCGAGTCGTCTTAATGTATAGATTTGAAGAAGAGCTGTTTCTGAGGAGCCTTCAGGATTACAAGATTCAAAGTGCGCTGCTGGTGCCAACCCTATTCTCCTTCTTCGCCAAAAGCACTCTGATTGACAAATACGATTTATCTAATTTACACGAAATTGCTTCTGGTGGCGCTCCCCTCTCTAAGGAAGTCGGGGAAGCGGTTGCCAAGAGGTTCCATCTGCCAGGTATCAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCAAGGATATGGGCTCACTGAGACTACATCAGCTATTCTGATTACACCCGAGGGGGATGATAAACCGGGCGCGGTCGGTAAAGTTGTTCCATTTTTTGAAGCGAAGGTTGTGGATCTGGATACCGGGAAAACGCTGGGCGTTAATCAAAGAGGCGAACTGTGTGTGAGAGGTCCTATGATTATGTCCGGTTATGTAAACAATCCGGAAGCGACCAACGCCTTGATTGACAAGGATGGATGGCTACATTCTGGAGACATAGCTTACTGGGACGAAGACGAACACTTCTTCATCGTTGACCGCCTGAAGTCTCTGATTAAGTACAAAGGCTATCAGGTGGCTCCCGCTGAATTGGAATCCATCTTGCTCCAACACCCCAACATCTTCGACGCAGGTGTCGCAGGTCTTCCCGACGATGACGCCGGTGAACTTCCCGCCGCCGTTGTTGTTTTGGAGCACGGAAAGACGATGACGGAAAAAGAGATCGTGGATTACGTCGCCAGTCAAGTAACAACCGCGAAAAAGTTGCGCGGAGGAGTTGTGTTTGTGGACGAAGTACCGAAAGGTCTTACCGGAAAACTCGACGCAAGAAAAATCAGAGAGATCCTCATAAAGGCCAAGAAGGGCGGAAAGATCGCCGTGTAA

루시페라제 리포터 유전자에 3H4 리보스위치를 삽입함으로써 서열 ID 번호: 91이 획득되었다. 대문자는 루시페라제 암호화 서열을 나타낸다. 소문자는 인트론/대안 엑손/인트론 및 리보스위치 서열을 나타낸다. 3H4 압타머 암호화 서열(서열 ID 번호: 9)은 밑줄이 그어져 있다.

서열 ID 번호:91

ATGGAAGACGCCAAAAACATAAAGAAAGGCCCGGCGCCATTCTATCCGCTGGAAGATGGAACCGCTGGAGAGCAACTGCATAAGGCTATGAAGAGATACGCCCTGGTTCCTGGAACAATTGCTTTTACAGATGCACATATCGAGGTGGACATCACTTACGCTGAGTACTTCGAAATGTCCGTTCGGTTGGCAGAAGCTATGAAACGATATGGGCTGAATACAAATCACAGAATCGTCGTATGCAGTGAAAACTCTCTTCAATTCTTTATGCCGGTGTTGGGCGCGTTATTTATCGGAGTTGCAGTTGCGCCCGCGAACGACATTTATAATGAACGTGAATTGCTCAACAGTATGGGCATTTCGCAGCCTACCGTGGTGTTCGTTTCCAAAAAGGGGTTGCAAAAAATTTTGAACGTGCAAAAAAAGCTCCCAATCATCCAAAAAATTATTATCATGGATTCTAAAACGGATTACCAGGGATTTCAGTCGATGTACACGTTCGTCACATCTCATCTACCTCCCGGTTTTAATGAATACGATTTTGTGCCAGAGTCCTTCGATAGGGACAAGACAATTGCACTGATCATGAACTCCTCTGGATCTACTGGTCTGCCTAAAGGTGTCGCTCTGCCTCATAGAACTGCCTGCGTGAGATTCTCGCATGCCAGAGATCCTATTTTTGGCAATCAAATCATTCCGGATACTGCGATTTTAAGTGTTGTTCCATTCCATCACGGTTTTGGAATGTTTACTACACTCGGATATTTGATATGTGGATTTCGAGTCGTCTTAATGTATAGATTTGAAGAAGAGCTGTTTCTGAGGAGCCTTCAGGATTACAAGATTCAAAGTGCGCTGCTGGTGCCAACCCTATTCTCCTTCTTCGCCAAAAGCACTCTGATTGACAAATACGATTTATCTAATTTACACGAAATTGCTTCTGGTGGCGCTCCCCTCTCTAAGGAAGTCGGGGAAGCGGTTGCCAAGAGGTTCCATCTGCCAGGTATCAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcgccggtgagagcacaccctttgaacctgttcacggataatgccgctgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCAAGGATATGGGCTCACTGAGACTACATCAGCTATTCTGATTACACCCGAGGGGGATGATAAACCGGGCGCGGTCGGTAAAGTTGTTCCATTTTTTGAAGCGAAGGTTGTGGATCTGGATACCGGGAAAACGCTGGGCGTTAATCAAAGAGGCGAACTGTGTGTGAGAGGTCCTATGATTATGTCCGGTTATGTAAACAATCCGGAAGCGACCAACGCCTTGATTGACAAGGATGGATGGCTACATTCTGGAGACATAGCTTACTGGGACGAAGACGAACACTTCTTCATCGTTGACCGCCTGAAGTCTCTGATTAAGTACAAAGGCTATCAGGTGGCTCCCGCTGAATTGGAATCCATCTTGCTCCAACACCCCAACATCTTCGACGCAGGTGTCGCAGGTCTTCCCGACGATGACGCCGGTGAACTTCCCGCCGCCGTTGTTGTTTTGGAGCACGGAAAGACGATGACGGAAAAAGAGATCGTGGATTACGTCGCCAGTCAAGTAACAACCGCGAAAAAGTTGCGCGGAGGAGTTGTGTTTGTGGACGAAGTACCGAAAGGTCTTACCGGAAAACTCGACGCAAGAAAAATCAGAGAGATCCTCATAAAGGCCAAGAAGGGCGGAAAGATCGCCGTGTAA

루시페라제 리포터 유전자에 6B4 리보스위치를 삽입함으로써 서열 ID 번호: 92가 획득되었다. 대문자는 루시페라제 암호화 서열을 나타낸다. 소문자는 인트론/대안 엑손/인트론 및 리보스위치 서열을 나타낸다. 6B4 압타머 암호화 서열(서열 ID 번호: 14)은 밑줄이 그어져 있다.

서열 ID 번호:92

ATGGAAGACGCCAAAAACATAAAGAAAGGCCCGGCGCCATTCTATCCGCTGGAAGATGGAACCGCTGGAGAGCAACTGCATAAGGCTATGAAGAGATACGCCCTGGTTCCTGGAACAATTGCTTTTACAGATGCACATATCGAGGTGGACATCACTTACGCTGAGTACTTCGAAATGTCCGTTCGGTTGGCAGAAGCTATGAAACGATATGGGCTGAATACAAATCACAGAATCGTCGTATGCAGTGAAAACTCTCTTCAATTCTTTATGCCGGTGTTGGGCGCGTTATTTATCGGAGTTGCAGTTGCGCCCGCGAACGACATTTATAATGAACGTGAATTGCTCAACAGTATGGGCATTTCGCAGCCTACCGTGGTGTTCGTTTCCAAAAAGGGGTTGCAAAAAATTTTGAACGTGCAAAAAAAGCTCCCAATCATCCAAAAAATTATTATCATGGATTCTAAAACGGATTACCAGGGATTTCAGTCGATGTACACGTTCGTCACATCTCATCTACCTCCCGGTTTTAATGAATACGATTTTGTGCCAGAGTCCTTCGATAGGGACAAGACAATTGCACTGATCATGAACTCCTCTGGATCTACTGGTCTGCCTAAAGGTGTCGCTCTGCCTCATAGAACTGCCTGCGTGAGATTCTCGCATGCCAGAGATCCTATTTTTGGCAATCAAATCATTCCGGATACTGCGATTTTAAGTGTTGTTCCATTCCATCACGGTTTTGGAATGTTTACTACACTCGGATATTTGATATGTGGATTTCGAGTCGTCTTAATGTATAGATTTGAAGAAGAGCTGTTTCTGAGGAGCCTTCAGGATTACAAGATTCAAAGTGCGCTGCTGGTGCCAACCCTATTCTCCTTCTTCGCCAAAAGCACTCTGATTGACAAATACGATTTATCTAATTTACACGAAATTGCTTCTGGTGGCGCTCCCCTCTCTAAGGAAGTCGGGGAAGCGGTTGCCAAGAGGTTCCATCTGCCAGGTATCAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcgccggtgagagcacacccttgtgacctgtttacggataatgccgccgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCAAGGATATGGGCTCACTGAGACTACATCAGCTATTCTGATTACACCCGAGGGGGATGATAAACCGGGCGCGGTCGGTAAAGTTGTTCCATTTTTTGAAGCGAAGGTTGTGGATCTGGATACCGGGAAAACGCTGGGCGTTAATCAAAGAGGCGAACTGTGTGTGAGAGGTCCTATGATTATGTCCGGTTATGTAAACAATCCGGAAGCGACCAACGCCTTGATTGACAAGGATGGATGGCTACATTCTGGAGACATAGCTTACTGGGACGAAGACGAACACTTCTTCATCGTTGACCGCCTGAAGTCTCTGATTAAGTACAAAGGCTATCAGGTGGCTCCCGCTGAATTGGAATCCATCTTGCTCCAACACCCCAACATCTTCGACGCAGGTGTCGCAGGTCTTCCCGACGATGACGCCGGTGAACTTCCCGCCGCCGTTGTTGTTTTGGAGCACGGAAAGACGATGACGGAAAAAGAGATCGTGGATTACGTCGCCAGTCAAGTAACAACCGCGAAAAAGTTGCGCGGAGGAGTTGTGTTTGTGGACGAAGTACCGAAAGGTCTTACCGGAAAACTCGACGCAAGAAAAATCAGAGAGATCCTCATAAAGGCCAAGAAGGGCGGAAAGATCGCCGTGTAA

동물 연구: 수컷 Balb/c 쥐는 수용 AAV2.8 바이러스 입자의 1.0 x 10¹¹ 또는 2.5 x 10¹¹ 게놈 사본의 단일 꼬리 정맥 주사를 맞았다. AAV 벡터 전달 28일 후, 쥐는 50 mg/kg 프로술티아민으로 복강내(I.P.) 치료되었다. 루시페라제 활성은 약물 투여 전날과, 약물 투여 후 6시간, 24시간, 48시간 및 72시간에 측정되었다. 프로술티아민의 첫 번째 투여 후, 쥐는 다음과 같이 3회의 추가 투여 및 영상화 주기를 거쳤다: (AAV 투여 후)36일차: 100 mg/kg; 43일차: 200 mg/kg; 및 51일차: 400 mg/kg.

비침습적 살아있는 동물 생물발광 영상화: 영상화 전에, 쥐는 2% 이소플루란으로 마취되고, 150 mg/kg 체중의 루시페린이 주사되었다. 약물 투여 후 표시된 시점에서, Bruker Xtreme 시스템을 사용하여 루시페린 주사 후 2-5분 이내에 이미지를 촬영했다. 루시페라제 활성은 평균 광자/초 ± SD (n=5)으로 표현되었다. 루시페라제 유전자 발현의 배수 유도는 프로술티아민으로 치료된 마우스로부터 얻은 광자/들을 프로술티아민 치료 하루 전에 마우스로부터 얻은 값으로 나눈 몫으로 계산되었다.

결과:

동물에서 유전자 발현을 조절하는 리보스위치를 테스트하기 위해, 리보스위치가 있거나 없는 루시페라제 유전자를 보유하는 AAV 벡터를 정맥내로 쥐에 전달했다. AAV 주사 4주 후에 쥐를 복강내(I.P.) 프로술티아민으로 치료되었다. 프로술티아민 1회 투여(50 mg/kg) 후 6시간 치료, 루시페라제 활성은 리보스위치 3H4 또는 6B4를 포함하는 루시페라제 유전자를 함유하는 AAV 벡터를 주사한 쥐에게서 유의하게 증가했지만, 동일한 용량의 비조절성 대조군 벡터 Con1이 주사된 쥐 그룹에서는 증가하지 않았다(도 8a-도 8e참조). 또한, 프로술티아민 치료 시 루시페라제 활성의 증가는 용량 의존적이었다. 50 mg/kg의 단일 용량 또는 50 mg/kg의 2회 투여 및 100 mg/kg C 각각으로 치료된 쥐 그룹에서, 유도된 루시페라제 활성은 단일 용량 치료 후 24시간 동안 유도제 치료 전 수준으로 약화되었다. 그러나, 더 고용량의 유도제 프로술티아민(즉, 200 mg/kg 그리고 400 mg/kg)으로 추가로 치료되었던 쥐에서, 유도된 루시페라제 활성은 48시간 이상 동안 유지되었다.

이러한 결과는, 재설계된 압타머 서열을 포함하는 리보스위치가 생체 내에서 용량 의존적 방식으로 티아민 유사체로 치료 시 표적 유전자 발현을 선택적으로 유도한다는 것을 입증한다.

실시예 6 내지 99: 티아민 유사체 리보스위치는 신규 티아민 유사체에 반응하여 포유동물 세포에서 유전자 발현을 조절한다.

실험적 절차:

티아민 유사체의 생성

모든 용매 및 시약은 상업적으로 입수하여 받은 대로 사용되었다. 1H NMR 스펙트럼은 인용된 중수소화 용매에서 Bruker 기기(300MHz 또는 400MHz)에 기록되었다. 화학적 이동은 ppm으로 표시되고, 커플링 상수는 헤르츠로 표시된다. 모든 최종 화합물은 220-400 메쉬 실리카 겔을 사용하는 플래시 크로마토그래피 또는 용매로서 CH3CN/물을 사용하는 역상 HPLC에 의해 정제되었다. 박막 크로마토그래피는 실리카겔 60 F-254(0.25nm 두께) 플레이트에서 수행되었다. 가시화는 UV 광 및/또는 에탄올 내 10% 인몰리브덴산으로 가시화가 달성되었다. Waters LCT 또는 Applied Biosystems API 3000 질량 분석기에서 공칭(저해상도) 질량 스펙트럼을 획득했다. 고해상도 질량 스펙트럼(HRMS)은 Waters LCT 또는 Agilent TOF 질량 분석기에서 획득되었다. 다른 모든 LC-MS 실험은 Agilent 단일 사중극자 질량 분석기와 결합된 Agilent 1100 HPLC에서 수행되었다. 화합물 순도는 230 nM 및 254 nM 파장의 LC-MS에 의해 결정되었다. 보고된 모든 최종 화합물은 순도 ≥95%이다.

실시예 6(M19)

(((Z)-2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 (3r,5r,7r)-아다만탄-1-카르복실레이트

단계 1

(3r,5r,7r)-아다만탄-1-카르보닐 클로라이드

(3r,5r,7r)-아다만탄-1-카르복실산(10.0g, 55.4mmol) 및 SOCl₂ (32.8g, 275mmol, 20.0mL)의 혼합물을 25℃에서 1시간 동안 교반하였다. TLC(디클로로메탄:메탄올 = 10:1, 브로모크레졸 그린, R_f = 0.62)는 출발 물질이 완전히 소모되었음을 나타냈다. 혼합물은, 추가 정제 없이 다음 단계 반응에 직접 사용되는 무색 결정으로서 표제 화합물(11.0g, 99.7%)을 획득하기 위해 농축되었다.

단계 2

클로로메틸(3r,5r,7r)-아다만탄-1-카르복실레이트

DCM(150mL) 및 H₂O(150mL) 중 (3r,5r,7r)-아다만탄-1-카복실산(15g, 83.2mmol, 1당량), 테트라부틸암모늄 브로마이드(TBAB)(2.68g, 8.32mmol, 0.1당량) 및 NaHCO₃(21.0g, 250.0mmol, 3당량)의 혼합물에 클로로(클로로설포닐옥시)메탄(16.5g, 99.9mmol, 1.2당량)을 20℃에서 적가하였다. 혼합물은 20℃에서 15 시간 동안 교반했다(기체 발생). 방치 시, 혼합물은 2개의 층으로 분리되고, 수성 층은 메틸렌 디클로라이드(100mL Х 2)로 추출되었다. 조합된 유기상은 무수 Na₂SO₄로 건조되고, 여과되고, 그리고 농축되어 미가공 무색 오일(crude colorless oil)을 제공하였다. 미가공 생성물은 석유 에테르(500mL)로 희석되고 실리카겔 패드를 통해 여과되었다. 여과액을 농축하여 표제 화합물(15.5g, 81.4%)을 무색 오일로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 5.72 (s, 2H), 2.05-1.92 (m, 6H), 1.74-1.70 (m, 2H).

단계 3

H₂O(150mL) 및 THF(150mL) 중 비타민 B1(10g, 33.2mmol, 1당량) 및 KI(551.0mg, 3.32mmol, 0.1당량)의 혼합물에 NaOH(2.66g, 66.5mmol, 2 당량)이 조금씩 첨가되었고, 이 혼합물은 20℃에서 0.5시간 동안 교반되었다. 클로로메틸(3r,5r,7r)-아다만탄-1-카르복실레이트(15.2g, 66.5mmol, 2당량)가 혼합물에 적가되고, 생성된 혼합물은 20℃에서 추가로 12시간 동안 교반되었다. LCMS는 반응의 완료를 보여주었다. 반응 혼합물은 2개의 층으로 분리되었다. 수성 층이 에틸 아세테이트(200 mL Х 3)로 추출되었다. 조합된 유기상은 무수 Na₂SO₄로 건조되고, 여과되고, 농축되어 미가공 생성물(TLC: 에틸 아세테이트/에탄올 = 10/1, 제품 R_f = 0.2)이 제공되었다. 미가공 생성물은 표제 화합물(580.24 mg, 4%)을 백색 고체로 제공하기 위해 생성물을 예비-HPLC(컬럼: Waters Xbridge BEH C18 250 Х 50mm, 10μm; 이동상: 0.05% 암모니아 수산화물 v/v 함유 물-아세토니트릴, 20분)에 의해 추가로 정제된 황색 고체로 제공하도록 실리카겔 크로마토그래피(메틸렌 디클로라이드/메탄올 = 10/1)에 의해 정제되었다. ¹H NMR (400 MHz, DMSO-d ₆) δ 7.93 (s, 1H), 7.82 (s, 1H), 6.96 (br, 2H), 4.95 (s, 2H), 4.68 (t, J = 5.2 Hz, 1H), 4.32 (s, 2H), 3.52-3.48 (m, 2H), 2.58 (m, 2H), 2.28 (s, 3H), 1.94 (s, 6H), 1.80-1.78 (m, 6H), 1.68-1.62 (m, 6H). MS (ES⁺) m/e 475.2 (M+H)⁺.

실시예 7 (M10)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 피발레이트

EtOH(10.0mL) 중 비타민 B1(1.00g, 3.78mmol, 1.00당량)의 용액에 NaOEt(257mg, 3.78mmol, 1.00당량), 클로로메틸 피발레이트(569mg, 3.78mmol, 547uL, 1.00 당량) 및 NaOH(45.4 mg, 1.13 mmol, 0.30 당량)이 추가되었다. 상기 혼합물은 20 ℃에서 2 시간 동안 교반하였다. 반응 혼합물을 감압 하에 농축되어 잔류물을 제공하였다. 잔류물은 prep-HPLC로 정제되어 표제 화합물(61.0 mg, 3.4%) 밝은 황색 고체로 제공되었다. ¹H NMR (400 MHz, DMSO-d ₆) δ 7.93 (s, 1H), 7.83 (s, 1H), 6.71 (br d, J = 0.9 Hz, 2H), 4.96 (s, 2H), 4.69 (t, J = 5.5 Hz, 1H), 4.34 (br s, 2H), 3.60 - 3.42 (m, 2H), 2.59 (t, J = 6.9 Hz, 2H), 2.28 (s, 3H), 1.96 (s, 3H), 1.12 (s, 9H). MS (ES⁺) m/e 397.3 (M+H)⁺.

실시예 8 (M16)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 이소부틸레이트

단계 1

나트륨 (Z)-2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-티올레이트

EtOH(80.0mL) 중 비타민 B1(40.0g, 132mmol)의 용액에 EtOH 중 NaOEt(40.0g, 123mmol)를 -10℃에서 첨가되었다. 혼합물은 10℃에서 30분 동안 교반하였다. 형성된 고체는 여과에 의해 수집되고 건조되어 표제 화합물(36.0g, 88.9%)을 황색 고체로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 9.51 (s, 1H), 8.05 (s, 1H), 7.18 (s, 2 H), 5.41 (s, 3 H), 3.65-3.62 (m, 2H), 3.01-2.95 (m, 2H), 2.48 (s, 3H), 2.34 (s, 3H).

단계 2

EtOH(30.0mL) 중 나트륨 (Z)-2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-티올레이트(3.00g, 9.86mmol)의 혼합물에 NaOH(120mg, 3.00mmol)를 25℃에서 첨가한 다음 클로로메틸 이소부티레이트(1.35g, 9.88mmol)를 첨가하였다. 혼합물은 25℃에서 1시간 동안 교반되고 농축되어 잔류물을 제공하였다. 잔류물을 prep-HPLC(염기성 조건)로 정제하고 동결건조하여 150 mg의 미가공 갈색 고체를 수득하고 이를 prep-HPLC(NH4HCO3로 완충됨)로 추가 정제한 후 동결건조하여 표제 화합물(50.1 mg, 29%)을 황색 고체로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 7.92 (s, 1H), 7.83 (s, 1H), 6.70 (br, 2H), 4.96 (s, 2H), 4.69 (t, J = 5.2 Hz, 1H), 4.34 (s, 2H), 3.41-3.52 (m, 2H), 2.58 (t, J = 6.8 Hz, 2H), 2.50-2.40 (m, 1H), 2.28 (s, 3H), 1.95 (s, 3H), 1.08 (d, J = 7.2 Hz, 6H). MS (ES⁺) m/e 383.3 (M+H)⁺.

실시예 9 (M18)

(Z)-1-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)에틸 피발레이트

단계 1

1-클로로에틸 피발레이트

피발로일 클로라이드(9.80g, 81.2mmol, 10.0mL) 및 2,4,6-트리메틸-1,3,5-트리옥산(4.95g, 37.4mmol, 5.00mL)의 혼합물에 ZnCl₂(1M, 2.50 mL)가 첨가되었고 그 혼합물은 90℃에서 1시간 동안 교반되었다. 반응 혼합물은 실온으로 냉각되고, EtOAc(100 mL)로 희석되었다. 생성된 유기 용액은 빙냉된 NaHCO₃ (20.0 mL Х 3) 용액 및 염수로 세척되고, Na₂SO₄상에서 건조되고, 여과되고, 농축되어 잔류물을 제공하였다. 잔류물은 90℃게이지 압력: -0.09 MPa)에서 증류되어 표제 화합물(1.60 g)을 무색 오일로서 제공되었다. ¹H NMR (400 MHz, CDCl₃) δ 6.52-6.56 (m, 1H), 1.80 (d, J = 5.6 Hz, 3H), 1.22 (s, 9H).

단계 2

EtOH(30.0mL) 중 나트륨 (Z)-2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-티올레이트(3.00g, 9.86mmol)의 혼합물에 25℃에서 EtOH의 NaOEt (3.20 g, 9.88 mmol)를 첨가한 후 1-클로로에틸 피발레이트(1.60 g, 9.72 mmol) 및 NaOH (120 mg, 3.00 mmol)를 첨가하였다. 혼합물은 25℃에서 12시간 동안 교반되었고 농축되어 잔류물을 제공하였다. 잔류물은 prep-HPLC로 정제한 후 동결건조하여 표제 화합물 (60.0 mg, 2% 수율)을 황색 고체로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 7.92 (s, 1H), 7.85 (s, 1H), 6.48 (br, 2H), 5.74-5.79 (m, 1H), 4.46 (d, J = 15.2 Hz, 1H), 4.37 (s, 1H), 4.28 (d, J = 15.2 Hz, 1H), 3.53-3.55 (m, 2H), 2.52-2.57 (m, 2H), 2.30 (s, 3H), 1.95 (s, 3H), 1.29 (d, J = 6.4 Hz, 3H), 1.33 (s, 9H). MS (ES⁺) m/e 411.3 (M+H)⁺.

실시예 10 (M21)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 벤조에이트

H₂O(25mL) 중 비타민 B1(5g, 16.6mmol, 1당량) 및 KI(138.0mg, 831.0μmol, 0.05당량)의 혼합물에 NaOH(1.33g, 33.2mmol, 2당량)를 부분적으로 첨가하였다. 이 혼합물을 20℃에서 0.5시간 동안 교반한 다음, THF(25mL) 중 클로로메틸 벤조에이트(2.84g, 16.6mmol, 1당량)의 용액을 적가하였다. 이 반응 혼합물은 20℃에서 10 시간 동안 교반하였다. LCMS는 형성된 새로운 생성물을 보여주었다. 혼합물은 5 mL의 메탄올을 첨가하여 ?칭(quench)되고 pH는 포화 탄산수소나트륨 수용액으로 ~7까지 조정되었다. 그후, 수성 상이 에틸 아세테이트 (200 mL Х 2)로 추출되었다. 조합된 유기상을 무수 Na₂SO₄로 건조하고, 여과하고, 농축하여 미가공 생성물을 수득하고 이를 에틸 아세테이트(50 mL)로 분쇄하여 표제 화합물(700 mg, 10%)을 백색 고체로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 7.96-7.92 (m, 3H), 7.81 (s, 1H), 7.73-7.67 (m, 1H), 7.57-7.53 (m, 2H), 6.76 (brs, 2H), 5.28 (s, 2H), 4.74-4.70 (m, 1H), 4.32 (s, 2H), 3.54-3.48 (m, 2H), 2.69-2.66 (m, 2H), 2.26 (s, 3H), 1.96 (s, 3H). MS (ES⁺) m/e 417.2 (M+H)⁺.

실시예 11 (M34)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 나프탈렌-1-카보티오에이트

H₂O(150mL) 및 THF(150mL) 중 비타민 B1(9g, 29.9mmol, 1당량) 및 KI(497.0mg, 2.99mmol, 0.1당량)의 혼합물에 NaOH(2.39g, 59.8mmol, 2당량)를 첨가하였다. 혼합물을 20℃에서 0.5시간 동안 교반하였다. 1-나프토일 클로라이드(11.1g, 58.0mmol, 8.71mL, 1.94당량)를 적가하였다. 반응 혼합물은 20℃에서 다른 12 시간 동안 교반하였다. LCMS는 반응의 완료를 보여주었다. 이 반응 혼합물은에틸 아세테이트(100 mL Х 3)로 추출되었다. 수성 상이 포화 중탄산나트륨 용액에 의해 pH 7~8로 조정되고 에틸 아세테이트(100 mL Х 3)에 의해 추출되었다. 조합된 유기상을 무수 Na₂SO₄로 건조하고, 여과하고, 농축하여 미가공 생성물을 수득하고 이를 에틸 아세테이트(10 mL)로 분쇄하여 표제 화합물(420 mg, 962 μmol, 3% 수율)을 회백색 고체로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 8.21-8.20 (m, 2H), 8.05-8.02 (m, 1H), 7.99 (s, 1H), 7.92-7.91 (m, 1H), 7.88 (s, 1H), 7.68-7.59 (m, 3H), 6.74 (brs, 2H), 4.70-4.68 (m, 1H), 4.44 (s, 2H), 3.53 (m, 2H), 2.70-2.68 (m, 2H), 2.19 (s, 3H), 2.13 (s, 3H). MS (ES⁺) m/e 437.1 (M+H)⁺.

실시예 12(M26)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 벤조티오에이트

H₂O (50.0 mL) 및 THF(5.00mL) 중 비타민 B1(1.00g, 3.32mmol, 1.00당량) 및 NaOH(133.0mg, 3.32mmol, 1.00당량)의 용액에 염화벤조일(935.0mg, 0℃에서 6.65mmol, 772.0μL, 2.00당량)을 0℃에서 첨가하였다. 반응 혼합물을 0℃에서 0.5 시간 동안 교반하였다. LCMS는 출발 물질이 소모되었고 원하는 질량의 생성물이 검출되었음을 보여주었다. 반응 혼합물은 MeOH(5.00mL)로 ?칭되고 pH = 7로 조정되었고, 10:1 DCM:MeOH (25.0 mL Х 2)로 추출되었다. 조합된 유기 층은 Na₂SO₄상에서 건조되고, 여과되고, 감압 하에 농축되어 미가공 생성물을 얻었고, 이는 EtOAc/EtOH/DCM (2:2:1)으로 분쇄시 표제 화합물(251 mg, 18.6%)을 백색 고체로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 7.89 (s, 1H), 7.82 (s, 1H), 7.73 (d, J = 7.2 Hz, 2H), 7.68 (t, J = 7.6 Hz, 1H), 7.53 (t, J = 7.6 Hz, 2H), 6.65 (brs, 2H), 4.64 (t, J = 4.2 Hz, 1H), 4.39 (s, 2H), 3.46 (m, 2H), 2.57 (m, 2H), 2.16 (s, 3H), 2.14 (s, 3H). MS (ES⁺) m/e 387.0 (M+H)⁺.

실시예 13 (M27)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-메틸프로판티오에이트

H₂O (50.0 mL) 및 THF(5.00mL) 중 비타민 B1(1.00g, 3.32mmol, 1.00당량) 및 NaOH(266 mg, 6.65 mmol, 2.00 당량)의 용액에 이소부티릴 클로라이드(708 mg, 6.65 mmol, 695.0 μL, 2.00 당량)을 0℃에서 첨가하였다. 반응 혼합물은 0℃에서 0.5시간 동안 교반되고, MeOH(5.00mL)로 ?칭되고, pH = 7로 조정되었다. 혼합물은 10:1 DCM:MeOH (25.0 mL Х 2)로 추출되었다. 조합된 유기 층들을 Na₂SO₄ 상에서 건조시키고, 여과하고 감압 하에서 농축하였다. 이 미가공 생성물은 EtOAc/EtOH/DCM (2:2:1)로 분쇄되어 표제 화합물(224.0 mg, 19.0%)을 백색 고체로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 7.79 (s, 1H), 7.77 (s, 1H), 6.68 (brs, 2H), 4.61 (t, J = 4.2 Hz, 1H), 4.35 (s, 2H), 3.40 (q, J = 6.8 Hz, 2H), 2.60-2.50 (m, 1H), 2.44 (t, J = 7.2 Hz, 1H), 2.26 (s, 3H), 2.07 (s, 3H), 1.02 (s, 3H), 1.00 (s, 3H). MS (ES⁺) m/e 353.3 (M+H)⁺.

실시예 14(M28)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2,2-디메틸프로판에티오에이트

H₂O(5.00 mL) 중 나트륨 (Z)-2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-티올레이트 (0.50 g, 1.64 mmol, 1.00 당량) 및 NaOH(65.7 mg, 1.64 mmol, 1.00 당량)의 혼합물에 0℃에서 피발로일 클로라이드(198 mg, 1.64 mmol, 202 μL, 1 당량)을 첨가하고, 생성된 혼합물을 0℃에서 1시간 동안 교반하였다. 이 혼합물은 농축되고 컬럼 크로마토그래피(SiO₂, 디클로로메탄:메탄올 = 100:1 내지 10:1, TLC: 디클로로메탄: 메탄올= 10:1, R_f = 0.4)에 의해 정제되어 표제 화합물(110 mg, 18.2%)을 백색 고체로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 7.79 (s, 1 H) 7.75 (s, 1 H) 6.70 (br s, 2 H) 4.60 (t, J = 5.6 Hz, 1 H) 4.35 (br s, 2 H) 3.39 (q, J = 6.8 Hz, 2 H) 2.42 (br t, J = 6.8 Hz, 2 H) 2.26 (s, 3 H) 2.08 (s, 3 H) 1.07 (s, 9 H). MS (ES⁺) m/e 367.2 (M+H)⁺.

실시예 15 (M29)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-메톡시벤조티오에이트

H₂O (4 mL) 중 나트륨 (Z)-2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-티올레이트 (0.50 g, 1.64 mmol, 1.00 당량) 및 NaOH(65.7 mg, 1.64 mmol, 1.00 당량)의 혼합물에 0℃에서 화합물 4-메톡시벤조일 클로라이드(280 mg, 1.64 mmol, 226 uL, 1.00 당량)을 첨가하고, 생성된 혼합물은 0℃에서 1시간 동안 교반되었다. LCMS는 출발 물질이 소모되었고 원하는 질량의 생성물이 검출되었음을 보여주었다. 그런 다음, 혼합물이 농축되고, 잔류물은 실리카겔 컬럼 크로마토그래피로 정제되었고(100:0 내지 20:1 디클로로메탄:메탄올) 표제 화합물(60.0 mg, 9%)을 백색 고체로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 7.87 (s, 1 H), 7.81 (s, 1 H), 7.72 (br d, J = 8.8 Hz, 2 H), 7.05 (br d, J = 8.8 Hz, 2 H), 6.64 (m, 2 H), 4.64 (br s, 1 H), 4.37 (br s, 2 H), 3.84 (s, 3 H), 3.46 (br d, J = 4.0 Hz, 2 H), 2.58 (m, 2 H), 2.19 (s, 3 H), 2.12 (s, 3 H). MS (ES⁺) m/e 417.1 (M+H)⁺.

실시예 16 (M30)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2,6-디클로로벤조티오에이트

H₂O(4.00 mL) 중 나트륨 (Z)-2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-티올레이트 (0.50 g, 1.64 mmol, 1.00 당량) 및 NaOH(65.7 mg, 1.64 mmol, 1.00 당량)의 혼합물에 0℃에서 2,6-디클로로벤조일 클로라이드(344 mg, 1.64 mmol, 235 μL, 1.00 당량)에 첨가되었다. 생성된 혼합물은 0℃에서 1시간 동안 교반되고, 이후 농축시켜 잔류물을 제공하였다. 잔류물은 prep-HPLC로 정제하여 표제 화합물(150 mg, 20.1%) 백색 고체로서 제공하였다. ¹H NMR (400 MHz, DMSO-d ₆) δ 7.96 (s, 1 H), 7.84 (s, 1 H), 7.60 - 7.54 (m, 3 H), 6.68 (m, 2 H), 4.68 - 4.75 (m, 1 H), 4.41 (br s, 2 H), 3.46 - 3.52 (m, 2 H), 2.62 - 2.69 (m, 2 H), 2.26 (s, 3 H), 2.14 (s, 3 H). MS (ES⁺) m/e 455.1 (M+H)⁺.

실시예 17 (M31)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-(포스포노옥시)펜트-2-엔-3-일) 2,2-디메틸프로판티오에이트

단계 1

3-((4-아미노-2-메틸피리미딘-5-일)메틸)-4-메틸-5-(2-(포스포노옥시)에틸)티아졸-3-이움 클로라이드

130℃에서 폴리인산(150g, 49.8mmol, 1.00당량)의 용액에 비타민 B1(15.0g, 49.8mmol, 1.00당량)을 부분적으로 첨가하였다. 상기 혼합물은 100-130℃에서 2 시간 동안 교반되었다. 물(250mL)이 첨가되고, 혼합물은 100℃에서 추가로 2시간 동안 교반되었고, 25℃로 냉각시키고, 트리옥틸아민/MTBE (1:1, 250mL Х 2)에 의해 추출되었다. 수층을 분리하고, EtOH 400mL로 희석하여, 25℃에서 2시간 동안 교반하였다. 형성된 백색 고체를 여과에 의해 수집하고 EtOH(200mL Х 2)로 세척하고 건조하여 표제 화합물(17.0g, 98.7%)을 제공하였다.

단계 2

나트륨 (Z)-4-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-3-설피도펜트-3-엔-1-일 포스페이트

H₂O (20 mL) 중 3-((4-아미노-2-메틸피리미딘-5-일)메틸)-4-메틸-5-(2-(포스포노옥시)에틸)티아졸-3-이움(2.00g, 5.79mmol, 1.00 당량)의 혼합물에 NaOH (5.64 g, 42.3 mmol, 7.30 당량)를 0-5℃에서 천천히 첨가하였다. 혼합물은 0.5시간 동안 5-10℃에서 교반되고 농축되어 표제 화합물(2.40 g, 97%)을 추가 정제 없이 다음 단계 반응에 직접 사용되는 황색 고체로서 제공하였다.

단계 3

NaOH(1M, 3.74mL, 2.00당량) 중 나트륨 (Z)-4-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-3-술피도펜트-3-엔-1-일 포스페이트 (0.800 g, 1.87 mmol, 1.00당량)의 혼합물에 피발로일 클로라이드(840mg, 6.97mmol, 857μL, 3.73당량)를 첨가하였다. 생성된 혼합물은 2시간 동안 25 ℃에서 교반되었다. TLC(에틸 아세테이트: 디클로로메탄 = 2: 1)은, 출발 물질이 소모되고 새로운 반점이 형성되었음을 보여주었다. 이 반응 혼합물은 농축되고 역상 HPLC로 정제되어 표제 화합물(132 mg, 15.7%)을 백색 고체로서 제공하였다. ¹H NMR (400 MHz, MeOD) δ 7.99 (s, 1 H), 7.79 (s, 1 H), 3.93 (br d, J = 5.6 Hz, 2 H), 2.56 (s, 3 H), 2.25 (s, 3 H), 1.14 (s, 9 H). MS (ES⁺) m/e 447.1 (M+H)⁺.

실시예 18 (M32)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-(포스포노옥시)펜트-2-엔-3-일) 4-메톡시벤조티오에이트

NaOH(1M, 3.74mL, 2.00당량) 중 나트륨 (Z)-4-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-3-술피도펜트-3-엔-1-일 포스페이트 (0.80 g, 1.87 mmol, 1.00당량)의 혼합물에 4-메톡시벤조일 클로라이드(1.19 g, 6.97 mmol, 958 μL, 3.73 당량)을 첨가하였다. 생성된 혼합물은 2시간 동안 25 ℃에서 교반되었다. TLC(에틸 아세테이트: 디클로로메탄 = 2: 1)은, 출발 물질이 소모되고 새로운 반점이 형성되었음을 보여주었다. 혼합물은 농축되고 역상 HPLC로 정제되어 표제 화합물(174 mg, 18.1%)을 백색 고체로서 제공되었다. ¹H NMR (400 MHz, MeOD) δ 8.04 (s, 1 H), 7.99 (s, 1 H), 7.75 (d, J = 8.8 Hz, 2 H), 7.00 (d, J = 8.8 Hz, 2 H), 4.74 - 4.35 (m, 2 H), 4.03 (q, J = 5.6 Hz, 2 H), 3.88 (s, 3 H), 2.81 (m, 2 H), 2.40 (s, 3 H), 2.30 (s, 3 H). MS (ES⁺) m/e 497.1 (M+H)⁺.

실시예 19 (M33)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-(포스포노옥시)펜트-2-엔-3-일) 2,6-디클로로벤조티오에이트

NaOH(1M, 3.74mL, 2.00당량) 중 나트륨 (Z)-4-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-3-술피도펜트-3-엔-1-일 포스페이트 (0.800 g, 1.87 mmol, 1.00당량)의 혼합물에 2,6-디클로로벤조일 클로라이드(391 mg, 1.87 mmol, 268 μL, 1.00 당량)이 첨가되었다. 혼합물은 25 ℃에서 2 시간 동안 교반되었다. TLC(에틸 아세테이트: 디클로로메탄 = 2: 1)은, 출발 물질이 소모되고 새로운 반점이 형성되었음을 보여주었다. 혼합물은 농축되고 역상 HPLC로 정제되어 표제 화합물(72.0 mg, 7.20%)을 백색 고체로서 제공되었다. ¹H NMR (400 MHz, MeOD) δ 8.06 (s, 1 H), 8.02 (s, 1 H), 7.44 (s, 3 H), 4.07 - 4.04 (m, 2 H), 2.49 (s, 3 H), 2.32 (s, 3 H). MS (ES⁺) m/e 535.0 (M+H)⁺.

실시예 20 내지 59:적절한 출발 물질을 사용하여 M34(실시예 11)의 제조 절차에 따라 하기 화합물을 합성하였다.

실시예 20 (M37)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-메틸나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.30 - 8.25 (m, 1H), 8.13 (dd, J = 3.2, 6.6 Hz, 1H), 7.98 (s, 1H), 7.88 - 7.80 (m, 2H), 7.69 - 7.64 (m, 2H), 7.47 (d, J = 7.6 Hz, 1H), 6.71 (br s, 2H), 4.69 (br t, J = 5.6 Hz, 1H), 4.43 (br s, 2H), 3.55 - 3.47 (m, 2H), 2.72 (s, 3H), 2.66 (br t, J = 6.8 Hz, 2H), 2.18 (s, 3H), 2.13 (s, 3H). MS (ES⁺) m/e 451 (M+H)⁺.

실시예 21 (M38)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-에톡시나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.06 - 7.92 (m, 4H), 7.57 - 7.42 (m, 4H), 6.67 (br s, 2H), 4.73 (br t, J = 4.8 Hz, 1H), 4.42 (br s, 2H), 4.23 (q, J = 6.8 Hz, 2H), 3.62 - 3.51 (m, 2H), 2.73 (br s, 2H), 2.23 (s, 3H), 2.13 (s, 3H), 1.32 (br t, J = 6.8 Hz, 3H).MS (ES⁺) m/e 481 (M+H)⁺.

실시예 22 (M39)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-브로모나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.27 - 8.23 (m, 2H), 8.02 - 7.98 (m, 2H), 7.86 - 7.78 (m, 4H), 6.72 (br d, J = 1.2 Hz, 2H), 4.71 (t, J = 5.6 Hz, 1H), 4.44 (br s, 2H), 3.53 (q, J = 6.4 Hz, 2H), 2.67 (br t, J = 6.8 Hz, 2H), 2.19 (s, 3H), 2.08 (s, 3H). MS (ES⁺) m/e 515 (M+H)⁺.

실시예 23 (M40)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 페난트렌-9-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.92 (d, J = 8.0 Hz, 1H), 8.88 (d, J = 8.4 Hz, 1H), 8.26-8.19 (m, 3H), 8.03 (s, 1H), 7.90 (s, 1H), 7.80-7.75 (m, 1H), 7.80-7.77 (m, 2H), 7.74-7.72 (m, 1H), 6.80 (s, 2H), 4.74 (t, J = 4.8 Hz, 1H), 4.47 (s, 2H), 4.11 (d, J = 3.6 Hz, 2H), 3.58 (q, J = 6.0 Hz, 2H), 3.17 (d, J = 2.4 Hz, 2H), 2.72 (t, J = 6.4 Hz, 2H), 2.21 (s, 3H), 2.09 (s, 3H). MS (ES⁺) m/e 487 (M+H)⁺.

실시예 24 (M43)

¹H NMR (400 MHz, DMSO-d6) δ 7.88 - 7.83 (m, 2H), 7.32 - 7.20 (m, 3H), 6.73 (br d, J = 1.2 Hz, 2H), 4.66 (t, J = 5.6 Hz, 1H), 4.40 (br s, 2H), 3.47 (q, J = 6.4 Hz, 2H), 2.75 (br s, 2H), 2.67 (br s, 2H), 2.58 (br t, J = 6.8 Hz, 2H), 2.21 (s, 3H), 2.13 (s, 3H), 1.70 (m, 4H). MS (ES⁺) m/e 441 (M+H)⁺.

실시예 25 (M44)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-플루오로나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.33 (br d, J = 8.0 Hz, 1H), 8.16 (br d, J = 7.6 Hz, 1H), 8.08 - 7.94 (m, 2H), 7.87 (s, 1H), 7.82 - 7.70 (m, 2H), 7.45 (dd, J = 8.0, 10.1 Hz, 1H), 6.71 (br s, 2H), 4.69 (br t, J = 5.2 Hz, 1H), 4.43 (br s, 2H), 3.66 - 3.47 (m, 2H), 2.66 (br t, J = 6.8 Hz, 2H), 2.25 - 2.15 (m, 3H), 2.13 - 1.96 (m, 3H). MS (ES⁺) m/e 455 (M+H)⁺.

실시예 26 (M45)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 8-플루오로나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.20 (br d, J = 8.4 Hz, 1H), 7.98 (s, 1H), 7.91 - 7.83 (m, 2H), 7.73 - 7.58 (m, 2H), 7.56 - 7.29 (m, 2H), 6.81 (br s, 2H), 4.73 (br s, 1H), 4.46 (br s, 2H), 3.55 (br s, 2H), 2.69 (br t, J = 6.4 Hz, 2H), 2.20 (s, 3H), 2.18 (s, 3H). MS (ES⁺) m/e 455 (M+H)⁺.

실시예 27 (M46)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 8-메틸나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.14 (dd, J ₁ = 1.6, J ₂ = 8.0 Hz, 1H), 7.98 (s, 1H), 7.91 - 7.86 (m, 2H), 7.59 - 7.47 (m, 4H), 6.83 (br s, 2H), 4.75 (br t, J = 5.2 Hz, 1H), 4.46 (br s, 2H), 3.54 (q, J = 6.4 Hz, 2H), 2.70 - 2.64 (m, 2H), 2.48 (s, 3H), 2.19 (d, J = 5.6 Hz, 6H). MS (ES⁺) m/e 451 (M+H)⁺.

실시예 28 (M47)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-메톡시나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.42 (d, J = 8.0 Hz, 1H), 8.26 (d, J = 0.4 Hz, 1H), 8.05 (d, J = 8.4 Hz, 1H), 7.96 (s, 1H), 7.87 (s, 1H), 7.68 - 7.65 (m, 1H), 7.65 - 7.61 (m, 1H), 7.08 (d, J = 8.4 Hz, 1H), 6.71 (br s, 2H), 4.69 (br t, J = 5.6 Hz, 1H), 4.43 (br s, 2H), 4.08 (s, 3H), 3.55 - 3.50 (m, 2H), 2.66 - 2.63 (m, 2H), 2.18 (s, 3H), 2.14 (s, 3H). MS (ES⁺) m/e 467 (M+H)⁺.

실시예 29 (M49)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 나프탈렌-2-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.41 (s, 1H), 8.18 (br d, J = 8.0 Hz, 1H), 8.06 - 8.02 (m, 2H), 7.95 (s, 1H), 7.85 (s, 1H), 7.76 - 7.64 (m, 3H), 6.64 (br s, 2H), 4.67 (br t, J = 5.6 Hz, 1H), 4.41 (br s, 2H), 3.52 (q, J = 6.4 Hz, 2H), 2.62 (br t, J = 6.8 Hz, 2H), 2.18 (s, 3H), 2.14 (s, 3H). MS (ES⁺) m/e 437 (M+H)⁺.

실시예 30 (M50)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 5,5,8,8 -테트라메틸-5,6,7,8-테트라히드로나프탈렌-2-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.84 (d, J = 14.4 Hz, 2H), 7.64 (s, 1H), 7.51-7.46 (m, 2H), 6.63 (s, 2H), 4.63 (t, J = 4.2 Hz, 1H), 4.38 (s, 2H), 3.45 (d, J = 5.6 Hz, 2H), 2.56 (t, J = 6.4 Hz, 2H), 2.20 (s, 2H), 2.13 (s, 2H), 1.65 (s, 3H), 1.25 (s, 12H). MS (ES⁺) m/e 497 (M+H)⁺.

실시예 31 (M51)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 1-브로모나프탈렌-2-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.28 (d, J = 8.8 Hz, 2H), 8.12-8.09 (m, 2H), 7.98 (s, 1H), 7.88 (s, 1H), 7.80-7.76 (m, 1H), 7.74-7.72 (m, 1H), 7.46 (d, J = 8.4 Hz, 2H), 6.75 (s, 2H), 4.72 (t, J = 5.6 Hz, 1H), 4.45 (s, 2H), 3.55 (q, J = 6.8 Hz, 2H), 2.68 (t, J = 6.4 Hz, 2H), 2.20 (s, 3H), 2.17 (s, 3H). MS (ES⁺) m/e 516 (M+H)⁺.

실시예 32 (M52)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 6-메톡시나프탈렌-2-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.33 (d, J = 1.2 Hz, 1H), 8.08 (d, J = 8.8 Hz, 1H), 7.94 - 7.83 (m, 3H), 7.70 (dd, J ₁ = 1.6, J ₂ = 8.4 Hz, 1H), 7.43 (d, J = 2.0 Hz, 1H), 7.28 (dd, J ₁ = 2.4, J ₂ = 8.8 Hz, 1H), 6.76 - 6.55 (m, 2H), 4.65 (t, J = 5.6 Hz, 1H), 4.40 (br s, 2H), 3.92 (s, 3H), 3.53 - 3.46 (m, 2H), 2.60 (br t, J = 6.8 Hz, 2H), 2.16 (s, 3H), 2.14 (s, 3H). MS (ES⁺) m/e 467 (M+H)⁺.

실시예 33 (M53)

S-((Z)-2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)(3r,5r,7r) -아다만탄-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.79 (s, 1H), 7.74 (s, 1H), 6.75 (br s, 2H), 4.60 (t, J = 5.6 Hz, 1H), 4.35 (br s, 2H), 3.44 - 3.38 (m, 2H), 2.41 (t, J = 6.8 Hz, 2H), 2.28 (s, 3H), 2.08 (s, 3H), 1.98 (br s, 3H), 1.84 - 1.75 (m, 1H), 1.71 - 1.62 (m, 11H). MS (ES⁺) m/e 445 (M+H)⁺.

실시예 34 (M54)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-페닐프로판티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.77 (s, 1H), 7.73 (s, 1H), 7.34 - 7.24 (m, 5H), 6.64 (s, 2H), 4.55 (t, J = 5.6 Hz, 1H), 4.40-4.24 (m, 2H), 3.82 (m, 1H), 3.29 - 3.28 (m, 2H), 2.48 - 2.39 (m, 1H), 2.32 - 2.28 (m, 1H), 2.28 (s, 3H), 1.34-1.30 (d, J = 7.6 Hz, 3H). MS (ES⁺) m/e 415 (M+H)⁺.

실시예 35 (M55)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2,2-디메틸-3-페닐프로판에티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.78 (s, 1H), 7.68 (s, 1H), 7.27 - 7.20 (m, 3H), 7.09 (m, 2H), 6.71 (s, 1H), 4.61 (t, J = 5.6 Hz, 1H), 4.34 (s, 1H), 3.42 -3.36 (m, 2H), 2.73 (s, 2H), 2.43 (t, J = 6.8 Hz, 2H), 2.25 (s, 2H), 2.07 (s, 3H), 1.02 (s, 6H). MS (ES⁺) m/e 443 (M+H)⁺.

실시예 36 (M57)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 1-메틸클로로헥산-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.79 (s, 1H), 7.75 (s, 1H), 6.70 (s, 2H), 4.61 (t, J = 5.6 Hz, 1H), 4.34 (s, 2H), 3.45 - 3.35 (m, 2H), 2.43 (br t, J = 6.8 Hz, 2H), 2.27 (s, 3H), 2.08 (s, 3H), 1.78 (dd, J = 6.8, 9.8 Hz, 2H), 1.49 - 1.24 (m, 8H), 1.05 (s, 3H). MS (ES⁺) m/e 407 (M+H)⁺.

실시예 37 (M58)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2,2-디페닐프로판티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.77 (d, J = 3.2 Hz, 2H), 7.35 - 7.25 (m, 6H), 7.16 - 7.08 (m, 4H), 6.73 (br s, 2H), 4.58 (t, J = 5.6 Hz, 1H), 4.31 (br s, 2H), 3.32 - 3.28 (m, 2H), 2.41 (br t, J = 6.8 Hz, 2H), 2.26 (s, 3H), 2.05 (s, 3H), 1.84 (s, 3H). MS (ES⁺) m/e 491 (M+H)⁺.

실시예 38 (M59)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 3-메틸-2-페닐부탄티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.77 (s, 1H), 7.73 (s, 1H), 7.35 - 7.30 (m, 2H), 7.29 - 7.21 (m, 3H), 6.64 (s, 2H), 4.55 (t, J = 5.6 Hz, 1H), 4.25 (s, 2H), 3.45 - 3.41 (m, 1H), 3.29 - 3.17 (m, 2H), 2.48 - 2.39 (m, 1H), 2.27-2.20 (m, 5H), 1.99 (s, 3H), 0.92 (d, J = 6.4 Hz, 3H), 0.61 (d, J = 6.8 Hz, 3H). MS (ES⁺) m/e 443 (M+H)⁺.

실시예 39 (M62)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-메틸-2,3 -디히드로-1H-인덴-2-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.79 (s, 2H), 7.21 - 7.13 (m, 4H), 6.72 (s, 2H), 4.62-4.59 (t, J = 5.6 Hz, 1H), 4.35 (s, 1H), 3.43 - 3.38 (m, 2H), 3.20 (d, J = 16.0 Hz, 2H), 2.73 (d, J = 16.0 Hz, 2H), 2.44 (t, J = 6.8 Hz, 2H), 2.22 (s, 3H), 2.09 (s, 3H), 1.21 (s, 3H). MS (ES⁺) m/e 441 (M+H)⁺.

실시예 40 (M63)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-메틸-2-(나프탈렌-2-일)프로판티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.90-7.89 (m, 1H), 7.88-7.85 (m, 3H), 7.77 (s, 1H), 7.73 (s, 1H), 7.53-7.51 (m, 2H), 7.35-7.33 (m, 1H), 6.71 (s, 2H), 4.50 (t, J = 5.6 Hz, 1H), 4.31 (s, 2H), 3.26 (q, J = 5.6 Hz, 2H), 2.38 (t, J = 6.8 Hz, 2H), 2.22 (s, 3H), 2.04 (s, 3H), 1.53 (s, 6H). MS (ES⁺) m/e 479 (M+H)⁺.

실시예 41 (M64)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2,2-디페닐에탄티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.77 (d, J = 3.2 Hz, 2H), 7.39 - 7.23 (m, 12H), 6.78 - 6.57 (m, 2H), 5.29 (s, 1H), 4.63 - 4.51 (m, 1H), 4.31 (br s, 2H), 2.21 (s, 3H), 2.02 (s, 3H). MS (ES⁺) m/e 477 (M+H)⁺.

실시예 42 (M65)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 1-(3-브로모페닐)클로로판-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.74 (s, 1H), 7.71 (s, 1H), 7.55-7.52(m, 2H), 7.39-7.37 (m, 2H), 6.71 (s, 2H), 4.55-4.52 (m, 1H), 4.31 (s, 2H), 3.37-3.35 (m, 1H), 2.41-2.34 (m, 2H), 2.37 (s, 3H), 2.04 (s, 3H), 1.40-1.37 (m, 2H), 1.22-1.19 (s, 2H). MS (ES⁺) m/e 506 (M+H)⁺.

실시예 43 (M66)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 3,5-디클로로-[1,1'-비페닐]-4-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.98 (s, 1H), 7.89 (s, 3H), 7.78 (dd, J ₁ = 1.6, J ₂ = 8.0 Hz, 2H), 7.58 - 7.45 (m, 3H), 6.92 (m, 2H), 4.74 (t, J = 5.6 Hz, 1H), 4.43 (br s, 2H), 3.55 - 3.48 (m, 2H), 2.67 (br d, J = 1.6 Hz, 2H), 2.22 (s, 3H), 2.15 (s, 3H). MS (ES⁺) m/e 532 (M+H)⁺.

실시예 44 (M67)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-(tert-부틸)-2,6-디메틸벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.95 (s, 1H), 7.83 (s, 1H), 7.13-7.08(m, 2H), 6.75 (s, 2H),4.75-4.72 (m, 1H), 4.40 (s, 2H), 3.49-3.44 (m, 2H), 2.68 (m, 1H), 2.26 (s, 3H), 2.20 (s, 6H), 2.15 (s, 3H), 1.24 (s, 9H). MS (ES⁺) m/e 471 (M+H)⁺.

실시예 45 (M68)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 3-클로로-[1,1'-비페닐]-4-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.92 (s, 1H), 7.90 - 7.84 (m, 2H), 7.80 - 7.73 (m, 3H), 7.65 (d, J = 8.0 Hz, 1H), 7.57 - 7.45 (m, 3H), 6.96 - 6.56 (m, 2H), 4.70 (t, J = 5.6 Hz, 1H), 4.43 (br s, 2H), 3.53 - 3.46 (m, 2H), 2.61 (br t, J = 6.8 Hz, 2H), 2.21 (s, 3H), 2.16 (s, 3H). MS (ES⁺) m/e 498 (M+H)⁺.

실시예 46 (M70)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 3,5-디-tert-부틸벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.88 (s, 1H), 7.83 (s, 1H), 7.74 (t, J = 2.0 Hz, 1H), 7.55 (d, J = 2.0 Hz, 1H), 6.60 (s, 2H), 4.65 (t, J = 5.6 Hz, 1H), 4.39 (s, 2H), 3.57 - 3.42 (m, 2H), 2.57 (t, J = 6.8 Hz, 2H), 2.20 (s, 3H), 2.15 (s, 3H), 1.32 (s, 18H). MS (ES⁺) m/e 499 (M+H)⁺.

실시예 47 (M72)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) [1,1'-비페닐]-3-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.98 (m, 1H), 7.93 (s, 1H), 7.91-7.90 (m, 1H), 7.84 (s, 1H), 7.73-7.71 (m, 3H), 7.63 (m, 1H), 7.55-7.51 (m, 2H), 7.44 (m, 1H), 6.64 (s, 2H), 4.64-4.65 (m, 2H), 4.40 (s, 2H), 3.52-3.48 (m, 2H), 2.61-2.51 (m, 2H), 2.21 (s, 3H), 2.13 (s, 3H). MS (ES⁺) m/e 463 (M+H)⁺.

실시예 48 (M73)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-페녹시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.87 (s, 1H), 7.82 (s, 1H), 7.77 (s, 1H), 7.75 (s, 1H), 7.50-7.46 (m, 2H), 7.27 (m, 1H), 7.15 (d, J = 8 Hz, 2H), 7.04 (d, J = 8 Hz, 2H), 6.64 (s, 2H), 4.64-4.61 (m, 2H), 4.38 (s, 2H), 3.48-3.43 (m, 2H), 2.58-2.52 (m, 2H), 2.18 (s, 3H), 2.13 (s, 3H). MS (ES⁺) m/e 463 (M+H)⁺.

실시예 49 (M76)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 디벤조[b,d]푸란-2-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.57 (s, 1H), 8.35-8.34 (d, J = 4Hz, 1H), 7.96 -7.90 (m, 5H), 7.79-7.77 (m, 1H), 7.61-7.48 (m, 1H), 6.65 (m, 2H), 4.70 (m, 1H), 4.41 (s, 1H), 3.54 (m, 2H), 2.63 (m, 2H), 2.17 (s, 3H), 2.16 (s, 6H). MS (ES⁺) m/e 477 (M+H)⁺.

실시예 50 (M79)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 벤조[b]티오펜-5-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.31 (s,1 H), 8.15 (d, J = 8.4 Hz, 1H), 7.94-7.93 (m, 2H), 7.84 (s, 1H), 7.67-7.65 (m, 2H), 6.63 (s, 2H), 4.67-4.64 (m, 2H), 4.40 (s, 2H), 3.51-3.47 (m, 2H), 2.67-2.58 (m, 2H), 2.16 (s, 3H), 2.14 (s, 3H). MS (ES⁺) m/e 443 (M+H)⁺.

실시예 51 (M82)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-(2-메톡시에톡시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.88 (s, 1H), 7.83 (s, 1H), 7.73-7.69 (m, 2H), 7.08-7.04 (m, 2H), 6.64 (s, 2H), 4.66-4.63 (m, 2H), 4.38 (s, 2H), 4.21-4.18 (m, 2H), 3.69-3.68 (m, 2H), 3.47 (m, 2H), 3.34 (s, 3H), 2.56 (m, 2H), 2.25 (s, 3H), 2.20 (s, 3H). MS (ES⁺) m/e 461 (M+H)⁺.

실시예 52 (M88)

S-((Z)-2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)(E)-3-(나프탈렌-2-일)프로프-2-엔티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.26 (s, 1H), 8.00-7.94 (m, 4H), 7.90 (s, 1H), 7.84 (s, 1H), 7.59-7.56 (m, 3H), 6.95 (d, J = 15.6 Hz, 1H), 6.68 (s, 2H), 4.69 (s, 1H), 4.39 (s, 2H), 3.48 (t, J = 7.2 Hz, 2H), 2.57 (t, J = 6.4 Hz, 2H), 2.22 (s, 3H), 2.12 (s, 3H). MS (ES⁺) m/e 463 (M+H)⁺.

실시예 53 (M108)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 6-메톡시나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.13 (d, J = 9.6 Hz, 1H), 8.09 (d, J = 8.4 Hz, 1H), 7.97 (s, 1H), 7.87 (s, 1H), 7.74 (d, J = 6.8 Hz, 1H), 7.55 (t, J = 6.8 Hz, 1H), 7.45 (d, J = 2.4 Hz, 1H), 7.29 (dd, J ₁ = 2.8 Hz, J ₂ = 9.2 Hz, 1H), 6.73 (s, 2H), 4.71 (s, 1H), 4.43 (s, 2H), 3.89 (s, 3H), 3.52 (s, 2H), 2.66 (t, J = 6.8 Hz, 2H), 2.18 (s, 3H), 2.13 (s, 3H). MS (ES⁺) m/e 467 (M+H)⁺.

실시예 54 (M109)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-에톡시나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.42 (d, J = 8.4 Hz, 1H), 8.26 (d, J = 8.0 Hz, 1H), 8.03 (d, J = 8.4 Hz, 1H), 7.96 (s, 1H), 7.87 (s, 1H), 7.67 (t, J = 1.2 Hz, 1H), 7.65-7.60 (m, 1H), 7.05 (d, J = 8.4 Hz, 1H), 6.70 (s, 2H), 4.68 (t, J = 9.2 Hz, 1H), 4.42 (s, 1H), 4.32 (q, J = 7.2 Hz, 2H), 3.51 (q, J = 6.4 Hz, 2H), 2.64 (t, J = 6.8 Hz, 2H), 2.17 (s, 3H), 2.13 (s, 3H), 1.50 (t, J = 6.8 Hz, 3H). MS (ES⁺) m/e 481 (M+H)⁺.

실시예 55 (M110)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-에틸나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.28-8.26 (m, 1H), 8.19-8.18 (m,1H), 7.97 (s, 1H), 7.87-7.85 (m, 1H), 7.67-7.64 (m, 1H), 7.48 (d, J = 7.6 Hz, 1H), 6.74 (s, 2H), 4.70 (t, J = 5.6 Hz, 1H), 4.43 (s, 1H), 3.52 (q, J = 6.0 Hz, 2H), 3.14 (q, J = 7.2 Hz, 2H), 2.66 (t, J = 6.8 Hz, 2H), 2.18 (s, 3H), 2.14 (s, 3H), 1.31 (t, J = 7.6 Hz, 3H). MS (ES⁺) m/e 465 (M+H)⁺.

실시예 56 (M111)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 5-브로모나프탈렌-1-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.44 (d, J = 8.8 Hz, 1H), 8.20 (d, J = 8.8 Hz, 1H), 8.06 - 7.95 (m, 3H), 7.88 (s, 1H), 7.79 (dd, J ₁ = 7.2, J ₂ = 8.4 Hz, 1H), 7.58 (dd, J ₁ = 7.6, J ₂ = 8.4 Hz, 1H), 6.74 (br s, 2H), 4.70 (t, J = 5.6 Hz, 1H), 4.45 (br s, 2H), 3.56 - 3.49 (m, 2H), 2.68 (br t, J = 6.8 Hz, 2H), 2.21 - 2.16 (m, 3H), 2.11 (s, 3H). MS (ES⁺) m/e 516 (M+H)⁺.

실시예 57 (M114)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-(tert-부틸)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.90 - 7.82 (m, 2H), 7.68 (d, J = 8.4 Hz, 2H), 7.59 - 7.52 (m, 2H), 6.84 - 6.54 (m, 2H), 4.67 (br s, 1H), 4.38 (br s, 2H), 4.03 (q, J = 7.2 Hz, 1H), 3.45 (br s, 2H), 2.56 (br t, J = 6.8 Hz, 2H), 2.27 - 2.07 (m, 6H), 1.30 (s, 9H). MS (ES⁺) m/e 443 (M+H)⁺.

실시예 58 (M115)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-(tert-부틸)-2-에톡시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.83-7.82 (m, 2H), 7.52 (d, J = 8.0 Hz, 1H), 7.06-7.03 (m, 2H), 6.68 (s, 2H), 4.62 (t, J = 5.6 Hz, 1H), 4.36 (s, 1H), 4.17 (q, J = 7.2 Hz, 2H), 3.44 (q, J = 5.6 Hz, 2H), 2.54-2.52 (m, 2H), 2.20 (s, 3H), 2.10 (s, 3H), 1.32 (t, J = 6.8 Hz, 3H), 1.28 (s, 9H). MS (ES⁺) m/e 487 (M+H)⁺.

실시예 59 (M148)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 디벤조[b,d]푸란-4-카보티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.47 (d, J = 6.80 Hz, 1H), 8.22 (d, J = 7.60 Hz, 1H), 7.95 (s, 1H), 7.90 - 7.86 (m, 3H), 7.62 (t, J = 8.00 Hz, 1H), 7.58 - 7.47 (m, 2H), 6.64 (s, 2H), 4.67 (t, J = 5.60 Hz, 1H), 4.42 (s, 2H), 3.54 - 3.48 (m, 2H), 2.65 (t, J = 6.80 Hz, 2H), 2.18 (s, 3H), 2.13 (s, 3H). MS (ES⁺) m/e 477 (M+H)⁺.

실시예 60 내지 68: 적절한 출발 물질을 사용하여 M19(실시예 6)의 제조 절차에 따라 하기 화합물을 합성하였다.

실시예 60 (M97)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 1-나프토에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.75 (d, 1H), 8.29 - 8.22 (m, 1H), 8.14 - 8.12 (m, 1H), 8.12 - 8.05 (m, 1H), 7.94 (s, 1H), 7.81 (s, 1H), 7.69 - 7.63 (m, 3H), 6.74 - 6.71 (m, 2H), 5.37 (s, 2H), 4.73 (t, J = 5.6 Hz, 1H), 4.34 (br s, 2H), 3.57 - 3.52 (m, 2H), 2.73 - 2.69 (m, 2H), 2.25 (s, 3H), 1.95 (s, 3H). MS (ES⁺) m/e 467 (M+H)⁺.

실시예 61 (M98)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸페난트렌-9-카르복실레이트

¹H NMR (400 MHz, DMSO-d6) δ 8.97 - 8.87 (m, 2H), 8.77 - 8.70 (m, 1H), 8.52 (s, 1H), 8.19 (d, J = 8.0 Hz, 1H), 7.98 (s, 1H), 7.90 - 7.81 (m, 2H), 7.80 - 7.73 (m, 3H), 6.74 (br s, 2H), 5.41 (s, 2H), 4.78 (t, J = 5.6 Hz, 1H), 4.35 (br s, 2H), 3.63 - 3.50 (m, 2H), 2.74 (br t, J = 7.2 Hz, 2H), 2.24 (s, 3H), 1.98 (s, 3H). MS (ES⁺) m/e 517 (M+H)⁺.

실시예 62 (M99)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 5,5,8 ,8-테트라메틸-5,6,7,8-테트라히드로나프탈렌-2-카르복실레이트

¹H NMR (400 MHz, DMSO-d6) δ 7.93 (s, 1H), 7.89 - 7.85 (m, 1H), 7.77 (s, 1H), 7.66 (dd, J ₁= 2.0, 1H), 7.51 - 7.46 (m, 1H), 6.73 (m, 2H), 5.24 (s, 2H), 4.69 (t, J = 5.6 Hz, 1H), 4.44 - 4.18 (m, 2H), 3.57 - 3.44 (m, 2H), 2.67 (br t, J = 6.8 Hz, 2H), 2.29 - 2.24 (m, 3H), 1.94 (s, 3H), 1.66 (s, 4H), 1.25 (s, 12H). MS (ES⁺) m/e 527 (M+H)⁺.

실시예 63 (M100)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 2-에톡시-1-나프토에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.07 (d, J = 8.8 Hz, 1H), 7.95 - 7.90 (m, 2H), 7.80 (s, 1H), 7.62 - 7.49 (m, 3H), 7.43 (m, 1H), 6.73 (br s, 2H), 5.33 (s, 2H), 4.65 (t, J = 5.6 Hz, 1H), 4.35 (br s, 2H), 4.27 - 4.21 (m, 2H), 3.55 - 3.44 (m, 2H), 2.61 (br t, J = 6.8 Hz, 2H), 2.28 (s, 3H), 1.95 (s, 3H), 1.31 (t, J = 7.2 Hz, 3H). MS (ES⁺) m/e 511 (M+H)⁺.

실시예 64 (M101)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 2,2-디메틸 -3-(나프탈렌-2-일)프로파노에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.90 (s, 1H), 7.88 - 7.78 (m, 4H), 7.64 - 7.58 (m, 1H), 7.51 - 7.44 (m, 2H), 7.28 - 7.19 (m, 1H), 6.78 (m, 2H), 4.95 (br s, 2H), 4.66 (t, J = 5.6 Hz, 1H), 4.33 (br s, 2H), 3.50 - 3.41 (m, 2H), 3.01 - 2.92 (m, 2H), 2.48 (br s, 2H), 2.28 (m, 3H), 1.91 (s, 3H), 1.16 - 1.12 (m, 6H). MS (ES⁺) m/e 523 (M+H)⁺.

실시예 65 (M103)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 2,2-디페닐프로파노에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.78 (s, 1H), 7.64 (s, 1H), 7.28 - 7.34 (m, 6H), 7.12 - 7.36 (m, 4H), 6.72 - 6.70 (m, 2H), 5.04 (br s, 2H), 4.60 (t, J = 5.6 Hz, 1H), 4.27 (br s, 2H), 3.28 - 3.32 (m, 2H), 2.38 - 2.35 (m, 2H), 2.27 (s, 3H), 1.88 - 1.85 (m, 6H). MS (ES⁺) m/e 521 (M+H)⁺.

실시예 66 (M105)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 2,2,2-트리페닐아세테이트

¹H NMR (400 MHz, DMSO-d6) δ 7.89 (s, 1H), 7.80 (s, 1H), 7.34 - 7.28 (m, 11H), 7.11 - 7.09 (m, 7H), 6.77 - 6.72 (m, 2H), 5.39 (br s, 2H), 4.56 (t, J = 5.6 Hz, 1H), 4.33 (br s, 2H), 3.20 - 3.19 (m, 2H), 2.28 (s, 3H), 2.08 - 1.99 (m, 2H), 1.89 (s, 3H). MS (ES⁺) m/e 583 (M+H)⁺.

실시예 67 (M107)

(Z)-((2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일)티오)메틸 2-메틸-2-(나프탈렌-2-일)프로파노에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.92 - 7.82 (m, 4H), 7.76 (s, 1H), 7.70 - 7.64 (m, 1H), 7.53 - 7.46 (m, 2H), 7.44 - 7.37 (m, 1H), 6.69 (br d, J = 12.4 Hz, 2H), 4.96 (s, 2H), 4.59 (t, J = 5.6 Hz, 1H), 4.35 - 4.12 (m, 2H), 3.32 - 3.25 (m, 2H), 2.34 (br t, J = 6.8 Hz, 2H), 2.29 - 2.20 (m, 3H), 1.77 (s, 3H), 1.64 - 1.57 (m, 6H). MS (ES⁺) m/e 509 (M+H)⁺.

실시예 68 (M126)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-플루오로-6-페녹시벤조티오에이트

단계 1. 2-플루오로-6-페녹시벤조산.

DMF(100mL) 중 2-브로모-6-플루오로벤조산(5.00g, 22.8mmol, 1.00당량) 및 페놀(3.87g, 41.1mmol, 3.61mL, 1.80당량)의 용액에 CuI(434mg, 2.28mmol, 0.10당량) 및 Cs₂CO₃ (22.3 g, 68.5 mmol, 3.00당량)이 첨가되었다. 이 혼합물은 N₂하에 100℃에서 10시간 동안 교반되고, 실온으로 냉각되어, 물(300mL)로 희석되고, 에틸 아세테이트(200mL × 2)로 세척되었다. 수성 상은 HCl(2M)로 pH ~1로 조정되었으며, 에틸 아세테이트(300 mL × 2)로 추출되었다. 조합된 유기상은 염수(100mL × 2)로 세척되고, Na₂SO₄상에서 건조되고, 여과되고, 진공 하에 농축되어 미가공 생성물을 수득하고 이를 역상 HPLC(물 중 5% ~ 55% 아세토니트릴, 0.1% HCl)에 의해 정제하고 진공 하에 농축하여 아세토니트릴을 제거하였다. 잔류물을 에틸 아세테이트(300 mL × 2)로 추출하였다. 조합된 유기상은 염수(100mL × 2)로 세척되고, Na₂SO₄상에서 건조되고, 여과되고, 진공 하에 농축되어 표제 화합물(1.10g, 4.74mmol, 21% 수율)을 황색 고체로서 수득하였다. ¹H NMR (400 MHz, DMSO-d6) δ 7.47 - 7.36 (m, 3H), 7.20 - 7.16 (m, 1H), 7.13 - 7.06 (m, 1H), 7.03 (dd, J ₁= 0.80 Hz, J ₂= 8.80 Hz, 2H), 6.74 (d, J = 8.40 Hz, 1H). MS (ES⁺) m/e 233 (M+H)⁺.

단계 2. 2-플루오로-6-페녹시벤조일 클로라이드

DCM(10.0 mL) 및 DMF(1.57 mg, 21.5 umol, 1.66 uL, 0.01 eq) 중 2-플루오로-6-페녹시벤조산(500 mg, 2.15 mmol, 1.00 eq)의 용액에 (COCl)₂ (328 mg, 2.58 mmol, 226 uL, 1.20 당량)이 25℃에서 적가되었다. 반응 혼합물은 25℃에서 0.5 시간 동안 교반되었다. 반응물은 무수 MeOH로 ?칭되고 감압 하에 농축되어 추가 정제 없이 다음 단계에 직접 사용되는 황색 오일로서 표제 화합물(540 mg, 미가공)을 수득하였다.

단계 3. (Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-플루오로-6-페녹시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.93 (s, 1H), 7.83 (s, 1H), 7.58 - 7.48 (m, 1H), 7.46 - 7. 39 (m, 1H), 7.24 - 7.17 (m, 1H), 7.13 - 7.02 (m, 1H), 6.78 (d, J = 8.40 Hz, 1H), 6.42 (s, 2H), 4.47 - 4.25 (m, 1H), 3.47 (br d, J = 5.20 Hz, 1H), 2.58 (br t, J = 6.80 Hz, 1H), 2.29 (s, 3H), 2.05 (s, 1H). MS (ES⁺) m/e 497 (M+H)⁺.

실시예 69 내지 99: M126 및 적절한 출발 물질의 제조에 대해 본질적으로 동일한 절차를 사용하여 하기 화합물이 합성되었다.

실시예 69 (M113)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-페녹시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.83 (s, 1H), 7.79 (s, 1H), 7.66 - 7.56 (m, 2H), 7.43 - 7.36 (m, 2H), 7.27 (dt, J ₁ = 0.8, J ₂ = 7.6 Hz, 1H), 7.19 - 7.12 (m, 1H), 7.01 - 6.95 (m, 3H), 6.78 - 6.59 (m, 2H), 4.57 (t, J = 5.6 Hz, 1H), 4.34 (br s, 2H), 3.36 (br d, J = 6.0 Hz, 2H), 2.43 (t, J = 6.4 Hz, 2H), 2.16 (s, 3H), 2.08 (s, 3H). MS (ES⁺) m/e 479 (M+H)⁺.

실시예 70 (M127)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-클로로-6-페녹시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.91 (s, 1H), 7.81 (s, 1H), 7.53 - 7.45 (m, 1H), 7.44 - 7.37 (m, 2H), 7.33 (br d, J = 8.00 Hz, 1H), 7.19 (br t, J = 8.00 Hz, 1H), 7.08 - 6.97 (m, 2H), 6.90 (br d, J = 8.40 Hz, 1H), 6.83 - 6.58 (m, 2H), 4.62 (br t, J = 5.20 Hz, 1H), 4.35 (br s, 2H), 3.41 - 3.37 (m, 2H), 2.59 - 2.54 (m, 2H), 2.27 (s, 3H), 2.07 (s, 3H). MS (ES⁺) m/e 514 (M+H)⁺.

실시예 71 (M128)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-메틸-6-페녹시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.91 (s, 1H), 7.79 (s, 1H), 7.40 - 7.31 (m, 3H), 7.16 - 7.05 (m, 2H), 6.98 - 6.92 (m, 2H), 6.80 - 6.60 (m, 3H), 4.57 (t, J = 5.20 Hz, 1H), 4.34 (br s, 2H), 3.37 - 3.33 (m, 2H), 2.53 - 2.51 (m, 2H), 2.26 (s, 3H), 2.24 (s, 3H), 2.06 (s, 3H). MS (ES⁺) m/e 493 (M+H)⁺.

실시예 72 (M129)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(벤질옥시)-6-플루오로벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.91 (s, 1H), 7.80 (s, 1H), 7.50 - 7.25 (m, 7H), 7.04 (d, J = 8.40 Hz, 1H), 6.89 (t, J = 8.80 Hz, 1H), 6.77 - 6.52 (m, 2H), 5.21 (s, 2H), 4.63 (t, J = 5.60 Hz, 1H), 4.33 (s, 2H), 3.43 - 3.38 (m, 2H), 2.59 - 2.55 (m, 2H), 2.26 (s, 3H), 2.05 (s, 3H). MS (ES⁺) m/e 511 (M+H)⁺.

실시예 73 (M130)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(3-클로로페녹시)-6-플루오로벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.86 (s, 1H), 7.80 (s, 1H), 7.63 - 7.55 (m, 1H), 7.46 - 7.40 (m, 1H), 7.28 - 7.18 (m, 2H), 7.13 (t, J = 2.00 Hz, 1H), 6.98 (dd, J ₁ = 2.00 Hz, J ₂ = 8.40 Hz, 1H), 6.92 (d, J = 8.40 Hz, 1H), 6.73 - 6.57 (m, 2H), 4.64 (t, J = 5.60 Hz, 1H), 4.34 (s, 2H), 3.40 (br s, 2H), 2.60 - 2.58 (m, 2H), 2.26 (s, 3H), 2.06 (s, 3H). MS (ES⁺) m/e 532 (M+H)⁺.

실시예 74 (M131)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 5-클로로-2-페녹시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.85 (s, 1H), 7.80 (s, 1H), 7.61 (dd, J = 12.0 Hz, 1H), 7.58 (d, J = 4.00 Hz, 1H), 7.45 - 7.39 (m, 2H), 7.22 - 7.16 (m, 1H), 7.04 (d, J = 7.60 Hz, 2H), 6.97 (d, J = 8.80 Hz, 1H), 6.76 - 6.73 (m, 2H), 4.61 - 4.56 (m, 1H), 4.35 (s, 2H), 3.43 - 3.38 (m, 2H), 2.49 - 2.45 (m, 2H), 2.17 (s, 3H), 2.10 (s, 3H). MS (ES⁺) m/e 514 (M+H)⁺.

실시예 75 (M133)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(2-클로로페녹시)-4-메틸벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.82 (s, 1H), 7.78 (s, 1H), 7.60 - 7.54 (m, 2H), 7.35 (dt, J ₁ = 1.60 Hz, J ₂ = 7.8 Hz, 1H), 7.21 (dt, J = 1.60 Hz, J ₂ = 8.00 Hz, 1H), 7.10 (d, J = 8.00 Hz, 1H), 6.99 (dd, J ₁ = 1.60 Hz, J ₂ = 8.00 Hz, 1H), 6.70 - 6.60 (m, 3H), 4.57 (t, J = 5.60 Hz, 1H), 4.33 (br s, 2H), 3.43 - 3.37 (m, 2H), 2.45 - 2.41 (m, 2H), 2.28 (s, 3H), 2.16 (s, 3H), 2.06 (s, 3H). MS (ES⁺) m/e 528 (M+H)⁺.

실시예 76 (M134)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 5-클로로-2-(4-플루오로페녹시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.84 (s, 1H), 7.79 (s, 1H), 7.65 - 7.63 (m, 2H), 7.29 - 7.24 (m, 2H), 7.13 - 7.11 (m, 2H), 6.66 (d, J = 7.20 Hz, 1H), 6.64(br s, 2H), 5.60 (t, J = 5.60 Hz, 1H), 4.35 (s, 2H), 3.42 - 3.39 (m, 2H), 2.56 - 2.55 (m, 2H), 2.15 (s, 3H), 2.11 (s, 3H). MS (ES⁺) m/e 532 (M+H)⁺.

실시예 77 (M135)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(3-시아노페녹시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.81 (s, 1H), 7.78 (s, 1H), 7.72 - 7.62 (m, 2H), 7.61 - 7.54 (m, 2H), 7.46 - 7.35 (m, 2H), 7.28 - 7.20 (m, 1H), 7.14 (d, J = 7.60 Hz, 1H), 6.69 (br s, 2H), 4.58 (t, J = 5.60 Hz, 1H), 4.34 (br s, 2H), 3.45-3.38 (m, 2H), 2.42 - 2.35 (m, 2H), 2.15 (s, 3H), 2.08 (s, 3H). MS (ES⁺) m/e 504 (M+H)⁺.

실시예 78 (M136)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(2-클로로페녹시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.85 (s, 1H), 7.80 (s, 1H), 7.64 (dd, J ₁ = 1.60 Hz, J ₂ = 7.60 Hz, 1H), 7.61 - 7.55 (m, 2H), 7.40 - 7.33 (m, 1H), 7.31 - 7.25 (m, 1H), 7.24 - 7.19 (m, 1H), 7.06 - 7.00 (m, 1H), 6.86 (d, J = 7.60 Hz, 1H), 6.67 (br s, 2H), 4.59 (t, J = 5.60 Hz, 1H), 4.35 (br s, 2H), 3.42 - 3.35 (m, 2H), 2.46 - 2.44 (m, 2H), 2.16 (s, 3H), 2.08 (s, 3H). MS (ES⁺) m/e 514 (M+H)⁺.

실시예 79 (M137)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(2-브로모페녹시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.85 (s, 1H), 7.80 (s, 1H), 7.73 (dd, J ₁ = 1.60 Hz, J ₂ = 8.00 Hz, 1H), 7.64 (dd, J ₁ = 1.60 Hz, J ₂ = 8.00 Hz, 1H), 7.60 - 7.54 (m, 1H), 7.44 - 7.37 (m, 1H), 7.28 (t, J = 7.60 Hz, 1H), 7.18 - 7.12 (m, 1H), 7.00 (dd, J ₁ = 1.60 Hz, , J ₂ = 8.00 Hz, 1H), 6.84 (d, J = 8.40 Hz, 1H), 6.75 - 6.60 (m, 2H), 4.59 (t, J = 6.00 Hz, 1H), 4.35 (br s, 2H), 3.40 (q, J = 6.80 Hz, 2H), 2.47 - 2.43 (m, 2H), 2.16 (s, 3H), 2.08 (s, 3H). MS (ES⁺) m/e 558 (M+H)⁺.

실시예 80 (M138)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(2,6-디클로로페녹시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.30 - 8.25 (m, 1H), 8.13 (dd, J ₁ = 3.20 Hz, J ₂ = 6.4 Hz, 1H), 7.98 (s, 1H), 7.88 - 7.80 (m, 2H), 7.69 - 7.64 (m, 2H), 7.47 (d, J = 7.60 Hz, 1H), 6.71 (br s, 2H), 4.69 (br t, J = 5.60 Hz, 1H), 4.43 (br s, 2H), 3.55 - 3.47 (m, 2H), 2.72 (s, 3H), 2.66 (br t, J = 6.80 Hz, 2H), 2.18 (s, 3H), 2.13 (s, 3H). MS (ES⁺) m/e 457 (M+H)⁺.

실시예 81 (M139)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(3-(tert-부틸)페녹시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.86 (s, 1H), 7.80 (s, 1H), 7.66 - 7.54 (m, 2H), 7.34 - 7.23 (m, 2H), 7.19 (br d, J = 8.00 Hz, 1H), 7.05 - 6.93 (m, 2H), 6.79 - 6.56 (m, 3H), 4.58 (t, J = 5.60 Hz, 1H), 4.34 (br s, 2H), 3.40 - 3.37 (m, 2H), 2.44 (br t, J = 6.80 Hz, 2H), 2.17 (s, 3H), 2.07 (s, 3H), 1.26 (s, 9H). MS (ES⁺) m/e 535 (M+H)⁺.

실시예 82 (M140)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(나프탈렌-2-일옥시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.97 (d, J = 8.80 Hz, 1H), 7.91 (d, J = 7.60 Hz, 1H), 7.86 - 7.81 (m, 2H), 7.77 (s, 1H), 7.72 - 7.65 (m, 1H), 7.65 - 7.58 (m, 1H), 7.54 - 7.41 (m, 2H), 7.37 - 7.29 (m, 2H), 7.26 (dd, J ₁ = 2.40 Hz, J ₂ = 8.80 Hz, 1H), 7.10 (d, J = 8.40 Hz, 1H), 6.70 (br s, 2H), 4.50 (t, J = 5.60 Hz, 1H), 4.32 (br s, 2H), 3.23 (q, J = 6.40 Hz, 2H), 2.35 (br t, J = 6.40 Hz, 2H), 2.14 (s, 3H), 2.05 (s, 3H). MS (ES⁺) m/e 529 (M+H)⁺.

실시예 83 (M141)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(퀴놀린-8-일옥시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.86 (s, 1H), 7.84 - 7.72 (m, 2H), 7.68 - 7.59 (m, 1H), 7.49 - 7.32 (m, 3H), 7.32 - 7.17 (m, 2H), 7.11 - 6.84 (m, 1H), 6.83 - 6.47 (m, 3H), 6.44 - 6.06 (m, 1H), 4.64 - 4.40 (m, 2H), 4.13 - 3.95 (m, 1H), 3.56 - 3.48 (m, 2H), 2.80 - 2.70 (m, 2H), 2.28 (s, 3H), 1.83 (br s, 3H). MS (ES⁺) m/e 530 (M+H)⁺.

실시예 84 (M142)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(2-클로로페녹시)-6-플루오로벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.89 (s, 1H), 7.80 (s, 1H), 7.58 (dd, J ₁ = 1.60 Hz, J ₂ = 8.00 Hz, 1H), 7.51 - 7.45 (m, 1H), 7.41 - 7.36 (m, 1H), 7.29 - 7.23 (m, 1H), 7.18 - 7.08 (m, 2H), 6.87 - 6.61 (m, 2H), 6.55 (d, J = 8.40 Hz, 1H), 4.61 (t, J = 5.60 Hz, 1H), 4.33 (s, 2H), 3.42 - 3.38 (m, 2H), 2.57 - 2.55 (m, 2H), 2.27 (s, 3H), 2.06 (d, J = 1.60 Hz, 3H). MS (ES⁺) m/e 532 (M+H)⁺.

실시예 85 (M143)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-에톡시-2-(3-플루오로페녹시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.79 (s, 1H), 7.77 (s, 1H), 7.69 (d, J = 8.80 Hz, 1H), 7.44 - 7.36 (m, 1H), 6.98 (dt, J ₁ = 2.40 Hz, J ₂ = 8.40 Hz, 1H), 6.91 - 6.85 (m, 1H), 6.76 (dd, J ₁ = 2.00 Hz, J ₂ = 8.00 Hz, 1H), 6.65 (br d, J = 2.00 Hz, 2H), 6.54 (d, J = 2.40 Hz, 1H), 4.55 (t, J = 5.60 Hz, 1H), 4.31 (br s, 2H), 4.06 (q, J = 7.20 Hz, 2H), 3.37 - 3.33 (m, 2H), 2.40 (br t, J = 6.80 Hz, 1H), 2.17 (s, 3H), 2.06 (s, 3H), 1.30 (t, J = 6.80 Hz, 3H). MS (ES⁺) m/e 541 (M+H)⁺.

실시예 86 (M145)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-(tert-부틸)-2-페녹시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.89 (s, 1H), 7.83 (s, 1H), 7.64 (br d, J = 8.40 Hz, 1H), 7.40 - 7.36 (m, 2H), 7.32 (br d, J = 7.20 Hz, 1H), 7.19 - 7.08 (m, 1H), 7.01 (s, 1H), 6.96 (d, J = 8.40 Hz, 2H), 6.30 (br s, 2H), 4.35 (s, 2H), 4.21 - 4.06 (m, 1H), 3.50 - 3.43 (m, 2H), 2.55 (br s, 2H), 2.25 (s, 3H), 2.06 (s, 3H), 1.26 (s, 9H). MS (ES⁺) m/e 535 (M+H)⁺.

실시예 87 (M146)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-((6-(트리플루오로메틸)피리딘-3-일)옥시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.50 (d, J = 2.40 Hz, 1H), 7.89 (d, J = 8.80 Hz, 1H), 7.85 - 7.63 (m, 4H), 7.50 - 7.40 (m, 2H), 7.39 - 7.27 (m, 1H), 6.71 (br s, 2H), 4.59 (t, J = 5.60 Hz, 1H), 4.35 (br s, 2H), 2.59 (br d, J = 6.80 Hz, 2H), 2.40 (br t, J = 6.40 Hz, 2H), 2.16 (s, 3H), 2.09 (s, 3H). MS (ES⁺) m/e 548 (M+H)⁺.

실시예 88 (M147)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-((2,3-디히드로벤조[b][1,4]디옥신-6-일)옥시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.85 (s, 1H), 7.80 (s, 1H), 7.65 - 7.51 (m, 2H), 7.22 (t, J = 7.60 Hz, 1H), 6.93 (d, J = 8.40 Hz, 1H), 6.87 (d, J = 8.80 Hz, 1H), 6.67 (br s, 2H), 6.56 (d, J = 2.40 Hz, 1H), 6.48 (dd, J ₁ = 2.80 Hz, J ₂ = 8.80 Hz, 1H), 4.67 - 4.54 (m, 1H), 4.35 (br s, 2H), 4.25 - 4.23 (br d, J = 2.40 Hz, 4H), 3.41 (q, J = 6.40 Hz, 2H), 2.48 - 4.46 (m, 2H), 2.16 (s, 3H), 2.09 (s, 3H). MS (ES⁺) m/e 537 (M+H)⁺.

실시예 89 (M149)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-클로로-4-페녹시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.88 (s, 1H), 7.84 (s, 1H), 7.61 (d, J = 8.80 Hz, 1H), 7.50 (t, J = 8.00 Hz, 2H), 7.33 - 7.28 (m, 1H), 7.22 - 7.15 (m, 3H), 6.98 (dd, J ₁ = 2.40 Hz, J ₂ = 8.80 Hz, 1H), 6.79 - 6.68 (m, 2H), 4.67 (t, J = 5.60 Hz, 1H), 4.45 - 4.41 (m, 2H), 3.49 - 3.45 (m, 2H), 2.60 - 2.58 (m, 2H), 2.20 (s, 3H), 2.15 (s, 3H). MS (ES⁺) m/e 514 (M+H)⁺.

실시예 90 (M150)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-플루오로-6-메틸-4-페녹시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.91 (s, 1H), 7.83 (s, 1H), 7.49 - 7.42 (m, 2H), 7.29 - 7.22 (m, 1H), 7.14 (d, J = 8.00 Hz, 2H), 6.79 - 6.57 (m, 4H), 4.71 (t, J = 5.20 Hz, 1H), 4.39 (br s, 2H), 3.49 - 3.43 (m, 2H), 2.60 (br s, 2H), 2.26 (m, 3H), 2.19 (s, 3H), 2.12 (s, 3H). MS (ES⁺) m/e 511 (M+H)⁺.

실시예 91 (M151)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-(3-클로로페녹시)-2-메틸벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.88 (s, 1H), 7.83 (s, 1H), 7.67 (d, J = 8.40 Hz, 1H), 7.47 (t, J = 8.00 Hz, 1H), 7.30 (dd, J ₁ = 0.80 Hz, J ₂ = 8.00 Hz, 1H), 7.23 (t, J = 2.00 Hz, 1H), 7.09 (dd, J ₁ = 2.00 Hz, J ₂ = 8.00 Hz, 1H), 7.00 (br d, J = 2.00 Hz, 1H), 6.90 (br dd, J = 2.40 Hz, J ₂ = 8.80 Hz, 1H), 6.82 - 6.59 (m, 2H), 4.65 (br t, J = 5.60 Hz, 1H), 4.40 (br s, 2H), 3.46 (q, J = 6.40 Hz, 2H), 2.58 - 2.55 (m, 2H), 2.32 (s, 3H), 2.19 (s, 3H), 2.14 (s, 3H). MS (ES⁺) m/e 528 (M+H)⁺.

실시예 92 (M152)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2,4-디페녹시벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.13 (s, 1H), 7.93 (s, 1H), 7.71 (d, J = 8.80 Hz, 1H), 7.43 - 7.41 (m, 5H), 7.28 - 7.18 (m, 2H), 7.09 (m, 5H), 6.79 - 6.77 (m, 1H), 6.38 (d, J = 2.40 Hz, 1H), 4.70 (s, 1H), 4.48 (s, 2H), 3.42 (t, J = 6.00 Hz, 2H), 2.448 - 2.44 (m, 2H), 2.20 (s, 3H), 2.16 (s, 3H). MS (ES⁺) m/e 571 (M+H)⁺.

실시예 93 (M153)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(페닐티오)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.92 (s, 1H), 7.85 (s, 1H), 7.69 (dd, J ₁ = 1.20 Hz, J ₂ = 8.00 Hz, 1H), 7.53 - 7.40 (m, 7H), 7.34 - 7.28 (m, 1H), 6.90 (d, J = 8.00 Hz, 1H), 6.86 - 6.60 (m, 2H), 4.67 (t, J = 5.60 Hz, 1H), 4.44 - 4.33 (m, 2H), 3.49 - 3.44 (m, 2H), 2.62 - 2.55 (m, 2H), 2.20 (s, 3H), 2.14 (s, 3H). MS (ES⁺) m/e 495 (M+H)⁺.

실시예 94 (M155)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(4-(2-옥소피로리딘-1-일)페녹시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.84 (s, 1H), 7.79 (s, 1H), 7.69 - 7.63 (m, 3H), 7.62 - 7.54 (m, 1H), 7.31 - 7.22 (m, 1H), 7.04 - 6.99 (m, 2H), 6.96 (d, J = 8.40 Hz, 1H), 6.69 (br s, 2H), 4.59 (t, J = 5.60 Hz, 1H), 4.34 (br s, 2H), 3.82 (t, J = 7.20 Hz, 2H), 3.42 - 3.37 (m, 2H), 2.49 - 2.44 (m, 4H), 2.17 (s, 3H), 2.11 - 2.02 (m, 5H). MS (ES⁺) m/e 562 (M+H)⁺.

실시예 95 (M156)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 4-(tert-부틸)-2-(3-(tert-부틸)페녹시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.83 (s, 1H), 7.79 (s, 1H), 7.60 (d, J = 8.00 Hz, 1H), 7.39 - 7.30 (m, 2H), 7.16 (d, J = 7.20 Hz, 1H), 6.99 (s, 2H), 6.74 - 6.66 (m, 3H), 4.62 - 4.54 (m, 1H), 4.42 - 4.39 (s, 2H), 2.45 - 2.40 (m, 3H), 2.17 (s, 3H), 2.06 (s, 3H), 1.24 (s, 9H), 1.21 (s, 9H). MS (ES⁺) m/e 591 (M+H)⁺.

실시예 96 (M157)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(나프탈렌-1-일옥시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 8.09 - 8.04 (m, 1H), 8.01 - 7.96 (m, 1H), 7.84 (s, 1H), 7.80 - 7.71 (m, 2H), 7.68 (dd, J ₁ = 1.60 Hz, J ₂ = 8.00 Hz, 1H), 7.62 - 7.52 (m, 3H), 7.47 (t, J = 8.00 Hz, 1H), 7.32 - 7.24 (m, 1H), 6.97 - 6.88 (m, 2H), 6.69 (br s, 2H), 4.52 (t, J = 5.60 Hz, 1H), 4.33 (br s, 2H), 3.29 - 3.26 (m, 2H), 2.39 (br t, J = 6.40 Hz, 2H), 2.15 (s, 3H), 2.05 (s, 3H). MS (ES⁺) m/e 529 (M+H)⁺.

실시예 97 (M158)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 5-클로로-2-(2-클로로페녹시)벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.87 (s, 1H), 7.81 (s, 1H), 7.64 - 7.58 (m, 3H), 7.39 (t, J = 7.20 Hz, 1H), 7.27 (t, J = 7.20 Hz, 1H), 7.14 (t, J = 8.00 Hz, 1H), 6.86 (d, J = 8.40 Hz, 1H), 6.63 (s, 2H), 4.63 - 4.59 (m, 1H), 4.35 (s, 2H), 3.46 - 3.41 (m, 2H), 2.46 - 2.44 (m, 2H), 2.17 (s, 3H), 2.10 (s, 3H). MS (ES⁺) m/e 548 (M+H)⁺.

실시예 98 (M159)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(2-브로모페녹시)-5-클로로벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.87 (s, 1H), 7.81 (s, 1H), 7.78 - 7.74 (m, 1H), 7.65 - 7.58 (m, 2H), 7.48 - 7.42 (m, 1H), 7.25 - 7.18 (m, 1H), 7.16 - 7.13 (m, 1H), 6.86 (d, J = 8.40 Hz, 1H), 6.63 (s, 2H), 4.62 - 4.58 (m, 1H), 4.35 (s, 2H), 3.45 - 3.40 (m, 2H), 2.46 - 2.42 (s, 2H), 2.17 (s, 3H), 2.10 (s, 3H). MS (ES⁺) m/e 592 (M+H)⁺.

실시예 99 (M160)

(Z)-S-(2-(N-((4-아미노-2-메틸피리미딘-5-일)메틸)포름아미도)-5-히드록시펜트-2-엔-3-일) 2-(2-브로모페녹시)-6-플루오로벤조티오에이트

¹H NMR (400 MHz, DMSO-d6) δ 7.89 (s, 1H), 7.81 (s, 1H), 7.75 (dd, J ₁ = 1.20 Hz, J ₂ = 7.60 Hz, 1H), 7.56 - 7.41 (m, 2H), 7.23 - 7.19 (m, 1H), 7.18 - 7.08 (m, 2H), 6.63 - 6.61 (m, 2H), 6.56 (d, J = 8.80 Hz, 1H), 4.64 - 4.61 (m, 1H), 4.35 (s, 2H), 3.47 - 3.36 (m, 2H), 2.06 (s, 3H). MS (ES⁺) m/e 576 (M+H)⁺.

실시예 100: 결과

포유류 세포에서 이러한 티아민 유사체 리보스위치를 켜는 데 더 강력한 화합물을 식별하기 위해, 및/또는 개선된 약동학적 매개변수와 같은 다른 특성을 갖게 하기 위해, 추가 화합물(예를 들어, 화학식 IV-VIII의 화합물)을 만들고 15D10 리보스위치(Luci-15D10, 서열 ID 번호: 93)를 포함하는 루시페라제 구조물을 사용하여 티아민 유사체 리보스위치를 조절하는 활성에 대해 테스트했다.

서열 ID 번호: 93은 15D10 리보스위치를 루시페라제 리포터 유전자에 삽입하여 획득되었다. 대문자는 루시페라제 암호화 서열을 나타낸다. 소문자는 인트론/대안 엑손/인트론 및 리보스위치 서열을 나타낸다. 15D10 압타머 암호화 서열(서열 ID 번호: 26)은 밑줄이 그어져 있다.

서열 ID 번호: 93: ATGGAAGACGCCAAAAACATAAAGAAAGGCCCGGCGCCATTCTATCCGCTGGAAGATGGAACCGCTGGAGAGCAACTGCATAAGGCTATGAAGAGATACGCCCTGGTTCCTGGAACAATTGCTTTTACAGATGCACATATCGAGGTGGACATCACTTACGCTGAGTACTTCGAAATGTCCGTTCGGTTGGCAGAAGCTATGAAACGATATGGGCTGAATACAAATCACAGAATCGTCGTATGCAGTGAAAACTCTCTTCAATTCTTTATGCCGGTGTTGGGCGCGTTATTTATCGGAGTTGCAGTTGCGCCCGCGAACGACATTTATAATGAACGTGAATTGCTCAACAGTATGGGCATTTCGCAGCCTACCGTGGTGTTCGTTTCCAAAAAGGGGTTGCAAAAAATTTTGAACGTGCAAAAAAAGCTCCCAATCATCCAAAAAATTATTATCATGGATTCTAAAACGGATTACCAGGGATTTCAGTCGATGTACACGTTCGTCACATCTCATCTACCTCCCGGTTTTAATGAATACGATTTTGTGCCAGAGTCCTTCGATAGGGACAAGACAATTGCACTGATCATGAACTCCTCTGGATCTACTGGTCTGCCTAAAGGTGTCGCTCTGCCTCATAGAACTGCCTGCGTGAGATTCTCGCATGCCAGAGATCCTATTTTTGGCAATCAAATCATTCCGGATACTGCGATTTTAAGTGTTGTTCCATTCCATCACGGTTTTGGAATGTTTACTACACTCGGATATTTGATATGTGGATTTCGAGTCGTCTTAATGTATAGATTTGAAGAAGAGCTGTTTCTGAGGAGCCTTCAGGATTACAAGATTCAAAGTGCGCTGCTGGTGCCAACCCTATTCTCCTTCTTCGCCAAAAGCACTCTGATTGACAAATACGATTTATCTAATTTACACGAAATTGCTTCTGGTGGCGCTCCCCTCTCTAAGGAAGTCGGGGAAGCGGTTGCCAAGAGGTTCCATCTGCCAGGTATCAGGgtgagtctatgggacccttgatgttttctttccccttcttttctatggttaagttcatgtcataggaaggggagaagtaacagggtacacatattgaccaaatcagggtaattttgcatttgtaattttaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgccgagtaacgctgtttctctaacttgtaggaatgaattcagatatttccagagaatgaaaaaaaatcttcagtagaaggtaatgtacaggggtccggccttttcatttggcaccggtgagaacatacccttcggacctgttcacggataatgccgctgcagggagtacattacgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagCAAGGATATGGGCTCACTGAGACTACATCAGCTATTCTGATTACACCCGAGGGGGATGATAAACCGGGCGCGGTCGGTAAAGTTGTTCCATTTTTTGAAGCGAAGGTTGTGGATCTGGATACCGGGAAAACGCTGGGCGTTAATCAAAGAGGCGAACTGTGTGTGAGAGGTCCTATGATTATGTCCGGTTATGTAAACAATCCGGAAGCGACCAACGCCTTGATTGACAAGGATGGATGGCTACATTCTGGAGACATAGCTTACTGGGACGAAGACGAACACTTCTTCATCGTTGACCGCCTGAAGTCTCTGATTAAGTACAAAGGCTATCAGGTGGCTCCCGCTGAATTGGAATCCATCTTGCTCCAACACCCCAACATCTTCGACGCAGGTGTCGCAGGTCTTCCCGACGATGACGCCGGTGAACTTCCCGCCGCCGTTGTTGTTTTGGAGCACGGAAAGACGATGACGGAAAAAGAGATCGTGGATTACGTCGCCAGTCAAGTAACAACCGCGAAAAAGTTGCGCGGAGGAGTTGTGTTTGTGGACGAAGTACCGAAAGGTCTTACCGGAAAACTCGACGCAAGAAAAATCAGAGAGATCCTCATAAAGGCCAAGAAGGGCGGAAAGATCGCCGTGTAA

화학식 IV의 화합물이 먼저 HEK 293 세포에서 테스트되었다. 도 9a에 도시된 바와 같이, HEK 293 세포에서 용량-의존적 방식으로 화합물 M10, M16, M18, M19 또는 M21 처리시 루시페라제 유전자 발현은 증가되었다. 퍼술티아민의 활성과 비교하여, M19는 루시페라제 발현 유도에 더 강력한데, 이는 HEK 293 세포에서 12.5μM 농도에서 루시페라제 발현을 168.7배 증가를 생성한다. 또한, 이러한 새로운 화합물은 마우스 간 세포주 AML 12 세포에서 테스트되었다. 도 9b에 나타낸 바와 같이, HEK 293 세포로부터의 관찰과 일치하게, 모든 화합물은 용량 의존적 방식으로 15D10 리보스위치를 보유하는 구조물로부터 루시페라제 발현을 증가시켰다. 리보스위치 15D10에 대한 퍼술티아민의 활성과 비교할 때, 화합물 M10, M16, M19 및 M21은 퍼술티아민보다 더 강력하다. M19 및 M21은 이러한 유형의 세포에서 리보스위치 15D10 조절 루시페라제 발현을 유도하는 데 있어서 동등하게 강력하다.

대조군 화합물로서 벤포티아민과 함께 화학식 V 및 VI의 화합물을 HEK 293 및 AML 12 세포 둘 다에서 테스트하였다. 도 9c에 도시된 바와 같이, 화합물 M30, M31 M32 및 M33, 뿐만 아니라 벤포티아민은 루시페라제 발현에 영향을 미치지 않은 반면, M26, M27, M28, M29 및 M34는 루시-15D10 구조물로부터 루시페라제 발현을 증가시켰으며, M34는 HEK 293 세포에서 가장 강력한 화합물이다. 대조적으로, AML 12 세포에서 M30 및 M33을 제외한 모든 화합물은 루시-15D10 구조물로부터 루시페라제 발현을 증가시켰다. 이 두 가지 세포 유형 내에서 일관되게, M34는 리보스위치를 켜는 데 있어 이 두 화합물 그룹 중에서 가장 강력한 유도제이다(도 9d).

상대적으로 더 강력한 화합물이 추가 인간 세포주에서 리보스위치를 조절하는 활성에 대해 추가로 테스트되었다. 인간 ARPE-19 세포에서 도 9e에 도시된 바와 같이, 벤포티아민과 M32는 모두 리보스위치 15D10-조절된 루시페라제 발현을 증가시키는 활성을 나타내지 않은 반면, M10, M19 및 M21은 루시-15D10 구조물로부터 루시페라제 발현을 증가시키는 데 퍼술타이민과 동등한 효능을 갖는다. 유사하게, 벤포티아민 및 M32는 Hep G2 세포에서 활성이 없는 반면, M19, M21 및 M10은 12.5 μM 농도에서 유사한 효능을 갖는다(도 9f).

대조군 화합물로서 퍼술티아민을 포함하는 화합물 M34 내지 M123및 화합물 M126 내지 M160을 HEK 293 및 AML 12 세포 모두에서 15D10 리보스위치(루시-15D10, 서열 ID 번호:93)를 보유하는 루시퍼라제 구조물을 사용하여 티아민 유사체 리보스위치를 조절하는 활성에 대해 테스트되었다. 이들 화합물에 대한 반응으로 루시-15D10 구조물로부터의 루시페라제 발현 증가가 표 2 및 3에 나타냈다.

50 μM에서 화합물 M34 내지 M123에 대한 리보스위치 15D10 조절 루시페라제 발현의 배수 증가 (식별된 화합물로 처리된 세포의 루시페라제 신호를 미처리 세포의 루시페라제 신호로 나눈 비율로 계산됨). # = 화합물 번호. HEK = HEK 293 세포. AML = AML12 세포. Ctrl. = 퍼술티아민.

#	HEK	AML	#	HEK	AML	#	HEK	AML
M19	676.3	329.5	M59	1.1	1.0	M101	88.6	128.0
M21	618.3	228.6	M62	49.0	109.9	M103	0.9	0.5
M34	163.5	290.6	M63	1.7	19.0	M105	0.2	0.2
M37	76.2	134.3	M64	2.0	3.9	M106	1.2	294.4
M38	1.2	1.0	M65	3.2	67.1	M107	26.0	40.2
M39	102.7	127.2	M66	1.1	0.4	M108	75.8	129.2
M40	83.1	206.0	M67	2.1	0.9	M109	22.6	87.3
M43	10.2	95.3	M68	303.0	209.0	M110	65.7	145.6
M44	176.8	314.1	M70	51.0	235.9	M111	180.7	174.7
M45	1.3	2.9	M72	235.9	295.1	M113	212.9	272.5
M46	1.3	6.0	M73	205.1	200.3	M114	50.1	88.8
M47	25.3	85.1	M76	60.7	134.3	M115	19.9	52.1
M49	414.0	202.3	M79	352.8	358.2	M116	1.3	0.8
M50	93.5	141.8	M82	89.2	73.9	M117	0.8	3.4
M51	392.5	188.6	M88	215.7	355.2	M118	9.3	140.3
M52	363.9	195.1	M91	13.1	150.3	M119	0.9	0.7
M53	2.4	57.0	M92	0.9	23.7	M120	0.5	30.5
M54	3.0	13.9	M97	298.9	126.2	M121	0.9	0.5
M55	2.1	9.0	M98	13.6	57.7	M122	1.3	0.5
M57	1.2	24.4	M99	0.2	0.4	M123	0.4	0.6
M58	1.1	1.5	M100	1.1	0.4	Ctrl.	446.2	314.6

50 μM에서 화합물 M126 내지 M160에 대한 리보스위치 15D10 조절 루시페라제 발현의 배수 증가 (식별된 화합물로 처리된 세포의 루시페라제 신호를 미처리 세포의 루시페라제 신호로 나눈 비율로 계산됨). # = 화합물 번호. HEK = HEK 293 세포. AML = AML12 세포.

#	HEK	AML	#	HEK	AML
M113	265.00	348.35	M143	138.05	299.80
M126	147.00	305.39	M145	156.06	60.62
M127	0.46	7.39	M146	53.27	96.56
M128	0.56	7.87	M147	193.36	266.56
M129	10.91	167.48	M148	152.89	288.05
M130	110.40	328.65	M149	175.93	382.94
M131	740.64	508.85	M150	12.27	11.96
M133	99.97	273.22	M151	20.51	231.00
M134	556.94	407.79	M152	68.89	36.62
M135	87.55	44.49	M153	441.91	534.59
M136	132.20	262.53	M155	7.71	117.46
M137	139.56	287.66	M156	0.06	10.13
M138	227.96	195.26	M157	117.52	315.57
M139	37.02	188.39	M158	96.94	235.31
M140	174.69	192.16	M159	85.50	205.55
M141	1.61	3.46	M160	79.51	131.03
M142	85.27	183.85

SEQUENCE LISTING <110> MeiraGTx UK II Limited Xuecui, Guo Alexandria, Forbes Kevin G., Liu Ji-In, Kim <120> APTAMERS THAT BIND THIAMINE ANALOGS AND DERIVATIVES <130> 162027.48976 <140> US 62/994,135 <141> 2020-03-24 <160> 98 <170> PatentIn version 3.5 <210> 1 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (3)..(3) <223> n is A or G <220> <221> misc_feature <222> (14)..(14) <223> n is C or no nucleotide <220> <221> misc_feature <222> (16)..(16) <223> n is T or no nucleotide <220> <221> misc_feature <222> (27)..(27) <223> n is A or G <220> <221> misc_feature <222> (37)..(38) <223> n is a, c, g, or t <220> <221> misc_feature <222> (40)..(40) <223> n is a, c, g, or t <220> <221> misc_feature <222> (47)..(47) <223> n is a, c, g, or t <220> <221> misc_feature <222> (48)..(48) <223> n is C, G, or T <220> <221> misc_feature <222> (49)..(49) <223> n is a, c, g, or t <220> <221> misc_feature <222> (50)..(50) <223> n is A or T <220> <221> misc_feature <222> (57)..(57) <223> n is C or T <220> <221> misc_feature <222> (72)..(72) <223> n is C or T <400> 1 acnggggtcc ggcntnttca tttggcnccg gtgagannan acccttnnnn cctgttnacg 60 gataatgccg cngcagggag t 81 <210> 2 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (3)..(3) <223> n is A or G <220> <221> misc_feature <222> (14)..(14) <223> n is C or no nucleotide <220> <221> misc_feature <222> (16)..(16) <223> n is T or no nucleotide <220> <221> misc_feature <222> (37)..(37) <223> n is G or T <220> <221> misc_feature <222> (38)..(38) <223> n is C or T <220> <221> misc_feature <222> (40)..(40) <223> n is C or T <220> <221> misc_feature <222> (47)..(47) <223> n is a, c, g, or t <220> <221> misc_feature <222> (48)..(48) <223> n is G or T <220> <221> misc_feature <222> (49)..(49) <223> n is A, G, or T <220> <221> misc_feature <222> (50)..(50) <223> n is A or T <220> <221> misc_feature <222> (57)..(57) <223> n is C or T <220> <221> misc_feature <222> (72)..(72) <223> n is C or T <400> 2 acnggggtcc ggcntnttca tttggcgccg gtgagannan acccttnnnn cctgttnacg 60 gataatgccg cngcagggag t 81 <210> 3 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (57)..(57) <223> n is C or T <220> <221> misc_feature <222> (72)..(72) <223> n is C or T <400> 3 acaggggtcc ggccttttca tttggcgccg gtgagagcac accctttgaa cctgttnacg 60 gataatgccg cngcagggag t 81 <210> 4 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (3)..(3) <223> n is A or G <220> <221> misc_feature <222> (47)..(47) <223> n is a, c, g, or t <220> <221> misc_feature <222> (48)..(48) <223> n is G or T <220> <221> misc_feature <222> (49)..(49) <223> n is A, G, or T <220> <221> misc_feature <222> (50)..(50) <223> n is A or T <400> 4 acnggggtcc ggccttttca tttggcgccg gtgagagcac acccttnnnn cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 5 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (37)..(37) <223> n is G or T <220> <221> misc_feature <222> (38)..(38) <223> n is C or T <220> <221> misc_feature <222> (40)..(40) <223> n is C or T <400> 5 acaggggtcc ggccttttca tttggcgccg gtgagannan accctttgaa cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 6 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (27)..(27) <223> n is A or G <220> <221> misc_feature <222> (37)..(38) <223> n is a, c, g, or t <220> <221> misc_feature <222> (40)..(40) <223> n is a, c, g, or t <220> <221> misc_feature <222> (47)..(47) <223> n is a, c, g, or t <220> <221> misc_feature <222> (48)..(48) <223> n is C or G <220> <221> misc_feature <222> (49)..(49) <223> n is a, c, g, or t <400> 6 acaggggtcc ggccttttca tttggcnccg gtgagannan acccttnnna cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 7 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 14G4 <400> 7 acaggggtcc ggccttttca tttggcgccg gtgagagcac accctttgaa cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 8 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 1D10 <400> 8 acaggggtcc ggccttttca tttggcgccg gtgagattat accctttgaa cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 9 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 3H4 <400> 9 acaggggtcc ggccttttca tttggcgccg gtgagagcac accctttgaa cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 10 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 3F10 <400> 10 acgggggtcc ggccttttca tttggcgccg gtgagagcac acccttcgga cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 11 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> 3H9 <400> 11 acaggggtcc ggcttttcat ttggcgccgg tgagagcaca cccttatgac ctgtttacgg 60 ataatgccgc cgcagggagt 80 <210> 12 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 4G2 <400> 12 acgggggtcc ggccttttca tttggcgccg gtgagagcac accctttgga cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 13 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 6D2 <400> 13 acgggggtcc ggccttttca tttggcgccg gtgagagcac accctttgtt cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 14 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 6B4 <400> 14 acaggggtcc ggccttttca tttggcgccg gtgagagcac acccttgtga cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 15 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 4H2 <400> 15 acaggggtcc ggccttttca tttggcgccg gtgagagcac acccttcgga cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 16 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 6C4 <400> 16 acgggggtcc ggccttttca tttggcgccg gtgagagcac acccttcgaa cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 17 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 6G12 <400> 17 acaggggtcc ggccttttca tttggcgccg gtgagagcac accctttgga cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 18 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> 8F1 <400> 18 acgggggtcc ggcctttcat ttggcgccgg tgagagcaca cccttcggac ctgtttacgg 60 ataatgccgc cgcagggagt 80 <210> 19 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 10A7 <400> 19 acaggggtcc ggccttttca tttggcgccg gtgagatgat accctttgga cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 20 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 12D5 <400> 20 acaggggtcc ggccttttca tttggcgccg gtgagagcac accctttgga cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 21 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 12G7 <400> 21 acaggggtcc ggccttttca tttggcgccg gtgagattat acccttcgga cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 22 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 12H3 <400> 22 acaggggtcc ggccttttca tttggcgccg gtgagatcac acccttacta cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 23 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 13H7 <400> 23 acaggggtcc ggccttttca tttggcgccg gtgagaacag accctttgca cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 24 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 13B6 <400> 24 acaggggtcc ggccttttca tttggcgccg gtgagaacac accctttgta cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 25 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 15A5 <400> 25 acaggggtcc ggccttttca tttggcgccg gtgagattat acccttacta cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 26 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 15D10 <400> 26 acaggggtcc ggccttttca tttggcaccg gtgagaacat acccttcgga cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 27 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 15F9 <400> 27 acaggggtcc ggccttttca tttggcgccg gtgagattac acccttagca cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 28 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 16E5 <400> 28 acaggggtcc ggccttttca tttggcgccg gtgagatcaa acccttggca cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 29 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 16G8 <400> 29 acaggggtcc ggccttttca tttggcgccg gtgagagtac acccttcgca cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 30 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 16G6 <400> 30 acaggggtcc ggccttttca tttggcgccg gtgagatcac acccttggta cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 31 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 17E2 <400> 31 acaggggtcc ggccttttca tttggcgccg gtgagattac accctttgga cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 32 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 17G1 <400> 32 acaggggtcc ggccttttca tttggcgccg gtgagatcac acccttggaa cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 33 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 17D3 <400> 33 acaggggtcc ggccttttca tttggcgccg gtgagaggat acccttcgga cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 34 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 17F5 <400> 34 acaggggtcc ggccttttca tttggcgccg gtgagagtat acccttagta cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 35 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 17G3 <400> 35 acaggggtcc ggccttttca tttggcaccg gtgagacaat acccttggta cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 36 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> 18G9 <400> 36 acaggggtcc ggccttttca tttggcgccg gtgagagaat acccttggta cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 37 <211> 563 <212> DNA <213> Artificial Sequence <220> <223> G17 riboswitch <220> <221> misc_feature <222> (317)..(317) <223> n is aptamer encoding sequence <400> 37 gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60 cataggaagg ggagaagtaa cagggtacac atattgacca aatcagggta attttgcatt 120 tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct tatttctaat 180 actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg ccgagtaacg 240 ctgtttctct aacttgtagg aatgaattca gatatttcca gagaatgaaa aaaaaatctt 300 cagtagaagg taatgtnaca ttacgcacca ttctaaagaa taacagtgat aatttctggg 360 ttaaggcaat agcaatattt ctgcatataa atatttctgc atataaattg taactgatgt 420 aagaggtttc atattgctaa tagcagctac aatccagcta ccattctgct tttattttat 480 ggttgggata aggctggatt attctgagtc caagctaggc ccttttgcta atcatgttca 540 tacctcttat cttcctccca cag 563 <210> 38 <211> 95 <212> RNA <213> Artificial Sequence <220> <223> 14G4 with P1 stem <400> 38 guaauguaca gggguccggc cuuuucauuu ggcgccggug agagcacacc cuuugaaccu 60 guuuacggau aaugccgccg cagggaguac auuac 95 <210> 39 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> Library A1 <220> <221> misc_feature <222> (55)..(57) <223> n is a, c, g, or t <220> <221> misc_feature <222> (70)..(71) <223> n is a, c, g, or t <400> 39 acaggggtcc ggccttttca tttggcgccg gtgagagcac accctttgaa cctgnnncgg 60 ataatgccgn ngcagggagt 80 <210> 40 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Library A2 <220> <221> misc_feature <222> (3)..(3) <223> n is a, c, g, or t <220> <221> misc_feature <222> (46)..(50) <223> n is a, c, g, or t <400> 40 acnggggtcc ggccttttca tttggcgccg gtgagagcac accctnnnnn cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 41 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Library A3 <220> <221> misc_feature <222> (8)..(8) <223> n is a, c, g, or t <220> <221> misc_feature <222> (37)..(41) <223> n is a, c, g, or t <400> 41 acaggggncc ggccttttca tttggcgccg gtgagannnn nccctttgaa cctgtttacg 60 gataatgccg ccgcagggag t 81 <210> 42 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Library A4 <220> <221> misc_feature <222> (37)..(38) <223> n is a, c, g, or t <220> <221> misc_feature <222> (40)..(40) <223> n is a, c, g, or t <220> <221> misc_feature <222> (47)..(49) <223> n is a, c, g, or t <400> 42 acaggggtcc ggccttttca tttggcgccg gtgagannan acccttnnna cctgttcacg 60 gataatgccg ctgcagggag t 81 <210> 43 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (3)..(3) <223> n is A or G <220> <221> misc_feature <222> (14)..(14) <223> n is C or no nucleotide <220> <221> misc_feature <222> (16)..(16) <223> n is U or no nucleotide <220> <221> misc_feature <222> (27)..(27) <223> n is A or G <220> <221> misc_feature <222> (37)..(38) <223> n is a, c, g, or u <220> <221> misc_feature <222> (40)..(40) <223> n is a, c, g, or u <220> <221> misc_feature <222> (47)..(47) <223> n is a, c, g, or u <220> <221> misc_feature <222> (48)..(48) <223> n is C, G, or U <220> <221> misc_feature <222> (49)..(49) <223> n is a, c, g, or u <220> <221> misc_feature <222> (50)..(50) <223> n is A or U <220> <221> misc_feature <222> (57)..(57) <223> n is C or U <220> <221> misc_feature <222> (72)..(72) <223> n is C or U <400> 43 acnggggucc ggcnunuuca uuuggcnccg gugagannan acccuunnnn ccuguunacg 60 gauaaugccg cngcagggag u 81 <210> 44 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (3)..(3) <223> n is A or G <220> <221> misc_feature <222> (14)..(14) <223> n is C or no nucleotide <220> <221> misc_feature <222> (16)..(16) <223> n is U or no nucleotide <220> <221> misc_feature <222> (37)..(37) <223> n is G or U <220> <221> misc_feature <222> (38)..(38) <223> n is C or U <220> <221> misc_feature <222> (40)..(40) <223> n is C or U <220> <221> misc_feature <222> (47)..(47) <223> n is a, c, g, or u <220> <221> misc_feature <222> (48)..(48) <223> n is G or U <220> <221> misc_feature <222> (49)..(49) <223> n is A, G, or U <220> <221> misc_feature <222> (50)..(50) <223> n is A or U <220> <221> misc_feature <222> (57)..(57) <223> n is C or U <220> <221> misc_feature <222> (72)..(72) <223> n is C or U <400> 44 acnggggucc ggcnunuuca uuuggcgccg gugagannan acccuunnnn ccuguunacg 60 gauaaugccg cngcagggag u 81 <210> 45 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (57)..(57) <223> n is C or U <220> <221> misc_feature <222> (72)..(72) <223> n is C or U <400> 45 acaggggucc ggccuuuuca uuuggcgccg gugagagcac acccuuugaa ccuguunacg 60 gauaaugccg cngcagggag u 81 <210> 46 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (3)..(3) <223> n is A or G <220> <221> misc_feature <222> (47)..(47) <223> n is a, c, g, or u <220> <221> misc_feature <222> (48)..(48) <223> n is G or U <220> <221> misc_feature <222> (49)..(49) <223> n is A, G, or U <220> <221> misc_feature <222> (50)..(50) <223> n is A or U <400> 46 acnggggucc ggccuuuuca uuuggcgccg gugagagcac acccuunnnn ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 47 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (37)..(37) <223> n is G or U <220> <221> misc_feature <222> (38)..(38) <223> n is C or U <220> <221> misc_feature <222> (40)..(40) <223> n is C or U <400> 47 acaggggucc ggccuuuuca uuuggcgccg gugagannan acccuuugaa ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 48 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> Aptamer motif <220> <221> misc_feature <222> (27)..(27) <223> n is A or G <220> <221> misc_feature <222> (37)..(38) <223> n is a, c, g, or u <220> <221> misc_feature <222> (40)..(40) <223> n is a, c, g, or u <220> <221> misc_feature <222> (47)..(47) <223> n is a, c, g, or u <220> <221> misc_feature <222> (48)..(48) <223> n is C or G <220> <221> misc_feature <222> (49)..(49) <223> n is a, c, g, or u <400> 48 acaggggucc ggccuuuuca uuuggcnccg gugagannan acccuunnna ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 49 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 14G4 <400> 49 acaggggucc ggccuuuuca uuuggcgccg gugagagcac acccuuugaa ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 50 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 1D10 <400> 50 acaggggucc ggccuuuuca uuuggcgccg gugagauuau acccuuugaa ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 51 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 3H4 <400> 51 acaggggucc ggccuuuuca uuuggcgccg gugagagcac acccuuugaa ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 52 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 3F10 <400> 52 acgggggucc ggccuuuuca uuuggcgccg gugagagcac acccuucgga ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 53 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> 3H9 <400> 53 acaggggucc ggcuuuucau uuggcgccgg ugagagcaca cccuuaugac cuguuuacgg 60 auaaugccgc cgcagggagu 80 <210> 54 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 4G2 <400> 54 acgggggucc ggccuuuuca uuuggcgccg gugagagcac acccuuugga ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 55 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 6D2 <400> 55 acgggggucc ggccuuuuca uuuggcgccg gugagagcac acccuuuguu ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 56 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 6B4 <400> 56 acaggggucc ggccuuuuca uuuggcgccg gugagagcac acccuuguga ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 57 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 4H2 <400> 57 acaggggucc ggccuuuuca uuuggcgccg gugagagcac acccuucgga ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 58 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 6C4 <400> 58 acgggggucc ggccuuuuca uuuggcgccg gugagagcac acccuucgaa ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 59 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 6G12 <400> 59 acaggggucc ggccuuuuca uuuggcgccg gugagagcac acccuuugga ccuguuuacg 60 gauaaugccg ccgcagggag u 81 <210> 60 <211> 80 <212> RNA <213> Artificial Sequence <220> <223> 8F1 <400> 60 acgggggucc ggccuuucau uuggcgccgg ugagagcaca cccuucggac cuguuuacgg 60 auaaugccgc cgcagggagu 80 <210> 61 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 10A7 <400> 61 acaggggucc ggccuuuuca uuuggcgccg gugagaugau acccuuugga ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 62 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 12D5 <400> 62 acaggggucc ggccuuuuca uuuggcgccg gugagagcac acccuuugga ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 63 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 12G7 <400> 63 acaggggucc ggccuuuuca uuuggcgccg gugagauuau acccuucgga ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 64 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 12H3 <400> 64 acaggggucc ggccuuuuca uuuggcgccg gugagaucac acccuuacua ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 65 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 13H7 <400> 65 acaggggucc ggccuuuuca uuuggcgccg gugagaacag acccuuugca ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 66 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 13B6 <400> 66 acaggggucc ggccuuuuca uuuggcgccg gugagaacac acccuuugua ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 67 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 15A5 <400> 67 acaggggucc ggccuuuuca uuuggcgccg gugagauuau acccuuacua ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 68 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 15D10 <400> 68 acaggggucc ggccuuuuca uuuggcaccg gugagaacau acccuucgga ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 69 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 15F9 <400> 69 acaggggucc ggccuuuuca uuuggcgccg gugagauuac acccuuagca ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 70 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 16E5 <400> 70 acaggggucc ggccuuuuca uuuggcgccg gugagaucaa acccuuggca ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 71 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 16G8 <400> 71 acaggggucc ggccuuuuca uuuggcgccg gugagaguac acccuucgca ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 72 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 16G6 <400> 72 acaggggucc ggccuuuuca uuuggcgccg gugagaucac acccuuggua ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 73 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 17E2 <400> 73 acaggggucc ggccuuuuca uuuggcgccg gugagauuac acccuuugga ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 74 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 17G1 <400> 74 acaggggucc ggccuuuuca uuuggcgccg gugagaucac acccuuggaa ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 75 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 17D3 <400> 75 acaggggucc ggccuuuuca uuuggcgccg gugagaggau acccuucgga ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 76 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 17F5 <400> 76 acaggggucc ggccuuuuca uuuggcgccg gugagaguau acccuuagua ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 77 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 17G3 <400> 77 acaggggucc ggccuuuuca uuuggcaccg gugagacaau acccuuggua ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 78 <211> 81 <212> RNA <213> Artificial Sequence <220> <223> 18G9 <400> 78 acaggggucc ggccuuuuca uuuggcgccg gugagagaau acccuuggua ccuguucacg 60 gauaaugccg cugcagggag u 81 <210> 79 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> modified DHFR exon 2 <400> 79 gaatgaattc agatatttcc agagaatgaa aaaaaaatct tcagtagaag 50 <210> 80 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> U1 snRNP binding site (consensus site) <400> 80 caggtaagta 10 <210> 81 <211> 10 <212> RNA <213> Artificial Sequence <220> <223> U1 snRNP binding site (consensus site) <400> 81 cagguaagua 10 <210> 82 <211> 2305 <212> DNA <213> Artificial Sequence <220> <223> TPPz riboswitch <400> 82 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840 aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960 aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag ggtgagtcta 1020 tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 1080 gggagaagta acagggtaca catattgacc aaatcagggt aattttgcat ttgtaatttt 1140 aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct 1200 aatctctttc tttcagggca ataatgatac aatgtatcat gccgagtaac gctgtttctc 1260 taacttgtag gaatgaattc agatatttcc agagaatgaa aaaaaaatct tcagtagaag 1320 gtaatgtgtc ggagtgcctt agggattatt cccctaaagc tgagaccgca ttgcgggatc 1380 cgttgaacct gatcaggcta atacctgcga agggaacaca ttacgcacca ttctaaagaa 1440 taacagtgat aatttctggg ttaaggcaat agcaatattt ctgcatataa atatttctgc 1500 atataaattg taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta 1560 ccattctgct tttattttat ggttgggata aggctggatt attctgagtc caagctaggc 1620 ccttttgcta atcatgttca tacctcttat cttcctccca cagcaaggat atgggctcac 1680 tgagactaca tcagctattc tgattacacc cgagggggat gataaaccgg gcgcggtcgg 1740 taaagttgtt ccattttttg aagcgaaggt tgtggatctg gataccggga aaacgctggg 1800 cgttaatcaa agaggcgaac tgtgtgtgag aggtcctatg attatgtccg gttatgtaaa 1860 caatccggaa gcgaccaacg ccttgattga caaggatgga tggctacatt ctggagacat 1920 agcttactgg gacgaagacg aacacttctt catcgttgac cgcctgaagt ctctgattaa 1980 gtacaaaggc tatcaggtgg ctcccgctga attggaatcc atcttgctcc aacaccccaa 2040 catcttcgac gcaggtgtcg caggtcttcc cgacgatgac gccggtgaac ttcccgccgc 2100 cgttgttgtt ttggagcacg gaaagacgat gacggaaaaa gagatcgtgg attacgtcgc 2160 cagtcaagta acaaccgcga aaaagttgcg cggaggagtt gtgtttgtgg acgaagtacc 2220 gaaaggtctt accggaaaac tcgacgcaag aaaaatcaga gagatcctca taaaggccaa 2280 gaagggcgga aagatcgccg tgtaa 2305 <210> 83 <211> 2289 <212> DNA <213> Artificial Sequence <220> <223> TPPm riboswitch <400> 83 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840 aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960 aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag ggtgagtcta 1020 tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 1080 gggagaagta acagggtaca catattgacc aaatcagggt aattttgcat ttgtaatttt 1140 aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct 1200 aatctctttc tttcagggca ataatgatac aatgtatcat gccgagtaac gctgtttctc 1260 taacttgtag gaatgaattc agatatttcc agagaatgaa aaaaaaatct tcagtagaag 1320 gtaatgtctc ggggtgccct tctgcgtgaa ggctgagaaa tacccgtatc acctgatctg 1380 gataatgcca gcgtagggaa gacattacgc accattctaa agaataacag tgataatttc 1440 tgggttaagg caatagcaat atttctgcat ataaatattt ctgcatataa attgtaactg 1500 atgtaagagg tttcatattg ctaatagcag ctacaatcca gctaccattc tgcttttatt 1560 ttatggttgg gataaggctg gattattctg agtccaagct aggccctttt gctaatcatg 1620 ttcatacctc ttatcttcct cccacagcaa ggatatgggc tcactgagac tacatcagct 1680 attctgatta cacccgaggg ggatgataaa ccgggcgcgg tcggtaaagt tgttccattt 1740 tttgaagcga aggttgtgga tctggatacc gggaaaacgc tgggcgttaa tcaaagaggc 1800 gaactgtgtg tgagaggtcc tatgattatg tccggttatg taaacaatcc ggaagcgacc 1860 aacgccttga ttgacaagga tggatggcta cattctggag acatagctta ctgggacgaa 1920 gacgaacact tcttcatcgt tgaccgcctg aagtctctga ttaagtacaa aggctatcag 1980 gtggctcccg ctgaattgga atccatcttg ctccaacacc ccaacatctt cgacgcaggt 2040 gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg ccgccgttgt tgttttggag 2100 cacggaaaga cgatgacgga aaaagagatc gtggattacg tcgccagtca agtaacaacc 2160 gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag taccgaaagg tcttaccgga 2220 aaactcgacg caagaaaaat cagagagatc ctcataaagg ccaagaaggg cggaaagatc 2280 gccgtgtaa 2289 <210> 84 <211> 2296 <212> DNA <213> Artificial Sequence <220> <223> 14G4 riboswitch <400> 84 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840 aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960 aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag ggtgagtcta 1020 tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 1080 gggagaagta acagggtaca catattgacc aaatcagggt aattttgcat ttgtaatttt 1140 aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct 1200 aatctctttc tttcagggca ataatgatac aatgtatcat gccgagtaac gctgtttctc 1260 taacttgtag gaatgaattc agatatttcc agagaatgaa aaaaaaatct tcagtagaag 1320 gtaatgtaca ggggtccggc cttttcattt ggcgccggtg agagcacacc ctttgaacct 1380 gtttacggat aatgccgccg cagggagtac attacgcacc attctaaaga ataacagtga 1440 taatttctgg gttaaggcaa tagcaatatt tctgcatata aatatttctg catataaatt 1500 gtaactgatg taagaggttt catattgcta atagcagcta caatccagct accattctgc 1560 ttttatttta tggttgggat aaggctggat tattctgagt ccaagctagg cccttttgct 1620 aatcatgttc atacctctta tcttcctccc acagcaagga tatgggctca ctgagactac 1680 atcagctatt ctgattacac ccgaggggga tgataaaccg ggcgcggtcg gtaaagttgt 1740 tccatttttt gaagcgaagg ttgtggatct ggataccggg aaaacgctgg gcgttaatca 1800 aagaggcgaa ctgtgtgtga gaggtcctat gattatgtcc ggttatgtaa acaatccgga 1860 agcgaccaac gccttgattg acaaggatgg atggctacat tctggagaca tagcttactg 1920 ggacgaagac gaacacttct tcatcgttga ccgcctgaag tctctgatta agtacaaagg 1980 ctatcaggtg gctcccgctg aattggaatc catcttgctc caacacccca acatcttcga 2040 cgcaggtgtc gcaggtcttc ccgacgatga cgccggtgaa cttcccgccg ccgttgttgt 2100 tttggagcac ggaaagacga tgacggaaaa agagatcgtg gattacgtcg ccagtcaagt 2160 aacaaccgcg aaaaagttgc gcggaggagt tgtgtttgtg gacgaagtac cgaaaggtct 2220 taccggaaaa ctcgacgcaa gaaaaatcag agagatcctc ataaaggcca agaagggcgg 2280 aaagatcgcc gtgtaa 2296 <210> 85 <211> 579 <212> DNA <213> Artificial Sequence <220> <223> Con8-Epo <400> 85 atgggggtgc ccgaacgtcc caccctgctg cttttactct ccttgctact gattcctctg 60 ggcctcccag tcctctgtgc tcccccacgc ctcatctgcg acagtcgagt tctggagagg 120 tacatcttag aggccaagga ggcagaaaat gtcacgatgg gttgtgcaga aggtcccaga 180 ctgagtgaaa atattacagt cccagatacc aaagtcaact tctatgcttg gaaaagaatg 240 gaggtggaag aacaggccat agaagtttgg caaggcctgt ccctgctctc agaagccatc 300 ctgcaggccc aggccctgct agccaattcc tcccagccac cagagaccct tcagcttcat 360 atagacaaag ccatcagtgg tctacgtagc ctcacttcac tgcttcgggt actgggagct 420 cagaaggaat tgatgtcgcc tccagatacc accccacctg ctccactccg aacactcaca 480 gtggatactt tctgcaagct cttccgggtc tacgccaact tcctccgggg gaaactgaag 540 ctgtacacgg gagaggtctg caggagaggg gacaggtga 579 <210> 86 <211> 1221 <212> DNA <213> Artificial Sequence <220> <223> Epo-3H4 <400> 86 atgggggtgc ccgaacgtcc caccctgctg cttttactct ccttgctact gattcctctg 60 ggcctcccag tcctctgtgc tcccccacgc ctcatctgcg acagtcgagt tctggagagg 120 tacatcttag aggccaagga ggcagaaaat gtcacgatgg gttgtgcaga aggtcccaga 180 ctgagtgaaa atattacagt cccagatacc aaagtcaact tctatgcttg gaaaagaatg 240 gaggtggaag aacaggccat agaagtttgg caaggcctgt ccctgctctc agaagccatc 300 ctgcagggtg agtctatggg acccttgatg ttttctttcc ccttcttttc tatggttaag 360 ttcatgtcat aggaagggga gaagtaacag ggtacacata ttgaccaaat cagggtaatt 420 ttgcatttgt aattttaaaa aatgctttct tcttttaata tacttttttg tttatcttat 480 ttctaatact ttccctaatc tctttctttc agggcaataa tgatacaatg tatcatgccg 540 agtaacgctg tttctctaac ttgtaggaat gaattcagat atttccagag aatgaaaaaa 600 aatcttcagt agaaggtaat gtacaggggt ccggcctttt catttggcgc cggtgagagc 660 acaccctttg aacctgttca cggataatgc cgctgcaggg agtacattac gcaccattct 720 aaagaataac agtgataatt tctgggttaa ggcaatagca atatttctgc atataaatat 780 ttctgcatat aaattgtaac tgatgtaaga ggtttcatat tgctaatagc agctacaatc 840 cagctaccat tctgctttta ttttatggtt gggataaggc tggattattc tgagtccaag 900 ctaggccctt ttgctaatca tgttcatacc tcttatcttc ctcccacagc ccaggccctg 960 ctagccaatt cctcccagcc accagagacc cttcagcttc atatagacaa agccatcagt 1020 ggtctacgta gcctcacttc actgcttcgg gtactgggag ctcagaagga attgatgtcg 1080 cctccagata ccaccccacc tgctccactc cgaacactca cagtggatac tttctgcaag 1140 ctcttccggg tctacgccaa cttcctccgg gggaaactga agctgtacac gggagaggtc 1200 tgcaggagag gggacaggtg a 1221 <210> 87 <211> 1221 <212> DNA <213> Artificial Sequence <220> <223> Epo-15D10 <400> 87 atgggggtgc ccgaacgtcc caccctgctg cttttactct ccttgctact gattcctctg 60 ggcctcccag tcctctgtgc tcccccacgc ctcatctgcg acagtcgagt tctggagagg 120 tacatcttag aggccaagga ggcagaaaat gtcacgatgg gttgtgcaga aggtcccaga 180 ctgagtgaaa atattacagt cccagatacc aaagtcaact tctatgcttg gaaaagaatg 240 gaggtggaag aacaggccat agaagtttgg caaggcctgt ccctgctctc agaagccatc 300 ctgcagggtg agtctatggg acccttgatg ttttctttcc ccttcttttc tatggttaag 360 ttcatgtcat aggaagggga gaagtaacag ggtacacata ttgaccaaat cagggtaatt 420 ttgcatttgt aattttaaaa aatgctttct tcttttaata tacttttttg tttatcttat 480 ttctaatact ttccctaatc tctttctttc agggcaataa tgatacaatg tatcatgccg 540 agtaacgctg tttctctaac ttgtaggaat gaattcagat atttccagag aatgaaaaaa 600 aatcttcagt agaaggtaat gtacaggggt ccggcctttt catttggcac cggtgagaac 660 atacccttcg gacctgttca cggataatgc cgctgcaggg agtacattac gcaccattct 720 aaagaataac agtgataatt tctgggttaa ggcaatagca atatttctgc atataaatat 780 ttctgcatat aaattgtaac tgatgtaaga ggtttcatat tgctaatagc agctacaatc 840 cagctaccat tctgctttta ttttatggtt gggataaggc tggattattc tgagtccaag 900 ctaggccctt ttgctaatca tgttcatacc tcttatcttc ctcccacagc ccaggccctg 960 ctagccaatt cctcccagcc accagagacc cttcagcttc atatagacaa agccatcagt 1020 ggtctacgta gcctcacttc actgcttcgg gtactgggag ctcagaagga attgatgtcg 1080 cctccagata ccaccccacc tgctccactc cgaacactca cagtggatac tttctgcaag 1140 ctcttccggg tctacgccaa cttcctccgg gggaaactga agctgtacac gggagaggtc 1200 tgcaggagag gggacaggtg a 1221 <210> 88 <211> 1362 <212> DNA <213> Artificial Sequence <220> <223> EGFP-6B4 <400> 88 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaagggtgag tctatgggac ccttgatgtt 300 ttctttcccc ttcttttcta tggttaagtt catgtcatag gaaggggaga agtaacaggg 360 tacacatatt gaccaaatca gggtaatttt gcatttgtaa ttttaaaaaa tgctttcttc 420 ttttaatata cttttttgtt tatcttattt ctaatacttt ccctaatctc tttctttcag 480 ggcaataatg atacaatgta tcatgccgag taacgctgtt tctctaactt gtaggaatga 540 attcagatat ttccagagaa tgaaaaaaaa tcttcagtag aaggtaatgt acaggggtcc 600 ggccttttca tttggcgccg gtgagagcac acccttgtga cctgtttacg gataatgccg 660 ccgcagggag tacattacgc accattctaa agaataacag tgataatttc tgggttaagg 720 caatagcaat atttctgcat ataaatattt ctgcatataa attgtaactg atgtaagagg 780 tttcatattg ctaatagcag ctacaatcca gctaccattc tgcttttatt ttatggttgg 840 gataaggctg gattattctg agtccaagct aggccctttt gctaatcatg ttcatacctc 900 ttatcttcct cccacagcta cgtccaggag cgcaccatct tcttcaagga cgacggcaac 960 tacaagaccc gcgccgaggt gaagttcgag ggcgacaccc tggtgaaccg catcgagctg 1020 aagggcatcg acttcaagga ggacggcaac atcctggggc acaagctgga gtacaactac 1080 aacagccaca acgtctatat catggccgac aagcagaaga acggcatcaa ggtgaacttc 1140 aagatccgcc acaacatcga ggacggcagc gtgcagctcg ccgaccacta ccagcagaac 1200 acccccatcg gcgacggccc cgtgctgctg cccgacaacc actacctgag cacccagtcc 1260 gccctgagca aagaccccaa cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc 1320 gccgccggga tcactctcgg catggacgag ctgtacaagt aa 1362 <210> 89 <211> 1055 <212> DNA <213> Artificial Sequence <220> <223> Epo-Con1 <400> 89 atgggggtgc ccgaacgtcc caccctgctg cttttactct ccttgctact gattcctctg 60 ggcctcccag tcctctgtgc tcccccacgc ctcatctgcg acagtcgagt tctggagagg 120 tacatcttag aggccaagga ggcagaaaat gtcacgatgg gttgtgcaga aggtcccaga 180 ctgagtgaaa atattacagt cccagatacc aaagtcaact tctatgcttg gaaaagaatg 240 gaggtggaag aacaggccat agaagtttgg caaggcctgt ccctgctctc agaagccatc 300 ctgcagggtg agtctatggg acccttgatg ttttctttcc ccttcttttc tatggttaag 360 ttcatgtcat aggaagggga gaagtaacag ggtacacata ttgaccaaat cagggtaatt 420 ttgcatttgt aattttaaaa aatgctttct tcttttaata tacttttttg tttatcttat 480 ttctaatact ttccctaatc tctttctttc agggcaataa tgatacaatg tatcatgcct 540 ctttgcacca ttctaaagaa taacagtgat aatttctggg ttaaggcaat agcaatattt 600 ctgcatataa atatttctgc atataaattg taactgatgt aagaggtttc atattgctaa 660 tagcagctac aatccagcta ccattctgct tttattttat ggttgggata aggctggatt 720 attctgagtc caagctaggc ccttttgcta atcatgttca tacctcttat cttcctccca 780 cagcccaggc cctgctagcc aattcctccc agccaccaga gacccttcag cttcatatag 840 acaaagccat cagtggtcta cgtagcctca cttcactgct tcgggtactg ggagctcaga 900 aggaattgat gtcgcctcca gataccaccc cacctgctcc actccgaaca ctcacagtgg 960 atactttctg caagctcttc cgggtctacg ccaacttcct ccgggggaaa ctgaagctgt 1020 acacgggaga ggtctgcagg agaggggaca ggtga 1055 <210> 90 <211> 2129 <212> DNA <213> Artificial Sequence <220> <223> luci-Con1 <400> 90 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840 aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960 aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag ggtgagtcta 1020 tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 1080 gggagaagta acagggtaca catattgacc aaatcagggt aattttgcat ttgtaatttt 1140 aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct 1200 aatctctttc tttcagggca ataatgatac aatgtatcat gcctctttgc accattctaa 1260 agaataacag tgataatttc tgggttaagg caatagcaat atttctgcat ataaatattt 1320 ctgcatataa attgtaactg atgtaagagg tttcatattg ctaatagcag ctacaatcca 1380 gctaccattc tgcttttatt ttatggttgg gataaggctg gattattctg agtccaagct 1440 aggccctttt gctaatcatg ttcatacctc ttatcttcct cccacagcaa ggatatgggc 1500 tcactgagac tacatcagct attctgatta cacccgaggg ggatgataaa ccgggcgcgg 1560 tcggtaaagt tgttccattt tttgaagcga aggttgtgga tctggatacc gggaaaacgc 1620 tgggcgttaa tcaaagaggc gaactgtgtg tgagaggtcc tatgattatg tccggttatg 1680 taaacaatcc ggaagcgacc aacgccttga ttgacaagga tggatggcta cattctggag 1740 acatagctta ctgggacgaa gacgaacact tcttcatcgt tgaccgcctg aagtctctga 1800 ttaagtacaa aggctatcag gtggctcccg ctgaattgga atccatcttg ctccaacacc 1860 ccaacatctt cgacgcaggt gtcgcaggtc ttcccgacga tgacgccggt gaacttcccg 1920 ccgccgttgt tgttttggag cacggaaaga cgatgacgga aaaagagatc gtggattacg 1980 tcgccagtca agtaacaacc gcgaaaaagt tgcgcggagg agttgtgttt gtggacgaag 2040 taccgaaagg tcttaccgga aaactcgacg caagaaaaat cagagagatc ctcataaagg 2100 ccaagaaggg cggaaagatc gccgtgtaa 2129 <210> 91 <211> 2295 <212> DNA <213> Artificial Sequence <220> <223> luci-3H4 <400> 91 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840 aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960 aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag ggtgagtcta 1020 tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 1080 gggagaagta acagggtaca catattgacc aaatcagggt aattttgcat ttgtaatttt 1140 aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct 1200 aatctctttc tttcagggca ataatgatac aatgtatcat gccgagtaac gctgtttctc 1260 taacttgtag gaatgaattc agatatttcc agagaatgaa aaaaaatctt cagtagaagg 1320 taatgtacag gggtccggcc ttttcatttg gcgccggtga gagcacaccc tttgaacctg 1380 ttcacggata atgccgctgc agggagtaca ttacgcacca ttctaaagaa taacagtgat 1440 aatttctggg ttaaggcaat agcaatattt ctgcatataa atatttctgc atataaattg 1500 taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta ccattctgct 1560 tttattttat ggttgggata aggctggatt attctgagtc caagctaggc ccttttgcta 1620 atcatgttca tacctcttat cttcctccca cagcaaggat atgggctcac tgagactaca 1680 tcagctattc tgattacacc cgagggggat gataaaccgg gcgcggtcgg taaagttgtt 1740 ccattttttg aagcgaaggt tgtggatctg gataccggga aaacgctggg cgttaatcaa 1800 agaggcgaac tgtgtgtgag aggtcctatg attatgtccg gttatgtaaa caatccggaa 1860 gcgaccaacg ccttgattga caaggatgga tggctacatt ctggagacat agcttactgg 1920 gacgaagacg aacacttctt catcgttgac cgcctgaagt ctctgattaa gtacaaaggc 1980 tatcaggtgg ctcccgctga attggaatcc atcttgctcc aacaccccaa catcttcgac 2040 gcaggtgtcg caggtcttcc cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt 2100 ttggagcacg gaaagacgat gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta 2160 acaaccgcga aaaagttgcg cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt 2220 accggaaaac tcgacgcaag aaaaatcaga gagatcctca taaaggccaa gaagggcgga 2280 aagatcgccg tgtaa 2295 <210> 92 <211> 2295 <212> DNA <213> Artificial Sequence <220> <223> luci-6B4 <400> 92 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840 aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960 aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag ggtgagtcta 1020 tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 1080 gggagaagta acagggtaca catattgacc aaatcagggt aattttgcat ttgtaatttt 1140 aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct 1200 aatctctttc tttcagggca ataatgatac aatgtatcat gccgagtaac gctgtttctc 1260 taacttgtag gaatgaattc agatatttcc agagaatgaa aaaaaatctt cagtagaagg 1320 taatgtacag gggtccggcc ttttcatttg gcgccggtga gagcacaccc ttgtgacctg 1380 tttacggata atgccgccgc agggagtaca ttacgcacca ttctaaagaa taacagtgat 1440 aatttctggg ttaaggcaat agcaatattt ctgcatataa atatttctgc atataaattg 1500 taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta ccattctgct 1560 tttattttat ggttgggata aggctggatt attctgagtc caagctaggc ccttttgcta 1620 atcatgttca tacctcttat cttcctccca cagcaaggat atgggctcac tgagactaca 1680 tcagctattc tgattacacc cgagggggat gataaaccgg gcgcggtcgg taaagttgtt 1740 ccattttttg aagcgaaggt tgtggatctg gataccggga aaacgctggg cgttaatcaa 1800 agaggcgaac tgtgtgtgag aggtcctatg attatgtccg gttatgtaaa caatccggaa 1860 gcgaccaacg ccttgattga caaggatgga tggctacatt ctggagacat agcttactgg 1920 gacgaagacg aacacttctt catcgttgac cgcctgaagt ctctgattaa gtacaaaggc 1980 tatcaggtgg ctcccgctga attggaatcc atcttgctcc aacaccccaa catcttcgac 2040 gcaggtgtcg caggtcttcc cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt 2100 ttggagcacg gaaagacgat gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta 2160 acaaccgcga aaaagttgcg cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt 2220 accggaaaac tcgacgcaag aaaaatcaga gagatcctca taaaggccaa gaagggcgga 2280 aagatcgccg tgtaa 2295 <210> 93 <211> 2295 <212> DNA <213> Artificial Sequence <220> <223> Luci-15D10 <400> 93 atggaagacg ccaaaaacat aaagaaaggc ccggcgccat tctatccgct ggaagatgga 60 accgctggag agcaactgca taaggctatg aagagatacg ccctggttcc tggaacaatt 120 gcttttacag atgcacatat cgaggtggac atcacttacg ctgagtactt cgaaatgtcc 180 gttcggttgg cagaagctat gaaacgatat gggctgaata caaatcacag aatcgtcgta 240 tgcagtgaaa actctcttca attctttatg ccggtgttgg gcgcgttatt tatcggagtt 300 gcagttgcgc ccgcgaacga catttataat gaacgtgaat tgctcaacag tatgggcatt 360 tcgcagccta ccgtggtgtt cgtttccaaa aaggggttgc aaaaaatttt gaacgtgcaa 420 aaaaagctcc caatcatcca aaaaattatt atcatggatt ctaaaacgga ttaccaggga 480 tttcagtcga tgtacacgtt cgtcacatct catctacctc ccggttttaa tgaatacgat 540 tttgtgccag agtccttcga tagggacaag acaattgcac tgatcatgaa ctcctctgga 600 tctactggtc tgcctaaagg tgtcgctctg cctcatagaa ctgcctgcgt gagattctcg 660 catgccagag atcctatttt tggcaatcaa atcattccgg atactgcgat tttaagtgtt 720 gttccattcc atcacggttt tggaatgttt actacactcg gatatttgat atgtggattt 780 cgagtcgtct taatgtatag atttgaagaa gagctgtttc tgaggagcct tcaggattac 840 aagattcaaa gtgcgctgct ggtgccaacc ctattctcct tcttcgccaa aagcactctg 900 attgacaaat acgatttatc taatttacac gaaattgctt ctggtggcgc tcccctctct 960 aaggaagtcg gggaagcggt tgccaagagg ttccatctgc caggtatcag ggtgagtcta 1020 tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 1080 gggagaagta acagggtaca catattgacc aaatcagggt aattttgcat ttgtaatttt 1140 aaaaaatgct ttcttctttt aatatacttt tttgtttatc ttatttctaa tactttccct 1200 aatctctttc tttcagggca ataatgatac aatgtatcat gccgagtaac gctgtttctc 1260 taacttgtag gaatgaattc agatatttcc agagaatgaa aaaaaatctt cagtagaagg 1320 taatgtacag gggtccggcc ttttcatttg gcaccggtga gaacataccc ttcggacctg 1380 ttcacggata atgccgctgc agggagtaca ttacgcacca ttctaaagaa taacagtgat 1440 aatttctggg ttaaggcaat agcaatattt ctgcatataa atatttctgc atataaattg 1500 taactgatgt aagaggtttc atattgctaa tagcagctac aatccagcta ccattctgct 1560 tttattttat ggttgggata aggctggatt attctgagtc caagctaggc ccttttgcta 1620 atcatgttca tacctcttat cttcctccca cagcaaggat atgggctcac tgagactaca 1680 tcagctattc tgattacacc cgagggggat gataaaccgg gcgcggtcgg taaagttgtt 1740 ccattttttg aagcgaaggt tgtggatctg gataccggga aaacgctggg cgttaatcaa 1800 agaggcgaac tgtgtgtgag aggtcctatg attatgtccg gttatgtaaa caatccggaa 1860 gcgaccaacg ccttgattga caaggatgga tggctacatt ctggagacat agcttactgg 1920 gacgaagacg aacacttctt catcgttgac cgcctgaagt ctctgattaa gtacaaaggc 1980 tatcaggtgg ctcccgctga attggaatcc atcttgctcc aacaccccaa catcttcgac 2040 gcaggtgtcg caggtcttcc cgacgatgac gccggtgaac ttcccgccgc cgttgttgtt 2100 ttggagcacg gaaagacgat gacggaaaaa gagatcgtgg attacgtcgc cagtcaagta 2160 acaaccgcga aaaagttgcg cggaggagtt gtgtttgtgg acgaagtacc gaaaggtctt 2220 accggaaaac tcgacgcaag aaaaatcaga gagatcctca taaaggccaa gaagggcgga 2280 aagatcgccg tgtaa 2295 <210> 94 <211> 104 <212> RNA <213> Artificial Sequence <220> <223> thiC aptamer with stem <400> 94 guaauguguc ggagugccuu agggauuauu ccccuaaagc ugagaccgca uugcgggauc 60 cguugaaccu gaucaggcua auaccugcga agggaacaca uuac 104 <210> 95 <211> 88 <212> RNA <213> Artificial Sequence <220> <223> thiM aptamer with stem <400> 95 guaaugucuc ggggugcccu ucugcgugaa ggcugagaaa uacccguauc accugaucug 60 gauaaugcca gcguagggaa gacauuac 88 <210> 96 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> thiC aptamer encoding sequence <400> 96 gtcggagtgc cttagggatt attcccctaa agctgagacc gcattgcggg atccgttgaa 60 cctgatcagg ctaatacctg cgaagggaac 90 <210> 97 <211> 74 <212> DNA <213> Artificial Sequence <220> <223> thiM aptamer encoding sequence <400> 97 ctcggggtgc ccttctgcgt gaaggctgag aaatacccgt atcacctgat ctggataatg 60 ccagcgtagg gaag 74 <210> 98 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> modified DHFR exon 2 <400> 98 gaatgaattc agatatttcc agagaatgaa aaaaaatctt cagtagaag 49

Claims

표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트로서, 폴리뉴클레오티드 카세트는 압타머를 암호화하는 서열을 포함하고, 압타머 암호화 서열은
ACX₁GGGGTCCGGCX₂TX₃TTCATTTGGCX₄CCGGTGAGAX₅X₆AX₇ACCCTTX₈X₉X₁₀X₁₁CCTGTTX₁₂ACGGATAATGCCGCX₁₃GCAGGGAGT (서열 ID 번호:1)를 포함하고, 여기서:
X₁은 A 또는 G이고;
X₂는 C이거나 뉴클레오티드가 없고;
X₃은 T이거나 뉴클레오티드가 없고;
X₄는 A 또는 G이고;
X₅는 임의의 뉴클레오티드이고;
X₆은 임의의 뉴클레오티드이고;
X₇은 임의의 뉴클레오티드이고;
X₈은 임의의 뉴클레오티드이고;
X₉는 C, G 또는 T이고;
X₁₀은 임의의 뉴클레오티드이고;
X₁₁은 A 또는 T이고;
X₁₂는 C 또는 T이고;
X₁₃은 C 또는 T인,
폴리뉴클레오티드 카세트.
표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트로서, 폴리뉴클레오티드 카세트는 압타머를 암호화하는 서열을 포함하고, 압타머 암호화 서열은
ACX₁GGGGTCCGGCX₂TX₃TTCATTTGGCGCCGGTGAGAX₅X₆AX₇ACCCTTX₈X₉X₁₀X₁₁CCTGTTX₁₂ACGGATAATGCCGCX₁₃GCAGGGAGT (서열 ID 번호:2)를 포함하고, 여기서:
X₁은 A 또는 G이고;
X₂는 C이거나 뉴클레오티드가 없고;
X₃은 T이거나 뉴클레오티드가 없고;
X₅는 G 또는 T이고;
X₆은 C 또는 T이고;
X₇은 C 또는 T이고;
X₈은 임의의 뉴클레오티드이고;
X₉는 G 또는 T이고;
X₁₀은 A, G 또는 T이고;
X₁₁은 A 또는 T이고;
X₁₂는 C 또는 T이고;
X₁₃은 C 또는 T인,
폴리뉴클레오티드 카세트.
표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트로서, 폴리뉴클레오티드 카세트는 압타머를 암호화하는 서열을 포함하고, 압타머 암호화 서열은
ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTTGAACCTGTTX₁₂ACGGATAATGCCGCX₁₃GCAGGGAGT (서열 ID 번호:3)를 포함하고, 여기서:
X₁₂는 C 또는 T이고;
X₁₃은 C 또는 T인,
폴리뉴클레오티드 카세트.
표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트로서, 폴리뉴클레오티드 카세트는 압타머를 암호화하는 서열을 포함하고, 압타머 암호화 서열은
ACX₁GGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTX₈X₉X₁₀X₁₁CCTGTTTACGGATAATGCCGCCGCAGGGAGT (서열 ID 번호:4)를 포함하고, 여기서,
X₁은 A 또는 G이고;
X₈은 임의의 뉴클레오티드이고;
X₉는 G 또는 T이고;
X₁₀은 A, G 또는 T이고;
X₁₁은 A 또는 T인,
폴리뉴클레오티드 카세트.
표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트로서, 폴리뉴클레오티드 카세트는 압타머를 암호화하는 서열을 포함하고, 압타머 암호화 서열은
ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAX₅X₆AX₇ACCCTTTGAACCTGTTTACGGATAATGCCGCCGCAGGGAGT (서열 ID 번호:5)를 포함하고, 여기서:
X₅는 G 또는 T이고;
X₆은 C 또는 T이고;
X₇은 C 또는 T인,
폴리뉴클레오티드 카세트.
표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트로서, 폴리뉴클레오티드 카세트는 압타머를 암호화하는 서열을 포함하고, 압타머 암호화 서열은
ACAGGGGTCCGGCCTTTTCATTTGGCX₄CCGGTGAGAX₅X₆AX₇ACCCTTX₈X₉X₁₀ACCTGTTCACGGATAATGCCGCTGCAGGGAGT (서열 ID 번호:6)를 포함하고, 여기서:
X₄는 A 또는 G이고;
X₅는 임의의 뉴클레오티드이고;
X₆은 임의의 뉴클레오티드이고;
X₇은 임의의 뉴클레오티드이고;
X₈은 임의의 뉴클레오티드이고;
X₉는 C 또는 G이고;
X₁₀은 임의의 뉴클레오티드인,
폴리뉴클레오티드 카세트.
표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트로서, 폴리뉴클레오티드 카세트는 압타머를 암호화하는 서열을 포함하고, 압타머 암호화 서열은 서열 ID 번호:7 내지 36으로 구성된 그룹에서 선택된 서열인, 폴리뉴클레오티드 카세트.
제7항에 있어서,
압타머 암호화 서열은 서열 ID 번호: 8, 9, 14 내지 18, 21, 25, 26 및 30으로 이루어진 그룹에서 선택되는, 폴리뉴클레오티드 카세트.
제8항에 있어서,
압타머 암호화 서열은 서열 ID 번호: 9, 14 및 26으로 이루어진 그룹에서 선택된 서열을 포함하는, 폴리뉴클레오티드 카세트.
압타머를 암호화하는 핵산으로서, 여기서 압타머 암호화 서열은
ACX₁GGGGTCCGGCX₂TX₃TTCATTTGGCX₄CCGGTGAGAX₅X₆AX₇ACCCTTX₈X₉X₁₀X₁₁CCTGTTX₁₂ACGGATAATGCCGCX₁₃GCAGGGAGT (서열 ID 번호:1)를 포함하고, 여기서:
X₁은 A 또는 G이고;
X₂는 C이거나 뉴클레오티드가 없고;
X₃은 T이거나 뉴클레오티드가 없고;
X₄는 A 또는 G이고;
X₅는 임의의 뉴클레오티드이고;
X₆은 임의의 뉴클레오티드이고;
X₇은 임의의 뉴클레오티드이고;
X₈은 임의의 뉴클레오티드이고;
X₉는 C, G 또는 T이고;
X₁₀은 임의의 뉴클레오티드이고;
X₁₁은 A 또는 T이고;
X₁₂는 C 또는 T이고;
X₁₃은 C 또는 T인,
핵산.
제10항에 있어서,
압타머 암호화 서열은 하기의 속성들: X₁은 A가 아님; X₂는 C가 아님; X₃은 T가 아님; X₄는 G가 아님; X₅는 G가 아님; X₆은 C가 아님; X₇은 C가 아님; X₈은 T가 아님; X₉는 G가 아님; X₁₀은 A가 아님; X₁₁은 A가 아님; X₁₂는 T가 아님; 및 X₁₃은 C가 아님 중 하나 이상을 갖는, 핵산.
제10항에 있어서,
하기 모두: X₁은 A임; X₂는 C임; X₃은 T임; X₄는 G임; X₅는 G임; X₆은 C임; X₇은 C임; X₈은 T임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂은 T임; 및 X₁₃은 C임은 압타머 암호화 서열에서 동시에 존재하지 않는, 핵산.
압타머를 암호화하는 핵산으로서, 여기서 압타머 암호화 서열은
ACX₁GGGGTCCGGCX₂TX₃TTCATTTGGCGCCGGTGAGAX₅X₆AX₇ACCCTTX₈X₉X₁₀X₁₁CCTGTTX₁₂ACGGATAATGCCGCX₁₃GCAGGGAGT (서열 ID 번호:2)를 포함하고, 여기서:
X₁은 A 또는 G이고;
X₂는 C이거나 뉴클레오티드가 없고;
X₃은 T이거나 뉴클레오티드가 없고;
X₅는 G 또는 T이고;
X₆은 C 또는 T이고;
X₇은 C 또는 T이고;
X₈은 임의의 뉴클레오티드이고;
X₉는 G 또는 T이고;
X₁₀은 A, G 또는 T이고;
X₁₁은 A 또는 T이고;
X₁₂는 C 또는 T이고;
X₁₃은 C 또는 T인,
핵산.
제13항에 있어서,
압타머 암호화 서열은 하기의 속성들: X₁은 A가 아님; X₂는 C가 아님; X₃은 T가 아님; X₅는 G가 아님; X₆은 C가 아님; X₇은 C가 아님; X₈은 T가 아님; X₉는 G가 아님; X₁₀은 A가 아님; X₁₁은 A가 아님; X₁₂는 T가 아님; 및 X₁₃은 C가 아님 중 하나 이상을 갖는, 핵산.
제13항에 있어서,
하기 모두: X₁은 A임; X₂는 C임; X₃은 T임; X₅는 G임; X₆은 C임; X₇은 C임; X₈은 T임; X₉는 G임; X₁₀은 A임; X₁₁은 A임; X₁₂는 T임; 및 X₁₃은 C임은 압타머 암호화 서열에서 동시에 존재하지 않는, 핵산.
압타머를 암호화하는 핵산으로서, 여기서 압타머 암호화 서열은
ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTTGAACCTGTTX₁₂ACGGATAATGCCGCX₁₃GCAGGGAGT (서열 ID 번호:3)를 포함하고, 여기서:
X₁₂는 C 또는 T이고;
X₁₃은 C 또는 T인,
핵산.
제16항에 있어서,
압타머 암호화 서열은 하기 특성: X₁₂는 T가 아님; 및 X₁₃은 C가 아님 중 하나 이상을 갖는, 핵산.
제16항에 있어서,
하기 모두: X₁₂는 T임 및 X₁₃은 C임은 압타머 암호화 서열에서 동시에 존재하지 않는, 핵산.
압타머를 암호화하는 핵산으로서, 여기서 압타머 암호화 서열은
ACX₁GGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAGCACACCCTTX₈X₉X₁₀X₁₁CCTGTTTACGGATAATGCCGCCGCAGGGAGT (서열 ID 번호:4)를 포함하고, 여기서:
X₁은 A 또는 G이고;
X₈은 임의의 뉴클레오티드이고;
X₉는 G 또는 T이고;
X₁₀은 A, G 또는 T이고;
X₁₁은 A 또는 T인,
핵산.
제19항에 있어서,
압타머 암호화 서열은 하기의 특성들: X₁는 A가 아님; X₈은 T가 아님; X₉는 G가 아님; X₁₀은 A가 아님; 및 X₁₁은 A가 아님 중 하나 이상을 갖는, 핵산.
제19항에 있어서,
하기 모두: X₁은 A임; X₈은 T임; X₉는 G임; X₁₀은 A임; 및 X₁₁은 A임은 압타머 암호화 서열에서 동시에 존재하지 않는, 핵산.
압타머를 암호화하는 핵산으로서, 여기서 압타머 암호화 서열은
ACAGGGGTCCGGCCTTTTCATTTGGCGCCGGTGAGAX₅X₆AX₇ACCCTTTGAACCTGTTTACGGATAATGCCGCCGCAGGGAGT (서열 ID 번호:5)를 포함하고, 여기서:
X₅는 G 또는 T이고;
X₆은 C 또는 T이고;
X₇은 C 또는 T인,
핵산.
제22항에 있어서,
압타머 암호화 서열은 하기 특성: X₅는 G가 아님; X₆은 C가 아님; 및 X₇은 C가 아님 중 하나 이상을 갖는, 핵산.
제22항에 있어서,
하기 모두: X₅는 G임; X₆은 C임; 및 X₇은 C임은 압타머 암호화 서열에서 동시에 존재하지 않는, 핵산.
압타머를 암호화하는 핵산으로서, 여기서 압타머 암호화 서열은
ACAGGGGTCCGGCCTTTTCATTTGGCX₄CCGGTGAGAX₅X₆AX₇ACCCTTX₈X₉X₁₀ACCTGTTCACGGATAATGCCGCTGCAGGGAGT (서열 ID 번호:6)를 포함하고, 여기서:
X₄는 A 또는 G이고;
X₅는 임의의 뉴클레오티드이고;
X₆은 임의의 뉴클레오티드이고;
X₇은 임의의 뉴클레오티드이고;
X₈은 임의의 뉴클레오티드이고;
X₉는 C 또는 G이고;
X₁₀는 임의의 뉴클레오티드인,
핵산.
압타머를 암호화하는 핵산으로서, 압타머 암호화 서열은 서열 ID 번호: 7 내지 36으로 이루어진 그룹으로부터 선택된 서열인, 핵산.
제26항에 있어서,
압타머 암호화 서열은 서열 ID 번호:8, 9, 14 내지 18, 21, 25, 26 및 30으로 이루어진 그룹으로부터 선택되는, 핵산.
제27항에 있어서,
압타머 암호화 서열은 서열 ID 번호: 9, 14 및 26으로 이루어진 그룹에서 선택된 서열을 포함하는, 핵산.
제1항 내지 제9항 중 어느 한 항에 있어서,
압타머는 하기 중 어느 하나에 따른 구조를 갖는 소분자에 결합하고, 상기 어느 하나는:
a) 화학식 I:

상기 식 중:
R¹은 OH, 아미노, F, Cl, Br, 포스페이트, 피로포스페이트,
-O-C(=O)-C₁-C₆ 알킬, -O-C(=O)-C₂-C₆ 알케닐, -O-C(=O)-페닐,
-O-C(=O)-헤테로시클, -O-C(=O)-O-C₁-C₆ 알킬, -O-C(=O)-O-C₂-C₆ 알케닐,
-O-C(=O)-O-페닐 및 -O-C(=O)-O-헤테로시클로 이루어진 그룹으로부터 선택되고;
b) 화학식 II:

상기 식 중:
R²는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, -(CH₂) _n -R⁶,
-C(=O)-R⁴, -C(=O)-O-R⁴, -CHR⁵-O-C(=O)-R⁴, -S-C₁-C₆ 알킬, -S-C₂-C₆ 알케닐,
-S-헤테로시클 및 -S-CH₂-헤테로시클로 이루어진 그룹으로부터 선택되거나, R²는 화합물이 디설파이드(-S-S-) 결합을 통해 연결된 화학식 II의 두 분자의 이량체를 형성하도록 하는 -S-[화학식 II]이고;
R³은 OH, 아미노, F, Cl, Br, 포스페이트, 피로포스페이트,
-O-C(=O)-C₁-C₆ 알킬, -O-C(=O)-C₁-C₆ 알케닐, -O-C(=O)-페닐,
-O-C(=O)-헤테로시클, -O-C(=O)-O-C₁-C₆ 알킬, -O-C(=O)-O-C₁-C₆ 알케닐,
-O-C(=O)-O-페닐, 및 -O-C(=O)-O-헤테로시클로 이루어진 그룹으로부터 선택되고;
R⁴는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₉-C₁₄ 트리시클릴, -(C₁-C₆ 알킬)-아릴, -(C₂-C₆ 알케닐)-아릴, 아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택되고;
R⁵는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, 아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택되고;
R⁶은 히드록실, 아미노, 아미도, C₁-C₆ 알콕시, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, 아릴, 헤테로아릴 및 헤테로시클릴이고;
n은 1 내지 8이며;
여기서, 각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 트리시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-( C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 군으로부터 선택된 1 내지 3개의 치환기로 치환될 수 있고;
c) 화학식 III:

상기 식 중:
R²는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, -(CH₂) _n -R⁶,
-C(=O)-R⁴, -C(=O)-O-R⁴, -CHR⁵-O-C(=O)-R⁴, -S-C₁-C₆ 알킬, -S-C₂-C₆ 알케닐,
-S-헤테로시클 및 -S-CH₂-헤테로시클로 이루어진 그룹으로부터 선택되고;
R³¹은 OH 및 포스페이트로 이루어진 그룹으로부터 선택되고;
R⁴ 는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₉-C₁₄ 트리시클릴, -(C₁-C₆ 알킬)-아릴, -(C₂-C₆ 알케닐)-아릴, 아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택되고;
R⁵는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, 아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택되고;
R⁶은 히드록실, 아미노, 아미도, C₁-C₆ 알콕시, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, 아릴, 헤테로아릴 및 헤테로시클릴이고;
n은 1 내지 8이며;
여기서, 각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 트리시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-( C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 군으로부터 선택된 1 내지 3개의 치환기로 치환될 수 있고;
d) 화학식 IV:

상기 식 중:
R⁴는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₉-C₁₄ 트리시클릴, -(C₁-C₆ 알킬)-아릴, -(C₂-C₆ 알케닐)-아릴, 아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택되고;
R⁵는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, 아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택되고;
여기서, 각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 트리시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-( C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 군으로부터 선택된 1 내지 3개의 치환기로 치환될 수 있고;
e) 화학식 V:

상기 식 중:
R⁴는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₉-C₁₄ 트리시클릴, -(C₁-C₆ 알킬)-아릴, -(C₂-C₆ 알케닐)-아릴, 아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택되고;
여기서, 각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 트리시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-( C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 군으로부터 선택된 1 내지 3개의 치환기로 치환될 수 있고;
f) 화학식 VI:

상기 식 중:
R⁴는 H, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₉-C₁₄ 트리시클릴, -(C₁-C₆ 알킬)-아릴, -(C₂-C₆ 알케닐)-아릴, 아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 그룹으로부터 선택되고;
여기서, 각각의 알킬, 알케닐, 시클로알킬, 비시클릴, 트리시클릴, 아릴, 헤테로아릴 및 헤테로시클릴기는 비치환되거나 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-( C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로 이루어진 군으로부터 선택된 1 내지 3개의 치환기로 치환될 수 있고;
g) 화학식 VII

상기 식 중:
각각의 R⁷은, 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬) , -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-( C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, - S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 개별적으로 선택되거나, 2개의 인접한 R⁷ 그룹은 함께 취해져서 0 내지 2개의 고리 헤테로원자를 함유하고 비치환되거나 또는 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁- C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 선택된 최대 4개의 치환기로 치환된, 융합된 5원 또는 6원 방향족 또는 비방향족 고리를 형성할 수 있고;
m은 0, 1, 2, 3 또는 4이고;
h) 화학식 VIII

상기 식 중:
각각의 R⁸은, 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬) , -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, - S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 독립적으로 선택되거나, 2개의 인접한 R⁸ 그룹은 함께 취해져서 0 내지 2개의 고리 헤테로원자를 함유하고 비치환되거나 또는 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁- C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 선택된 최대 4개의 치환기로 치환된, 융합된 5원 또는 6원 방향족 또는 비방향족 고리를 형성할 수 있고;
각각의 R⁹는, 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁-C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬) , -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, - S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 독립적으로 선택되거나, 2개의 인접한 R⁹ 그룹은 함께 취해져서 0 내지 2개의 고리 헤테로원자를 함유하고 비치환되거나 또는 할로겐, 히드록실, 아미노, 시아노, 아미도, 술폰아미드, 니트로, -SH, C₁-C₆ 알킬, C₂-C₆ 알케닐, C₃-C₇ 시클로알킬, C₆-C₁₀ 비시클릴, C₁- C₆ 할로알킬, C₁-C₆ 퍼할로알킬, -O-(C₁-C₆ 알킬), O-(C₃-C₇ 시클로알킬), -O-(C₁-C₆ 할로알킬), -O-(C₁-C₆ 퍼할로알킬), 아릴, -O-아릴, -(C₁-C₆ 알킬)-아릴, -O-(C₁-C₆ 알킬)-아릴, -S-(C₁-C₆ 알킬), -S-(C₃-C₇ 시클로알킬), -S-(C₁-C₆ 할로알킬), -S-(C₁-C₆ 퍼할로알킬), -S-아릴, -S-(C₁-C₆ 알킬)-아릴, 헤테로아릴 및 헤테로시클릴로부터 선택된 최대 4개의 치환기로 치환된, 융합된 5원 또는 6원 방향족 또는 비방향족 고리를 형성할 수 있고;
x는 0, 1, 2 또는 3이고;
y는 0, 1, 2, 3 또는 4인,
폴리뉴클레오티드 카세트.
제1항 내지 제9항 중 어느 한 항에 있어서,
압타머는 아세푸르티아민, 아세티아민, 알리티아민, 암프롤륨, 베클로티아민, 벤포티아민, 벤티아민, 비스벤티아민, 세토티아민, 시클로티아민, 퍼술티아민, 모노포스포티아민, 옥토티아민, 옥시티아민, 프로술티아민, 술부티아민, 티아민, 티아민 피로포스페이트 및 빈티아몰로 이루어진 그룹으로부터 선택된 소분자에 결합하는, 폴리뉴클레오티드 카세트.
제30항에 있어서,
압타머는 벤포티아민, 퍼술티아민 및 프로술티아민으로 이루어진 그룹으로부터 선택된 소분자에 결합하는, 폴리뉴클레오티드 카세트.
제1항 내지 제9항 중 어느 한 항에 있어서,
압타머는 등몰량의 퍼술티아민, 벤포티아민 또는 프로술티아민에 비해 티아민 피로포스페이트(TPP)에 대한 감소된 결합을 갖거나 감소된 반응을 나타내는, 폴리뉴클레오티드 카세트.
제32항에 있어서,
압타머는 표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트의 일부로서 암호화된 리보스위치에 포함되는, 폴리뉴클레오티드 카세트.
표적 유전자 발현을 조절하기 위한 리보스위치로서, 제1항 내지 제28항 중 어느 한 항에 인용된 압타머를 포함하는, 리보스위치.
제34항에 있어서,
서열 ID 번호:37의 서열을 포함하는, 리보스위치.
표적 유전자의 발현을 조절하기 위한 폴리뉴클레오티드 카세트로서, 폴리뉴클레오티드 카세트는:
(a) 리보스위치; 및
(b) 5' 인트론 및 3' 인트론이 측면에 있는 대안적으로 스플라이싱된 엑손을 포함하고,
리보스위치는 (i) 3' 인트론의 5' 스플라이스 부위 서열을 포함하는 스템을 포함하는 효과기 영역 및 (ii) 제1항 내지 제28항 중 어느 한 항에 인용된 압타머를 포함하고;
대안적으로 스플라이싱된 엑손은, 대안적으로 스플라이싱된 엑손이 표적 유전자 mRNA로 스플라이싱될 때 표적 유전자와 인-프레임(in-frame)인 정지 코돈을 포함하는,
폴리뉴클레오티드 카세트.
제36항에 있어서,
리보스위치는 서열 ID 번호:37의 서열을 포함하는, 폴리뉴클레오티드 카세트.
제36항에 있어서,
표적 유전자의 단백질 암호화 서열에 위치되는, 폴리뉴클레오티드 카세트.
제36항에 있어서,
표적 유전자의 비번역 영역 또는 표적 유전자의 인트론에 위치되는, 폴리뉴클레오티드 카세트.
제1항 내지 제9항 중 어느 한 항의 폴리뉴클레오티드 카세트, 제10항 내지 제28항 중 어느 한 항의 핵산, 또는 제1항 내지 제28항 중 어느 한 항에 인용된 압타머를 포함하는, 표적 유전자 발현을 조절하기 위한 리보스위치를 포함하는, 벡터.
제40항에 있어서,
바이러스 벡터인, 벡터.
제41항에 있어서,
바이러스 벡터는 아데노바이러스 벡터, 아데노 관련 바이러스 벡터 및 렌티바이러스 벡터로 이루어진 그룹으로부터 선택되는, 벡터.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제