KR102628446B1 - 멀티플렉싱된 수용체-리간드 상호작용 스크린 - Google Patents

멀티플렉싱된 수용체-리간드 상호작용 스크린 Download PDF

Info

Publication number
KR102628446B1
KR102628446B1 KR1020207003519A KR20207003519A KR102628446B1 KR 102628446 B1 KR102628446 B1 KR 102628446B1 KR 1020207003519 A KR1020207003519 A KR 1020207003519A KR 20207003519 A KR20207003519 A KR 20207003519A KR 102628446 B1 KR102628446 B1 KR 102628446B1
Authority
KR
South Korea
Prior art keywords
delete delete
artificial sequence
dna
receptor
cells
Prior art date
Application number
KR1020207003519A
Other languages
English (en)
Other versions
KR20200024305A (ko
Inventor
스리람 코수리
에릭 존스
Original Assignee
더 리전츠 오브 더 유니버시티 오브 캘리포니아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 리전츠 오브 더 유니버시티 오브 캘리포니아 filed Critical 더 리전츠 오브 더 유니버시티 오브 캘리포니아
Publication of KR20200024305A publication Critical patent/KR20200024305A/ko
Application granted granted Critical
Publication of KR102628446B1 publication Critical patent/KR102628446B1/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
    • C12N2830/002Vector systems having a special element relevant for transcription controllable enhancer/promoter combination inducible enhancer/promoter combination, e.g. hypoxia, iron, transcription factor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 개시내용의 양태는 세포의 집단으로서, 각 세포는 i) 이종 수용체 유전자; ii) 수용체-반응 요소를 포함하는 유도성 리포터를 포함하며, 여기서, 리포터의 발현은 수용체 유전자에 의해 엔코딩된 수용체의 활성의 활성화에 의존적이며, 리포터는 이종 수용체 유전자에 고유한 인덱스 영역을 포함하는 바코드를 포함하며; 세포는 상이한 이종 수용체를 발현시키며, 각 단일 세포는 하나의 특정 이종 수용체의 하나 이상의 카피 및 하나의 특정 리포터의 하나 이상의 카피를 발현시키는, 세포의 집단에 관한 것이다.

Description

멀티플렉싱된 수용체-리간드 상호작용 스크린
관련 출원에 대한 상호 참고문헌
본 출원은 2017년 7월 5일에 출원된 미국가특허출원 제62/528,833호의 우선권의 이익을 주장하며, 이러한 문헌은 전문이 본원에 참고로 포함된다.
본 발명은 국립 과학 재단(National Science Foundation)에 의해 수여된 제1555952호에 따라 정부 지원으로 이루어졌다. 정부는 본 발명의 특정 권리를 갖는다.
본 개시내용은 의학 및 약물 발견의 분야에 관한 것이다.
G 단백질-결합 수용체(G protein-coupled receptor; GPCR)는 약물 타겟의 가장 중요한 부류 중 하나로서, 현재 시판되고 있는 약물의 대략 1/3은 GPCR을 통한 이의 효과를 갖는다. G 단백질-결합 수용체(GPCR)는 현 약물 타겟의 50 내지 60%를 나타낸다. 이러한 막 단백질의 패밀리(family)는 오늘날 약물 발견에서 중요한 역할을 한다. 전통적으로, GPCR을 기초로 한 다수의 약물은 심혈관, 대사, 신경퇴행성, 정신의학, 및 종양학적 질병으로 이러한 상이한 징후(indication)를 위해 개발되었다.
또한, 현재, 단일 검정 플랫폼에서 수천 및 심지어 수만개의 수용체의 효과적이고 효율적인 대규모 스크린을 허용하는 임의의 방법이 거의 존재하지 않는다. 본 기술 분야에서 수용체 및 리간드 상호작용 스크린의 개선이 상당히 요구되고 있다.
본 개시내용은 특정 수용체 활성화를 결정하기 위해 사용될 수 있는 핵산, 벡터, 세포, 바이러스 입자, 및 방법에 관한 것이다. 이에 따라, 특정 구체예는 i) 이종 수용체 유전자; 및 ii) 수용체-반응 요소(receptor-responsive element)를 포함하는 유도성 리포터를 포함하는 핵산으로서, 리포터의 발현은 수용체 유전자에 의해 엔코딩된 수용체의 활성의 활성화에 의존적이며, 리포터는 이종 수용체 유전자에 대해 독특하게 식별 가능한 인덱스 영역을 포함하는 바코드를 포함하는 핵산에 관한 것이다. 추가 양태는 본 개시내용의 핵산을 포함하는 벡터에 관한 것이다. 추가 양태는 이종 수용체 유전자를 포함하는 벡터에 관한 것이다. 폴리뉴클레오티드의 문맥에서, 용어 "이종"은 당해 분야에 공지되어 있거나 본원에 기술되어 있는 유전자 전달 방법에 의해 세포로 전달된 유전자 또는 폴리뉴클레오티드를 지칭하며; 이러한 세포의 자손세포는 또한, 외인성 유래 서열이 자손 세포(descendant cell)에 잔류하는 경우에, 이종 핵산 서열을 함유하는 것으로 지칭될 수 있다. 세포는 이종 수용체 유전자와 동일한 내인성 유전자를 이미 함유할 수 있거나, 세포에는 이종 유전자와 관련되거나 이와 동일한 임의의 내인성 유전자가 결여될 수 있다. 용어 "이종 세포" 또는 "숙주 세포"는 이종 핵산 서열을 의도적으로 함유한 세포를 지칭한다.
폴리뉴클레오티드에 적용될 때 용어 "엔코딩하다(encode)"는, 이의 고유 상태(native state)에서 또는 당업자에게 널리 공지된 방법에 의해 조작될 때, 폴리펩티드 및/또는 이의 단편에 대한 mRNA를 생성하기 위해 전사되고/거나 번역될 수 있는 경우에, 폴리펩티드를 "엔코딩한다"고 하는 폴리뉴클레오티드를 지칭한다. 안티센스 가닥은 이러한 핵산의 보체이며, 엔코딩 서열은 이로부터 추정될 수 있다.
일부 구체예에서, 벡터는 유도성 리포터를 추가로 포함하며; 여기서, 리포터의 발현은 수용체 유전자에 의해 엔코딩되는 수용체의 활성의 활성화에 의존적이며, 리포터는 이종 수용체 유전자에 고유한 인덱스 영역을 포함하는 바코드를 포함한다. 추가 양태는 바코드를 포함하는 유도성 리포터를 포함하는 벡터에 관한 것이다.
추가 양태는 세포의 집단에 관한 것으로서, 여기서, 각 세포는 i) 이종 수용체 유전자; ii) 수용체-반응 요소를 포함하는 유도성 리포터를 포함하며; 리포터의 발현은 수용체 유전자에 의해 엔코딩되는 수용체의 활성의 활성화에 의존적이며, 리포터는 이종 수용체 유전자에 고유한 인덱스 영역을 포함하는 바코드를 포함하며; 세포는 상이한 이종 수용체를 발현시키며, 각 단일 세포는 하나의 특정 이종 수용체의 하나 이상의 카피(copy) 및 하나의 특정 리포터의 하나 이상의 카피를 발현시킨다. 예를 들어, 세포의 집단은 적어도, 제1 수용체 유전자 및 제1 유도성 리포터를 갖는 제1 세포, 제2 수용체 유전자 및 제2 유도성 리포터를 갖는 제2 세포, 제3 수용체 유전자 및 유도성 리포터를 갖는 제3 세포, 제4 수용체 유전자 및 제4 유도성 리포터를 갖는 제4 세포, ... 및 제1000 수용체 유전자 및 제1000 유도성 리포터를 갖는 제10000 세포, .... 등을 포함할 수 있다. 세포의 집단은 세포를 포함할 수 있으며, 이들 각각은 단지 하나의 수용체, 및 동일한 세포에서 활성화되는 이종 수용체를 식별하기 위해 사용될 수 있는 인덱스 영역을 포함하는 바코드를 포함하는 관련된 유도성 리포터를 함유한다. 세포의 집단은 적어도 또는 최대 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4500, 5000, 6000, 7000, 8000, 9000, 104, 105, 106, 107, 108, 109, 또는 1010개의 세포(또는 그 안에서 임의의 도출 가능한 범위)를 포함할 수 있으며, 이는 상이한 수용체 유전자 및 이의 관련된 유도성 리포터의 수를 나타낸다. 또한, 일부 구체예에서, 유도성 리포터는 그러한 세포에서 발현된 이종 수용체 유전자를 독특하게 식별하는 발현된 핵산을 생성한다. 상이한 수용체 유전자는 한 부류의 수용체, 예를 들어, 후각 수용체, 호르몬 수용체, 아드레날린수용체, 약물-반응 수용체, 등에 속하는 수용체일 수 있다. 이에 따라, 세포의 집단은 하나 및 단지 하나의 수용체 유전자(이러한 것이 동일한 유전자의 다수의 카피로부터 발현될 수 있음에도 불구함) 및 하나 및 단지 하나의 관련된 유도성 리포터(유도성 리포터의 다수의 카피가 존재할 수 있음에도 불구함)를 발현시키는 세포를 포함할 수 있다. 일부 구체예에서, 세포 각각은 동일한 수용체 유전자의 하나의 변이체를 발현시킨다. 단일 스크린이 본원에서 논의된 다수의 세포/수용체를 포함할 수 있다는 것이 고려된다. 이는 다른 스크린과 스케일에 있어서 상이하며, 이는 본 개시내용에 의해 제공된 일부 구체예의 크기를 갖기 위해 스크린을 연속적으로 이용하는 것을 포함할 수 있다.
추가 구체예는 i) 이종 수용체 유전자; 및 ii) 수용체-반응 요소를 포함하는 유도성 리포터를 포함하는 세포로서, 리포터의 발현은 수용체 유전자에 의해 엔코딩된 수용체의 활성의 활성화에 의존적이며, 리포터는 이종 수용체 유전자에 고유한 인덱스 영역을 포함하는 바코드를 포함하는 세포에 관한 것이다. 일부 구체예에서, 이종 유전자의 발현은 "지속 가능한" 것으로서, 이는 이종 유전자의 발현이 후속 세포 이전에 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50 계대 배양 이상(또는 그 안에서 도출 가능한 임의의 범위)으로부터 또는 그러한 후속 세포 이전의 시점에 1, 2, 3, 4, 5, 6, 7일 및/또는 1, 2, 3, 4, 5주 및/또는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개월(또는 그 안에서 도출 가능한 임의의 범위)로부터의 세포의 발현 수준의 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100% 이내, 또는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100% 이내에 있는 수준으로 잔류함을 의미한다. 특정 구체예에서, 세포는 시험되는 수용체의 지속 가능한 발현을 나타낸다. 일부 구체예에서, 세포는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50 계대배양 이상(또는 그 안에서 도출 가능한 임의의 범위) 후에 최초 측정된 수준의 2배 내에 있는 수준으로 수용체를 발현시킨다.
일부 구체예에서, 수용체 유전자는 G-단백질 결합된 수용체(GPCR)에 대해 엔코딩한다. 일부 구체예에서, 리포터는 활성화된 수용체 단백질에 의해 신호 전달 시에 유도된다. 일부 구체예에서, 수용체 단백질의 활성화는 리간드에 대한 수용체의 결합을 포함한다. 일부 구체예에서, 수용체 유전자는 보조 폴리펩티드에 대해 엔코딩하는 하나 이상의 추가적인 폴리뉴클레오티드를 추가로 포함한다. 일부 구체예에서, 보조 폴리펩티드는 선택 가능한 또는 스크리닝 가능한 단백질을 포함한다. 일부 구체예에서, 보조 폴리펩티드는 단백질 또는 펩티드 태그를 포함한다. 일부 구체예에서, 보조 폴리펩티드는 전사 인자를 포함한다. 일부 구체예에서, 보조 폴리펩티드는 하나 이상의 트래피킹 태그를 포함한다. 일부 구체예에서, 보조 폴리펩티드는 2개의 트래피킹 태그를 포함한다. 일부 구체예에서, 보조 폴리펩티드는 적어도, 최대, 또는 정확하게, 1, 2, 3, 4, 또는 5개(또는 그 안에서 임의의 도출 가능한 범위)의 트래피킹 태그를 포함한다. 일부 구체예에서, 트래피킹 태그는 Lucy 및/또는 Rho 트래피킹 태그를 포함한다. 일부 구체예에서, 트래피킹 태그는 신호 펩티드를 포함한다. 일부 구체예에서, 신호 펩티드는 내인성 단백질에 의해 생체 내에서 절단된 절단 가능한 펩티드이다. 예시적인 보조 폴리펩티드는 본원에 기술되어 있다. 일부 구체예에서, 수용체 유전자는 수용체 유전자 및 보조 폴리펩티드를 포함하는 융합 단백질에 대해 엔코딩한다. 일부 구체예에서, 융합 단백질은 수용체 유전자와 보조 폴리펩티드 사이에 프로테아제 사이트를 포함한다.
일부 구체예에서, 리포터는 GPCR의 활성화 시에 신호 전달에 의해 유도된다. 일부 구체예에서, 수용체-반응 요소는 cAMP 반응 요소(CRE), 활성화된 T-세포 반응 요소의 핵 인자(NFAT-RE), 혈청 반응 요소(SRE), 및 혈청 반응 인자 반응 요소(SRF-RE) 중 하나 이상을 포함한다. 일부 구체예에서, 수용체-반응 요소는 보조 폴리펩티드 전사 인자에 의해 결합된 DNA 요소를 포함한다. 일부 구체예에서, 보조 폴리펩티드 전사 인자는 역 테트라사이클린-제어 트랜스활성제(rtTA)를 포함하며, 수용체-반응 요소는 테트라사이클린 반응 요소(TRE)를 포함한다.
일부 구체예에서, 수용체-반응 요소는 CRE를 포함한다. 일부 구체예에서, CRE는 tgacgtca(SEQ ID NO:1)의 적어도 5 반복을 포함한다. 일부 구체예에서, CRE는 SEQ ID NO:1의 적어도, 최대, 또는 정확하게, 3, 4, 5, 6, 7, 8, 9, 또는 10 반복(또는 그 안에서 임의의 도출 가능한 범위)을 포함한다. 일부 구체예에서, CRE는 cgtcgtgacgtcagacagaccacgcgatcgctcgagtccgccggtcaatccggtgacgtcacgggcctcttcgctattacgccagctggcgaaagggggttgacgtcacattaaatcggccaacgcgcggggagaggcggtgacgtcaacaggcatcgtggtgtcacgctcgtcgtgacgtcagtcgctttaactggccctggctttggcagcctgtagcctgacgtcagagagcctgacgtcaGagagcggagactctagagggtatataatggaagctcgaattccagcttggcattccggtactgttggtaaa(SEQ ID NO:2), 또는 SEQ ID NO:2와 적어도, 최대, 또는 정확하게, 70, 75, 80, 85, 90, 95, 96, 97, 98, 또는 99% 동일한 서열 또는 이의 단편, 예를 들어, SEQ ID NO:2의 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 225 250, 275, 300, 301, 302, 304, 305, 306, 307, 308, 309, 310, 312, 313, 314, 또는 315개의 인접 핵산(또는 그 안에서 임의의 도출 가능한 범위)의 단편을 포함한다.
일부 구체예에서, GPCR은 후각 수용체(OR)이다. OR은 당해 분야에 공지되고, 본원에 추가로 기술되어 있다. 일부 구체예에서, 수용체 유전자는 핵 호르몬 수용체 유전자를 포함한다. 일부 구체예에서, 수용체 유전자는 수용체 티로신 키나아제 유전자를 포함한다. 일부 구체예에서, 수용체는 아드레날린수용체를 포함한다. 일부 구체예에서, 아드레날린수용체는 베타-2 아드레날린성 수용체를 포함한다. 일부 구체예에서, 수용체는 본원에 기술된 수용체를 포함한다. 일부 구체예에서, 수용체는 막관통 수용체이다. 일부 구체예에서, 수용체는 세포내 수용체이다.
일부 구체예에서, 벡터는 바이러스 벡터이다. 추가 구체예에서, 벡터는 당해 분야에 공지되고/거나 본원에 기술된 것이다. 일부 구체예에서, 벡터는 렌티바이러스 벡터를 포함한다.
일부 구체예에서, 수용체 유전자는 구성적 프로모터를 포함한다. 예시적인 구성적 프로모터는 CMV, RSV, SV40, 등을 포함한다. 일부 구체예에서, 수용체 유전자는 조건적 프로모터를 포함한다. 본원에서 사용되는 용어 "조건적 프로모터"는 유도제(inducer)의 첨가에 의해 유도되고/거나, 온도 변화와 같은 조건의 변화 또는 활성제, 또는 보조-활성제, 또는 리간드와 같은 분자의 첨가에 의해 "오프(off)" 상태로부터 "온(on)" 상태로 또는 "온" 상태로부터 "오프" 상태로 스위칭될 수 있는 프로모터를 지칭한다. 조건적 프로모터의 예는 "Tet-on" 또는 "Tet-off" 시스템을 포함하며, 이는 세포에서 단백질을 유도 가능하게 발현시키기 위해 사용될 수 있다.
일부 구체예에서, 리포터는 발현된 RNA를 포함한다. 일부 구체예에서, 리포터는 적어도 10개의 핵산의 바코드를 포함한다. 바코드는 적어도, 또는 최대, 길이가 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100개 또는 그 이상의 핵산(또는 그 안에서 임의의 도출 가능한 범위)일 수 있다. 일부 구체예에서, 리포터는 오픈 리딩 프레임(ORF)을 포함하거나, 이를 추가로 포함하며; 유전자는 3' 비번역 영역(UTR)을 포함한다. 일부 구체예에서, 바코드는 예를 들어, 형광 단백질을 엔코딩하는 유전자에 대한, 유전자, 리포터, 또는 다른 핵산 세그먼트의 3'UTR에 위치되어 있다. 일부 구체예에서, ORF는 선택 가능한 또는 스크리닝 가능한 단백질을 엔코딩한다. 일부 구체예에서, ORF는 형광 단백질을 엔코딩한다. 일부 구체예에서, ORF는 루시페라아제 단백질을 엔코딩한다.
일부 구체예에서, 수용체 유전자는 격리자 서열에 의해 5' 및/또는 3' 말단 측면에 있다. 일부 구체예에서, 리포터는 격리자 서열에 의해 5' 및/또는 3' 말단 측면에 있다. 일부 구체예에서, 리포터 유전자는 단지 5' 말단에서 또는 단지 3' 말단 측면에 있다. 일부 구체예에서, 리포터 유전자는 격리자에 의해 3' 말단 측면에 있지 않다. 일부 구체예에서, 리포터 유전자는 격리자에 의해 5' 말단 측면에 있지 않다. 일부 구체예에서, 수용체 유전자는 단지 5' 말단에서 또는 단지 3' 말단 측면에 있다. 일부 구체예에서, 수용체 유전자는 격리자에 의해 3' 말단 측면에 있지 않다. 일부 구체예에서, 수용체 유전자는 격리자에 의해 5' 말단 측면에 있지 않다.
일부 구체예에서, 격리자는 cHS4 격리자를 포함한다. 일부 구체예에서, 격리자는 GAGGGACAGCCCCCCCCCAAAGCCCCCAGGGATGTAATTACGTCCCTCCCCCGCTAGGGGGCAGCAGCGAGCCGCCCGGGGCTCCGCTCCGGTCCGGCGCTCCCCCCGCATCCCCGAGCCGGCAGCGTGCGGGGACAGCCCGGGCACGGGGAAGGTGGCACGGGATCGCTTTCCTCTGAACGCTTCTCGCTGCTCTTTGAGCCTGCAGACACCTGGGGGGATACGGGGAAAA(SEQ ID NO:3), 또는 SEQ ID NO:3과 적어도, 최대, 또는 정확하게 70, 75, 80, 85, 90, 95, 96, 97, 98, 또는 99% 동일한 서열, 또는 이의 단편, 예를 들어, SEQ ID NO:3의 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 125, 150, 175, 200, 205, 210, 215, 216, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 229, 230, 또는 231개의 인접 핵산(또는 그 안에서 임의의 도출 가능한 범위)의 단편을 포함한다.
일부 구체예에서, 격리자는 CTCF 억제 인자에 의해 조절된 CTCF 격리자, 또는 드로소필라(Drosophila)의 집시 레트로트랜스포존(gypsy retrotransposon)에서 발견된 집시 격리자이다.
일부 구체예에서, 벡터는 제2, 제3, 제4, 또는 제5 바코드를 포함한다. 일부 구체예에서, 제2, 제3, 또는 제4 바코드 중 적어도 하나는 검정 조건 또는 마이크로플레이트 상의 위치 중 하나 이상에 대해 고유한 인덱스 영역을 포함한다. 검정 조건은 특정 리간드의 첨가, 특정 농도의 리간드의 첨가, 또는 리간드의 변이체, 또는 대사물, 소분자, 폴리펩티드, 억제제, 억제 인자, 또는 핵산의 농도 또는 변이체를 포함할 수 있다. 일부 구체예에서, 추가적인 바코드는 세포가 마이크로플레이트 상에 정위된 경우를 식별하기 위해 사용될 수 있으며, 이에 따라, 그러한 특정 위치에서의 검정 조건은 식별되고 바코드에 연결될 수 있게 한다.
본 개시내용의 추가 양태는 본 개시내용의 하나 이상의 벡터 또는 핵산을 포함하는 바이러스 입자에 관한 것이다.
본 개시내용의 다른 추가 양태는 본 개시내용의 핵산, 벡터, 또는 바이러스 입자를 포함하는 세포에 관한 것이다. 추가 구체예는 본 개시내용의 벡터의 복수의 카피를 포함하는 세포에 관한 것이다. 일부 구체예에서, 세포는 벡터의 적어도 3개의 카피를 포함한다. 일부 구체예에서, 세포는 벡터의 적어도 4개의 카피를 포함한다. 일부 구체예에서, 세포는 벡터의 적어도, 최대, 또는 정확하게, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 또는 20개의 카피(또는 그 안에서 임의의 도출 가능한 범위)를 포함한다.
일부 구체예에서, 본 개시내용의 세포 또는 세포들은 하나 이상의 보조 단백질에 대해 엔코딩하는 하나 이상의 유전자를 추가로 포함한다. 일부 구체예에서, 하나 이상의 보조 단백질은 G α-서브유닛, Ric-8B, RTP1L, RTP2, RTP3, RTP4, CHMR3, 및 RTP1S 중 하나 이상을 포함한다. 일부 구체예에서, 하나 이상의 보조 단백질은 아레스틴 단백질을 포함한다. 일부 구체예에서, 하나 이상의 보조 단백질은 Gi 또는 Gq 단백질을 포함한다. 일부 구체예에서, 아레스틴 단백질은 프로테아제에 융합된다. 일부 구체예에서, 하나 이상의 보조 단백질은 샤페론 단백질, G 단백질, 및 구아닌 뉴클레오티드 교환 인자 중 하나 이상을 포함한다. 일부 구체예에서, 보조 단백질은 세포의 게놈 내에 통합된다. 본 출원의 실시예에 나타내는 바와 같이, 보조 인자의 안정한 통합은 일시적 발현과 비교하여, 놀랍게도 양호한 결과를 제공한다. 일부 구체예에서, 보조 단백질은 일시적으로 발현된다. 일부 구체예에서, 세포는 하나 이상의 보조 인자 유전자를 엔코딩하는 하나 이상의 외인성 뉴클레오티드의 안정한 통합을 포함하며, 여기서, 보조 인자 유전자는 RTP1S, RTP2, G α-서브유닛(NCBI 유전자 ID:2774), 또는 Ric-8b(NCBI 유전자 ID 237422)를 포함한다.
일부 구체예에서, 세포는 이종 수용체 유전자로부터 발현된 수용체 단백질을 추가로 포함한다. 일부 구체예에서, 수용체 단백질는 세포 내에서 국소화된다. 일부 구체예에서, 세포에는 이종 수용체 유전자와 적어도 80% 동일한 단백질에 대해 엔코딩하는 내인성 유전자가 결여되어 있다. 일부 구체예에서, 세포에는 이종 수용체 유전자와 적어도, 최대, 또는 정확하게, 65, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99, 또는 100% 동일한(또는 그 안에서 임의의 도출 가능한 범위) 단백질에 대해 엔코딩하는 내인성 유전자가 결여되어 있다. 일부 구체예에서, 수용체 유전자는 세포의 게놈 내에 통합된다. 일부 구체예에서, 유도성 리포터는 세포의 게놈 내에 통합된다. 일부 구체예에서, 수용체 유전자 및/또는 유도성 리포터는 일시적으로 발현된다.
일부 구체예에서, 수용체 유전자 및 유도성 리포터는 유전적으로 연결된다. 일부 구체예에서, 수용체 유전자 및 유도성 리포터는 유전적으로 연결되지 않는다. 일부 구체예에서, 수용체 유전자 및 유도성 리포터는 세포의 게놈 내에 삽입되고, 서로 적어도 10, 50, 100, 200, 500, 1000, 2000, 3000, 5000, 또는 10000개의 염기쌍(bp)(또는 그 안에서 도출 가능한 임의의 범위) 내에 존재하거나 이에 의해 분리된다. 추가 구체예에서, 수용체 유전자 및 유도성 리포터는 별도의 유전적 요소, 예를 들어, 별도의 염색체 및/또는 염색체외 분자 상에 존재한다.
일부 구체예에서, 통합된 수용체 유전자 및/또는 유도성 리포터는 타겟화된 통합에 의해 세포 게놈 내에 통합된다. 일부 구체예에서, 통합된 수용체 유전자 및/또는 유도성 리포터는 게놈 내에 무작위적으로 통합된다. 일부 구체예에서, 무작위 통합은 수용체 유전자 및/또는 유도성 리포터의 전위를 포함한다. 일부 구체예에서, 세포는 수용체 유전자 및/또는 유도성 리포터의 적어도 2개의 카피를 포함한다. 무작위 통합의 다른 방법에서, DNA는 세포 내에 도입될 수 있고, 재조합을 통해 무작위적으로 통합될 수 있게 한다. 일부 구체예에서, 통합은 H11 안전 하버 유전자좌 내에 존재한다. 일부 구체예에서, 통합은 H11 안전 하버 유전자좌 내의 타겟화된 통합이다.
일부 구체예에서, 수용체 유전자는 구성적 프로모터를 포함한다. 일부 구체예에서, 수용체의 발현은 구성적이다. 일부 구체예에서, 수용체 유전자는 조건적 프로모터를 포함한다. 일부 구체예에서, 수용체의 발현은 조건적이거나 유도성이다. 일부 구체예에서, 이종 수용체 유전자는 유도성 프로모터에 작동 가능하게 결합된다. 일부 구체예에서, 유도성 또는 조건적 프로모터는 테트라사이클린 반응 요소이다.
일부 구체예에서, 이종 수용체의 발현 수준은 생리학적으로 관련된 발현 수준에 있다. 용어 "생리학적으로 관련된 발현 수준"은 세포에서 수용체의 내인성 발현 수준과 유사하거나 균등한 발현 수준을 지칭한다. 다른 구체예에서, 발현 수준은 생리학적으로 관련된 수준 미만일 수 있다. 일부 구체예에서, 바코드 시퀀싱의 감도는 덜 민감한 검정을 위해 요구되는 것보다 더 낮은 발현 수준을 허용한다. 일부 구체예에서, RNA 전사체의 수준은 적어도 약 10, 102, 103, 104, 105, 106, 107, 108, 109, 또는 1010, 또는 그 안에서 도출 가능한 임의의 범위에 있거나, 최대 약 10, 102, 103, 104, 105, 106, 107, 108, 109, 또는 1010, 또는 그 안에서 도출 가능한 임의의 범위에 있다.
일부 구체예에서, 세포 또는 세포들은 냉동되어 있다. 일부 구체예에서, 세포는 포유류 세포이다. 일부 구체예에서, 세포는 인간 배아 신장 293T(HEK293T) 세포이다.
추가 양태는 본원에 기술되어 있는 세포 또는 세포의 집단을 포함하는 검정 시스템에 관한 것이다.
추가 양태는 리간드 및 수용체 결합을 스크리닝하는 방법으로서, 본 개시내용의 세포 또는 세포들을 리간드와 접촉시키는 단계; 하나 이상의 리포터를 검출하는 단계; 및 하나 이상의 리포터의 동일성을 결정하는 단계를 포함하며, 리포터의 동일성은 결합된 수용체의 동일성을 명시하는 방법에 관한 것이다. 방법은 특정 시간 내에 일정 수의 수용체 및/또는 일정 수의 리간드를 스크리닝하는 것을 포함할 수 있다. 일부 구체예에서, 단일 스크린은 2, 3, 4, 5, 6, 7일 및/또는 1, 2, 3, 4, 5주 및/또는 1, 2, 3, 4, 5, 또는 6개월(및 여기에서 도출 가능한 임의의 범위)의 시간에 약, 약 적어도, 또는 약 최대 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300, 3400, 3500, 3600, 3700, 3800, 3900, 4000, 4500, 5000, 6000, 7000, 8000, 9000, 104, 105, 106, 107, 108, 109, 또는 1010개의 리간드 또는 잠재적인 리간드(또는 그 안에서 도출 가능한 임의의 범위)를 갖는 약, 적어도 약, 또는 최대 약 10, 102, 103, 104, 105, 106, 107, 108, 109, 또는 1010개의 상이한 세포 및/또는 수용체(또는 그 안에서 도출 가능한 임의의 범위)를 검정하는 것을 포함하며, 여기서, 세포가 후보 리간드와 접촉될 때 스크린이 시작하고, 수용체가 이의 시퀀싱된 바코드에 의해 식별될 때 스크린이 종료된다.
일부 구체예에서, 적어도 300개의 상이한 이종 수용체는 세포의 집단에서 발현된다. 일부 구체예에서, 적어도 2, 5, 10, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 20000, 30000, 40000, 50000개, 또는 그 이상의 수용체는 세포의 집단에서 발현된다. 일부 구체예에서, 세포의 집단은 적어도 또는 최대 104, 105, 106, 107, 108, 109, 1010, 1011, 또는 1012개의 세포(또는 그 안에서 도출 가능한 임의의 범위)를 포함한다. 일부 구체예에서, 세포의 집단은 하나의 조성물에서 동시-혼합된다. 조성물은 세포의 현탁된 조성물 또는 세포의 플레이팅된 조성물일 수 있다. 일부 구체예에서, 세포외 집단은 기질, 예를 들어, 세포 배양 접시에 접착된다. 일부 구체예에서, 세포의 집단은 기질의 하나의 웰 내에 또는 하나의 세포 배양 접시 내에 함유된다.
일부 구체예에서, 리포터의 동일성을 결정하는 단계는 세포로부터 핵산을 단리시키는 것을 포함한다. 일부 구체예에서, 핵산은 RNA를 포함한다. 일부 구체예에서, 방법은 cDNA를 제조하기 위해 단리된 RNA 상에서 역전사효소 반응을 수행하는 것을 추가로 포함한다. 일부 구체예에서, 방법은 단리된 핵산을 증폭시키는 것을 추가로 포함한다. 일부 구체예에서, 방법은 단리된 핵산을 시퀀싱하는 것을 추가로 포함한다. 일부 구체예에서, 역전사효소 반응은 용해물에서 수행된다. 일부 구체예에서, 하나 이상의 리포터를 검출하는 단계는 세포 또는 세포들로부터 형광의 수준을 검출하는 것을 포함한다. 일부 구체예에서, 방법은 세포를 플레이팅하는 것을 추가로 포함한다. 일부 구체예에서, 세포는 96-웰 세포 배양 플레이트 상에 플레이팅된다. 일부 구체예에서, 세포 또는 세포들은 냉동되며, 방법은 냉동된 세포를 해동시키는 것을 추가로 포함한다.
본 개시내용의 특정 양태는 리간드 및 수용체 결합을 스크리닝하는 방법으로서, 세포의 집단을 리간드와 접촉시키는 단계로서, 세포의 집단의 각 세포가 i) 이종 수용체 유전자; 및 ii) 수용체-반응 요소를 포함하는 유도성 리포터를 포함하고, 리포터의 발현이 수용체 유전자에 의해 엔코딩된 수용체의 활성의 활성화에 의존적이고, 리포터가 이종 수용체 유전자에 고유한 인덱스 영역을 포함하는 바코드를 포함하고, 세포의 집단이 이종 수용체 유전자로부터의 적어도 2개의 상이한 수용체를 발현시키고, 각 단일 세포가 하나의 특정 이종 수용체의 하나 이상의 카피 및 하나의 특정 리포터의 하나 이상의 카피를 갖는 단계; 하나 이상의 리포터를 검출하는 단계; 및 하나 이상의 리포터의 동일성을 결정하는 단계로서, 리포터의 동일성은 결합된 수용체의 동일성을 명시하는 단계를 포함하는 방법에 관한 것이다.
방법은 스크린에서 식별 가능한 임의의 수용체를 세포에서 발현시키는 것을 추가로 포함한다. 수용체는 정제되거나 단리될 수 있다. 하나 이상의 식별된 수용체는 또한, 클로닝될 수 있다. 이는 이후에, 발현을 위한 상이한 숙주 세포 내로 트랜스펙션될 수 있다.
추가 양태는 적어도 2개의 상이한 벡터를 포함하는 벡터 라이브러리로서, 벡터는 상이한 이종 수용체 유전자 및 상이한 유도성 리포터를 포함하는, 벡터 라이브러리에 관한 것이다. 벡터는 본원에 기술된 벡터일 수 있다. 추가 양태는 본 개시내용의 세포의 집단을 포함하는 세포 라이브러리에 관한 것이다. 추가 양태는 본 개시내용의 적어도 2개의 바이러스 입자를 포함하는 바이러스 라이브러리에 관한 것으로서, 여기서, 바이러스 입자는 상이한 이종 수용체 유전자 및 상이한 유도성 리포터를 포함한다.
추가 양태는 수용체 단백질을 포함하는 세포의 라이브러리를 제조하는 방법으로서, i) 세포에서 본 개시내용의 핵산 또는 벡터를 발현시키는 단계, 또는 ii) 세포를 본 개시내용의 바이러스 입자로 감염시키는 단계로서, 세포는 상이한 이종 수용체를 발현시키고, 각 단일 세포는 하나의 특정 이종 수용체의 하나 이상의 카피 및 하나의 특정 리포터의 하나 이상의 카피를 갖는 단계를 포함하는 방법에 관한 것이다. 각 세포는 이종 수용체 유전자 및/또는 유도성 리포터의 적어도, 최대, 또는 정확하게, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 카피(또는 여기에서의 임의의 도찰 가능한 범위)를 가질 수 있다. 특정 구체예에서, 세포는 수용체 유전자 및/또는 유도성 리포터를 엔코딩하는 핵산의 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 카피(또는 여기에서의 임의의 도찰 가능한 범위)를 포함한다.
추가 양태는 본원에 기술된 바와 같은 벡터, 세포, 핵산, 라이브러리, 프라이머, 프로브, 시퀀싱 시약 및/또는 완충제를 포함하는 키트에 관한 것이다.
추가 양태는 i) 유도성 프로모터에 작동 가능하게 결합된 이종 수용체 유전자; 및 ii) 수용체-반응 요소를 포함하는 리포터를 포함하는 핵산으로서, 리포터의 발현은 이종 수용체 유전자에 의해 엔코딩된 수용체의 활성의 활성화에 의존적이고, 리포터는 이종 수용체 유전자에 고유한 인덱스 영역을 포함하는 바코드를 포함하는 핵산에 관한 것이다. 일부 구체예에서, 핵산의 적어도 2개의 카피 내지 적어도 6개의 카피를 포함한다.
용어 "균등한 핵산"은 핵산의 뉴클레오티드 서열 또는 이의 보체와 특정 정도의 상동성을 갖는 뉴클레오티드 서열을 갖는 핵산을 지칭한다. 이중 가닥 핵산의 동족체는 핵산의 뉴클레오티드 서열과 또는 이의 보체와 특정 정도의 상동성을 갖는 뉴클레오티드 서열을 갖는 핵산을 포함하도록 의도된다. 일 양태에서, 핵산의 동족체는 핵산 또는 이의 보체에 하이브리드화될 수 있다. 본 개시내용의 핵산은 또한, 균등한 핵산을 포함한다.
폴리뉴클레오티드 또는 폴리뉴클레오티드 영역(또는 폴리펩티드 또는 폴리펩티드 영역)은 다른 서열과 적어도, 최대, 또는 정확하게, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98% 또는 99%(또는 그 안에서 임의의 도출 가능한 범위)의 "서열 동일성" 또는 "상동성"을 가질 수 있으며, 이는 정렬될 때, 염기(또는 아미노산)의 백분율이 2개의 서열을 비교 시에 동일함을 의미한다. 이러한 정렬 및 퍼센트 상동성 또는 서열 동일성은 당해 분야에 공지된 소프트웨어 프로그램, 예를 들어, 문헌[Ausubel et al. eds. (2007) Current Protocols in Molecular Biology]에 기술된 것을 이용하여 결정될 수 있다.
생물학적으로 동등한 폴리뉴클레오티드는 명시된 퍼센트 상동성을 가지고 동일하거나 유사한 생물학적 활성을 갖는 폴리펩티드를 엔코딩하는 것이다.
"약" 및 "대략"은 일반적으로, 측정의 특성 또는 정밀도를 고려하여 측정된 양에 대한 허용 가능한 정도의 오차를 의미할 것이다. 통상적으로, 예시적인 정도의 오차는 제공된 값 또는 값의 범위의 20 퍼센트(%) 이내, 바람직하게, 10% 이내, 및 더욱 바람직하게, 5% 이내이다. 대안적으로, 및 특히, 생물학적 시스템에서, 용어 "약" 및 "대략"은 제공된 값의 한 자리수, 바람직하게, 5배 이내, 및 더욱 바람직하게, 2배 이내인 값을 의미할 수 있다. 일부 구체예에서, 본원에서 논의된 수치가 용어 "약" 또는 "대략"과 함께 이용될 수 있다는 것이 고려된다.
본원에서 사용되는 용어 "포함하는(comprising)"은 조성물 및 방법이 인용된 구성요소를 포함하면서 다른 것들을 배제하지 않는다는 것을 의미하도록 의도된다. "필수적으로 포함하는(consisting essentially of)"은 조성물 및 방법을 규정하기 위해 사용될 때, 기술된 목적을 위해 조합에 임의의 본질적인 중요성의 다른 구성요소를 배제하는 것을 의미할 것이다. 본 개시내용의 약제 조성물의 문맥에서 "필수적으로 포함하는"은 모든 인용된 활성제를 포함하고 임의의 추가적인 인용되지 않은 활성제를 배제하는 것을 포함하지만, 활성 성분이 아닌 조성물의 다른 성분들을 배제하지 않는 것으로 의도된다. 이에 따라, 본원에서 규정된 바와 같은 구성요소들을 필수적으로 포함하는 조성물은 단리 및 정제 방법으로부터의 미량 오염물, 및 약제학적으로 허용되는 담체, 예를 들어, 포스페이트 완충 염수, 보존제, 등을 배제하지 않을 것이다. "...로 이루어진(consisting of)"은 다른 구성성분의 미량 원소 및 본 발명의 조성물을 투여하기 위한 실질적인 방법 단계 또는 조성물을 형성하거나 의도된 결과를 달성하기 위한 공정 단계를 배제하는 것을 의미할 것이다. 이러한 전환 용어 각각에 의해 규정된 구체예는 본 발명의 범위 내에 속한다.
용어 "단백질", "폴리펩티드" 및 "펩티드"는 유전자 산물 또는 기능 단백질을 지칭할 때 본원에서 서로 교대 가능하게 사용된다.
용어 "접촉된" 및 "노출된"은 세포에 적용될 때, 작용제가 타겟 세포로 전달되거나 타겟 세포 또는 타겟 분자와 직접 병치되게 배치되는 공정을 기술하기 위해 본원에서 사용된다.
청구범위 및/또는 명세서에서 용어 "포함하는(comprising)"과 함께 사용될 때 단수 형태("a" 또는 "an")의 사용은 "하나"를 의미할 수 있지만, 또한, "하나 이상," "적어도 하나," 및 "하나 또는 하나 초과"의 의미와 일치한다.
본 출원 전반에 걸쳐, 용어 "약"은 값이 값을 결정하기 위해 이용되는 디바이스 또는 방법에 대한 오차의 표준 편차를 포함한다는 것을 명시하기 위해 이용된다.
청구범위에서 용어 "또는"의 용어는 단지 대안예를 지칭하기 위해 명확하게 명시하지 않는 한 "및/또는"을 의미하기 위해 사용되거나, 대안예는 서로 배타적이며, 본 개시내용은 "및/또는" 뿐만 아니라 단지 대안예를 지칭하는 정의를 지지한다. 본원에서 사용되는 "다른"은 적어도 제2 이상을 의미할 수 있다.
본 명세서 및 청구항(들)에서 사용되는 바와 같이, 단어 "포함하는"(및 "포함하다(comprise, comprises)"와 같은 포함하는의 임의의 형태), "갖는"(및 "갖는다"와 같은 갖는의 임의의 형태), "포함하는(including)"(및 "포함하는"과 같은 포함하는의 임의의 형태) 또는 "함유하는"(및 "함유하다"와 같은 함유하는의 임의의 형태)은 포괄적이거나 개방-종결어이고, 추갖거인, 인용되지 않은 구성요소 또는 방법 단계를 배제하지 않는다. 용어 "포함하는"과 함께 기술된 임의의 구체예가 또한, "포함하는"에 대해 단어 "...로 이루어진"으로 치환될 수 있다는 것이 고려된다.
본원에 기술된 임의의 방법 또는 조성물이 본원에 기술된 임의의 다른 방법 또는 조성물에 대해 구현될 수 있으며, 상이한 구체예들이 조합될 수 있다는 것이 고려된다.
하나 이상의 조성물의 사용은 본원에 기술된 방법을 기초로 하여 이용될 수 있다. 하나 이상의 조성물의 사용은 본원에 기술된 방법에 따라 치료를 위한 약제의 제조에서 이용될 수 있다. 다른 구체예는 본 출원 전반에 걸쳐 논의된다. 본 개시내용의 일 양태에 대해 논의된 임의의 구체예는 본 개시내용의 다른 양태에 적용하며, 그 반대로도 적용한다. 본 실시예 섹션의 구체예는 본원에 기술된 기술의 모든 양태에 적용 가능한 구체예인 것으로 이해된다.
본 발명의 다른 목적, 특징 및 장점은 하기 상세한 설명으로부터 자명할 것이다. 그러나, 본 발명의 사상 및 범위 내에서의 다양한 변화 및 개질이 이러한 상세한 설명으로부터 당업자에게 자명할 것이기 때문에, 본 발명의 바람직한 구체예를 지시하지만, 상세한 설명 및 특정 실시예가 단지 예시로서 제공되는 것으로 이해될 수 있다.
하기 도면은 본 명세서의 일부를 형성하고, 본 발명의 특정 양태를 추가로 나타내기 위해 포함된다. 본 발명은 본원에 제시된 특정 구체예의 상세한 설명과 함께 이러한 도면 중 하나 이상을 참조하여 더 잘 이해될 수 있다.
도 1. 멀티플렉싱된 리포터 방식의 개론. 멀티플렉싱된 방식을 상세히 설명한 다이어그램. OR 라이브러리에 대한 바코딩 전략을 상세히 설명한 다이아그램. 각 OR은 리포터 유전자의 3' UTR에서 고유 바코드에 결합된다. Mukku3a 세포는 각 OR과 콜로니로 통합되고, 풀링되고, 후각자극제 유도를 위해 시딩된다. 유도 후에, 바코딩된 전사체는 시퀀싱되고 각 후각자극제-수용체 쌍에 대한 상대 친화력을 결정하기 위해 정량화된다.
도 2. Ind. 세포주 Luc/RNA 및 파일롯 스크린. a) 적합한 세포주에 대한 Ind. Luc를 도시함 b) 적합한 세포주에 대한 Ind. RAN를 도시함. a) Mukku3a 세포에서 cAMP 반응 루시페라아제 유전자 리포터를 통해 측정된 공지된 리간드로의 개별적인 적합한 OR 활성화. b) Mukku3a 세포에서 바코딩된 유전자 리포터의 Q-RTPCR을 통해 측정된 공지된 리간드와의 개별적인 적합한 OR 활성화.
도 3. 조합된 v. Sep 유전자tic 리포터. a) Sep v. Comb의 개략도. b) Sep v. Comb 일시적 데이터. a) OR 및 리포터를 개별적으로 및 함께 엔코딩하기 위한 플라스미드 구성. b) 별도로 및 조합된 구성에서 cAMP 반응 루시페라아제 유전자 리포터를 통해 측정된 공지된 리간드와의 일시적 OR 활성화(MOR42-3 및 MOR9-1)의 비교.
도 4. 랜딩 패드. a) Bxb1의 개략도. b) 통합 효율. c) B2 및 OR int Luc. a) 랜eld 패드 내에 Bxb1 재조합의 개략도. HEK293T 세포는 안전 하버 유전자좌 H11에 랜딩 패드의 단일 카피를 함유하도록 사전-조작되었다(Mukku1a 세포). 랜딩 패드는 Bxb1 리콤비나아제 인식 사이트 attp를 함유한다. 상응하는 attb 인식 사이트를 함유한 플라스미드 및 리콤비나아제의 동시-발현은 단일의 비가역적 사이트-특이적 통합 사건을 야기시킨다. 이러한 통합 전략은 단일 포트에서 이종 라이브러리의 콜로니 통합을 가능하게 한다. b) 유세포 분석법을 이용한 Bxb1 랜딩 패드의 통합 효율의 평가. 세포는 오로지 mCherry 플라스미드, 뿐만 아니라, 통합 시에 mCherry를 조건적으로 발현시키는 플라스미드 및 리콤비나아제를 발현시키는 플라스미드와 동시-트랜스펙션되었다. 다수의 계대배양 후에, 리콤비나아제와 트랜스펙션된 세포의 7 내지 8%는 형광성이었으며, 리콤비나아제와 트랜스펙션되지 않은 세포는 형광성이 아니었다. c) OR(MOR42-3) 및 베타-2 아드레날린성 수용체(ADRB2)를 엔코딩하는 조합된 유전자 리포터는 랜딩 패드 내에 통합되었다. 둘 모두는 공지된 효능제로 유도되었으며, 유전자 리포터 활성화는 루시페라아제 검정으로 측정되었다. 용량 의존 활성화는 ADRB2에 대해 관찰되었지만, MOR42-3에 대해서는 관찰되지 않았다.
도 5. 유동성 개략도. a) 방식 b) 트랜스 및 Int Ind. a) Mukku1a 세포는 역 테트라사이클린 트랜스활성제(m2rtTA)를 구성적으로 발현시키기 위해 형질도입되었으며, OR 발현을 구동시키는 구성적 프로모터는 테트라사이클린 조절된 프로모터로 대체되었다. (테트라사이클린 반응 GFP는 독시사이클린의 첨가와 함께 랜딩 패드에서 발현을 확인하기 위해 통합됨). b) 유도성 조합된 유전자 리포터는 OR 활성화에 대해 일시적으로 스크리닝되고 Mukku2a 세포의 랜딩 패드에서 통합된다. MOR42-3의 일시적 활성화는 후각자극제로 자극될 때 dox의 존재 하에서 관찰되었지만, 랜딩 패드에서 통합될 때 관찰되지 않았다. 파트 b의 각 농도 위의 바는 - Dox(좌측 바) 및 + Dox(우측 바)를 나타낸다.
도 6. 카피 수. a) 트랜스포존 방식 b) Cons. 트랜스포존 c) Ind. 트랜스포존 d) QPCR. a) 트랜스포존 개략도의 다이아그램. PiggyBac 트랜스포사아제는 중간 물단 반복에 의해 측면에 있는 조합된 유전자 리포터를 절단한다. 서열의 다수의 카피는 이후에 게놈을 가로질러 TTAA 유전자좌에 삽입된다. b) 구성적 발현 하에서 Mukku1a 세포에서 전위될 때, MOR42-3은 리간드에 대한 용량 반응성 루시페라아제 생산을 나타내지 않는다. c) 유도성 발현 하에서 Mukku2a에서 전위될 때, MOR42-3은 독시사이클린의 존재 하에서 리간드에 대한 강력한 용량 반응성 루시페라아제 생산을 나타낸다. 파트 c의 각 농도 위의 바는 - Dox(좌측 바) 및 + Dox(우측 바)를 나타낸다. d) 트랜스포존의 카피 수는 게놈 DNA의 QPCR에 의한 3개의 상이한 OR의 전위에 대해 결정되었다. 절대 커피 수는 랜딩 패드에서 콜로니로 통합된 조합된 유전자 리포터에 대해 트랜스포존에 대한 Cq를 비교함으로써 결정되었다. 파트 d에서 바는 (좌측에서 우측으로) 대조군, MOR203-1, MOR9-1, 및 Olfr62를 나타낸다.
도 7. a) 트랜스 AF b) 클론 선택. a) 보조 인자 RTP1S 및 RTP2의 존재 또는 부재 하에서 조합된 루시페라아제 유전자 리포터를 통해 측정된 공지된 리간드와의 일시적 OR 활성화(Olfr62 및 MOR30-1)의 비교. b) Mukku2a 세포는 유도성 발현 하에서 조절된 4개의 보조 인자(RTP1S, RTP2, Gαolf, 및 Ric8b)로 전위되었다. 개개 클론은 단리되고, 보조 인자 발현에 대해 기능적으로 평가되었다. 클론은 별도의 루시페라아제 유전자 리포터를 통해 공지된 리간드와의 일시적 OR 활성화(Olfr62 및 OR7D4)에 대해 검정되었다. 통상적인 모폴로지 및 성장률 둘 모두에 대한 강력한 활성화를 나타낸 클론(Mukku3a)은 다운스트림 적용을 위해 선택되었다.
도 8. 랜딩 패드 통합.
도 9. 유전적으로 통합된 합성 회로는 포유류 후각 수용체 활성화의 스크리닝을 허용한다. a) 조작된 HEK293T 세포주에서 적합한 OR 발현 및 기능에 대한 합성 회로의 개략도. b) 다양한 카피 수에서 및 구성적 또는 유도성 발현 하에서, 일시적으로 또는 게놈적으로 통합된 수용체를 발현시키는 MOR42-3 리포터 활성화. c) 보조 인자를 갖거나/갖지 않고 일시적으로 발현되거나/조작된 세포주 내에 통합된 Olfr62 리포터 활성화. d) 조작된 세포주 내에 통합된 OR 리포터 활성화에 대한 용량-반응 곡선.
도 10. 후각 수용체-후각자극제 상호작용의 대규모, 멀티플렉싱된 스크리닝. a) OR 리포터 세포주의 라이브러리의 CREation 및 멀티플렉싱된 스크리닝에 대한 개략도. b) 일시적 또는 게놈적으로 통합된 루시페라아제 검정 또는 풀링된 RNA-seq 검정으로 시험될 때 MOR30-1 및 Olfr62 리포터 활성화의 비교. c) 후각자극제 및 수용체 반응의 유사성에 의해 클러스터링되고 리포터 활성을 촉발시킨 최저 농도에 의해 색으로 나타낸 스크린으로부터의 모든 상호작용의 히트맵(heatmap). d) 본 발명의 후각자극제 패널(회색)의 화학적 공건의 PCA 투영 상에 맵핑된 4개의 OR(검정색)에 대해 식별된 히트.
도 11. 안정한, 기능성 OR 발현을 위한 조작 HEK293 세포. a) H11 게놈 유전자좌에서 단일 카피에서 일시적으로 트랜스펙션되거나 통합된 유도성으로 구동된 수용체 발현으로부터의 MOR42-3 활성화의 비교. B. 구성적 또는 유도성 발현 하에서 게놈에서 다수의 카피에 통합된 MOR42-3으로의 세포로부터의 활성화. c) 단일 카피 통합체에 대한 3개의 전위된 OR에 대한 qPCR로 결정된 상대적 수용체/리포터 DNA 카피 수. d) 보조 인자(AF) Gα olf , Ric8b, RTP1S, 및 RTP2와 함께 또는 이의 없이 동시-트랜스펙션된 MOR30-1 및 Olfr62 활성화(데칸산 및 2-코우마라논 각각으로 자극됨). e) 적합한 보조 인자 발현을 위한 세포주 생성. 트랜스펙션 후에, 클론은 단리되고, 기능적으로 발현시키기 위해 보조 인자를 필요로 하는 OR, Olfr62 및 OR7D4의 활성화에 대해 스크리닝되었다. 진한 회색 바는 추가 실험을 위해 선택된 클론을 나타낸다.
도 12. OR 활성화에 대한 멀티플렉싱된 유전자 리포터의 설계. a) OR 발현 카세트 및 통합을 위한 유전자 리포터를 함유한 벡터의 개략도. b) 별도의 플라스미드 상 또는 함께 수용체 카세트를 일시적으로 동시-발현시키는 세포에서 MOR42-3 리포터 활성화. c) Promega's pGL4.19 CRE 인헨서와 비교한 조작된 CRE 인헨서의 배수 활성화. d) CRE 인헨서의 업스트림의 DNA 격리자와 함께 또는 이의 없이 유도성 OR 프로모터의 유도 시에 유전자 리포터의 기저 활성화.
도 13. 조작된 세포주에서 합성 후각 활성화 회로의 개략도. 도 9에 도시되고 실시예 2에 기술된 OR 및 바코딩된 리포터 시스템의 발현/신호전달을 위한 발현된 성분의 전체 그래픽 도식. 수용체 발현은 Tet-On 시스템에 의해 제어된다. 독시사이클린 유도 후에, OR은 2개의 외인성으로 발현된 샤페론, RTP1S 및 RTP2로부터 도움을 받으면서 세포 표면 상에서 발현된다. 후각자극제 활성화 시에, g 단백질 신호전달은 cAMP 생성을 촉발시킨다. 신호전달은 천연 OR G 알파 서브유닛, G olf , 및 이의 상응하는 GEF, Ric8b의 유전자변형 발현에 의해 증대된다. cAMP는 바코팅된 리포터의 발현을 야기시키는 전사 인자 CREB를 포스포릴화하는 키나아제 PKA의 활성화를 야기시킨다.
도 14. 멀티플렉스에서 후각자극제 반응의 파일롯-스케일 요약. a) 9개의 후각자극제 및 2개의 혼합물에 대한 40개의 풀링된 수용체 반응을 나타낸 히트맵. 상호작용은 유전자 리포터의 log 2 배수 활성화에 의해 색으로 나타낸다. 이전에 확인된 후각자극제 상호작용(Saito et al. 2009)은 황색으로 박스 표시되어 있다. b) 5개의 농도에서 OR 라이브러리에 대해 스크리닝된 후각자극제 또는 포르스콜린(알데닐레이트 사이클라아제 자극제)에 대한 용량-반응 곡선. 후각자극제와 상호작용하는 것으로 고이조딘 OR에 대한 곡선은 색으로 나타낸다. 포르스콜린으로의 자극은 본 발명의 검정에서 OR 간의 실질적인 차등 활성을 나타내지 않는다.
도 15. 라이브러리 예시. OR 라이브러리에서 개별 OR의 예시. a) DMSO와 함께 인큐베이션된 각 리포터의 상대적 활성화에 의해 결정된 바와 같은 라이브러리의 분율로서의 각 OR의 빈도수. b) 라이브러리에서 각 OR의 빈도와, 모든 조건에 대한 리포터 활성화의 생물학적 복제물 측정 간의 평균 변동 계수 간의 관계.
도 16. 대규모 멀티플렉싱된 스크린의 복제능력. a) DMSO로 자극될 때 OR 라이브러리에 대한 변동 계수의 분포를 나타낸 히스토그램. b) 검정된 모든 조건에 대한 변동 계수의 분포를 나타낸 히스토그램. c) 검정된 각 96-웰 플레이트 상에 포함된 대조 후각자극제에 대한 용량-반응 곡선. 각 칼라는 상이한 플레이트를 나타낸다.
도 17. 고처리량 검정 데이터의 유의성 및 배수 변화 a) 각 OR-후각자극제 상호작용에 대한 배수 변화에 대해 플롯팅된, 음의 이항 가정을 이용하여 일반화된 선형 모델로부터 계산되고, 다수의 가설이 보정된, 오류 발견률(FDR). 점선은 1% FDR, 상호작용을 식별하기 위해 사용된 보존적 컷오프를 나타낸다. b) 직교 개별 루시페라아제 검정 칼라에 대해 선택된 상호작용의 서브세트는 상호작용이 검출되었는 지의 여부를 나타낸다. 1% DFR을 통과하는 상호작용 중에서, 28 중 21개는 또한, 직교 후속 검정에서 상호작용을 나타내었다.
도 18. 일시적, 직교 시스템에서 스크린의 요약. 루시페라아제 판독을 이용한 단일 후각 수용체를 발현시키는 세포주에 대한 화학물질의 2차 스크린. 각 플롯은 OR을 발현시키지 못하지만 후각자극제로 처리된 음성 대조군 세포주(검정색 라인) 뿐만 아니라 특정 OR을 발현시키는 세포주의 거동을 도시한 것이다. 또한, 고처리량 시퀀싱 스크린으로부터의 데이터(Seq로 라벨링됨)는 참고로 플롯팅된다.
도 19. 이전에 스크리닝된 후각자극제-수용체 쌍과의 검정 관련성. a) 사이토(Saito) 등에 의해 이전에 시험된 540개 후각자극제-OR 상호작용에 대한 배수 유도에 대해 플롯팅된 FDR. 포인트는 사이토 등(2009)에 의해 식별된 상호작용의 EC50에 의해 색으로 나타낸다. 회색 포인트는 이전 스크린에서 식별되지 않은 상호작용을 나타낸다. 일시적 대 통합된 루시페라아제 검정의 비교는, 일부 경우에, CRE-구동 루시페라아제 및 수용체의 더 낮은 DNA 카피 수로 인하여, 상당한 활성화를 달성하기 위해 더 높은 농도의 후각자극제를 필요로 함을 나타내었다. 검정된 후각자극제의 최고 농도가 1 mM이었기 때문에, 낮은 친화력 상호작용은 이러한 스크린에서 검출되지 못할 수 있다. b) 검정에서 FDR은 멀티플렉싱된 스크린으로부터 배수 활성화에 의해 색으로 나타낸 이전 스크린으로부터의 히트의 EC50과 관련이 있다.
도 20. 수용체에 대한 후각자극제 반응의 클러스터링. 여기에서, 본 발명자는 도 20과 동일한 좌표 상에서 시험된 다른 화학물질(회색)에 대해 임의의 히트의 위치(검정색)를 플롯팅한다. 이는 더 큰 화학적 공간에 대해 제공된 OR에 대한 활성 폭의 시각화를 제공한다.
도 21. 깊은 돌연변이 스캐닝 개론
도 22. 라이브러리 활성의 분포
도 23. 0.625 uM 이소프로테레놀에서 2 에서 변이체 활성 랜드스케이프.
도 24. 개별적으로 검정된 돌연변이체에 대한 비교
도 25. 리간드 상호작용 사이트.
도 26. k-수단 클러스터링.
도 27. A) 세포 당 단지 하나의 작제물이 삽입됨을 확인하기 위한 시험의 환경에서 Bxb1 재조합이 어떻게 작업되는 지의 다이아그램(세포는 단지 적색 또는 녹색일 것임). B) 2개의 칼라 시험의 흐름 결과 C) KO 또는 야생형 세포에서, B2 효능제, 이소프로테레놀로 자극될 때 리포터의 활성. D) 단일 카피 유전자좌에서 유전자변형 B2를 첨가할 때, 본 발명자는 B2 활성을 판독하는 능력을 회복할 수 있고, E)는 RNA 수준에서 또한 다운될 수 있고, 격리자 요소로 배수 활성화가 개선될 수 있다.
도 28. H11 유전자좌 내에 삽입된 B2 작제물의 다이어그램.
브루트-포스(Brute-force) 화학적 스크린은 상당한 경제적 비용, 스케일링 문제를 가지며, 후각 수용어댑터와 같은 일부 수용체의 경우에, 스크린이 또한 신뢰성이 없는 기능성 발현으로 어렵게 한다. 최근에, 인간 수용체에 대한 포괄적인 후각 스크린을 수행하기 위한 대규모 노력은 73개의 후각자극제에 걸쳐 394개의 OR을 검정하였다. 연구자들은 일시적 트랜스펙션과 조합하여, 기능성 OR 발현에 대한 모든 요망되는 인자의 발현을 허용하는 세포주를 구성하였다. 일시적으로 트랜스펙션된 OR의 활성화는 루시페라아제 리포터 발현을 야기시키며, 이는 다중-웰 플레이트에서 검정할 수 있다. 이러한 스크린은 50,000개의 개별 측정을 필요로 하고, 수년이 소요된다. 이러한 연구 단독은 공지된 수의 리간드-수용체 결합 쌍의 두배이고, 이의 화학적 리간드에 대해 27개의 인간 OR 수용체를 맵핑하였다. 이러한 방법의 성공에도 불구하고, 이러한 비교적 작은 화학적 스크린을 수행하기 위해 요망되는 스케일은 너무 큰데, 왜냐하면, 모든 화합물이 별개의 일시적 트랜스펙션을 필요로 하는 각 시험으로 수 백개의 OR에 걸쳐 소정 범위의 농도에서 시험되어야 하기 때문이다. 이에 따라, 이러한 방법은 본 개시내용의 방법의 타입으로 스케일링할 기회가 거의 없다.
본 개시내용의 방법은 본원에 기술된 검출 방법을 이용하여 멀티플렉스로 이의 활성을 보고할 수 있는 세포주 내에 함유된 수용체의 큰 라이브러리의 구조를 기술한다. 이러한 자동 특징분석 플랫폼과 관련하여, 본 방법은 전에 수행된 것보다 훨씬 더 큰 스케일로 리간드 및 수용체 결합을 조사하기 위해 이용될 수 있다. 검정 및 방법은 약물 발견 및 시험에서 다수의 적용을 가질 수 있다.
I. 수용체 및 유도성 리포터 요소
본 개시내용의 본 방법, 핵산, 벡터, 바이러스 입자, 및 세포는 리간드 결합 시에, 수용체-반응 요소를 통한 리포터의 전사를 유도하는, 수용체 단백질에 관한 것이다. 이에 따라, 리포터는 수용체 단백질의 직접 조절 하에 있거나 수용체 단백질에 의해 간접적으로 조절된다. 용어 "수용체-반응 요소"는 수용체 또는 수용체 및 리간드 결합 후에 수용체의 다운-스트림 요소에 의해 결합된 유도성 리포터의 프로모터 영역에서의 요소를 지칭한다. 일부 구체예에서, 수용체 단백질은 G-단백질 결합된 수용체(GPCR)이거나, 수용체 유전자는 GPCR에 대해 엔코딩한다. G 단백질 결합된 수용체(GPCR)는 매우 다양한 정상적인 생물학적 과정을 조절하고, 이의 다운스트림 신호전달 활성의 조절장애 시에 여러 질병의 병리생리학에서 역할을 한다. GPCR 리간드는 신경전달물질, 호르몬, 시토카인, 및 지질 신호전달 분자를 포함한다. GPCR은 매우 다양한 생물학적 과정, 예를 들어, 시력, 후각, 자율 신경계, 및 행동의 조절한다. 이의 세포외 리간드 이외에, 각 GPCR은 다운스트림 신호전달 경로를 활성화시키는, G-알파, G-베타, 및 G-감마 서브유닛으로 이루어진 특정 세포내 헤테로트라이머 G-단백질을 결합시킨다. 이러한 세포내 신호전달 경로는 cAMP/PKA, 칼슘/NFAT, 포스포리파아제 C, 단백질 티로신 키나아제, MAP 키나아제, PI-3-키나아제, 산화 질소/cGMP, Rho, 및 JAK/STAT를 포함한다. GPCR 기능 또는 신호전달의 중단은 신경계에서 면역계까지 호르몬 장애에 이르기까지, 이의 리간드 및 이러한 것이 조절되는 과정에 따라 달라지는 병리학적 상태에 기여한다. GPCR은 현재 모든 약물 개발 타겟의 30%를 나타낸다. 약물 스크리닝 검정의 개발은 직접 및 잠재적인 오프-타겟 부작용 둘 모두를 평가하기 위해 관련된 GPCR의 발현 뿐만 아니라 선택된 세포-기반 모델 시스템에서의 타겟 및 관련된 GPCR 발현 및 기능 모두의 조사를 필요로 한다.
수용체에 의해 영향을 받는 수용체 신호전달 및 전사 조절의 광범위한 지식을 기초로 하여 수용체 유전자/수용체-반응 요소를 구성하는 것은 당업자의 기술 내에 있다.
GPCR의 경우에, 유도성 리포터는 리간드 결합에 의한 GPCR 신호전달 활성화 시에 리포터의 전사 활성을 유도하는 반응 요소를 포함한다. GPCR 반응 요소는 cAMP 반응 요소(CRE), 활성화된 T-세포 반응 요소의 핵 인자(NFAT-RE), 혈청 반응 요소(SRE) 및 혈청 반응 인자 반응 요소(SRF-RE)를 포함한다. GPCR은 Gs, Gi, Gq, 및 G12로서 추가로 분류될 수 있다. 수용체 유전자/단백질 및 반응 요소의 예는 하기 표에 나타나 있다:
Golf 또는 G 후각 수용체는 신호 전달이 ATP에서 cAMP로 전환시키는 Gs GPCR이다. cAMP는 이후에, CRE 반응 요소를 통해 전사를 유도한다. 예시적인 후각 수용체는 하기에 표로 나타낸 것을 포함한다:
후각 수용체, 패밀리 1:
후각 수용체, 패밀리 2:
후각 수용체, 패밀리 3:
후각 수용체, 패밀리 4:
후각 수용체, 패밀리 5
후각 수용체, 패밀리 6:
후각 수용체, 패밀리 7:
http://www.genenames.org/cgi-bin/download?title=Genefam+data&submit=submit&hgnc_dbtag=on&preset=genefam&status=Approved&status=Entry+Withdrawn&status_opt=2&=on&format=text&limit=&.cgifields=&.cgifields=chr&.cgifields=status&.cgifields=hgnc_dbtag&where=gd_gene_fam_name%20RLIKE%20'(%5e|%20)OR7($|,)'&order_by=gd_app_sym_sort
후각 수용체, 패밀리 8:
후각 수용체, 패밀리 9:
후각 수용체, 패밀리 10:
후각 수용체, 패밀리 11:
후각 수용체, 패밀리 12:
후각 수용체, 패밀리 13:
후각 수용체, 패밀리 14:
후각 수용체, 패밀리 51:
후각 수용체, 패밀리 52:
후각 수용체, 패밀리 55:
후각 수용체, 패밀리 56:
본 개시내용의 방법 및 조성물에 따라 이종 수용체로서 유용한 추가의 예시적인 수용체 유전자/단백질은 하기 표에 나열된 것과 같은 수용체를 포함한다:
GPCR 수용체
핵 호르몬 수용체:
촉매 수용체
리간드는 수용체 또는 시험 화합물에 대한 공지된 리간드일 수 있다. 예를 들어, 후각 수용체의 경우에, 리간드는 후각자극제일 수 있다. 예시적인 후각자극제는 게라닐 아세테이트, 메틸 포르메이트, 메틸 아세테이트, 메틸 프로피오네이트, 메틸 프로파노에이트, 메틸 부티레이트, 메틸 부타노에이트, 에틸 아세테이트, 에틸 부티레이트, 에틸 부타노에이트, 이소아밀 아세테이트, 펜틸 부티레이트, 펜틸 부타노에이트, 펜틸 펜타노에이트, 옥틸 아세테이트, 벤질 아세테이트, 및 메틸 안트라닐레이트를 포함한다.
일부 구체예에서, 리간드는 소분자, 폴리펩티드, 또는 핵산 리간드를 포함한다. 본 개시내용의 방법은 수용체와의 리간드 결합을 검출하는 스크리닝 절차에 관한 것이다. 이에 따라, 리간드는 시험 화합물 또는 약물일 수 있다. 본 개시내용의 방법은 리간드/약물 효능 및/또는 오프-타겟 효과를 결정할 목적을 위해 리간드 및 수용체 결합을 결정하기 위해 이용될 수 있다. 폴리펩티드 리간드는 길이가 100개 보다 적은 아미노산인 펩티드일 수 있다.
화학 작용제는 통상적으로, 10,000 Da 미만의 분자량을 갖는, 유기, 비-펩티드 분자인 "소분자" 화합물이다. 일부 구체예에서, 이러한 것은 5,000 Da 미만, 1,000 Da 미만, 또는 500 Da 미만(및 여기에서 도출 가능한 임의의 범위)이다. 이러한 부류의 조절제는 화학적으로 합성된 분자, 예를 들어, 조합 화학적 라이브러리로부터의 화합물을 포함한다. 합성 화합물은 본원에 기술된 스크리닝 방법으로부터 합리적으로 설계되거나 식별될 수 있다. 소분자를 생성시키고 얻는 방법은 당해 분야에 널리 공지되어 있다[Schreiber, Science 2000; 151:1964-1969; Radmann et al., Science 2000; 151:1947-1948, 이러한 문헌은 본원에 참고로 포함됨].
II. 리포터 시스템
A. 핵산 리포터
리포터는 바코드 영역을 포함하는데, 이는 활성화된 수용체를 식별할 수 있는 인덱스 영역을 포함한다. 인덱스 영역은 길이가 적어도, 최대, 또는 정확하게, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 150, 200개 또는 그 초과(또는 그 안에서 도출 가능한 임의의 범위)의 뉴클레오티드의 폴리뉴클레오티드일 수 있다. 바코드는 하나 이상의 공통 PCR 영역, 어댑터, 링커, 또는 이들의 조합을 포함할 수 있다.
바코드의 인덱스 영역은 사용되는 스크린의 맥락에서 특정 이종 수용체에 고유하기 때문에 바코드와 동일한 세포에서 활성화되고/거나 발현되는 이종 수용체를 식별하기 위해 사용될 수 있는 폴리뉴클레오티드 서열이다. 세포의 집단과 관련된 구체예에서, 바코드의 동일성을 결정하는 것은 세포의 집단에서 수용체(들)가 활성화되었는 지를 식별하기 위해 인덱스 영역의 뉴클레오티드 서열을 결정함으로써 수행된다. 본원에서 논의된 바와 같이, 방법은 하나 이상의 인덱스 영역을 시퀀싱하거나 시퀀싱된 이러한 인덱스 영역을 갖는 것을 포함할 수 있다.
핵산 작제물은 폴리머라아제의 사용 및 고체 상태 핵산 합성(예를 들어, 컬럼, 다중벽 플레이트, 또는 마이크로어레이 상에서)을 통하는 것을 포함하는, 당해 분야에 공지된 임의의 수단에 의해 생성된다. 본 발명은 활성화된 수용체의 표시(indication)일 수 있는, 특정 핵산 조절 요소(즉, 수용체-반응 요소)의 활성의 결정을 용이하게 하기 위해, 바코드의 포함을 제공한다. 이러한 바코드는 핵산 조절 요소를 함유한 핵산 작제물 및 발현 벡터에 포함된다. 바코드의 각 인덱스 영역은 상응하는 이종 수용체 유전자에 고유하다(즉, 특정 핵산 조절 요소가 1 초과의 바코드 또는 인덱스 영역(예를 들어, 2, 3, 4, 5, 10, 또는 그 초과)을 가질 수 있음에도 불구하고, 각 바코드는 단일 수용체의 활성화를 나타냄). 이러한 바코드는 연관된 오픈 리딩 프레임과 동일한 mRNA 전사체에서 전사되도록 발현 벡터에서 배향된다. 바코드는 mRNA 전사체에서 5'에서 오픈 리딩 프레임으로, 3'에서 오픈 리딩 프레임으로서, 바로 5'에서 말단 폴리-A 테일로, 또는 이들 사이의 어느 곳에서 배향될 수 있다. 일부 구체예에서, 바코드는 3' 비번역 영역에 존재한다.
바코드의 고유 부분은 바코드 서열의 길이에 따라 연속적일 수 있거나, 바코드는 임의의 하나의 바코드에 고유하지 않은 핵산 서열의 스트레치(stretch)를 포함할 수 있다. 일 적용에서, 바코드의 고유 부분(즉, 인덱스 영역(들))은 mRNA(예를 들어, 인트론)로의 전사 동안 세포 기구(cellular machinery)에 의해 제거되는 핵산의 스트레치에 의해 분리될 수 있다.
유도성 리포터는 조절 요소, 예를 들어, 프로모터, 및 바코드를 포함한다. 일부 구체예에서, 조절 요소는 오픈 리딩 프레임을 추가로 포함한다. 오픈 리딩 프레임은 본원에 기술된 바와 같이, 선택 가능한 또는 스크리닝 가능한 마커에 대해 엔코딩할 수 있다. 핵산 조절 요소는 5', 3'이거나, 오픈 리딩 프레임 내에 있을 수 있다. 바코드는 mRNA로 전사되는 영역 내의 어느 곳에나 위치될 수 있다(예를 들어, 오픈 리딩 프레임의 업스트림, 오픈 리딩 프레임의 다운스트림, 또는 오픈 리딩 프레임 내). 중요하게, 바코드는 전사 종료 사이트에 대해 5'에 위치된다.
바코드 및/또는 인덱스 영역은 정량적 시퀀싱(예를 들어, Illumina® 시퀀서를 이용함) 또는 정량적 하이브리드화 기술(예를 들어, 마이크로어레이 하이브리드화 기술 또는 Luminex® 비드 시스템을 이용함)을 포함하는, 당해 분야에 공지된 방법에 의해 정량화되거나 결정된다. 시퀀싱 방법은 본원에 추가로 기술되어 있다.
B. 바코드를 검출하기 위한 시퀀싱 방법
1. 대량 병렬 시그니처 시퀀싱(Massively parallel signature sequencing; MPSS)
최초 차세대 시퀀싱 기술인 대량 병렬 시그니처 시퀀싱(또는 MPSS)은 1990년대에 Lynx Therapeutics에서 개발되었다. MPSS는 어댑터 결찰 이후 어댑터 디코딩의 복잡한 방법을 사용하는 비드-기반 방법으로서, 이는 서열을 4개의 뉴클레오티드의 증분으로 판독한다. 이러한 방법은 서열-특이적 바이어스 또는 특정 서열의 손실이 발생되기 쉽다. 이러한 기술이 너무 복잡하기 때문에, MPSS는 단지, Lynx Therapeutics에 의해 '인-하우스'로 수행되었으며, DNA 시퀀싱 기계는 독립 실험실에 판매되지 않았다. Lynx Therapeutics는 2004년에 Solexa(후에 Illumina에 의해 인수됨)와 합병되어, Manteia Predictive Medicine으로부터 획득된 합성에 의한 시퀀싱, 더 단순한 방법을 개발하였으며, 이로 MPSS가 더 이상 사용되지 않았다. 그러나, MPSS 출력의 필수 성질은 수십만 개의 짧은 DNA 서열을 포함하는 후속 "차세대" 데이터 타입에서 통상적이었다. MPSS의 경우에, 이러한 것은 통상적으로, 유전자 발현 수준의 측정을 위한 cDNA를 시퀀싱하기 위해 통상적으로 사용되었다. 실제로, 강력한 Illumina HiSeq2000, HiSeq2500 및 MiSeq 시스템은 MPSS를 기초로 한 것이다.
2. 폴로니 시퀀싱(Polony sequencing)
하바드9Harvard)에서 George M. Church의 실험실에서 개발된 폴로니 시퀀싱 방법은 첫번째 차세대 시퀀싱 시스템 중 하나이고, 2006년에 전체 거놈을 시퀀싱하기 위해 이용되었다. 이는 시험관내 쌍-태그 라이브러리를 에멀젼 PCR, 자동화된 현미경, 및 서열 및 E. coli 게놈에 대한 결차-기반 시퀀싱 화학을, >99.9999%의 정확성 및 Sanger 시퀀싱 보다 대략 1/9의 비용으로 결합하였다. 이러한 기술은 Agencourt Biosciences에 라이센스를 부여하고, 후속하여, Agencourt Personal Genomics 내로 스피닝되고, 결국, 현재 Life Technologies에 의해 소유된, Applied Biosystems SOLiD 플랫폼 내로 도입되었다.
3. 454 피로시퀀싱
피로시퀀싱의 병렬화된 버젼은 454 Life Sciences에 의해 개발되었는데, 이는 이후에 Roche Diagnostics에 의해 인수되었다. 본 방법은 오일 용액 중 물 점적 내측에서 DNA를 증폭시키며(에멀젼 PCR), 각 점적은 이후에 클론 콜로니를 형성하는 단일 프라이머-코팅된 비드에 부착된 단일 DNA 주형을 함유한다. 시퀀싱 기계는 각각이 단일 비드 및 시퀀싱 효소를 함유한 수 피코리터-부피 웰을 함유한다. 피로시퀀싱은 초기 DNA에 첨가된 개개 뉴클레오티드의 검출을 위해 광을 생성시키기 위해 루시페라아제를 사용하며, 조합된 데이터는 서열 판독을 생성하기 위해 사용된다. 이러한 기술은 한 단부 상에 Sanger 시퀀싱 및 다른 단부에서 Solexa 및 SOLiD와 비교하여 염기 당 중간 리드 길이 및 가겨을 제공한다.
4. Illumina(Solexa) 시퀀싱
현재 Illumina의 일부인 Solexa는 내부적으로 개발된 역 염료-종결 인자 기술, 및 조작된 폴리머라아제를 기초로 한 시퀀싱 방법을 개발하였다. 말단화된 화학은 Solexa에서 내부적으로 개발되었으며, Solexa 시스템의 개념은 캠브리지 대학의 화학부로부터 Balasubramanian 및 Klennerman에 의해 발명되었다. 2004년에, Solexa는 "DNA 클러스터"를 기초로 한 대규모 병렬 시퀀싱 기술을 얻기 위해 회사 Manteia Predictive Medicine가 인수하였으며, 이는 표면 상에 DNA의 클론 증폭을 포함한다. 클러스터 기술은 후에 Lynx와 합병되어 Solexa Inc.를 형성하는 Lynx Therapeutics of California. Solexa Ltd.로 동시에 획득되었다.
이러한 방법에서, DNA 분자 및 프라이머는 먼저 슬라이드 상에 부착되고, 후에 만들어진 "DNA 클러스터"인 국소 클론 DNA 콜로니가 형성되도록 폴리머라아제로 증폭된다. 서열을 결정하기 위하여, 4가지 타입의 역 종결 인자 염기(RT-염기)가 첨가되며, 도입되지 않은 뉴클레오티드가 세척된다. cAMera는 형광으로 표지된 뉴클레오티드의 이미지를 얻으며, 이후에, 말단 3' 블로커와 함께 염료는 DNA로부터 화학적으로 제거되어, 다음 사이클을 개시할 수 있게 한다. 피로시퀀싱과는 달리, DNA 사슬은 한번에 하나의 뉴클레오티드를 확장되며, 이미지 획득은 지연된 순간에 수행될 수 있으며, 이는 단일 카메라로부터 얻어진 순차적 이미지에 의해 DNA 콜로니의 매우 큰 어레이를 캡쳐할 수 있게 한다.
효소 반응 및 이미지 캡쳐의 디커플링은 최적의 처리량 및 이론적으로 무제한 시퀀싱 용량을 허용한다. 이에 따라, 최적의 구성과 관련하여, 공극적으로 도달 가능한 기기 처리량은 오로지 카메라의 아날로그-대-디지털 전환 속도에 의해 좌우되며, 이는 카메라의 수를 곱하고 이를 최적으로 시각화하기 위해 요구되는 DNA 콜로니당 픽셀의 수(대략 10 픽섹/콜로니)로 나눈 것이다. 2012년에, 10 MHz A/D 이상의 전환 속도 이상에서 작동하는 카메라 및 이용 가능한 옵틱, 유체학 및 효소학을 이용하여, 처리량은 수 백만개의 뉴클레오티드/초일 수 있으며, 이는 대략, 기기 당 1시간 당 1배 커버리지에서 균등한 하나의 인간 게놈, 및 (단일 카메라가 장착된) 기기 당 하루 당 (대략 30배로) 재-시퀀싱된 하나의 인간 게놈에 해당한다.
5. SOLiD 시퀀싱
Applied Biosystems'(현재 Life Technologies 브랜드) SOLiD 기술은 결찰에 의해 시퀀싱을 이용한다. 여기에서, 고정된 길이의 모든 가능한 올리고뉴클레오티드의 풀은 시퀀싱된 위치에 따라 표지된다. 올리고뉴클레오티드는 어닐링되고 결찰된다. 서열을 매칭시키기 위한 DNA 리가아제에 의한 우선적 결찰은 그러한 위치에서 뉴클레오티드에 대한 정보를 나타내는 신호를 야기시킨다. 시퀀싱 전에, DNA는 에멀젼 PCR에 의해 증폭된다. 각각이 동일한 DNA 분자의 단일 카피를 함유한 얻어진 비드는 유리 슬라이드 상에 증착된다. 결과는 Illumina 시퀀싱과 유사한 양 및 길이의 서열이다. 결찰 방법에 의한 이러한 시퀀싱은 일부 문제 시퀀싱 회문 서열을 갖는 것을 보고하였다.
6. 이온 토렌트 반도체 시퀀싱
이온 Torrent Systems Inc.(현재 Life Technologies에 의해 소유됨)는 표준 시퀀싱 화학을 이용하는 기초로 하지만, 신규한, 반도체 기반 검출 시스템을 갖는 시스템을 개발하였다. 이러한 시퀀싱 방법은 다른 시퀀싱 시스템에서 사용되는 광학적 방법과는 상반되게, DNA의 중합 동안 방출되는 수소 이온의 검출을 기초로 한 것이다. 시퀀싱되는 주형 DNA 가닥을 함유한 마이크로웰은 단일 타입의 뉴클레오티드로 플로딩된다. 도입된 뉴클레오티드가 선두 주형 뉴클레오티드에 대해 상보적인 경우에, 이는 성장하는 상보적 가닥 내에 도입된다. 이는 과민성 이온 센서를 작동시키는 수소 이온의 방출을 야기시키는데, 이는 반응이 일어남을 지시하는 것이다. 호모폴리머 반복이 주형 서열에 존재하는 경우에, 다수의 뉴클레오티드는 단일 사이클에 도입될 것이다. 이는 상응하는 수의 방출된 수소 및 비례하여 더 높은 전자 신호를 야기시킨다.
7. DNA 나노볼 시퀀싱(DNA nanoball sequencing)
DNA 나노볼 시퀀싱은 유기체의 전체 게놈 서열을 결정하기 위해 사용되는 한 타입의 고처리량 시퀀싱 기술이다. 회사 Complete Genomics는 독립 연구자에 의해 제출된 샘플을 시퀀싱하기 위해 이러한 기술을 이용한다. 이러한 방법은 DNA 나노볼 내에 게놈 DNA의 작은 단편을 증폭시키기 위해 롤링 사이클 복제를 이용한다. 결찰에 의한 사슬화되지 않은 시퀀싱은 이후에, 뉴클레오티드 서열을 결정하기 위해 사용된다. 이러한 DNA 시퀀싱 방법은 실행 당 큰 수의 시퀀싱되는 DNA 나노볼을 허용하고 및 다른 차세대 시퀀싱 플랫폼과 비교하여 낮은 시약 비용을 허용한다. 그러나, DNA의 단지 짧은 서열은 참조 게놈에 대한 짧은 리드를 맵핑하는데 어렵게 만드는 각 DNA 나노볼로부터 결정된다. 이러한 기술은 다수의 게놈 시퀀싱 프로젝트를 위해 사용되었고 더욱 많은 프로젝트를 위해 사용될 계획이다.
8. 헬리스코프 단일 분자 시퀀싱
헬리스코프 시퀀싱은 Helicos Biosciences에 의해 개발된 단일-분자 시퀀싱의 방법이다. 이는 흐름 세포 표면에 부착된 폴리-A 테일 어댑터가 첨가된 DNA 단편을 사용한다. 다음 단계는 형광으로 표지된 뉴클레오티드로(Sanger 방법과 같이, 1회에 하나의 뉴클레오티드 타입)의 흐름 세포의 사이클릭 세척과 함께 확장-기반 시퀀싱을 포함한다. 리드는 헬리스코프 시퀀서에 의해 수행된다. 리드는 실행 당 짧은, 최대 55개의 염기이지만, 최근 개선은 한 타입의 뉴클레오티드의 스트레치의 더욱 정확한 리드를 가능하게 한다. 이러한 시퀀싱 방법 및 장치는 M13 박테리오파지의 게놈을 시퀀싱하기 위해 사용되었다.
9. 단일 분자 실시간(SMRT) 시퀀싱
SMRT 시퀀싱은 합성 방법에 의한 시퀀싱을 기초로 한 것이다. DNA는 웰의 바닥에 위치된 포집 툴을 갖는 0-모드 도파관(ZMW), 즉, 작은 웰-유사 용기에서 합성된다. 시퀀싱은 비변형된 폴리머라아제(ZMW 바닥에 부착됨) 및 용액 중에서 자유롭게 흐르는 형광으로 표지된 뉴클레오티드의 사용으로 수행된다. 웰은 웰의 바닥에 의해 일어나는 형광만이 검출되는 방식으로 구조화된다. 형광 표지는 DNA 가닥 내에 이의 도입 시에 뉴클레오티드로부터 분리되어, 비변형된 DNA 가닥을 남긴다. SMRT 기술 개발업체인 Pacific Biosciences에 따르면, 이러한 방법은 뉴클레오티드 변형(예를 들어, 시토신 메틸화)의 검출을 허용한다. 이는 폴리머라아제 동력학의 관찰을 통해 일어난다. 이러한 방법은 20,000개의 뉴클레오티드 이상의 리드를 허용하며, 평균 5 킬로염기의 평균 리드 길이를 갖는다.
C. 유전자 또는 바코드 발현의 측정
본 개시내용의 구체예는 리포터 바코드 및/또는 리포터 유전자 또는 오픈 리딩 프레임의 발현을 결정하는 것에 관한 것이다. 리포터의 발현은 바코드 또는 인덱스 영역의 RNA 전사체 및 리포터 작제물로부터 발현된 임의의 다른 폴리뉴클레오티드의 수준을 측정함으로써 결정될 수 있다. 이러한 목적을 위한 적합한 방법은 RT-PCR, 노던 블롯, 인시튜 하이브리드화, 써던 블롯, 슬롯-블롯팅, 뉴클레아제 보호 검정 및 올리고뉴클레오티드 검정을 포함하지만, 이로 제한되지 않는다.
특정 양태에서, 세포로부터 단리된 RNA는 검출 및/또는 정량화 전에 cDNA 또는 cRNA로 증폭될 수 있다. 단리된 RNA는 전체 RNA 또는 mRNA 중 어느 하나일 수 있다. RNA 증폭은 특이적이거나 비-특이적일 수 있다. 일부 구체예에서, 증폭은 이러한 것이 리포터 바코드 또는 이의 영역, 예를 들어, 인덱스 영역을 특이적으로 증폭한다는 점에서 특이적이다. 일부 구체예에서, 증폭 및/또는 역전사효소 단계는 랜덤 프라이밍(random priming)을 배제한다. 적합한 증폭은 역전사효소 PCR, 등온 증폭, 리가아제 연쇄 반응, 및 Q베타 레플리카아제를 포함하지만, 이로 제한되지 않는다. 증폭된 핵산 산물은 표지된 프로브에 대한 하이브리드화를 통해 검출 및/또는 정량화될 수 있다. 일부 구체예에서, 검출은 형광 공명 에너지 전이(fluorescence resonance energy transfer; FRET) 또는 일부 다른 부류의 양자점을 포함할 수 있다.
리포터 바코드를 위한 증폭 프라이머 또는 하이브리드화 프로브는 리포터의 발현된 부분의 서열로부터 제조될 수 있다. 본원에서 사용되는 용어 "프라이머" 또는 "프로브"는 주형-의존 과정에서 초기 핵산의 합성을 프라이밍할 수 있는 임의의 핵산을 포함하는 것을 의미한다. 통상적으로, 프라이머는 길이가 10 내지 20 및/또는 30개의 염기쌍의 올리고뉴클레오티드이지만, 더 긴 서열이 사용될 수 있다. 프라이머는 이중-가닥 및/또는 단일-가닥 형태로 제공될 수 있으며, 단일-가닥 형태가 바람직하다.
길이가 13 내지 100개의 뉴클레오티드, 특히, 17 내지 100개의 뉴클레오티드, 또는 일부 양태에서, 길이가 최대 1000 내지 2000개 이상의 염기인 프로브 또는 프라이머의 사용은 안정하고 민감한 이중 분자의 형성을 가능하게 한다. 길이가 20개 초과의 염기인 인접 스트레치에 걸쳐 상보적인 서열을 갖는 분자는 얻어진 하이브리드 분자의 안정성 및/또는 민감성을 증가시키기 위해 사용될 수 있다. 20 내지 30개의 뉴클레오티드, 또는 요망되는 경우, 심지어 더 긴 뉴클레오티드의 하나 이상의 상보적 서열을 갖는 하이브리드화를 위한 핵산 분자가 설계될 수 있다. 이러한 단편은 예를 들어, 화학적 수단에 의해 단편을 직접적으로 합성함으로써 또는 재조합 생산을 위해 선택된 서열을 재조합 벡터 내에 도입함으로써, 용이하게 제조될 수 있다.
일 구체예에서, 각 프로브/프라이머는 적어도 15개의 뉴클레오티드를 포함한다. 예를 들어, 각 프로브는 적어도 또는 최대 20, 25, 50, 75, 100, 125, 150, 175, 200, 225, 250, 275, 300, 325, 350, 400개 또는 그 초과의 뉴클레오티드(또는 그 안에서 도출 가능한 임의의 범위)를 포함할 수 있다. 이러한 것은 이러한 길이를 가질 수 있고, 본원에 기술된 유전자와 동일하거나 상보적인 서열을 가질 수 있다. 특히, 각 프로브/프라이머는 비교적 높은 서열 복잡성을 가지고, 임의의 모호한 잔기(결정되지 않은 "n" 잔기)를 가지지 않는다. 프로브/프라이머는 엄격한 또는 매우 엄격한 조건 하에서, 이의 RNA 전사체를 포함하는 타겟 유전자에 하이브리드화할 수 있다. 일부 구체예에서, 바이오마커 각각이 하나 초과의 인간 서열을 갖기 때문에, 프로브 및 프라이머가 이러한 서열 각각과 함께 사용하기 위해 설계될 수 있다는 것이 고려된다. 예를 들어, 이노신은 하나 초과의 서열에 하이브리드화하기 위해 프로브 또는 프라이머에서 종종 사용되는 뉴클레오티드이다. 프로브 또는 프라이머가 특정 바이오마커에 대한 하나 초과의 인간 서열의 인식을 수용하는 이노신 또는 다른 설계 구현예를 가질 수 있다는 것이 고려된다.
높은 민감성을 필요로 하는 적용을 위하여, 통상적으로, 하이브리드를 형성하기 위해 비교적 높은 엄격 조건을 이용하는 것이 요망될 것이다. 예를 들어, 약 50
Figure 112020012335190-pct00048
내지 약 70
Figure 112020012335190-pct00049
의 온도에서 약 0.02 M 내지 약 0.10 M NaCl에 의해 제공되는 것과 같은, 비교적 낮은 염 및/또는 높은 온도 조건. 이러한 높은 엄격한 조건은 임의의 경우에, 프로브 또는 프라이머와 주형 또는 타겟 가닥 간의 미스매치를 거의 허용하지 않고, 특정 유전자를 단리시키거나 특정 mRNA 전사체를 검출하기에 특히 적합할 것이다. 일반적으로, 조건이 증가하는 양의 포름아미드의 첨가에 의해 더욱 엄격해질 수 있다는 것이 인식된다.
일 구체예에서, 정량적 RT-PCR(예를 들어, TaqMan, ABI)은 샘플에서 RNA 전사체의 수준을 검출하고 비교하기 위해 사용된다. 정량적 RT-PCR은 RNA의 cDNA로의 역전사(RT), 이후, 상대 정량적 PCR(RT-PCR)을 포함한다. PCR 과정의 선형 부분에서 타겟 DNA의 농도는 PCR이 개시되기 전 타겟의 출발 농도에 비례한다. 동일한 사이클 수를 완료하고 이의 선형 범위에 있는 PCR 반응에서 타겟 DNA의 PCR 산물의 농도를 결정함으로써, 본래 DNA 혼합물에서 특정 타겟 서열의 상대적인 농도를 결정하는 것이 가능하다. DNA 혼합물이 상이한 조직 또는 세포로부터 단리된 RNA로부터 합성된 cDNA인 경우에, 타겟 서열이 유도된 특정 mRNA의 상대적 존재비는 개개 조직 또는 세포에 대해 결정될 수 있다. PCR 산물의 농도와 상대적 mRNA 존재비 간의 직접적인 비례는 PCR 반응의 선형 범위 부분에서 그러하다. 곡선의 플래토(plateau) 부분에서 타겟 DNA의 최종 농도는 반응 혼합물에서 시약의 유용성에 의해 결정되고, 타겟 DNA의 본래 농도에 독립적이다. 이에 따라, 증폭된 PCR 산물의 샘플링 및 정량화는 PCR 반응이 이의 곡선의 선형 부분에 있을 때 수행될 수 있다. 또한, 증폭 가능한 cDNA의 상대적 농도는 내부에 존재하는 RNA 종 또는 외부적으로 도입된 RNA 종 중 어느 하나를 기초로 할 수 있는, 일부 독립적인 표준으로 정규화될 수 있다. 특정 mRNA 종의 존재비는 또한, 샘플에서 모든 mRNA 종의 평균 존재비에 대해 결정될 수 있다.
일 구체예에서, PCR 증폭은 하나 이상의 내부 PCR 표준물을 사용한다. 내부 표준물은 세포에서 풍부한 하우스키핑 유전자일 수 있거나, 이는 상세하게, GAPDH, GUSB 및 -2 마이크로글로불린일 수 있다. 이러한 표준물은, 상이한 유전자 산물의 발현 수준이 직접적으로 비교될 수 있도록 발현 수준을 정규화하기 위해 사용될 수 있다. 당업자는 발현 수준을 정규화하기 위해 내부 표준물을 사용하는 방법을 인지할 것이다.
일부 샘플에서 내재되어 있는 문제는 이러한 것이 가변 양 및/또는 품질을 갖는다는 것이다. 이러한 문제는 RT-PCR이 내부 표준물과 함께 상대 정량적 RT-PCR로서 수행되는 경우에 극복될 수 있으며, 여기서, 내부 표준물은 타겟 cDNA 단편과 유사하거나 이보다 큰 증폭 가능한 cDNA 단편이며, 내부 표준물을 엔코딩하는 mRNA의 존재비는 타겟을 엔코딩하는 mRNA보다 대략 5 내지 100배 더 높다. 이러한 검정은 개개 mRNA 종의 절대 존재비가 아닌, 상대 존재비를 측정한다.
다른 구체예에서, 상대 정량적 RT-PCR은 외부 표준 프로토콜을 이용한다. 이러한 프로토콜 하에서, PCR 산물은 이의 증폭 곡선의 선형 부분에서 샘플링된다. 샘플을 위해 최적화된 PCR 사이클 수는 각 타겟 cDNA 단편에 대해 경험적으로 결정될 수 있다. 또한, 다양한 샘플로부터 단리된 각 RNA 집단의 역전사효소 산물은 동일한 농도의 증폭 가능한 cDNA에 대해 정규화될 수 있다.
핵산 어레이는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 150, 200, 250개 또는 그 초과의 상이한 폴리뉴클레오티드 프로브를 포함할 수 있으며, 이는 상이한 및/또는 동일한 바이오마커에 하이브리드화할 수 있다. 동일한 유전자에 대한 다수의 프로브는 단일 핵산 어레이 상에서 사용될 수 있다. 다른 질병 유전자에 대한 프로브가 또한, 핵산 어레이에 포함될 수 있다. 어레이 상의 프로브 밀도는 임의의 범위일 수 있다. 일부 구체예에서, 밀도는 50, 100, 200, 300, 400, 500개 또는 그 초과의 프로브/cm2일 수 있다.
상세하게, 하시아(Hacia) 등(1996) 및 슈메이커(Shoemaker) 등(1996)에 의해 기술된 것과 같은 칩-기반 핵산 기술이 고려된다. 간단하게, 이러한 기술은 다수의 유전자를 빠르고 정확하게 분석하기 위한 정량적 방법을 포함한다. 유전자를 올리고뉴클레오티드로 태그화함으로써 또는 고정된 프로브 어레이를 사용함으로써, 하이브리드화를 기초로 하여 타겟 분자를 고밀도 어레이로서 분리하고 이러한 분자를 스크리닝하는 칩 기술이 이용될 수 있다[또한, 문헌[Pease et al., 1994; 및 Fodor et al, 1991] 참조]. 이러한 기술이 진단, 예후, 및 치료 방법과 관련하여 하나 이상의 암 바이오마커의 발현 수준을 평가하는 것과 함께 이용될 수 있다는 것이 고려된다.
특정 구체예는 어레이 또는 어레이로부터 생성된 데이터의 사용을 포함할 수 있다. 데이터는 용이하게 입수 가능할 수 있다. 또한, 어레이는 이후에 상관관계 연구에서 이용될 수 있는 데이터를 생성하기 위해 준비될 수 있다.
어레이는 일반적으로, 복수의 mRNA 분자 또는 cDNA 분자와 완전히 또는 거의 상보적이거나 동일하고 공간적으로 분리된 조직화에서 지지 물질 상에 정위되어 있는 핵산 분자(프로브)의 정렬된 마크로어레이 또는 마이크로어레이를 지칭한다. 마크로어레이는 통상적으로, 프로브가 그 위에 스폿팅되어 있는 니트로셀룰로오스 또는 나일론의 시트이다. 마이크로어레이는 10,000개 이하의 핵산 분자가 통상적으로 1 내지 4 제곱센티미터의 영역 내에 피팅될 수 있도록 핵산 프로브를 더욱 조밀하게 정위시킨다. 마이크로어레이는 핵산 분자, 예를 들어, 유전자, 올리고뉴크레오티드, 등을 기판 상에 스폿팅하거나 기판 상에서 인시튜로 올리고뉴클레오티드 서열을 제조함으로써 제조될 수 있다. 스폿팅되거나 제조된 핵산 분자는 제곱 센티미터 당 약 30개 이하의 동일하지 않은 핵산 분자, 또는 더 높은, 예를 들어, 제곱 센티미터 당 약 100개 이하 또는 심지어 1000개 이하의 동일하지 않은 핵산 분자의 고밀도 매트릭스 패턴에서 적용될 수 있다. 마이크로어레이는 통상적으로, 필터 어레이의 니트로셀룰로오스-기반 물질과는 상반되게, 고체 지지체로서 코팅된 유리를 사용한다. 상보적인 핵산 샘플의 정렬된 어레이를 가짐으로써, 각 샘플의 위치는 트래킹되고 본래 샘플에 결합될 수 있다. 복수의 별개의 핵산 프로브가 고체 지지체의 표면과 안정하게 결합되어 있는 다양한 상이한 어레이 디바이스는 당업자에게 공지되어 있다. 어리에의 유용한 기판은 나일론, 유리 및 실리콘을 포함한다. 이러한 어레이는 평균 프로브 길이, 프로브의 서열 또는 타입, 프로브와 어레이 표면 간의 결합 특성, 예를 들어, 공유 또는 비-공유, 등을 포함하는 다수의 상이한 방식으로 다양할 수 있다. 표지화 및 스크리닝 방법 및 어레이는 프로브가 발현 수준을 검출하는 것을 제외한 임의의 파라미터와 관련한 이의 유용성으로 제한되지 않으며, 결과적으로, 방법 및 조성물은 다양한 상이한 타입의 유전자와 함께 사용될 수 있다.
마이크로어레이를 제조하기 위한 예시적인 방법 및 장치는 예를 들어, 미국특허 5,143,854; 5,202,231; 5,242,974; 5,288,644; 5,324,633; 5,384,261; 5,405,783; 5,412,087; 5,424,186; 5,429,807; 5,432,049; 5,436,327; 5,445,934; 5,468,613; 5,470,710; 5,472,672; 5,492,806; 5,525,464; 5,503,980; 5,510,270; 5,525,464; 5,527,681; 5,529,756; 5,532,128; 5,545,531; 5,547,839; 5,554,501; 5,556,752; 5,561,071; 5,571,639; 5,580,726; 5,580,732; 5,593,839; 5,599,695; 5,599,672; 5,610;287; 5,624,711; 5,631,134; 5,639,603; 5,654,413; 5,658,734; 5,661,028; 5,665,547; 5,667,972; 5,695,940; 5,700,637; 5,744,305; 5,800,992; 5,807,522; 5,830,645; 5,837,196; 5,871,928; 5,847,219; 5,876,932; 5,919,626; 6,004,755; 6,087,102; 6,368,799; 6,383,749; 6,617,112; 6,638,717; 6,720,138, 뿐만 아니라, WO 93/17126; WO 95/11995; WO 95/21265; WO 95/21944; WO 95/35505; WO 96/31622; WO 97/10365; WO 97/27317; WO 99/35505; WO 09923256; WO 09936760; WO0138580; WO 0168255; WO 03020898; WO 03040410; WO 03053586; WO 03087297; WO 03091426; WO03100012; WO 04020085; WO 04027093; EP 373 203; EP 785 280; EP 799 897 및 UK 8 803 000에 기술되어 있으며, 이러한 문헌의 개시내용은 모두 본원에 참고로 포함된다.
어레이가 100개 이상의 상이한 프로브를 함유하는 고밀도 어레이일 수 있다는 것이 고려된다. 이러한 것은 1000, 16,000, 65,000, 250,000 또는 1,000,000개 이상의 상이한 프로브를 함유할 수 있다는 것이 고려된다. 올리고뉴클레오티드 프로브의 길이는 일부 구체예에서 5 내지 50, 5 내지 45, 10 내지 40, 또는 15 내지 40개의 뉴클레오티드의 범위이다. 특정 구체예에서, 올리고뉴클레오티드 프로브의 길이는 20 내지 25개의 뉴클레오티드이다.
어레이에서 각 상이한 프로브 서열의 위치 및 서열은 일반적으로 공지되어 있다. 또한, 다수의 상이한 프로브가 비교적 작은 구역을 점유하여, 1 cm2 당 약 60, 100, 600, 1000, 5,000, 10,000, 40,000, 100,000, 또는 400,000개의 상이한 올리고뉴클레오티드 프로브 보다 큰 프로브 밀도를 갖는 고밀도 어레이를 제공할 수 있다. 어레이의 표면적은 대략 1, 1.6, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 cm2 또는 약 1, 1.6, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 cm2 미만일 수 있다.
또한, 당업자는 어레이를 이용하여 생상된 데이터를 용이하게 분석할 수 있다. 이러한 프로토콜은 WO 9743450; WO 03023058; WO 03022421; WO 03029485; WO 03067217; WO 03066906; WO 03076928; WO 03093810; WO 03100448A1에서 확인된 정보를 포함하며, 이러한 문헌 모두는 상세하게 참고로 포함된다.
일 구체예에서, 뉴클레아제 보호 검정은 암 샘플로부터 유도된 RNA를 정량화하기 위해 사용된다. 당업자에게 공지된 여러 상이한 버젼의 뉴클레아제 보호 검정이 존재한다. 이러한 뉴클레아제 보호 검정이 갖는 공통의 특징은 이러한 것이 정량화되는 RNA와 안티센스 핵산의 하이브리드화를 포함한다는 점이다. 얻어진 하이브리드 이중-가닥 분자는 이후에, 이중-가닥 분자 보다 더욱 효율적으로 단일-가닥 핵산을 소화시키는 뉴클레아제로 소화된다. 소화에서 생존하는 안티센스 핵산의 양은 정량화되는 타겟 RNA 종의 양의 척도이다. 상업적으로 입수 가능한 뉴클레아제 보호 검정의 예는 Ambion, Inc.(Austin, Tex.)에 의해 제작된 RNase 보호 검정이다.
III. 수용체 유전자 및 유도성 리포터 첨가
특정 구체예에서, 수용체 유전자 및 유도성 리포터 시스템은 하나 이상의 보조 폴리펩티드에 대해 엔코딩하는 하나 이상의 폴리뉴클레오티드 서열을 포함한다. 예시적인 보조 폴리펩티드는 전사 인자, 단백질 또는 펩티드 태그, 및 스크리닝 가능하거나 선택 가능한 유전자를 포함한다.
A. 선택 및 스크리닝 유전자
본 개시내용의 특정 구체예에서, 유도성 리포터 및/또는 수용체 유전자는 선택 또는 스크리닝 유전자를 포함하거나, 추가로 포함할 수 있다. 또한, 본 개시내용의 세포, 벡터, 및 바이러스 입자는 선택 또는 스크리닝 유전자를 추가로 포함할 수 있다. 일부 구체예에서, 선택 또는 스크리닝 유전자는 선택 또는 스크리닝 단백질에 융합된 수용체 단백질을 포함하는 하나의 융합 단백질이 세포에 존재하도록 수용체 유전자에 융합된다. 이러한 유전자는 이종 수용체 유전자의 활성화를 갖는 세포의 용이한 식별을 허용하도록 세포에 대한 식별 가능한 변화를 부여할 것이다. 일반적으로, 선택 가능한 유전자(즉, 선택 유전자)는 선택을 허용하는 성질을 부여하는 것이다. 양성 선택 가능한 유전자는 유전자 또는 유전자 산물의 존재가 이의 선택을 허용하는 것이며, 음성 선택 가능한 유전자는 유전자 또는 유전자 산물의 존재가 이의 선택을 방해하는 것이다. 양성 선택 가능한 유전자의 일 예는 항생제 내성 유전자이다.
대개, 약물 선택 유전자의 포함은 예를 들어, 성공적인 리간드 결합을 통해 활성화된 수용체 유전자를 갖는 세포의 클로닝 및 식별을 돕는다. 선택 유전자는 예를 들어, 네오마이신, 푸로마이신, 히그로마이신, DHFR, GPT, 제오신, G418, 플레오마이신, 블라스티시딘, 및 히스티디놀에 대해 내성을 부여하는 유전자일 수 있다. 조건의 구현을 기초로 하여 수용체 활성화의 구별을 허용하는 표현형을 부여하는 유전자 이외에, 유전자 산물이 비색 분석을 제공하는, 스크리닝 가능한 유전자, 예를 들어, GFP를 포함하는 다른 타입의 유전자가 또한 고려된다. 대안적으로, 스크리닝 가능한 효소, 예를 들어, 단순 포진 바이러스 티미딘 키나아제(tk) 또는 클로람페니콜 아세틸트랜스퍼라아제(CAT)가 사용될 수 있다. 당업자는 또한, FACS 분석과 함께, 스크리닝 가능한 유전자 및 이의 단백질 산물을 사용하는 방법을 인지할 수 있을 것이다. 선택 가능하고 스크리닝 가능한 유전자의 추가 예는 당업자에게 널리 공지되어 있다. 특정 구체예에서, 유전자는 형광 단백질, 효소 활성 단백질, 발광 단백질, 광활성화 가능한 단백질, 광변화 가능한 단백질, 또는 비색 단백질을 생성한다. 형광 마커는 예를 들어, GFP 및 변이체, 예를 들어, YFP, RFP, 등, 및 다른 형광 단백질, 예를 들어, DsRed, mPlum, mCherry, YPet, Emerald, CyPet, T-Sapphire, 루시페라아제, 및 Venus를 포함한다. 광활성화 가능한 마커는 예를 들어, KFP, PA-mRFP, 및 Dronpa를 포함한다. 광변환 가능한 마커는 예를 들어, mEosFP, KikGR, 및 PS-CFP2를 포함한다. 발광 단백질은 예를 들어, Neptune, FP595, 및 피알리딘을 포함한다.
B. 단백질 또는 펩티드 태그
예시적인 단백질/펩티드 태그는 효소 BirA에 의해 바이티닐화를 가능하고 이에 따라 단백질이 스트렙타비딘에 의해 단리될 수 있는 펩티드인 AviTag(GLNDIFEAQKIEWHE, SEQ ID NO:4), 단백질 칼모둘린에 의해 결합된 펩티드인 칼모둘린-태그(KRRWKKNFIAVSAANRFKKISSSGAL, SEQ ID NO:5), Mono-Q와 같은 음이온-교환 수지에 효율적으로 결합하는 펩티드인 폴리글루타메이트 태그(EEEEEE, SEQ ID NO:6), 항체에 의해 인식된 펩티드인, E-태그(GAPVPYPDPLEPR, SEQ ID NO:7), 항체에 의해 인식된 펩티드인 FLAG-태그(DYKDDDDK, SEQ ID NO:8), 항체에 의해 인식된 헤마글루티닌으로부터의 펩티드인 HA-태그(YPYDVPDYA, SEQ ID NO:9), 니켈 또는 코발트 킬레이트에 의해 결합된 5 내지 10개의 히스티딘인 His-태그(HHHHHH, SEQ ID NO:10), 항체에 의해 인식된 c-myc로부터 유도된 펩티드인 Myc-태그(EQKLISEEDL, SEQ ID NO:11), 재조합 단백질의 웨스턴 블롯팅, ELICA, 유세포분석, 면역세포 화학, 면역침전, 및 친화력 정제를 포함하는 광범위한 스펙트럼의 적용에서 유용한, 모노클로날 IgG1 항체에 의해 인식된 신규한 18개 아미노산 합성 펩티드인 NE-태그(TKENPRSNQEESYDDNES, SEQ ID NO:12), 리보뉴클레아제 A로부터 유도된 펩티드인 S-태그(KETAAAKFERQHMDS, SEQ ID NO:13), 스트렙타비딘에 결합하는 펩티드인 SBP-태그(MDEKTTGWRGGHVVEGLAGELEQLRARLEHHPQGQREP, SEQ ID NO:14), 포유류 발현을 위한 Softag 1(SLAELLNAGLGGS, SEQ ID NO:15), 원핵세포 발현을 위한 Softag 3(TQDPSRVG, SEQ ID NO:16), 스트렙타비딘 또는 변형된 스트렙타비딘으로 불리워지는 스트렙탁틴에 결합하는 펩티드인 Strep-태그(Strep-태그 II: WSHPQFEK, SEQ ID NO:17), FlAsH 및 ReAsH 바이아르세니칼(biarsenical) 화합물에 의해 인식된 테트라시스테인 태그인 TC tag(CCPGCC, SEQ ID NO:18), 항체에 의해 인식된 펩티드인 V5 태그(GKPIPNPLLGLDST, SEQ ID NO:19), 항체에 의해 인식된 펩티드인 VSV-태그(YTDIEMNRLGK, SEQ ID NO:20), Xpress 태그(DLYDDDDK, SEQ ID NO:21), 필린-C 단백질에 공유 결합하는 펩티드인 공유 펩티드 태그, Isopeptag(TDKDMTITFTNKKDAE, SEQ ID NO:22), SpyCatcher 단백질에 공유 결합하는 펩티드인 SpyTag(AHIVMVDAYKPTK, SEQ ID NO:23), SnoopCatcher 단백질에 공유 결합된 펩티드인 SnoopTag(KLGDIEFIKVNK, SEQ ID NO:24), 스트렙타비딘에 의해 인식할 수 있는 BirA에 의해 바이오티닐화된 단백질 도메인인 BCCP(바이오틴 카복실 캐리어 단백질), 고정된 글루타티온에 결합하는 단백질인 글루타티온-S-트랜스퍼라아제-태그, 자발적으로 형광성이고 나노바디에 의해 결합될 수 있는 단백질인 녹색 형광 단백질-태그, 반응성 할로알칸 기질에 공유 결합하여 이러한 것이 매우 다양한 기질에 부착할 수 있는 돌연변이된 박테리아 할로알칸 데할로게나아제인 HaloTag, 아밀로오스 아가로오스에 결합하는 단백질인 말토오스 결합 단백질-태그, 다이머화 및 가용화를 허용하는, 면역글로불린 Fc 도메인으로부터 유도된, Nus-태그, 티오레독신-태그, Fc-태그를 포함한다. 단백질-A 세파로오스 상에서 정제를 위해, 무질서 증진 아미노산(P,E,S,T,A,Q,G,..)을 함유한 본질적으로 무질서하게 설계된 태그, 및 Ty-태그가 사용될 수 있다.
C. 전사 인자
일부 구체예에서, 수용체 유전자는 수용체 단백질 및 보조 폴리펩티드를 포함하는 융합 단백질에 대해 엔코딩한다. 일부 구체예에서, 보조 폴리펩티드는 전사 인자이다. 관련된 구체예에서, 유도성 리포터는 수용체-반응 요소를 포함하며, 여기서, 수용체-반응 요소는 전사 인자에 의해 결합된다. 이러한 전사 인자 및 반응 요소는 당해 분야에 공지되어 있고, 예를 들어, 테트라사이클린-반응 요소(TRE)를 통해 전사를 유도할 수 있는 역 테트라사이클린-제어 트랜스활성제(rtTA), GAL1 프로모터를 통해 전사를 유도하는 Gal4p, 및 리간드에 결합할 때, 에스트로겐 반응 요소를 통해 발현을 유도하는 에스트로겐 수용체를 포함한다. 이에 따라, 관련된 구체예는 보조 폴리펩티드 전사 인자의 전사를 활성화시키기 위해 리간드를 투여하는 것을 포함한다.
IV. 벡터 및 핵산
본 개시내용은 이종 수용체 유전자 및 유도성 리포터 중 하나 이상을 포함하는 핵산의 구체예를 포함한다. 용어 "올리고뉴클레오티드," "폴리뉴클레오티드," 및 "핵산"은 상호 교환 가능하게 사용되고, 왓슨-크릭 타입의 염기쌍, 염기 스택킹, 후그스틴 또는 역 후그스틴 타입의 염기쌍, 등과 같은, 모노머-대-모노머 상호작용의 규칙적인 패턴에 의해 타겟 폴리뉴클레오티드에 특이적으로 결합할 수 있는, 데옥시리보뉴클레오시드, 리보뉴클레오시드, 이의 α-아노머 형태, 펩티드 핵산(PNA), 등을 포함하는, 천연 또는 변형된 모노머의 선형 올리고머 또는 연결을 포함한다. 대개, 모노머는 수 개의 모노머 단위, 예를 들어, 3 내지 4개에서 수십개의 모노머 단위의 크기 범위의 올리고뉴클레오티드를 형성하기 위해 포스포디에스테르 결합 또는 이의 유사체에 의해 연결된다. 올리고뉴클레오티드가 문자 순서, 예를 들어, "ATGCCTG"에 의해 나타낼때 마다, 달리 주지하지 않는 한, 뉴클레오티드가 왼쪽에서 오른쪽으로 5'→3' 순서를 가지며, "A"가 데옥시아데노신을 나타내며, "C"가 데옥시시티딘을 나타내며, "G"가 데옥시구아노신을 나타내며, "T"가 티미딘을 나타내는 것으로 이해될 것이다. 포스포디에스테르 연결의 유사체는 포스포로티오에이트, 포스포로디티오에이트, 포스포라닐리데이트, 포스포라미데이트, 등을 포함한다. 천연 또는 비-천연 뉴클레오티드를 갖는 올리고뉴클레오티드가 사용될 수 있을 때, 예를 들어, 효소에 의한 처리가 요구되고, 대개, 천연 뉴클레오티드로 이루어진 올리고뉴클레오티드가 요구되는 경우 당업자에게 명백하다.
핵산은 "비변형된 올리고뉴클레오티드" 또는 "비변형된 핵산"일 수 있으며, 이는 일반적으로, 리보핵산(RNA) 또는 데옥시리보핵산(DNA)의 올리고머 또는 폴리머를 지칭한다. 일부 구체예에서, 핵산 분자는 비변형된 올리고뉴클레오티드이다. 이러한 용어는 천연 발생 핵염기, 당 및 공유 뉴클레오시드간 연결을 포함하는 올리고뉴클레오티드를 포함한다. 용어 "올리고뉴클레오티드 유사체"는 올리고뉴클레오티드와 유사한 방식으로 기능하는 하나 이상의 비-천연 발생 부분을 갖는 올리고뉴클레오티드를 지칭한다. 이러한 비-천연 발생 올리고뉴클레오티드는 종종, 예를 들어, 향상된 세포 섭취, 다른 올리고뉴클레오티드 또는 핵산 타겟에 대한 향상된 친화력, 및 뉴클레아제의 존재 중 증가된 안정성과 같은, 요망되는 성질로 인하여 천연 발생 형태에 비해 선택된다. 용어 "올리고뉴클레오티드"는 비변형된 올리고뉴클레오티드 또는 올리고뉴클레오티드 유사체를 지칭하기 위해 사용될 수 있다.
핵산 분자의 특정 예는 변형된, 즉, 비-천연 발생 뉴클레오시드간 연결을 함유한 핵산 분자를 포함한다. 이러한 비-천연 뉴클레오시드간 연결은 종종 예를 들어, 향상된 세포 섭취, 다른 올리고뉴클레오티드 또는 핵산 타겟에 대한 향상된 친화력, 및 뉴클레아제의 존재 중 증가된 안정성과 같은 요망되는 성질로 인해, 천연 발생 형태에 비해 선택된다. 특정 구체예에서, 변형은 메틸 기를 포함한다.
핵산 분자는 하나 이상의 변형된 뉴클레오시드간 연결을 가질 수 있다. 본 명세서에서 규정된 바와 같이, 변형된 뉴클레오시드간 연결을 갖는 올리고뉴클레오티드는 인 원자를 보유한 뉴클레오시드간 연결, 및 인 원자를 가지지 않은 뉴클레오시드간 연결을 포함한다. 본 명세서의 목적을 위하여, 그리고, 때때로 당해 분야에서 언급된 바와 같이, 이의 뉴클레오시드간 골격에서 인 원자를 갖지 않는 변형된 올리고뉴클레오티드는 또한, 올리고뉴클레오시드인 것으로 여겨질 수 있다.
핵산 분자에 대한 변형은 하나의 말단 뉴클레오티드 또는 두 말단 뉴클레오티드 모두가 변형된 변형을 포함할 수 있다.
하나의 적합한 인-함유 변형된 뉴클레오시드간 연결은 포스포로티오에이트 뉴클레오시드간 연결이다. 다수의 다른 변형된 올리고뉴클레오티드 골격(뉴클레오시드간 연결)은 당해 분야에 공지되어 있고, 본 구체예의 맥락에서 유용할 수 있다.
인-함유 뉴클레오시드간 연결의 제조를 교시하는 예시적인 미국특허는 미국특허 3,687,808; 4,469,863; 4,476,301; 5,023,243, 5,177,196; 5,188,897; 5,264,423; 5,276,019; 5,278,302; 5,286,717; 5,321,131; 5,399,676; 5,405,939; 5,453,496; 5,455,233; 5,466,677; 5,476,925; 5,519,126; 5,536,821; 5,541,306; 5,550,111; 5,563,253; 5,571,799; 5,587,361; 5,194,599; 5,565,555; 5,527,899; 5,721,218; 5,672,697 5,625,050, 5,489,677, 및 5,602,240을 포함하지만, 이로 제한되지 않으며, 이러한 문헌 각각은 본원에 참고로 포함된다.
인 원자를 포함하지 않은 변형된 올리뉴클레오시드 골격(뉴클레오시드간 연결)은 단쇄 알킬 또는 사이클로알킬 뉴클레오시드간 연결, 혼합된 헤테로원자 및 알킬 또는 사이클로알킬 뉴클레오시드간 연결, 또는 하나 이상의 단쇄 헤테로원자 또는 헤테로시클릭 뉴클레오시드간 연결에 의해 형성된 뉴클레오시드간 연결을 갖는다. 이러한 것은 아미드 골격을 갖는 것을 포함하며, 다른 것은 혼합된 N, O, S 및 CH2 성분 부분을 갖는 것을 포함한다.
상기 비-인-함유 올리고뉴클레오시드의 제조를 교시하는 예시적인 미국특허는 미국특허 5,034,506; 5,166,315; 5,185,444; 5,214,134; 5,216,141; 5,235,033; 5,264,562; 5,264,564; 5,405,938; 5,434,257; 5,466,677; 5,470,967; 5,489,677; 5,541,307; 5,561,225; 5,596,086; 5,602,240; 5,610,289; 5,602,240; 5,608,046; 5,610,289; 5,618,704; 5,623,070; 5,663,312; 5,633,360; 5,677,437; 5,792,608; 5,646,269 및 5,677,439를 포함하지만, 이로 제한되지 않으며, 이러한 문헌 각각은 본원에 참고로 포함된다.
올리고머 화합물은 또한, 올리고뉴클레오티드 모방체를 포함할 수 있다. 올리고뉴클레오티드에 적용되는 바와 같은 용어 모방체(mimetic)는 올리고머 화합물을 포함하도록 의도되며, 여기서, 단지 푸라노오스 고리 또는 푸라노오스 고리와 뉴클레오티드간 연결 둘 모두는 신규한 기로 대체되며, 예를 들어, 단지 푸라노오스 고리의 모르폴리노 고리로의 대체는 당해 분야에서 당 대용품(sugar surrogate)으로서 지칭된다. 헤테로시클릭 염기 모이어티 또는 변형된 헤테로시클릭 염기 모이어티는 적절한 타겟 핵산과의 하이브리드화를 위해 유지된다.
올리고뉴클레오티드 모방체는 펩티드 핵산(PNA) 및 사이클로헥세닐 핵산(CeNA로 공지됨, 문헌[Wang et al., J. Am. Chem. Soc., 2000, 122, 8595-8602] 참조)과 같은 올리고머 화합물을 포함할 수 있다. 올리고뉴클레오티드 모방체의 제조를 교시하는 예시적인 미국특허는 미국특허 5,539,082; 5,714,331; 및 5,719,262를 포함하지만, 이로 제한되지 않으며, 이러한 문헌 각각은 본원에 참고로 포함된다. 다른 부류의 올리고뉴클레오티드 모방체는 포스포노모노에스테르 핵산으로서 지칭되고, 골격에서 인 기를 도입한다. 이러한 부류의 올리고뉴클레오티드 모방체는 핵산의 검출을 위한 프로브로서 및 분자 생물학에서 사용하기 위한 보조물로서, 유전자 발현을 억제하는 영역(안티센스 올리고뉴클레오티드, 리보자임, 센스 올리고뉴클레오티드 및 삼중-형성 올리고뉴크레오티드)에서 유용한 물리적 및 생물학적 및 약리학적 성질을 갖는 것으로 보고된다. 다른 올리고뉴클레오티드 모방체가 보고되었으며, 여기서, 푸라노실 고리는 사이클로부틸 모이어티에 의해 대체된 것이다.
핵산 분자는 또한, 하나 이상의 변형된 또는 치환된 당 모이어티를 함유할 수 있다. 염기 모이어티는 적절한 핵산 타겟 화합물과의 하이브리드화를 위해 유지된다. 당 변형은 올리고머 화합물에 뉴클레아제 안정성, 결합 친화력 또는 일부 다른 유익한 생물학적 성질을 부여할 수 있다.
예시적인 변형된 당은 카르보시클릭 또는 비환형 당, 이의 2', 3' 또는 4' 위치 중 하나 이상에서 치환기를 갖는 당, 당의 하나 이상의 수소 원자 대신에 치환체를 갖는 당, 및 당에서 임의의 2개의 다른 원자들 간에 연결을 갖는 당을 포함한다. 다수의 당 변형은 당해 분야에 공지되어 있으며, 2' 위치에서 변형된 당 및 당의 임의의 2개의 원자 간에 브릿지를 갖는 것(당이 바이시클릭이게 됨)은 본 구체예에서 특히 유용하다. 이러한 구체예에서 유용한 당 변형의 예는 OH; F; O-, S-, 또는 N-알킬; 또는 O-알킬-O-알킬로부터 선택된 당 치환기를 포함하는 화합물을 포함하지만, 이로 제한되지 않으며, 여기서, 알킬, 알케닐, 및 알키닐은 치환되거나 비치환된 C1 내지 C10 알킬 또는 C2 내지 C10 알케닐 및 알키닐일 수 있다. 2-메톡시에톡시(또한, 2'-O-메톡시에틸, 2'-MOE, 또는 2'-OCH2CH2OCH3으로서 공지됨), 2'-O-메틸(2'-O--CH3), 2'-플루오로(2'-F), 또는 2' 탄소 원자에 4' 탄소 원자를 연결시키는 브릿징 기를 갖는 바이시클릭 당 변형 뉴클레오시드가 특히 적합하며, 여기서, 예시적인 브릿지 기는 --CH2--O--, --(CH2)2--O-- 또는 --CH2--N(R3)--O를 포함하며, 여기서, R3은 H 또는 C1-C12 알킬이다.
증가된 뉴클레아제 내성 및 뉴클레오티드에 대한 매우 높은 결합 친화력을 부여하는 하나의 변형은 2'-MOE 측쇄이다[Baker et al., J. Biol. Chem., 1997, 272, 11944-12000]. 2'-MOE 치환의 즉각적인 장점들 중 하나는 결합 친화력의 개선으로서, 이는 다수의 유사한 2' 변형, 예를 들어, O-메틸, O-프로필, 및 O-아미노프로필보다 더 크다. 2'-MOE 치환체를 갖는 올리고뉴클레오티드는 또한, 생체내 사용을 위한 유망한 특징을 갖는 유전자 발현의 안티센스 억제제인 것으로 밝혀졌다[Martin, P., Helv. Chim. Acta, 1995, 78, 486-504; Altmann et al., Chimia, 1996, 50, 168-176; Altmann et al., Biochem. Soc. Trans., 1996, 24, 630-637; 및 Altmann et al., Nucleosides Nucleotides, 1997, 16, 917-926].
2'-당 치환기는 아라비노(위) 위치 또는 리보(아래) 위치에 존재할 수 있다. 하나의 2'-아라비노 변형은 2'-F이다. 유사한 변형은 또한, 올리고머 화합물 상의 다른 위치, 특히, 3' 말단 뉴클레오시드 상의 당의 3' 위치에서 또는 2'-5' 결합된 올리고뉴클레오티드 및 5' 말단 뉴클레오티드의 5' 위치에서 이루어질 수 있다. 올리고머 화합물은 또한, 펜토푸라노실 당 대신에 사이클로부틸 모이어티와 같은 당 모방체를 가질 수 있다. 이러한 변형된 당 구조의 제조를 교시하는 예시적인 미국특허는 미국특허 4,981,957; 5,118,800; 5,319,080; 5,359,044; 5,393,878; 5,446,137; 5,466,786; 5,514,785; 5,519,134; 5,567,811; 5,576,427; 5,591,722; 5,597,909; 5,610,300; 5,627,053; 5,639,873; 5,646,265; 5,658,873; 5,670,633; 5,792,747; 및 5,700,920을 포함하지만 이로 제한되지 않으며, 이러한 문헌 각각은 전문이 본원에 참고로 포함된다.
핵산 분자는 또한, 자연 발생 또는 합성 비변형된 핵염기와 구조적으로 구별 가능하지만, 기능적으로 상호교환 가능한 하나 이상의 핵염기(종종 당해 분야에서 단순하게 "염기"로서 지칭됨) 변형 또는 치환을 함유할 수 있다. 이러한 핵염기 변형은 올리고머 화합물에 뉴클레아제 안정성, 결합 친화력 또는 일부 다른 유익한 생물학적 성질을 부여할 수 있다. 본원에서 사용되는 "비변형된" 또는 "천연" 핵염기는 푸린 염기 아데닌(A) 및 구아닌(G), 및 피리미딘 염기 티민(T), 시토신(C) 및 우라실(U)을 포함한다. 본원에서 헤테로시클릭 염기 모이어티로서도 지칭되는 변형된 핵염기는 다른 합성 및 천연 핵염기를 포함하며, 이의 여러 예는 다른 것들 중에서, 예를 들어, 5-메틸시토신(5-me-C), 5-하이드록시메틸 시토신, 7-데아자구아닌 및 7-데아자아데닌이 있다.
헤테로시클릭 염기 모이어티는 푸린 또는 피리미딘 염기가 다른 헤테로사이클로 대체된 것, 예를 들어, 7-데아자-아데닌, 7-데아자구아노신, 2-아미노피리딘, 및 2-피리돈을 포함할 수 있다. 일부 핵염기는 미국특허 3,687,808에 개시된 것, 문헌[The Concise Encyclopedia Of Polymer Science And Engineering, pages 858-859, Kroschwitz, J. I., ed. John Wiley & Sons, 1990]에 개시된 것, 문헌[Englisch et al., Angewandte Chemie, International Edition, 1991, 30, 613]에 개시된 것, 및 문헌[Sanghvi, Y. S., Chapter 15, Antisense Research and Applications, pages 289-302, Crooke, S. T. and Lebleu, B., ed., CRC Press, 1993]에 개시된 것을 포함한다. 특정의 이러한 핵염기는 올리고머 화합물의 결합 친화력을 증가시키기 위해 특히 유용하다. 이러한 것은 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신을 포함하는, 5-치환된 피리미딘, 6-아자피리미딘 및 N-2, N-6 및 O-6 치환된 푸린을 포함한다.
핵산 분자에 대한 추가적인 변형은 미국특허공개 2009/0221685에 개시되어 있으며, 이러한 문헌은 본원에 참고로 포함된다. 또한, 본원에는 핵산 분자에 대한 추가적인 적합한 컨쥬게이트가 개시되어 있다.
이종 수용체 유전자 및 유도성 리포터는 벡터와 같은, 핵산 분자에 의해 엔코딩될 수 있다. 일부 구체예에서, 이러한 것은 동일한 핵산 분자 상에서 엔코딩된다. 일부 구체예에서, 이러한 것은 별도의 핵산 분자 상에서 엔코딩된다. 특정 구체예에서, 핵산 분자는 핵산 벡터 형태를 가질 수 있다. 용어 "벡터"는 이종 핵산 서열이 세포 내에 도입하기 위해 삽입될 수 있는 캐리어 핵산 분자로 지칭하기 위해 사용되며, 여기서, 이는 복제되고 발현되고/거나, 숙주 세포의 게놈 내에 통합될 수 있다. 핵산 서열은 "이종"일 수 있으며, 이는 이러한 상황에서, 벡터가 도입된 세포 또는 도입된 핵산에 대해 외래임을 의미하며, 이는 세포 또는 핵산에서 그러나 일반적으로 발견되지 않는 숙주 세포 또는 핵산 내의 소정 위치에의 서열에 대해 상동성인 서열을 포함한다. 벡터는 DNA, RNA, 플라스미드, 코스미드, 바이러스(박테리오파지, 동물 바이러스, 및 식물 바이러스), 및 인공 염색체(예를 들어, YAC)를 포함한다. 당업자는 표준 재조합 기술을 통해 벡터를 작제하기 위해 잘 구성될 것이다[예를 들어, 문헌[Sambrook et al., 2001; Ausubel et al., 1996], 두 문헌 모두는 본원에 참고로 포함됨]. 벡터는 항체를 생성하기 위해 숙주 세포에서 사용될 수 있다.
용어 "발현 벡터"는 숙주 세포의 게놈에 전사되거나 안정하게 통합하고 후속하여 전사될 수 있는 유전자 산물의 적어도 일부에 대해 코딩하는 핵산 서열을 함유하는 벡터를 지칭한다. 일부 경우에, RNA 분자는 이후에, 단백질, 폴리펩티드, 또는 펩티드로 분역된다. 발현 벡터는 다양한 "제어 서열"을 함유할 수 있으며, 이는 특정 숙주 유기체에서 작동 가능하게 연결된 코딩 서열의 전사 및 번역을 위해 요구되는 핵산 서열을 지칭한다. 전사 및 번역을 지배하는 제어 서열 이외에, 벡터 및 발현 벡터는 다른 기능을 또한 수행하고 본원에 기술된 핵산 서열을 함유할 수 있다.
본원에 개시된 벡터는 당해 분야에 공지된 임의의 핵산 벡터일 수 있다. 예시적인 벡터는 플라스미드, 코스미드, 박테리아 인공 염색체(BAC) 및 바이러스 벡터를 포함한다.
동물 세포를 위한 임의의 발현 벡터가 사용될 수 있다. 적합한 벡터의 예는 pAGE107(Miyaji et al., 1990), pAGE103(Mizukami and Itoh, 1987), pHSG274(Brady et al., 1984), pKCR(O'Hare et al., 1981), pSG1 베타 d2-4(Miyaji et al., 1990), 등을 포함한다.
플라스미드의 다른 예는 복제 기원을 포함하는 복제 플라스미드, 또는 통합성 플라스미드, 예를 들어, 예컨대, pUC, pcDNA, pBR, 등을 포함한다.
바이러스 벡터의 다른 예는 아데노바이러스, 렌티바이러스, 레트로바이러스, 포진 바이러스 및 AAV 벡터를 포함한다. 이러한 재조합 바이러스는 당해 분야에 공지된 기술에 의해, 예를 들어, 포장 세포를 트랜스펙션시킴으로써 또는 헬퍼 플라스미드 또는 바이러스로의 일시적 트랜스펙션에 의해 생성될 수 있다. 바이러스 포장 세포의 통상적인 예는 PA317 세포, PsiCRIP 세포, GPenv+ 세포, 293 세포, 등을 포함한다. 이러한 복제-결함 재조합 바이러스를 생성하기 위한 상세한 프로토콜은 예를 들어, WO 95/14785, WO 96/22378, 미국특허 5,882,877, 미국특허 6,013,516, 미국특허 4,861,719, 미국특허 5,278,056 및 WO 94/19478에서 확인될 수 있다.
"프로모터"는 제어 서열이다. 프로모터는 통상적으로, 전사의 개시 및 속도가 제어되는 핵산 서열의 영역이다. 이는 조절 단백질 및 분자가 결합할 수 있는 유전자 요소, 예를 들어, RNA 폴리머라아제 및 다른 전사 인자를 함유할 수 있다. 구 "작동 가능하게 정위된," "작동 가능하게 결합된," "제어 하에서" 및 "전사 제어 하에서"는, 프로모터가 그러한 서열의 전사 개시 및 발현을 제어하기 위해 핵산 서열과 관련한 정확한 기능적 위치 및/또는 배향에 있음을 의미한다. 프로모터는 "인헨서"와 함께 사용될 수 있거나 사용되지 않을 수 있으며, 이는 핵산 서열의 전사 활성화에서 관련된 시스-작용 조절 서열을 지칭한다.
동물 세포를 위한 발현 벡터에서 사용되는 프로모터 및 인헨서의 예는 SV40의 초기 프로모터 및 인헨서(Mizukami and Itoh, 1987), 몰로니 마우스 백혈병 바이러스의 LTR 프로모터 및 인헨서(Kuwana et al., 1987), 면역글로불린 H 사슬의 프로모터(Mason et al., 1985) 및 인헨서(Gillies et al., 1983), 등을 포함한다.
특정 개시 신호는 또한, 코딩 서열의 효율적인 번역을 위해 요구될 수 있다. 이러한 신호는 ATG 개시 코돈 또는 인접한 서열을 포함한다. ATG 개시 코돈을 포함하는, 외인성 번역 제어 신호는 제공될 수도 있다. 당업자는 이를 결정하고 필요한 신호를 용이하게 제공할 수 있을 것이다.
벡터는 다중 클로닝 사이트(MCS)를 포함할 수 있으며, 이는 다중 제한 효소 사이트를 함유하는 핵산 영역이며, 이들 중 임의의 것은 벡터를 소화시키기 위해 표준 재조합 기술과 함께 사용될 수 있다[문헌[Carbonelli et al., 1999, Levenson et al., 1998, 및 Cocea, 1997] 참조, 이러한 문헌은 본원에 참고로 포함됨].
대부분의 전사된 진핵 생물 RNA 분자는 1차 전사체로부터 인트론을 제거하기 위해 RNA 스플라이싱을 거칠 것이다. 게놈 진행생물 서열을 함유한 벡터는 단백질 발현을 위한 전사체의 적절한 처리를 보장하기 위해 공여체 및/또는 수용체 스플라이싱 사이트를 필요로 할 수 있다[문헌[Chandler et al., 1997] 참조, 이러한 문헌은 본원에 참고로 포함됨].
벡터 또는 작제물은 일반적으로, 적어도 하나의 종결 신호를 포함할 것이다. "종결 신호" 또는 "종결 인자"는 RNA 폴리머라아제에 의한 RNA 전사체의 특정 종료에 관여되는 DNA 서열을 포함한다. 이에 따라, 특정 구체예에서, RNA 전사체의 생성을 종료하는 종결 신호가 고려된다. 종결 인자는 요망되는 메시지 수준을 달성하기 위해 생체 내에서 필요할 수 있다. 진핵생물계에서, 종결 인자 영역은 또한, 폴리아데닐화 사이트를 노출시키기 위해 새로운 전사체의 사이트-특이적 절단을 허용하는 특정 DNA 서열을 포함할 수 있다. 이는 전사페의 3' 말단에 약 200개의 A 잔기(폴리A)의 스트레치를 첨가하기 위해 특수화된 내인성 폴리머라아제에 신호를 보낸다. 이러한 폴리A 테일로 변형된 RNA 분자는 더욱 안정한 것으로 나타나고, 더욱 효율적으로 번역된다. 이에 따라, 진핵생물을 포함하는 다른 구체예에서, 종결 인자가 RNA의 절단을 위한 신호를 포함하는 것이 바람직하며, 종결 인자 신호가 메시지의 폴리아데닐화를 증진시키는 것이 더욱 바람직하다.
발현, 특히, 진핵 발현에서, 통상적으로, 전사체의 적절한 폴리아데닐화를 달성하기 위해 폴리아데닐화 신호가 포함될 것이다.
숙주 세포에서 벡터를 전파하기 위하여, 이는 복제 사이트의 하나 이상의 기원(종종 "ori"로 명명됨)을 함유할 수 있으며, 이는 복제가 개시되는 특정 핵산 서열이다. 대안적으로, 숙주 세포가 효모인 경우에, 자율 복제 서열(ARS)이 사용될 수 있다.
일부 벡터는 원핵 및 진핵 세포 둘 모두에서 복제되고/거나 발현될 수 있게 하는 제어 서열을 사용할 수 있다. 당업자는 숙주 세포를 유지시키고 벡터의 복제를 허용하기 위해 상술된 숙주 세포 모두를 인큐베이션하는 조건을 추가로 이해할 것이다. 또한, 벡터의 대량 생산뿐만 아니라, 벡터 및 이의 동족 폴리펩티드, 단백질, 또는 펩티드에 의해 엔코딩된 핵산의 생산을 허용하는 기술 및 조건이 이해되고 공지되어 있다.
본 개시내용의 추가 양태는 본원에 기술된 바와 같이, 수용체 유전자 및 유도성 리포터를 포함하는 세포 또는 세포들에 관한 것이다. 일부 구체예에서, 원생생물 또는 진핵 세포는 본 개시내용에 따른 적어도 하나의 핵산 분자 또는 벡터로 유전적으로 변형되거나 트랜스펙션된다. 일부 구체예에서, 세포는 본 개시내용의 바이러스 입자로 감염된다.
용어 "변형" 또는 "트랜스펙션"은 숙주 세포가 요망되는 물질, 통상적으로, 도입된 유전자 또는 서열에 의해 코딩된 단백질 또는 효소를 생성하기 위해 도입된 유전자 또는 서열을 발현시키도록, 숙주 세포에 "외래"(즉, 외인성 또는 세포외) 유전자, DNA 또는 RNA 서열의 도입을 의미한다. 도입된 DNA 또는 RNA를 수용하고 발현시키는 숙주 세포는 "변형"되거나 "트랜스펙션"되었다. 본 개시내용에 따른 발현 벡터의 작제화, 및 숙주 세포의 변형 또는 트랜스펙션은 통상적인 분자 생물학 기술을 이용하여 수행될 수 있다.
본 발명과 함께 사용하기 위한 세포, 조직 또는 유기체의 변형/트랜스펙션을 위한 핵산 전달을 위한 적합한 방법은 실제로, 본원에 기술되거나 당업자에게 공지되는 바와 같이, 핵산(예를 들어, DNA)이 세포, 조직 또는 유기체 내에 도입될 수 있는 임의의 방법을 포함하는 것으로 여겨진다[예를 들어, 문헌[Stadtfeld and Hochedlinger, Nature Methods 6(5):329-330 (2009); Yusa et al., Nat. Methods 6:363-369 (2009); Woltjen et al., Nature 458, 766-770 (9 Apr. 2009)] 참조]. 이러한 방법은 임의적으로 Fugene6(Roche) 또는 리포펙타민(Invitrogen)과 함께, 생체외 트랜스펙션[Wilson et al., Science, 244:1344-1346, 1989, Nabel and Baltimore, Nature 326:711-713, 1987]에 의한 것과 같은 DNA의 직접 전달, 마이크로주사[Harland and Weintraub, J. Cell Biol., 101:1094-1099, 1985; 미국특허 5,789,215, 문헌은 본원에 참고로 포함됨]를 포함하는, 주사에 의함[미국특허 5,994,624, 5,981,274, 5,945,100, 5,780,448, 5,736,524, 5,702,932, 5,656,610, 5,589,466 및 5,580,859, 각각은 본원에 참고로 포함함]; 전기천공법에 의함[미국특허 5,384,253, 본원에 참고로 포함됨; Tur-Kaspa et al., Mol. Cell Biol., 6:716-718, 1986; Potter et al., Proc. Nat'l Acad. Sci. USA, 81:7161-7165, 1984]; 칼슘 포스페이트 침강에 의함[Graham and Van Der Eb, Virology, 52:456-467, 1973; Chen and Okayama, Mol. Cell Biol., 7(8):2745-2752, 1987; Rippe et al., Mol. Cell Biol., 10:689-695, 1990]; DEAE-덱스트란, 이후, 폴리에틸렌 글리콜의 사용[Gopal, Mol. Cell Biol., 5:1188-1190, 1985]; 직접 초음파 로딩에 의함[Fechheimer et al., Proc. Nat'l Acad. Sci. USA, 84:8463-8467, 1987]; 리포솜 매개 트랜스펙션[Nicolau and Sene, Biochim. Biophys. Acta, 721:185-190, 1982; Fraley et al., Proc. Nat'l Acad. Sci. USA, 76:3348-3352, 1979; Nicolau et al., Methods Enzymol., 149:157-176, 1987; Wong et al., Gene, 10:87-94, 1980; Kaneda et al., Science, 243:375-378, 1989; Kato et al., J Biol. Chem., 266:3361-3364, 1991] 및 수용체-매개 트랜스펙션에 의함[Wu and Wu, Biochemistry, 27:887-892, 1988; Wu and Wu, J. Biol. Chem., 262:4429-4432, 1987]; 및 이러한 방법들의 임의의 조합을 포함하지만, 이로 제한되지 않으며, 이러한 문헌 각각은 본원에 참고로 포함된다.
V. 세포
본원에서 사용되는 용어 "세포," "세포주," 및 "세포 배양물"은 서로 교환 가능하게 사용될 수 있다. 이러한 용어 모두는 또한, 새로이 단리된 세포 및 시험관 내에서 배양되거나 확장된 세포 둘 모두를 포함한다. 이러한 용어 모두는 또한, 이의 자손세포를 포함하며, 이는 임의의 및 모든 후속 세대이다. 모든 자손세포가 고의적인 또는 우연한 돌연변이로 인해 동일하지 않을 수 있는 것으로 이해된다. 이종 핵산 서열의 발현의 맥락에서, "숙주 세포" 또는 간단히 "세포"는 원핵 또는 진핵 세포를 지칭하며, 이는 벡터를 복제하거나 벡터 또는 통합된 핵산에 의해 엔코딩된 이종 유전자를 발현시킬 수 있는 임의의 변형 가능한 유기체를 포함한다. 숙주 세포는 벡터, 바이러스 및 핵산에 대한 수용체로서 사용될 수 있고, 사용되고 있다. 숙주 세포는 "트랜스펙션"되거나 "변형"될 수 있으며, 이는 재조합 단백질-엔코딩 서열과 같은, 외인성 핵산이 숙주 세포 내로 이동되거나 도입되는 과정을 지칭한다. 변형된 세포는 주요 대상 세포 및 이의 자손세포를 포함한다.
특정 구체예에서, 핵산 전달은 임의의 원핵 또는 진핵 세포 상에서 수행될 수 있다. 일부 양태에서, 본 개시내용의 세포는 인간 세포이다. 다른 양태에서, 본 개시내용의 세포는 동물 세포이다. 일부 양태에서, 세포 또는 세포들은 암 세포, 종양 세포 또는 불명 세포이다. 추가 양태에서, 세포는 질병-모델 세포를 나타낸다. 특정 양태에서, 세포는 A549, B-세포, B16, BHK-21, C2C12, C6, CaCo-2, CAP/, CAP-T, CHO, CHO2, CHO-DG44, CHO-K1, COS-1, Cos-7, CV-1, 수지상 세포, DLD-1, 배아 줄기(ES) 세포 또는 유도체, H1299, HEK, 293, 293T, 293FT, Hep G2, 조혈 줄기 세포, HOS, Huh-7, 유도 만능 줄기(iPS) 세포 또는 유도체, Jurkat, K562, L5278Y, LNCaP, MCF7, MDA-MB-231, MDCK, 중간엽 세포, Min-6, 단핵구 세포, Neuro2a, NIH 3T3, NIH3T3L1, K562, NK-세포, NS0, Panc-1, PC12, PC-3, 말초 혈액 세포, 혈장 세포, 1차 섬유아세포, RBL, Renca, RLE, SF21, SF9, SH-SY5Y, SK-MES-1, SK-N-SH, SL3, SW403, 전분화능의 자극-유발 획득(STAP) 세포 또는 유도체 SW403, T-세포, THP-1, 종양 세포, U2OS, U937, 말초 혈액 림프구, 확장된 T 세포, 조혈 줄기 세포, 또는 Vero 세포일 수 있다. 일부 구체예에서, 세포는 HEK293T 세포이다.
본원에서 사용되는 용어 "계대배양된(passaged)"은 기존의 것으로부터 다수의 세포를 생성하기 위해 세포를 분할하는 과정을 지칭하도록 의도된다. 세포는 본원에 기술된 임의의 단계 전 또는 후에 여러 차례 계대배양될 수 있다. 계대배양은 세포를 분할하고, 각 새로운 용기 내에 작은 수를 옮기는 것을 포함한다. 접착 배양물에 대하여, 세포는 먼저 분리되어야 하고, 통상적으로, 트립신-EDTA의 혼합물로 수행된다. 작은 수의 분리된 세포는 이후에, 새로운 배양물을 시딩하기 위해 사용될 수 있으며, 나머지는 폐기된다. 또한, 배양된 세포의 양은 새로운 플라스크에 모든 세포를 분포시킴으로써 용이하게 확대될 수 있다. 세포는 배양물 중에 유지되고 세포 복제를 가능하게 하기 위한 조건 하에서 인큐베이션될 수 있다. 일부 구체예에서, 세포는 세포가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 세포 분화 라운드 하에서 가능한 배양 조건에서 유지된다.
일부 구체예에서, 세포는 세포의 클론 집단의 확장을 가능하게 하기 위해 제한 희석 방법으로 처리될 수 있다. 희석 클로니을 제한하는 방법은 당업자에게 널리 공지되어 있다. 이러한 방법은 예를 들어, 하이브리도마에 대해 기술되어 있지만, 임의의 세포에 적용될 수 있다. 이러한 방법은 문헌[Cloning hybridoma cells by limiting dilution, Journal of tissue culture methods, 1985, Volume 9, Issue 3, pp 175-177, by Joan C. Rener, Bruce L. Brown, and Roland M. Nardone]에 기술되어 있으며, 이러한 문헌은 본원에 참고로 포함된다.
본 개시내용의 방법은 세포의 배양을 포함한다. 현탁액 및 접착 세포를 배양하는 방법은 당업자에게 널리 공지되어 있다. 일부 구체예에서, 세포는 상업적으로 입수 가능한 세포-배양 용기 및 세포 배양 배지를 사용하여 현탁액 중에서 배양된다. 일부 구체예에서 사용될 수 있는 상업적으로 입수 가능한 배양 용기의 예는 ADME/TOX 플레이트, 세포 챔버 슬라이드 및 커버슬립, 세포 카운팅 장치, 세포 배양 표면, Corning HYPERFlask 세포 배양 용기, 코팅된 배양식기, Nalgene Cryoware, 배양 챔버, 배양 접시, 유리 배양 플라스크, 플라스틱 배양 플라스크, 3D 배양 포맷, 배양 다중웰 플레이트, 배양 플레이트 인서트, 유리 배양 튜브, 플라스틱 배양 튜브, 적층 가능한 세포 배양 용기, 저산소 배양 챔버, 페트리 디시 및 플라스크 캐리어, Quickfit 배양 용기, 롤러 병을 이용한 스케일-업 세포 배양, 스피너 플라스크, 3D 세포 배양, 또는 세포 배양 백을 포함한다.
다른 구체예에서, 배지는 당업자에게 널리 공지된 성분들을 사용하여 포뮬레이션될 수 있다. 세포를 배양하는 포뮬레이션 및 방법은 하기 참조문헌에서 상세히 기술되어 있으며[Short Protocols in Cell Biology J. Bonifacino, et al., ed., John Wiley & Sons, 2003, 826 pp; Live Cell Imaging: A Laboratory Manual D. Spector & R. Goldman, ed., Cold Spring Harbor Laboratory Press, 2004, 450 pp.; Stem Cells Handbook S. Sell, ed., Humana Press, 2003, 528 pp.; Animal Cell Culture: Essential Methods, John M. Davis, John Wiley & Sons, Mar 16, 2011; Basic Cell Culture Protocols, Cheryl D. Helgason, Cindy Miller, Humana Press, 2005; Human Cell Culture Protocols, Series: Methods in Molecular Biology, Vol. 806, Mitry, Ragai R.; Hughes, Robin D. (Eds.), 3rd ed. 2012, XIV, 435 p. 89, Humana Press; Cancer Cell Culture: Method and Protocols, Cheryl D. Helgason, Cindy Miller, Humana Press, 2005; Human Cell Culture Protocols, Series: Methods in Molecular Biology, Vol. 806, Mitry, Ragai R.; Hughes, Robin D. (Eds.), 3rd ed. 2012, XIV, 435 p. 89, Humana Press; Cancer Cell Culture: Method and Protocols, Simon P. Langdon, Springer, 2004; Molecular Cell Biology. 4th edition., Lodish H, Berk A, Zipursky SL, et al., New York: W. H. Freeman; 2000., Section 6.2Growth of Animal Cells in Culture], 이러한 문헌 모두는 본원에 참고로 포함된다.
VI. 핵산의 게놈 통합
A. 타겟화된 통합
본 개시내용은 핵산의 통합을 타겟화하는 방법을 제공한다. 이는 또한, 본원에서 및 당해 분야에서 "유전자 에디팅(gene editing)"으로서 지칭된다. 일부 구체예에서, 타겟화된 통합은 DNA 소화제/폴리뉴크레오티드 변형 효소, 예를 들어, 사이트-특이적 리콤비나아제 및/또는 타겟팅 엔도뉴클레아제의 사용을 통해 달성된다. 용어 "DNA 소화제"는 핵산의 뉴클레오티드 서브유닛 간의 결합(즉, 포스포디에스테르 결합)을 절단시킬 수 있는 작용제를 지칭한다.
일 양태에서, 본 개시내용은 타겟화된 통합을 포함한다. 이를 달성하는 하나의 방식은 사이트-특이적 리콤비나아제 및/또는 타겟팅 엔도뉴크레아제와 같은, 적어도 하나의 폴리뉴클레오티드 변형 효소에 대한 적어도 하나의 인식 서열을 포함하는 외인성 핵산 서열(즉, 랜딩 패드)의 사용을 통한 것이다. 사이트-특이적 리콤비나아제는 당해 분야에 널리 공지되어 있고, 일반적으로, 인버타아제, 레솔바아제, 또는 인테그라아제로서 지칭될 수 있다. 사이트-특이적 리콤비나아제의 비제한적인 예는 람다 인테그라아제, Cre 리콤비나아제, FLP 리콤비나아제, 감마-델타 레솔바아제, Tn3 레솔바아제, ΦC31 인테그라아제, Bxb1-인테그라아제, 및 R4 인테그라아제를 포함할 수 있다. 사이트-특이적 리콤비나아제는 특정 인식 서열(또는 인식 사이트) 또는 이의 변이체를 인식하며, 이들 모두는 당해 분야에 널리 공지되어 있다. 예를 들어, Cre 리콤비나아제는 LoxP 사이트를 인식하며, FLP 리콤비나아제는 FRT 사이트를 인식한다.
고려되는 타겟팅 엔도뉴클레아제는 아연 핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성제-유사 이펙터 뉴클레아제(TALEN), CRIPSR/Cas-유사 엔도뉴클레아제, I-Tevl 뉴클레아제 또는 관련된 모노머 하이브리드, 또는 인공 타겟화된 DNA 이중 가닥 파괴 유도제를 포함한다. 예시적인 타겟팅 엔도뉴클레아제는 하기에 추가로 기술되어 있다. 예를 들어, 통상적으로, 아연 핑거 뉴클레아제는 DNA 결합 도메인(즉, 아연 핑거), 및 절단 도메인(즉, 뉴클레아제)을 포함하며, 둘 모두는 하기에 기술되어 있다. 또한, 폴리뉴클레오티드 변형 효소의 정의에서, 당업자에게 공지된 임의의 다른 유용한 융합 단백질이 포함되며, 예를 들어, DNA 결합 도메인 및 뉴클레아제를 포함할 수 있다.
랜딩 패드 서열은 사이트-특이적 리콤비나아제 및/또는 타겟팅 엔도뉴클레아제와 같은 특정 폴리뉴클레오티드 변형 효소에 의해 선택적으로 결합되고 변형된 적어도 하나의 인식 서열을 포함하는 뉴클레오티드 서열이다. 일반적으로, 랜딩 패드 서열에서 인식 서열(들)은 변형되는 세포의 게놈에서 내인성으로 존재하지 않는다. 예를 들어, 변형되는 세포가 CHO 세포인 경우에, 랜딩 패드 서열에서 인식 서열은 내인성 CHO 게놈에 존재하지 않는다. 타겟화된 통합률은 타겟화된 세포의 게놈 내에 내인성으로 존재하지 않는 고효율 뉴클레오티드 변형 효소에 대해 인식 서열을 선택함으로써 개선될 수 있다. 내인성으로 존재하지 않는 인식 서열의 선택은 또한, 잠재적인 오프-타겟 통합을 감소시킨다. 다른 양태에서, 변형되는 세포에서 천연인 인식 서열의 사용이 요망될 수 있다. 예를 들어, 다수의 인식 서열이 랜딩 패드 서열에서 사용되는 경우에, 하나 이상은 외인성일 수 있으며, 하나 이상은 천연일 수 있다.
당업자는 사이트-특이적 리콤비나아제 및/또는 타겟팅 엔도뉴클레아제에 의해 결합되고 절단된 서열을 용이하게 결정할 수 있다.
다수의 인식 서열은 단일 랜딩 패드에 존재하여, 둘 이상의 고유 핵산(다른 것들 중에서, 수용체 유전자 및/또는 유도성 리포터를 포함함)이 삽입될 수 있도록, 랜딩 패드가 둘 이상의 폴리뉴클레오티드 변형 효소에 의해 순차적으로 타겟화될 수 있게 할 수 있다. 대안적으로, 랜딩 패드에서 다수의 인식 서열의 존재는 동일한 핵산의 다수의 카피를 랜딩 패드 내에 삽입될 수 있게 한다. 2개의 핵산이 단일 랜딩 패드에 타겟화될 때, 랜딩 패드는 제1 폴리뉴클레오티드 변형 효소(예를 들어, 제1 ZFN 쌍)를 위한 제1 인식 서열, 및 제2 폴리뉴클레오티드 변형 효소(예를 들어, 제2 ZFN 쌍)를 위한 제2 인식 서열을 포함한다. 대안적으로, 또는 추가적으로, 하나 이상의 인식 서열을 포함하는 개별 랜딩 패드는 다수의 위치에서 통합될 수 있다. 증가된 단백질 발현은 페이로드(payload)의 다수의 카피로 변형된 세포에서 관찰될 수 있다. 대안적으로, 다수의 유전자 산물은, 동일하거나 상이한 랜딩 패드에서든지간에, 상이한 발현 카셋트를 포함하는 다수의 독특한 핵산 서열이 삽입될 때, 동시에 발현될 수 있다. 핵산의 수 및 타입과는 무관하게, 타겟팅 엔도뉴클레아제가 ZFN일 때, 예시적인 ZFN 쌍은 인식 서열을 수반하면서, hSIRT, hRSK4, 및 hAAVS1을 포함한다.
일반적으로 말하면, 타겟화된 통합을 용이하게 하기 위해 사용되는 랜딩 패드는 적어도 하나의 인식 서열을 포함할 수 있다. 예를 들어, 랜딩 패드는 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개 이상의 인식 서열을 포함할 수 있다. 하나 초과의 인식 서열을 포함하는 구체예에서, 인식 서열은 서로(즉, 상이한 폴리뉴클레오티드 변형 효소에 의해 인식됨), 동일한 반복된 서열, 또는 반복되고 고유한 서열의 조합으로부터 고유할 수 있다.
당업자는 랜딩 패드로서 사용되는 외인성 핵산이 또한 인식 서열(들) 이외에 다른 서열을 포함할 수 있다는 것을 용이하게 이해할 것이다. 예를 들어, 항생제 내성 유전자, 대사 선택 마커, 또는 형광 단백질과 같은, 본원에 기술된 바와 같은 선택 가능한 또는 스크리닝 가능한 유전자를 엔코딩하는 하나 이상의 서열을 포함하는 것이 바람직할 수 있다. 전사 조절 및 제어 요소(즉, 프로모터, 부분 프로모터, 프로모터 트랩, 출발 코돈, 인헨서, 인트론, 격리자, 및 다른 발현 요소)와 같은 다른 보충 서열의 사용이 또한 존재할 수 있다.
적절한 인식 서열(들)의 선택 이외에, 높은 절단 효율로 타겟팅 엔도뉴클레아제의 선택은 또한, 랜딩 패드(들)의 타겟화된 통합율을 개선시킨다. 타겟팅 엔도뉴클레아제의 절단 효율은 예를 들어, CEL-1 검정 또는 PCR 앰플리콘에서 삽입/결실(Indels)의 직접 시퀀싱과 같은 검정을 이용하는 것을 포함하는, 당해 분야에 널리 공지된 방법을 이용하여 결정될 수 있다.
본원에 개시된 방법 및 세포에서 사용되는 타겟팅 엔도뉴클레아제의 타입은 다양할 수 있고 다양할 것이다. 타겟팅 엔도뉴클레아제는 자연 발생 단백질 또는 공학처리된 단백질일 수 있다. 타겟팅 엔도뉴클레아제의 일 예는 아연-핑거 뉴클레아제로서, 이는 하기에서 더욱 상세히 논의된다.
사용될 수 있는 타겟팅 엔도뉴클레아제의 다른 예는 적어도 하나의 핵 국소화 신호를 포함하는 RNA-가이딩 엔도뉴클레아제이며, 이는 진핵 세포의 핵 내에 엔도뉴클레아제의 진입을 가능하게 한다. RNA-가이딩 엔도뉴클레아제는 또한, 적어도 하나의 뉴클레아제 도메인, 및 가이딩 RNA와 상호작용하는 적어도 하나의 도메인을 포함한다. RNA-가이딩 엔도뉴클레아제는 RNA-가이딩 엔도뉴클레아제가 특정 염색체 서열을 절단하도록 가이딩 RNA에 의해 특정 염색체 서열로 유도된다. 가이딩 RNA가 타겟화된 절단을 위한 특이성을 제공하기 때문에, RNA-가이딩 엔도뉴클레아제의 엔도뉴클레아제는 공통이고, 상이한 타겟 염색체 서열을 절단하기 위해 상이한 가이딩 RNA와 함께 사용될 수 있다. 하기에는 예시적인 RNA-가이딩 엔도뉴클레아제 단백질이 더욱 상세히 논의되어 있다. 예를 들어, RNA-가이딩 엔도뉴클레아제는 CRISPR/Cas 단백질 또는 CRISPR/Cas-유사 융합 단백질일 수 있으며, RNA-가이딩 엔도뉴클레아제는 클러스터링된 규칙적으로 산재된 짧은 회문 회문 반복(CRISPR)/CRISPR-연관(Cas) 시스템으로부터 유도된다.
타겟팅 엔도뉴클레아제는 또한, 메가뉴클레아제일 수 있다. 메가뉴클레아제는 큰 인식 사이트에 의해 특징된 엔도데옥시리보뉴클레아제이며, 즉, 인식 사이트는 일반적으로, 약 12개의 염기쌍 내지 약 40개의 염기쌍의 범위이다. 이러한 요건의 결과로서, 인식 사이트는 일반적으로 임의의 제공된 게놈에서 단지 1회 생긴다. 메가뉴클레아제 중에서, LAGLIDADG로 명명되는 호밍 엔도뉴클레아제의 패밀리는 게놈 및 게놈 공학의 연구를 위한 가치 있는 툴이 된다. 메가뉴클레아제는 당업자에게 널리 공지된 기술을 이용하여 이의 인식 서열을 변형시킴으로써 특정 염색체 서열에 타겟화될 수 있다[예를 들어, 문헌[Epinat et al., 2003, Nuc. Acid Res., 31(11):2952-62 및 Stoddard, 2005, Quarterly Review of Biophysics, pp. 1-47] 참조].
사용될 수 있는 타겟팅 엔도뉴클레아제의 또 다른 예는 전사 활성제-유사 이펙터(TALE) 뉴클레아제이다. TALE는 신규한 DNA 타겟을 결합시키기 위해 용이하게 조작될 수 있는 식물 병원체 잔토모나스(Xanthomonas)로부터의 전사 인자이다. TALE 또는 이의 절단된 버젼은 TALE 뉴클레아제 또는 TALEN으로 불리워지는 타겟팅 엔도뉴클레아제를 생성시키기 위해 FokI와 같은 엔도뉴클레아제의 촉매적 도메인에 결합될 수 있다[예를 들어, 문헌[Sanjana et al., 2012, Nature Protocols 7(1):171-192; Bogdanove A J, Voytas D F., 2011, Science, 333(6051):1843-6; Bradley P, Bogdanove A J, Stoddard B L., 2013, Curr Opin Struct Biol., 23(1):93-9] 참조].
다른 예시적인 타겟팅 엔도뉴클레아제는 사이트-특이적 뉴클레아제이다. 특히, 사이트-특이적 뉴클레아제는 인식 서열이 게놈에서 드물게 생기는 "래어-커터(rare-cutter)" 엔도뉴클레아제일 수 있다. 바람직하게, 사이트-특이적 뉴클레아제의 인식 서열은 단지 게놈에서 1회 생긴다. 대안적으로, 타겟팅 뉴클레아제는 인공 타겟화된 DNA 이중 가닥 파괴 유도제일 수 있다.
일부 구체예에서, 타겟화된 통합은 인테그라아제의 사용을 통해 달성될 수 있다. 예를 들어, phiC31 인테그라아제는 박테리오파지 phiC31의 게놈 내에 엔코딩된 서열-특이적 리콤비나아제이다. phiC31 인테그라아제는 부착 사이트(att)로 지칭되는 2개의 34 염기쌍 서열 간의 재조합을 매개하며, 하나는 파지에서 발견되며, 다른 하나는 박테리아 숙주에서 발견된다. 이러한 세린 인테그라아제는 포유류 세포를 포함하는 다수의 상이한 세포 타입에서 효율적으로 기능하는 것으로 나타났다. phiC31 인테그라아제의 존재 하에서, attB-함유 도너 플라스미드는 천연 attP 사이트와 서열 유사성을 갖는 사이트(의사-attP 사이트로 지칭됨)에서 재조합을 통해 타겟 게놈에 단방향 통합될 수 있다. phiC31 인테그라아제는 단일 카피로서, 임의의 크기의 플라스미드를 통합하고, 보조인자를 필요로 하지 않을 수 있다. 통합된 이식 유전자는 안정적으로 발현되고 유전 가능하다.
일 구체예에서, 본 개시내용의 폴리뉴클레오티드의 게놈 통합은 트랜스포사아제의 사용을 통해 달성된다. 예를 들어, 척추 동물의 염색체 내에 정밀하게 규정된 DNA 서열을 도입하도록 설계된 합성 DNA 트랜스포존(예를 들어, "슬리핑 뷰티(Sleeping Beauty)" 트랜스포존 시스템)이 사용될 수 있다. 슬리핑 뷰티 트랜스포존 시스템은 척추 동물의 게놈 내에 DNA의 특정 서열을 삽입하도록 설계된 트랜스포존 및 슬리핑 뷰티(SB) 트랜스포사아제를 포함한다. DNA 트랜스포존은 단순, 절단-및-페이스트 방식으로 하나의 DNA 사이트에서 다른 사이트로 전위된다. 전위는 규정된 DNA 세그먼트가 하나의 DNA 분자로부터 절단되고 동일한 또는 상이한 DNA 분자 또는 게놈에서 다른 사이트로 이동되는 정밀한 과정이다.
모든 다른 Tc1/마리너-타입 트랜스포사아제와 마찬가지로, SB 트랜스포사아제는 수용체 DNA 서열에서 TA 디뉴클레오티드 염기쌍 내에 트랜스포존을 삽입한다. 삽입 사이트는 동일한 DNA 분자의 다른 곳에, 또는 다른 DNA 분자(또는 염색체)에 존재할 수 있다. 인간을 포함한 포유류 게놈에서, 대략 2억개의 TA 사이트가 존재한다. TA 삽입 사이트는 트랜스포존 통합의 과정에서 복제된다. 이러한 TA 서열의 복제는 전위의 특징이고, 일부 실험에서 메커니즘을확인하게 위해 이용된다. 트랜스포사아제는 트랜스포존 내에서 엔코딩될 수 있거나, 트랜스포사아제는 다른 공급원에 의해 공급될 수 있으며, 이러한 경우에, 트랜스포존은 비-자율 요소가 된다. 비-자율 트랜스포존은 삽입 후, 이러한 것이 독립적으로 계속 절단되고 재삽입되지 않을 수 있기 때문에, 유전자 툴로서 가장 유용하다. 인간 게놈 및 다른 포유류 게놈에서 식별된 모든 DNA 트랜스포존은, 이러한 것이 트랜스포사아제 유전자를 포함하더라도, 유전자가 기능하지 않고 트랜스포존을 이동시킬 수 있는 트랜스포사아제를 생성시키지 못할 수 있기 때문에 비-자율적이다.
VII. 사용 방법
본원에 기술된 검정은 대규모 스크린을 시간-및 비용-효과적으로 만든다. 또한, 본원에 기술된 검정은 온(on) 및 오프(off)-타겟 효과에 대해 리간드를 스크리닝하기 위해, 특정 리간드 또는 리간드 세트에 대한 하나 이상의 수용체의 변이체의 활성을 결정하기 위해, 리간드 결합을 위해 요구되는 수용체에서 요구되는 중요한 잔기를 맵핑하기 위해, 및 수용체에서의 잔기가 리간드 결합을 위해 중요하지 않는 지를 결정하기 위해 유용하다.
일부 양태에서, 검정 방법은 수용체가 하나의 수용체의 변이체인 검정에 관한 것이다. 일부 구체예에서, 각 변이체는 야생형 단백질 서열에 대한 하나의 치환을 포함하거나 이로 이루어진다. 일부 구체예에서, 각 변이체는 야생형 아미노산 서열과 비교하여, 적어도, 최대, 또는 정확하게, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 치환(또는 그 안에서 임의의 도출 가능한 범위)을 포함하거나, 이로 이루어진다. 일부 양태에서, 본 방법은 리간드에 대한 수용체의 집단의 활성을 결정하는 것을 포함하며, 여기서, 수용체의 집단은 동일한 수용체의 적어도 2개의 변이체를 포함하며, 활성은 리간드에 대한 반응을 결정한다. 일부 양태에서, 수용체의 집단은 적어도, 최대, 또는 약 2, 10, 100, 200, 300, 400, 500, 1000, 1500, 2000, 3000, 4000, 또는 5000개의 수용체(또는 그 안에서 임의의 도출 가능한 범위)를 포함하고, 이는 스크리닝된다. 일부 양태에서, 적어도, 최대, 또는 정확하게, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 리간드(또는 그 안에서 임의의 도출 가능한 범위)가 스크리닝된다. 일부 양태에서, 적어도, 최대, 또는 약 2, 10, 100, 200, 300, 400, 500, 1000, 1500, 2000, 3000, 4000, 또는 5000개의 수용체(또는 그 안에서 임의의 도출 가능한 범위)는 적어도, 최대, 또는 정확하게, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 리간드(또는 그 안에서 임의의 도출 가능한 범위)에 응답하여 스크리닝된다. 일부 구체예에서, 검정은 리간드에 대한 변이 수용체의 결정된 활성을 기초로 하여 리간드에 대한 환자의 반응을 예측하기 위해 이용될 수 있다. 예를 들어, 본원에 기술된 검정은 리간드에 대한 변이 수용체의 치료 반응을 예측하기 위해 이용될 수 있다. 이러한 정보는 이후에, 변이 수용체를 갖는 환자를 치료하기 위한 치료 방법에서 이용될 수 있다. 일부 구체예에서, 방법은 환자를 리간드로 치료하는 것을 포함하며, 여기서, 환자는 변이 수용체를 갖는 것으로 결정되었다. 일부 구체예에서, 리간드에 대한 변이 수용체의 활성은 본원에 기술된 방법에 의해 결정되었다.
일부 양태에서, 검정은 하나 이상의 리간드에 대한 한 부류의 수용체의 활성을 결정하기 위한 것이다.
일부 구체예에서, 수용체의 부류는 후각, GPCR, 핵 호르몬, 호르몬, 또는 촉매적 수용체이다. 일부 구체예에서, 수용체는 아드레날린수용체, 예를 들어, 알파 또는 베타 아드레날린성 수용체 또는 알파-1, 알파-2, 베타-1, 베타-2, 또는 베타-3 아드레날린성 수용체, 또는 알파-1A, 알파 1B, 알파-1D, 알파-2A, 알파-2B, 또는 알파-2C 아드레날린성 수용체이다. 일부 구체예에서, 수용체 또는 수용체의 부류는 본원에 기술된 것이다.
VIII. 키트
본 개시내용의 특정 양태는 또한, 본 개시내용의 핵산, 벡터, 또는 세포를 함유하는 키트에 관한 것이다. 키트는 본 개시내용의 방법을 구현하기 위해 이용될 수 있다. 일부 구체예에서, 키트는 수용체 유전자, 또는 수용체 유전자의 그룹의 활성화를 평가하기 위해 이용될 수 있다. 일부 구체예에서, 키트는 단일 유전자의 변이체를 평가하기 위해 사용될 수 있다. 특정 구체예에서, 키트는 적어도 또는 최대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 100, 500, 1,000개 또는 그 이상의 핵산 프로브, 프라이머, 또는 합성 RNA 분자, 또는 여기에서 도출 가능한 임의의 값 또는 범위 및 조합의 핵산 프로브, 프라이머, 또는 합성 RNA 분자를 함유한다. 일부 구체예에서, 리간드에 의해 수용체의 활성 또는 결합을 평가하기 위한 키트가 존재한다. 일부 구체예에서, 공통 프로브 또는 프라이머는 바코드 또는 수용체를 증폭, 식별, 또는 시퀀싱하기 위해 포함된다. 이러한 시약은 또한, 스크린에서 이용될 수 있는 숙주 세포를 생성시키거나 이를 시험하기 위해 사용될 수 있다.
특정 구체예에서, 키트는 세포 모폴로지 및/또는 표현형을 분석하기 위한 물질, 예를 들어, 조직학 슬라이드 및 시약, 조직학적 염색제, 알코올, 완충제, 조직 임베딩 배지, 파라핀, 포름알데하이드, 및 조직 탈수제를 포함할 수 있다.
키트는 튜브, 병, 바이알, 시린지, 또는 다른 적합한 용기 수단과 같은, 개별적으로 포장되거나 용기에 배치될 수 있는 성분들을 포함할 수 있다.
개별 성분들은 또한, 키트에 농축된 양으로 제공될 수 있다. 일부 구체예에서, 성분은 다른 성분을 갖는 용액 중에 존재하는 것과 동일한 농도로 개별적으로 제공된다. 성분의 농도는 1배, 2배, 5배, 10배, 또는 20배 이상으로 제공될 수 있다.
약물 발견을 위한 본 개시내용의 프로브, 폴리펩티드 또는 폴리뉴클레오티드 검출제를 사용하기 위한 키트가 고려된다.
특정 양태에서, 음성 및/또는 양성 제어제가 일부 키트 구체예에서 포함된다. 제어 분자는 트랜스펙션 효율을 입증하고/거나 세포에서 트랜스펙션-유도 변화를 제어하기 위해 사용될 수 있다.
본 개시내용의 구체예는 적합한 용기 수단에서, 발현된 폴리뉴클레오티드를 검출하기 위한 2개 이상의 RNA 프로브 또는 프라이머를 포함하는 샘플을 위한 핵산 또는 폴리펩티드 프로파일을 평가함으로써 병리학적 샘플의 분석을 위한 키트를 포함한다. 또한, 프로브 또는 프라이머가 표지될 수 있다. 표지는 당해 분야에 공지되어 있고, 또한, 본원에 기술되어 있다. 일부 구체예에서, 키트는 표지 프로브, 핵산, 및/또는 검출제를 위한 시약을 추가로 포함할 수 있다. 키트는 또한, 아민-변형된 뉴클레오티드, 폴리(A) 폴리머라아제, 및 폴리(A) 폴리머라아제 완충제 중 적어도 하나를 포함하는, 표지 시약을 포함할 수 있다. 표지화 시약은 아민-반응성 염료를 포함할 수 있다. 키트는 하기 물질들 중 임의의 하나 이상을 포함할 수 있다: 효소, 반응 튜브, 완충제, 세제, 프라이머, 프로브, 항체. 일부 구체예에서, 이러한 키트는 RNA 추출, RT-PCR, 및 겔 전기영동을 수행하기 위한 요구되는 장비를 포함한다. 검정을 수행하기 위한 설명서가 또한, 키트에 포함될 수 있다.
키트는 발현을 평가하기 위한 키트를 이용하기 위한 설명서, 발현 데이터를 발현 값으로 변환시키기 위한 수단, 및/또는 리간드/수용체 상호작용 데이터를 발생시키기 위해 발현 값을 분석하기 위한 수단을 추가로 포함할 수 있다.
키트는 표지를 구비한 용기를 포함할 수 있다. 적합한 용기는 예를 들어, 병, 바이알, 및 시험관을 포함한다. 용기는 다양한 물질, 예를 들어, 유리 또는 플라스틱으로부터 형성될 수 있다. 용기는 본 개시내용의 방법을 위해 유용한 프로브를 포함하는 조성물을 보유할 수 있다. 키트는 상술된 용기, 및 완충제, 희석제, 필터, 니들, 시린지, 및 사용 설명서를 갖는 포장 삽입물을 포함하는, 상업적 및 사용자 관점으로부터 요망되는 물질을 포함하는 하나 이상의 다른 용기를 포함할 수 있다.
IX. 실시예
하기 실시예는 본 개시내용의 바람직한 구체예를 나타내기 위해 포함된다. 하기 실시예에 개시된 기술이 본 개시내용의 실시에서 잘 기능하기 위해 본 발명자에 의해 발견된 기술을 나타내고, 이에 따라, 이의 실시를 위한 바람직한 모드를 구성하는 것으로 여겨질 수 있다는 것이 당업자에 의해 인식되어야 한다. 그러나, 당업자는, 본 개시내용에 비추어, 개시된 특정 구체예에서 다수의 변형이 이루어질 수 있고, 본 개시내용의 사상 및 범위를 벗어나지 않으면서 동일하거나 유사한 결과를 여진히 얻을 수 있다는 것을 인식해야 한다.
실시예 1 - 멀티플렉싱된 후각자극제-수용체 스크리닝 시스템
포유류 후각은 매우 복잡한 과정이고, 아마도 가장 잘 이해되지 않는 감각이다. 후각 수용체(OR)는 냄새 인식의 첫번째 층이다. 인간 OR은 비강 상피에 위치된 뉴런에서 단일대립적으로 발현되는 400 G 단백질-결합 수용체(GPCR) 세트이다. 후각자극제는 다-대-다 방식(many-to-many fashion)으로 수용체와 결합하며, 패턴은 후각 후각 전구로 전달되고, 피질에서 지각으로 변형된다. 인간 OR 중 단지 약 5%는 이러한 것에 대해 식별된 높은 친화력의 리간드를 가지며, 다수의 희귀 수용체는 후각을 지배하는 다운스트림 신경생물학을 조사하는 능력을 억제한다. 이전 디오파니제이션(deorphanization) 시도는 각 후각자극제-수용체 쌍을 개별적으로 스크리닝하는 이종 세포-기반 검정을 이용하였다. 잠재적인 다수의 수용체-후각자극제 조합및 이종 OR 발현을 달성하는 어려움은 "한번에 하나씩(one-at-a-time)" 방법의 처리량을 제한하였다. 대신에, 본 발명자는 멀티플렉싱된 후각자극제-수용체 스크리닝을 가능하게 하는 세포주를 발현시키는 적합한 OR을 조작하였다.
수용체-후각자극제 상호작용을 측정하기 위하여, 본 발명자는 HEK293T 세포에서 cAMP 신호전달을 위한 유전자 리포터를 조정하였다. 후각자극제 결합 시에, g-단백질 신호전달은 전사 인자 CREB의 포스포릴화를 유발시키는 cAMP 생성을 자극한다. CREB는 짧은 텐뎀-반복 서열 CRE와 결합하고, 다운스트림 리포터 유전자, 대개 루시페라아제의 전사를 활성화시킨다. 동일한 플라스미드 상에서 발현되는 라이브러리에서 하나의 OR과 독특하게 결합하는 리포터 유전자의 3' UTR 내에 DNA 바코드를 포함하도록 검정을 변형시켰다(도 1). 각 세포는 cAMP 신호전달이 후각자극제에 의해 결합되지 않고 동일한 세포 내에 존재하는 수용체에 상응하는 바코드의 발현을 촉발을 보장하기 위해 단일 라이브러리 구성원과 통합된다. 본 발명자는 96-웰 플레이트 내에 세포주를 시딩시키고, 상이한 냄새를 갖는 각 웰을 유발시키고, 바코딩된 전사체를 시퀀싱하였다. 본 발명자는 각 바코드의 상대 존재비를 각 수용체에 대한 냄새의 친화력을 나타내는 히트 맵(heat map)으로 전변환시켰다.
GPCR 활성화에 대한 통상적인 유전자 리포터 검정은 수용체 및 리포터를 개별적으로 동시-트랜스펙션한다. 각 바코드를 이의 상응하는 OR로 맵핑하기 위하여, 시퀀싱을 통해 바코드와 OR의 회합을 가능하게 하는 단일 플라스미드 상에서 검정을 위한 모든 구성성분을 발현시킬 필요가 있다. 본 발명자는 모든 필수적인 구성성분을 발현시키기 위해 플라스미드를 구성하였다(도 3). 본 발명자는 두 구성 모두에 대해 공지된 높은 친화력 리간드 및 관찰된 유사한 리포터 활성화를 갖는 두 개의 OR, 즉, MOR42-3 및 MOR9-1에 대한 소정 범위의 농도를 일시적으로 스크리닝하였다.
멀티플렉싱 전략은 OR 라이브러리의 안정한, 클론 통합을 필요로 한다. 초기에, 본 발명자는 Bxb1 재조합을 사용하기로 결정하였는데, 왜냐하면, 이는 단일 포트 반응에서 세포 당 단일 카피에서 각 라이브러리 구성원이 통합될 수 있기 때문이다. 본 발명자는 HEK293T 세포의 H11 안전 하버 유전자좌 내에 Bxb1 attp 리콤비나아제 사이트를 함유한 '랜딩 패드'를 조작하였다(도 4). 조작된 세포주는 Mukku1a로 지칭된다(표 1). Bxb1 재조합은 상보적인 attb 인식 사이트를 함유한 플라스미드 DNA를 비가역적으로 통합하고, 세포 당 단일 제조합을 제한하는 게놈 attp 서열을 파괴한다. 본 발명자는 랜딩 패드에서 MOR42-3을 유도할 때 리포터 활성화를 관찰할 수 없었다. 그러나, 베타-2 아드레날린성 수용체, 즉, 아데닐레이트 사이클라아제를 또한 활성화시키는 기본(canonical) GPCR은 랜딩 패드로부터 발현될 때 유도 시에 리포터를 강력하게 활성화시켰다.
OR은 이종으로 발현시키기에 매우 어려우며, 안정한, 이종 발현은 보고된 적이 없다. 본 발명자는 OR의 안정적이고 구성적 발현이 하향-조절의 많은 가능한 길로 이어질 수 있고 유도성 발현을 시도하기로 결정하였다. 본 발명자는 역 Tet 트랜스활성제를 발현시키기 위해 Mukku1a 세포를 조작하고, OR 발현을 유도하는 프로모터를 Tet-On 유도성 프로모터로 대체하였다(도 5). 유도성 시스템은 종래 시스템과 일시적으로 유사한 리포터 활성화를 달성하였지만, 본 발명자는 여전히 랜딩 패드에 있을 때 리포터 발현을 관찰할 수 없었다. 다음 가설은 단일 OR 유전자가 유전자 리포터를 활성화시키기 위해 필요한 발현을 달성하기에 충분히 않다는 것이다. 본 발명자는 중간 말단 반복을 갖는 유전자 작제물의 측면에 배치하고, 트랜스포사아제를 사용하여 플라스미드를 통합하였다(도 6). 구성적 OR 발현 하에서, 리포터는 후각자극제에 대해 여전히 반응하지 않는다. 예상치 못하게, 리포터를 전위시키고 OR 발현을 제어하는 것의 조합은 리포터의 후각자극제 반응을 유도적으로 복원하였다. OPCR은 트랜스포존이 평균적으로 세포 당 4 내지 6개의 카피에서 통합됨을 확인하였다.
다수의 OR은 이종 시스템에서 일시적으로 발현될 때 세포막 트래피킹 및 적절한 신호전달을 위한 보조 인자의 공동-발현을 필요로 한다(도 7). 이러한 것이 또한 적합한 발현 및 유전적으로 통합된 하기 4개의 보조 인자 이식 유전자에 대한 문제일 것이라는 것이 예측되었다: RTP1S 및 RTP2(표면 발현을 증가시키는 샤페론), Gαolf(OR과 본래 상호작용하는 G 단백질 알파 서브유닛), 및 및 Ric8b(Gαolf와 결합하는 구아닌 뉴클레오티드 교환 인자). 본 발명자는 Tet 유도성 조절 하에서 이러한 4개의 인자를 풀링하고 Mukku2a 세포로 전위시켰다. 강력한 OR 발현 능력을 갖는 세포주를 생성시키기 위해, 본 발명자는 단일 클론일 단리시키고, 이전에 이종 기능성 발현을 위해 보조 인자를 필요로 하는 것으로 알려진, 2개의 OR, 즉, Olfr62 및 OR7D4에 대해 유전자 리포터 활성화에 대해 이를 일시적으로 스크리닝하였다.
42개의 마우스 OR을 리포터 유전자의 3' UTR에서 랜덤 바코드를 함유한 트랜스포존 벡터 내로 클로닝시키고, 각 수용체에 바코드를 맵핑하게 위해 클론을 시퀀싱하였다. 다음으로, 각 작제물은 Mukku3a 세포 내로 개별적으로 전위되었으며, 이후에, 세포는 전위후 함께 풀링되었다. 궁극적으로, 통합된 Mukku3a 세포는 Tet-On 시스템의 제어 하에서 보조 인자 및 OR 둘 모두를 유도 가능하게 발현시킨다(데이터는 미도시됨). 본 발명자는 적합한 세포주가 이전 수용체-후각자극제 회합을 복제하고 큰 수용체 코호트에 대해 신뢰성 있게 작업함을 확인하기 위해 단백질 및 전사체 수준 둘 모두에서 공지된 리간드를 갖는 소수의 수용체를 시험하였다(도 2a 및 2b).
검정을 고처리량 스크리닝에 적합하게 만들기 위하여, 라이브러리 제조를 위한 96-웰 플레이트 양립성, 인-용해물 프로토콜(도 8)을 개발하였다. 플레이트의 각 웰 및 플레이트 자체를 맞춤형 인덱스로 바코딩하였다. 본 발명자는 16,128 독특한 수용체-리간드 상호작용을 형성시키는 본 발명자의 42-수용체 라이브러리에 대해 4개의 별도 농도의 96개의 후각자극제를 스크리닝하였다. 히트 맵은 각 조건 하에서 각 수용체의 상대 활성화를 나타내도록 구성되었다(도 2c).
후각자극제-수용체 상호작용 공간은 복잡하고, 횡단하기 어렵다. 본 발명자는 이종 OR 발현의 문제를 극복하고 멀티플렉싱을 통해 상호작용 공간을 압축시키는 플랫폼을 개발하였다. 이러한 플랫폼은 경제적으로 및 기술적으로, 포유류 OR의 대규모 디오파니제이션을 가능하게 한다.
실시예 2 - Smell-seq: 디코딩 후각 수용체-리간드 상호작용을 위한 멀티플렉싱된 GPCR 활성 검정
본 발명자는 고처리량 포맷에서 차세대 시퀀싱에 의해 다중으로 판돈될 수 있는 적합한 인간 세포주 리포터의 라이브러리를 구축함으로써 멀티플렉스 수용체-리간드 프로파일링을 위한 플랫폼을 개발하였다. 이러한 기술은 다수의 다른 부류의 수용체로 일반화하고 의학적으로 관련된 GPCR에 대한 약물 발견을 위한 고처리량 스크리닝을 가능하게 한다.
소분자와 수용체 간의 상호작용은 내부 상태 및 환경에 대한 유기체의 감지 및 반응 능력을 뒷받침한다. 다수의 약물 및 천연 산물에 대하여, 다수의 생물학적 타겟의 기능을 1회 조절하는 능력은 이의 효능에 대하여 중요하다. 이러한 다중 약리학(polypharmacology)은 연구하기 어려운데, 왜냐하면, 본 발명자가 종종 화학물질이 어떠한 타겟과 상호작용하는 지를 알지 못하기 때문이다. 이러한 다-대-다 문제는 한번에 하나의 상화작용을 연구하기 힘들고, 특히, 포유류의 냄새 감각에서 나타난다.
후각은 후각 수용체(OR)로서 공지된 G 단백질-결합 수용체(GPCR)의 한 부류에 의해 매개된다. GPCR은 포유동물에서 소분자 신호전달에서 중요한 역할자이고, FDA 승인 약물의 30% 이상 타겟화된다. OR은 인간, 마우스, 및 코끼리에서 각각 대략 396, 1130, 및 1948개의 온전한 수용체와 다수의 상이한 진화적 상황에서 특수화된 부류 A GPCR의 큰 패밀리이다. 각 OR은 잠재적으로 거의 무한한 수의 후각자극제와 상호작용할 수 있고, 각 후각자극제는 다수의 OR과 상호작용할 수 있다. 이의 복잡성으로 인해 및 시험관 내에서 포유류 GPCR 기능을 재현하는 것이 어렵기 대문에 대다수의 OR은 휘귀하다. 또한, 임의의 OR에 대한 결정 구조가 존재하지 않으며, 후각자극제가 각 OR을 활성화시킨다는 것을 예측하기 위한 계산 노력을 방해한다.
여기에서, 본 발명자는 멀티플렉스에서 포유류 OR 라이브러리에 대한 소분자 라이브러리를 특징화하기 위한 신규한 HTS-양립성 시스템을 보고한다(도 9a). 이를 위하여, 본 발명자는 기능성 OR 발현을 가능하게 하는 적합한 세포주(도 11) 및 OR 활성을 위한 멀티플렉싱된 리포터(도 12) 둘 모두를 개발하였다. 최종 플랫폼은 OR 트래피킹 및 신호전달을 위해 요구되는 유도성으로 발현된 단백질과 함께 조작된 세포주의 문맥 내에 있는 멀티-카피, 유도성으로 발현된 OR을 포함한다(도 13). 각 OR의 활성화는 고유의 15개의 뉴클레오티드 바코드 서열을 갖는 리포터 전사체의 발현을 유발시킨다. 각 바코드는 OR을 식별하여, 바코드의 앰플리콘 RNA-seq에 의한 멀티플렉싱된 판독을 가능하게 한다(도 9a, 도 13). 이러한 플랫폼을 이용하여, 본 발명자는 적어도 42개의 상이한 수용체를 스크리닝하였으며, 본 발명자는 신규한 후각자극제 쌍의 발견을 가능하게 하는 고처리량 스크리닝을 위한 이러한 플랫폼을 조정하였다. 본 발명자는 다수-카피 통합 및 유도성 발현이 리포터 활성화를 허용함을 발견하였다. 개별적으로, 이러한 특징은 반응을 나타내지 않았다. 그러나, 이의 조합은 기능성 OR 리포터 세포주를 야기시켰는데, 이는 다중-카피 통합 또는 유도성 발현이 단독으로 사용되었을 때 발견되지 않는 상승적 반응을 나타낸다. 본 발명자는 이후에, G_알파_olf, Ric8b, RTP1S, RTP2를 유도적으로 발현시켰다(도 9b, 도 11). 리포터 작제물을 조작하기 위하여, 본 발명자는 표면 발현을 증가시키기 위해 단백질 트래피킹 태그를 사용하였고, 백그라운드 리포터 활성화를 감소시키기 위해 DNA 격리자 서열을 첨가하였고, 리포터 신호를 개선시키기 위해 cAMP 반응 요소(CRE) 인헨서를 변형시켰고, 세포주 발달을 가속시키기 위해 이러한 구성요소를 단일 전위 가능한 벡터에 조합하였다(도 12). 본 발명자는 공지된 리간드를 갖는 3개의 뮤린 OR에 대해 본 시스템을 검증하였고, 종래에 발현시키기 어려웠던 Olfr62를 포함하는, 유도 및 용량-의존 활성화를 관찰하였다(도 9c).
변형 후에, 본 발명자는 42개의 뮤린 OR-발현 세포주의 라이브러리를 생성시켰고, 활성화의 멀티플렉싱된 판독을 시험하였다. 본 발명자는 먼저 OR을 클로닝하고 Sanger 시퀀싱을 통해 이의 상응하는 바코드에 맵핑하고, 플라스미드를 개별적으로 HEK-293T 세포 내로 전위시켜, 선택후 세포주를 함께 풀링하였다(도 10a). 멀티플렉싱된 검정을 파일롯팅하기 위하여, 본 발명자는 6-웰 배양 접시에서 세포 라이브러리를 플레이팅하고, 특정 OR을 활성화시키는 것으로 공지된 후각자극제를 첨가하고(도 14); 3개를 제외한 모든 OR은 활성화의 신뢰성 있는 추정치를 얻기 위해 충분한 세포에 존재하였다. 시퀀싱 판독의 분석은 이전에 식별된 후각자극제-수용체 쌍을 요약하였으며, 화학적 혼합물은 다수의 OR을 적절하게 활성화시켰다. 흥미롭게도, 본 발명자는, 검정이 직접 아데닐레이트 사이클라아제 시뮬레이터 포르스콜린과 같은 화학물질에 대해 강력하다는 것을 발견하였으며, 이는 이러한 것이 발현하는 OR에 독립적으로 세포를 비특이적을 자극시킨다. 이러한 화학물질이 모든 바코드를 균등하게 활성화시키기 때문에, 이러한 성가신 화학물질은 용이하게 여과될 수 있다. 다음으로, 본 발명자는 96-웰 포맷에서 고처리량 스크리닝을 위한 플랫폼을 조정하였다. 시약 비용 및 검정 시간을 감소시키기 위하여, 본 발명자는 인-용해물 역전사 프로토콜을 개발하였고, 각 웰을 독특하게 식별하기 위해 이중 인덱싱을 이용하였다(방법 참조). 이러한 개선을 이용하여, 본 발명자는 공지된 후각자극제-수용체 쌍에 대한 용량-반응 곡선을 나타낼 수 있다(도 10b, 도 14). 본 발명자는 동일하게 처리되었지만 생물학적으로 독립적인 웰들 간의 재현 가능한 결과를 관찰하였다(도 15 및 16).
본 발명자는 후속하여, OR 세포 라이브러리에 대해 3가지 농도로 182개의 후각자극제를 3회 스크리닝하였으며, 대조군을 포함하여 약 85,000 개별 루시페라아제 검정에 대해 균등하다(도 10a, 표 2). 검정에서 각 96-웰 플레이트는 양성 대조군 후각자극제 및 정규화를 위한 용매 DMSO 웰을 함유하였다(도 16). 본 발명자는 바코드 카운트의 네가티브 이항 모델을 기초로 하여 차등 반응성 OR을 결정하기 위해 EdgeR 소프트웨어 패키지를 이용하였다. 본 발명자는 114개의 OR-후각자극제 상호작용(가능한 7,200로부터)을 발견하였으며, 이중 81개는 신규하며, 24개의 상호작용은 15개의 희귀 수용체를 갖는다(도 10c, 도 17, 및 보충 표 4)(FDR = 1%; Benjamini-Hochberg 보정). 39개 수용체 중 전체 28개는 적어도 하나의 후각자극제에 의해 활성화되었으며, 182개의 후각자극제 중 68개는 적어도 하나의 OR을 활성화시켰다(표 4). 본 발명자는 여러 중요한 차이를 갖는 종래 개발된 일시적 OR 검정으로 개별적으로 시험하기 위해 적어도 1.2배 유도의 37개의 상호작용을 선택하였다(도 18). 1%의 FDR에서 히트로서 불리워지는 28개의 상호작용 중에서, 이들 중 21개는 이러한 직교 시스템에서 복제되었다(도 17). 심지어 복제하지 않는 7개 중 일부는 실제일 가능성이 있다. 예를 들어, 본 발명자의 검정은 높은 화학적 유사성(메틸 살리실레이트 및 벤질 살리실레이트)을 갖는 MOR19-1에 대한 2개의 히트를 등록하였는데, 이는 이러한 것이 거짓 양성(false positive)이지 않을 가능성을 시사한다(도 18). 추가적으로, 1% FDR 임계값을 통과하지 못한 9개의 상호작용 중 3개는 직교 검정(Orthogonal assay)에서 활성화를 나타내었는데, 이는 보존적 임계값을 나타낸다. 종래 대규모 OR 디오파니제이션 연구는 일부 동일한 수용체 및 화학물질을 사용하였으며, 본 발명자는 100μM 미만의 EC50을 갖는 이의 보고된 상호작용의 9/12가 또한 본 발명자의 플랫폼에서 검출되었다는 것을 발견하였으며, 본 발명자는 대부분의 종래 낮은 친화력 상호작용을 식별하지 못하였다(도 19). 반대로, 본 발명자는 또한, 이러한 종래 연구가 시험되었지만 음성으로 불리워진 14개의 상호작용을 검출한다. 마지막으로, 본 발명자의 검정은 상호작용하지 않는 후각자극제와 OR의 조합을 주로 요약하였다(493/507).
본 발명자는, 유사한 특징을 갖는 화학물질이 본 연구에서 본 발명자가 데오파니화한 수용체를 포함하는 OR의 유사한 세트를 활성화시킴을 발견하였다. 예를 들어, 종래 희귀 MOR13-1은 3 경우에, 강직의 비-회전 가능한 골격에 부착된 극성 기를 갖는 4개의 화학물질에 의해 활성화된다. 다른 예는 MOR19-1로서, 이는 살리실레이트 작용기에 대한 명확한 친화력을 갖는다. 불완전하고 때때로 임의의 화학적 기술어에 의존하지 않고 화학적 유사성이 수용체 활성화와 관련이 있음을 더 잘 이해하기 위하여, 본 발명자는 약 292 차원 잠재 공간에서 각 화학물질을 나타내기 위해 종래에 검증된 전산 오토인코더를 사용하여, 화학적 구조의 거의 무손실 압축을 허용한다(데이터는 미도시됨). 본 발명자는 동일한 OR을 활성화시키는 화학물질이 별도로 클러스터링되는 경향을 나타냄을 발견하였다(도 10d, 도 20). 예를 들어, MOR5-1 리간드는 잠재 공간에서 클러스터링되고, 장쇄(5개 초과의 탄소) 알데하이드 및 카복실산이 10/13 후각자극제가 수용체를 활성화시킴을 나타낸다. 또한, MOR170-1은 넓은 활성화 패턴을 나타낸다. 모든 후각자극제의 약 50%의 결합은 벤젠 고리, 및 카보닐 또는 에테르 기를 함유하며, 이러한 패턴은 또한, 잠재 공간에 반영된다. 다수의 그러나 모두는 아닌 수용체. 전체 상호작용 세트에 대한 활성화 환경은 일부 OR이 분리된 화학적 서브공간에 의해 활성화됨을 시사한다(도 20). 각 OR을 활성화시키는 화학물질의 공간의 이해는 새로운 후각자극제-OR 상호작용의 예측을 토대를 확립시킨다.
화학물질이 내인성 리간드, 약물, 천연 산물, 또는 냄새이던지 간에, 잠재적인 타겟과 어떻게 상호작용하는지에 대한 본 발명자의 불완전한 이해는 여러 가능한 타겟으로 합리적으로 새로운 것을 개발하는 본 발명자의 능력을 제한하며, 기능적 경로는 특정 화학물질이 다수의 타겟과 상호작용할 수 있기 때문에 문제가 된다. 이는 천연 및 치료적 맥락 둘 모두에서 점점 더 명백하게 된다. 본 발명자는 Smell-seq가 396-구성원 인간 OR 레퍼토리로 스케일링될 수 있고, 임의의 후각자극제에 대한 OR 반응을 포괄적으로 규정할 것으로 예상한다. Smell-seq에 대한 웰 당 대략적인 비용은 기존 검정의 유사하지만, 멀티플렉싱은 조사되는 상호작용 당 비용 및 노동을 크게 감소시킨다. 특정 타겟을 더욱 선택적으로 맞추거나 수용체의 세트를 광범위하게 활성화시키려는 노력은 대규모 데이터세트에 의존하는 기계 학습 방법을 이용한다. Smell-seq와 같은 멀티플렉스 방법은 이러한 규모의 품질 데이터를 생성하기 위해 확장 가능한 솔류션을 제공한다.
[표 2] 본 연구에서 스크리닝된 후각 수용체
[표 3] 본 연구에서 스크리닝된 후각자극제
[표 4] 히트로서 불리워지는 후각자극제-수용체 쌍
[표 5] 본 연구에서 사용되는 프라이머 및 서열
방법
1. 후각자극제-수용체 활성화 루시페라아제 검정(일시적)
Dual-Glo 루시페라아제 검정 시스템(Promega)을 이용하여 전술된 바와 같은 OR-후각자극제 반응을 측정하였다[Zhuang and Matsunami 2008]. HEK293T 세포(ATCC #11268)를 100 ㎕ DMEM(Thermo Fisher Scientific)에서 웰 당 7,333개의 세포의 밀도로 폴리-D-라이신 코팅된 백색 96-웰 플레이트(Corning)에 플레이팅하였다. 24시간 후에, 세포를 OR을 엔코딩하는 5 ng/웰의 플라스미드 및 사이클릭 AMP 반응 요소에 의해 유도된 10 ng/웰의 루시페라아제 또는 OR 및 루시페라아제 유전자 둘 모두를 엔코딩하는 10 ng/웰의 플라스미드, 및 둘 모두의 경우에 레닐라 루시페라아제를 엔코딩하는 5 ng/웰의 플라스미드와 함께 리포펙타민 2000(Thermo Fisher Scientific)을 사용하여 트랜스펙션하였다. 실험을 RTP1S(Gene ID: 132112) 및 RTP2(Gene ID: 344892)를 엔코딩하는 5 ng/웰의 플라스미드가 포함된 보조 인자와 함께 수행하였다. 유도적으로 발현된 OR을 트랜스펙션 배지에 첨가된 1 ㎍/ml 독시사이클린(Sigma-Aldrich)으로 트랜스펙션시켰다. 10 내지 100 mM 후각자극제 모액을 DMSO 또는 에탄올 중에 제조하였다. 트랜스펙션 후 24시간 후에, 트랜스펙션 배지를 제거하고, 모액으로부터 CD293(Thermo Fisher Scientific) 내로 희석된 25 ㎕/웰의 적절한 농도의 후각자극제로 교체하였다. 후각자극제 자극 후 4시간 후에, Dual-Glo 루시페라아제 검정 키트를 제조업체의 설명서에 따라 투여하였다. M1000 플레이트 판독기(Tecan)를 이용하여 발광을 측정하였다. 모든 발광값을 레닐라 루시페라아제 활성으로 정규화하여 제공된 웰에서의 트랜스펙션 효율을 조절하였다. 데이터를 마이크로소프트 엑셀 및 R로 분석하였다.
2. 후각자극제-수용체 활성화 루시페라아제 검정(통합됨)
결합된 수용체/리포터 플라스미드와 통합된 HEK293T 및 HEK293T 유래 세포를 폴리-D-라이신 코팅된 96-웰 플레이트에서 100 ㎕ DMEM 중 7333개의 세포/웰의 밀도로 플레이팅하였다. 24시간 후에, 1 ㎍/ml 독시사이클린을 웰 배지에 첨가하였다. 후각자극제 자극, 루시페라아제 시약 첨가, 및 발광 측정을 일과성 검정과 동일한 방식으로 수행하였다. 구성적으로 발현된 OR을 독시사이클린 첨가 없이 동일한 방식으로 검정하였다. 데이터를 마이크로소프트 엑셀 및 R로 분석하였다.
3. 파일롯-스케일 멀티플렉싱된 후각자극제 스크리닝을 위한 냄새 자극 및 RNA 추출
결합된 수용체/리포터 플라스미드로 전위된 HEK293T 및 HEK293T 유래 세포를 6 웰 플레이트에서 2 mL DMEM 중에서 200k개의 세포/웰의 밀도로 플레이팅하였다. 24시간 후에, 1 ㎍/ml 독시사이클린을 웰 배지에 첨가하였다. 10 내지 100 mM 후각자극제 모액을 DMSO 또는 에탄올 중에 제조하였다. 독시사이클린 첨가 후 24시간 후에, 후각자극제를 OptiMEM 중에서 희석시키고, 배지를 흡기시키고, 1 mL의 후각자극제-OptiMEM 용액으로 교체하였다. 냄새 자극 후 3시간 후에, 냄새 배지를 흡기시키고, 각 웰에 600 ㎕의 완충제 RLT(Qiagen)를 첨가하였다. 세포를 Qiashredder Tissue 및 Cell Homogenizer(Qiagen)로 용해시키고, RNA를 제조업체의 프로토콜에 따라 임의적 온-커럼 DNAse 단계를 갖는 RNEasy MiniPrep Kit(Qiagen)를 이용하여 정제하였다.
4. 파일롯 스케일 라이브러리 제조 및 RNA-seq
샘플 당 5 ㎍의 전체 RNA를 바코딩된 리포터 유전자(OL003)에 대한 유전자 특이적 프라이머를 사용하여 Superscript IV(Thermo-Fisher)로 역전사하였다. 반응 조건은 하기와 같다: 어닐링: [5분 동안 65℃ 1분 동안 0℃] 확장: [60분 동안 52℃ 10분 동안 80℃]. 10%의 cDNA 라이브러리 부피를 HiFi Master Mix(Kapa Biosystems)를 이용하여 5회 사이클(OL004F 및 R) 동안 증폭시켰다. 반응 및 사이클링 조건은 하기와 같이 최적화된다: 3분 동안 95℃ 20초 동안 98℃ 15초 동안 59℃및 10초 동안 72℃의 5회 사이클, 이후, 1분 동안 72℃의 확장. PCR 산물을 DNA Clean & Concentrator 키트(Zymo Research)를 이용하여 10 ㎕로 정제하고, 1 ㎕의 각 샘플을 CFX Connect Thermocycler(Biorad)를 구비한 SYBR FAST qPCR Master mix(Kapa Biosystems)를 이용하여 증폭시켜(OL005F 및 R) 라이브러리 증폭을 위해 필요한 PCR의 수를 결정하였다. 반응 및 사이클링 조건은 하기와 같이 최적화된다: 3분 동안 95℃ 3초 동안 95℃ 및 20초 동안 60℃의 40회 사이클. qPCR 후에, 5 ㎕의 사전-증폭된 cDNA 라이브러리를 사전에 결정된 Cq보다 4회 사이클 더 많은 사이클 동안 qPCR을 위해 사용된 동일한 프라이머로 제1 증폭과 동일한 사이클링 조건에서 두번째 증폭하였다. PCR 산물을 이후에, Zymoclean Gel DNA Recovery Kit(Zymo Research)를 이용하여 1% 아가로오스 겔로부터 겔 단리하였다. 라이브러리 농도를 Tape Station 2200(Agilent)을 이용하여 정량화하고, 20% PhiX 스파이크-인을 구비한 Hi-Seq 3000 상에서 동일한 몰로 로딩하고, 맞춤 프라이머: Read 1(OL003) 및 i7 Index(OL006)로 시퀀싱하였다.
5. OR 라이브러리 클로닝
골격 플라스미드(OR 및 바코드를 제외한 모든 유전자 요소)를 Gibson Assembly Hifi Mastermix(SGI-DNA)를 구비한 등온 어셈블리를 이용하여 생성하였다. HiFi Master Mix를 이용하여 바코드 서열(OL007F 및 R)을 생성하기 위해 짧은 단편을 15개의 랜덤 뉴클레오티드를 함유한 프라이머로 증폭시켰다. 반응 및 사이클링 조건은 하기와 같이 최적화된다: 3분 동안 95℃ 20초 동안 98℃ 15초 동안 60℃및 20초 동안 72℃의 35회 사이클, 이후, 1분 동안 72℃의 확장. 앰플리콘 및 골격 플라스미드를 제한 효소 MluI 및 AgeI(New England Biolabs)로 소화시키고 T4 DNA 리가아제(New England Biolabs)로 결찰시켰다. 바코드 라이브러리의 다양성을 유지하기 위해 DH5α E. coli 경쟁 세포(New England Biolabs)를 항생제를 갖는 액체 배양물 내에서 직접 형질전환시켰다.
OR 유전자를 HiFi Master Mix를 이용하여 바코딩된 골격 플라스미드에 상동성을 추가하여 프라이머(OL008)로 개별적으로 증폭하였다. 반응 및 사이클링 조건은 하기와 같이 최적화된다: 3분 동안 95℃ 20초 동안 98℃ 15초 동안 61℃ 및 30초 동안 72℃의 35회 사이클, 이후, 1분 동안 72℃의 확장. 증폭된 OR을 DNA Clean and Concentrator로 정제하고, 함께 풀링하였다. 바코딩된 골격 플라스미드를 NdeI 및 SbfI로 소화시키고, OR 앰플리콘 풀을 Gibson Assembly Hifi Mastermix를 갖는 등온 어셈블리를 이용하여 여기에 클로닝하였다. DH5α E.coli 경쟁 세포를 어셈블리로 형질도입하고, 항생제 내성 클론을 96-웰 플레이트에서 피킹하고 밤새 성장시켰다. 플라스미드 DNA를 Zyppy-96 플라스미드 Miniprep Kit(Zymo Research)로 준비하였다. 바코드를 리포터 유전자와 연관시키고 무오류 OR을 식별하기 위해 플라스미드를 Sanger 시퀀싱하였다(OL109-111).
6. OR 라이브러리 게놈 통합
HEK293T 세포 및 HEK293T 유래 세포를 6-웰 플레이트에서 2 mL DMEM 중에 350k개의 세포/웰의 밀도로 시딩하였다. 시딩 후 24시간 후에, 세포를 제조업체의 설명서에 따라 수용체/리포터 트랜스포존을 엔코딩하는 플라스미드 및 Super PiggyBac 트랜스포사아제(Systems Bioscience)로 트랜스펙션시켰다. 1 ㎍의 트랜스포존 DNA 및 200 ng의 트랜스포사아제 DNA를 웰 당 리포펙타민 3000으로 트랜스펙션시켰다. 트랜스펙션 세포 후 3일 후에, 6-웰 플레이트에 1:10으로 계대배양하고, 계대배양 후 1일 후에, 8 ㎍/ml 블라스티시딘을 세포에 첨가하였다. 세포를 7 내지 10일 동안 선별하여 성장시켰다. OR 라이브러리를 개별적으로 전위시키고, 동일한 세포 수로 함께 풀링하였다.
7. 보조 인자 세포주 생성
HEK293T 유래 세포를 OR 라이브러리 통합 섹션에서 전위 프로토콜에 따라 동일한 몰로 풀링된 Tet-On 프로모터에 의해 유발성으로 유도된 보조 인자 유전자 RTP1S, RTP2, Gα olf(Gene ID: 2774), 및 Ric8b(Gene ID: 237422)를 엔코딩하는 플라스미드로 전위시켰다. 세포를 2 ㎍/ml 푸로마이신(Thermo Fisher)으로 선택하였다. 선택 후에, 세포를 96-웰 플레이트에서 0.5개의 세포/웰의 밀도로 시딩하였다. 웰을 3일 후에 단일 콜로니에 대해 시험하고, 7일 후에 24-웰 플레이트로 확장하였다. 클론을 일과성 루시페라아제 검정으로 Olfr62 및 OR7D4의 강력한 활성화에 대해 이를 스크리닝함으로써 보조 인자 발현에 대해 스크리닝하였다(도 11). 수용체 및 현저한 성장 결함이 없음 둘 모두에 대해 가장 높은 배수 활성화를 갖는 클론을 멀티플렉싱된 스크린을 위해 규명하였다.
8. 트랜스포존 카피 수 입증
gDNA를 Quick-gDNA Miniprep 키트로 OR 리포터 벡터로 전위된 세포로부터 및 단일 카피 랜딩 패드를 함유한 세포로부터 정제하였다. 50 ng의 gDNA를 제조업체의 프로토콜을 이용하여 CFX Connect Thermocycler 상에서 SYBR FAST qPCR Master Mix(Kapa Biosystems)를 이용하여 각 샘플로부터 외인성 DNA의 영역에 어닐링하여 프라이머로 증폭시켰다. 반응 및 사이클링 조건은 하기와 같이 최적화된다: 3분 동안 95℃ 3초 동안 95℃ 및 20초 동안 60℃의 40회 사이클. 카피 수를 결정하기 위하여 전위된 OR에 대한 Cq 값을 단일 카피 랜딩 패드(single copy 랜딩 패드)로 정규화하였다.
9. 렌티바이러스 형질도입
렌티바이러스 벡터를 Mirus TransIT-293를 사용하여 렌티바이러스 전사 플라스미드, pCMVΔR8.91 및 pCAGGS-VSV-G로 293T 세포의 일시적 트랜스펙션에 의해 생성하였다. HEK293T 세포를 형질도입하여 50% 컨플루언시로 m2rtTA 전사 인자(Tet-On)를 발현시키고, 형질도입하기 1일 전에 시딩하였다. 96-웰 플레이트에서 세포를 0.5개 세포/웰의 밀도로 시딩함으로서 클론을 단리시켰다. 웰을 7일 후에 단일 콜로니에 ego 시험하고, 24 웰 플레이트로 확장시켰다. 클론을 일시적 루시페라아제 검정으로 MOR42-3(Gene ID: 257926)의 강력한 활성화에 대한 스크리닝에 의해 m2rtTA에 대해 평가하였다.
10. 고처리량 후각자극제 스크리닝
OR 라이브러리 세포주를 스크리닝을 위해 96-웰 플레이트 내에 시딩하기 전에 3일 동안 T-225 플라스크(Corning) 내에 액체 질소 냉동된 모액으로부터 해동하였다. 라이브러리를 100 ㎕의 DMEM에서 웰 당 6,666개의 세포로 시딩하였다. 24시간 후에, DMEM 중 작업 농도의 1 ㎍/ml의 독시사이클린을 웰에 첨가하였다. 유도 후 24시간 후에, 배지를 각 플레이트로부터 제거하고, OptiMEM에 희석된 25 ㎕의 후각자극제로 교체하였다. 각 냄새를 동일한 양의 최종 DMSO(1%)로 3개의 상이한 농도(10 uM, 100 uM, 1 mM)로 3회 첨가하였다. 각 플레이트는 3개의 농도(10 uM, 100 uM, 1 mM)로 2개의 대조 후각자극제, 및 매질 중에 용해된 1% DMSO를 함유한 3개의 웰을 함유하였다. 라이브러리를 뚜껑이 제거된 세포 배양 인큐베이터에서 3시간 동안 후각자극제와 함께 인큐베이션하였다.
냄새 인큐베이션 후에, 배지를 플레이트로부터 피펫팅하고, 25 ㎕의 얼음-냉각된 세포-대-cDNA II 용해 완충제(Thermo Fisher)를 첨가하고 위 아래로 피펫팅하여 세포를 균질화하고 용해함으로써 세포를 용해하였다. 용해물을 15분 동안 75℃까지 가열하고, 액체 질소로 새로이 냉동시키고, 추가 처리까지 -80℃에서 유지시켰다. 이후에, 0.5 ㎕ DNase I(New England Biolabs)을 용해물에 첨가하고, 37℃에서 15분 동안 인큐베이션하였다. RT 프라이머를 어닐링하기 위해, 각 웰로부터의 5 ㎕의 용해물을 2.5 ㎕의 10 mM dNTP(New England Biosciences), 1 ㎕의 2 uM 유전자 특이적 RT 프라이머(OL003), 및 1.5 ㎕의 H2O와 합하였다. 반응을 5분 동안 65℃까지 가열시키고, 다시 0℃까지 냉각시켰다. 어닐링 후에, 1 ㎕의 M-MuLV 역전사효소(Enzymatics), 1 ㎕의 완충제, 및 0.25 ㎕의 RNase 억제제(Enzymatics)를 각 반응에 첨가하였다. 반응을 42℃에서 60분 동안 인큐베이션하고, RT 효소를 85℃에서 10분 동안 열 비활성화시켰다.
각 배치에 대하여, PCR 기반 라이브러리 제조를 위해 필요한 사이클의 수를 결정하기 위하여, qPCR을 SYBR FAST qPCR Mastermix를 갖는 수 개의 웰(OL005F 및 OL013)에서 수행하였다. 반응 및 사이클링 반응은 하기와 같이 최적화된다: 3분 동안 95℃ 3초 동안 95℃ 및 20초 동안 60℃의 40회 사이클. qPCR 후에, 5 ㎕의 각 RT 반응을 시퀀싱 어댑터를 함유한 0.4 ㎕의 10 uM 프라이머(OL005F 및 OL013), 10 ㎕의 NEB-Next Q5 Mastermix(New England Biosciences) 및 4.2 ㎕ H2O와 합하고, PCR을 제조업체 프로토콜에 따라 수행하였다. 포워드 프라이머는 P7 어댑터 서열 및 검정에서 웰을 식별하는 인덱스를 함유하며, 리버스 프라이머는 P5 어댑터 서열 및 검정에서 플레이트를 식별하는 인덱스를 함유한다. PCR 산물을 플레이트에 의해 함께 풀링하고, DNA Clean and Concentrator Kit로 정제하였다. 라이브러리 농도를 Tape Station 2200 및 Qubit(Thermo Fisher)를 이용하여 정량화하였다. 라이브러리를 고출력 모드(Illumina)에서 NextSeq 500에서 2개의 인덱스 리드 및 단일 단부 75-bp 리드로 시퀀싱하였다.
11. 차세대 시퀀싱 데이터의 분석
샘플을 각 웰(5' 말단)에 대해 고유하고 각 플레이트(3' 말단)에 대해 고유한 및 각 플레이트(3' 말단)에 대해 고유한 이의 PCR 인덱스 어댑터에 의한 인덱싱을 통해 식별하였다. 웰 바코드 이후에, 문헌[Illumina Sequencing Library Preparation for Highly multiplexed Target Capture and Sequencing Matthias Meyer, Martin Kircher, Cold Spring Harb Protoc; 2010; doi:10.1101/pdb.prot5448]에서의 7bp 인덱싱 방식(indexing scheme)으로 이어졌다. 플레이트 인덱싱 방식 이후에, Illumina 인덱싱 방식이 이어졌다. 시퀀싱 데이터를 탈멀티플렉싱하고, 15bp 바코드 서열을 맞춤 파이톤 및 바시 스크립(python and bash script)에 의해 단지 정확한 매칭으로 카운팅하였다.
12. 콜링 히트(Calling Hit)를 위한 통계학적 방법
카운트 데이터를 이후에, 차등 발현 패키지 EdgeR을 이용하여 분석하였다. 낮은 표현(low representation)을 갖는 OR을 필터링하기 위하여, 본 발명자는 OR이 1954개의 시험 샘플 중 399개 이상으로부터 리드(read)의 적어도 0.5%를 함유해야하는 컷오프를 설정하였다. 이러한 것은 42개의 OR 중 3개를 필터링하였는데, 이는 세포 라이브러리(MOR172-1, MOR176-1 및 MOR181-1)에서 낮게 표현되었다. 정규화 인자를 EdgeR 패키지 함수 calcNormFactors를 이용하여 결정하고, 단지 40개의 OR이 라이브러리에 존재하고 추세를 갖는 분산 값이 데이터에 잘 맞기 때문에, glmFit를 태그별 분산으로 설정된 분산과 함께 사용하였다. 후각자극제가 특정 OR을 자극한 경우를 결정하기 위해 카운트 데이터에 일반화된 선형 모델을 피팅함으로써, 본 발명자는 각 OR-후각자극제 상호작용에 대한 평균 활성화 및 p-값 둘 모두를 결정할 수 있었다. 본 발명자는 이후에, 오류 발견률(FDR)을 산출하는 Benjamini & Hochberg 보정을 갖는 빌트 인 p.adjust 함수를 이용하여 다중 가설 시험을 위해 이러한 p-값을 보정하였다. 본 발명자는 상호작용하는 후각자극제-OR 쌍을 결정하기 위해 1%의 보존적 컷오프를 설정하였다. 후각자극제와 OR 간의 각 상호작용을 위하여, 본 발명자는 OR-후각자극제 상호작용이 2개의 상이한 농도의 후각자극제에서 또는 단지 1000 uM 농도에서 컷오프를 넘는 것을 추가로 요구하였다.
13. 분자 오토엔코더(Molecular Autoencoder)
본 발명자는 화학적 공간의 환경에서 OR-화학적 상호작용을 시각화하기 위해 Gomez-Bombarelli 등에서 기술된 바와 같이 오토엔코더를 사용하였다. 저자의 조언에 따라, 본 발명자는 본래 구현이 불필요한 Python 패키지를 필요로 하기 때문에 오토엔코더의 재구현을 이용하였다. 이러한 모델은 SMILES이 120개의 문자보다 더 긴 분자를 제외하고 전체 ChEMBL 23 데이터베이스 상에서 0.99의 검증 정확도로 사전-훈련되었다. 본 발명자는 이러한 사전훈련된 모델을 이용하여 본 발명의 168개의 화학물질(이 중 본 발명자는 SMILES 표현을 발견할 수 있음) 및 ChEMBL 23으로부터 무작위적으로 샘플링된 250,000 모두의 잠재 표현을 생성하였다. 본 발명자는 이후에, 2차원으로 얻어진 행렬을 투영하기 위한 주요 구성 분석을 수행하기 위해 scikit-learn을 이용하였다.
실시예 3 - ADRB2 변이체 스크린
돌연변이체 라이브러리의 생성 및 기능성 평가의 개요. 본 발명자는 올리고뉴클레오티드 마이크로어레이 상에서 돌연변이체 서열을 합성하지만, 각 올리고에 대한 길이 제한은 약 230 nt이며, ADRB2의 길이는 약 1200 nt이다. 단백질의 길이를 커버하기 위하여, 본 발명자는 이를 8개의 부분으로 세그먼트화해야 하며, 각 돌연변이체를 8번째 합성하고 별도의 백그라운드 벡터로 클로닝하였다. 변이체 세그먼트를 증폭시키고 클로닝할 때, 본 발명자는 각 서열에 대한 15nt 랜덤 바코드를 부착시켰다. 클로닝 시에, 본 발명자는 차세대 시퀀싱으로 각 변이체에 대한 각 바코드를 맵핑하였다. 그 후에, 본 발명자는 단백질의 잔부에서 클로닝되고, Gs 신호전달 시에 발현시키는 사이클릭 AMP 반응 요소(CRE) 리포터 유전자의 3' UTR에 바코드를 전위시켰다. 이로부터, 본 발명자는 세린 리콤비나아제 기술을 이용하여 세포 당 단일 카피(멀티플렉싱된 검정에서 돌연변이체들 간의 혼성을 방지하는데 필수적임)에서 ΔADRB2 HEK293T 세포에서 규정된 게놈 유전자좌에서 라이브러리를 통합하였다. 통합 후에, 본 발명자는 다양한 이소프로테레놀 농도로 라이브러리 세포주를 자극시켰고 바코드 서열 상에서 RAN-seq를 수행하였다. 각 바코드의 상대 존재비는 표현을 위한 정규화 후 각 B2 변이체의 상대 활성로서 추정될 수 있다. 이는 도 21에 도시되어 있다.
도 22에서, 본 발명자는 2개의 생물학적 복제에 대한 프레임이동(올리고뉴클레오티드 마이크로어레이 합성의 공통 오류 모드) 및 단일 돌연변이체 라이브러리 둘 모두에 대한 중간 야생형 신호에 대한 분포 활성을 본다. 본 발명자의 변이체 분포를 구축하기 위하여, 본 발명자는 제공된 변이체와 관련된 모든 바코드의 측정을 평균처리한다. 프레임이동 분포를 구축하기 위해, 본 발명자는 특정 코돈에서 인델과 관련된 모든 바코드의 측정을 평균처리한다(C-말단 제외). 예상되는 바와 같이, 프레임이동은 평균 미스센스 돌연변이보다 더욱 유해한 효과를 갖는다. 본 발명자는 또한, 높은 이소프로테레놀 농도에서, 본 발명자의 미스센스 돌연변이 더 높은 비율이 야생형 수준의 활성에 접근함을 본다.
도 23에서, 본 발명자는 0.625 uM 이소프로테레놀에서 β2에 대한 변이체 활성 환경을 나타낸다. 돌연변이 환경은 β2 구조 및 기능의 일반적인 경향을 나타낸다. 예를 들어, 본 발명자는 막관통 도메인이 말단 또는 세포내 루프 3보다 프롤린 및 하전된 잔기 치환에 대해 더욱 민감함을 보인다(돌연변이 내성은 모든 돌연변이의 평균 효과임). 본 발명자는 또한, 프레임이동의 효과가 C-말단에서 크게 감소됨을 본다. 본 발명자는 돌연변이 데이터가 EV 돌연변이 스코어와 상호관련있음을 보며, 본 발명자는 또한, 드문 변이체가 GNOMAD 데이터로부터의 기능에 어떻게 영향을 미치는지를 볼 수 있다.
도 24에서, 본 발명자는 멀티플렉싱된 시퀀싱 방법과 비교하여 루시페라아제 리포터와 개별적으로 검정된 미스센스 변이체들 간의 비교를 나타낸다. WT에 대한 돌연변이체 활성가 대부분 요약되어 있다. 멀티플렉싱된 검정은 이소프로테레놀 자극 범위에 걸쳐 완전히 죽은 돌연변이체와 일부 유해한 돌연변이체를 구별할 수 있다.
본 발명자는 Ring 등의 수용체와 하이드록시 벤질 이소프로테레놀의 접촉 맵으로부터 주석을 붙인 바와 같이, β2의 리간드 결합 포켓의 돌연변이 내성(모든 치환의 평균)을 조사하였다. 본 발명자의 검정에서, 본 발명자는 오로지 이소프로테레놀로 자극되며, 본 발명자는 이소프로테레놀과 상호작용하는 잔기에 대한 돌연변이가 하이드록시벤질 테일과 상호작용하는 잔기에 비해 돌연변이에 대해 상당히 덜 내성적임은 것으로 본다. 이는 도 25에 도시되어 있다.
본 발명자는 또한, k-수단 클러스터링과 같은 단순 알고리즘이 기능적으로 관련된 방식에서 β2의 구조 상에 맵핑하는 별개의 부류로 본 발명자의 데이터를 그룹핑할 수 있다는 것을 발견하였다. 이러한 특정 예에서, 본 발명자는 아미노산 돌연변이를 기능성 부류로 그룹핑하고, 이의 신호를 평균처리하였다. 중요하게, 본 발명자는 알고리즘에 임의의 공간 정보를 제공하지 않는다. 본 발명자는 afo의 심층 돌연변이 스캔이 단백질 구조를 조사하는 강력한 방법일 수 있다고 생각한다. 이는 도 26에 도시되어 있다.
본원에 개시되고 청구된 모든 방법은 본 개시내용의 측면에서 과도한 실험 없이 이루어지고 실행될 수 있다. 본 발명의 조성물 및 방법이 바람직한 구체예의 측면에서 기술되었지만, 변형이 본 발명의 개념, 사상 및 범위를 벗어나지 않으면서 본원에 기술된 방법에 및 단계들에, 또는 방법의 단계들의 순서에 적용될 수 있다는 것이 당업자에게 명백할 것이다. 더욱 상세하게, 화학적으로 및 생리학적 둘 모두로 관련된 특정 작용제가 본원에 기술된 작용제에 대해 치환될 수 있고 동일하거나 유사한 결과가 달성될 수 있다는 것이 명백할 것이다. 당업장에게 명백한 모든 이러한 유사한 치환 및 변형은 첨부된 청구항에 의해 규정된 바와 같은 본 발명의 사상, 범위 및 개념 내에 있는 것으로 간주된다.
참고문헌
본 명세서 전반에 걸쳐 언급된 하기 참고문헌 및 출판물은 본원에 기술된 것들에 대해 보충적인 예시적인 절차 또는 다른 세부사항을 제공하는 한, 상세하게 본원에 참고로 포함된다.
1. Roth, B. L., Sheffler, D. J. & Kroeze, W. K. Magic shotguns versus magic bullets: selectively non-selective drugs for mood disorders and schizophrenia. Nat. Rev. Drug Discov. 3, 353-359 (2004).
2. Reddy, A. S. & Zhang, S. Polypharmacology: drug discovery for the future. Expert Rev. Clin. Pharmacol. 6, 41-47 (2013).
3. Fang, J., Liu, C., Wang, Q., Lin, P. & Cheng, F. In silico polypharmacology of natural products. Brief. Bioinform. (2017). doi: 10.1093/bib/bbx045
4. Anighoro, A., Bajorath, J. & Rastelli, G. Polypharmacology: challenges and opportunities in drug discovery. J. Med. Chem. 57, 7874-7887 (2014).
5. Malnic, B., Hirono, J., Sato, T. & Buck, L. B. Combinatorial receptor codes for odors. Cell 96, 713-723 (1999).
6. Buck, L. & Axel, R. A novel multigene family may encode odorant receptors: a molecular basis for odor recognition. Cell 65, 175-187 (1991).
7. Hauser, A. S., Attwood, M. M., Rask-Andersen, M., Schiφth, H. B. & Gloriam, D. E. Trends in GPCR drug discovery: new agents, targets and indications. Nat. Rev. Drug Discov. 16, 829-842 (2017).
8. Niimura, Y., Matsui, A. & Touhara, K. Extreme expansion of the olfactory receptor gene repertoire in African elephants and evolutionary dynamics of orthologous gene groups in 13 placental mammals. Genome Res. 24, 1485-1496 (2014).
9. Peterlin, Z., Firestein, S. & Rogers, M. E. The state of the art of odorant receptor deorphanization: a report from the orphanage. J. Gen. Physiol. 143, 527-542 (2014).
10. Lu, M., Echeverri, F. & Moyer, B. D. Endoplasmic reticulum retention, degradation, and aggregation of olfactory G-protein coupled receptors. Traffic 4, 416-433 (2003).
11. Saito, H., Chi, Q., Zhuang, H., Matsunami, H. & Mainland, J. D. Odor coding by a Mammalian receptor repertoire. Sci. Signal. 2, ra9 (2009).
12. Mainland, J. D. et al. The missense of smell: functional variability in the human odorant receptor repertoire. Nat. Neurosci. 17, 114-120 (2014).
13. Botvinik, A. & Rossner, M. J. Linking cellular signalling to gene expression using EXT-encoded reporter libraries. Methods Mol. Biol. 786, 151-166 (2012).
14. Galinski, S., Wichert, S. P., Rossner, M. J. & Wehr, M. C. Multiplexed profiling of GPCR activities by combining split TEV assays and EXT-based barcoded readouts. Sci. Rep. 8, 8137 (2018).
15. Zhuang, H. & Matsunami, H. Synergism of accessory factors in functional expression of mammalian odorant receptors. J. Biol. Chem. 282, 15284-15293 (2007).
16. Shepard, B. D., Natarajan, N., Protzko, R. J., Acres, O. W. & Pluznick, J. L. A cleavable N-terminal signal peptide promotes widespread olfactory receptor surface expression in HEK293T cells. PLoS One 8, e68758 (2013).
17. Saito, H., Kubota, M., Roberts, R. W., Chi, Q. & Matsunami, H. RTP family members induce functional expression of mammalian odorant receptors. Cell 119, 679-691 (2004).
18. Li, X. et al. piggyBac transposase tools for genome engineering. Proc. Natl. Acad. Sci. U. S. A. 110, E2279-87 (2013).
19. McCarthy, D. J., Chen, Y. & Smyth, G. K. Differential expression analysis of multifactor RNA-Seq experiments with respect to biological variation. Nucleic Acids Res. 40, 4288-4297 (2012).
20. Zhuang, H. & Matsunami, H. Evaluating cell-surface expression and measuring activation of mammalian odorant receptors in heterologous cells. Nat. Protoc. 3, 1402-1413 (2008).
21. Gomez-Bombarelli, R. et al. Automatic Chemical Design Using a Data-Driven Continuous Representation of Molecules. ACS Cent Sci 4, 268-276 (2018).
22. Antebi, Y. E. et al. Combinatorial Signal Perception in the BMP Pathway. Cell 170, 1184-1196.e24 (2017).
SEQUENCE LISTING <110> THE REGENTS OF THE UNIVERSITY OF CALIFORNIA <120> MULTIPLEXED RECEPTOR-LIGAND INTERACTION SCREENS <130> UCLA.P0051WO <140> PCT/US2018/040866 <141> 2018-07-05 <150> 62/528,833 <151> 2017-07-05 <160> 189 <170> PatentIn version 3.5 <210> 1 <211> 8 <212> DNA <213> Unknown <220> <223> Description of Unknown: CRE motif sequence <400> 1 tgacgtca 8 <210> 2 <211> 316 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 2 cgtcgtgacg tcagacagac cacgcgatcg ctcgagtccg ccggtcaatc cggtgacgtc 60 acgggcctct tcgctattac gccagctggc gaaagggggt tgacgtcaca ttaaatcggc 120 caacgcgcgg ggagaggcgg tgacgtcaac aggcatcgtg gtgtcacgct cgtcgtgacg 180 tcagtcgctt taactggccc tggctttggc agcctgtagc ctgacgtcag agagcctgac 240 gtcagagagc ggagactcta gagggtatat aatggaagct cgaattccag cttggcattc 300 cggtactgtt ggtaaa 316 <210> 3 <211> 232 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 3 gagggacagc ccccccccaa agcccccagg gatgtaatta cgtccctccc ccgctagggg 60 gcagcagcga gccgcccggg gctccgctcc ggtccggcgc tccccccgca tccccgagcc 120 ggcagcgtgc ggggacagcc cgggcacggg gaaggtggca cgggatcgct ttcctctgaa 180 cgcttctcgc tgctctttga gcctgcagac acctgggggg atacggggaa aa 232 <210> 4 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 4 Gly Leu Asn Asp Ile Phe Glu Ala Gln Lys Ile Glu Trp His Glu 1 5 10 15 <210> 5 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 5 Lys Arg Arg Trp Lys Lys Asn Phe Ile Ala Val Ser Ala Ala Asn Arg 1 5 10 15 Phe Lys Lys Ile Ser Ser Ser Gly Ala Leu 20 25 <210> 6 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 6 Glu Glu Glu Glu Glu Glu 1 5 <210> 7 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 7 Gly Ala Pro Val Pro Tyr Pro Asp Pro Leu Glu Pro Arg 1 5 10 <210> 8 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 8 Asp Tyr Lys Asp Asp Asp Asp Lys 1 5 <210> 9 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 9 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 10 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 10 His His His His His His 1 5 <210> 11 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 11 Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu 1 5 10 <210> 12 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 12 Thr Lys Glu Asn Pro Arg Ser Asn Gln Glu Glu Ser Tyr Asp Asp Asn 1 5 10 15 Glu Ser <210> 13 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 13 Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser 1 5 10 15 <210> 14 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 14 Met Asp Glu Lys Thr Thr Gly Trp Arg Gly Gly His Val Val Glu Gly 1 5 10 15 Leu Ala Gly Glu Leu Glu Gln Leu Arg Ala Arg Leu Glu His His Pro 20 25 30 Gln Gly Gln Arg Glu Pro 35 <210> 15 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 15 Ser Leu Ala Glu Leu Leu Asn Ala Gly Leu Gly Gly Ser 1 5 10 <210> 16 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 16 Thr Gln Asp Pro Ser Arg Val Gly 1 5 <210> 17 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 17 Trp Ser His Pro Gln Phe Glu Lys 1 5 <210> 18 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 18 Cys Cys Pro Gly Cys Cys 1 5 <210> 19 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 19 Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr 1 5 10 <210> 20 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 20 Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys 1 5 10 <210> 21 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 21 Asp Leu Tyr Asp Asp Asp Asp Lys 1 5 <210> 22 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 22 Thr Asp Lys Asp Met Thr Ile Thr Phe Thr Asn Lys Lys Asp Ala Glu 1 5 10 15 <210> 23 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 23 Ala His Ile Val Met Val Asp Ala Tyr Lys Pro Thr Lys 1 5 10 <210> 24 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 24 Lys Leu Gly Asp Ile Glu Phe Ile Lys Val Asn Lys 1 5 10 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 25 ccctttaatc agatgcgtcg 20 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 26 ctgcctgctt caccaccttc 20 <210> 27 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 27 aagtgccttc ctgcccttta atcagatgcg tcg 33 <210> 28 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 28 cgccgaagtg aaaaccacct a 21 <210> 29 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 29 aagtgccttc ctgcccttta a 21 <210> 30 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (25)..(32) <223> a, c, t or g <400> 30 caagcagaag acggcatacg agatnnnnnn nncgaagtga aaaccaccta 50 <210> 31 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 31 aatgatacgg cgaccaccga gatctacaca agtgccttcc tgccctttaa 50 <210> 32 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 32 cgggtttctt ggccttgtag gtggttttca cttcg 35 <210> 33 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (13)..(27) <223> a, c, t, g, unknown or other <400> 33 ggaataacgc gtnnnnnnnn nnnnnnncga cgcatctgat taaaggg 47 <210> 34 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 34 ggaaggaccg gttctagtca aggcactata cat 33 <210> 35 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 35 tgctcctggc cctgctgacc ctaggcctgg ctcatatgaa tggcacagaa ggccc 55 <210> 36 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 36 agtcggccct gctgaggagt ctttccacct gcaggtctta tcatgtctgc tcgaa 55 <210> 37 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 37 cttctacgtg cccttctc 18 <210> 38 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 38 cctgcaggtc ttatcatgtc 20 <210> 39 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 39 tacaggcgga atggacgag 19 <210> 40 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 40 aagtgaaaac cacctacaag g 21 <210> 41 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 41 ccctttaatc agatgcgtcg 20 <210> 42 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <220> <221> modified_base <222> (30)..(37) <223> a, c, t or g <400> 42 aatgatacgg cgaccaccga gatctacacn nnnnnnnaag tgccttcctg ccctttaa 58 <210> 43 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 43 tgggcagttc caggcttata gtc 23 <210> 44 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 44 gggcgtactt ggcatatgat acac 24 <210> 45 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 45 atcacg 6 <210> 46 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 46 cgatgt 6 <210> 47 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 47 ttaggc 6 <210> 48 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 48 tgacca 6 <210> 49 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 49 acagtg 6 <210> 50 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 50 gccaat 6 <210> 51 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 51 cagatc 6 <210> 52 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 52 acttga 6 <210> 53 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 53 gatcag 6 <210> 54 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 54 tagctt 6 <210> 55 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 55 ggctac 6 <210> 56 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 56 cttgta 6 <210> 57 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 57 agtcaa 6 <210> 58 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 58 agttcc 6 <210> 59 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 59 atgtca 6 <210> 60 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 60 ccgtcc 6 <210> 61 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 61 gtagag 6 <210> 62 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 62 gtccgc 6 <210> 63 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 63 gtgaaa 6 <210> 64 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 64 gtggcc 6 <210> 65 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 65 gtttcg 6 <210> 66 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 66 cgtacg 6 <210> 67 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 67 gagtgg 6 <210> 68 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 68 ggtagc 6 <210> 69 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 69 actgat 6 <210> 70 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 70 atgagc 6 <210> 71 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 71 attcct 6 <210> 72 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 72 caaaag 6 <210> 73 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 73 caacta 6 <210> 74 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 74 caccgg 6 <210> 75 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 75 cacgat 6 <210> 76 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 76 cactca 6 <210> 77 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 77 caggcg 6 <210> 78 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 78 catggc 6 <210> 79 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 79 cctgcga 7 <210> 80 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 80 ctctctat 8 <210> 81 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 81 tgcagag 7 <210> 82 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 82 tatcctct 8 <210> 83 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 83 acctagg 7 <210> 84 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 84 gtaaggag 8 <210> 85 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 85 ttgatcc 7 <210> 86 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 86 actgcata 8 <210> 87 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 87 atcttgc 7 <210> 88 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 88 aaggagta 8 <210> 89 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 89 tctccat 7 <210> 90 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 90 ctaagcct 8 <210> 91 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 91 catcgag 7 <210> 92 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 92 cgtctaat 8 <210> 93 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 93 ttcgagc 7 <210> 94 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 94 tctctccg 8 <210> 95 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 95 agttggt 7 <210> 96 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 96 ctagtcga 8 <210> 97 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 97 gtaccgg 7 <210> 98 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 98 agctagaa 8 <210> 99 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 99 cggagtt 7 <210> 100 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 100 actctagg 8 <210> 101 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 101 acttcaa 7 <210> 102 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 102 tcttacgc 8 <210> 103 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 103 tgatagt 7 <210> 104 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 104 cttaatag 8 <210> 105 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 105 gatccaa 7 <210> 106 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 106 caggtcg 7 <210> 107 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 107 cgcatta 7 <210> 108 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 108 ggtacct 7 <210> 109 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 109 ggacgca 7 <210> 110 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 110 gagattc 7 <210> 111 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 111 gagcatg 7 <210> 112 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 112 gttgcgt 7 <210> 113 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 113 ccaatgc 7 <210> 114 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 114 cgagatc 7 <210> 115 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 115 catattg 7 <210> 116 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 116 gacgtca 7 <210> 117 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 117 tggcatc 7 <210> 118 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 118 gtaattg 7 <210> 119 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 119 cctatct 7 <210> 120 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 120 caatcgg 7 <210> 121 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 121 gcggcat 7 <210> 122 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 122 agtactg 7 <210> 123 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 123 tactatt 7 <210> 124 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 124 ccggatg 7 <210> 125 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 125 accatga 7 <210> 126 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 126 cggttct 7 <210> 127 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 127 tattcca 7 <210> 128 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 128 cctcctg 7 <210> 129 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 129 aggtatt 7 <210> 130 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 130 gcattcg 7 <210> 131 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 131 ttgcgaa 7 <210> 132 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 132 ttgaatt 7 <210> 133 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 133 ctgcgcg 7 <210> 134 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 134 agacctt 7 <210> 135 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 135 gtccagt 7 <210> 136 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 136 acctgct 7 <210> 137 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 137 ccggtac 7 <210> 138 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 138 cttgacc 7 <210> 139 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 139 catcatt 7 <210> 140 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 140 tctgact 7 <210> 141 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 141 tctagtt 7 <210> 142 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 142 gccatag 7 <210> 143 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 143 accgtcg 7 <210> 144 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 144 cttggtt 7 <210> 145 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 145 tacgccg 7 <210> 146 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 146 ggactgc 7 <210> 147 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 147 gcgcgag 7 <210> 148 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 148 gtcgcag 7 <210> 149 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 149 catacgt 7 <210> 150 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 150 tcagtat 7 <210> 151 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 151 ctaagta 7 <210> 152 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 152 ttagctt 7 <210> 153 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 153 cgccgtc 7 <210> 154 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 154 gtcttct 7 <210> 155 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 155 gccggac 7 <210> 156 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 156 aagctga 7 <210> 157 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 157 gcgctct 7 <210> 158 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 158 cgtaggc 7 <210> 159 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 159 atgatta 7 <210> 160 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 160 gcaggtt 7 <210> 161 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 161 aatcgtc 7 <210> 162 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 162 cggccta 7 <210> 163 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 163 ctatgcc 7 <210> 164 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 164 ggttgaa 7 <210> 165 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 165 gagttaa 7 <210> 166 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 166 tagacta 7 <210> 167 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 167 tcatgca 7 <210> 168 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 168 gcttatt 7 <210> 169 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 169 caaggct 7 <210> 170 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 170 aggttgg 7 <210> 171 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 171 cttctgc 7 <210> 172 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 172 taattct 7 <210> 173 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 173 gatgctg 7 <210> 174 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 174 cctagaa 7 <210> 175 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 175 ctagagg 7 <210> 176 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 176 tatccgg 7 <210> 177 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 177 aggcggc 7 <210> 178 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 178 ggtcgtt 7 <210> 179 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 179 ccgctgg 7 <210> 180 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 180 ggaacta 7 <210> 181 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 181 attgcca 7 <210> 182 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 182 atatacg 7 <210> 183 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 183 gattagc 7 <210> 184 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 184 agaagtc 7 <210> 185 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 185 atagtac 7 <210> 186 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 186 gatctcg 7 <210> 187 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 187 ggctgcg 7 <210> 188 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MISC_FEATURE <222> (1)..(10) <223> This sequence may encompass 5-10 residues <400> 188 His His His His His His His His His His 1 5 10 <210> 189 <211> 413 <212> PRT <213> Unknown <220> <223> Description of Unknown: Beta-2 adrenergic receptor sequence <400> 189 Met Gly Gln Pro Gly Asn Gly Ser Ala Phe Leu Leu Ala Pro Asn Gly 1 5 10 15 Ser His Ala Pro Asp His Asp Val Thr Gln Glu Arg Asp Glu Val Trp 20 25 30 Val Val Gly Met Gly Ile Val Met Ser Leu Ile Val Leu Ala Ile Val 35 40 45 Phe Gly Asn Val Leu Val Ile Thr Ala Ile Ala Lys Phe Glu Arg Leu 50 55 60 Gln Thr Val Thr Asn Tyr Phe Ile Thr Ser Leu Ala Cys Ala Asp Leu 65 70 75 80 Val Met Gly Leu Ala Val Val Pro Phe Gly Ala Ala His Ile Leu Met 85 90 95 Lys Met Trp Thr Phe Gly Asn Phe Trp Cys Glu Phe Trp Thr Ser Ile 100 105 110 Asp Val Leu Cys Val Thr Ala Ser Ile Glu Thr Leu Cys Val Ile Ala 115 120 125 Val Asp Arg Tyr Phe Ala Ile Thr Ser Pro Phe Lys Tyr Gln Ser Leu 130 135 140 Leu Thr Lys Asn Lys Ala Arg Val Ile Ile Leu Met Val Trp Ile Val 145 150 155 160 Ser Gly Leu Thr Ser Phe Leu Pro Ile Gln Met His Trp Tyr Arg Ala 165 170 175 Thr His Gln Glu Ala Ile Asn Cys Tyr Ala Asn Glu Thr Cys Cys Asp 180 185 190 Phe Phe Thr Asn Gln Ala Tyr Ala Ile Ala Ser Ser Ile Val Ser Phe 195 200 205 Tyr Val Pro Leu Val Ile Met Val Phe Val Tyr Ser Arg Val Phe Gln 210 215 220 Glu Ala Lys Arg Gln Leu Gln Lys Ile Asp Lys Ser Glu Gly Arg Phe 225 230 235 240 His Val Gln Asn Leu Ser Gln Val Glu Gln Asp Gly Arg Thr Gly His 245 250 255 Gly Leu Arg Arg Ser Ser Lys Phe Cys Leu Lys Glu His Lys Ala Leu 260 265 270 Lys Thr Leu Gly Ile Ile Met Gly Thr Phe Thr Leu Cys Trp Leu Pro 275 280 285 Phe Phe Ile Val Asn Ile Val His Val Ile Gln Asp Asn Leu Ile Arg 290 295 300 Lys Glu Val Tyr Ile Leu Leu Asn Trp Ile Gly Tyr Val Asn Ser Gly 305 310 315 320 Phe Asn Pro Leu Ile Tyr Cys Arg Ser Pro Asp Phe Arg Ile Ala Phe 325 330 335 Gln Glu Leu Leu Cys Leu Arg Arg Ser Ser Leu Lys Ala Tyr Gly Asn 340 345 350 Gly Tyr Ser Ser Asn Gly Asn Thr Gly Glu Gln Ser Gly Tyr His Val 355 360 365 Glu Gln Glu Lys Glu Asn Lys Leu Leu Cys Glu Asp Leu Pro Gly Thr 370 375 380 Glu Asp Phe Val Gly His Gln Gly Thr Val Pro Ser Asp Asn Ile Asp 385 390 395 400 Ser Gln Gly Arg Asn Cys Ser Thr Asn Asp Ser Leu Leu 405 410

Claims (119)

  1. 포유류 세포의 집단(population)으로서,
    각각의 포유류 세포는,
    i) 조건적 프로모터(conditional promoter)에 작동 가능하게 결합된 이종 수용체 유전자(heterologous receptor gene); 및
    ii) 수용체-반응 요소(receptor-responsive element)를 포함하는 유도성 리포터(inducible reporter);
    를 포함하고;
    상기 유도성 리포터는, cAMP 반응 요소(CRE), 활성화된 T-세포 반응 요소의 핵 인자(NFAT-RE), 혈청 반응 요소(SRE), 및 혈청 반응 인자 반응 요소(SRF-RE) 중 하나 이상을 포함하며,
    상기 유도성 리포터는 상기 이종 수용체 유전자에 의해 엔코딩된(encoded) 이종 수용체 단백질의 활성화 시 유도되고,
    상기 유도성 리포터는 상기 이종 수용체 유전자에 대해 고유한 인덱스 영역(index region)을 포함하는 바코드(barcode)를 포함하며,
    상기 이종 수용체 유전자는 상기 조건적 프로모터의 활성화 시 발현되고,
    상기 포유류 세포는 상이한 이종 수용체를 발현하는,
    포유류 세포의 집단.
  2. 제 1 항에 있어서,
    상기 이종 수용체 유전자는 GPCR을 엔코딩하는, 포유류 세포의 집단.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 포유류 세포의 집단의 포유류 세포는 하나 이상의 보조 단백질(accessory protein)을 엔코딩하는 하나 이상의 유전자를 더 포함하는, 포유류 세포의 집단.
  4. 제 1 항에 있어서,
    상기 포유류 세포의 집단의 포유류 세포는 상기 이종 수용체 유전자의 내인성(endogenous) 발현을 결여한, 포유류 세포의 집단.
  5. 제 1 항에 있어서,
    상기 이종 수용체 유전자 및/또는 상기 유도성 리포터는 상기 포유류 세포의 집단의 포유류 세포의 게놈 내에 통합되는, 포유류 세포의 집단.
  6. 제 5 항에 있어서,
    상기 이종 수용체 유전자 또는 유도성 리포터는 타겟화된 통합에 의해서 통합되는, 포유류 세포의 집단.
  7. 제 6 항에 있어서,
    상기 통합은 H11 안전 하버 유전자좌(H11 safe harbor locus) 내에 존재하는, 포유류 세포의 집단.
  8. 제 1 항에 있어서,
    상기 포유류 세포의 집단의 포유류 세포는 상기 수용체 유전자 및/또는 유도성 리포터 중의 2개 이상의 카피(copy)를 포함하는, 포유류 세포의 집단.
  9. 제 1 항에 있어서,
    상기 포유류 세포의 집단의 포유류 세포 각각은 상기 이종 수용체 유전자의 하나의 카피(copy) 및 상기 유도성 리포터의 하나의 카피를 갖는, 포유류 세포의 집단.
  10. 삭제
  11. 제 1 항에 있어서,
    상기 바코드 및/또는 상기 인덱스 영역은 10개 이상의 핵산인, 포유류 세포의 집단.
  12. 제 1 항에 있어서,
    상기 유도성 리포터는 형광 단백질에 대한 유전자를 포함하거나 더 포함하고, 상기 형광 단백질에 대한 유전자는 3' 비번역 영역(untranslated region; UTR)을 포함하는, 포유류 세포의 집단.
  13. 제 12 항에 있어서,
    상기 유전자는 루시페라아제 단백질(luciferase protein)을 엔코딩하는, 포유류 세포의 집단.
  14. 제 1 항에 있어서,
    상기 이종 수용체 유전자는 격리자 서열(insulator sequence)에 의해서 5' 및 3' 말단 측면에 있고, 또는 상기 유도성 리포터는 격리자 서열에 의해서 5' 및 3' 말단 측면에 있는 것인, 포유류 세포의 집단.
  15. 리간드 및 수용체 결합을 스크리닝하는 방법으로서,
    제 1 항의 포유류 세포의 집단 또는 포유류 세포를 리간드와 접촉시키는 단계;
    하나 이상의 리포터를 검출하는 단계; 및
    상기 하나 이상의 리포터의 동일성을 결정하는 단계, 상기 리포터의 동일성은 결합된 수용체의 동일성을 지시함;
    을 포함하는 방법.
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
  68. 삭제
  69. 삭제
  70. 삭제
  71. 삭제
  72. 삭제
  73. 삭제
  74. 삭제
  75. 삭제
  76. 삭제
  77. 삭제
  78. 삭제
  79. 삭제
  80. 삭제
  81. 삭제
  82. 삭제
  83. 삭제
  84. 삭제
  85. 삭제
  86. 삭제
  87. 삭제
  88. 삭제
  89. 삭제
  90. 삭제
  91. 삭제
  92. 삭제
  93. 삭제
  94. 삭제
  95. 삭제
  96. 삭제
  97. 삭제
  98. 삭제
  99. 삭제
  100. 삭제
  101. 삭제
  102. 삭제
  103. 삭제
  104. 삭제
  105. 삭제
  106. 삭제
  107. 삭제
  108. 삭제
  109. 삭제
  110. 삭제
  111. 삭제
  112. 삭제
  113. 삭제
  114. 삭제
  115. 삭제
  116. 삭제
  117. 삭제
  118. 삭제
  119. 삭제
KR1020207003519A 2017-07-05 2018-07-05 멀티플렉싱된 수용체-리간드 상호작용 스크린 KR102628446B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762528833P 2017-07-05 2017-07-05
US62/528,833 2017-07-05
PCT/US2018/040866 WO2019010270A1 (en) 2017-07-05 2018-07-05 MULTIPLEXER RECEPTOR-LIGAND INTERACTION CRIBLES

Publications (2)

Publication Number Publication Date
KR20200024305A KR20200024305A (ko) 2020-03-06
KR102628446B1 true KR102628446B1 (ko) 2024-01-23

Family

ID=64950350

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207003519A KR102628446B1 (ko) 2017-07-05 2018-07-05 멀티플렉싱된 수용체-리간드 상호작용 스크린

Country Status (8)

Country Link
US (1) US20200255844A1 (ko)
EP (1) EP3649236A4 (ko)
JP (2) JP7229223B2 (ko)
KR (1) KR102628446B1 (ko)
CN (1) CN111133100A (ko)
AU (1) AU2018297258A1 (ko)
CA (1) CA3068969A1 (ko)
WO (1) WO2019010270A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113423436B (zh) * 2018-12-10 2024-02-06 耶鲁大学 塑造宿主生理学的微生物群代谢物
EP3938505A4 (en) * 2019-02-25 2022-11-30 Twist Bioscience Corporation COMPOSITIONS AND METHODS FOR SEQUENCING THE NEXT GENERATION
MX2021013131A (es) * 2019-04-30 2021-11-25 Ntt Docomo Inc Aparato de comunicacion y metodo de comunicacion.
WO2021126930A1 (en) * 2019-12-17 2021-06-24 University Of Miami Methods for identifying modulators of g protein-coupled receptors
US20240141328A1 (en) 2021-03-08 2024-05-02 Ladder Therapeutics, Inc. Assay for Massive Parallel RNA Function Perturbation Profiling
GB202108867D0 (en) * 2021-06-21 2021-08-04 Givaudan Sa Screening system
CN113504378B (zh) * 2021-09-08 2022-01-04 汉王科技股份有限公司 嗅觉受体、重组细胞、试剂盒及其用途
WO2023141808A1 (zh) * 2022-01-26 2023-08-03 深圳阿尔法分子科技有限责任公司 用于分析g蛋白偶联受体与配体相互作用的方法和系统
CN115902128B (zh) * 2023-02-08 2023-06-06 汉王科技股份有限公司 嗅觉受体在识别4-乙基愈创木酚中的用途和检测4-乙基愈创木酚的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010026926A1 (en) 1993-03-31 2001-10-04 Cadus Pharmaceutical Corporation. Methods and compositions for identifying receptor effectors
US20040023315A1 (en) 1994-02-14 2004-02-05 Basf Aktiengesellschaft Heterologous G protein coupled receptors expressed in yeast, their fusion with G proteins and use thereof in bioassay
US20090018031A1 (en) 2006-12-07 2009-01-15 Switchgear Genomics Transcriptional regulatory elements of biological pathways tools, and methods
WO2009023107A1 (en) 2007-08-10 2009-02-19 Peter Oliver Krutzik Biological encoding of large numbers of cells

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5993778A (en) * 1997-05-07 1999-11-30 Firestein; Stuart J. Functional expression of, and assay for, functional cellular receptors in vivo
US7273747B2 (en) * 1998-08-27 2007-09-25 Cadus Technologies, Inc. Cell having amplified signal transduction pathway responses and uses therefor
WO2000035274A1 (en) * 1998-12-17 2000-06-22 The Johns Hopkins University School Of Medicine Olfactory receptor expression libraries and methods of making and using them
ES2592263T3 (es) * 2012-01-31 2016-11-29 Canvax Biotech, S.L. GPCR con expresión mejorada en superficie celular
US9932607B2 (en) * 2013-11-15 2018-04-03 The Board Of Trustees Of The Leland Stanford Junior University Site-specific integration of transgenes into human cells
EP2884280B1 (en) * 2013-12-15 2018-05-09 Symrise AG Method for evaluating the scent performance of perfumes and perfume mixtures

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010026926A1 (en) 1993-03-31 2001-10-04 Cadus Pharmaceutical Corporation. Methods and compositions for identifying receptor effectors
US20040023315A1 (en) 1994-02-14 2004-02-05 Basf Aktiengesellschaft Heterologous G protein coupled receptors expressed in yeast, their fusion with G proteins and use thereof in bioassay
US20090018031A1 (en) 2006-12-07 2009-01-15 Switchgear Genomics Transcriptional regulatory elements of biological pathways tools, and methods
WO2009023107A1 (en) 2007-08-10 2009-02-19 Peter Oliver Krutzik Biological encoding of large numbers of cells

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SABRINA G. ‘Multiplexed cell-based assays to profile GPCR activities and cellular signalling’, Georg-August-University Göttingen 박사학위논문(2016)*

Also Published As

Publication number Publication date
CN111133100A (zh) 2020-05-08
US20200255844A1 (en) 2020-08-13
CA3068969A1 (en) 2019-01-10
EP3649236A4 (en) 2021-04-07
AU2018297258A1 (en) 2020-01-30
JP7229223B2 (ja) 2023-02-27
WO2019010270A1 (en) 2019-01-10
EP3649236A1 (en) 2020-05-13
JP2023058651A (ja) 2023-04-25
JP2020530281A (ja) 2020-10-22
KR20200024305A (ko) 2020-03-06

Similar Documents

Publication Publication Date Title
KR102628446B1 (ko) 멀티플렉싱된 수용체-리간드 상호작용 스크린
US20230042624A1 (en) Crispr/cas transcriptional modulation
Maslon et al. A slow transcription rate causes embryonic lethality and perturbs kinetic coupling of neuronal genes
US11046952B2 (en) Encoding of DNA vector identity via iterative hybridization detection of a barcode transcript
CN106893739A (zh) 用于靶向基因操作的新方法和系统
US20220229044A1 (en) In situ cell screening methods and systems
KR20230005984A (ko) 유전자 발현을 활성화 및 침묵시키기 위해 효과기 도메인을 제조, 동정 및 특성규명하기 위한 조성물, 시스템 및 방법
Asimi et al. Hijacking of transcriptional condensates by endogenous retroviruses
US8975042B2 (en) Fluorescent and colored proteins and methods for using them
US9771402B2 (en) Fluorescent and colored proteins and methods for using them
Ravid Lustig et al. GATA transcription factors drive initial Xist upregulation after fertilization through direct activation of long-range enhancers
Roelle et al. Mammalian Genomic Manipulation with Orthogonal Bxb1 DNA Recombinase Sites for the Functional Characterization of Protein Variants
EP1458880B1 (en) Isolation tool for viable c-kit expressing cells
Liu et al. The PPR domain of mitochondrial RNA polymerase is a ribonuclease required for mtDNA replication
Weaver Double-Homeobox (Dux) Transcription Factors Regulate Protein Synthesis in Early Embryonic Totipotency
Jones A Massively Parallel Assay for Understanding Receptor-Ligand Relationships
Andoh et al. Bovine leukemia virus-derived long-noncoding RNA, AS1-S, binds to bovine hnRNPM and alters interaction properties between hnRNPM and host mRNAs
Chau Defining the sequence requirements for Xist function in X inactivation
US20210079440A1 (en) HIGH EXPRESSION mRNA SWITCH
Potluri et al. High throughput gene complementation screening permits identification of a mammalian mitochondrial protein synthesis (ρ−) mutant
WO2011036812A1 (ja) アリルハイドロカーボンレセプター転写活性化量を測定するための細胞、方法およびアッセイキット
Middlehurst The Role of Endogenous Retrotransposable Elements in Parkinson’s Disease
Sun Investigating the Mechanism of LINE-1 Retrotransposition in Human Cells
WO2023196677A1 (en) Increasing developmental potential of human preimplantation embryos by reducing genetic instability, aneuploidies and chromosomal mosaicism
NZ760374A (en) High-throughput single-cell transcriptome libraries and methods of making and of using

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant