KR20230124978A - 게놈 dna에 대규모 결실을 일으키게 하는 방법 및 게놈dna의 분석 방법 - Google Patents

게놈 dna에 대규모 결실을 일으키게 하는 방법 및 게놈dna의 분석 방법 Download PDF

Info

Publication number
KR20230124978A
KR20230124978A KR1020237024465A KR20237024465A KR20230124978A KR 20230124978 A KR20230124978 A KR 20230124978A KR 1020237024465 A KR1020237024465 A KR 1020237024465A KR 20237024465 A KR20237024465 A KR 20237024465A KR 20230124978 A KR20230124978 A KR 20230124978A
Authority
KR
South Korea
Prior art keywords
dna
cells
artificial sequence
deletion
region
Prior art date
Application number
KR1020237024465A
Other languages
English (en)
Inventor
야스노리 아이자와
히토요시 야마시타
Original Assignee
가부시키가이샤 로고믹스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 가부시키가이샤 로고믹스 filed Critical 가부시키가이샤 로고믹스
Publication of KR20230124978A publication Critical patent/KR20230124978A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1082Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Virology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은, 게놈의 대규모 결실을 일으키게 하는 방법을 제공한다. 본 발명은, 게놈 상의 세포의 생존에 영향을 주는 유전자(예를 들어, 생존에 필수적인 유전자)를 동정하는 방법을 제공한다. 본 발명은 또한, 생존에 필수적인 유전자를 게놈 상의 다른 개소에 재도입하는 방법, 및 그것에 의해, 게놈에 대해서 더 큰 결실을 일으키게 하는 방법을 제공한다.

Description

게놈 DNA에 대규모 결실을 일으키게 하는 방법 및 게놈 DNA의 분석 방법
본 발명은, 게놈 DNA에 대규모 결실을 일으키게 하는 방법 및 게놈 DNA의 분석 방법에 관한 것이다.
고등 생물에 있어서는, 게놈 서열의 1-2%밖에 단백질을 코딩하기 위해서 사용하고 있지 않는 데 반해, 포유류에서는 근위(프로모터) 또는 장거리(인핸서, 서프레서, 인슐레이터 등)의 조절 엘리먼트를 위해서 대규모로 유전자간 서열이 할당되어 있다. 따라서, 기능성 인공 세포 창출을 위한 게놈의 설계에 즈음해서는, 유전자의 선택에 더하여, 유전자간 영역의 설계가 관건이 된다. Encyclopedia of DNA Elements(ENCODE) 프로젝트에서는, 인간 배양 세포에 있어서, 유전자간 영역의 대부분이 특정의 전사 인자 결합이나 히스톤 수식을 나타내는 것이 시사되어 있어, 합리적인 유전자간 영역 설계의 지침이 될 가능성이 시사되고 있다. 그러나, 이들 전사 및 에피제네틱한 활성이 모두 정상적인 세포 기능에 필요한 것인지 여부는 불명하다. 포유류의 세포 네트워크는, 유전자 패밀리의 확대와 유전자 제어 네트워크의 장황성의 증대에 의해, 진화적으로 강고한 것이 되었다. 그 때문에, 비필수 유전자뿐만 아니라, 유전자간 영역의 대부분이 세포의 생존이나 유지를 위해서는 반드시 필요하지는 않을 가능성이 있다(비특허문헌 1∼3).
Xavier, J. C., Patil, K. R. & Rocha, I., Microbiol Mol Biol Rev, 78, 487-509 (2014). Posfai, G., Science, 312, 1044-1046 (2006). Hutchison, C. A. et al., Science, 351, aad6253-aad6253 (2016).
본 발명은, 게놈 DNA에 결실을 일으키게 하는 방법 및 게놈 DNA의 분석 방법을 제공한다.
본 발명자들은, 표적 서열을 서열 특이적으로 절단할 수 있는 서열 특이적 핵산 절단 분자를 이용하여, 2개의 표적 서열간에 있어서 DNA 영역의 결실을 유도하는 방법을 개발했다. 본 발명자들은 또한, 게놈 DNA 중에 있어서 결실시키는 DNA 영역을 크게 할 경우에, 세포의 생존 및/또는 증식에 필요한 유전자를 결실시키면, 세포의 생존 및/또는 증식이 부(負)의 영향을 받음을 발견했다. 이것에 의해, 본 발명자들은, 세포의 생존 및/또는 증식에 필요한 유전자의 장소 및 당해 유전자를 특정하는 방법을 발견했다. 본 발명자들은 또한, 세포의 생존 및/또는 증식에 필요한 유전자를, 게놈 DNA에 이소적(異所的)으로 발현 가능하게 삽입하는 것에 의해, DNA 영역의 결실을 가지면서도 생존 및/또는 증식이 가능한 세포를 제작하는 방법을 발견했다. 또한, 본 발명자들은, 네거티브 선택용 마커 유전자가 삽입된 DNA 영역을 결실시키는 방법을 발견했다. 본 발명은, 이들 지견에 기초하는 것이다.
본 발명에 의하면, 이하의 발명이 제공될 수 있다.
(1) 인비트로의 방법으로서,
(a) 단리된 세포를 포함하는 세포 집단을 준비하는 것과,
(b) 상기 세포 집단 중의 상기 세포의 게놈 DNA에, 게놈 DNA 상의 2개소의 표적 서열을 서열 특이적으로 절단할 수 있는 서열 특이적 핵산 절단 분자를 각각 작용시켜, 게놈 DNA 상의 2개소의 표적 서열에 있어서 각각 절단을 일으키게 하고, 이것에 의해, 세포 집단 중의 적어도 일부의 세포에 있어서, 상기 2개소의 절단 부위 사이의 영역에 있어서 DNA 영역의 결실을 일으키게 하는 것과,
(c) 그 후, 얻어진 세포 집단을 배양하여, 세포의 증식 또는 생존에 대한 상기 DNA 영역의 결실의 영향을 결정하는 것
을 포함하는,
방법.
(2) 상기 (c)에 있어서, 상기 결정이, DNA 영역의 결실 효율 또는 그 추정치를 결정하는 것과, 그 후의 배양 후의 세포 집단에 있어서의 DNA 영역의 결실을 갖는 세포의 비율과 결정된 결실 효율 또는 그 추정치를 비교하는 것에 의해 행해지는, 상기 (1)에 기재된 방법.
(3) 상기 (c)에 있어서, 결실 효율 또는 그 추정치의 결정, 및, 배양 후의 DNA 영역의 결실을 갖는 세포의 비율이, 각각 세포 집단을 포함하는 현탁액 중에 포함되는 전체 세포에 대한 결실을 갖는 세포의 비율로서 결정되는, 상기 (2)에 기재된 방법.
(4) 상기 비율이, 현탁액 중에 포함되는, 결실을 갖는 게놈 DNA 및 갖지 않는 게놈 DNA의 계수 기술에 의해 결정되는, 상기 (3)에 기재된 방법.
(5) 상기 (1)∼(4) 중 어느 하나에 기재된 방법으로서,
(d) 대조가 되는 세포 집단과 비교하여, 상기 (c)에 있어서의 세포의 생존 및/또는 증식에 대한 영향의 유무 또는 크기에 기초하여, 대조의 게놈 DNA와 비교하여 결실된 DNA 영역이 세포의 생존 및/또는 증식을 제어하는 유전자를 포함하는지 여부를 결정하는 것
을 추가로 포함하는, 방법.
(6) 상기 (5)에 기재된 방법으로서, 대조가 되는 세포 집단이, 상기 (b)에 의해, 보다 큰 DNA 영역, 보다 작은 DNA 영역, 또는 상이한 DNA 영역의 결실을 갖는 세포를 포함하는 세포 집단인, 방법.
(7) 상기 (5) 또는 (6)에 기재된 방법으로서, 대조의 게놈 DNA와 비교하여 결실된 DNA 영역에 존재하는 유전자로부터, 세포의 생존 및/또는 증식을 제어하는 유전자를 적어도 1개 특정하는 것을 추가로 포함하는, 방법.
(8) 상기 (1)∼(7) 중 어느 하나에 기재된 방법으로서,
(f) 결실된 DNA 영역에 존재하는 유전자로부터, 세포의 생존 및/또는 증식을 제어하는 유전자를 적어도 1개 특정하는 것
을 추가로 포함하는, 방법.
(9) (g) 제어 서열에 작동 가능하게 연결된 세포의 생존 및/또는 증식을 제어하는 유전자의 적어도 1개를, 당해 DNA 영역의 결실을 갖는 게놈 DNA에 이소적으로 도입하는 것을 추가로 포함하는, 상기 (7) 또는 (8)에 기재된 방법.
(10) 상기 (b)에 있어서 결실되는 DNA 영역의 사이즈가, 0.5Mbp 이상인, 상기 (1)∼(9) 중 어느 하나에 기재된 방법.
(11) 상기 (b)에 있어서 결실되는 DNA 영역의 사이즈가, 1Mbp 이상인, 상기 (1)∼(10)에 기재된 방법.
(12) 인비트로의 방법으로서,
(α) 단리된 세포를 포함하는 세포 집단을 준비하는 것과, 여기에서 단리된 세포는, 결실시키는 영역 중에 네거티브 선택용 마커 유전자를 포함하고,
(β) 상기 세포 집단 중의 상기 세포의 게놈 DNA에, 게놈 DNA 상의 2개소의 표적 서열을 서열 특이적으로 절단할 수 있는 서열 특이적 핵산 절단 분자를 각각 작용시켜, 게놈 DNA 상의 2개소의 표적 서열에 있어서 각각 절단을 일으키게 하고, 이것에 의해, 세포 집단 중의 적어도 일부의 세포에 있어서, 상기 2개소의 절단 부위 사이의 영역에 있어서 DNA 영역의 결실을 일으키게 하는 것과, 여기에서, 상기 2개소는, 상기 네거티브 선택용 마커 유전자를 끼우는 위치에 설계되고,
(γ) 네거티브 선택 마커 유전자를 갖지 않는 세포를 선택하는 것
을 포함하는, 방법.
(13) 상기 네거티브 선택 마커 유전자가, 결실시키는 영역 중에 외래적으로 삽입된 것인, 상기 (12)에 기재된 방법.
(14) 상기 네거티브 선택 마커 유전자가, 게놈 DNA 중의 내재적인 유전자인, 상기 (12)에 기재된 방법.
(15) 세포가 진핵세포인, 상기 (1)∼(14) 중 어느 하나에 기재된 방법.
(16) 공정(c)이, 공정(b)에서 얻어진 세포 집단으로부터 일부의 세포를 선별하는 공정을 거치지 않고 실시되는, 상기 (1)∼(11) 중 어느 하나에 기재된 방법.
[도 1] 도 1은, HPRT1 유전자를 포함하는 DNA 영역의 결손을 수반하는 인간 세포의 제작 방법을 나타낸다. 패널 a는, 네거티브 선택용 마커 유전자를 이용한 DNA 영역의 결실 스킴을 나타낸다. 네거티브 선택용 마커 유전자를 포함하는 DNA 영역이 결실되면, 세포는 생존하기 쉬워진다. 따라서, 네거티브 선택용 마커 유전자의 발현을 지표로 하여 세포를 선별하는 것에 의해, DNA 영역의 결실을 갖는 세포를 취득할 수 있다. 패널 a에서는, 서열 특이적 핵산 절단 분자로서 CRISPR-Cas9 시스템을 이용한 예를 도시하고 있다. 세포에 대해서, 네거티브 선택용 마커 유전자를 끼우도록 배치된 2개소의 표적 서열에 대한 gRNA와 Cas9 엔도뉴클레아제를 발현시키는 플라스미드를 트랜스펙션한다. 2일 후, 일부의 세포를 취득하여 게놈의 결실 영역의 정션 PCR을 디지털 PCR법에 의해 행한다. 콜로니가 형성될 때까지 세포를 선택 배지에서 배양한다. 이것에 의해, 네거티브 선택용 마커 유전자를 갖는 세포, 즉, 결실이 생기지 않았던 세포는 사멸하고, 결실을 갖는 세포만이 생존하고, 증식하여, 콜로니를 형성한다. 콜로니수를 계수하고, 다시 정션 PCR을 디지털 PCR법에 의해 행하여, 결실의 존재를 확인한다. 패널 b는, X 염색체 상의 내재성의 HPRT1 유전자자리 주변을 결실시키고, 그 후, 디지털 PCR법에 의해 정션 영역을 PCR한 결과이다. 디지털 PCR에서는, 100게놈을 1PCR의 주형으로 하여, 48PCR을 행했다. 14예에서 증폭 산물이 얻어졌으므로, 결실 효율은, 14/48/100×100=약 0.3(%)이다. 패널 c는, 6-싸이오구아닌(6-TG)에 의한 선택 후에 형성된 콜로니 및 그 수를 나타낸다. 패널 d는, L1-R1에 의한 결실 영역의 전후의 서열의 시퀀스를 나타낸다. 대체로, 2개의 표적 서열 사이의 DNA 영역이 결실되었음을 알 수 있다.
[도 2] 도 2는, HPRT1 유전자의 주변의 게놈 영역의 맵과, 당해 영역의 메가 스케일의 결실의 제작을 나타낸다. 패널 a는, X 염색체의 HPRT1 유전자의 주변의 Refseq 유전자를 나타낸다. OGEE 데이터베이스에 의해 추정되는 세포 증식을 위한 필수 유전자가 동그라미로 나타난다. 패널 b와 c는, 센트로미어 방향 및 텔로미어 방향에의 결실 영역을 격단(格段)시킨 실험의 결과를 나타낸다. 서열 특이적 핵산 절단 분자의 표적 서열이 기호 L1∼L5 및 R1∼R5를 수반하는 수직의 파선으로 나타나 있다. 각각의 DNA 영역의 결실을 유발시킨 세포 집단의 6-TG 선택 후의 콜로니 형성수와 결실 효율(%)이 나타나 있다.
[도 3] 도 3은, L4-R4에 의한 결실을 갖는 클론의 게놈 분석의 결과를 나타낸다. 패널 a는, HAP1 세포(WT)와 L4-R4에 의한 결실을 갖는 클론이 각각 갖는 유전자의 존재를 분명히 하는 PCR의 결과이다. 패널 b는, L4-R4에 의한 결실을 갖는 클론의 상대적인 증식능을 나타낸다. 상대적인 증식능은, 야생형 세포에 대한 결실을 갖는 세포의 비율로서 구하고, 결실 후 0일째 및 16일째에서 측정하여, 당해 비율이 변화하지 않았음을 나타낸다. 패널 c는, L4-R4에 의한 결실을 갖는 클론에 있어서의 유전자 발현의 마이크로어레이에 의한 분석 결과를 나타낸다.
[도 4] 도 4는, 필수 유전자를 포함하는 메가 스케일의 결실과, 결실의 레스큐 실험을 나타낸다. 패널 a는, 필수 유전자를 끼우는 상류 및 하류 3kb의 서열을 포함하는 pHY262 벡터를 이용한 GAPDH 유전자자리의 3' 비번역 영역(UTR)에의 유전자 삽입의 스킴을 나타낸다. 패널 b는, 레스큐된 RBMX2 및 MMGT1 유전자의 발현을 리얼타임 PCR에 의해 분석한 결과를 나타낸다. 패널 c 및 d는 각각, 내재성의 RBMX2 및 MMGT1 유전자를 결손한 주와, RBMX2 및 MMGT1이 레스큐된 주의 콜로니 형성수 및 결실 효율을 나타낸다.
[도 5] 도 5는, 메가 스케일의 결실에 의한 필수 유전자를 포함하는 영역의 결실의 결과를 나타낸다. 패널 a와 c는 각각, RBMX2 및 MMGT1 유전자를 포함하는 영역이 결실되었지만, GAPDH 유전자자리 하류로에 각 유전자가 재도입되어, 추가로 결실 영역이 확대된 실험의 결과를 나타낸다. 패널 b는, 패널 a 실험 후의 상대적 콜로니 사이즈의 측정 결과를 나타낸다. p치는, 3회의 독립된 실험 결과로부터 구해졌다.
[도 6] 도 6은, HCT116 세포에 있어서의 네거티브 선택용 마커 유전자를 이용한 메가 스케일의 결실의 제작을 나타낸다. 패널 a는, 티미딘 키나제(TK) 발현 카세트를 갖는 pHYT271 벡터를 이용하여 HCT116 세포의 OCRL 유전자의 하류에 TK를 삽입하는 스킴을 나타낸다. 정션 PCR에 의해 증폭 산물의 사이즈가 커졌던 것으로부터, 삽입이 확인되고 있다. 패널 b는, HCT116 세포 중의 결실을 일으키게 하는 유전자자리의 유전자 맵을 나타낸다. 패널 c는, 네거티브 선택용 마커 유전자인 TK를 이용한 메가 스케일의 DNA 영역의 결실의 양상을 나타낸다. 결실은 센트로미어 방향으로 확대되었다. 각 결실에 대한 셀렉션 후의 콜로니 형성수 및 결실 효율이 나타난다. 수치는, 3회의 독립된 실험의 평균 및 표준 편차를 나타낸다.
[도 7] 도 7은, 네거티브 선택을 하지 않고 메가 스케일의 결실을 일으키게 하는 방법을 나타낸다. HAP1 세포에 있어서, 표적 영역 A∼C의 3종류의 표적 영역을 결실시켰다. 게놈의 결실을 유발시킨 2일 후와 17일 후에, 1웰 100게놈에 대한 디지털 PCR법에 의해 결실의 유무를 판정하여, 세포 집단 중의 결실을 갖는 세포의 비율을 구했다. 그 결과, 표적 영역 B 및 C를 결실시켰을 경우에, 세포 집단 중의 결실을 갖는 세포의 비율이 저하되었다. 이 저하는, 결실시킨 영역에 세포의 생존 및/또는 증식에 필요한 유전자가 포함되어 있음을 나타내는 것이다.
[도 8] 도 8은, 인간 X 염색체 상에서, 세포의 생존에 필수는 아니라고 여겨지고 있던 영역에 대해 본 발명의 방법으로 도면에 나타내는 영역을 각각 결실시켜, 세포의 생존율에 대한 각 결실의 영향을 조사한 실험의 결과를 나타낸다.
본 명세서에서는, 「세포」란, 적어도 게놈 DNA와 세포질과, 이들을 싸는 막 구조를 갖는 생명의 기본 단위를 말한다. 세포로서는, 특별히 한정되지 않지만, 원핵생물의 세포와 진핵생물의 세포를 들 수 있다. 게놈 DNA는, 그 세포의 내인성의 DNA를 포함하지만, 반드시 그 세포의 내인성의 인자만으로 구성되는 것은 아니다.
세포는, 세포의 게놈 DNA를 포함하지만, 외래의 침입자(예를 들어, 병원체)의 게놈 DNA를 추가로 포함하는 경우가 있다. 본 명세서에서는, 세포 자체의 게놈 DNA를 「숙주 게놈 DNA」라고 한다. 침입자의 게놈 DNA는, 숙주의 게놈 DNA와는 별체로서 세포 내에서 존재할 수 있지만, 숙주의 게놈 DNA에 짜넣어져 있는 경우도 있다. 숙주 게놈 DNA는, 외래성의 인자(예를 들어, 바이러스 등의 게놈 DNA의 전부 또는 일부의 삽입)를 포함하고 있는 경우가 있다.
본 명세서에서는, 「세포 집단」이란, 복수의 세포를 포함하는 조성물을 의미한다.
본 명세서에서는, 「단리」란, 목적하는 세포를 적어도 1개의 다른 구성 요소로부터 분리하는 것을 의미한다. 단리는, 예를 들어, 자연스러운 존재 상태의 세포를 자연스러운 존재 상태에 있어서 함께 존재하는 다른 구성 요소로부터 분리하여 빼내는 것에 의해 실시될 수 있다. 단리는, 예를 들어, 다세포 생물로부터 일부의 세포를 분리하여 빼내는 것에 의해 실시될 수 있다. 단리된 세포를 취급하는 기술을 본 명세서에서는, 인비트로의 기술이라고 한다.
본 명세서에서는, 「정제」란, 단리된 목적하는 세포를, 함께 존재하는 다른 구성 요소로부터 추가로 분리하는 것을 의미한다. 정제는, 예를 들어, 목적하는 세포를, 형태나 표면 마커에 기초하여 다른 구성 요소로부터 분리하는 것에 의해 실시될 수 있다. 정제는, 세포의 한외 희석 및/또는 클로닝에 의해 실시될 수 있다. 정제는, 목적하는 세포의 주화에 의해 실시될 수 있다. 정제는, 목적하는 세포가 약제 내성 유전자나 형광 단백질을 코딩하는 유전자 등의 마커 유전자를 갖는 경우에는, 당해 마커 유전자의 발현에 기초하여 실시할 수 있다. 본 명세서에서는, 「부화」(enrich)란, 목적하는 세포의 존재 밀도를 향상시키는 것을 의미한다.
본 명세서에서는, 「폴리뉴클레오타이드」 및 「핵산」이라고 하는 용어는, 서로 호환적으로 사용되고, 뉴클레오타이드가 포스포다이에스터 결합에 의해 결합한 뉴클레오타이드 폴리머를 가리킨다. 「폴리뉴클레오타이드」 및 「핵산」은, DNA여도 되고, RNA여도 되고, DNA와 RNA의 조합으로 구성되어도 된다. 또한, 「폴리뉴클레오타이드」 및 「핵산」은, 천연 뉴클레오타이드의 폴리머여도 되고, 천연 뉴클레오타이드와 비천연 뉴클레오타이드(천연 뉴클레오타이드의 유사체, 염기 부분, 당 부분 및 인산 부분 중 적어도 하나의 부분이 수식되어 있는 뉴클레오타이드(예를 들어, 포스포로싸이오에이트 골격) 등)의 폴리머여도 되고, 비천연 뉴클레오타이드의 폴리머여도 된다.
본 명세서에서는, 「폴리뉴클레오타이드」 또는 「핵산」의 염기 서열은, 특별히 명시하지 않는 한, 일반적으로 인정되고 있는 1문자 코드로 기재된다. 특별히 명시하지 않는 한, 염기 서열은, 5'측으로부터 3'측을 향해 기재한다. 「폴리뉴클레오타이드」 또는 「핵산」을 구성하는 뉴클레오타이드 잔기는, 간단히, 아데닌, 티민, 시토신, 구아닌, 또는 우라실 등, 혹은 그들의 1문자 코드로 기재되는 경우가 있다.
본 명세서에서는, 「유전자」라고 하는 용어는, 특정의 단백질을 코딩하는 적어도 1개의 오픈 리딩 프레임을 포함하는 폴리뉴클레오타이드를 가리킨다. 유전자는, 엑손 및 인트론의 양쪽을 포함할 수 있다.
본 명세서에서는, 「폴리펩타이드」, 「펩타이드」 및 「단백질」이라고 하는 용어는, 서로 호환적으로 사용되고, 아마이드 결합에 의해 결합한 아미노산의 폴리머를 가리킨다. 「폴리펩타이드」, 「펩타이드」 또는 「단백질」은, 천연 아미노산의 폴리머여도 되고, 천연 아미노산과 비천연 아미노산(천연 아미노산의 화학적 유사체, 수식 유도체 등)의 폴리머여도 되고, 비천연 아미노산의 폴리머여도 된다. 특별히 명시하지 않는 한, 아미노산 서열은, N말단측으로부터 C말단측을 향해 기재한다.
본 명세서에서는, 「알렐」이라고 하는 용어는, 염색체 게놈 상의 동일 좌위에 존재하는 염기 서열 세트를 가리킨다. 어느 태양에서는, 2배체의 세포에서는 동일 좌위에 2알렐 존재하고, 3배체의 세포에서는 동일 좌위에 3알렐 존재한다. 또한, 어느 태양에서는, 염색체의 이상한 카피 또는 당해 좌위의 이상한 추가의 카피에 의해 추가의 알렐이 형성되어 있는 경우가 있다.
본 명세서에서는, 「게놈 개변」 또는 「게놈 편집」이라고 하는 용어는, 서로 호환적으로 이용되고, 게놈 상의 소망의 위치(표적 영역)에 변이를 유도하는 것을 가리킨다. 게놈 개변은, 표적 영역 DNA를 절단하도록 설계된 서열 특이적 핵산 절단 분자(예를 들어, 서열 특이적 또는 서열 의존적 엔도뉴클레아제)의 사용을 포함할 수 있다. 바람직한 실시형태에 있어서, 게놈 개변은, 표적 영역의 DNA를 절단하도록 조작된 뉴클레아제의 사용을 포함할 수 있다. 바람직한 실시형태에 있어서, 게놈 개변은, 표적 영역 중의 특정의 염기 서열을 갖는 표적 서열을 절단하도록 조작된 뉴클레아제(예를 들어, TALEN나 징크 핑거 뉴클레아제(ZFN))의 사용을 포함할 수 있다. 특히 바람직한 실시형태에 있어서, 게놈 개변은, 표적 영역 중의 특정의 염기 서열을 갖는 표적 서열을 절단하도록 조작된 뉴클레아제(예를 들어, CRISPR-Cas9 시스템)의 사용을 포함할 수 있다. 바람직한 실시형태에 있어서, 게놈 개변은, 표적 영역 중의 특정의 염기 서열을 갖는 표적 서열을 절단하도록, 메가뉴클레아제 등의 게놈에 1개밖에 절단 부위를 갖지 않는 제한 효소(예를 들어, 16베이스의 서열 특이성을 갖는 제한 효소(이론상은 416 염기에 1개의 비율로 존재한다), 17베이스의 서열 특이성을 갖는 제한 효소(이론상은 417 염기에 1개의 비율로 존재한다), 및 18베이스의 서열 특이성을 갖는 제한 효소(이론상은 418 염기에 1개의 비율로 존재한다)) 등의 서열 특이적 엔도뉴클레아제를 이용할 수 있는 경우도 있다. 전형적으로는, 부위 특이적 뉴클레아제의 사용에 의해, 표적 영역의 DNA에 2본쇄 절단(DSB)이 유도되고, 그 후, 상동 재조합 수복(Homologous Directed Repair: HDR) 및 비상동 말단 재결합(Non-Homologous End-Joining Repair: NHEJ)과 같은, 세포의 내인성 프로세스에 의해 게놈이 수복된다. NHEJ는, 도너 DNA를 이용하지 않고 2본쇄 절단된 말단을 연결하는 수복 방법이며, 수복 시에 삽입 및/또는 결실(indel)이 고빈도로 유도된다. HDR은, 도너 DNA를 이용한 수복 기구이며, 표적 영역에 소망의 변이를 도입하는 것도 가능하다. 게놈 개변 기술로서는, 예를 들어, CRISPR/Cas 시스템이 바람직하게 예시된다. 메가뉴클레아제로서는, 예를 들어, I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-CrepsbIIIP, I-CrepsbIVP, I-TliI, I-PpoI, PI-PspI, F-SceI, F-SceII, F-SuvI, F-TevI, F-TevII, I-AmaI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII, I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-LlaI, I-MsoI, I-NaaI, I-NanI, I-NclIP, I-NgrIP, I-NitI, I-NjaI, I-Nsp236IP, I-PakI, I-PboIP, I-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-SpomIP, I-SpomIIP, I-SquIP, I-Ssp68031, I-SthPhiJP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I-TevI, I-TevII, I-TevIII, I-UarAP, I-UarHGPAIP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-Mtul, PI-MtuHIPPI-MtuHIIP, PI-PfuI, PI-PfuII, PI-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-TliI, 및 PI-TliII, 및 이들 기능적인 유도체 제한 효소로 이루어지는 군으로부터 선택되는 메가뉴클레아제 및 그 절단 부위(또는 인식 부위), 바람직하게는, 18염기 이상의 서열 특이성을 갖는 제한 효소인 메가뉴클레아제 및 그 절단 부위(또는 인식 부위), 특히 세포의 게놈을 1개소 또는 복수 개소 이상 절단하지 않는 메가뉴클레아제 및 그 절단 부위를 이용할 수 있다.
「표적 영역」이라고 하는 용어는, 게놈 개변 시스템에 의해 타게팅되는 영역을 말한다. 본 발명에서는, 2개소의 표적 영역(예를 들어, 제1 표적 영역 및 제2 표적 영역) 사이에 위치하는 게놈 상의 DNA 영역을 결실시킬 수 있다.
「서열 특이적 핵산 절단 분자」라고 하는 용어는, 특정의 핵산 서열을 인식하여, 상기 특정의 핵산 서열에서 핵산을 절단할 수 있는 분자를 가리킨다. 서열 특이적 핵산 절단 분자는, 서열 특이적으로 핵산 절단하는 활성(서열 특이적 핵산 절단 활성)을 갖는 분자이다.
「표적 서열」이라고 하는 용어는, 서열 특이적 핵산 절단 분자에 의한 절단의 대상이 되는 게놈 중의 DNA 서열을 가리킨다. 서열 특이적 핵산 절단 분자가 Cas 단백질인 경우, 표적 서열은, Cas 단백질에 의한 절단의 대상이 되는 게놈 중의 DNA 서열을 가리킨다. Cas 단백질로서 Cas9 단백질을 이용하는 경우, 표적 서열은, 프로토스페이서 인접 모티프(PAM)의 5'측에 인접하는 서열일 필요가 있다. 표적 서열은, 통상, PAM의 5'측 직전에 인접하는 17∼30염기(바람직하게는 18∼25염기, 보다 바람직하게는 19∼22염기, 더 바람직하게는 20염기)의 서열이 선택된다. 표적 서열의 설계에는, CRISPR DESIGN(crispr.mit.edu/) 등의 공지된 디자인 툴을 이용할 수 있다.
「Cas 단백질」이라고 하는 용어는, CRISPR 관련(CRISPR-associated) 단백질을 가리킨다. 바람직한 태양에 있어서, Cas 단백질은, 가이드 RNA와 복합체를 형성하여, 엔도뉴클레아제 활성 또는 니카제 활성을 나타낸다. Cas 단백질로서는, 특별히 한정되지 않지만, 예를 들어, Cas9 단백질 등을 들 수 있다. Cas 단백질은, 가이드 RNA와 협동하여 엔도뉴클레아제 활성 또는 니카제 활성을 나타내는 한, 야생형 Cas 단백질 및 그 호몰로그(파라로그 및 오소로그), 및 그들의 변이체를 포함한다.
바람직한 태양에 있어서, Cas 단백질은, 클래스 2의 CRISPR/Cas계에 관여하는 것이고, 보다 바람직하게는 II형의 CRISPR/Cas계에 관여하는 것이다. Cas 단백질의 바람직한 예로서는, Cas9 단백질이 예시된다.
「Cas9 단백질」이라고 하는 용어는, II형의 CRISPR/Cas계에 관여하는 Cas 단백질을 가리킨다. Cas9 단백질은, 가이드 RNA와 복합체를 형성하여, 가이드 RNA와 협동하여 표적 영역의 DNA를 절단하는 활성을 나타낸다. Cas9 단백질은, 상기의 활성을 갖는 한, 야생형 Cas9 단백질 및 그 호몰로그(파라로그 및 오소로그), 및 그들의 변이체를 포함한다. 야생형 Cas9 단백질은, 뉴클레아제 도메인으로서 RuvC 도메인 및 HNH 도메인을 갖지만, 본 명세서에 있어서의 Cas9 단백질은, RuvC 도메인 및 HNH 도메인 중 어느 한쪽이 불활성화된 것이어도 된다. RuvC 도메인 및 HNH 도메인 중 어느 한쪽이 불활성화된 Cas9는, 2본쇄 DNA에 대해서 1본쇄 절단(닉(nick))을 도입한다. 그 때문에, RuvC도메인 및 HNH 도메인 중 어느 한쪽이 불활성화된 Cas9를 2본쇄 DNA의 절단에 이용하는 경우에는, 센스쇄와 안티센스쇄 각각에 대해 Cas9의 표적 서열을 설정하고, 센스쇄 및 안티센스쇄의 닉이 충분히 가까운 위치에서 생기고, 그것에 의해 2본쇄 절단이 유발되도록, 개변 시스템을 구성할 수 있다.
Cas9 단백질이 유래하는 생물종은 특별히 한정되지 않지만, 스트렙토코커스(Streptococcus)속, 스타필로코커스(Staphylococcus)속, 나이세리아(Neisseria)속, 또는 트레포네마(Treponema)속에 속하는 세균 등이 바람직하게 예시된다. 보다 구체적으로는, S. pyogenes, S. thermophilus, S. aureus, N. meningitidis, 또는 T. denticola 등에서 유래하는 Cas9 단백질이 바람직하게 예시된다. 바람직한 태양에 있어서, Cas9 단백질은, S. pyogenes 유래의 Cas9 단백질이다.
「가이드 RNA」 및 「gRNA」라고 하는 용어는, 서로 호환적으로 사용되고, Cas 단백질과 복합체를 형성하여, Cas 단백질을 표적 영역에 유도할 수 있는 RNA를 가리킨다. 바람직한 태양에 있어서, 가이드 RNA는, CRISPR RNA(crRNA) 및 트랜스 활성화형 CRISPR RNA(tracrRNA)를 포함한다. crRNA는, 게놈 상의 표적 영역에의 결합에 관여하고, tracrRNA는, Cas 단백질과의 결합에 관여한다. 바람직한 태양에 있어서, crRNA는, 스페이서 서열과 리피트 서열을 포함하고, 스페이서 서열이 표적 영역에 있어서 표적 서열의 상보쇄와 결합한다. 바람직한 태양에 있어서, tracrRNA는, 안티리피트 서열과 3' 테일 서열을 포함한다. 안티리피트 서열은 crRNA의 리피트 서열과 상보적인 서열을 가져, 리피트 서열과 염기쌍을 형성하고, 3' 테일 서열은 통상 3개의 스템 루프를 형성한다.
가이드 RNA는, crRNA의 3'말단에 tracrRNA의 5'말단을 연결한 단일 가이드 RNA(sgRNA)여도 되고, crRNA 및 tracrRNA를 다른 RNA 분자로 하고, 리피트 서열 및 안티리피트 서열로 염기쌍을 형성시킨 것이어도 된다. 바람직한 태양에 있어서, 가이드 RNA는 sgRNA이다.
crRNA의 리피트 서열 및 tracrRNA의 서열은, Cas 단백질의 종류에 따라서 적절히 선택할 수 있고, Cas 단백질과 동일한 세균종에서 유래하는 것을 이용할 수 있다. CRISPR-Cas9 시스템으로서는, S. pyogenes 유래의 Cas9 단백질, crRNA 및 tracrRNA(또는 sgRNA)를 이용할 수 있다. sgRNA 설계를 위한 crRNA 리피트 서열 및 tracrRNA의 서열은, 여러 가지 제안되어 있고, 당업자는, 공지 기술에 기초하여 sgRNA를 설계할 수 있다(예를 들어, Jinek et al. (2012) Science, 337, 816-21; Mali et al. (2013) Science, 339: 6121, 823-6; Cong et al. (2013) Science, 339: 6121, 819-23; Hwang et al. (2013) Nat. Biotechnol. 31: 3, 227-9; Jinek et al. (2013) eLife, 2, e00471).
폴리뉴클레오타이드에 관해서 이용하는 「작동 가능하게 연결」이라고 하는 용어는, 제1 염기 서열이 제2 염기 서열에 충분히 가깝게 배치되어, 제1 염기 서열이 제2 염기 서열 또는 제2 염기 서열의 제어하의 영역에 영향을 미칠 수 있음을 의미한다. 예를 들어, 폴리뉴클레오타이드가 프로모터에 기능적으로 연결된다는 것은, 당해 폴리뉴클레오타이드가, 당해 프로모터의 제어하에서 발현되도록 연결되어 있음을 의미한다.
「발현 가능한 상태」라고 하는 용어는, 폴리뉴클레오타이드가 도입된 세포 내에서, 해당 폴리뉴클레오타이드가 전사될 수 있는 상태에 있음을 가리킨다.
「발현 벡터」라고 하는 용어는, 대상 폴리뉴클레오타이드를 포함하는 벡터로서, 해당 벡터를 도입한 세포 내에서, 대상 폴리뉴클레오타이드를 발현 가능한 상태로 하는 시스템을 구비한 벡터를 가리킨다. 예를 들어, 「Cas 단백질의 발현 벡터」란, 해당 벡터를 도입한 세포 내에서, Cas 단백질을 발현 가능한 벡터를 의미한다. 또한, 예를 들어, 「가이드 RNA의 발현 벡터」란, 해당 벡터를 도입한 세포 내에서, 가이드 RNA를 발현 가능한 벡터를 의미한다.
본 명세서에 있어서, 염기 서열끼리 또는 아미노산 서열끼리의 서열 동일성(또는 상동성)은, 2개의 염기 서열 또는 아미노산 서열을, 대응하는 염기 또는 아미노산이 가장 많이 일치하도록, 삽입 및 결실에 해당되는 부분에 갭을 넣으면서 병치하고, 얻어진 얼라인먼트 중의 갭을 제외한, 염기 서열 전체 또는 아미노산 서열 전체에 대한 일치된 염기 또는 아미노산의 비율로서 구해진다. 염기 서열 또는 아미노산 서열끼리의 서열 동일성은, 당해 기술 분야에서 공지된 각종 상동성 검색 소프트웨어를 이용하여 구할 수 있다. 예를 들어, 염기 서열의 서열 동일성의 값은, 공지된 상동성 검색 소프트웨어 BLASTN에 의해 얻어진 얼라인먼트를 바탕으로 한 계산에 의해 얻을 수 있고, 아미노산 서열의 서열 동일성의 값은, 공지된 상동성 검색 소프트웨어 BLASTP에 의해 얻어진 얼라인먼트를 바탕으로 한 계산에 의해 얻을 수 있다.
<본 발명의 방법>
본 발명에 의하면,
(a) 세포를 포함하는 세포 집단을 준비하는 것과,
(b) 상기 세포 집단 중의 상기 세포의 게놈 DNA에, 게놈 DNA 상의 2개소의 표적 서열을 서열 특이적으로 절단할 수 있는 서열 특이적 핵산 절단 분자를 각각 작용시켜, 게놈 DNA 상의 2개소의 표적 서열에 있어서 각각 절단을 일으키게 하고, 이것에 의해, 세포 집단 중의 적어도 일부의 세포에 있어서, 상기 2개소의 절단 부위 사이의 영역에 있어서 DNA 영역의 결실을 일으키게 하는 것
을 포함하는 방법
이 제공된다. 본 발명의 방법은, 인비트로의 방법일 수 있다. 본 발명의 방법은 또한, 단리된 세포를 바람직하게 사용할 수 있다.
따라서, 본 발명에 의하면, 인비트로의 방법으로서,
(a) 단리된 세포를 포함하는 세포 집단을 준비하는 것과,
(b) 상기 세포 집단 중의 상기 세포의 게놈 DNA에, 게놈 DNA 상의 2개소의 표적 서열을 서열 특이적으로 절단할 수 있는 서열 특이적 핵산 절단 분자를 각각 작용시켜, 게놈 DNA 상의 2개소의 표적 서열에 있어서 각각 절단을 일으키게 하고, 이것에 의해, 세포 집단 중의 적어도 일부의 세포에 있어서, 상기 2개소의 절단 부위 사이의 영역에 있어서 DNA 영역의 결실을 일으키게 하는 것
을 포함하는 방법이 제공된다.
본 발명의 일 태양에 의하면, 본 발명의 방법은,
(c) 상기 DNA 영역의 결실을 일으킨 세포를 포함하는 세포 집단에 있어서, 전체 세포에 대한 상기 DNA 영역의 결실을 일으킨 세포의 비율을 결정하는 것
을 추가로 포함한다.
상기 (a)에 있어서, 세포 집단에 포함되는 세포는, 단일 종류여도 되고, 복수 종류여도 된다. 바람직하게는, 세포 집단에 포함되는 세포는, 단일 종류(예를 들어, 세포주, 클론화된 세포)일 수 있다. 세포 집단은, 부유(浮游) 세포의 집단이어도 되고, 접착 세포의 집단이어도 된다. 세포 집단은, 단일 세포화된 세포의 집단이어도 되고, 세포괴를 포함하는 세포 집단이어도 된다. 세포 집단은, 세포와 생리학적으로 허용 가능한 부형제를 포함할 수 있다. 생리학적으로 허용 가능한 부형제로서는, 세포의 유지에 적절한 조건을 갖는 부형제이며, 예를 들어, 물, 염, pH완충제, 등장제 등을 들 수 있다. 세포 집단은, 예를 들어, 102 이상, 103 이상, 104 이상, 105 이상, 또는 106 이상의 세포를 포함할 수 있다.
본 발명의 어느 태양에서는, 세포는, 단리된 세포일 수 있다. 세포는, 정제된 세포여도 된다. 세포는, 단세포 생물의 세포일 수 있다. 세포는, 세포주일 수 있다. 세포는, 클론화된 세포(세포 클론)일 수 있다. 세포는, 단일 세포화된 세포일 수 있다. 세포는, 부유 세포일 수 있다. 세포는, 접착 세포일 수 있다. 세포는, 세포괴를 형성하고 있어도 된다. 세포는, 콜로니를 형성하고 있어도 된다. 세포는, 그 유지 또는 증식에 적합한 조건하에 놓여진다.
어느 태양에서는, 세포는, 다능성 세포, 및 다능성 줄기세포(배성 줄기세포 및 유도 다능성 줄기세포 등)로 이루어지는 군으로부터 선택되는 세포일 수 있다. 어느 태양에서는, 세포는, 조직 줄기세포일 수 있다. 어느 태양에서는, 세포는, 체세포일 수 있다. 어느 태양에서는, 세포는, 조직 전구 세포일 수 있다. 어느 태양에서는, 세포는, 생식 계열 세포(예를 들어, 생식 세포)일 수 있다. 어느 태양에서는, 세포는, 세포주일 수 있다. 어느 태양에서는, 세포는 불사화 세포일 수 있다. 어느 태양에서는, 세포는 암 세포일 수 있다. 어느 태양에서는, 세포는, 비암 세포일 수 있다. 어느 태양에서는, 세포는, 질환 환자의 세포일 수 있다. 어느 태양에서는, 세포는 건상자(健常者)의 세포일 수 있다. 어느 태양에서는, 세포는, 외래의 병원체에 감염된 세포일 수 있다. 어느 태양에서는, 세포는, 비감염 세포일 수 있다. 어느 태양에서는, 세포는, 동물 세포(예를 들어, 조류 세포, 예를 들어, 어류 세포, 예를 들어, 양서류 세포, 예를 들어, 파충류 세포, 예를 들어, 포유동물 세포, 예를 들어, 설치류 세포, 예를 들어, 영장류 세포, 예를 들어, 인간 세포)일 수 있다. 어느 태양에서는, 세포는, 예를 들어, 곤충 세포(예를 들어, 누에 세포), HEK293 세포, HEK293T 세포, Expi293F(상표) 세포, FreeStyle(상표) 293F 세포, 차이니즈 햄스터 난소 세포(CHO 세포), CHO-S 세포, CHO-K1 세포, 및 ExpiCHO 세포, 및 이들 세포로부터의 파생 세포로 이루어지는 군으로부터 선택되는 세포(특히, 재조합 단백질 산생 세포)일 수 있다. 어느 태양에서는, 세포는, 식물의 세포일 수 있다. 어느 태양에서는, 세포로서는 또한, 미생물의 세포, 예를 들어, 사상균, 방선균 등의 그램 양성균, 대장균 등의 그램 음성균, 및 효모 등의 진균 등의 미생물의 세포를 들 수 있다.
본 발명에서 이용되는 세포는, 바람직하게는, 1배체의 세포여도, 2배체의 세포여도 된다. 세포는 또한, 그 이외의 배수체의 세포여도, 특별히 한정 없이 이용할 수 있다. 본 발명의 모든 실시태양에 있어서 1배체의 세포는 바람직하게 이용될 수 있다.
상기 (b)에 있어서, 세포의 게놈 DNA(특히 숙주 게놈 DNA)에 대해서, 게놈 DNA 상의 2개소의 표적 서열을 서열 특이적으로 절단할 수 있는 서열 특이적 핵산 절단 분자를 각각 작용시킬 수 있다. 표적 서열은, 이용하는 서열 특이적 핵산 절단 분자의 절단 특성에 비추어, 당업자이면 적절히 설정할 수 있다. 표적 서열은, 적어도 1개의 알렐의 염기 서열에 존재하고, 바람직하게는, 2개 이상 또는 모든 알렐에 공통되게 존재하는 서열일 수 있다. 게놈 상의 복수의 표적 서열을 절단하려면, 예를 들어, CRISPR-Cas9 시스템, TALEN, 및 징크 핑거 뉴클레아제는 모두 바람직하게 이용될 수 있다. 구체적으로는, 이용하는 가이드 RNA(crRNA 및 tracrRNA의 조합, 또는 sgRNA)를 표적 서열의 증가에 따라서 늘리는 것만으로, 복수 개소의 절단이 생기기 때문이다(예를 들어, WO2014/093661 참조). 절단에 CRISPR-Cas9 시스템 이외의 게놈 개변 시스템을 이용하는 경우는, 표적 서열마다 절단 분자를 준비한다.
게놈 DNA(특히 숙주 게놈 DNA)에 절단이 생기면, 세포의 게놈 수복 기구에 의해, 절단 부위가 다시 연결된다. 게놈 DNA에 2개소의 절단을 일으키게 하면, 게놈 수복 기구에 의해 일정한 확률로 게놈 DNA의 텔로미어측의 절단 말단과 센트로미어측의 절단 말단이 직접 연결되어, 2개소의 절단 부위 사이의 DNA 영역은, 게놈 DNA로부터 결실될 수 있다.
따라서, 상기 (b)에 있어서, 상기 2개소의 절단 부위 사이의 영역에 있어서 생긴 DNA 영역의 결실을 갖는 적어도 1개의 세포(바람직하게는 복수의 세포)를 포함하는 세포 집단이 취득된다.
상기 (b)에 있어서, 2개소의 절단 부위는, 1개 또는 복수의 유전자 또는 유전자 후보를 포함하는 영역을 끼우도록 설계될 수 있다. 2개소의 절단 부위에 포함되는 1개 또는 복수의 유전자 또는 유전자 후보는, 1개 또는 복수의 세포의 생존 및/또는 증식을 정(正)으로 제어하는 유전자(예를 들어, 세포의 생존 및/또는 증식에 필수인 유전자)를 포함하고 있어도 된다. 2개소의 절단 부위에 포함되는 1개 또는 복수의 유전자 또는 유전자 후보는, 1개 또는 복수의 세포의 증식을 억제하는 유전자 등의, 결실되면 세포 증식이 촉진되는 1개 또는 복수의 유전자를 포함하고 있어도 된다. 세포의 생존 및/또는 증식을 정으로 제어하는 유전자(예를 들어, 세포의 생존 및/또는 증식에 필수인 유전자)는, 당업자는 미리 파악해 둘 필요는 반드시 없다. 그러나, 세포의 생존 및/또는 증식을 정으로 제어하는 유전자(예를 들어, 세포의 생존 및/또는 증식에 필수인 유전자)는, Online Gene Essentiality(OGEE) 데이터베이스(http://ogee.medgenius.info/browse/) 등의 공개 데이터베이스를 이용하여 미리 추정해 둘 수 있다.
어느 태양에서는, 1개 또는 복수의 유전자 또는 유전자 후보를 포함하는 영역은, 세포의 생존 및/또는 증식을 정으로 제어하는 유전자(예를 들어, 세포의 생존 및/또는 증식에 필수인 유전자)라고 추정되는 유전자를 포함하고 있어도 된다. 어느 태양에서는, 1개 또는 복수의 유전자 또는 유전자 후보를 포함하는 영역은, 세포의 생존 및/증식을 부(負)로 제어하는 유전자 또는 그와 같이 추정되는 유전자를 포함하고 있어도 된다. 어느 태양에서는, 1개 또는 복수의 유전자 또는 유전자 후보를 포함하는 영역은, 세포의 생존 및/또는 증식을 정으로 제어하는 유전자(예를 들어, 세포의 생존 및/또는 증식에 필수인 유전자) 또는 그와 같이 추정되는 유전자와, 세포의 생존 및/증식을 부로 제어하는 유전자 또는 그와 같이 추정되는 유전자를 포함하고 있어도 된다.
상기 (b)에 있어서, 2개소의 절단 부위는, 특별히 한정되지 않지만, 0.1Mb 이상, 0.2Mb 이상, 0.3Mb 이상, 0.4Mb 이상, 0.5Mb 이상, 0.6Mb 이상, 0.7Mb 이상, 0.8Mb 이상, 0.9Mb 이상, 1Mb 이상, 2Mb 이상, 3Mb 이상, 4Mb 이상, 또는 5Mb 이상의 영역을 끼우도록 설계되어 있어도 된다. 즉, 게놈 DNA로부터 결실되는 DNA 영역은, 0.1Mb 이상, 0.2Mb 이상, 0.3Mb 이상, 0.4Mb 이상, 0.5Mb 이상, 0.6Mb 이상, 0.7Mb 이상, 0.8Mb 이상, 0.9Mb 이상, 1Mb 이상, 2Mb 이상, 3Mb 이상, 4Mb 이상 또는 5Mb 이상의 길이를 갖고 있어도 된다.
이것에 의해, 상기 (b)에서는, 상기 2개소의 절단 부위 사이의 영역에 있어서 생긴 DNA 영역의 결실을 갖는 세포를 포함하는 세포 집단이 얻어질 수 있다. 2개소의 절단을 갖는 게놈 DNA 등의 DNA는, 세포 내에서 수복될 수 있지만, 이 수복에 의해, 일정 확률로, 상기 2개소의 절단 부위 사이의 영역에 있어서 생긴 DNA 영역의 결실을 갖는 게놈 DNA 등의 DNA를 갖는 세포가 생길 수 있다. 따라서, 상기에 의해, 상기 2개소의 절단 부위 사이의 영역에 있어서 생긴 DNA 영역의 결실을 갖는 세포를 포함하는 세포 집단이 얻어지는 것이다.
세포 집단으로부터, 상기 2개소의 절단 부위 사이의 영역에 있어서 생긴 DNA 영역의 결실을 갖는 세포를 취득할 수 있다. 취득은, 예를 들어, 세포 집단을 한외 희석하여 클로닝하는 것에 의해 행할 수 있다. DNA 영역을 결실한 게놈 DNA에 있어서는, 결실된 부분의 전후가 직접 연결되어 있다고 생각된다. 따라서, 그 연결부(정션)를 끼우도록 증폭용 프라이머를 설계하여, DNA 영역을 결실한 게놈 DNA를 주형으로 한 PCR법(정션 PCR)에 의해, DNA 영역의 결실의 유무를 결정할 수 있다. 또한, 연결부를 시퀀싱하는 것에 의해, DNA 영역의 결실의 유무를 결정할 수 있다.
이 때, 결실된 DNA 영역이, 세포의 생존 및/또는 증식을 정으로 제어하는 유전자(예를 들어, 세포의 생존 및/또는 증식에 필수인 유전자)를 포함하지 않는 경우에는, 당해 DNA 영역의 결실을 갖는 세포를 취득할 수 있다. 또한, 결실된 DNA 영역이, 세포의 생존 및/또는 증식을 정으로 제어하는 유전자(예를 들어, 세포의 생존 및/또는 증식에 필수인 유전자)를 포함하는 경우에는, 당해 결실을 갖는 세포는, 시간과 함께 증식을 정지하거나, 사멸하여, 세포 집단에서 차지하는 세포의 비율을 감소시킨다. 혹은, 결실된 DNA 영역이, 세포의 생존 및/증식을 부로 제어하는 유전자를 포함하는 경우에는, 당해 결실을 갖는 세포는, 시간과 함께 증식하여, 세포 집단에서 차지하는 비율을 증가시킨다.
상기 (c)에서는, DNA 영역의 결실을 일으킨 세포의 비율에 기초하여 세포의 증식 또는 생존에 대한 상기 DNA 영역의 결실의 영향을 결정할 수 있다.
세포의 증식 또는 생존에 대한 상기 DNA 영역의 결실의 영향은, 여러 가지 방법에 의해 결정할 수 있다.
상기 (c)는, 공정(b)에 계속해서 행할 수 있다. 여기에서, 공정(b)와 (c) 사이에서는, 세포의 선별(특정의 세포를 다른 세포로부터 단리하는 것, 예를 들어, 세포 집단으로부터 일부의 세포를 선별하는 것)을 실시하지 않을 수 있다. 즉, 공정(b)에 있어서 얻어진 세포 집단을 그대로 배양하여, 공정(c)를 실시할 수 있다. 배양은, 결실 전의 세포의 배양(또는 증식)에 적합한 조건하에서 행할 수 있다. 혹은, 공정(b)와 (c) 사이에서는, 세포의 선별 공정을 실시해도 된다.
상기 (c)에 있어서, 상기 결정은, DNA 영역의 결실 효율 또는 그 추정치를 결정함으로써, 그 후의 배양 후의 세포 집단에 있어서의 DNA 영역의 결실을 갖는 세포의 비율과, 결정된 결실 효율 또는 그 추정치를 비교하는 것에 의해 행해질 수 있다.
상기 (c)에 있어서, 결실 효율 또는 그 추정치의 결정, 및, 배양 후의 DNA 영역의 결실을 갖는 세포의 비율은, 각각 세포 집단을 포함하는 현탁액 중에 포함되는 전체 세포에 대한 결실을 갖는 세포의 비율로서 결정될 수 있다. 상기 비율은, 현탁액 중에 포함되는, 결실을 갖는 게놈 DNA 및 갖지 않는 게놈 DNA의 계수 기술에 의해 결정될 수 있다.
세포의 증식 또는 생존에 대한 DNA 영역의 결실의 영향은, 결실의 도입 효율(또는 그 추정치)과, 계속되는 배양 후의 DNA 영역의 결실을 갖는 세포의 비율로부터 결정할 수 있다. 예를 들어, 상기 (c){이하, DNA 영역의 결실의 영향을 결정하는 공정에서도 마찬가지이다}는, 결실의 도입 효율(또는 그 추정치)을 산출하는 것을 포함할 수 있다. DNA 영역의 결실의 도입 효율은, 상기 (b)의 처리 후, DNA 영역의 결실의 효과가 세포에 생기기 전에 행할 수 있다. DNA 영역의 결실을 한 직후에는, 세포 내에 당해 결실된 DNA 영역에서 유래하는 전사 산물이나 번역 산물이 잔존하고 있기 때문에, DNA 영역의 결실의 영향은 적다. 따라서, 상기 (b)의 처리 후, 예를 들어, 2시간 후∼3일 후, 4시간∼3일 후, 6시간∼3일 후, 8시간∼3일 후, 12시간∼3일 후, 18시간∼3일 후, 1일 후∼2일 후, 1일 후∼3일 후, 1일∼60시간 후, 4시간∼60시간 후, 4시간∼48시간 후, 4시간∼36시간 후, 4시간∼30시간 후, 또는 4시간∼2일 후에 DNA 영역의 결실의 도입 효율을 확인할 수 있다. 상기 (c){이하, DNA 영역의 결실의 영향을 결정하는 공정에서도 마찬가지이다}는 또한, 얻어진 세포를 배양하는 것을 포함할 수 있다. 배양은, DNA 영역의 결실 처치 전의 세포의 배양에 적합한 조건하에서 행해질 수 있다. 예를 들어, 상기 (b)의 후에서 얻어지는, 상기 DNA 영역의 결실을 갖는 세포를 포함하는 세포 집단을 배양하여, 일정 세포수당의 증식된 세포의 수, 또는 증식된 세포가 형성하는 콜로니의 수를 계수하는 것에 의해 평가할 수 있다. 구체적으로는, 일정 세포수당의 증식된 세포의 수, 또는 증식된 세포가 형성하는 콜로니의 수가 변화된 것(또는, 결실을 갖는 콜로니의 비율 또는 세포의 비율이 결실의 도입 효율보다 저하된 것)은, 상기 결실된 DNA 영역에, 세포의 생존 및/또는 증식을 제어하는 유전자가 포함되는 것을 의미한다. 보다 구체적으로는, 일정 세포수당의 증식된 세포의 수, 또는 증식된 세포가 형성하는 콜로니의 수가 큰 것 또는 증가했던 것은, 상기 DNA 영역의 결실은, 세포의 증식 또는 생존에 정의 영향을 주었다고 평가하는 것, 또는 상기 DNA 영역이, 세포의 생존 및/또는 증식을 부로 제어하는 유전자를 포함하고 있었다고 평가하는 것이 가능하다. 또한, 일정 세포수당의 증식된 세포의 수, 또는 증식된 세포가 형성하는 콜로니의 수가 작은 것 또는 감소했던 것은, 상기 DNA 영역의 결실은, 세포의 증식 또는 생존에 부의 영향을 주었다고 평가하는 것, 또는 상기 DNA 영역이, 세포의 생존 및/또는 증식을 정으로 제어하는 유전자(특히, 세포의 생존 및/또는 증식에 필수인 유전자)를 포함하고 있었다고 평가하는 것이 가능하다. 상기 배양은, 개변 전의 세포의 배양에 적합한 조건하에 행해질 수 있다. 형성된 콜로니수에 대한 DNA 영역의 결실을 갖는 콜로니의 비율을 조사해도 된다.
또한, 예를 들어, 결실의 도입 효율(또는 그 추정치) 및 세포 집단 중의 상기 DNA 영역의 결실을 갖는 세포수의 비율을 디지털 PCR이나 분자 바코드에 의한 핵산의 디지털 계수 기술 등의 계수 수법을 이용하여 결정할 수도 있다. 상기 계측 수법은, 어느 세포를 다른 세포로부터 분리하는 것, 및/또는, 세포에 콜로니를 형성시키는 것을 포함하지 않아도 된다. 즉, 결실의 도입 효율(또는 그 추정치) 및 세포 집단 중의 상기 DNA 영역의 결실을 갖는 세포수의 비율을 세포 현탁액을 이용하여(또는 세포 현탁액으로부터 추출한 게놈 DNA 또는 그 증폭 산물을 이용하여) 산출할 수 있다.
디지털 PCR은, 핵산(여기에서는 게놈 DNA)을 1웰당의 게놈수가 일정해지는 농도 및 양으로 복수의 미세한 칸막이에 핵산을 분주하고, PCR 반응에 제공하고, PCR 반응을 일으킨 웰수를 계수하는 것에 의해, 주형 핵산의 절대 정량을 행하는 수법이다. 마이크로 유체 디바이스, 유중 액적을 이용한 드롭렛법을 이용하여 핵산을 1분자를 포함하는 다수의 획분에 분획할 수 있고, 각각의 1분자를 포함하는 획분으로 병행하여 핵산 증폭 반응을 일으킨다. 증폭하는 주형이 존재하지 않는 경우에는, 증폭 산물이 생기지 않고, 증폭하는 주형이 존재하는 경우에는, 증폭 산물이 생기는 것을 이용하여, 획분마다 증폭의 유무를 계수하는 것에 의해, 디지털적으로 샘플 중에 증폭하는 주형이 존재하고 있었는지, 또는 그 존재량을 결정할 수 있다. PCR 프라이머는, DNA 영역의 결실을 일으키지 않을 때에 증가하고, 결실을 가질 때 증가하지 않게 설계할 수 있거나, 또는, DNA 영역의 결실을 일으키지 않을 때에 증가하지 않고, 결실을 가질 때 증가하도록 설계할 수 있다.
분자 바코드에 의한 핵산의 디지털 계수 기술은, 핵산의 단편에 대해서, 1 분자마다 고유의 분자 바코드(구체적으로는, 고유의 염기 서열)를 부가하고, 그 후, 그 서열을 시퀀싱하는 것에 의해, 핵산 분자의 수를 절대 정량하는 기술이다. 분자 바코드에 의한 핵산의 디지털 계수 기술에 있어서는, 분자 바코드의 종류의 수가, 핵산 분자수에 대응한다.
상기 DNA 영역이, 세포의 생존 및/또는 증식을 정으로 제어하는 유전자(특히, 세포의 생존 및/또는 증식에 필수인 유전자)를 포함하고 있는 경우에는, 배양과 함께 세포는 사멸한다. 따라서, 예를 들어, 그 사멸의 전후에서, 세포 집단 중의 상기 DNA 영역의 결실을 갖는 세포수의 비율을 결정하는 것(또는, 결실을 갖는 콜로니의 비율 또는 세포의 비율이 결실의 도입 효율보다 저하된 것)에 의해, 세포의 증식 또는 생존에 대한 상기 DNA 영역의 결실의 영향을 평가할 수 있다.
세포의 증식 또는 생존에 대한 상기 DNA 영역의 결실의 영향은, 대조와 비교하여 결정할 수 있다. 예를 들어, 세포의 증식 또는 생존에 대한 상기 DNA 영역의 결실의 영향은, 대조의 세포의 증식 또는 생존과 비교하여 결정할 수 있다. 대조의 세포로서는, 예를 들어, 상기 DNA 영역의 일부 또는 전부를 갖는 세포로 할 수 있다.
본 발명의 어느 태양에서는, 상기 (c){이하, DNA 영역의 결실의 영향을 결정하는 공정에서도 마찬가지이다}는, 상기 (b)에서 얻어진 세포를 배양하는 것을 포함한다. 당해 배양은, 예를 들어, 소정의 조건하에서 행할 수 있다. 소정의 조건하로서는, 통상의 세포의 배양 조건하에 더하여, 예를 들어, 스트레스 존재하, 증식 자극 존재하, 분화 유도 자극 존재하, 저산소 조건하, 증식 인자 존재하, 증식 저해제 존재하, 분화 유도 인자 존재하, 분화 저해 인자 존재하, 및 약제 존재하를 들 수 있다. 이와 같이 하여, 상기 (b)에서 얻어진 세포를 소정의 조건하에서 배양하는 것에 의해, 당해 세포의 당해 소정의 조건하에서의 거동에 대한, 결실된 DNA 영역의 영향(역할)을 결정할 수 있다. 또한, 특정의 DNA 영역의 결실을 갖는 세포의 거동에 대한, 배양 조건(소정의 조건)의 영향을 조사할 수도 있다. 예를 들어, 특정의 DNA 영역의 결실을 갖는 세포의 거동에 대한, 약제 첨가의 영향을 조사하는 것에 의해, 약제의 특성 분석을 행하는 것이나 약제의 스크리닝을 행하는 것이 가능하다.
본 발명의 방법은, 상기 (a)∼(c)와,
(d) 대조가 되는 세포 집단과 비교하여, 상기 (c)에 있어서의 생존 및/또는 증식에 대한 영향의 유무 또는 크기에 기초하여, 대조의 게놈 DNA와 비교하여 결실된 DNA 영역이 세포의 생존 및/또는 증식을 제어하는 유전자를 포함하는지 여부를 결정하는 것
을 포함하고 있어도 된다.
상기 (d)에 있어서, 대조 또는 음성 대조는, 미개변 또는 개변 전의 세포 또는 세포 집단일 수 있다. 상기 (d)에 있어서, 대조(또는 음성 대조)는, 보다 작은 DNA 영역의 결실을 갖는 세포 또는 당해 세포를 포함하는 세포 집단일 수 있다. 상기 (d)에 있어서, 대조(또는 양성 대조)는, 보다 큰 DNA 영역의 결실을 갖는 세포 또는 당해 세포를 포함하는 세포 집단일 수 있다. 상기 (d)에 있어서, 대조는, 다른 DNA 영역의 결실을 갖는 세포 또는 당해 세포를 포함하는 세포 집단일 수 있다. 상기 세포 집단은, 상기 (b)에 의해 얻어질 수 있다.
상기 (d)에 있어서, 미개변 또는 개변 전의 세포 또는 세포 집단을 대조로 하는 것에 의해, 결실된 DNA 영역에 포함되는 유전자의, 세포의 생존 및/또는 증식에 대한 영향을 평가할 수 있다.
상기 (d)에 있어서, 보다 작은 DNA 영역의 결실을 갖는 세포 또는 당해 세포를 포함하는 세포 집단을 대조로 하는 것에 의해, 당해 대조가 포함하는 유전자로서, 평가 대상이 되는 DNA의 결실에 의해 결실된 유전자의, 세포의 생존 및/또는 증식에 대한 영향을 평가할 수 있다.
상기 (d)에 있어서, 보다 큰 DNA 영역의 결실을 갖는 세포 또는 당해 세포를 포함하는 세포 집단을 대조로 하는 것에 의해, 당해 대조가 포함하지 않는 유전자로서, 평가 대상이 되는 DNA의 결실을 갖는 세포가 포함하는 유전자의, 세포의 생존 및/또는 증식에 대한 영향을 평가할 수 있다.
상기 (d)에 있어서, 다른 DNA 영역의 결실을 갖는 세포 또는 당해 세포를 포함하는 세포 집단을 대조로 하는 것에 의해, (d-1) 당해 대조가 포함하는 유전자로서, 평가 대상이 되는 DNA의 결실에 의해 결실된 유전자 및/또는 (d-2) 당해 대조가 포함하지 않는 유전자로서, 평가 대상이 되는 DNA의 결실을 갖는 세포가 포함하는 유전자의, 세포의 생존 및/또는 증식에 대한 영향을 평가할 수 있다.
본 발명은 어느 태양에서는, 상기 (a)∼(c)와,
(e) 상기 세포의 비율을 적어도 상이한 2시점에서 결정하는 것을 추가로 포함하고, 시간 경과에 수반하는 상기 (c)에 있어서의 세포의 생존 및/또는 증식에 대한 영향의 유무 또는 크기에 기초하여, 결실된 DNA 영역이 적어도 1개의 세포의 생존 및/또는 증식을 제어하는 유전자를 포함하는지 여부를 결정하는 것
을 포함할 수 있다.
상기 (b)에 의해 상기 DNA 영역의 결실을 포함하는 세포를 포함하는 세포 집단이 얻어진다. 세포 집단에 포함되는 당해 결실을 포함하는 세포의 비율은, 게놈의 개변 효율에 의존한다. 세포 집단에 포함되는 당해 결실을 포함하는 세포는, 배양하는 것에 의해 그 수를 증가, 감소, 또는 유지할 수 있다. 세포는, 게놈에 개변이 생기고 나서도, 당분간은 세포질 내의 게놈 DNA로부터의 전사물(예를 들어, mRNA)의 잔존이나, 전사물로부터의 번역 산물(예를 들어, 단백질)의 잔존에 의해, 개변 전과 마찬가지의 거동을 나타낼 수 있다. 그렇지만, 당분간 배양하면, 상기 전사물의 잔존량이나 단백질의 잔존량이 감소되어, DNA의 결실에 의한 유전자형이 표현형으로서 발현하게 된다. 그리고, 그 후, 세포의 생존 및/또는 증식을 제어하는 유전자에 의한 표현형이 분명해진다.
상기 (e)에 있어서, 2시점(제1 시점 및 제2 시점)에 관해서, 제1 시점은, DNA의 결실에 의한 유전자형이 표현형으로서 발현하기 전일 수 있고, 제2 시점은, DNA의 결실에 의한 유전자형이 표현형으로서 발현한 후일 수 있다. 예를 들어, 제1 시점은, 게놈 개변으로부터 3일 이내일 수 있다. 또한 예를 들어, 제2의 시점은, 게놈 개변으로부터 3일째 이후일 수 있다. 제1 시점과 제2 시점의 간격은, 예를 들어, 1일 이상, 2일 이상, 3일 이상, 4일 이상, 5일 이상, 6일 이상, 또는 1주간 이상의 기간일 수 있다. 당업자이면, 세포 상태 등에 비추어 적절히 제1 시점과 제2 시점을 결정하여, 본 발명을 실시할 수 있다.
상기 (e)에 있어서, 상기 세포의 비율을 적어도 상이한 2시점에서 결정하는 것을 추가로 포함하고, 시간 경과에 수반하는 상기 (c)에 있어서의 세포의 생존 및/또는 증식에 대한 영향의 유무 또는 크기를 평가한다.
상기 (e)에 있어서, 시간 경과에 수반하는 상기 (c)에 있어서의 세포의 생존 및/또는 증식에 대한 영향이 인정되었을 경우에는, 그 원인이 되는 DNA 영역의 결실이, 세포의 생존 및/또는 증식을 제어하는 유전자를 포함하고 있을 가능성이 시사된다. 또한, 시간 경과에 수반하는 상기 (c)에 있어서의 세포의 생존 및/또는 증식에 대한 영향이 인정되었을 경우에는, 그 영향의 크기를 평가하는 것에 의해, 그 원인이 되는 DNA 영역의 결실이 포함하는 세포의 생존 및/또는 증식을 제어하는 유전자의 세포의 생존 및/또는 증식에의 영향력의 크기를 평가할 수 있다. 영향의 크기는, 대조와 비교하여 평가할 수 있다. 대조로서는, 세포의 증식 인자를 코딩하는 유전자 등의 양성 대조 및/또는 세포의 증식 억제 인자를 코딩하는 유전자 등의 양성 대조를 들 수 있다. 대조로서는, 세포의 생존 및/또는 증식에 영향을 주지 않음이 알려져 있는 인자를 코딩하는 유전자 등의 음성 대조를 이용해도 된다.
결실된 DNA 영역이 복수의 추정 유전자(또는 유전자)를 포함하는 경우에는, (f) 거기로부터 어떤 유전자가, 세포의 생존 및/또는 증식을 제어하는 유전자인지를 결정하는 것을 실시해도 된다. 어떤 유전자가, 세포의 생존 및/또는 증식을 제어하는 유전자인지를 결정하는 것은, 다양한 방법을 이용하여 실시할 수 있다. 예를 들어, 특이적인 유전자 파괴, 본 발명에 의한 유전자의 결실에 의한 결손 영역의 세분화, 유전자 클로닝과 그 유전자의 기능 해석 등에 의해, 어떤 유전자가, 세포의 생존 및/또는 증식을 제어하는 유전자인지를 결정할 수 있다.
결실된 DNA 영역에, 세포의 생존 및/또는 증식을 제어하는 유전자가 포함되었을 경우에는, 당해 유전자를 게놈 DNA의 다른 장소에 이소적으로 도입할 수 있다. 따라서, 본 발명은,
(g) 제어 서열에 작동 가능하게 연결된 세포의 생존 및/또는 증식을 제어하는 유전자(특히 세포의 생존 및/또는 증식을 정으로 제어하는 유전자)가 적어도 1개를, 당해 DNA 영역의 결실을 갖는 게놈 DNA에 이소적으로 도입하는 것
을 추가로 포함하고 있어도 된다.
여기에서 이소적으로 도입한다는 것은, 내인성으로 위치하는 장소와는 상이한 장소에 대해서 도입하는 것을 의미한다.
상기 (b)와 상기 (g)에 의해, 게놈 DNA에 DNA 영역의 결실을 일으키게 하면서도, 세포의 생존 및/또는 증식을 제어하는 유전자(특히 세포의 생존 및/또는 증식을 정으로 제어하는 유전자, 특히 세포의 생존에 필수인 유전자)를 이소적으로 상기 게놈 DNA에 도입하는 것에 의해, 세포의 생존 및/또는 증식에 대한 영향을 저감시키면서, 게놈 DNA에 보다 큰 DNA 영역의 결실을 일으키게 할 수 있다. 이와 같이 하여, 세포의 게놈 DNA를 생존에 필수적인 유전자 세트를 갖는 상태가 될 때까지 최소화할 수 있다.
본 발명에 의하면 또한,
(α) 세포를 포함하는 세포 집단을 준비하는 것과, 여기에서 세포는, 결실시키는 영역 중에 네거티브 선택 마커 유전자를 포함하고,
(β) 상기 세포 집단 중의 상기 세포의 게놈 DNA에, 게놈 DNA 상의 2개소의 표적 서열을 서열 특이적으로 절단할 수 있는 서열 특이적 핵산 절단 분자를 각각 작용시켜, 게놈 DNA 상의 2개소의 표적 서열에 있어서 각각 절단을 일으키게 하고, 이것에 의해, 세포 집단 중의 적어도 일부의 세포에 있어서, 상기 2개소의 절단 부위 사이의 영역에 있어서 DNA 영역의 결실을 일으키게 하는 것과, 여기에서, 상기 2개소는, 상기 네거티브 선택 마커 유전자를 끼우는 위치에 설계되고,
(γ) 네거티브 선택 마커 유전자를 갖지 않는 세포를 선택하는 것
을 포함하는, 방법
이 제공된다. 본 발명의 방법은 인비트로의 방법일 수 있고, 세포는 단리된 세포일 수 있다. 어느 태양에서는, 본 발명의 방법은 인비트로의 방법이며, 세포는 단리된 세포이다.
상기 (α)는, 세포는, 결실시키는 영역 중에 네거티브 선택 마커 유전자를 포함하는 것 이외는, 상기 (a)와 동일하므로, 동일 부분에 대한 설명을 생략한다. 여기에서, 선택 마커 발현 세포 및 비발현 세포가 혼재하는 세포 집단에 있어서, 선택 마커 비발현 세포를 선택하는 경우, 당해 선택 마커를 「네거티브 선택 마커」 또는 「네거티브 선택용의 선택 마커」라고 한다.
네거티브 선택 마커는, 그것을 발현하지 않는 세포를 선택 가능한 것이면, 특별히 한정되지 않는다. 네거티브 선택 마커 유전자로서는, 예를 들어, 자살 유전자(티미딘 카이네이스(TK)) 등), 형광 단백질 유전자, 발광 효소 유전자, 발색 효소 유전자 등을 들 수 있다. 네거티브 선택 마커 유전자가, 세포의 생존에 부의 영향을 주는 유전자(예를 들어, 자살 유전자)인 경우, 당해 네거티브 선택 마커 유전자는, 유도성 프로모터에 기능적으로 연결될 수 있다. 유도성 프로모터에 기능적으로 연결함으로써, 네거티브 선택 마커 유전자를 갖는 세포를 제거하고 싶을 때에만, 네거티브 선택 마커 유전자를 발현시킬 수 있다. 네거티브 선택 마커 유전자가, 형광, 발광, 및 발색 등의 광학적으로 검출 가능한 마커 유전자(가시화 마커 유전자; visible marker gene)인 경우 등, 세포의 생존에 부의 영향이 적은 경우에는, 항상적으로 발현시켜도 된다.
상기 (α)에서는, 세포는, 결실시키는 DNA 영역 중에 네거티브 선택 마커 유전자(네거티브 선택에 이용할 수 있는 마커 유전자이다)를 포함한다. 결실시키는 DNA 영역은, 네거티브 선택 마커 유전자를 내재적으로 갖는 부분으로 하거나, 또는 결실시키는 DNA 영역에 외래적으로 네거티브 선택 마커 유전자를 도입하는 것에 의해 제작될 수 있다. 네거티브 선택 마커 유전자를 내재적으로 갖는 부분은, 예를 들어, X 염색체의 HPRT1 유전자(특히, 인간 X 염색체의 인간 HPRT1 유전자)의 존재하는 영역(특히, 인간 X 염색체의 q25-26의 DNA 영역)일 수 있다. 결실시키는 영역에의 외래적으로 네거티브 선택 마커 유전자의 도입은, 예를 들어, 유전자 개변 기술(예를 들어, HDR, 게놈 편집 시스템)을 이용하여 행할 수 있다. 예를 들어, 네거티브 선택 마커 유전자가 가시화 마커 유전자인 경우에는, 예를 들어, 가시화 마커 유전자는, 게놈 DNA의 특정 DNA 영역에 삽입된 후에 발현시킴으로써, 그 발광 강도로부터 1개의 알렐에 가시화 마커 유전자가 도입되었는지, 복수의 알렐에 가시화 마커 유전자가 도입되었는지를 판단할 수 있다. 특정의 DNA 영역에 가시화 마커 유전자가 삽입된 세포를 클로닝하는 것에 의해, 결실시키는 영역 중에 네거티브 선택 마커 유전자를 포함하는 세포를 얻을 수 있다. 혹은, 복수의 알렐에 대해서, 각각 서로 구별 가능한 고유의 선택 마커 유전자와 네거티브 선택 마커 유전자를 삽입하고, 당해 각각의 알렐에 짜넣어진 고유의 선택 마커의 발현을 지표로 하여 세포를 선택함으로써, 복수의 알렐에 네거티브 선택 마커 유전자가 짜넣어진 세포를 취득할 수 있다. 특정의 DNA 영역에의 유전자의 삽입은, 게놈 개변 시스템을 이용하여 당해 DNA 영역 중의 표적 서열을 절단하는 것과, 절단 부위의 상류와 상동 재조합 가능한 상류 호몰로지 암과 절단 부위의 하류와 상동 재조합 가능한 하류 호몰로지 암을 구비하고, 상류 호몰로지 암과 하류 호몰로지 암 사이에, 삽입하고 싶은 유전자를 포함하는 도너 DNA에 의한 HDR을 유발시키는 것에 의해 달성할 수 있다. 네거티브 선택 마커 유전자가 자살 유전자 등의 세포의 생존에 부의 영향을 주는 유전자인 경우에는, 클로닝한 후에, 각각의 클론에 자살 유전자를 발현시켜, 자살하는 세포는, 적어도 1개의 알렐에 네거티브 선택 마커 유전자가 도입된 세포이다. 다른 알렐에도 네거티브 선택 마커 유전자를 도입하는 경우에는, 다른 유도성 프로모터에 기능적으로(작동 가능하게) 연결하고, 다른 알렐에 네거티브 선택 마커 유전자를 도입하여, 당해 프로모터를 구동했을 경우에도 세포가 사멸하지 않는 것을 확인하면 된다. 세포는, 2배 체세포, 바람직하게는 1배 체세포를 이용할 수 있다. 어세이계의 간편성의 관점에서, 1배체의 세포로서는, 예를 들어, HAP1 세포를 이용할 수 있다.
상기 (β)에서는, 상기 (α)에 있어서 네거티브 선택용 마커 유전자가 삽입된 DNA 영역을 끼우도록, 2개소의 표적 서열을 결정하고, 이것을 서열 특이적으로 절단할 수 있는 서열 특이적 핵산 절단 분자를 설계할 수 있다. 게놈 DNA에 서열 특이적 핵산 절단 분자를 작용시키면, 2개소의 표적 서열 사이의 DNA 영역이 게놈 DNA로부터 결실된다. 2개소의 표적 서열 사이의 DNA 영역은, 네거티브 선택용 마커 유전자를 포함하기 때문에, 상기 결실에 의해, 네거티브 선택용 마커 유전자도 함께 결실된다.
상기 (γ)에서는, 상기 (β)에 의해 얻어진, 2개소의 표적 서열 사이의 DNA 영역의 결실을 갖는 세포를 선택한다. 2개소의 표적 서열 사이의 DNA 영역의 결실을 갖는 세포는, 전술한 바와 같이 네거티브 선택용 마커 유전자를 갖지 않는다. 따라서, 네거티브 선택용 마커 유전자가 유도되는 조건하에서 세포를 유지해도, 네거티브 선택용 마커 유전자는 발현되는 경우가 없다. 따라서, 네거티브 선택용 마커 유전자가 유도되는 조건하에서, 세포를 유지하고, 네거티브 선택용 마커 유전자가 발현하지 않는 것을 지표로 하여, 2개소의 표적 서열 사이의 DNA 영역의 결실을 갖는 세포를 선택할 수 있다. 네거티브 선택용 마커 유전자가, 세포를 사멸시키는 유전자(자살 유전자)인 경우에는, 이들 유전자는, 유도성 프로모터에 작동 가능하게 연결되어 있어도 되고, 당해 유도성 프로모터에 대해서 유도 인자를 작용시켜 네거티브 선택용 마커 유전자의 발현을 유도하고, DNA 영역의 결실을 갖지 않는 세포를 제거할 수 있다. 네거티브 선택용 마커 유전자가, 가시화 마커 유전자인 경우에는, 가시화 마커 유전자가 발현하고 있는 것을 지표로 하여, DNA 영역의 결실을 갖지 않는 세포를 제거할 수 있다. 네거티브 선택용 마커 유전자가, 가시화 마커 유전자인 경우에는 또한, 가시화 마커 유전자가 발현하고 있지 않는 것을 지표로 하여, DNA 영역의 결실을 갖는 세포를 선택할 수도 있다.
<DNA 영역의 결손을 갖는 세포>
본 발명에 의하면, 전술한 본 발명의 방법에 의해, 표적 DNA 영역의 결실을 갖는 세포를 얻을 수 있다. 따라서, 본 발명에 의하면, 표적 DNA 영역의 결실을 갖는 세포가 제공된다. 본 발명에 의하면, 표적 DNA 영역이 세포의 생존에 필수인 유전자를 포함하고 있을 수 있다. 따라서, 본 발명에 의하면, 표적 DNA 영역의 결실을 갖는 세포로서, 표적 DNA 영역이 세포의 생존에 필수인 유전자를 포함하는 세포가 제공된다. 본 발명에 의하면, 표적 DNA 영역의 결실을 갖는 세포로서, 표적 DNA 영역이 세포의 생존에 필수인 유전자를 포함하는 세포는, 생존에 필수인 유전자가 이소적으로 삽입된 게놈 DNA를 가질 수 있다. 따라서, 본 발명에 의하면, 표적 DNA 영역의 결실을 갖는 세포로서, 표적 DNA 영역이 세포의 생존에 필수인 유전자를 포함하고, 당해 세포의 생존에 필수인 유전자가 이소적으로 삽입된 게놈 DNA를 갖는 세포가 제공된다. 이소적인 삽입 개소는, 특별히 한정되지 않지만, 다른 유전자가 존재하지 않는 영역일 수 있다. 상기 (a) 및 (α)에 있어서, 표적 DNA 영역의 결실을 갖는 세포로서, 표적 DNA 영역이 세포의 생존에 필수인 유전자를 포함하고, 당해 세포의 생존에 필수인 유전자가 이소적으로 삽입된 게놈 DNA를 갖는 세포를 세포로서 이용해도 된다. 이것에 의해, 상기 (b) 또는 (β)에 의해, 결실되는 DNA 영역을 더 확대할 수 있고, 다음의 세포의 생존 및/또는 증식을 제어하는 유전자(예를 들어, 세포의 생존 및/또는 증식을 정으로 제어하는 유전자, 예를 들어, 세포의 생존 및/또는 증식에 필수인 유전자)까지 결실을 넓힐 수 있다. 전술한 본 발명의 방법에 의해 얻어진 표적 DNA 영역의 결실을 갖는 세포는, 결실 전의 세포와 비교하여 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 또는 95% 이상의 증식률 또는 생존율을 가질 수 있다. 어느 태양에서는, 상기 표적 DNA 영역의 결실을 갖는 세포는, 원래의 게놈의 20% 이상, 30% 이상, 40% 이상, 50% 이상, 60% 이상, 70% 이상, 80% 이상 또는 90% 이상을 결실하고 있다.
<DNA 영역의 결손을 갖는 세포의 제조 방법>
상기 표적 DNA 영역의 결실을 갖는 세포는, 상기의 본 발명의 방법에 의해 제작할 수 있다. 따라서, 본 발명에 의하면, 표적 DNA 영역의 결실을 갖는 세포를 제조하는 방법으로서, 본 발명의 방법을 실시하는 것을 포함하는, 방법이 제공된다. DNA 영역의 결실을 갖는 세포는, 네거티브 선택용 마커 유전자를 갖지 않음으로써 선택된 것일 수 있다.
실시예
재료와 방법
세포 배양
HAP1 세포는, 5% CO2를 포함하는 분위기하, 37℃에서, 10%(v/v) 소 태아 혈청과 100U/mL 페니실린/스트렙토마이신을 보충한 이스코프 개변 덜베코 배지(IMDM)에서 배양했다. HCT116 세포는 맥코이 5A 배지를 사용한 것을 제외하고, 동일한 조건에서 배양했다.
과거의 대규모 실험에 기초하는 필수 유전자의 추정
HAP1 세포의 필수 유전자는, 이하의 2개의 기준으로 정의되었다: (1) 3개의 보고(OGEE 데이터베이스1, CRISPR 스크리닝2, Gene-trap 스크리닝3) 중 적어도 1개에서 필수라고 어노테이션되어 있는 것, (2) HAP1 세포에 있어서 전사되어 있는 것[Transcript per million>0; 데이터는 Human Protein Atlas(www.proteinatlas.org/humancell)로부터 입수할 수 있다].
플라스미드 구축
24개의 gRNA/Cas9 발현 플라스미드(gpHY001-pJS067)의 구축에 대해서는, CRISPRdirect 소프트웨어4를 이용하여 gRNA 서열을 설계했다. gRNA 올리고뉴클레오타이드(표 1)를 어닐링하고, 표준 프로토콜을 이용하여 직선화한 pX330(Addgene)에 라이게이션했다5.
Figure pct00001
라이게이션된 생성물은, DH5 alpha E. coli 세포에 형질 전환되고, 플라스미드는, 제조자의 프로토콜을 사용하여 EndoFree Plasmid mini Kit(Qiagen)를 사용하여 정제되었다.
pHY262는, pWZ267 벡터6에, IRES-puro 카세트와, pJS050에서 표적으로 하는 sgRNA(sg-A) 사이트라고 불리는 서열을 IRES-puro 카세트의 5'UTR에 삽입하는 것에 의해 구축되었다. pHY262는, TransforMaxTM EPI300TM 대장균(Epicentre)에 형질 전환되었다.
pHY263은, pGEM(상표)-T Easy Vector(Promega)에 IRES-GFP-2A-Puro 카세트를 삽입하여 구축했다.
pHY271(티미딘 키나제 네거티브 셀렉션 마커)은, 표 2-1 및 2-2에 나타내는 증폭 산물을 깁슨 어셈블리를 이용하여 결합하여 구축했다. 깁슨 어셈블리 산물을 DH5 alpha E. coli 세포에 형질 전환했다. 플라스미드는, EndoFree Plasmid Midi Kit(Qiagen)를 이용하여, 제조자의 프로토콜을 이용하여 정제했다.
[표 2-1]
Figure pct00002
[표 2-2]
Figure pct00003
pHY269(RBMX2 유전자자리 클로닝) 및 pHY270(MMGT1 유전자자리 클로닝)을 구축했다. pHY262(∼100ng)를 BamHI 및 EcoRI(New England Biolabs)에 의해 직쇄화하고, 전사 개시 부위의 상류의 3kb 영역 및 폴리아데닐화 부위의 하류의 3kb 영역을 포함하는 RBMX2 또는 MMGT1 유전자자리를 커버하는 ∼100ng의 게놈의 증폭 산물(보충표 6)과 함께 효모에 공형질 전환했다. 각 프래그먼트는, ∼300bp의 오버랩을 갖는다. 효모의 형질 전환은, 앞서 기재된 프로토콜에 따라 행했다7. 플라스미드를 효모 콜로니로부터 추출하고, 상기의 프로토콜에 따라, TransforMaxTM EPI300TM 대장균(Epicentre)에 회수했다8. 대장균을 CopyControlTM Induction Solution(Epicentre)을 이용하여 LB에서 배양하고, 제조자의 프로토콜을 이용하여 EndoFree Plasmid Midi Kit(Qiagen)를 이용하여 플라스미드를 정제했다. 구축한 플라스미드를 확인하기 위해서, 정제한 플라스미드를 적절한 제한 효소로 소화하고, 아가로스 겔 전기 영동으로 분리했다.
트랜스펙션
HAP1 세포를 12웰 플레이트에 6×105세포/웰의 밀도로 파종하고, 하룻밤 인큐베이트했다. 1.5μg의 DNA를 포함하는 2.5M CaCl2를 50μL 조제하고, 2×BBS 버퍼(400mM 붕산, 300mM NaCl, 5mM EDTA) 50μL와 혼합했다. 이 용액을 25℃에서 5분간 인큐베이트한 후, IMDM 1mL와 혼합하고, 세포 배양물에 첨가하고 4∼8시간 인큐베이트했다. 그 후, 배지를 흡인하고, 세포를 D-PBS(나카라이 테스크, #14249-24)로 2회 세정했다. 그 후, 신선한 IMDM 배지를 가하고, 37℃, 5% CO2에서 인큐베이트했다. HCT116 세포를 12웰 플레이트에 3×105세포/웰의 밀도로 파종하고, 하룻밤 인큐베이트했다. FuGENE(상표) HD(Promega) 트랜스펙션은, 제조자의 지시서에 따라, 3:1의 비율로 행했다(1웰당, FuGENE(상표) HD 3μL Transfection Reagent: 900ng DNA).
디지털 정션 PCR
각 표적 영역에 대해, 48회의 반응을 네스트 PCR 형식으로 행했다. 1회째의 PCR에서는 1반응당 100게놈(반수체 인간 세포의 경우는 3.3pg의 게놈 DNA)을 사용하고, 2번째의 PCR에서는 2×Quick Taq HS DyeMix(도요보)와 표 3-1 및 3-2에 기재된 프라이머를 이용하여, 1회째의 PCR 혼합물의 1/100 희석액을 주형으로서 사용했다. 결실 효율(λ)은, 포아송 통계학을 이용하여 계산했다: λ=-ln(1-p){여기에서, λ는 100게놈 중의 결실 정션부를 가지는 게놈의 평균수이며, p는 48회의 PCR에 있어서의 양성 반응의 비율이다}9.
[표 3-1]
Figure pct00004
[표 3-2]
Figure pct00005
6-TG 선택 후의 생존 콜로니의 단리
gRNA/Cas9 발현 벡터를 HAP1 세포에 트랜스펙션한 후, ∼2,000개의 세포를 트립신 처리하고 10cm 디시에 재파종하고, 5μM 6-싸이오구아닌(6-TG)(Sigma, A4882-100MG)에서 12일간 배양했다. 그 후, 10cm 디시 상의 독립된 콜로니를 픽업하고, 24웰 플레이트의 각 웰에 따로따로 전개했다. 그 다음에, 세포의 일부를 게놈 DNA의 단리를 위해서 12웰 플레이트 중에서 전개하고, 나머지를 개개의 클론의 추가적인 분석을 위해서 동결 스톡으로 했다.
6-TG 선택 후의 콜로니 형성 어세이
gRNA/Cas9 발현 벡터를 HAP1 또는 HCT116에 트랜스펙션한 후, ∼5×104개의 세포를 트립신 처리하고 6cm 디시에 재파종하고, 5μM 6-TG(Sigma, A4882-100MG)에서 9일간 배양했다. 그 후, 6cm 디시로부터 배지를 제거하고, EtBr 용액(10mg/mL 에티듐 브로마이드(나카라이 테스크) 50% 에탄올 중 0.5%)을 가하고, 실온에서 30초간 인큐베이트했다. EtBr 용액을 제거하고, 콜로니를 UV 일루미네이터로 가시화했다10. 염색된 콜로니의 수와 크기는, 각각 ImageJ 소프트웨어의 「find maxima」와 「analysis particle」 함수를 사용하여 정량했다.
게놈 DNA 추출
12웰 플레이트에서 배양한 세포를 1.5mL의 튜브에 채취하고, 118μL의 브레이킹 버퍼(10mM Tris-HCl(pH8.0), 100mM NaCl, 0.04%(w/v) SDS, 0.2mg/mL 프로테이나제 K(와코), 2.5mg/mL RNasA(닛폰진))에 재현탁하고, 37℃에서 ∼18시간 인큐베이트했다. 페놀/클로로폼/아이소아밀 알코올(25:24:1)의 1체적을 첨가하고, 60rpm으로 30분간 회전시켰다. 12,000rpm으로 10분간 원심분리한 후, 상층 수층을 신선한 튜브로 옮기고, 절대 아이소프로판올 1체적을 첨가했다. 13,000rpm으로 5분간 원심분리한 후, 펠릿을 300μL의 70% 에탄올로 세정하고, 풍건했다. 게놈 DNA를 100μL의 TE 완충액에 용해하고, -20℃에서 보존했다.
결실 정션부의 검출과 서열 결정
2×Quick Taq HS DyeMix(도요보)와 보충표 5에 기재된 PCR 프라이머를 이용하여, 추출한 게놈 DNA로부터, 네스트 PCR 형식에서 결실을 갖는 정션부(결실 정션부; deletion junction)를 증폭했다. ABI PRISM BigDye Terminator Cycle Sequencing kit(Applied Biosystems사)를 이용하여, ABI 3100 DNA 시퀸서를 이용하여 전체 PCR 산물의 염기 서열을 결정했다(도 1d).
결실 클론 중의 유전자 결실의 검출
유전자 결실의 검출은, 추출한 게놈 DNA를 2x Quick Taq HS DyeMix(도요보)와 표 4-1 및 4-2에 기재된 PCR 프라이머를 이용하여 증폭하고, 결실해야 할 유전자가 게놈 상으로부터 결실된 것을 확인하기 위해서, 네스트 PCR 형식으로 행했다. 얻어진 PCR 산물을 1% 아가로스 겔 전기 영동에 의해 해석했다(도 3a).
[표 4-1]
Figure pct00006
[표 4-2]
Figure pct00007
성장 속도의 해석
각 HAP1 결실 클론 또는 WT 클론을 hHY224(IRES-GFP-2A-Puro 카세트를 HAP1 세포의 GAPDH 유전자자리의 3'UTR에 짜넣었다)와 혼합하고, IMDM 배지에서 배양했다. 2일간 배양한 후, 세포를 「day_0」샘플로서 회수하고, 나머지의 세포를 추가로 16일간 배양하여 「day_16」샘플로서 회수했다. GFP 양성 세포와 음성 세포를 플로 사이토메트리로 측정했다. 결실 클론 중의 GFP 음성 세포의 비율을 WT 클론 중의 GFP 음성 세포의 비율로 나누어 상대 집단을 산출했다. 플로 사이토메트리 해석은, EC800 플로 사이토메트리 애널라이저(소니 바이오 테크놀러지사제)를 이용하여 행했다.
마이크로어레이 해석
RNeasy Mini RNA isolation kit(Qiagen)를 이용하여 HAP1 세포로부터 Total RNA를 추출했다. 마이크로어레이 해석은, SurePrint G3 Human GE 8x60K Microarray(아질런트)를 이용하여 행했다. 데이터 해석은, Agilent Feature Extraction Software(Agilent)를 이용하여 행했다. 데이터의 플롯에는, 모든 야생형 클론 또는 결실 클론에 있어서 시그널 평가 스코어=2를 갖는 유전자만을 선택했다. P치<0.05, 2배 변화>1을 유의로 간주했다.
필수 게놈 유전자자리 또는 IRES-GFP-2A-Puro 카세트의 GAPDH 유전자자리에의 이식
pHY269(RBMX2 유전자자리 클로닝), pHY270(MMGT1 유전자자리 클로닝), 또는 pHY263(hHY224 세포를 만들기 위한 IRES-GFP-2A-Puro 카세트 부가 플라스미드)을, pJS039(GAPDH 영역의 3'UTR을 표적으로 하는 gRNA 발현 벡터) 및 pJS050(pHY262의 sgRNA(sg-A) 부위를 표적으로 하는 gRNA 발현 벡터)을 이용하여, HAP1 세포에 공트랜스펙션했다. 트랜스펙션 후 2일째에, 세포를 1ng/ml의 퓨로마이신을 첨가한 IMDM 배지로 ∼10일간 배양했다. HAP1 세포의 일부의 집단은 2배체가 되기 때문에, SH800Z(소니 바이오)를 이용하여 하프로이드 집단만을 채취했다. 하프로이드 세포는, 장기 보존을 위해서 세포를 동결 보존하기 전에, 확대 배양하여 7일간 배양했다. 세포주를 해동하고, 통상의 배지에서 5일간 배양한 후, MEGES를 적용했다.
TK 마커의 HCT116 게놈에의 통합
pHY271을 pJS067(OCRL 영역의 하류를 표적으로 한 gRNA 발현 벡터) 및 pJS050(pHY271의 sg-A 부위를 표적으로 한 gRNA 발현 벡터)을 이용하여 HCT116에 공트랜스펙션했다. 2일간의 트랜스펙션 후, 세포를 맥코이 5A 배지(10% FBS, 1% 페니실린/스트렙토마이신, 1ng/L 퓨로마이신) 중에서 ∼10일간 배양했다. 단일 콜로니를 확대하고, 세포를 장기 보존을 위해서 동결 보존하기 전에, 다른 7일간 배양했다. 마커의 통합을, HY2223 및 HY2224 프라이머를 이용한 PCR에 의해 시험했다(보충표 1). 세포 스톡을 해동하고, MEGES를 적용하기 전에, 통상의 배지에서 7일간 배양했다.
DNA 함유량의 분석
2×106세포를 4% PFA/PBS의 1mL에 현탁하고, 4℃에서 10분간 인큐베이트했다. 그 후, 세포를 500g로 3분간 스핀 다운시켰다. 세포 펠릿을 70% EtOH에 재현탁하고, -20℃에서 보존했다. PI 염색은, 세포를 500g로 3분간 스핀 다운하고, 500μL의 PI 용액(D-PBS(나카라이 테스크), 50μg/mL 아이오딘화 프로피듐(와코), 0.25mg/mL RNaseA(닛폰진))에 재현탁한 후, 37℃에서 10분간 인큐베이트했다. 플로 사이토메트리 해석은 EC800 플로 사이토메트리 애널라이저(소니 바이오)로 행했다.
정량적 RT-qPCR
RNeasy Mini RNA isolation kit(Qiagen)를 이용하여 HAP1 세포로부터 Total RNA를 추출했다. 400ng의 RNA를 PrimeScript RT Reagent Kit with gDNA eraser(다카라)를 이용하여 역전사했다. 정량 PCR은 TB Green(상표) Premix Ex TaqTM(다카라)를 이용하여 행했다. 각 데이터 포인트는, 중복해서 행한 3개의 독립된 실험의 평균치이다. 유전자 발현 레벨의 격차를 정규화하기 위해서, ACTB mRNA를 내부 컨트롤로서 사용했다. 프라이머 서열을 표 5에 나타낸다.
Figure pct00008
[결과]
게놈의 대규모 결실을 위한 방법론의 개발
이 실험 플랫폼의 개념을 실증하기 위해서, 인간 세포주 HAP1의 하이포잔틴 포스포리보실 트랜스페라제 1(HPRT1) 유전자를 포함하는 염색체 X 상의 게놈 영역을 결실시키는 것을 시도했다(도 1b). HPRT1은, Online GEne Essentiality(OGEE)의 데이터베이스[REF]에 기초하여 특정의 인간 세포에 있어서 필수 유전자로서 동정 되었지만, 6-TG(Nature Reviews Genetics, 6, 507-512 (2005))와의 네거티브인 선택 마커로서 확립되어 있다. 이와 같은 경우, HAP1 세포도 마찬가지라고 한다면, HPRT1을 네거티브 셀렉션 마커로서 사용할 수 없다. Blomen's gene trapping3이나 Mair's CRISPR screening2에 의한 HAP1 세포의 기능 저하 스크리닝에서는, HPRT1은 HAP1 세포의 증식에는 불필요함이 나타나 있었지만, 우리가 개발한 페어의 gRNA(예를 들어, 도 1a에 나타나는 gRNA L 및 gRNA R)에 의한 결실은, 유전자 녹아웃과는 상이한 방법이며, 상이한 결과를 가져올 가능성이 있다. 그래서, HPRT1을 포함하는 0.51Mb의 영역이 필수인지 여부를 조사하기 위해서, 페어의 gRNA를 이용한 어프로치를 행했다. HAP1 세포에 페어형 gRNA(R1과 L1)를 도입한 2일 후에, 세포의 일부를 채취하고, 정션 PCR을 행했다. 템플릿으로서 ∼100의 게놈을 포함하는 48의 PCR 반응 중, 14의 반응은 증폭을 일으키게 하고, 트랜스펙트된 HAP1 세포의 ∼0.3%가, 임의의 증식 효과가 생긴 후에 R1과 L1 절단 부위 사이의 표적 결실을 갖고 있었음을 나타냈다. gRNA R1에만 의한 네거티브 컨트롤에서는, 48의 반응의 어느 것에 있어서도 증폭은 일어나지 않았지만, 이것은 0.51Mb의 영역이 흠이 없었기 때문에, 정션 PCR로 증폭하기에는 지나치게 길었기 때문이라고 설명된다. 이와 같이 하여, 후속하는 6-TG 선택은, 생존 세포 콜로니의 수에 유의한 차이를 줄 것이 예상되었다(도 1c). 상기 공정에 의해 HPRT1을 포함하는 11의 유전자와 그 중의 0.51Mb 내의 비유전적 영역을 제거할 수 있었다. 또한, 페어의 gRNA 절단 및 6-TG 선택 후에 생존한 3클론으로부터 추출한 게놈 DNA의 염기 서열을 해석한 바, 표적 영역이 분명하게 유전자자리로부터 결실되고 있음이 확인되었다(도 1 d). HPRT1-6-TG 네거티브 선택을 이용한 우리의 플랫폼이, 우리가 표적으로 하는 비필수 영역을 결실한 HAP1 세포 클론을 얻는 데 유용하다는 것이 검증되었다.
게놈 필수 영역 검출을 위한 결실 유전자자리의 확대
다음에, HPRT1로부터 결실된 영역을 센트로미어 방향과 텔로미어 방향의 양쪽으로 확대하여, 우리의 플랫폼이 본질적인 유전자 영역 및/또는 유전자간 영역의 동정에 사용할 수 있는지 여부를 검토했다(도 2). OGEE 데이터베이스에 기초하여, 센트로미어 방향의 HPRT1로부터의 최초의 필수 유전자 후보는 ARHGAP36이며, 이들 사이에는 22의 잠재적으로 비필수 유전자 영역과 그 사이에 개재하는 논코딩 영역(도 2b의 gRNA L1 사이트와 L2 사이트 사이의 3.12Mb의 영역에 상당)이 존재한다. 다음의 필수 유전자 후보는 RBMX2이다. ARHGAP36과 RBMX2 사이(도 2b의 gRNA L3 사이트와 L4 사이트 사이의 0.62Mb 영역에 대응)에는, 3개의 비필수 유전자 후보가 존재하고, 대부분은 유전자간 영역이다. 여기에서는, gRNA L1과 L5 사이의 약 4Mb의 영역을 4개의 섹션(2개의 필수 유전자 후보 영역과 2개의 비필수 유전자 후보 클러스터)으로 분리하고, 우리의 플랫폼을 적용하여, 필수 유전자 후보 및/또는 광대한 유전자간 영역의 어느 것이 HAP1의 성장에 필수인지 여부를 검토했다(도 2b).
2일째의 디지털 정션 PCR에서는, L1, L2, L3, L4, L5의 각각과 R1의 5개의 상이한 gRNA 페어에 의해, 표적 영역의 결실이 동등한 효율(0.3-1.1%)로 달성됨이 확인되었다. 주목해야 할 것은, 6-TG 선택 후, 5개의 gRNA쌍 중 4개의 gRNA쌍에서 수백개의 콜로니가 형성되었지만, L4/L5 사이의 영역을 결실시키면, 생존 세포가 극단적으로 없어진 것이다. 이 데이터는, L4와 L5의 gRNA 표적 부위 사이에 존재하는 RBMX2 유전자가 HAP1의 정상적인 증식에 중요하고, 그 사이에 있는 영역은 결실되어 있음을 분명하게 한다. 이 결과는 또한, Blomen의 유전자 트랩3이나 Mair의 CRISPR 스크리닝2에 의한 기능 저하 스크리닝과 일치하고 있고, RBMX2 유전자자리에는 필수 요소가 포함되어 있지만, ARHGAP36은 HAP1 세포에는 존재하지 않음이 시사되고 있다. 그러나, 이들 종래의 LOF 스크리닝에서는, 1개의 유전자의 본질성만을 한 번에 평가할 수 있는 데 반해, 우리의 플랫폼은, RBMX2를 포함하는 Mb 스케일의 게놈 영역 전체, 다른 38의 유전자, 그리고 대규모 유전자간 영역의 분산성에 관한 새로운 정보를 제공하고 있다. 이와 같은 스케일러빌리티의 높이로부터, 우리의 플랫폼은 MEGES라고 명명되었다.
텔로미어 방향에의 결실의 확대를 계속해서 행했다(도 2c). 최초의 OGEE에 의해 지지되는 필수 유전자 후보는 SMIM10이며, 지금까지 HAP1 세포에서는 필수성이 미검증이었다. 그 다음의 OGEE 후보인 MMGT1은 Mair의 CRISPR 스크리닝으로 HAP1 세포에서는 필수임이 시사되었지만, Biomen의 유전자 트랩에서는 비필수임이 시사되었다. HPRT1와 MMGT1 사이의 1.1Mb의 영역(gRNA R1과 R4 사이트 사이)에도 30의 비필수 유전자 후보와 그 유전자간 서열이 있음에 주의해야 한다. MEGES는, R2, R3, R4 및 R5의 각각과 L4의 5개의 상이한 gRNA쌍을 이용하여, 결실을 유도했다. 그 2일째에 디지털 정션 PCR에 의해 검증된 바와 같이, 모든 표적 영역의 효율적인 결실을 유도했다. MMGT1은 필수이지만, SMIM10을 포함하는 gRNA의 L4와 R4 부위 사이의 5.48Mb 영역 전체가, HAP1 세포의 성장에의 큰 영향 없이 결실 가능함이 나타났다.
L4-R4 결실 클론의 특성 평가
R4와 L4의 페어링 gRNA를 이용하여 MEGES 후에 싱글 클론 전개하여 얻어진 4종류의 HAP1 세포 클론(hHY131, 145, 148, 149; L4-R4 결실 클론)을 분석했다. 얻어진 클론이 프로피듐 아이오다이드 염색을 이용한 플로 사이토메트리를 이용하여 하프로이드인 것을 확인했다16. 우선, 결실 영역 내에 위치하는 개개의 유전자자리에 대해서 PCR 제노타이핑을 행했다. 페어의 gRNA에 의해 절단된 게놈 단편은, 상이한 염색체 부위에 랜덤하게 통합되고 있는 것은 아닌가 추측되고, 이 영역 내의 필수 유전자가 비필수 유전자라고 판단될 가능성도 있을 것이다. gRNA의 R4 부위와 L4 부위 사이에는 69개의 어노테이션 유전자가 존재하지만, 많은 유전자가 중복되어 있거나, 혹은 매우 가까운 위치에 존재한다. 그래서, L4-R4 결실 클론으로부터 추출한 게놈 DNA를 이용하여, 69개의 유전자자리를 모두 커버할 수 있는 39개의 유전자자리에 대해서 제노타이핑 PCR을 행했다. 도 3a에 나타내는 바와 같이, 시험한 유전자자리를 모두 유지하고 있던 오리지날 HAP1의 2개의 클론(hHY153, 154)과 비교하여, L4-R4 결실 클론은, 그 게놈으로부터 시험한 유전자자리를 모두 결실하고 있음을 알 수 있었다.
Figure pct00009
표 6에 나타나는 데이터는, 도 2에 나타나는 클론의 유전자형을 분석하는 것에 의해 얻어졌다. 소망의 유전자 결손을 갖는 세포 클론을 결실을 갖는 세포수로 하여 계수했다.
또한, 69유전자 결실이 트랜스크립톰에 미치는 영향을 평가한다(도 3b). 이 트랜스크립톰 해석에서는, RBMX2와 MMGT1은, 인접하는 5.5Mb 영역의 결실에 의한 전사 레벨의 변화가 거의 없어[도 3c], 이 결실 영역에 이들 유전자의 원위의 시스 조절 요소가 존재하지 않음이 나타났다.
필수 요소의 염색체간 이식
RBMX2 유전자와 MMGT1 유전자는, 원위의 시스 제어 요소가 없으면, 세균이나 효모의 유전자의 대부분이 게놈의 설계 및 합성에 있어서 그랬듯이, 컴팩트하여 독립된 유전자 유닛으로서 취급할 수 있을 것이다. 이것을 검증하기 위해서, 양 유전자를 상이한 염색체 위치에 이식하는 것을 시도했다. BAC-YAC 벡터를 이용하여, 전사 개시 부위의 상류의 ∼3kbp 영역과 폴리아데닐화(pA) 부위의 하류의 ∼3kbp 영역을 포함하는 유전자 영역 전체(「레스큐 카세트」)를 클로닝했다[도 4a]. 폐환형 pHY262 벡터 상에서는, IRES 서열과 pA 시그널 사이에 퓨로마이신 N-아세틸 트랜스페라제(PNAT)의 코딩 서열이 존재한다. 결과로서 얻어진 레스큐 벡터를 HAP1에 트랜스펙트하면, gRNA/Cas9의 2개의 상이한 벡터가 공트랜스펙트된다; 1개는, 12번 염색체 상의 GAPDH 유전자의 3'UTR에 표적화된 gRNA이며, 다른 1개는, 레스큐 유전자자리 벡터 상의 IRES 서열의 바로 외측에 표적화된 것이다15. 퓨로마이신 선택에 의해, IRES-Puro-pA+레스큐 카세트가 GAPDH 유전자자리에 통합된 세포를 얻을 수 있다. 리얼타임 RT-PCR에 의해, 얻어진 세포 클론은, RBMX2 또는 MMGT1의 mRNA 레벨이 1.5∼2.0배로 증가하고 있음이 실증되었다[도 4b]. 계속해서, X 염색체의 내인성 유전자자리로부터 RBMX2 또는 MMGT1 유전자를 결실시키는 MEGES를 행한 바, 동등한 gRNA를 개재시킨 결실 효율에서, 이식 세포는 보다 많은 생존 세포 콜로니를 나타냈다[도 4c]. 이들 데이터로부터, 양 유전자자리는 내인성이 아닌 염색체 부위에의 이식이 가능하고, 필수 유전자로서의 역할을 하고 있음이 분명해졌다. 또한, 상류와 하류의 3kb의 영역은, 정상적인 세포 증식에 충분한 레벨로 양 유전자를 발현시키는 데 충분하다는 것이 분명해졌다. 특히, 염색체간에 필수 유전자를 이식함으로써, MEGES는 HPRT1 유전자자리의 게놈을 추가로 결실시켜, 다음의 필수 유전자 후보에 도달할 수 있었다[도 5].
비HPRT1 유전자자리에서의 MEGES
MEGES의 범위를 넓히기 위해서, 다른 네거티브 셀렉션 마커를 이용하여, 상이한 인간 세포주 HCT116에 있어서, HPRT1 유전자자리 이외의 게놈 영역을 결실시키는 시험을 행했다. 대장암의 남성 환자로부터 수립된 HCT116 세포는, X 염색체가 1개이기 때문에, HPRT1 유전자자리는 1개이다. 단순 헤르페스 바이러스 티미딘 키나제(TK) 발현 카세트는, TK를 코딩하는 서열에 이어서, 2A 펩타이드를 끼운 PNAT를 포함하고, 이들은 CMV 프로모터와 SV40 pA 시그널에 의해 발현된다[도 6a]. TK발현 카세트를 포함하는 플라스미드를 gRNA/Cas9의 2개의 상이한 벡터와 공트랜스펙트했을 때, 1개의 gRNA는 염색체 X 상의 HCT116의 비필수 유전자 OCRL(Nucleic Acid Research, 2020, doi: 10.1093/nar/gkaa884)의 3'UTR에 표적화되고, 다른 1개의 gRNA는 TK 발현 카세트 벡터 상의 CMV 프로모터의 바로 상류에 표적화되었다15. 퓨로마이신 내성을 위해서 선택된 세포는, 정션 PCR에 의해, 표적이 된 OCRL 유전자자리에 TK 발현 카세트를 가짐이 확인되었다[도 6a 및 6b]. 다음에, 이들 세포를 MEGES에 사용했다. 5개의 gRNA쌍(R9와의 쌍에서는 L8, L9, L10, L11 또는 L12)은 모두, 2일째에 정션 디지털 PCR에 의해 측정된 0.3∼1.2의 결실 효율에 의해 나타나는 바와 같이, OCRL 유전자자리를 포함하는 게놈 영역을 효율적으로 결실시켰다[도 6c]. TK가 게놈 중에 존재하여, 세포 내에서 발현하고 있는 경우에 세포 증식 장애를 유발하는 간시클로비르 선택은, L12와 R9의 쌍을 제외한 모든 gRNA쌍에서 유의하게 많은 콜로니를 발생시켜, L11과 L12의 gRNA 표적 부위 사이의 영역이 세포 증식에 중요한 요소를 포함하고 있음을 시사했다. 이와 같이, MEGES의 기본 전략은, 상이한 선택 마커와 상이한 인간 세포를 이용함으로써, 어떠한 염색체 부위에도 적용 가능함이 증명되었다.
부의 선택을 하지 않는 MEGES
지금까지, 세포 증식에 중요한 게놈 영역의 스크리닝이나 동정, 더욱이 메가 베이스 페어 스케일에서의 표적 게놈 영역의 결실을 갖는 세포 클론의 단리를 행하여, 표적 영역의 기능적 의의를 더 분명히 하기 위해서, MEGES의 유용성과 이점을 실증해 왔다. 그러나, 필수 영역만을 스크리닝하는 경우에는, 사전에 네거티브 셀렉션 마커를 통합할 필요가 있고, 또한, 네거티브 셀렉션을 이용한 콜로니 형성 어세이는 스루풋이 낮다고 하는 문제가 있었다. 그래서 우리는, 네거티브 선택 대신에, 복수의 시점에서의 디지털 정션 PCR을 포함하는 MEGES의 개량판을 고안했다. 결실된 영역이 세포 증식에 불가결하거나, 또는 중요한 경우, 결실된 영역을 가지는 세포의 비율은, 세포 배양이 진행됨에 따라 감소한다. 이 비율의 변화는, gRNA/Cas9 트랜스펙션 후, 복수의 타임 포인트에서 디지털 정션 PCR을 이용하여 결정한 결실 효율을 비교함으로써 평가할 수 있다. 이 전략을 디지털 정션 PCR 베이스의 MEGES(dMEGES)라고 부른다. 그 개념을 실증하기 위해서, 우리는 dMEGES를 HPRT1 유전자자리에 적용했다(도 7). 우리는, 2개의 gRNA 페어(R1-L4와 R1-L5)에 의한 절단 후, 2일째와 17일째에 디지털 정션 PCR을 실행하여, 기대되는 결과를 실증했다. R1-L4가 절단된 세포의 비율은 2일째에서 17일째에 걸쳐 거의 변화하지 않았지만(1.8%로부터 2.0%), R1-L5가 절단된 세포의 비율은 1.0%로부터 0.2%로 큰폭으로 감소하고 있었다. 여기에서, RBMX2 유전자자리의 내측을 절단하는 R1과 L13의 다른 gRNA쌍 개렬을 시험한 바, R1-L5의 개렬은 1.0%로부터 0.2%까지 유의하게 감소했다. 이것도 또한, 결실을 갖는 세포 집단의 유의한 감소를 가져왔다(2.1%로부터 0.6%). 이들 데이터는, 도 2b의 데이터와 일치하고 있어, R1과 L4 사이의 4.35Mb의 영역은 세포 증식에 영향을 주지 않고 결실시킬 수 있었지만, R1-L5의 영역은 RBMX2의 본질적인 영역이기 때문에 결실시킬 수 없었음이 나타나 있다.
추가로 X 염색체에 대해서 22영역 각각의 결실을 갖는 세포 집단을 작성하여 마찬가지로 분석했다(도 8). 그 결과, 도 8에 나타나는 바와 같이, 영역 7 및 영역 16의 결실은 세포의 증식 또는 생존에 필수일 가능성이 분명해졌다. 또한, 영역 1, 9∼15, 및 17∼19는, 세포의 증식 또는 생존에 정으로 영향을 주는 유전자를 포함할 가능성이 분명해졌다. 지금까지의 CRISPR 스크리닝에서는, 생존에 필수는 아니라고 여겨져 온 22영역의 결실이었지만, 본 발명에 의하면 감도 높게 필수인 염색체 영역을 결정할 수 있었다.
이와 같이 하여 본원 발명에서는, 네거티브 선택 마커를 사전에 도입하지 않고 MEGES를 실시할 수 있고, 이 경우에는, MEGES에 의해 대규모 게놈 결실을 일으키게 할 수 있으며, 게다가, 세포의 생존에 필수적인 유전자가 존재하는 영역을 결정할 수 있다. 생존에 필수적인 유전자가 결정되었을 경우에는, 이것을 다른 염색체 상에 통합하여, 추가로 게놈의 결실을 확장할 수도 있을 것이다. dMEGES는, 세포의 생존에 필수적인 유전자를 특정하는 것, 및/또는, 게놈의 대규모 결실에 유용한 기술일 수 있다.
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
SEQUENCE LISTING <110> Logomix, Inc. <120> Method of inducing large deletion in genomic DNA and method of analyzing the deletion <130> PL19-9002WO <150> JP 2020-216271 <151> 2020-12-25 <160> 388 <170> PatentIn version 3.5 <210> 1 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L1 forward primer <400> 1 caccgaataa ttgtgtagtt aagtc 25 <210> 2 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L1 reverse primer <400> 2 aaacgactta actacacaat tattc 25 <210> 3 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L2 forward primer <400> 3 caccgttaat agcttgatat agcta 25 <210> 4 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L2 reverse primer <400> 4 aaactagcta tatcaagcta ttaac 25 <210> 5 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L3 formard primer <400> 5 caccggggag agattatgct ttacg 25 <210> 6 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L3 reverse primer <400> 6 aaaccgtaaa gcataatctc tcccc 25 <210> 7 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L4 forward primer <400> 7 caccgttctc agcaattgtg cggtc 25 <210> 8 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L4 reverse primer <400> 8 aaacgaccgc acaattgctg agaac 25 <210> 9 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L5 forward primer <400> 9 caccgcatct agcactcccg gtaac 25 <210> 10 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L5 reverse primer <400> 10 aaacgttacc gggagtgcta gatgc 25 <210> 11 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L6 forward primer <400> 11 caccgttctc agcaattgtg cggtc 25 <210> 12 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L6 reverse primer <400> 12 aaacgaccgc acaattgctg agaac 25 <210> 13 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L7 forward primer <400> 13 caccgtgggg aagagctcac cgctc 25 <210> 14 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L7 reverse primer <400> 14 aaacgagcgg tgagctcttc cccac 25 <210> 15 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L8 forward primer <400> 15 caccgatccc cattactagc tcgaa 25 <210> 16 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L8 reverse primer <400> 16 aaacttcgag ctagtaatgg ggatc 25 <210> 17 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L9 forward primer <400> 17 caccgatttc tatgaacaca cgtag 25 <210> 18 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L9 reverse primer <400> 18 aaacctacgt gtgttcatag aaatc 25 <210> 19 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L10 forward primer <400> 19 caccggcatg gagtgaatac gactt 25 <210> 20 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L10 reverse primer <400> 20 aaacaagtcg tattcactcc atgcc 25 <210> 21 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L11 forward primer <400> 21 caccgcagag aaatgacgaa cgatt 25 <210> 22 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L11 reverser primer <400> 22 aaacaatcgt tcgtcatttc tctgc 25 <210> 23 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L12 forward primer <400> 23 caccgagcac atttgcaacg tcacg 25 <210> 24 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> L12 reverse primer <400> 24 aaaccgtgac gttgcaaatg tgctc 25 <210> 25 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R1 forward primer <400> 25 caccggacag cagtgagcgt agagt 25 <210> 26 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R1 reverse primer <400> 26 aaacactcta cgctcactgc tgtcc 25 <210> 27 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R2 forward primer <400> 27 caccgcactt gatgcattaa tgccg 25 <210> 28 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R2 reverse primer <400> 28 aaaccggcat taatgcatca agtgc 25 <210> 29 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R3 forward primer <400> 29 caccggaggg agaaacaggt ccgtt 25 <210> 30 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R3 reverse primer <400> 30 aaacaacgga cctgtttctc cctcc 25 <210> 31 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R4 forward primer <400> 31 caccgaacag aaaagtttac tgcga 25 <210> 32 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R4 reverse primer <400> 32 aaactcgcag taaacttttc tgttc 25 <210> 33 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R5 forward primer <400> 33 caccgttact agaaaatgtg aaacg 25 <210> 34 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R5 reverse primer <400> 34 aaaccgtttc acattttcta gtaac 25 <210> 35 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R6 forward primer <400> 35 caccgagaac agtgtgccag atcga 25 <210> 36 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R6 reverse primer <400> 36 aaactcgatc tggcacactg ttctc 25 <210> 37 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R7 forward primer <400> 37 caccgaagcc aactacaact acgga 25 <210> 38 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R7 reverse primer <400> 38 aaactccgta gttgtagttg gcttc 25 <210> 39 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R8 forward primer <400> 39 caccggctgt gctattaaga tgcgc 25 <210> 40 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R8 reverse primer <400> 40 aaacgcgcat cttaatagca cagcc 25 <210> 41 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R9 forward primer <400> 41 caccgccatg gactggaata gccgg 25 <210> 42 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> R9 reverse primer <400> 42 aaacccggct attccagtcc atggc 25 <210> 43 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> gRNA#1 forward primer <400> 43 caccgagccc cagcaagagc acaag 25 <210> 44 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> gRNA#1 reverse primer <400> 44 aaaccttgtg ctcttgctgg ggctc 25 <210> 45 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> gRNA#2 forward primer <400> 45 caccggagat cgagtgccgc atcac 25 <210> 46 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> gRNA#2 reverse primer <400> 46 aaacgtgatg cggcactcga tctcc 25 <210> 47 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> gRNA#3 forward primer <400> 47 caccggggac tgcagtcaag tcgaa 25 <210> 48 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> gRNA#3 reverse primer <400> 48 aaacttcgac ttgactgcag tcccc 25 <210> 49 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> HY1674 <400> 49 atatggccac aaccgccacc atgggtaccg tgagcaaggg 40 <210> 50 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> HY1675 <400> 50 gacgactgag cgcgggatct cttgtacagc tcgtccatgc c 41 <210> 51 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> JS214 <400> 51 gatcgagtgc cgcatcaccg gcaattgacg cgtgctcctc 40 <210> 52 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> HY1673 <400> 52 ggtggcggtt gtggccatat 20 <210> 53 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> JS210 <400> 53 aaactcatca atgtatctta attgcgttgc gctcactgcc 40 <210> 54 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> JS211 <400> 54 gtgatgcggc actcgatctc cctgatgcgg tattttctcc 40 <210> 55 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> HY2669 <400> 55 ccgcgctcag tcgtccaatt ctgccgtgga cggcaccgcc ggacccggct ccaccggatc 60 tcgcgagggc agaggaagtc ttct 84 <210> 56 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> JS218 <400> 56 taagatacat tgatgagttt ggacaaac 28 <210> 57 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> HY1498 <400> 57 gaatactcat tttagcttcc ttagctcctg aaaatctcg 39 <210> 58 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> HY1499 <400> 58 gcatcgcaaa ctgcacccgg tgccgggcag ccacatcca 39 <210> 59 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> HY1496 <400> 59 gcccgggcgc atgcgggccg gatcagacta tcagcgtgag 40 <210> 60 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> HY1497 <400> 60 ggaagctaaa atgagtattc aacatttccg tgt 33 <210> 61 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> HY1569 <400> 61 gtgggatcca gacttcgaat tcatgtcgaa agctacatat aagga 45 <210> 62 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> HY1570 <400> 62 tccggcccgc atgcgcccgg gccggccctg atgcggtatt ttctcctta 49 <210> 63 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> HY1567 <400> 63 aactcatcaa tgtatcttag cccctacaac aactaagaaa atgg 44 <210> 64 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> HY1568 <400> 64 gacatgaatt cgaagtctgg atcccactat ttataccatg ggagg 45 <210> 65 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> HY2670 <400> 65 atatggccac aaccgccacc atgaccgagt acaagc 36 <210> 66 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> HY1419 <400> 66 gctaagatac attgatgagt ttggaca 27 <210> 67 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> JS213 <400> 67 gtggcggttg tggccatatt atcatcgtgt ttttcaaagg 40 <210> 68 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HY1571 <400> 68 atcgtctttc cctcgctatc ac 22 <210> 69 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> HY1572 <400> 69 ccactattta taccatggga ggcg 24 <210> 70 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> HY1587 <400> 70 tcccatggta taaatagtgg ggcttataaa tgcagatcct ttac 44 <210> 71 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> HY1578 <400> 71 ctgccaagaa ggagaacaga g 21 <210> 72 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HY1579 <400> 72 aatacctctg ctgaacctac ca 22 <210> 73 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HY1580 <400> 73 gattgccttt gctcactaac ct 22 <210> 74 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HY1581 <400> 74 ggtcgtagtt tgctttcttt gtt 23 <210> 75 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HY1582 <400> 75 cctttggatt tcccagtttt ct 22 <210> 76 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HY1583 <400> 76 tggccttgaa ttagtctttg ct 22 <210> 77 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> HY1427 <400> 77 acgacgcatc tcaaattcac agcatttaaa aaacataatt attt 44 <210> 78 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> HY1428 <400> 78 gtgaatttga gatgcgtcgt aactattttt gtatctaaaa cttc 44 <210> 79 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> HY1429 <400> 79 gtgctagagc gagaaaggtt cgtgcaaaca atatccagga tatc 44 <210> 80 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> HY1430 <400> 80 gaacctttct cgctctagca cagtatgtat cctgaacttt ggtt 44 <210> 81 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HY1584 <400> 81 agccctaagt gtgtaactgg aa 22 <210> 82 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HY1585 <400> 82 caacaccgag tagcgtttga tt 22 <210> 83 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> HY1589 <400> 83 cttatatgta gctttcgaca tggcgggtga gcagcctcta at 42 <210> 84 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> HY1573 <400> 84 catgtcgaaa gctacatata agga 24 <210> 85 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HY1574 <400> 85 gcttcaaacc gctaacaata cc 22 <210> 86 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> HK1294 <400> 86 taagtacctt gggttcccac tatttatacc atgggaggcg tca 43 <210> 87 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> HK1295 <400> 87 atggtataaa tagtgggaac ccaaggtact tatttgaatg atacagtc 48 <210> 88 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> HK1296 <400> 88 gctgcgcagc ggaaaaggcg gcgtg 25 <210> 89 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HK1297 <400> 89 ctttcgcctc ttcgtttatg act 23 <210> 90 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HK1298 <400> 90 ccagttcttc tgttgttggt gtt 23 <210> 91 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HK1299 <400> 91 atgtaaggga aataaagcca aca 23 <210> 92 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HK1300 <400> 92 agagggatgg aaggagtgaa ag 22 <210> 93 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HK1301 <400> 93 gaggcaatga agaggtagag aga 23 <210> 94 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> HK1302 <400> 94 tcagagaaat gatgaaacaa gacag 25 <210> 95 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HK1303 <400> 95 atcactgcgt cgttaagatt tgt 23 <210> 96 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> HY1660 <400> 96 ggactatcct aagcaagcat tctttaggga gttacagaga ataatcacc 49 <210> 97 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HY1669 <400> 97 agaatgcttg cttaggatag tcc 23 <210> 98 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HY1670 <400> 98 agatattttc gagagcgcta gc 22 <210> 99 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> HY1663 <400> 99 gctagcgctc tcgaaaatat ctatgattgt ctcaccctgt ttttggt 47 <210> 100 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> HK1304 <400> 100 cttgccccca ctcccctttc taagaa 26 <210> 101 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> HK1305 <400> 101 gtagctttcg acatttaatg tacacacatt tttaaaaacc atttgggag 49 <210> 102 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> HK1306 <400> 102 ttttaaaaat gtgtgtacat taaatgtcga aagctacata taaggaa 47 <210> 103 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> HY2639 <400> 103 tcactgcccg ctttccagtc 20 <210> 104 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> HY2640 <400> 104 tgccggtgat gcggcactcg atctccctga tgcggtattt tctcc 45 <210> 105 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> HY2641 <400> 105 cgagtgccgc atcaccggca attgacgcgt gctcaattcg ataatcatat tgtgacgtac 60 gttaaagata 70 <210> 106 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> HY2642 <400> 106 cccctcgata tacagaccga taaaacacat gcgtcaattt tacacatgat tatctttaac 60 gtacgtcaca 70 <210> 107 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> HY2643 <400> 107 tcggtctgta tatcgagggg gcagagcgca catcgcccac agtcc 45 <210> 108 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> HY2644 <400> 108 gctggcgtgc tggtggcagg ggtagctggc catggtggcg ata 43 <210> 109 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> HY2645 <400> 109 gccagctacc cctgccacca gcacgccagc gccttcgacc aggc 44 <210> 110 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2646 <400> 110 tcctgctgtc ttctgggtct cagggcggtt cttctgttgc tgtggcctct gcttctggcg 60 gcctggtcga aggcgctggc 80 <210> 111 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2647 <400> 111 agacccagaa gacagcagga ggccaccgag gtgagactgg agcagaagat gcccaccctg 60 ctgagagtgt acatcgacgg 80 <210> 112 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2648 <400> 112 tctctgctgc ccagggccac cagcagctgg gtggtggtgg tcttgcccat gccgtggggg 60 ccgtcgatgt acactctcag 80 <210> 113 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2649 <400> 113 gtggccctgg gcagcagaga cgacatcgtg tacgtgcccg agcccatgac ctactggcag 60 gtgctgggcg ccagcgagac 80 <210> 114 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2650 <400> 114 tcgccggcgc tgatctcgcc ctggtccagt ctgtgctggg tggtgtagat gttggcgatg 60 gtctcgctgg cgcccagcac 80 <210> 115 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2651 <400> 115 ggcgagatca gcgccggcga cgccgccgtg gtgatgacca gcgcccagat caccatgggc 60 atgccctacg ccgtgaccga 80 <210> 116 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2652 <400> 116 gccgggggcg gggcgtggct gctgccggcc tcgccgccca cgtggggggc cagcacggcg 60 tcggtcacgg cgtagggcat 80 <210> 117 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2653 <400> 117 agccacgccc cgcccccggc cctgaccatc ttcctggaca gacaccccat cgccttcatg 60 ctgtgctacc ccgccgccag 80 <210> 118 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2654 <400> 118 ggggggatca gggccacgaa ggccagcacg gcctgggggg tcatgctgcc catcaggtat 60 ctggcggcgg ggtagcacag 80 <210> 119 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2655 <400> 119 ttcgtggccc tgatcccccc caccctgccc ggcaccaaca tcgtgctggg cgccctgccc 60 gaggacagac acatcgacag 80 <210> 120 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2656 <400> 120 ctgatggcgg ccagcatggc caggtccagt ctctcgccgg gtctctgtct cttggccagt 60 ctgtcgatgt gtctgtcctc 80 <210> 121 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2657 <400> 121 gccatgctgg ccgccatcag aagagtgtac ggcctgctgg ccaacaccgt gagatacctg 60 cagggcggcg gcagctggtg 80 <210> 122 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2658 <400> 122 ctctggggct cggcgccctg ggggggcacg gcggtgccgc tcagctggcc ccagtcctcc 60 caccagctgc cgccgccctg 80 <210> 123 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2659 <400> 123 cagggcgccg agccccagag caacgccggc cccagacccc acatcggcga caccctgttc 60 accctgttca gagcccccga 80 <210> 124 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2660 <400> 124 gccagcacgt ccagggccca ggcgaacacg ttgtacaggt cgccgttggg ggccagcagc 60 tcgggggctc tgaacagggt 80 <210> 125 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2661 <400> 125 tgggccctgg acgtgctggc caagagactg agacccatgc acgtgttcat cctggactac 60 gaccagagcc ccgccggctg 80 <210> 126 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2662 <400> 126 ccgggggtgg tcacgtgggt ctgcaccatg ccgctggtca gctgcagcag ggcgtctctg 60 cagccggcgg ggctctggtc 80 <210> 127 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> HY2663 <400> 127 gccagctacc cctgccacca gcacgccagc gccttcgacc aggc 44 <210> 128 <211> 80 <212> DNA <213> Artificial Sequence <220> <223> HY2664 <400> 128 gttggcctcg cccatctctc tggcgaaggt tctggccagg tcgcagatgg tggggatgct 60 gccgggggtg gtcacgtggg 80 <210> 129 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> HY2665 <400> 129 gagagatggg cgaggccaac gagggcagag gaagtcttct 40 <210> 130 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> HY2666 <400> 130 tgagtcaaaa tgacgcatga gacttcgttc ctgtgaggac 40 <210> 131 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> HY2667 <400> 131 tcatgcgtca ttttgactca cgcggtcgtt atagttcaaa atcagtgaca cttaccgcat 60 <210> 132 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> HY2668 <400> 132 ggaaagcggg cagtgaagct cccgtgaggc gtgcttgtca atgcggtaag tgtcactgat 60 <210> 133 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L1-R1 <400> 133 tggtaaggat gagggaaaga tg 22 <210> 134 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L1-R1 <400> 134 gccaagtagc aaagagcgtg t 21 <210> 135 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L1-R1 <400> 135 atataagaag gacgaggaga aatg 24 <210> 136 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L1-R1 <400> 136 ggccaatatg tgctttagga a 21 <210> 137 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L2-R1 <400> 137 tggcatattt gttaatgttc tgct 24 <210> 138 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L2-R1 <400> 138 gccaagtagc aaagagcgtg t 21 <210> 139 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L2-R1 <400> 139 ataagaccaa cttcagacac cag 23 <210> 140 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L2-R1 <400> 140 ggccaatatg tgctttagga a 21 <210> 141 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L3-R1 <400> 141 aaagagatca tggggtagca aa 22 <210> 142 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L3-R1 <400> 142 gccaagtagc aaagagcgtg t 21 <210> 143 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L3-R1 <400> 143 gtagccaaga gggctgagag t 21 <210> 144 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L3-R1 <400> 144 ggccaatatg tgctttagga a 21 <210> 145 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L4-R1 <400> 145 cagacttgga tgtggacctt g 21 <210> 146 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L4-R1 <400> 146 gccaagtagc aaagagcgtg t 21 <210> 147 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L4-R1 <400> 147 gatcatagca aaagctcagt tgtc 24 <210> 148 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L4-R1 <400> 148 ggccaatatg tgctttagga a 21 <210> 149 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L5-R1 <400> 149 cccatcctgt gcttcttctc t 21 <210> 150 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L5-R1 <400> 150 gccaagtagc aaagagcgtg t 21 <210> 151 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L5-R1 <400> 151 gcactcatgt gctctggtct t 21 <210> 152 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L5-R1 <400> 152 ggccaatatg tgctttagga a 21 <210> 153 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L4-R2 <400> 153 cagacttgga tgtggacctt g 21 <210> 154 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L4-R2 <400> 154 tcctgaacca caccttggac 20 <210> 155 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L4-R2 <400> 155 gatcatagca aaagctcagt tgtc 24 <210> 156 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L4-R2 <400> 156 acgagaggca gctctattca tc 22 <210> 157 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L4-R3 <400> 157 cagacttgga tgtggacctt g 21 <210> 158 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L4-R3 <400> 158 ttgtaacctg tgttttcatg ttttt 25 <210> 159 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L4-R3 <400> 159 gatcatagca aaagctcagt tgtc 24 <210> 160 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L4-R3 <400> 160 tggcacaaag gagagaataa ca 22 <210> 161 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L4-R4 <400> 161 cagacttgga tgtggacctt g 21 <210> 162 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L4-R4 <400> 162 gcttgctagg attttggttt tt 22 <210> 163 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L4-R4 <400> 163 gatcatagca aaagctcagt tgtc 24 <210> 164 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L4-R4 <400> 164 ccacagattc attaaaagga ggag 24 <210> 165 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L4-R5 <400> 165 cagacttgga tgtggacctt g 21 <210> 166 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L4-R5 <400> 166 cacttctggg gtcacttagg aa 22 <210> 167 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L4-R5 <400> 167 gatcatagca aaagctcagt tgtc 24 <210> 168 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L4-R5 <400> 168 ctagctgtac cttgcacctt tg 22 <210> 169 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L4-R6 <400> 169 cagacttgga tgtggacctt g 21 <210> 170 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L4-R6 <400> 170 ccaaggtacc acttaatgct tca 23 <210> 171 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L4-R6 <400> 171 gatcatagca aaagctcagt tgtc 24 <210> 172 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L4-R6 <400> 172 tactcggcag gtagtaaact tct 23 <210> 173 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L6-R1 <400> 173 ctccctggct tttgtgttgg 20 <210> 174 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L6-R1 <400> 174 gccaagtagc aaagagcgtg t 21 <210> 175 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L6-R1 <400> 175 ctccctggct tttgtgttgg 20 <210> 176 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L6-R1 <400> 176 ggccaatatg tgctttagga a 21 <210> 177 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L7-R1 <400> 177 caccgaccag accctgggat cgtcc 25 <210> 178 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L7-R1 <400> 178 gccaagtagc aaagagcgtg t 21 <210> 179 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L7-R1 <400> 179 ctgtggagat tagtcagccc aa 22 <210> 180 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L7-R1 <400> 180 ggccaatatg tgctttagga a 21 <210> 181 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L4-R7 <400> 181 cagacttgga tgtggacctt g 21 <210> 182 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L4-R7 <400> 182 ctgctggacg ttttggtaat gc 22 <210> 183 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L4-R7 <400> 183 gatcatagca aaagctcagt tgtc 24 <210> 184 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L4-R7 <400> 184 ccagctatcc acgccattta g 21 <210> 185 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L4-R8 <400> 185 cagacttgga tgtggacctt g 21 <210> 186 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L4-R8 <400> 186 ggaagaaggc aaatcaaaag gtc 23 <210> 187 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L4-R8 <400> 187 gatcatagca aaagctcagt tgtc 24 <210> 188 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L4-R8 <400> 188 gcttgactct tctaattctc actgc 25 <210> 189 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L8-R9 <400> 189 tttgtggttc tggcatattg gg 22 <210> 190 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L8-R9 <400> 190 atgcctcctt gacttccatc ag 22 <210> 191 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L8-R9 <400> 191 aaaagcaaag cagaattccg ga 22 <210> 192 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L8-R9 <400> 192 taaagtgacg agcaagcaag ga 22 <210> 193 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L9-R9 <400> 193 taattgaaga agccctcgac cc 22 <210> 194 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L9-R9 <400> 194 atgcctcctt gacttccatc ag 22 <210> 195 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L9-R9 <400> 195 acccctttta ctatccacag gc 22 <210> 196 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L9-R9 <400> 196 taaagtgacg agcaagcaag ga 22 <210> 197 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L10-R9 <400> 197 atgattgtcc cagtctttcc cc 22 <210> 198 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L10-R9 <400> 198 atgcctcctt gacttccatc ag 22 <210> 199 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L10-R9 <400> 199 acagggaagt tgcaaagaca aa 22 <210> 200 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L10-R9 <400> 200 taaagtgacg agcaagcaag ga 22 <210> 201 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L11-R9 <400> 201 aggcagttaa ggaaaagtac cca 23 <210> 202 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L11-R9 <400> 202 atgcctcctt gacttccatc ag 22 <210> 203 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L11-R9 <400> 203 tctgatctat tcctgggctg gt 22 <210> 204 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L11-R9 <400> 204 taaagtgacg agcaagcaag ga 22 <210> 205 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for L12-R9 <400> 205 aaataaggct gggcatggtt g 21 <210> 206 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for L12-R9 <400> 206 atgcctcctt gacttccatc ag 22 <210> 207 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for L12-R9 <400> 207 gcaaaccaaa accacgagat ac 22 <210> 208 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for L12-R9 <400> 208 taaagtgacg agcaagcaag ga 22 <210> 209 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for GPR119 <400> 209 gcccttaccg tcttagccat ca 22 <210> 210 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for GPR119 <400> 210 cgacatgctc aagattgcct cc 22 <210> 211 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for GPR119 <400> 211 ctgctgatct agttggggct cc 22 <210> 212 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for GPR119 <400> 212 gctgtatttc accctcactt cgt 23 <210> 213 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for RBMX2 <400> 213 cactgaagca tcgcctgtct tg 22 <210> 214 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for RBMX2 <400> 214 atgtcgagtg gctgtacaag gt 22 <210> 215 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for RBMX2 <400> 215 tcactgaagc atcgcctgtc tt 22 <210> 216 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for RBMX2 <400> 216 ggagaacaac cttggcagca g 21 <210> 217 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for DENND10P1 <400> 217 gaaaggtccc aagtcaaagg aa 22 <210> 218 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for DENND10P1 <400> 218 gggtcagaaa ccacaccaag 20 <210> 219 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for DENND10P1 <400> 219 ccagccctac atgtgttcag ga 22 <210> 220 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for DENND10P1 <400> 220 ccgccacaac cccatatgta ga 22 <210> 221 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for ENOX2,LOC105373338 <400> 221 aagccagttt tcagcacgaa tg 22 <210> 222 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for ENOX2,LOC105373338 <400> 222 aacagagagg atggaggttt gg 22 <210> 223 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for ENOX2,LOC105373338 <400> 223 ccaagagccc gagactgatg aa 22 <210> 224 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for ENOX2,LOC105373338 <400> 224 ttcccctctg gccttcttac ag 22 <210> 225 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for LINC01201,ARHGAP36 <400> 225 tcctctagaa cggaccagtg at 22 <210> 226 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for LINC01201,ARHGAP36 <400> 226 cgaagggagg cagagacaca c 21 <210> 227 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for LINC01201,ARHGAP36 <400> 227 tcctgctcac attcttggtc ct 22 <210> 228 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for LINC01201,ARHGAP36 <400> 228 acccagctaa gagtgtttcg gt 22 <210> 229 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for IGSF1 <400> 229 acattacacc caggaagagc gg 22 <210> 230 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for IGSF1 <400> 230 aggtgccctt actgagtcca at 22 <210> 231 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for IGSF1 <400> 231 tggatatgag tgcggcagat gt 22 <210> 232 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for IGSF1 <400> 232 ggatctgggt ccgggctaat tt 22 <210> 233 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for OR13H1 <400> 233 tcaaacgagt gtctccttgg ct 22 <210> 234 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for OR13H1 <400> 234 tcagggtagg acttggactg ag 22 <210> 235 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for OR13H1 <400> 235 aatttacctc agcacattgt tggg 24 <210> 236 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for OR13H1 <400> 236 caacataact ttccttattg cccgt 25 <210> 237 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for FIRRE <400> 237 cactgttggc accgtttaga tttt 24 <210> 238 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for FIRRE <400> 238 tgaccacgca caaacagatg ag 22 <210> 239 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for FIRRE <400> 239 tgcacaaatt cttcaacacc acc 23 <210> 240 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for FIRRE <400> 240 gtattcgtct ctctccccgc c 21 <210> 241 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for MST4 <400> 241 ggggtgtggt atgggacttc aa 22 <210> 242 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for MST4 <400> 242 cccctttcct ccatcctagc ac 22 <210> 243 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for MST4 <400> 243 tctaggtgaa gcatactcca gtgt 24 <210> 244 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for MST4 <400> 244 aggaggcaat tctataggca agct 24 <210> 245 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for FRMD7 <400> 245 cgctattctc cctcctgtta caca 24 <210> 246 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for FRMD7 <400> 246 tgtttacgtg tggcagtgtt gt 22 <210> 247 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for FRMD7 <400> 247 aagccctcat tgtcacgatg tt 22 <210> 248 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for FRMD7 <400> 248 acctcgtacc agtgcttcat cc 22 <210> 249 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for RAP2C,RAP2C-AS1,MBNL3 <400> 249 ttcaccctga ctgacttttg ct 22 <210> 250 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for RAP2C,RAP2C-AS1,MBNL3 <400> 250 tgggactgac atttaaaacg cct 23 <210> 251 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for RAP2C,RAP2C-AS1,MBNL3 <400> 251 acgaaactca gttgaaccga agc 23 <210> 252 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for RAP2C,RAP2C-AS1,MBNL3 <400> 252 agtggggaac agaagtatat gtgct 25 <210> 253 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for HS6ST2,HS6ST2-AS1 <400> 253 gtgagtctgg tttggctttc gg 22 <210> 254 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for HS6ST2,HS6ST2-AS1 <400> 254 tcagacccat ttccagagcc ag 22 <210> 255 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for HS6ST2,HS6ST2-AS1 <400> 255 ttctacagct cggtaagatt cacc 24 <210> 256 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for HS6ST2,HS6ST2-AS1 <400> 256 acaacctctc tgtcatgcct ga 22 <210> 257 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for USP26 <400> 257 aacgcctatc ctcctgcatc tg 22 <210> 258 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for USP26 <400> 258 actcagcagt gtgacggtat ga 22 <210> 259 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for USP26 <400> 259 agctatggga ttgaggtgtc tgt 23 <210> 260 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for USP26 <400> 260 tcaaacagtg cccgaaaatc ca 22 <210> 261 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for TFDP3 <400> 261 cccaaaagtc atgcccatcc ac 22 <210> 262 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for TFDP3 <400> 262 cctgtgccgt ctttccatga ag 22 <210> 263 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for TFDP3 <400> 263 tcgcaatgtt ggtcaggtca ct 22 <210> 264 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for TFDP3 <400> 264 gcctctcaga accagcattc ct 22 <210> 265 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for GPC4 <400> 265 ttgcccgagt gttgacagct at 22 <210> 266 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for GPC4 <400> 266 tctggagaga cgtggaggtg at 22 <210> 267 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for GPC4 <400> 267 tctggacacc tagttctccc ct 22 <210> 268 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for GPC4 <400> 268 aagcaaacca gggtcccttc tt 22 <210> 269 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for GPC3,GPC3-AS1 <400> 269 cagggaggtg ggtttcaagg aa 22 <210> 270 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for GPC3,GPC3-AS1 <400> 270 gtgtgcttct tcttcctggt gc 22 <210> 271 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for GPC3,GPC3-AS1 <400> 271 agttgtaaag agagaccaga ccagg 25 <210> 272 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for GPC3,GPC3-AS1 <400> 272 actggcctat gatctggatg tgg 23 <210> 273 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for microRNAs <400> 273 atcctccttt cttccacagg cc 22 <210> 274 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for microRNAs <400> 274 actgccctaa atgccccttc tg 22 <210> 275 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for microRNAs <400> 275 gctgatcagg aatgtcgcca ac 22 <210> 276 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for microRNAs <400> 276 aggccttggc catgtaaaag tg 22 <210> 277 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for CCDC160 <400> 277 cagatagcag caagggaatg ga 22 <210> 278 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for CCDC160 <400> 278 tgacttcttt ggcttgctgg ag 22 <210> 279 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for CCDC160 <400> 279 cagatattgg aagaggtgcc tgga 24 <210> 280 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for CCDC160 <400> 280 gagcacattt ccaacctcgg t 21 <210> 281 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for PHF6 <400> 281 gggttaccgc ttgctaagga ct 22 <210> 282 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for PHF6 <400> 282 tggtactgag gtgctatggt agt 23 <210> 283 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for PHF6 <400> 283 cttgacagca cacctcctct ct 22 <210> 284 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for PHF6 <400> 284 acttgacaaa cgtgatctta aggga 25 <210> 285 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for HPRT1 <400> 285 cctttgggcg gattgttgtt taa 23 <210> 286 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for HPRT1 <400> 286 tttgtagctc cgccaaccca tt 22 <210> 287 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for HPRT1 <400> 287 actggaaaag caaaatacaa agcct 25 <210> 288 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for HPRT1 <400> 288 ggaacacgtg taagctagat ggc 23 <210> 289 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for microRNAs-2 <400> 289 ccttatgtca ggggttcatg ct 22 <210> 290 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for microRNAs-2 <400> 290 tggggaaaag aggctatcag ga 22 <210> 291 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for microRNAs-2 <400> 291 caatgcgtct tgaggccctg 20 <210> 292 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for microRNAs-2 <400> 292 tctgagttgt ggtataaagg tgacc 25 <210> 293 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for MIR503HG,microRNAs <400> 293 tggaggaaaa tctaggcaca ctg 23 <210> 294 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for MIR503HG,microRNAs <400> 294 gaaatcccca ttctgctccc gc 22 <210> 295 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for MIR503HG,microRNAs <400> 295 agtttaaggg ccacgtctgt ct 22 <210> 296 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for MIR503HG,microRNAs <400> 296 ggcccctaga agtttcccag tt 22 <210> 297 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for LINC00629 <400> 297 ttcatgttcc caggtggcaa gg 22 <210> 298 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for LINC00629 <400> 298 catccaagga caagaggcag gg 22 <210> 299 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for LINC00629 <400> 299 actcgattct ctccctacac tgg 23 <210> 300 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for LINC00629 <400> 300 tttcaaagtg gggtgaggag gt 22 <210> 301 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for PLAC1 <400> 301 agggacctgg gtatgctctt ct 22 <210> 302 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for PLAC1 <400> 302 gatcctcctc acctctgcgt tt 22 <210> 303 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for PLAC1 <400> 303 ggacccaatc atatcatctg tgtga 25 <210> 304 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for PLAC1 <400> 304 gttctgtttt gggttcatct tgagg 25 <210> 305 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for FAM122B,FAM122C <400> 305 ggcaaccaca aaccccaaat ct 22 <210> 306 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for FAM122B,FAM122C <400> 306 ggtggctggg agtagaagta gc 22 <210> 307 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for FAM122B,FAM122C <400> 307 agttgccatg cctgttcctt tc 22 <210> 308 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for FAM122B,FAM122C <400> 308 cccaaattaa gtactacaag tggcg 25 <210> 309 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for MOSPD1 <400> 309 gcagggaggg gcttggaaga 20 <210> 310 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for MOSPD1 <400> 310 cactttgatt gctaggggtc atgt 24 <210> 311 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for MOSPD1 <400> 311 tgacttaggc tcctcacatg gt 22 <210> 312 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for MOSPD1 <400> 312 aggatgcttc tgagtgacac ct 22 <210> 313 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for LINC02243 <400> 313 ccactggcat ttctaccacc ca 22 <210> 314 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for LINC02243 <400> 314 cagcacagca gttccatgtc ac 22 <210> 315 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for LINC02243 <400> 315 ccccagtccc attatctgcc tt 22 <210> 316 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for LINC02243 <400> 316 tgcatcgtca caggcagtaa ga 22 <210> 317 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for SMIM10 <400> 317 tgattctcaa cgtccacctg ca 22 <210> 318 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for SMIM10 <400> 318 gggagatttg cctgctgtct ga 22 <210> 319 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for SMIM10 <400> 319 catccctctg tcccacggtc 20 <210> 320 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for SMIM10 <400> 320 caactgttca aaaccatgcc aca 23 <210> 321 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for RLT8B <400> 321 cctgctggct gacttctcac at 22 <210> 322 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for RLT8B <400> 322 ctgttacctt cagcgagacc ca 22 <210> 323 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for RLT8B <400> 323 cagctgttca ccaataatct gtgtg 25 <210> 324 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for RLT8B <400> 324 agacgactac atcatgctgc cc 22 <210> 325 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for RLT8C <400> 325 ctttctggcc gagatgaagc ga 22 <210> 326 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for RLT8C <400> 326 tctgtcggtg ggatgcgatg 20 <210> 327 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for RLT8C <400> 327 tgcagctgat aaaggccctc c 21 <210> 328 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for RLT8C <400> 328 ccagcccaga tacctccgag 20 <210> 329 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for RLT8A <400> 329 agtctggagg agtggaggtg g 21 <210> 330 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for RLT8A <400> 330 tctccaacga cgccctgaag 20 <210> 331 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for RLT8A <400> 331 ctctggggat ggggaggaaa tg 22 <210> 332 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for RLT8A <400> 332 ttccctttcc cgagacgttt ga 22 <210> 333 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for SMIM0L2B <400> 333 aaatggggat agcaggtgag gg 22 <210> 334 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for SMIM0L2B <400> 334 gggaatctgg ggatctcgct tt 22 <210> 335 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for SMIM0L2B <400> 335 caaggtcagg ggttctcagg ag 22 <210> 336 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for SMIM0L2B <400> 336 tgacagagga aaccgaggct tc 22 <210> 337 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for ETDB,SMIM10L2B-AS1 <400> 337 cccaagtgac agagaggtga ga 22 <210> 338 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for ETDB,SMIM10L2B-AS1 <400> 338 gccagggtag ttgagggttc tg 22 <210> 339 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for ETDB,SMIM10L2B-AS1 <400> 339 tgggaacgta atcacagtgg ct 22 <210> 340 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for ETDB,SMIM10L2B-AS1 <400> 340 catggcggac aaagttgctg at 22 <210> 341 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for CT55 <400> 341 aggggttctc tgccttcctt tg 22 <210> 342 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for CT55 <400> 342 ttcctctgtg tgtccccttg tc 22 <210> 343 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for CT55 <400> 343 tcaccaacat gatgagtagc acct 24 <210> 344 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for CT55 <400> 344 ggtcccatgc cacagtgtct 20 <210> 345 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for ZNF75D,ETDA,ETDC,ZNF449 <400> 345 cagctcctgt ccccgtttcg 20 <210> 346 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for ZNF75D,ETDA,ETDC,ZNF449 <400> 346 tgacgcattg aatctcacag ga 22 <210> 347 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for ZNF75D,ETDA,ETDC,ZNF449 <400> 347 gtttcaagtt ccagccggtg ag 22 <210> 348 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for ZNF75D,ETDA,ETDC,ZNF449 <400> 348 tgagccttgg agtaactgga gc 22 <210> 349 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for LOC100506790 <400> 349 tgtttggtaa tcaggggagg gt 22 <210> 350 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for LOC100506790 <400> 350 agctgccttc ttctcacctc tg 22 <210> 351 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for LOC100506790 <400> 351 accctattga gtcctgaacc cg 22 <210> 352 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for LOC100506790 <400> 352 tcacacatgg ggctgtatag ga 22 <210> 353 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for SMIM10L2A <400> 353 atctgctcct gtccctgctt tt 22 <210> 354 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for SMIM10L2A <400> 354 gtccaggtca agtcggttct ca 22 <210> 355 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for SMIM10L2A <400> 355 cagatgtggc cctttcaaac cc 22 <210> 356 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for SMIM10L2A <400> 356 agaacaagca gctacctctc gg 22 <210> 357 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for INTS6L,ISTN6L-AS1 <400> 357 tccctcccct agtcctgtca tc 22 <210> 358 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for INTS6L,ISTN6L-AS1 <400> 358 gttcatagag gcggacgtgt ct 22 <210> 359 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for INTS6L,ISTN6L-AS1 <400> 359 cattcgaact gcttccaagt cct 23 <210> 360 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for INTS6L,ISTN6L-AS1 <400> 360 ggggtcgcgt aggaaaggag 20 <210> 361 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for SAGEP2 <400> 361 gcgagactaa ttgagccctc ct 22 <210> 362 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for SAGEP2 <400> 362 ccactccatt ccctaccctt gg 22 <210> 363 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for SAGEP2 <400> 363 gtatgttttg tcccatcctc ccc 23 <210> 364 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for SAGEP2 <400> 364 taacgcgggt cccatccatt tc 22 <210> 365 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for CT45A1,2,3,5,6,7,8,9,10 <400> 365 cctgagtccc accataggct ta 22 <210> 366 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for CT45A1,2,3,5,6,7,8,9,10 <400> 366 cgccacaact tcactgccat tt 22 <210> 367 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for CT45A1,2,3,5,6,7,8,9,10 <400> 367 gcacatttcc cacaactccc ag 22 <210> 368 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for CT45A1,2,3,5,6,7,8,9,10 <400> 368 agacagagtt cccaaggtca cg 22 <210> 369 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for SAGE1 <400> 369 gtctttggtg gaaactgtgc ca 22 <210> 370 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for SAGE1 <400> 370 cactcacctt gctgcttcct tg 22 <210> 371 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for SAGE1 <400> 371 acaggacatt gtatgccacc ca 22 <210> 372 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for SAGE1 <400> 372 ggccagggat taggaggaac aa 22 <210> 373 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for MMGT1 <400> 373 cccactcccc tttctaagaa cact 24 <210> 374 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for MMGT1 <400> 374 tgaccttgcc ctgtccaata aat 23 <210> 375 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for MMGT1 <400> 375 tgcatacatc atctttcttg cccc 24 <210> 376 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for MMGT1 <400> 376 agcatcttcc tggttgtatg tgg 23 <210> 377 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP forward for SLC9A6 <400> 377 ttttgtgtgc taggggaggg ag 22 <210> 378 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 1st STEP reverse for SLC9A6 <400> 378 aacttctgac gacaaagcct gc 22 <210> 379 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP forward for SLC9A6 <400> 379 tggttgcact ctgtagactg ga 22 <210> 380 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> 2nd STEP reverse for SLC9A6 <400> 380 ctgactttgg tgcagtgtgg aa 22 <210> 381 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> HK1338 <400> 381 gcgaacccga ggagatga 18 <210> 382 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> HK1339 <400> 382 agatccaggc gctgtcctt 19 <210> 383 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HK1375 <400> 383 ccttcggata cagcaaattc tt 22 <210> 384 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HK1376 <400> 384 gcagggagga gtgttttata cc 22 <210> 385 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HY2671 <400> 385 cactgtgttg gcgtacaggt ctt 23 <210> 386 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> HY2672 <400> 386 ctgaggcact cttccagcct tc 22 <210> 387 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> HY2223 <400> 387 acattgcatt agtctccctt tcac 24 <210> 388 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> HY2224 <400> 388 aattgagttg ttttgttgcc tgaa 24

Claims (14)

  1. 인비트로의 방법으로서,
    (a) 단리된 세포를 포함하는 세포 집단을 준비하는 것과,
    (b) 상기 세포 집단 중의 상기 세포의 게놈 DNA에, 게놈 DNA 상의 2개소의 표적 서열을 서열 특이적으로 절단할 수 있는 서열 특이적 핵산 절단 분자를 각각 작용시켜, 게놈 DNA 상의 2개소의 표적 서열에 있어서 각각 절단을 일으키게 하고, 이것에 의해, 세포 집단 중의 적어도 일부의 세포에 있어서, 상기 2개소의 절단 부위 사이의 영역에 있어서 DNA 영역의 결실을 일으키게 하는 것과,
    (c) 그 후, 얻어진 세포 집단을 배양하여, 세포의 증식 또는 생존에 대한 상기 DNA 영역의 결실의 영향을 결정하는 것
    을 포함하는,
    방법.
  2. 제 1 항에 있어서,
    상기 (c)에 있어서, 상기 결정이, DNA 영역의 결실 효율 또는 그 추정치를 결정하는 것과, 그 후의 배양 후의 세포 집단에 있어서의 DNA 영역의 결실을 갖는 세포의 비율과, 결정된 결실 효율 또는 그 추정치를 비교하는 것에 의해 행해지는, 방법.
  3. 제 2 항에 있어서,
    상기 (c)에 있어서, 결실 효율 또는 그 추정치의 결정, 및, 배양 후의 DNA 영역의 결실을 갖는 세포의 비율이, 각각 세포 집단을 포함하는 현탁액 중에 포함되는 전체 세포에 대한 결실을 갖는 세포의 비율로서 결정되는, 방법.
  4. 제 3 항에 있어서,
    상기 비율이, 현탁액 중에 포함되는, 결실을 갖는 게놈 DNA 및 갖지 않는 게놈 DNA의 계수 기술에 의해 결정되는, 방법.
  5. 제 1 항 내지 제 4 항 중 어느 한 항에 있어서,
    (d) 대조가 되는 세포 집단과 비교하여, 상기 (c)에 있어서의 세포의 생존 및/또는 증식에 대한 영향의 유무 또는 크기에 기초하여, 대조의 게놈 DNA와 비교하여 결실된 DNA 영역이 세포의 생존 및/또는 증식을 제어하는 유전자를 포함하는지 여부를 결정하는 것
    을 추가로 포함하는, 방법.
  6. 제 5 항에 있어서,
    대조가 되는 세포 집단이, 상기 (b)에 의해, 보다 큰 DNA 영역, 보다 작은 DNA 영역, 또는 상이한 DNA 영역의 결실을 갖는 세포를 포함하는 세포 집단인, 방법.
  7. 제 5 항 또는 제 6 항에 있어서,
    대조의 게놈 DNA와 비교하여 결실된 DNA 영역에 존재하는 유전자로부터, 세포의 생존 및/또는 증식을 제어하는 유전자를 적어도 1개 특정하는 것을 추가로 포함하는, 방법.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서,
    (f) 결실된 DNA 영역에 존재하는 유전자로부터, 세포의 생존 및/또는 증식을 제어하는 유전자를 적어도 1개 특정하는 것
    을 추가로 포함하는, 방법.
  9. 제 7 항 또는 제 8 항에 있어서,
    (g) 제어 서열에 작동 가능하게 연결된 세포의 생존 및/또는 증식을 제어하는 유전자의 적어도 1개를, 당해 DNA 영역의 결실을 갖는 게놈 DNA에 이소적(異所的)으로 도입하는 것을 추가로 포함하는, 방법.
  10. 제 1 항 내지 제 9 항 중 어느 한 항에 있어서,
    상기 (b)에 있어서 결실되는 DNA 영역의 사이즈가, 0.5Mbp 이상인, 방법.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 (b)에 있어서 결실되는 DNA 영역의 사이즈가, 1Mbp 이상인, 방법.
  12. 인비트로의 방법으로서,
    (α) 단리된 세포를 포함하는 세포 집단을 준비하는 것과, 여기에서 단리된 세포는, 결실시키는 영역 중에 네거티브 선택용 마커 유전자를 포함하고,
    (β) 상기 세포 집단 중의 상기 세포의 게놈 DNA에, 게놈 DNA 상의 2개소의 표적 서열을 서열 특이적으로 절단할 수 있는 서열 특이적 핵산 절단 분자를 각각 작용시켜, 게놈 DNA 상의 2개소의 표적 서열에 있어서 각각 절단을 일으키게 하고, 이것에 의해, 세포 집단 중의 적어도 일부의 세포에 있어서, 상기 2개소의 절단 부위 사이의 영역에 있어서 DNA 영역의 결실을 일으키게 하는 것과, 여기에서, 상기 2개소는, 상기 네거티브 선택용 마커 유전자를 끼우는 위치에 설계되고,
    (γ) 네거티브 선택 마커 유전자를 갖지 않는 세포를 선택하는 것
    을 포함하는, 방법.
  13. 제 12 항에 있어서,
    상기 네거티브 선택 마커 유전자가, 결실시키는 영역 중에 외래적으로 삽입된 것인, 방법.
  14. 제 12 항에 있어서,
    상기 네거티브 선택 마커 유전자가, 게놈 DNA 중의 내재적인 유전자인, 방법.
KR1020237024465A 2020-12-25 2021-10-19 게놈 dna에 대규모 결실을 일으키게 하는 방법 및 게놈dna의 분석 방법 KR20230124978A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2020216271 2020-12-25
JPJP-P-2020-216271 2020-12-25
PCT/JP2021/038504 WO2022137760A1 (ja) 2020-12-25 2021-10-19 ゲノムdnaに大規模な欠失を生じさせる方法およびゲノムdnaの分析方法

Publications (1)

Publication Number Publication Date
KR20230124978A true KR20230124978A (ko) 2023-08-28

Family

ID=82158966

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237024465A KR20230124978A (ko) 2020-12-25 2021-10-19 게놈 dna에 대규모 결실을 일으키게 하는 방법 및 게놈dna의 분석 방법

Country Status (10)

Country Link
US (1) US20240052337A1 (ko)
EP (1) EP4269580A4 (ko)
JP (1) JPWO2022137760A1 (ko)
KR (1) KR20230124978A (ko)
CN (1) CN116648517A (ko)
AU (1) AU2021405456A1 (ko)
CA (1) CA3206479A1 (ko)
IL (1) IL303994A (ko)
TW (1) TW202242107A (ko)
WO (1) WO2022137760A1 (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
CN106637421B (zh) * 2016-10-28 2019-12-27 博雅缉因(北京)生物科技有限公司 双sgRNA文库的构建及其应用于高通量功能性筛选研究的方法
WO2019023291A2 (en) * 2017-07-25 2019-01-31 Dana-Farber Cancer Institute, Inc. COMPOSITIONS AND METHODS FOR PRODUCTION AND DECODING OF GUIDE RNA LIBRARIES AND USES THEREOF

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Hutchison, C. A. et al., Science, 351, aad6253-aad6253 (2016).
Posfai, G., Science, 312, 1044-1046 (2006).
Xavier, J. C., Patil, K. R. & Rocha, I., Microbiol Mol Biol Rev, 78, 487-509 (2014).

Also Published As

Publication number Publication date
WO2022137760A1 (ja) 2022-06-30
TW202242107A (zh) 2022-11-01
EP4269580A1 (en) 2023-11-01
CN116648517A (zh) 2023-08-25
CA3206479A1 (en) 2022-06-30
AU2021405456A1 (en) 2023-07-13
IL303994A (en) 2023-08-01
AU2021405456A9 (en) 2024-02-08
JPWO2022137760A1 (ko) 2022-06-30
US20240052337A1 (en) 2024-02-15
EP4269580A4 (en) 2024-10-30

Similar Documents

Publication Publication Date Title
US11535863B2 (en) RNA-guided human genome engineering
JP7136816B2 (ja) 核酸誘導型ヌクレアーゼ
KR102594051B1 (ko) 단일 가이드 RNA, CRISPR/Cas9 시스템, 및 이의 사용방법
TWI747808B (zh) 新穎之cho整合位點及其用途
Cao et al. Construction of BAC‐based physical map and analysis of chromosome rearrangement in Chinese hamster ovary cell lines
JP2018532419A (ja) CRISPR−Cas sgRNAライブラリー
US20220136041A1 (en) Off-Target Single Nucleotide Variants Caused by Single-Base Editing and High-Specificity Off-Target-Free Single-Base Gene Editing Tool
Saha et al. Telomere and subtelomere R-loops and antigenic variation in trypanosomes
JP2022078058A (ja) ゲノム編集方法
US11946163B2 (en) Methods for measuring and improving CRISPR reagent function
JP2020528046A (ja) T細胞に基づく免疫療法の有効性増強のための組成物および方法
KR20230124978A (ko) 게놈 dna에 대규모 결실을 일으키게 하는 방법 및 게놈dna의 분석 방법
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
Zhang et al. Mouse genomic rewriting and tailoring: synthetic Trp53 and humanized ACE2
US20190093147A1 (en) Purification process of nascent dna
Spaller et al. TRE5-A retrotransposition profiling reveals putative RNA polymerase III transcription complex binding sites on the Dictyostelium extrachromosomal rDNA element
US20240287609A1 (en) Compositions and methods for large-scale in vivo genetic screening
TW201840849A (zh) 編輯核酸序列之組成物及方法
JP7402453B2 (ja) 細胞を単離又は同定する方法及び細胞集団
WO2021171688A1 (ja) 遺伝子ノックイン方法、遺伝子ノックイン細胞作製方法、遺伝子ノックイン細胞、がん化リスク評価方法、がん細胞製造方法、及びこれらに用いるためのキット
Haas Tracing the specificity of CRISPR-Cas nucleases in clinically relevant human cells
EP1661992B1 (en) Method of screening for homologous recombination events
US10131913B2 (en) Purification process of nascent DNA
Franke The role of higher-order chromatin organization at the SOX9 locus in gene regulation and disease
JP2012080808A (ja) Es細胞における相同組換え効率を改善する方法