KR20210121756A - Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase - Google Patents

Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase Download PDF

Info

Publication number
KR20210121756A
KR20210121756A KR1020200038994A KR20200038994A KR20210121756A KR 20210121756 A KR20210121756 A KR 20210121756A KR 1020200038994 A KR1020200038994 A KR 1020200038994A KR 20200038994 A KR20200038994 A KR 20200038994A KR 20210121756 A KR20210121756 A KR 20210121756A
Authority
KR
South Korea
Prior art keywords
sequence
seq
gene encoding
histone
ala
Prior art date
Application number
KR1020200038994A
Other languages
Korean (ko)
Other versions
KR102541652B1 (en
Inventor
임광일
Original Assignee
바이오디자인랩 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이오디자인랩 주식회사 filed Critical 바이오디자인랩 주식회사
Priority to KR1020200038994A priority Critical patent/KR102541652B1/en
Publication of KR20210121756A publication Critical patent/KR20210121756A/en
Application granted granted Critical
Publication of KR102541652B1 publication Critical patent/KR102541652B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/001Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof by chemical synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07049RNA-directed DNA polymerase (2.7.7.49), i.e. telomerase or reverse-transcriptase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/10022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/10041Use of virus, viral particle or viral elements as a vector
    • C12N2740/10043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

The present invention relates to safe retroviral vectors developed through introduction of histone or leucine zipper into integrase, a method for developing the same, and a use thereof. The present invention inserts histone or leucine zipper in front of the 37^th and 273^rd residues of an integrase gene to extinct integration preference with respect to a transcriptional start site (TSS) so that risk of overexpressing oncogenes is removed, thereby being usefully used for clinical application and disease treatment.

Description

히스톤 또는 루신 지퍼의 인테그라제로의 삽입을 통한 안전한 레트로바이러스 벡터 구축 방법 {Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase}{Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase}

본 발명은 히스톤 또는 루신 지퍼의 인테그라제로의 도입을 통해 구축한 레트로바이러스 벡터, 이의 구축 방법 및 이의 용도에 관한 것이다.The present invention relates to a retroviral vector constructed through the introduction of histone or leucine zipper into an integrase, a method for constructing the same, and a use thereof.

레트로바이러스 벡터는 최대 8kb의 큰 유전자 단위를 탑재할 수 있으며, 특별한 면역 반응을 일으키지 않는다. 또한, 다른 유형의 바이러스 벡터와는 달리, 레트로바이러스 벡터는 치료용 유전자의 인간 게놈으로의 통합을 통해 장기적인 유전자 발현을 가능케 한다. Retroviral vectors can carry large gene units of up to 8 kb and do not elicit a specific immune response. Also, unlike other types of viral vectors, retroviral vectors enable long-term gene expression through integration of therapeutic genes into the human genome.

오랫동안 연구되어온 마우스 백혈병 바이러스 (Murine leukemia virus; 이하, MLV)는 레트로바이러스 벡터를 개발하기 위한 플랫폼으로 사용되었다. 레트로바이러스 벡터는 X 염색체 연관 중증 복합 면역 결핍 (X-linked severe combined immunodeficiency; SCID-X1), 아데노신 디아미나제 결핍 및 중증 종합 면역 결핍 (adenosine deaminase deficiency-severe combined immunodeficiency; ADA-SCID) 및 Wiskott-Aldrich 증후군 (Wiskott-Aldrich syndrome; WAS) 등의 유전 질환을 치료하는데 사용되어 왔다. 이러한 시도는 환자에게 거의 완전한 치료 효과를 가져왔다. Murine leukemia virus (MLV), which has been studied for a long time, was used as a platform for developing retroviral vectors. Retroviral vectors include X-linked severe combined immunodeficiency (SCID-X1), adenosine deaminase deficiency-severe combined immunodeficiency (ADA-SCID) and Wiskott- It has been used to treat genetic disorders such as Aldrich syndrome (Wiskott-Aldrich syndrome; WAS). Such an attempt has resulted in an almost complete therapeutic effect on the patient.

최근, ADA-SCID 환자를 치료하기 위한 MLV 벡터 기반 유전자 치료 약물인 스트림벨리스 (Strimvelis)가 유럽에서 승인되었다. 스트림벨리스는 인간 아데노신 디아미나제를 코딩하는 유전자를 탑재한 레트로바이러스 벡터가 도입된 CD34+ 세포를 사용하는 요법이다. Recently, Strimvelis, an MLV vector-based gene therapy drug for the treatment of ADA-SCID patients, was approved in Europe. Streambellis is a therapy using CD34+ cells into which a retroviral vector carrying a gene encoding human adenosine deaminase has been introduced.

추가적으로 두 가지 승인된 레트로바이러스 기반 치료제가 있다. 잘목시스 (Zalmoxis)는 절단된 형태의 인간 저 친화성 신경 성장 인자 수용체 (△LNGFR) 및 돌연변이된 단순 포진 I형 바이러스 티미딘키나제 (HSV-TK Mut2)를 암호화하는 유전자를 탑재한 레트로바이러스 벡터가 도입된 동종 이형 T 세포를 기초로 한다 (HSV-TK Mut2). 예스카다 (Yescarta)는 레트로바이러스 벡터를 적용하여 키메라 항원 수용체를 표면에 발현하도록 조작된 T 세포로 구성된 요법이다. In addition, there are two approved retroviral-based therapies. Zalmoxis is a retroviral vector carrying a gene encoding a truncated form of human low affinity nerve growth factor receptor (ΔLNGFR) and a mutated herpes simplex type I virus thymidine kinase (HSV-TK Mut2). Based on transduced allogeneic T cells (HSV-TK Mut2). Yescarta is a therapy consisting of T cells engineered to express a chimeric antigen receptor on the surface by applying a retroviral vector.

치료적 사용에 대한 그들의 긍정적인 특성과는 대조적으로, MLV-기반 레트로바이러스 벡터는 발암 가능성을 갖는다. 이러한 불리한 특성은 실험 및 임상적으로 검증되었다. MLV의 발암 가능성은 유전자 발현 조절에 관여하는 인간 게놈 부위를 MLV가 선호하는 것과 관련 있다. 특히, 레트로바이러스가 종양 유전자 TSS 근처의 게놈 부위에 삽입될 때, 해당 유전자가 활성화될 수 있고, 이로부터 통합된 레트로바이러스를 가지는 세포가 암세포로 변형될 수 있다. 이처럼 MLV 고유의, 특정 인간 유전체 부분 삽입 선호는 임상 적용에서 벡터 플랫폼으로서 광범위하게 사용되는 것을 제한한다.In contrast to their positive properties for therapeutic use, MLV-based retroviral vectors have carcinogenic potential. These adverse properties have been validated experimentally and clinically. The carcinogenic potential of MLV is related to MLV's preference for regions of the human genome involved in gene expression regulation. In particular, when a retrovirus is inserted into a genomic site near the oncogene TSS, the gene can be activated, from which a cell having an integrated retrovirus can be transformed into a cancer cell. This MLV-specific, specific human genome segment insertion preference limits its widespread use as a vector platform in clinical applications.

MLV의 인간유전체로의 삽입 패턴은 부분적으로 바이러스 인테그라제와 브로모 도메인 및 외부 말단 (bromodomain and extra-terminal; BET) 패밀리 단백질과의 상호 작용과 관련이 있는 것으로 최근 보고되었다. 이러한 발견에 기초하여 바이러스 인테그라제를 돌연변이 시키거나 작은 분자 (BET 단백질과 염색체의 결합을 선택적으로 방해하는)를 세포 내로 도입함으로써 관련 상호 작용을 차단하려는 여러 시도가 있었다. 이러한 방법들은 TSS를 포함한 조절 게놈 도메인으로의 MLV 삽입을 감소시킬 수 있다. 그러나 조절하려는 영역으로의 바이러스 삽입 빈도는 무작위 확률보다 여전히 훨씬 높다. 이러한 결과는 추가적인 숙주 인자 또는 알려지지 않은 여러 메커니즘들이 MLV의 인간 게놈 특정 영역 삽입 선호도에 기여함을 나타낸다.It has recently been reported that the pattern of MLV insertion into the human genome is partly related to the interaction of viral integrase with bromodomain and extra-terminal (BET) family proteins. Based on these findings, several attempts have been made to block the relevant interaction by mutating the viral integrase or introducing small molecules (which selectively interfere with the binding of BET proteins to chromosomes) into cells. These methods can reduce MLV insertion into regulatory genomic domains, including TSS. However, the frequency of virus insertion into the region to be controlled is still much higher than the random probability. These results indicate that additional host factors or several unknown mechanisms contribute to the human genome-specific region insertion preference of MLV.

다른 유형의 레트로바이러스인 인간 면역 결핍 바이러스 (human immunodeficiency virus; HIV-1)는 상피 유래 성장 인자 (LEDGF/p75)가 전사 단위 (Transcriptional units)로 삽입되도록 유도하는 메커니즘을 따르는 것으로 알려져 있다. 그러나, LEDGF/p75를 암호화하는 유전자의 제거로는 전사 단위로의 HIV-1 삽입을 완전히 차단할 수 없음도 관찰되었다. 추가 숙주 인자 (간세포 유래 성장 인자-관련 단백질 2 [hepatoma-derived growth factor-related protein 2; HRP-2)]) 또한 바이러스 삽입전-복합체 (pro-integration complex)를 특정 선호 게놈 영역으로 인도한다는 발견은, 바이러스 삽입 사이트 결정에 관여하는 숙주 인자에 대한 제한된 지식으로는, HIV-1 삽입 패턴을 완전히 전환하기 어려움을 보여준다.Another type of retrovirus, human immunodeficiency virus (HIV-1), is known to follow a mechanism that induces the insertion of epithelial-derived growth factor (LEDGF/p75) into transcriptional units. However, it was also observed that removal of the gene encoding LEDGF/p75 could not completely block HIV-1 insertion into the transcription unit. Discovered that additional host factors (hepatoma-derived growth factor-related protein 2 [HRP-2]) also direct viral pro-integration complexes to specific preferred genomic regions show that with limited knowledge of the host factors involved in the determination of the viral insertion site, it is difficult to completely switch the HIV-1 insertion pattern.

알려지지 않은 숙주 인자의 작용 모두를 완전히 차단하기는 불가능하므로, 본 발명자들은 대신 레트로바이러스 인테그라제 구조를 교란시켜 레트로바이러스 유전자 삽입 패턴을 변경시키려는 시도를 하였다. Since it is impossible to completely block the action of unknown host factors, we instead attempted to alter the retroviral gene insertion pattern by perturbing the retroviral integrase structure.

본 발명자들은 인테그라제의 내부 사이트에 히스톤과 루신 지퍼를 삽입하여 TSS를 선호하는 MLV 기반 레트로바이러스 벡터의 유전자 삽입 패턴을 변경하였다. 결과, TSS에 대한 선호도가 무작위 수준으로 낮아진 유전자 삽입 패턴을 얻었다. The present inventors changed the gene insertion pattern of the MLV-based retroviral vector favoring TSS by inserting histone and leucine zippers into the internal sites of integrase. As a result, a gene insertion pattern in which the preference for TSS was lowered to a random level was obtained.

또한, 인테그라제 돌연변이는 발암성 영역으로의 레트로바이러스 삽입 빈도를 크게 감소시켰다. 야생형 및 돌연변이 인테그라제의 예측된 구조 비교로부터 변경된 레트로바이러스의 유전자 삽입 패턴이 히스톤과 루신 지퍼의 삽입에 의한 것으로 추정되는, 해당 효소의 일부 하위 도메인 구조상 변화와 관련이 있음을 유추하였다.In addition, the integrase mutation greatly reduced the frequency of retroviral insertion into the oncogenic region. From the predicted structural comparison of wild-type and mutant integrase, it was inferred that the altered retrovirus gene insertion pattern was related to structural changes in some subdomains of the enzyme, presumed to be due to the insertion of histone and leucine zippers.

인테그라제의 구조적 변형은 삽입된 단백질과 해당 바이러스 단백질의 서브 도메인 사이에 새로 형성된 수소 결합과 부분적으로 연관된다고 추정하였다. 발명자가 얻은 결과는 인테그라제 구조를 정교하게 변화시키는 것이 안전한 레트로바이러스 벡터를 구축하는 좋은 방법임을 보여준다.It was hypothesized that the structural modification of integrase was partially related to the newly formed hydrogen bond between the inserted protein and the subdomain of the corresponding viral protein. The results obtained by the inventors show that elaborately changing the integrase structure is a good way to construct a safe retroviral vector.

이에 본 발명자들은 레트로바이러스 유전자 삽입 패턴을 변경하기 위해 히스톤 또는 루신 지퍼 단백질을 MLV 특정 내부 부위에 도입하였다. 히스톤은 다른 유형의 히스톤과 상호 작용할 수 있으며 루신 지퍼는 다른 루신 지퍼와 이합체를 형성할 수 있다. 두 가지 유형 단백질의 이러한 특성에 기초하여, 본 발명자들은 해당 단백질이 바이러스 인테그라제 내부에 도입될 때, MLV 유전자 삽입 패턴에서 큰 변화가 생김을 확인하였다. Accordingly, the present inventors introduced histone or leucine zipper proteins into MLV specific internal sites to change the retroviral gene insertion pattern. Histones can interact with other types of histones and leucine zippers can dimerize with other leucine zippers. Based on these characteristics of the two types of proteins, the present inventors confirmed that when the corresponding proteins were introduced into the viral integrase, a large change occurred in the MLV gene insertion pattern.

이에, 본 발명의 목적은 히스톤 또는 루신 지퍼의 인테그라제로의 도입을 통해 구축한 레트로바이러스 벡터를 제공하는 것이다. Accordingly, it is an object of the present invention to provide a retroviral vector constructed through the introduction of histone or leucine zipper into integrase.

본 발명의 다른 목적은 히스톤 또는 루신 지퍼의 인테그라제로의 도입을 통한 레트로바이러스 벡터 구축 방법을 제공하는 것이다.Another object of the present invention is to provide a method for constructing a retroviral vector through the introduction of a histone or leucine zipper into an integrase.

본 발명의 또 다른 목적은 히스톤 또는 루신 지퍼의 인테그라제로의 도입을 통해 구축한 레트로바이러스 벡터의 용도를 제공하는 것이다.Another object of the present invention is to provide the use of a retroviral vector constructed through the introduction of a histone or leucine zipper into an integrase.

본 발명은 히스톤 또는 루신 지퍼의 인테그라제로의 도입을 통한 안전한 레트로바이러스 벡터 구축 방법에 관한 것이다. The present invention relates to a method for constructing a safe retroviral vector through the introduction of histone or leucine zipper into an integrase.

본 발명은 히스톤 또는 루신 지퍼를 인테그라제 단백질의 37번째 및/또는 273번째 잔기 앞에 도입하여 전사 개시 부위 (transcriptional start site; TSS)에 대한 삽입 (integration) 선호도를 소멸시킴으로써, 구축된 벡터가 발암 유전자를 과발현시킬 수 있는 위험성을 제거하고 임상 응용 및 질병 치료에 유용하게 사용될 수 있도록 할 것이다. The present invention introduces a histone or leucine zipper before the 37th and/or 273th residue of the integrase protein to eliminate the integration preference for a transcriptional start site (TSS), so that the constructed vector is an oncogene It will eliminate the risk of overexpression and make it useful for clinical applications and disease treatment.

이하 본 발명을 더욱 자세히 설명하고자 한다.Hereinafter, the present invention will be described in more detail.

본 발명의 일 예는 히스톤 또는 루신 지퍼를 코딩하는 유전자를 레트로바이러스 벡터의 주요소인 Gag-Pol 발현을 위한 유전자 내로 도입하는 것에 관한 것이다.An example of the present invention relates to introducing a gene encoding a histone or leucine zipper into a gene for Gag-Pol expression, which is a major element of a retroviral vector.

본 발명에 있어서 레트로바이러스 벡터는 MLV-기반 레트로바이러스 벡터, HIV-1 기반 레트로바이러스 벡터, ASLV 기반 레트로바이러스 벡터인 것일 수 있으며, 예를 들어, MLV-기반 레트로바이러스 벡터인 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the retroviral vector may be an MLV-based retroviral vector, an HIV-1 based retroviral vector, or an ASLV-based retroviral vector, for example, it may be an MLV-based retroviral vector, but is limited thereto. it's not going to be

본 발명에 있어서 히스톤 또는 루신 지퍼를 코딩하는 유전자는 인테그라제를 코딩하는 유전자에 도입된 것일 수 있다.In the present invention, the gene encoding a histone or leucine zipper may be introduced into a gene encoding an integrase.

본 발명에 있어서 인테그라제는 MLV 인테그라제, HIV-1 인테그라제, ASLV 인테그라제 등인 것일 수 있으며, 예를 들어, MLV 인테그라제인 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the integrase may be MLV integrase, HIV-1 integrase, ASLV integrase, etc., for example, may be MLV integrase, but is not limited thereto.

본 발명에 있어서 인테그라제를 코딩하는 유전자는 서열번호 83의 염기서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 83의 염기서열로 이루어진 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the gene encoding integrase may include the nucleotide sequence of SEQ ID NO: 83, for example, it may consist of the nucleotide sequence of SEQ ID NO: 83, but is not limited thereto.

본 발명에 있어서 인테그라제는 서열번호 84의 아미노산 서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 84의 아미노산 서열로 이루어진 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, integrase may include the amino acid sequence of SEQ ID NO: 84, for example, may consist of the amino acid sequence of SEQ ID NO: 84, but is not limited thereto.

본 발명에 있어서 히스톤은 서열번호 70 내지 76으로 이루어진 군에서 선택된 아미노산 서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 70 내지 76으로 이루어진 군에서 선택된 아미노산 서열로 이루어진 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the histone may include an amino acid sequence selected from the group consisting of SEQ ID NOs: 70 to 76, for example, may consist of an amino acid sequence selected from the group consisting of SEQ ID NOs: 70 to 76, but is limited thereto it is not

본 발명에 있어서 히스톤을 코딩하는 유전자는 서열번호 52 내지 58로 이루어진 군에서 선택된 염기서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 52 내지 58로 이루어진 군에서 선택된 염기서열로 이루어진 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the histone-encoding gene may include a nucleotide sequence selected from the group consisting of SEQ ID NOs: 52 to 58, for example, may consist of a nucleotide sequence selected from the group consisting of SEQ ID NOs: 52 to 58 , but is not limited thereto.

본 발명에 있어서 히스톤은 C-말단, N-말단 또는 양 말단에 제1 링커를 포함하는 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the histone may include the first linker at the C-terminus, the N-terminus or both ends, but is not limited thereto.

본 발명에 있어서 히스톤을 코딩하는 유전자는 3', 5'또는 이들 모두에 제1 링커를 코딩하는 유전자를 포함하는 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the gene encoding the histone may include a gene encoding the first linker in 3', 5' or both, but is not limited thereto.

본 발명에 있어서 제1 링커는 통상의 기술자가 사용하는 어떠한 링커도 사용할 수 있다.In the present invention, any linker used by a person skilled in the art may be used as the first linker.

본 발명의 일 구체예에 있어서, 제1 링커는 서열번호 77의 아미노산 서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 77의 아미노산 서열로 이루어진 것일 수 있으나, 이에 한정되는 것은 아니다.In one embodiment of the present invention, the first linker may include the amino acid sequence of SEQ ID NO: 77, for example, may consist of the amino acid sequence of SEQ ID NO: 77, but is not limited thereto.

본 발명의 일 구체예에 있어서, 제1 링커를 코딩하는 유전자는 서열번호 59의 염기서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 59의 염기서열로 이루어진 것일 수 있으나, 이에 한정되는 것은 아니다.In one embodiment of the present invention, the gene encoding the first linker may include the nucleotide sequence of SEQ ID NO: 59, for example, it may consist of the nucleotide sequence of SEQ ID NO: 59, but is limited thereto no.

본 발명에 있어서 루신 지퍼는 서열번호 78의 아미노산 서열을 포함하는 NZ 서열 및 서열번호 79의 아미노산 서열을 포함하는 CZ 서열; 또는 서열번호 80의 아미노산 서열을 포함하는 Jun 서열 및 서열번호 81의 아미노산 서열을 포함하는 Fos 서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 78의 아미노산 서열로 이루어진 NZ 서열 및 서열번호 79의 아미노산 서열로 이루어진 CZ 서열; 또는 서열번호 80의 아미노산 서열로 이루어진 Jun 서열 및 서열번호 81의 아미노산 서열로 이루어진 Fos 서열을 을 포함하는 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the leucine zipper comprises a NZ sequence comprising the amino acid sequence of SEQ ID NO: 78 and a CZ sequence comprising the amino acid sequence of SEQ ID NO: 79; Or it may include a Jun sequence comprising the amino acid sequence of SEQ ID NO: 80 and a Fos sequence comprising the amino acid sequence of SEQ ID NO: 81, for example, the NZ sequence consisting of the amino acid sequence of SEQ ID NO: 78 and SEQ ID NO: 79 a CZ sequence consisting of an amino acid sequence; Alternatively, the Jun sequence consisting of the amino acid sequence of SEQ ID NO: 80 and the Fos sequence consisting of the amino acid sequence of SEQ ID NO: 81 may include, but are not limited thereto.

본 발명에 있어서 NZ 서열을 코딩하는 유전자는 서열번호 60의 염기서열을 포함하는 염기서열인 것일 수 있으며, 예를 들어, 서열번호 60의 염기서열로 이루어진 염기서열인 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the gene encoding the NZ sequence may be a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 60, for example, it may be a nucleotide sequence consisting of the nucleotide sequence of SEQ ID NO: 60, but is limited thereto no.

본 발명에 있어서 CZ 서열을 코딩하는 유전자는 서열번호 61의 염기서열을 포함하는 염기서열인 것일 수 있으며, 예를 들어, 서열번호 61의 염기서열로 이루어진 염기서열인 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the gene encoding the CZ sequence may be a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 61, for example, may be a nucleotide sequence consisting of the nucleotide sequence of SEQ ID NO: 61, but is limited thereto no.

본 발명에 있어서 Jun 서열을 코딩하는 유전자는 서열번호 62의 염기서열을 포함하는 염기서열인 것일 수 있으며, 예를 들어, 서열번호 62의 염기서열로 이루어진 염기서열인 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the gene encoding the Jun sequence may be a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 62, for example, it may be a nucleotide sequence consisting of the nucleotide sequence of SEQ ID NO: 62, but is limited thereto no.

본 발명에 있어서 Fos 서열을 코딩하는 유전자는 서열번호 63의 염기서열을 포함하는 염기서열인 것일 수 있으며, 예를 들어, 서열번호 63의 염기서열로 이루어진 염기서열인 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the gene encoding the Fos sequence may be a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 63, for example, may be a nucleotide sequence consisting of the nucleotide sequence of SEQ ID NO: 63, but is limited thereto no.

본 발명에 있어서 루신 지퍼는 C-말단, N-말단 또는 양 말단에 제2 링커를 포함하는 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the leucine zipper may include a second linker at the C-terminus, the N-terminus or both ends, but is not limited thereto.

본 발명에 있어서 루신 지퍼를 코딩하는 유전자는 3', 5'또는 이들 모두에 제2 링커를 코딩하는 유전자를 포함하는 것일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the gene encoding the leucine zipper may include a gene encoding a second linker in 3', 5', or both, but is not limited thereto.

본 발명에 있어서 NZ 서열과 CZ 서열; 또는 Jun 서열과 Fos 서열은 제2 링커를 통해 연결된 것일 수 있으나, 이에 한정되는 것은 아니다.NZ sequence and CZ sequence in the present invention; Alternatively, the Jun sequence and the Fos sequence may be linked through a second linker, but the present invention is not limited thereto.

본 발명에 있어서 제2 링커는 통상의 기술자가 사용하는 어떠한 링커도 사용할 수 있다.As the second linker in the present invention, any linker used by a person skilled in the art may be used.

본 발명의 일 구체예에 있어서, 제2 링커는 서열번호 82의 아미노산 서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 82의 아미노산 서열로 이루어진 것일 수 있으나, 이에 한정되는 것은 아니다.In one embodiment of the present invention, the second linker may include the amino acid sequence of SEQ ID NO: 82, for example, may consist of the amino acid sequence of SEQ ID NO: 82, but is not limited thereto.

본 발명의 일 구체예에 있어서, 제2 링커를 코딩하는 유전자는 서열번호 64 내지 서열번호 69로 이루어진 군에서 선택된 1종의 염기서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 64 내지 서열번호 69로 이루어진 군에서 선택된 1종의 염기서열로 이루어진 것일 수 있으나, 이에 한정되는 것은 아니다.In one embodiment of the present invention, the gene encoding the second linker may include one type of nucleotide sequence selected from the group consisting of SEQ ID NO: 64 to SEQ ID NO: 69, for example, SEQ ID NO: 64 to sequence It may consist of one type of nucleotide sequence selected from the group consisting of number 69, but is not limited thereto.

본 발명의 일 구체예에 있어서, 상기 루신 지퍼가 서열번호 78의 아미노산 서열을 포함하는 NZ 서열 및 서열번호 79의 아미노산 서열을 포함하는 CZ 서열을 포함하는 것일 경우, 루신 지퍼를 코딩하는 유전자는 5'에는 서열번호 64를 포함하는 제2 링커를 코딩하는 유전자를 포함하고, 3'에는 서열번호 66을 포함하는 제2 링커를 코딩하는 유전자를 포함하는 것일 수 있으며, 예를 들어, 5'에는 서열번호 64로 이루어진 제2 링커를 코딩하는 유전자를 포함하고, 3'에는 서열번호 66으로 이루어진 제2 링커를 코딩하는 유전자를 포함하는 것일 수 있으나, 이에 한정되는 것은 아니다.In one embodiment of the present invention, when the leucine zipper comprises the NZ sequence comprising the amino acid sequence of SEQ ID NO: 78 and the CZ sequence comprising the amino acid sequence of SEQ ID NO: 79, the gene encoding the leucine zipper is 5 ' may include a gene encoding a second linker comprising SEQ ID NO: 64, and 3' may include a gene encoding a second linker comprising SEQ ID NO: 66, for example, 5' includes a sequence It may include a gene encoding a second linker consisting of number 64, and may include a gene encoding a second linker consisting of SEQ ID NO: 66 in 3', but is not limited thereto.

본 발명의 일 구체예에 있어서, 상기 루신 지퍼가 서열번호 80의 아미노산 서열을 포함하는 Jun 서열 및 서열번호 81의 아미노산 서열을 포함하는 Fos 서열을 포함하는 것일 경우, 루신 지퍼를 코딩하는 유전자는 5'에는 서열번호 67를 포함하는 제2 링커를 코딩하는 유전자를 포함하고, 3'에는 서열번호 69을 포함하는 제2 링커를 코딩하는 유전자를 포함하는 것일 수 있으며, 예를 들어, 5'에는 서열번호 67로 이루어진 제2 링커를 코딩하는 유전자를 포함하고, 3'에는 서열번호 69로 이루어진 제2 링커를 코딩하는 유전자를 포함하는 것일 수 있으나, 이에 한정되는 것은 아니다.In one embodiment of the present invention, when the leucine zipper comprises a Jun sequence comprising the amino acid sequence of SEQ ID NO: 80 and a Fos sequence comprising the amino acid sequence of SEQ ID NO: 81, the gene encoding the leucine zipper is 5 ' may include a gene encoding a second linker comprising SEQ ID NO: 67, and 3' may include a gene encoding a second linker comprising SEQ ID NO: 69, for example, 5' has a sequence It may include a gene encoding a second linker consisting of number 67, and may include a gene encoding a second linker consisting of SEQ ID NO: 69 in 3', but is not limited thereto.

본 발명의 일 구체예에 있어서, NZ 서열과 CZ 서열이 제2 링커를 통해 연결된 경우, 제2 링커를 코딩하는 유전자는 서열번호 65의 염기서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 65의 염기서열로 이루어진 것일 수 있으나, 이에 한정되는 것은 아니다.In one embodiment of the present invention, when the NZ sequence and the CZ sequence are linked through a second linker, the gene encoding the second linker may include the nucleotide sequence of SEQ ID NO: 65, for example, SEQ ID NO: It may consist of a nucleotide sequence of 65, but is not limited thereto.

본 발명의 일 구체예에 있어서, Jun 서열과 Fos 서열이 제2 링커를 통해 연결된 경우, 제2 링커를 코딩하는 유전자는 서열번호 68의 염기서열을 포함하는 것일 수 있으며, 예를 들어, 서열번호 68의 염기서열로 이루어진 것일 수 있으나, 이에 한정되는 것은 아니다.In one embodiment of the present invention, when the Jun sequence and the Fos sequence are linked through a second linker, the gene encoding the second linker may include the nucleotide sequence of SEQ ID NO: 68, for example, SEQ ID NO: It may consist of the nucleotide sequence of 68, but is not limited thereto.

본 발명에 있어서 히스톤을 코딩하는 유전자 또는 루신 지퍼를 코딩하는 유전자는 인테그라제를 코딩하는 유전자의 108 또는 816 번 위치 다음에 삽입된 것일 수 있다.In the present invention, the gene encoding the histone or the gene encoding the leucine zipper may be inserted after position 108 or 816 of the gene encoding integrase.

본 발명에 있어서 히스톤 또는 루신 지퍼는 인테그라제의 37 또는 273 번 잔기 앞에 삽입된 것일 수 있다. 이를 통해 전사 개시 부위 (transcriptional start site; TSS)에 대한 삽입 (integration) 선호도를 소멸시킴으로써, 발암 유전자를 과발현시킬 수 있는 위험성이 제거되고 임상 응용 및 질병 치료에 유용하게 사용될 수 있다.In the present invention, the histone or leucine zipper may be inserted before residues 37 or 273 of integrase. Through this, by eliminating the preference for integration to the transcriptional start site (TSS), the risk of overexpressing oncogenes is eliminated, and it can be usefully used in clinical applications and disease treatment.

본 발명에 용어 "벡터(vector)"는 숙주 세포에서 목적 유전자를 발현시키기 위한 수단을 의미한다. 예를 들어, 레트로바이러스 벡터인 것일 수 있다. As used herein, the term “vector” refers to a means for expressing a target gene in a host cell. For example, it may be a retroviral vector.

본 발명에 있어서 재조합 벡터는 전형적으로 클로닝을 위한 벡터 또는 발현을 위한 벡터로서 구축될 수 있다. 상기 발현용 벡터는 당업계에서 식물, 동물 또는 미생물에서 외래의 단백질을 발현하는 데 사용되는 통상의 것을 사용할 수 있다. 상기 재조합 벡터는 당업계에 공지된 다양한 방법을 통해 구축될 수 있다.In the present invention, a recombinant vector can be typically constructed as a vector for cloning or a vector for expression. The expression vector may be a conventional vector used to express a foreign protein in plants, animals or microorganisms in the art. The recombinant vector can be constructed through various methods known in the art.

본 발명의 벡터 생산을 위한 유전자의 숙주 세포 내로의 운반(도입)은, 당업계에 널리 알려진 방법을 사용할 수 있다. 상기 방법은, 예를 들어, 숙주 세포가 원핵 세포인 경우, CaCl2 방법 또는 전기 천공 방법 등을 사용할 수 있고, 숙주 세포가 진핵 세포인 경우에는, 미세 주입법, 칼슘 포스페이트 침전법, 전기 천공법, 리포좀매개 형질감염법 및 유전자 밤바드먼트 등을 사용할 수 있으나, 이에 한정되는 것은 아니다.For the delivery (introduction) of a gene into a host cell for production of the vector of the present invention, a method well known in the art can be used. The method is, for example, when the host cell is a prokaryotic cell, CaCl 2 method or electroporation method, etc. can be used, and when the host cell is a eukaryotic cell, microinjection method, calcium phosphate precipitation method, electroporation method, Liposome-mediated transfection and gene bombardment may be used, but the present invention is not limited thereto.

본 발명의 다른 일 예는 하기의 단계를 포함하는 히스톤 또는 루신 지퍼를 코딩하는 유전자가 도입된 레트로바이러스 벡터 구축 방법에 관한 것이다.Another embodiment of the present invention relates to a method for constructing a retroviral vector into which a gene encoding a histone or leucine zipper is introduced, comprising the following steps.

히스톤 또는 루신 지퍼를 코딩하는 유전자를 준비하는 유전자 준비 단계; 및Gene preparation step of preparing a gene encoding a histone or leucine zipper; and

유전자를 레트로바이러스 인테그라제 유전자에 도입하는 도입 단계.An introduction step in which the gene is introduced into the retroviral integrase gene.

본 발명에 있어서 도입 단계는 히스톤 또는 루신 지퍼를 코딩하는 유전자를 인테그라제를 코딩하는 유전자에 도입하는 것일 수 있다.In the present invention, the introducing step may be introducing a gene encoding a histone or leucine zipper into a gene encoding integrase.

본 발명의 방법에 있어서 히스톤 또는 루신 지퍼에 대한 기재는 기 상술한 바와 동일하여, 그 기재를 생략한다.In the method of the present invention, the description of the histone or leucine zipper is the same as described above, and the description thereof is omitted.

본 발명의 방법에 있어서 히스톤 또는 루신 지퍼를 코딩하는 유전자에 대한 기재는 기 상술한 바와 동일하여, 그 기재를 생략한다.In the method of the present invention, the description of the gene encoding the histone or leucine zipper is the same as described above, and thus the description thereof is omitted.

본 발명의 또 다른 일 예는 히스톤 또는 루신 지퍼의 인테그라제로의 도입을 통해 구축된 안전한 레트로바이러스 벡터의 용도에 관한 것이다.Another embodiment of the present invention relates to the use of a safe retroviral vector constructed through the introduction of a histone or leucine zipper into an integrase.

본 발명에 있어서 용도는 다양한 동물 및 인간 세포로의 유전자 도입을 통한 치료 효과 획득 (유전자 치료)용, 목적 유전자를 다양한 동물 및 인간 세포 유전체로 도입하여 연구, 치료 목적을 가진 새로운 세포 개발용, 암을 포함한 다양한 질환을 치료하기 위한 면역치료제 개발용일 수 있으나, 이에 한정되는 것은 아니다.In the present invention, the use is for obtaining a therapeutic effect (gene therapy) through gene introduction into various animal and human cells, for research by introducing a target gene into various animal and human cell genomes, for developing new cells for therapeutic purposes, cancer It may be for the development of an immunotherapeutic agent for treating various diseases, including, but not limited to.

본 발명의 용도에 있어서 레트로바이러스 벡터 및 이의 구축 방법에 대해서는 기 상술한 바와 동일하여, 그 기재를 생략한다.For the use of the present invention, the retroviral vector and its construction method are the same as described above, and the description thereof will be omitted.

본 발명은 히스톤 또는 루신 지퍼의 인테그라제로의 도입을 통해 구축한 레트로바이러스 벡터, 이의 구축 방법 및 이의 용도에 관한 것이다. 본 발명은 히스톤 또는 루신 지퍼를 인테그라제 단백질의 37번째 및/또는 273번째 잔기 앞에 삽입하여 전사 개시 부위 (transcriptional start site; TSS)에 대한 유전자 삽입 (integration) 선호도를 소멸시킴으로써, 발암 유전자를 과발현시킬 수 있는 위험성을 제거하므로 임상 응용 및 질병 치료에 유용하게 사용될 수 있다.The present invention relates to a retroviral vector constructed through the introduction of histone or leucine zipper into an integrase, a method for constructing the same, and a use thereof. The present invention inserts a histone or leucine zipper before the 37th and/or 273th residue of the integrase protein to eliminate gene integration preference for a transcriptional start site (TSS), thereby overexpressing an oncogene. It can be usefully used for clinical applications and disease treatment as it eliminates the risk of possible risks.

도 1은 본 발명의 일 실시예에 따른 히스톤 또는 루신 지퍼를 포함하는 돌연변이 MLV 인테그라제의 구성을 보여주는 그림이다.
도 2는 본 발명의 일 실시예에 따른 바이러스 벡터의 형질 도입 역가 (Transducing titer)를 보여주는 그래프이다.
도 3은 본 발명의 일 실시예에 따른 단백질 코딩 유전자의 TSSs 5kb 내의 게놈 부위로의 레트로바이러스 벡터 삽입 빈도를 보여주는 그래프이다.
도 4a는 본 발명의 일 실시예에 따른 TSS로부터 5kb 이내 레트로바이러스 벡터 삽입 분포를 보여주는 그래프이다.
도 4b는 본 발명의 일 실시예에 따른 TSS로부터 50kb 이내 레트로바이러스 벡터 삽입 분포를 보여주는 그래프이다.
도 4c는 본 발명의 일 실시예에 따른 TSS로부터의 거리에 따른 바이러스 삽입 누적 빈도를 보여주는 그래프이다.
도 5는 본 발명의 일 실시예에 따른 발암 부위 레트로바이러스 벡터 삽입 빈도를 보여주는 그래프이다.
도 6a는 본 발명의 일 실시예에 따른 CpG 섬 근처 레트로바이러스 벡터 삽입 빈도를 보여주는 그래프이다.
도 6b는 본 발명의 일 실시예에 따른 cis 조절 요소 근처 레트로바이러스 벡터 삽입 빈도를 보여주는 그래프이다.
도 7a는 본 발명의 일 실시예에 따른 CpG 섬 및 cis-조절 요소로부터 5kb 내 레트로바이러스 벡터 삽입 분포를 보여주는 그래프이다.
도 7b는 본 발명의 일 실시예에 따른 CpG 섬 및 cis-조절 요소에서 50kb의 범위에서 레트로바이러스 벡터 삽입의 공간적 분포를 보여주는 그래프이다.
도 7c는 본 발명의 일 실시예에 따른 CpG 섬으로부터의 거리에 따른 레트로바이러스 벡터 삽입 누적 빈도를 보여주는 그래프이다.
도 7d는 본 발명의 일 실시예에 따른 cis-조절 요소로부터의 거리에 따른 레트로바이러스 벡터 삽입 누적 빈도를 보여주는 그래프이다.
도 8a는 본 발명의 일 실시예에 따른 야생형 및 돌연변이 인테그라제의 예측된 구조를 보여주는 그림이다.
도 8b는 본 발명의 일 실시예에 따른 MLV 인테그라제와 삽입된 히스톤 (H3.3) 사이의 수소 결합 형성을 예측한 결과 그림이다.
1 is a diagram showing the construction of a mutant MLV integrase comprising a histone or leucine zipper according to an embodiment of the present invention.
2 is a graph showing the transducing titer of a viral vector according to an embodiment of the present invention.
3 is a graph showing the frequency of retroviral vector insertion into a genomic region within 5 kb of TSSs of a protein-coding gene according to an embodiment of the present invention.
Figure 4a is a graph showing the distribution of retroviral vector insertion within 5 kb from TSS according to an embodiment of the present invention.
Figure 4b is a graph showing the distribution of retroviral vector insertion within 50 kb from TSS according to an embodiment of the present invention.
Figure 4c is a graph showing the cumulative frequency of virus insertion according to the distance from the TSS according to an embodiment of the present invention.
5 is a graph showing the frequency of insertion of a retroviral vector into an oncogenic site according to an embodiment of the present invention.
Figure 6a is a graph showing the frequency of retroviral vector insertion near the CpG island according to an embodiment of the present invention.
Figure 6b is a graph showing the frequency of retroviral vector insertion near the cis regulatory element according to an embodiment of the present invention.
7A is a graph showing the distribution of retroviral vector insertion within 5 kb from CpG islands and cis-regulatory elements according to an embodiment of the present invention.
7B is a graph showing the spatial distribution of retroviral vector insertion in the range of 50 kb in CpG islands and cis-regulatory elements according to an embodiment of the present invention.
7c is a graph showing the cumulative frequency of retroviral vector insertion according to the distance from the CpG island according to an embodiment of the present invention.
7D is a graph showing the cumulative frequency of retroviral vector insertion according to the distance from the cis-regulatory element according to an embodiment of the present invention.
8A is a diagram showing the predicted structure of wild-type and mutant integrase according to an embodiment of the present invention.
FIG. 8b is a graph showing the prediction result of hydrogen bond formation between MLV integrase and the inserted histone (H3.3) according to an embodiment of the present invention.

이하, 본 발명을 하기의 실시예에 의하여 더욱 상세히 설명한다. 그러나 이들 실시예는 본 발명을 예시하기 위한 것일 뿐이며, 본 발명의 범위가 이들 실시예에 의하여 한정되는 것은 아니다.Hereinafter, the present invention will be described in more detail with reference to the following examples. However, these examples are only for illustrating the present invention, and the scope of the present invention is not limited by these examples.

실험 방법Experimental method

인테그라제 돌연변이체를 코딩하는 플라스미드의 구축Construction of Plasmids Encoding Integrase Mutants

7 가지 유형의 히스톤 및 2 가지 유형의 루신 지퍼를 코딩하는 유전자를 MLV 인테그라제 유전자 내의 2 개의 부위 (해당 단백질 37 및 273 번째 아미노산 잔기에 해당)에 도입하여, gag-pol 폴리프로틴의 일부로서 돌연변이체 인테그라제를 암호화하는 플라스미드를 구축하였다. Genes encoding seven types of histones and two types of leucine zippers were introduced at two sites within the MLV integrase gene (corresponding to amino acid residues 37 and 273 of the corresponding protein), resulting in mutations as part of the gag-pol polyprotein A plasmid encoding the chain integrase was constructed.

히스톤을 코딩하는 DNA를 얻기 위해, 인간 배아 신장 (human embryonic kidney; HEK) 293T 세포의 H2A (H2A.1 및 H2A.2), H2B 및 H4의 mRNA로부터 cDNA 합성을 수행하고, HeLa 세포의 H3의 mRNA (H3.1, H3.2, 및 H3.3)로부터 cDNA 합성을 수행하였다. cDNA 합성은 올리고 dT 및 랜덤 헥사머와 함께 SuperScript III CellsDirect cDNA 합성 시스템 (미국 캘리포니아 주 칼스배드 소재의 Invitrogen)의 프로토콜에 따라 수행하였다. 중합 효소 연쇄 반응 (PCR)-기반 cDNA 증폭은 다음의 열 사이클로 수행되었다: To obtain DNA encoding histones, cDNA synthesis was performed from mRNA of H2A (H2A.1 and H2A.2), H2B and H4 of human embryonic kidney (HEK) 293T cells, and H3 of HeLa cells cDNA synthesis was performed from mRNA (H3.1, H3.2, and H3.3). cDNA synthesis was performed according to the protocol of the SuperScript III CellsDirect cDNA synthesis system (Invitrogen, Carlsbad, CA) with oligo dT and random hexamers. Polymerase chain reaction (PCR)-based cDNA amplification was performed with the following thermal cycle:

95 ℃에서 2분 동안 초기 변성; Initial denaturation at 95 °C for 2 min;

95 ℃에서 30초 동안 변성, 55 ℃에서 30초 동안 어닐링 및 72 ℃에서 27초 동안 연장 40 사이클;40 cycles of denaturation at 95° C. for 30 sec, annealing at 55° C. for 30 sec and extension at 72° C. for 27 sec;

72 ℃에서 2분 동안 최종 연장; 및final extension at 72° C. for 2 min; and

4 ℃에서 3 분 동안 냉각. Cool for 3 min at 4 °C.

PCR 반응은 C1000 PCR 기계 (Bio-Rad, Hercules, CA, USA), Taq DNA 폴리머라제 (New England Biolabs (NEB), Ipswich, MA, USA) 또는 Phusion High-Fidelity DNA Polymerase (NEB)를 사용하여 수행하였고, 링커 서열 (서열번호 1)을 갖는 프라이머를 이용하였다. 두 가지 유형의 루신 지퍼 단백질 (NZ-CZ 및 Jun-Fos)을 암호화하는 DNA 서열을 Genescript (홍콩, 중국)으로부터 얻어 증폭 후 pCMV gag-pol 플라스미드 내의 CMV 프로모터 다음에 도입하였다.PCR reactions were performed using a C1000 PCR machine (Bio-Rad, Hercules, CA, USA), Taq DNA polymerase (New England Biolabs (NEB), Ipswich, MA, USA) or Phusion High-Fidelity DNA Polymerase (NEB). and a primer having a linker sequence (SEQ ID NO: 1) was used. DNA sequences encoding two types of leucine zipper proteins (NZ-CZ and Jun-Fos) were obtained from Genescript (Hong Kong, China) and introduced after amplification after the CMV promoter in the pCMV gag-pol plasmid.

서열
번호
order
number
명명denomination 서열목록 (5'-> 3')Sequence Listing (5'-> 3') 비고note
1One LinkerLinker DDPVATDDPVAT 22 H2A_sense_primerH2A_sense_primer AAAAAGCGCTGATCCACCGGTCGCCACCATGTCTGGACGTGGCAAGCAGAAAAAGCGCTGATCCACCGGTCGCCACCATGTCTGGACGTGGCAAGCAG 33 H2A_antisense_primerH2A_antisense_primer AAAAGCTAGCGGTGGCGACCGGTGGATCCTTGCCCTTAGCTTTGTGGTGGAAAAGCTAGCGGTGGCGACCGGTGGATCCTTGCCCTTAGCTTTGTGGTGG 44 H2B_sense_primerH2B_sense_primer AAAAGGCGCCGATCCACCGGTCGCCACCATGCCTGAGCCAGCGAAATCCAAAAGGCGCCGATCCACCGGTCGCCACCATGCCTGAGCCAGCGAAATCC 55 H2B_antisense_primerH2B_antisense_primer AAAAGCTAGCGGTGGCGACCGGTGGATCCTTGGAGCTGGTGTACTTGGTAACGAAAAGCTAGCGGTGGCGACCGGTGGATCCTTGGAGCTGGTGTACTTGGTAACG 66 H3.1_sense_primerH3.1_sense_primer AAAAAGCGCTGATCCACCGGTCGCCACCATGGCACGCACGAAGCAAACAAAAAGCGCTGATCCACCGGTCGCCACCATGGCACGCACGAAGCAAAC 77 H3.1_antisense_primerH3.1_antisense_primer AAAAGCTAGCGGTGGCGACCGGTGGATCTGCCCTCTCTCCGCGAATGAAAAGCTAGCGGTGGCGACCGGTGGATCTGCCCTCTCTCCGCGAATG 88 H3.2_sense_primerH3.2_sense_primer AAAAAGCGCTGATCCACCGGTCGCCACCATGGCCCGTACTAAGCAGACTGCAAAAAGCGCTGATCCACCGGTCGCCACCATGGCCCGTACTAAGCAGACTGC 99 H3.2_antisense_primerH3.2_antisense_primer AAAAGCTAGCGGTGGCGACCGGTGGATCAGCCCGCTCTCCACGGATGAAAAGCTAGCGGTGGCGACCGGTGGATCAGCCCGCTCTCCACGGATG 1010 H3.3_sense_primerH3.3_sense_primer AAAAAGCGCTGATCCACCGGTCGCCACCATGGCTCGTACAAAGCAGACTGCCAAAAAGCGCTGATCCACCGGTCGCCACCATGGCTCGTACAAAGCAGACTGCC 1111 H3.3_antisense_primerH3.3_antisense_primer AAAAGCTAGCGGTGGCGACCGGTGGATCAGCACGTTCTCCACGTATGCGAAAAGCTAGCGGTGGCGACCGGTGGATCAGCACGTTCTCCACGTATGCG 1212 H4_sense_primerH4_sense_primer AAAAAGCGCTGATCCACCGGTCGCCACCATGTCCGGCAGAGGAAAGGGAAAAAGCGCTGATCCACCGGTCGCCACCATGTCCGGCAGAGGAAAGGG 1313 H4_antisense_primerH4_antisense_primer AAAAGCTAGCGGTGGCGACCGGTGGATCGCCTCCGAAGCCGTACAGGAAAAGCTAGCGGTGGCGACCGGTGGATCGCCTCCGAAGCCGTACAGG

세포 배양cell culture

HEK 293T 세포 및 HeLa 세포를 각각 37 ℃ 및 5% CO2 조건에서 Modified Dulbecco's medium (Gibco Life Technologies, Carlsbad, CA) 및 Dulbecco's modified Eagle medium (Gibco Life Technologies)를 이용하여 각각 배양하였다. 이들 배지 각각에는 10% 우태아 혈청 (Gibco Life Technologies) 및 1% 페니실린-스트렙토마이신 (Gibco Life Technologies)이 보충되었다.HEK 293T cells and HeLa cells were cultured at 37 ° C. and 5% CO 2 conditions, respectively, using Modified Dulbecco's medium (Gibco Life Technologies, Carlsbad, CA) and Dulbecco's modified Eagle medium (Gibco Life Technologies), respectively. Each of these media was supplemented with 10% fetal bovine serum (Gibco Life Technologies) and 1% penicillin-streptomycin (Gibco Life Technologies).

레트로바이러스 벡터 패키징Retrovirus vector packaging

레트로바이러스 벡터를 패키징하기 위해, 벡터 게놈 (pCLPIT GFP, 10 ug), 야생형 gag-pol 폴리프로틴 또는 돌연변이체 (pCMV gag-pol, pCMV gag-pol-histone 또는 pCMV gag-pol-leucine zipper, 6 ug)를 암호화하는 플라스미드, 외피 단백질을 암호화한 플라스미드 (pcDNA IVS VSVG, 4 ug)를 인산 칼슘계 형질 변환 방법에 의해 HEK 293T 세포 내로 도입하였다. 형질 변환된 세포를 형질 변환 12 시간 후 포스페이트-완충 식염수 (PBS, Gibco Life Technologies)로 2회 세척하고, 새로운 배지에서 추가로 배양하였다. 패키징된 바이러스 입자를 함유하는 세포 상청액은 형질 변환 후 36 시간 및 60 시간에 2회 수득되었다. 수득된 세포 상청액을 먼저 0.45 um 주사기 필터를 통해 여과한 다음 Optima ?? Ultracentrifuge LE-80K (Beckman Coulter, Brea, CA, USA) 기기로 4 ℃에서 20 %(w/v) 수크로오스 쿠션 상에서 초원심 분리, 농축하였다. 초원심 분리는 2시간 동안 24,000 rpm으로 SW28을 사용하여 수행되었다. 수득된 바이러스 입자 펠렛을 냉각된 인산염 완충 식염수로 재현탁하였다.For packaging retroviral vectors, the vector genome (pCLPIT GFP, 10 ug), wild-type gag-pol polyprotein or mutant (pCMV gag-pol, pCMV gag-pol-histone or pCMV gag-pol-leucine zipper, 6 ug) ) and a plasmid encoding the envelope protein (pcDNA IVS VSVG, 4 ug) were introduced into HEK 293T cells by a calcium phosphate-based transformation method. Transformed cells were washed twice with phosphate-buffered saline (PBS, Gibco Life Technologies) 12 hours after transformation, and further cultured in fresh medium. Cell supernatants containing packaged viral particles were obtained twice at 36 and 60 hours after transformation. The obtained cell supernatant was first filtered through a 0.45 um syringe filter and then Optima ?? Ultracentrifuge LE-80K (Beckman Coulter, Brea, CA, USA) was used for ultracentrifugation and concentration on a cushion of 20% (w/v) sucrose at 4°C. Ultracentrifugation was performed using SW28 at 24,000 rpm for 2 h. The resulting virus particle pellet was resuspended in cooled phosphate buffered saline.

레트로바이러스 벡터 형질 도입 입자의 적정 (Titration)Titration of retroviral vector transduced particles

바이러스 벡터 입자의 형질 도입 역가를 결정하기 위해, 강화된 녹색 형광 단백질 (eGFP)을 암호화하는 유전자를 원래 바이러스 게놈에 도입하였다. 형질 전환 바이러스 입자의 적정은 HEK 293T 세포를 형질 도입하고 eGFP 양성 세포를 계수함으로써 진행되었다. eGFP-positive 세포는 형질 도입 3일 후 FacsCanto ?? II 유세포 분석기 (BD Biosciences, San Diego, CA)로 유세포 분석에 의해 정량화되었다.To determine the transduction titer of viral vector particles, a gene encoding enhanced green fluorescent protein (eGFP) was introduced into the original viral genome. Titration of transgenic viral particles proceeded by transducing HEK 293T cells and counting eGFP-positive cells. eGFP-positive cells were transferred to FacsCanto ?? 3 days after transduction. Quantified by flow cytometry with a II flow cytometer (BD Biosciences, San Diego, CA).

바이러스 세포 게놈 접합의 증폭Amplification of viral cell genome junctions

야생형 및 돌연변이 레트로바이러스 벡터를 HEK 293T 세포에 형질 도입하였다. 그 다음, 형질 도입된 세포를 며칠 동안 배양하였다. 이어서, QIAamp DNA 미니 키트 (Qiagen, Valencia, CA, USA)를 사용하여 세포로부터 세포 게놈 DNA를 추출하였다. 이어서 게놈 DNA를 BamH I (NEB)로 단편화하고, 레트로바이러스 서열을 함유하는 DNA 단편을 단일 유형의 비오티닐화 올리고 뉴클레오티드 (서열번호 14)에 결합하여 PCR에 의해 선택적으로 그리고 선형적으로 증폭시켰다. Wild-type and mutant retroviral vectors were transduced into HEK 293T cells. Then, the transduced cells were cultured for several days. Cell genomic DNA was then extracted from the cells using the QIAamp DNA mini kit (Qiagen, Valencia, CA, USA). The genomic DNA was then fragmented with BamHI (NEB), and the DNA fragment containing the retroviral sequence was bound to a single type of biotinylated oligonucleotide (SEQ ID NO: 14) and selectively and linearly amplified by PCR.

서열
번호
order
number
명명denomination 서열목록 (5'-> 3')Sequence Listing (5'-> 3') 비고note
1414 biotinylated oligonucleotidebiotinylated oligonucleotide biotin-ATTTGTTAAAGAVAGGATATCAGTGGTCCAGbiotin-ATTTGTTAAAGAVAGGATATCAGTGGTCCAG

관련 수행된 PCR 반응 조건은 다음과 같다: The PCR reaction conditions performed were as follows:

95 ℃에서 5분 동안 초기 변성; initial denaturation at 95 °C for 5 min;

95 ℃에서 1분 동안 변성, 55 ℃에서 45초 동안 어닐링 및 72 ℃에서 90초 동안 연장 40회 사이클; 40 cycles of denaturation at 95° C. for 1 min, annealing at 55° C. for 45 sec and extension at 72° C. for 90 sec;

최종 72 ℃에서 10분 동안 연장; 및final extension at 72 °C for 10 min; and

4 ℃에서 5분 동안 냉각.Cool at 4 °C for 5 min.

그 다음, Dynabeads M-280 스트렙트아비딘 (Thermo Fisher Scientific, Carlsbad, CA, USA)을 사용하여 바이러스 서열을 포함하는 증폭된 DNA를 선택적으로 분리하였다. 그 다음, 증폭된 단일 가닥 바이러스-세포 접합 DNA를 dNTP, 랜덤 헥사머 및 Klenow 효소로 이중 가닥 (dsDNA)이 되도록 만들었다. 합성된 dsDNA 생성물을 Mse I (NEB)로 단편화하고, pre-annealed된 이중 가닥 링커에 연결하였다. 링커와 바이러스 게놈의 3 'LTR에 상보적인 2 개의 프라이머를 사용하여 링커에 연결된 바이러스-세포 게놈 접합을 Phusion high fidelity polymerase (NEB)을 사용한 PCR과 반응으로 각각 증폭시켰다. Then, the amplified DNA containing the viral sequence was selectively isolated using Dynabeads M-280 streptavidin (Thermo Fisher Scientific, Carlsbad, CA, USA). The amplified single-stranded virus-cell junction DNA was then made double-stranded (dsDNA) with dNTPs, random hexamers and Klenow enzymes. The synthesized dsDNA product was fragmented with Mse I (NEB) and ligated to a pre-annealed double-stranded linker. Using the linker and two primers complementary to the 3' LTR of the viral genome, the linker-linked virus-cell genome junction was amplified by PCR and reaction using Phusion high fidelity polymerase (NEB), respectively.

서열
번호
order
number
명명denomination 서열목록 (5'-> 3')Sequence Listing (5'-> 3') 비고note
1515 linker+linker+ GTAATACGACTCACTATAGGGCTCCGCTTAAGGGACGTAATACGACTCACTATAGGGCTCCGCTTAAGGGAC 1616 Linker-Linker- TAGTCCCTTAGCGGAG-NH2 TAGTCCCTTAGCGGAG-NH 2 1717 Primer_FPrimer_F GACTTGTGGTCTCGCTGTTCCTTGGGACTTGTGGTCTCGCTGTTCCTTGG 1818 Primer_RPrimer_R GTAATACGACTCACTATAGGGCTCCCCGCTTAAGGTAATACGACTCACTATAGGGCTCCCCGCTTAAG

관련 PCR 반응 조건은 다음과 같다:Relevant PCR reaction conditions are as follows:

98 ℃에서 2분 동안 초기 변성; Initial denaturation at 98 °C for 2 min;

98 ℃에서 2분 동안 변성, 55 ℃에서 90초 동안 어닐링 및 72 ℃에서 1분 동안 연장 25회 사이클; 25 cycles of denaturation at 98° C. for 2 minutes, annealing at 55° C. for 90 seconds and extension at 72° C. for 1 minute;

72 ℃에서 5분 동안 최종 연장; 및 final extension at 72 °C for 5 min; and

10 ℃에서 3분 동안 냉각.Cool at 10 °C for 3 min.

바이러스-세포 접합부의 차세대 시퀀싱 (Next generation sequencing; NGS)Next generation sequencing (NGS) of virus-cell junctions

NGS 분석을 위해, 어댑터 및 인덱스 서열을 PCR을 통해 증폭된 바이러스-세포 게놈 접합 DNA에 첨가하였다. 관련 PCR 반응 조건은 다음과 같다:For NGS analysis, adapter and index sequences were added to the amplified virus-cell genome junction DNA via PCR. Relevant PCR reaction conditions are as follows:

98 ℃에서 2분 동안 초기 변성; 및Initial denaturation at 98 °C for 2 min; and

98 ℃에서 2분 동안 변성, 72 ℃에서 90초 동안 단일 단계로 어닐링 및 확장, 72 ℃에서 5분 동안 최종 확장, 및 10 ℃에서 3분 동안 냉각 25회 사이클.25 cycles of denaturation at 98 °C for 2 min, annealing and extension in a single step at 72 °C for 90 sec, final extension at 72 °C for 5 min, and cooling at 10 °C for 3 min.

서열
번호
order
number
명명denomination 서열목록 (5'-> 3')Sequence Listing (5'-> 3') 비고note
1919 Forward primer for adaptor additionForward primer for adapter addition TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGGAGGGTCTCCTCTGAGTGATTGACTACCTCGTCGGCAGCGTCAGATGTGTATAAGAGACAGGGAGGGTCTCCTCTGAGTGATTGACTACC 2020 Reverse primer for adaptor additionReverse primer for adapter addition GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGACTCACTATAGGGCTCCGCTTAAGGGACGTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGACTCACTATAGGGCTCCGCTTAAGGGAC 2121 Forward primer for index additionForward primer for index addition AATGATACGGCGACCACCGAGATCTACACFFFFFFFFTCGTCGGCAGCGTCAATGATACGGCGACCACCGAGATCTACACFFFFFFFFTCGTCGGCAGCGTC 2222 Reverse primer for index additionReverse primer for index addition CAAGCAGAAGACGGCATACGAGATRRRRRRRRGTCTCGTGGGCTCGGCAAGCAGAAGACGGCATACGAGATRRRRRRRRRGTCTCGTGGGCTCGG

서열
번호
order
number
명명denomination 서열목록 (5'-> 3')Sequence Listing (5'-> 3') 비고note
2323 FFFFFFFF_S502FFFFFFFF_S502 CTCTCTATCTCTCTAT 2424 FFFFFFFF_S503FFFFFFFF_S503 TATCCTCTTATCCTCT 2525 FFFFFFFF_S505FFFFFFFF_S505 GTAAGGAGGTAAGGAG 2626 FFFFFFFF_S506FFFFFFFF_S506 ACTGCATAACTGCAT 2727 FFFFFFFF_S507FFFFFFFF_S507 AAGGAGTAAAGGAGTA 2828 FFFFFFFF_S508FFFFFFFF_S508 CTAAGCCTCTAAGCCT 2929 FFFFFFFF_S510FFFFFFFF_S510 CGTCTAATCGTCTAAT 3030 FFFFFFFF_S511FFFFFFFF_S511 TCTCTCCGTCTCTCCG 3131 FFFFFFFF_S513FFFFFFFF_S513 TCGACTAGTCGACTAG 3232 FFFFFFFF_S515FFFFFFFF_S515 TTCTAGCTTTCTAGCT 3333 FFFFFFFF_S516FFFFFFFF_S516 CCTAGAGTCCTAGAGT 3434 FFFFFFFF_S517FFFFFFFF_S517 GCGTAAGAGCGTAAGA 3535 FFFFFFFF_S518FFFFFFFF_S518 CTATTAAGCTATTAAG 3636 FFFFFFFF_S520FFFFFFFF_S520 AAGGCTATAAGGCTAT 3737 FFFFFFFF_S521FFFFFFFF_S521 GAGCCTTAGAGCCTTA 3838 FFFFFFFF_S522FFFFFFFF_S522 TTATGCGATTATGCGA 3939 RRRRRRRR_N701RRRRRRRR_N701 TCGCCTTATCGCCTTA 4040 RRRRRRRR_N702RRRRRRRR_N702 CTAGTACGCTAGTACG 4141 RRRRRRRR_N703RRRRRRRR_N703 TTCTGCCTTTCTGCCT 4242 RRRRRRRR_N704RRRRRRRR_N704 GCTCAGGAGCTCAGGA 4343 RRRRRRRR_N705RRRRRRRR_N705 AGGAGTCCAGGAGTCC 4444 RRRRRRRR_N706RRRRRRRR_N706 CATGCCTACATGCCTA 4545 RRRRRRRR_N707RRRRRRRR_N707 GTAGAGAGGTAGAGAG 4646 RRRRRRRR_N710RRRRRRRR_N710 CAGCCTCGCAGCCTCG 4747 RRRRRRRR_N711RRRRRRRR_N711 TGCCTCTTTGCCTCTT 4848 RRRRRRRR_N712RRRRRRRR_N712 TCCTCTACTCCTCTAC 4949 RRRRRRRR_N714RRRRRRRR_N714 TCATGAGCTCATGAGC 5050 RRRRRRRR_N715RRRRRRRR_N715 CCTGAGATCCTGAGAT

Illumina MiSeq를 사용한 시퀀싱 및 DNA 판독의 초기 프로세싱은 마크로젠(한국)에 의해 수행되었다. 의미 있는 시퀀스 데이터만 고려하기 위해 평균 품질 점수가 20 미만인 판독 값은 PRINSEQ-lite (v 0.20.4)로 필터링 되었다. 다음(downstream) 분석을 위해 EMBOSS Needle (v 6.6.0.0) 및 마크로젠 자체 스크립트를 사용하여 두 가지 염기 서열 정도의 불일치 또는 그 이하를 허용하는 조건에서, 바이러스 3 'LTR 서열 (서열번호 51)을 포함하는 바이러스-세포 게놈 접합만이 선택되었다. 다운 스트림 분석에서 중복 값은 제거되었다. 바이러스-세포 게놈 접합에서 최종적으로 얻은 세포 서열은 QuickMap 도구 (Gene Therapy Safety Group)를 사용하여 인간 게놈에 매핑하였다. 야생형과 돌연변이 벡터의 유전자 삽입 패턴 차이에 대한 통계적 유의성은 Fisher의 테스트에 기반하여 수행되었다.Initial processing of sequencing and DNA reads using Illumina MiSeq was performed by Macrogen (Korea). Reads with an average quality score of less than 20 were filtered with PRINSEQ-lite (v 0.20.4) to consider only meaningful sequence data. For downstream analysis, we used the EMBOSS Needle (v 6.6.0.0) and Macrogen's own script to contain the virus 3' LTR sequence (SEQ ID NO: 51), under conditions that allowed a mismatch of the order of two bases or less. Only virus-cell genome junctions with Duplicate values in downstream analysis were removed. The cellular sequence finally obtained from the virus-cell genome junction was mapped to the human genome using the QuickMap tool (Gene Therapy Safety Group). Statistical significance of the difference in gene insertion patterns between wild-type and mutant vectors was performed based on Fisher's test.

서열
번호
order
number
명명denomination 서열목록 (5'-> 3')Sequence Listing (5'-> 3') 비고note
5151 viral 3´ LTR sequenceviral 3´ LTR sequence GGAGGGTCTCCTCTGAGTGATTGACTACCCGTCAGCGGGGGTCTTTCAGGAGGGTCTCCTCTGAGTGATTGACTACCCGTCAGCGGGGGTCTTTCA 48 bp48 bp

야생형 및 돌연변이체 통합 구조의 예측Prediction of wild-type and mutant integration structures

바이러스 인테그라제의 구조는 I-TASSER를 사용하여 예측되었으며, 이는 복제-교환 Monte Carlo 시뮬레이션에 의해 단백질 구조를 예측한다. 예측된 구조 모델은 신뢰 점수 (C-점수)를 기준으로 평가되었다. C-점수가 -5와 2 사이에 있으면 예측 구조 모델이 높은 신뢰도를 가진다고 할 수 있다. 예측된 구조의 렌더링은 Pymol (DeLano Scientific, 미국 캘리포니아주 산카를로스)을 사용하여 수행되었다.The structure of viral integrase was predicted using I-TASSER, which predicts protein structure by replication-exchange Monte Carlo simulations. The predicted structural model was evaluated based on a confidence score (C-score). If the C-score is between -5 and 2, it can be said that the predictive structure model has high reliability. Rendering of the predicted structures was performed using Pymol (DeLano Scientific, San Carlos, CA).

결과 및 고찰Results and Discussion

DNA 결합 단백질을 내부에 포함하는 인테그라제 탑재 MLV 벡터MLV vector loaded with integrase containing DNA binding protein inside

본 발명자들은 DNA 결합 단백질의 인테그라제 내부 도입을 통합 구조적 교란으로, 레트로바이러스 벡터의 유전자 삽입 패턴을 변화시킬 수 있을 것으로 예상하였다. DNA 결합 단백질로서 히스톤 또는 루신 지퍼를 고려하였다. 히스톤은 링커 히스톤 (H1 및 H5) 및 코어 히스톤 (H2A, H2B, H3 및 H4)으로 분류된다. 코어 히스톤은 구조적으로 보존된 모티프를 가지며, 이는 2개의 짧은 스트랩 고리로 이루어진 3개의 나선으로 구성된다. 이들 히스톤은 다른 히스톤과 상호 작용할 수 있다. 먼저, 두 개의 H2A-H2B 이량체는 H3-H4 사량체와 결합한다. 다음으로, 코어 히스톤의 옥타머는 DNA와 상호 작용함으로써 뉴클레오솜을 형성한다. 이러한 상호 작용에는 극성 상호 작용, 수소 결합 및 비극성 상호 작용을 포함된다. H2A와 H3의 2 내지 3 가지 변형체를 포함하여 7가지 히스톤을 MLV 인테그라제 내부에 삽입하였다 (도 1). The present inventors expected that the integrase internal introduction of a DNA binding protein could change the gene insertion pattern of a retroviral vector by an integrative structural disturbance. Histone or leucine zippers were considered as DNA binding proteins. Histones are classified into linker histones (H1 and H5) and core histones (H2A, H2B, H3 and H4). Core histones have a structurally conserved motif, which consists of three helices of two short strap rings. These histones can interact with other histones. First, the two H2A-H2B dimers bind to the H3-H4 tetramer. Next, the octamers of the core histones interact with DNA to form nucleosomes. These interactions include polar interactions, hydrogen bonding, and non-polar interactions. Seven histones, including two to three variants of H2A and H3, were inserted into the MLV integrase ( FIG. 1 ).

루신 지퍼는 독특한 구조적 특성을 갖는 조절 단백질이다. 루신 지퍼의 지퍼형 구조는 2 개의 알파 나선 단량체의 이량체화에 의해 형성된다. 루신 지퍼는 루신 잔기를 사용하여, 소수성 상호 작용을 통해, DNA에 결합한다. 본 발명자들은 MLV 인테그라제 내부에 2 가지 유형의 루신 지퍼 [인공적인 것 (NZ-CZ (I, AD, & L, 2000))와 자연적으로 파생된 Jun-Fos (Glover & Harrison, 1995)]를 삽입하였다.Leucine zippers are regulatory proteins with unique structural properties. The zipper-like structure of a leucine zipper is formed by dimerization of two alpha-helical monomers. Leucine zippers use leucine residues to bind to DNA, through hydrophobic interactions. The present inventors have developed two types of leucine zippers [artificial (NZ-CZ (I, AD, & L, 2000)) and naturally derived Jun-Fos (Glover & Harrison, 1995)] inside MLV integrase. inserted.

인테그라제 내부에 DNA 결합 단백질이 도입된 14 개의 MLV 돌연변이 벡터를 생산하였다. DNA 결합 단백질을 인테그라제 내 2 개 부위에 삽입하였고, '벡터 형질 도입 능력'의 파괴는 없었다 (도 1, 2). 두 부위는 MLV 인테그라제의 N-말단 연장 도메인 (37 번째 잔기 옆) 및 촉매 도메인 (273 번째 잔기 옆)에 있다. H3 (H3.1, H3.2 또는 H3.3) 또는 루신 지퍼 (NZ-CZ 또는 Jun-Fos)가 인테그라제의 앞쪽 위치에 도입되었다. 또한, H2A (H2A.1 또는 H2A.2), H2B, H3 (H3.1, H3.2 또는 H3.3), H4 또는 두 개의 루신 지퍼 중 하나가 후면 위치로 도입되었다 (도 1).Fourteen MLV mutant vectors in which the DNA binding protein was introduced into the integrase were produced. The DNA binding protein was inserted at two sites in the integrase, and there was no disruption of the 'vector transduction ability' ( FIGS. 1 and 2 ). The two sites are in the N-terminal extension domain (by residue 37) and catalytic domain (by residue 273) of MLV integrase. H3 (H3.1, H3.2 or H3.3) or leucine zippers (NZ-CZ or Jun-Fos) were introduced at the anterior position of integrase. In addition, H2A (H2A.1 or H2A.2), H2B, H3 (H3.1, H3.2 or H3.3), H4 or one of the two leucine zippers was introduced into the posterior position (Fig. 1).

서열
번호
order
number
명명denomination 서열목록sequence list 비고note
5252 H3.1H3.1 ATGGCACGCACGAAGCAAACAGCTCGTAAGTCCACTGGCGGCAAAGCCCCGCGCAAGCAGCTGGCCACTAAGGCGGCTCGCAAAAGCGCGCCAGCCACCGGTGGCGTGAAGAAGCCCCACCGCTACAGGCCTGGTACTGTCGCCCTCCGTGAAATCCGCCGCTATCAGAAATCGACTGAGCTACTGATTCGCAAGCTACCATTCCAGCGTCTGGTACGTGAGATCGCGCAGGACTTCAAGACCGACCTGCGCTTCCAGAGCTCGGCTGTGATGGCGCTGCAGGAGGCCTGCGAGGCTTACCTGGTGGGGCTCTTTGAGGACACCAACCTGTGTGCTATCCACGCCAAGCGAGTGACTATCATGCCCAAGGACATCCAGCTCGCTCGCCGCATTCGCGGAGAGAGGGCAATGGCACGCACGAAGCAAACAGCTCGTAAGTCCACTGGCGGCAAAGCCCCGCGCAAGCAGCTGGCCACTAAGGCGGCTCGCAAAAGCGCGCCAGCCACCGGTGGCGTGAAGAAGCCCCACCGCTACAGGCCTGGTACTGTCGCCCTCCGTGAAATCCGCCGCTATCAGAAATCGACTGAGCTACTGATTCGCAAGCTACCATTCCAGCGTCTGGTACGTGAGATCGCGCAGGACTTCAAGACCGACCTGCGCTTCCAGAGCTCGGCTGTGATGGCGCTGCAGGAGGCCTGCGAGGCTTACCTGGTGGGGCTCTTTGAGGACACCAACCTGTGTGCTATCCACGCCAAGCGAGTGACTATCATGCCCAAGGACATCCAGCTCGCTCGCCGCATTCGCGGAGAGAGGGCA 5353 H3.2H3.2 ATGGCCCGTACTAAGCAGACTGCTCGCAAGTCGACCGGCGGCAAGGCCCCGAGGAAGCAGCTGGCCACCAAGGCGGCCCGCAAGAGCGCGCCGGCCACGGGCGGGGTGAAGAAGCCGCACCGCTACCGGCCCGGCACCGTAGCCCTGCGGGAGATCCGGCGCTACCAGAAGTCCACGGAGCTGCTGATCCGCAAGCTGCCCTTCCAGCGGCTGGTACGCGAGATCGCGCAGGACTTTAAGACGGACCTGCGCTTCCAGAGCTCGGCCGTGATGGCGCTGCAGGAGGCCAGCGAGGCCTACCTGGTGGGGCTGTTCGAAGACACGAACCTGTGCGCCATCCACGCCAAGCGCGTGACCATTATGCCCAAGGACATCCAGCTGGCCCGCCGCATCCGTGGAGAGCGGGCTATGGCCCGTACTAAGCAGACTGCTCGCAAGTCGACCGGCGGCAAGGCCCCGAGGAAGCAGCTGGCCACCAAGGCGGCCCGCAAGAGCGCGCCGGCCACGGGCGGGGTGAAGAAGCCGCACCGCTACCGGCCCGGCACCGTAGCCCTGCGGGAGATCCGGCGCTACCAGAAGTCCACGGAGCTGCTGATCCGCAAGCTGCCCTTCCAGCGGCTGGTACGCGAGATCGCGCAGGACTTTAAGACGGACCTGCGCTTCCAGAGCTCGGCCGTGATGGCGCTGCAGGAGGCCAGCGAGGCCTACCTGGTGGGGCTGTTCGAAGACACGAACCTGTGCGCCATCCACGCCAAGCGCGTGACCATTATGCCCAAGGACATCCAGCTGGCCCGCCGCATCCGTGGAGAGCGGGCT 5454 H3.3H3.3 ATGGCTCGTACAAAGCAGACTGCCCGCAAATCGACCGGTGGTAAAGCACCCAGGAAGCAACTGGCTACAAAAGCCGCTCGCAAGAGTGCGCCCTCTACCGGAGGGGTGAAGAAACCTCATCGTTACAGGCCTGGTACTGTGGCGCTCCGTGAAATTAGACGTTATCAGAAGTCCACTGAACTTCTGATTCGCAAACTTCCCTTCCAGCGTCTGGTGCGAGAAATTGCTCAGGACTTTAAAACAGATCTGCGCTTCCAGAGCGCAGCTATCGGTGCTTTGCAGGAGGCAAGTGAGGCCTATCTGGTTGGCCTTTTTGAAGACACCAACCTGTGTGCTATCCATGCCAAACGTGTAACAATTATGCCAAAAGACATCCAGCTGGCACGCCGCATACGTGGAGAACGTGCTATGGCTCGTACAAAGCAGACTGCCCGCAAATCGACCGGTGGTAAAGCACCCAGGAAGCAACTGGCTACAAAAGCCGCTCGCAAGAGTGCGCCCTCTACCGGAGGGGTGAAGAAACCTCATCGTTACAGGCCTGGTACTGTGGCGCTCCGTGAAATTAGACGTTATCAGAAGTCCACTGAACTTCTGATTCGCAAACTTCCCTTCCAGCGTCTGGTGCGAGAAATTGCTCAGGACTTTAAAACAGATCTGCGCTTCCAGAGCGCAGCTATCGGTGCTTTGCAGGAGGCAAGTGAGGCCTATCTGGTTGGCCTTTTTGAAGACACCAACCTGTGTGCTATCCATGCCAAACGTGTAACAATTATGCCAAAAGACATCCAGCTGGCACGCCGCATACGTGGAGAACGTGCT 5555 H2A.1H2A.1 ATGTCTGGACGTGGCAAGCAGGGCGGCAAGGCTCGCGCCAAGGCCAAAACCCGCTCCTCTAGAGCTGGGCTCCAATTTCCTGTAGGACGAGTGCACCGCCTGCTCCGCAAGGGCAACTACGCTGAGCGGGTCGGGGCCGGCGCGCCGGTTTACCTGGCGGCGGTGCTGGAGTACCTAACTGCCGAGATCCTGGAGCTGGCGGGCAACGCAGCCCGCGACAACAAAAAGACCCGCATCATCCCGCGCCACTTGCAGCTGGCCATCCGCAACGACGAGGAGCTCAACAAGCTGCTTGGTAAAGTTACCATCGCTCAGGGCGGTGTTCTGCCTAACATCCAGGCCGTACTGCTCCCCAAGAAGACTGAGAGCCACCACAAAGCTAAGGGCAAGATGTCTGGACGTGGCAAGCAGGGCGGCAAGGCTCGCGCCAAGGCCAAAACCCGCTCCTCTAGAGCTGGGCTCCAATTTCCTGTAGGACGAGTGCACCGCCTGCTCCGCAAGGGCAACTACGCTGAGCGGGTCGGGGCCGGCGCGCCGGTTTACCTGGCGGCGGTGCTGGAGTACCTAACTGCCGAGATCCTGGAGCTGGCGGGCAACGCAGCCCGCGACAACAAAAAGACCCGCATCATCCCGCGCCACTTGCAGCTGGCCATCCGCAACGACGAGGAGCTCAACAAGCTGCTTGGTAAAGTTACCATCGCTCAGGGCGGTGTTCTGCCTAACATCCAGGCCGTACTGCTCCCCAAGAAGACTGAGAGCCACCACAAAGCTAAGGGCAAG 5656 H2A.2H2A.2 ATGTCTGGTCGTGGCAAGCAAGGAGGCAAGGCCCGCGCCAAGGCCAAGTCGCGCTCGTCCCGCGCTGGCCTTCAGTTCCCGGTAGGGCGAGTGCATCGCTTGCTGCGCAAAGGCAACTACGCGGAGCGAGTGGGGGCCGGCGCGCCCGTCTACATGGCTGCGGTCCTCGAGTATCTGACCGCCGAGATCCTGGAGCTGGCGGGCAACGCGGCTCGGGACAACAAGAAGACGCGCATCATCCCTCGTCACCTCCAGCTGGCCATCCGCAACGACGAGGAACTGAACAAGCTGCTGGGCAAAGTCACCATCGCCCAGGGCGGCGTCTTGCCTAACATCCAGGCCGTACTGCTCCCTAAGAAGACGGAGAGTCACCACAAGGCAAAGGGCAAGATGTCTGGTCGTGGCAAGCAAGGAGGCAAGGCCCGCGCCAAGGCCAAGTCGCGCTCGTCCCGCGCTGGCCTTCAGTTCCCGGTAGGGCGAGTGCATCGCTTGCTGCGCAAAGGCAACTACGCGGAGCGAGTGGGGGCCGGCGCGCCCGTCTACATGGCTGCGGTCCTCGAGTATCTGACCGCCGAGATCCTGGAGCTGGCGGGCAACGCGGCTCGGGACAACAAGAAGACGCGCATCATCCCTCGTCACCTCCAGCTGGCCATCCGCAACGACGAGGAACTGAACAAGCTGCTGGGCAAAGTCACCATCGCCCAGGGCGGCGTCTTGCCTAACATCCAGGCCGTACTGCTCCCTAAGAAGACGGAGAGTCACCACAAGGCAAAGGGCAAG 5757 H2BH2B ATGCCTGAGCCAGCGAAATCCGCTCCCGCCCCGAAGAAGGGCTCCAAGAAGGCCGTGACCAAGGCGCAGAAGAAGGACGGCAAGAAGCGCAAGCGCAGCCGCAAGGAGAGCTACTCCGTATACGTGTACAAGGTGCTGAAACAGGTCCACCCCGACACCGGCATCTCCTCTAAAGCCATGGGGATCATGAATTCCTTTGTCAACGACATCTTCGAGCGCATCGCCGGCGAGGCTTCCCGCCTGGCGCATTACAACAAGCGCTCGACCATCACCTCCAGGGAGATCCAGACGGCCGTGCGCCTGCTGCTTCCCGGGGAGCTGGCCAAGCACGCTGTGTCAGAGGGCACCAAGGCCGTTACCAAGTACACCAGCTCCAAGATGCCTGAGCCAGCGAAATCCGCTCCCGCCCCGAAGAAGGGCTCCAAGAAGGCCGTGACCAAGGCGCAGAAGAAGGACGGCAAGAAGCGCAAGCGCAGCCGCAAGGAGAGCTACTCCGTATACGTGTACAAGGTGCTGAAACAGGTCCACCCCGACACCGGCATCTCCTCTAAAGCCATGGGGATCATGAATTCCTTTGTCAACGACATCTTCGAGCGCATCGCCGGCGAGGCTTCCCGCCTGGCGCATTACAACAAGCGCTCGACCATCACCTCCAGGGAGATCCAGACGGCCGTGCGCCTGCTGCTTCCCGGGGAGCTGGCCAAGCACGCTGTGTCAGAGGGCACCAAGGCCGTTACCAAGTACACCAGCTCCAAG 5858 H4H4 ATGTCCGGCAGAGGAAAGGGCGGAAAAGGCTTAGGCAAAGGGGGCGCTAAGCGCCACCGCAAGGTCTTGAGAGACAACATTCAGGGCATCACCAAGCCTGCCATTCGGCGTCTAGCTCGGCGTGGCGGCGTTAAGCGGATCTCTGGCCTCATTTACGAGGAGACCCGCGGTGTGCTGAAGGTGTTCCTGGAGAATGTGATTCGGGACGCAGTCACCTACACCGAGCACGCCAAGCGCAAGACCGTCACAGCCATGGATGTGGTGTACGCGCTCAAGCGCCAGGGGCGCACCCTGTACGGCTTCGGAGGCATGTCCGGCAGAGGAAAGGGCGGAAAAGGCTTAGGCAAAGGGGGCGCTAAGCGCCACCGCAAGGTCTTGAGAGACAACATTCAGGGCATCACCAAGCCTGCCATTCGGCGTCTAGCTCGGCGTGGCGGCGTTAAGCGGATCTCTGGCCTCATTTACGAGGAGACCCGCGGTGTGCTGAAGGTGTTCCTGGAGAATGTGATTCGGGACGCAGTCACCTACACCGAGCACGCCAAGCGCAAGACCGTCACAGCCATGGATGTGGTGTACGCGCTCAAGCGCCAGGGGCGCACCCTGTACGGCTTCGGAGGC 5959 L1L1 GATCCACCGGTCGCCACCGATCCACCGGTCGCCACC 6060 NZNZ GCACTGAAAAAGGAACTGCAGGCTAACAAAAAGGAACTGGCACAGCTGAAGTGGGAGCTGCAGGCCCTGAAGAAAGAACTGGCTCAGGCACTGAAAAAGGAACTGCAGGCTAACAAAAAGGAACTGGCACAGCTGAAGTGGGAGCTGCAGGCCCTGAAGAAAGAACTGGCTCAG 6161 CZCZ GAGCAGCTGGAAAAGAAACTGCAGGCACTGGAGAAGAAACTGGCCCAGCTGGAATGGAAAAACCAGGCTCTGGAAAAGAAACTGGCACAGGAGCAGCTGGAAAAGAAACTGCAGGCACTGGAGAAGAAACTGGCCCAGCTGGAATGGAAAAACCAGGCTCTGGAAAAGAAACTGGCACAG 6262 JunJun ATCGCAAGACTGGAGGAGAAGGTGAAGACACTGAAGGCACAGAATAGTGAGCTGGCCTCAACTGCTAACATGCTGCGAGAACAGGTGGCTCAGCTGATCGCAAGACTGGAGGAGAAGGTGAAGACACTGAAGGCACAGAATAGTGAGCTGGCCTCAACTGCTAACATGCTGCGAGAACAGGTGGCTCAGCTG 6363 FosFos CTGAAGGAGAAAGAAAAGCTGCTGAATGCAATCGAGACCCAGCTGGCCAGTAAAGAGGACGAACTGCAGGATACAGAAGCACAGCTGACCGATACACTGAAGGAGAAAGAAAAGCTGCTGAATGCAATCGAGACCCAGCTGGCCAGTAAAGAGGACGAACTGCAGGATACAGAAGCACAGCTGACCGATACA 6464 L2-1L2-1 TCAGGGGGCACCTCTGGGTCAACATCTGGCACTGGCTCTACCTCAGGGGGCACCTCTGGGTCAACATCTGGCACTGGCTCTACC 6565 L2-2L2-2 AGTGGAGGGACCAGCGGATCCACCTCTGGAACAGGCTCCACTAGTGGAGGGACCAGCGGATCCACCTCTGGAACAGGCTCCACT 6666 L2-3L2-3 AGCGGCGGGACAAGCGGGAGCACCTCAGGGACTGGGAGCACTAGCGGCGGGACAAGCGGGAGCACCTCAGGGACTGGGAGCACT 6767 L2-4L2-4 TCCGGCGGGACAAGCGGCAGCACATCCGGGACTGGCTCAACATCCGGCGGGACAAGCGGCAGCACATCCGGGACTGGCTCAACA 6868 L2-5L2-5 AGCGGAGGGACCAGCGGGTCCACCTCTGGAACAGGCTCCACTAGCGGAGGGACCAGCGGGTCCACCTCTGGAACAGGCTCCACT 6969 L2-6L2-6 TCTGGGGGCACCTCTGGCTCAACCTCTGGGACAGGCTCCACTTCTGGGGGCACCTCTGGCTCAACCTCTGGGACAGGCTCCACT

서열
번호
order
number
명명denomination 서열목록sequence list 비고note
7070 H3.1H3.1 MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEACEAYLVGLFEDTNLCAIHAKRVTIMPKDIQLARRIRGERAMARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEACEAYLVGLFEDTNLCAIHAKRVTIMPKDIQLARRIRGERA 7171 H3.2H3.2 MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEASEAYLVGLFEDTNLCAIHAKRVTIMPKDIQLARRIRGERAMARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEASEAYLVGLFEDTNLCAIHAKRVTIMPKDIQLARRIRGERA 7272 H3.3H3.3 MARTKQTARKSTGGKAPRKQLATKAARKSAPSTGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSAAIGALQEASEAYLVGLFEDTNLCAIHAKRVTIMPKDIQLARRIRGERAMARTKQTARKSTGGKAPRKQLATKAARKSAPSTGGVKKPHRYRPGTVALREIRRYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSAAIGALQEASEAYLVGLFEDTNLCAIHAKRVTIMPKDIQLARRIRGERA 7373 H2A.1H2A.1 MSGRGKQGGKARAKAKTRSSRAGLQFPVGRVHRLLRKGNYAERVGAGAPVYLAAVLEYLTAEILELAGNAARDNKKTRIIPRHLQLAIRNDEELNKLLGKVTIAQGGVLPNIQAVLLPKKTESHHKAKGKMSGRGKQGGKARAKAKTRSSRAGLQFPVGRVHRLLRKGNYAERVGAGAPVYLAAVLEYLTAEILELAGNAARDNKKTRIIPRHLQLAIRNDEELNKLLGKVTIAQGGVLPNIQAVLLPKKTESHHKAKGK 7474 H2A.2H2A.2 MSGRGKQGGKARAKAKSRSSRAGLQFPVGRVHRLLRKGNYAERVGAGAPVYMAAVLEYLTAEILELAGNAARDNKKTRIIPRHLQLAIRNDEELNKLLGKVTIAQGGVLPNIQAVLLPKKTESHHKAKGKMSGRGKQGGKARAKAKSRSSRAGLQFPVGRVHRLLRKGNYAERVGAGAPVYMAAVLEYLTAEILELAGNAARDNKKTRIIPRHLQLAIRNDEELNKLLGKVTIAQGGVLPNIQAVLLPKKTESHHKAKGK 7575 H2BH2B MPEPAKSAPAPKKGSKKAVTKAQKKDGKKRKRSRKESYSVYVYKVLKQVHPDTGISSKAMGIMNSFVNDIFERIAGEASRLAHYNKRSTITSREIQTAVRLLLPGELAKHAVSEGTKAVTKYTSSKMPEPAKSAPAPKKGSKKAVTKAQKKDGKKRKRSRKESYSVYVYKVLKQVHPDTGISSKAMGIMNSFVNDIFERIAGEASRLAHYNKRSTITSREIQTAVRLLLPGELAKHAVSEGTKAVTKYTSSK 7676 H4H4 MSGRGKGGKGLGKGGAKRHRKVLRDNIQGITKPAIRRLARRGGVKRISGLIYEETRGVLKVFLENVIRDAVTYTEHAKRKTVTAMDVVYALKRQGRTLYGFGGMSGRGKGGKGLGKGGAKRHRKVLRDNIQGITKPAIRRLARRGGVKRISGLIYEETRGVLKVFLENVIRDAVTYTEHAKRKTVTAMDVVYALKRQGRTLYGFGG 7777 L1L1 DPPVATDPPVAT 7878 NZNZ ALKKELQANKKELAQLKWELQALKKELAQALKKELQANKKELAQLKWELQALKKELAQ 7979 CZCZ EQLEKKLQALEKKLAQLEWKNQALEKKLAQEQLEKKLQALEKKLAQLEWKNQALEKKLAQ 8080 JunJun IARLEEKVKTLKAQNSELASTANMLREQVAQLIARLEEKVKTLKAQNSELASTANMLREQVAQL 8181 FosFos LKEKEKLLNAIETQLASKEDELQDTEAQLTDTLKEKEKLLNAIETQLASKEDELQDTEAQLTDT 8282 L2L2 SGGTSGSTSGTGSTSGGTSGSTSGTGST

eGFP 유전자를 함유하는 게놈을 갖는 야생형 및 돌연변이 벡터를 이용 HEK 293T 세포를 형질 전환 (Transduction)하였다. 다음으로, 유세포 분석법으로 eGFP를 발현하는 세포를 계수함으로써 야생형 및 돌연변이체 벡터의 형질 도입 효율을 정량하여, 그 결과를 도 2 및 표 9에 나타내었다.HEK 293T cells were transformed using wild-type and mutant vectors having a genome containing the eGFP gene. Next, the transduction efficiency of wild-type and mutant vectors was quantified by counting cells expressing eGFP by flow cytometry, and the results are shown in FIG. 2 and Table 9.

VectorsVectors Transducing units/mLTransducing units/mL WTWT 5.08E+065.08E+06 37-H3.137-H3.1 3.80E+043.80E+04 37-H3.237-H3.2 3.40E+043.40E+04 37-H3.337-H3.3 1.88E+041.88E+04 273-H3.1273-H3.1 2.45E+052.45E+05 273-H3.2273-H3.2 3.20E+053.20E+05 273-H3.3273-H3.3 6.81E+056.81E+05 273-H2A.1273-H2A.1 4.46E+054.46E+05 273-H2A.2273-H2A.2 2.38E+052.38E+05 273-H2B273-H2B 7.90E+057.90E+05 273-H4273-H4 3.67E+053.67E+05 37-NZCZ37-NZCZ 6.96E+046.96E+04 37-JunFos37-JunFos 1.92E+051.92E+05 273-NZCZ273-NZCZ 1.30E+061.30E+06 273-JunFos273-JunFos 1.22E+061.22E+06

도 2 및 표 9에서 확인할 수 있듯이, 인테그라제 내부에 외래 단백질 (크기 107 내지 154 아미노산)이 도입되더라도, 돌연변이 벡터들은 HEK 293T 세포에 대해 상당한 수준의 형질 도입 능력을 보였다. 예를 들어, 돌연변이체 273-NZ-CZ의 샘플은 1.3E + 06 T.U./mL의 형질 도입 역가 (Transducing titer)를 나타냈다. 이 역가 수준은 야생형 벡터 (5.1E + 06 T.U./mL) 보다 3.9 배 낮다. 전반적으로, 단백질이 인테그라제의 뒷부분에 삽입된 돌연변이체의 형질 도입 역가 (2.4E + 05 TU/mL ~ 1.3E + 06 TU/mL)는 앞부분에 삽입된 돌연변이체의 형질 도입 역가 보다 높았다(1.9E + 04 TU/mL ~ 1.9E + 05 TU/mL). As can be seen in Figure 2 and Table 9, even when a foreign protein (107 to 154 amino acids in size) is introduced into the integrase, the mutant vectors showed a significant level of transduction ability into HEK 293T cells. For example, a sample of mutant 273-NZ-CZ exhibited a transducing titer of 1.3E + 06 T.U./mL. This titer level is 3.9-fold lower than that of the wild-type vector (5.1E + 06 T.U./mL). Overall, the transduction titer (2.4E + 05 TU/mL to 1.3E + 06 TU/mL) of the mutant in which the protein was inserted at the back of the integrase was higher than that of the mutant inserted at the front (1.9 E + 04 TU/mL to 1.9E + 05 TU/mL).

인간 게놈의 TSS 영역 근처의 벡터 유전자 삽입 빈도Frequency of vector gene insertions near the TSS region of the human genome

레트로바이러스 벡터의 유전자 삽입 위치를 매핑하기 위해, 야생형 및 돌연변이 벡터로 형질 도입된 HEK 293T 세포로부터 게놈 DNA를 분리하였다. 바이러스-세포 간 게놈 접합 부분은 PCR에 의해 증폭된 후 NGS 방법으로 분석되었다. 분석에 기초하여, 인간 게놈상의 2,117개의 레트로바이러스 게놈 통합 부위가 확인되었으며 그 결과를 표 10에 나타내었다. To map the gene insertion site of the retroviral vector, genomic DNA was isolated from HEK 293T cells transduced with wild-type and mutant vectors. The virus-cell genome junction was amplified by PCR and then analyzed by NGS method. Based on the analysis, 2,117 retroviral genome integration sites on the human genome were identified and the results are shown in Table 10.

Numbers of integration sitesNumbers of integration sites WT MLVWT MLV 234234 37-H3.137-H3.1 268268 37-H3.237-H3.2 257257 37-H3.337-H3.3 126126 273-H3.1273-H3.1 107107 273-H3.2273-H3.2 102102 273-H3.3273-H3.3 209209 273-H2A.1273-H2A.1 103103 273-H2A.2273-H2A.2 6161 273-H2B273-H2B 8383 273-H4273-H4 9494 37-NZ-CZ37-NZ-CZ 7777 37-Jun-Fos37-Jun-Fos 111111 273-NZ-CZ273-NZ-CZ 117117 273-Jun-Fos273-Jun-Fos 168168 TotalTotal 2,1172,117

또한 QuickMap tool (Appelt et al., 2009)을 사용하여 인간 게놈에서 1,000,000개의 계산적으로 생성된 무작위 사이트를 생성하였다. 이전의 학술 논문 (Hacein-Bey-Abina et al., 2008; Deichmann et al., 2007; Howe et al., 2008; LaFave et al., 2014) 결과와 유사하게 야생형 MLV 벡터는 TSS 영역에 높은 유전자 삽입 빈도를 보였다 (TSS 영역은 단백질 코딩 유전자의 TSS로부터 5kb 내의 게놈 부위로 정의됨). We also generated 1,000,000 computationally generated random sites in the human genome using the QuickMap tool (Appelt et al., 2009). Similar to the results of previous academic papers (Hacein-Bey-Abina et al., 2008; Deichmann et al., 2007; Howe et al., 2008; LaFave et al., 2014), wild-type MLV vectors have high genes in the TSS region. insertion frequency (TSS region is defined as a genomic site within 5 kb from the TSS of a protein-coding gene).

도 3에서 확인할 수 있듯이, 야생형 바이러스 벡터의 TSS로의 유전자 삽입 빈도는 42.3 % 였으며, 이는 무작위 확률보다 6.8 배 높았다 (6.2 %). TSS 영역에 대한 야생형 바이러스의 강력한 삽입 선호도는 종양 유전자의 발현을 초래할 수 있다. 그 이유는, 벡터 삽입 위치가 종양 유전자의 TSS에 인접할 때 벡터 게놈 내의 프로모터(들)가 해당 종양 유전자를 활성화시킬 수 있기 때문이다. 따라서, TSS 영역 주변으로의 벡터 삽입 감소는 레트로바이러스 기반 벡터의 안전성을 향상시키는 데 매우 중요하다.As can be seen in Fig. 3, the gene insertion frequency of wild-type viral vector into TSS was 42.3%, which was 6.8 times higher than the random probability (6.2%). The strong insertional preference of wild-type virus for the TSS region may result in the expression of oncogenes. The reason is that when the vector insertion site is adjacent to the TSS of the oncogene, the promoter(s) in the vector genome can activate that oncogene. Therefore, reducing vector insertion around the TSS region is very important for improving the safety of retroviral-based vectors.

또한, 도 3에서 확인할 수 있듯이, 히스톤 또는 루신 지퍼를 탑재한 돌연변이체는 6.6-19.6 %의 빈도로 TSS 영역에 삽입되는데, 그 빈도는 야생형 보다 현저히 낮다. 특히, 돌연변이체 273-H2A.2는 TSS 영역에 대한 최저 삽입 빈도 (6.6 %)를 나타내었고, 이는 야생형 벡터의 경우 보다 6.4 배 낮았다. 다른 2개의 돌연변이체 벡터는 또한 TSS 영역 [273-H3.3 (7.7 %) 및 37-H3.1 (9.3 %)]에 대해 상당히 낮은 삽입 수준을 나타냈다.In addition, as can be seen in FIG. 3 , a mutant equipped with a histone or leucine zipper is inserted into the TSS region at a frequency of 6.6-19.6%, and the frequency is significantly lower than that of the wild type. In particular, mutant 273-H2A.2 showed the lowest insertion frequency (6.6%) into the TSS region, which was 6.4-fold lower than that of the wild-type vector. The other two mutant vectors also showed significantly lower levels of insertion for the TSS region [273-H3.3 (7.7%) and 37-H3.1 (9.3%)].

레트로바이러스 벡터가 TSS에 더 가까운 게놈 부위에 삽입될 때, TSS의 하류에 있는 유전자의 활성화 확률은 더 높을 것이다. 이러한 유전자 조절 교란 가능성을 확인하기 위해, TSS 주위 레트로바이러스 벡터 삽입의 공간적 분포를 더 자세히 조사하였다. 이 분석을 위해, 레트로바이러스 DNA를 가지고 있는 게놈 영역을 TSS에서 시작하여 1 kb의 공간 간격을 가진 더 작은 부분으로 나누어, 도 4a 및 도 4b에 나타내었다.When the retroviral vector is inserted into a genomic site closer to the TSS, the probability of activation of the gene downstream of the TSS will be higher. To confirm the possibility of this gene regulation perturbation, the spatial distribution of retroviral vector insertions around the TSS was further investigated. For this analysis, the genomic region containing the retroviral DNA was divided into smaller portions with a spatial interval of 1 kb starting at the TSS, as shown in FIGS. 4A and 4B.

도 4a에서 확인할 수 있듯이, 야생형 MLV의 삽입은 TSS로부터 3kb 내에서 강하게 농축된 반면, 돌연변이 MLV는 이러한 집중된 삽입 패턴을 나타내지 않았다. TSS 주위의 더 큰 범위 (크기 50 kb)에서 보면, 야생형 바이러스 벡터 삽입이 TSS에 가장 가까운 영역 주위에 집중되어 있음이 더욱 뚜렷하게 확인된다. 이에 비해, 도 4b에서 확인할 수 있듯이, 돌연변이 바이러스 벡터는 TSS 주위에 국소적으로 집중된 명확한 삽입 패턴이 나타나지 않았다. As can be seen in Fig. 4a, the insertion of wild-type MLV was strongly enriched within 3 kb from TSS, whereas the mutant MLV did not show this concentrated insertion pattern. Looking at the larger extent around the TSS (50 kb in size), it is more clearly confirmed that the wild-type viral vector insertion is concentrated around the region closest to the TSS. In contrast, as can be seen in Fig. 4b, the mutant viral vector did not show a clear insertion pattern locally concentrated around the TSS.

<1kb<1kb <2kb<2kb <3kb<3kb <4kb<4kb <5kb<5kb RandomRandom 1.3%1.3% 2.5%2.5% 3.8%3.8% 5.0%5.0% 6.2%6.2% WTWT 19.7%19.7% 32.9%32.9% 40.2%40.2% 41.9%41.9% 42.3%42.3% 37-H3.137-H3.1 2.6%2.6% 3.7%3.7% 6.0%6.0% 7.1%7.1% 9.3%9.3% 273-H3.3273-H3.3 2.4%2.4% 3.8%3.8% 4.5%4.5% 7.5%7.5% 8.2%8.2% 273-H2A.2273-H2A.2 4.9%4.9% 6.6%6.6% 6.6%6.6% 6.6%6.6% 6.6%6.6%

또한, 도 4c 및 표 11에서 확인할 수 있듯이, TSS로부터의 거리에 따른 누적 레트로바이러스 삽입 빈도에 대한 도표는 야생형 벡터의 인간 유전체로의 삽입이 TSS로부터 1kb 이내에 영역 근처에서 매우 높은 빈도로 발생했음을 명백히 보여준다. TSS-근위 영역을 넘어서, 야생형 벡터 삽입 누적 빈도는 TSS로부터의 거리에 따라 크게 증가하지 않았다. 이것은 포화 곡선으로 특징 지어질 수 있다. 대조적으로, 2개의 돌연변이체 (37-H3.1 및 273-H3.3)의 누적된 삽입 빈도는 TSS로부터의 거리에 따라 지속적으로 증가하였으며, 이는 무작위 삽입의 경우와 유사한 패턴이다. 이로부터 돌연변이의 인간유전체로의 삽입 패턴이 야생형과는 매우 다른 무작위 삽입 패턴과 가깝다는 결론을 도출할 수 있다. 요약하면, 실험적으로 얻어진 벡터 삽입 패턴 결과는 히스톤 또는 루신 지퍼를 인테그라제 내부로 삽입하면 TSS 주위의 레트로바이러스 벡터 삽입 집중을 효과적으로 감소시킬 수 있음을 보여준다.In addition, as can be seen in Figure 4c and Table 11, the plot of cumulative retroviral insertion frequency as a function of distance from TSS clearly shows that insertion of wild-type vector into the human genome occurred at a very high frequency near the region within 1 kb of TSS. show Beyond the TSS-proximal region, the cumulative frequency of wild-type vector insertions did not increase significantly with distance from the TSS. This can be characterized as a saturation curve. In contrast, the cumulative insertion frequency of the two mutants (37-H3.1 and 273-H3.3) continued to increase with distance from the TSS, a pattern similar to that of random insertion. From this, it can be concluded that the insertion pattern of the mutant into the human genome is close to the random insertion pattern, which is very different from that of the wild type. In summary, the experimentally obtained vector insertion pattern results show that insertion of histone or leucine zippers into the integrase can effectively reduce the concentration of retroviral vector insertion around the TSS.

발암 부위 근처의 레트로바이러스 삽입 빈도Frequency of retroviral insertion near carcinogenic sites

MLV 벡터는 암 유발 가능성을 보여왔으며 이는, MLV 벡터가 게놈을 인간 게놈 종양 유전자 TSS 근처에 높은 빈도로 삽입하는 특성과 관련 있다. 과거 유전자 치료 임상 경우에서, MLV 벡터는 종양 유전자의 하나인 LMO2 (LIM domain only 2) 인핸서 영역에 삽입되었다. 이로 인해 어린 환자에서 백혈병이 발생했다. 돌연변이 벡터의 발암 가능성을 야생형 벡터의 발암 가능성과 비교하기 위해, QuickMap tool을 사용하여 종양 유전자 TSS로부터 5kb 이내 게놈 부위로의 벡터 삽입 빈도를 정량하여, 그 결과를 도 5 및 표 12과 표 13에 나타내었다. MLV vectors have shown cancer-causing potential, which is related to their high frequency insertion of the genome into the human genome near the oncogene TSS. In past gene therapy clinical cases, the MLV vector was inserted into the LMO2 (LIM domain only 2) enhancer region, one of the oncogenes. This has resulted in leukemia in young patients. In order to compare the carcinogenic potential of the mutant vector with that of the wild-type vector, the frequency of vector insertion into a genomic site within 5 kb from the oncogene TSS was quantified using the QuickMap tool, and the results are shown in Figures 5 and 12 and Table 13. indicated.

Number of integrationsNumber of integrations Number of integrations within 5 kb of TSSsNumber of integrations within 5 kb of TSSs Frequency of integrations within 5 kb of TSSs (%)Frequency of integrations within 5 kb of TSSs (%) P-value (compared with the frequency
of wild-type)
P-value (compared with the frequency
of wild-type)
RandomRandom 1,000,0001,000,000 61,61761,617 6.2**6.2** 2.98E-562.98E-56 WTWT 234234 9999 42.342.3 37-H3.137-H3.1 268268 2525 9.3**9.3** 3.45E-183.45E-18 37-H3.237-H3.2 257257 2525 9.7**9.7** 2.72E-172.72E-17 37-H3.337-H3.3 126126 2222 17.5**17.5** 8.80E-078.80E-07 273-H3.1273-H3.1 107107 1313 12.1**12.1** 7.64E-097.64E-09 273-H3.2273-H3.2 102102 2020 19.6**19.6** 3.42E-053.42E-05 273-H3.3273-H3.3 209209 1616 7.7**7.7** 5.58E-185.58E-18 273-H2A.1273-H2A.1 103103 1212 11.7**11.7** 6.39E-096.39E-09 273-H2A.2273-H2A.2 6161 44 6.6**6.6** 1.40E-081.40E-08 273-H2B273-H2B 8383 99 10.8**10.8** 3.61E-083.61E-08 273-H4273-H4 9494 1616 17.0**17.0** 6.39E-066.39E-06 37-NZ-CZ37-NZ-CZ 7777 1212 15.6**15.6** 8.98E-068.98E-06 37-Jun-Fos37-Jun-Fos 111111 1717 15.3**15.3** 2.54E-072.54E-07 273-NZ-CZ273-NZ-CZ 117117 2121 17.9**17.9** 2.73E-062.73E-06 273-Jun-Fos273-Jun-Fos 168168 2828 16.7**16.7** 2.22E-082.22E-08

야생형 벡터의 경우와 비교한 차이에 대한 테스트 P-값이 0.05 미만인 경우 삽입 빈도는 **로 표시If the test P-value for the difference compared to that of the wild-type vector is less than 0.05, the insertion frequency is indicated by **.

Number of integrationsNumber of integrations Number of integrations near the TSSs of
oncogenes
Number of integrations near the TSSs of
oncogenes
Frequency of integrations near the TSSs of oncogenes (%)Frequency of integrations near the TSSs of oncogenes (%) P-value (compared with the frequency of wild-type)P-value (compared with the frequency of wild-type)
RandomRandom 1,000,0001,000,000 1,5771,577 0.16**0.16** 4.08E-054.08E-05 WTWT 234234 55 2.142.14 37-H3.137-H3.1 268268 1One 0.37*0.37* 7.95E-027.95E-02 37-H3.237-H3.2 257257 00 0.00**0.00** 2.40E-022.40E-02 37-H3.337-H3.3 126126 22 1.591.59 5.32E-015.32E-01 273-H3.1273-H3.1 107107 1One 0.930.93 3.89E-013.89E-01 273-H3.2273-H3.2 102102 1One 0.980.98 4.11E-014.11E-01 273-H3.3273-H3.3 209209 22 0.960.96 2.74E-012.74E-01 273-H2A.1273-H2A.1 103103 00 0.000.00 1.59E-011.59E-01 273-H2A.2273-H2A.2 6161 00 0.000.00 3.11E-013.11E-01 273-H2B273-H2B 8383 00 0.000.00 2.17E-012.17E-01 273-H4273-H4 9494 00 0.000.00 1.83E-011.83E-01 37-NZ-CZ37-NZ-CZ 7777 00 0.000.00 2.39E-012.39E-01 37-Jun-Fos37-Jun-Fos 111111 00 0.000.00 1.42E-011.42E-01 273-NZ-CZ273-NZ-CZ 117117 00 0.000.00 1.30E-011.30E-01 273-Jun-Fos273-Jun-Fos 168168 00 0.00*0.00* 6.56E-026.56E-02

야생형 벡터의 경우와 비교한 차이에 대한 테스트 P-값이 각각 0.1 및 0.05 미만인 경우, 삽입 빈도는 * 및 **로 표시If the test P-values for differences compared to that of the wild-type vector were less than 0.1 and 0.05, respectively, insertion frequencies are denoted by * and **

도 5 및 표 12에서 확인할 수 있듯이, 이들 게놈 영역으로의 야생형 MLV 삽입 빈도 (2.14 %)는 무작위 경우 삽입 빈도 (0.16 %)보다 13.4 배 더 높았다. 야생형 벡터는 PCM1, HOXD11, RB1, GATA2 및 NACA의 5 가지 종양 유전자 TSS 근처에 삽입되었다.As can be seen in Figure 5 and Table 12, the frequency of wild-type MLV insertions into these genomic regions (2.14%) was 13.4 times higher than that in the random case (0.16%). Wild-type vectors were inserted near five oncogenes TSS: PCM1, HOXD11, RB1, GATA2 and NACA.

한편, 도 5 및 표 13에서 확인할 수 있듯이, 이들 지역에 대한 3개의 돌연변이체 (37-H3.1, 37-H3.2 및 273-Jun-Fos)의 삽입 빈도는 야생형보다 훨씬 낮았다 (P-값 < 0.1). 돌연변이체 37-H3.1 및 273-H3.1은 단 하나의 종양 유전자 PBRM1의 TSS 근처에 삽입되었다 (표 12). 273-H3.2은 EVI1 종양 유전자의 TSS 근처에 삽입되었고 또 다른 돌연변이체 37-H3.3은 2개의 종양 유전자, PBRM1 및 TLX3의 TSS 근처에 삽입되었다. 돌연변이체 273-H3.3은 종양 유전자 ERG의 TSS 근처에 2번 독립적으로 삽입되었다. 돌연변이체 37-H3.2의 경우 발암성 영역으로 삽입되지 않았다는 것에 주목할 만하다 (P-값 < 0.05). 이 결과는 히스톤 또는 루신 지퍼를 인테그라제 내부에 삽입하면 레트로바이러스 벡터 삽입 패턴을 크게 변화시켜 발암 가능성을 의미 있는 수준에서 감소시킬 수 있음을 보여준다. 다른 돌연변이체도 발암성 영역으로 삽입되지 않았지만, 바이러스-세포 게놈 접합체 판독 횟수가 통계적으로 유의미한 P-값을 얻기에 충분하지 않았다.On the other hand, as can be seen in Figure 5 and Table 13, the insertion frequency of the three mutants (37-H3.1, 37-H3.2 and 273-Jun-Fos) for these regions was much lower than that of the wild type (P- value < 0.1). Mutants 37-H3.1 and 273-H3.1 were inserted near the TSS of only one oncogene PBRM1 (Table 12). 273-H3.2 was inserted near the TSS of the EVI1 oncogene and another mutant 37-H3.3 was inserted near the TSS of two oncogenes, PBRM1 and TLX3. Mutant 273-H3.3 was independently inserted twice near the TSS of the oncogene ERG. It is noteworthy that mutant 37-H3.2 did not insert into the oncogenic region (P-value < 0.05). These results show that inserting histone or leucine zippers inside the integrase can significantly change the retroviral vector insertion pattern, thereby significantly reducing the carcinogenic potential. No other mutants were inserted into the oncogenic region, but the number of virus-cell genome conjugate reads was not sufficient to obtain a statistically significant P-value.

CpG 섬 및 cis-조절 요소 근처의 레트로바이러스 벡터 삽입Retroviral vector insertion near CpG islands and cis-regulatory elements

CpG 섬과 cis-조절 요소는 종종 유전자의 프로모터 영역 근처에 위치한다. 따라서, CpG 섬 및 cis-조절 요소 근처의 게놈 부위로의 레트로바이러스 삽입은 또한 유전자 발현 조절의 교란을 유발할 수 있다. 야생형 MLV는 삽입하는 동안 CpG 섬 및 cis-조절요소를 매우 선호하였다. CpG islands and cis-regulatory elements are often located near the promoter region of a gene. Thus, retroviral insertion into genomic regions near CpG islands and cis-regulatory elements can also lead to perturbation of gene expression regulation. Wild-type MLV highly favored CpG islands and cis-regulators during insertion.

  Number of integrationsNumber of integrations Number of integrations into the oncogenic locationsNumber of integrations into the oncogenic locations Frequency of integrations into the oncogenic locations (%)Frequency of integrations into the oncogenic locations (%) Oncogenes whose TSSs were located near retroviral integration sites (within 5 kb)Oncogenes whose TSSs were located near retroviral integration sites (within 5 kb) WTWT 234234 55 2.142.14 PCM1
HOXD11
RB1
GATA2
NACA
PCM1
HOXD11
RB1
GATA2
NACA
37-H3.137-H3.1 268268 1One 0.370.37 PBRM1PBRM1 37-H3.337-H3.3 126126 22 1.591.59 PBRM1TLX3PBRM1TLX3 273-H3.1273-H3.1 107107 1One 0.930.93 PBRM1PBRM1 273-H3.2273-H3.2 102102 1One 0.980.98 EVI1EVI1 273-H3.3273-H3.3 209209 22 0.960.96 ERG (two integrations)ERG (two integrations)

Number of integrationsNumber of integrations Number of integrations
within 5 kb of
CpG islands
Number of integrations
within 5 kb of
CpG islands
Frequency of
integrations within 5
kb of CpG islands
(%)
Frequency of
integrations within 5
kb of CpG islands
(%)
P-value (compared
with the frequency
of wild-type)
P-value (compared
with the frequency
of wild-type)
RandomRandom 1,000,0001,000,000 71,76371,763 7.2**7.2** 2.33E-492.33E-49 WTWT 234234 9898 41.941.9 37-H3.137-H3.1 268268 2121 7.8**7.8** 6.09E-206.09E-20 37-H3.237-H3.2 257257 1515 5.8**5.8** 1.11E-221.11E-22 37-H3.337-H3.3 126126 2828 22.2**22.2** 1.17E-041.17E-04 273-H3.1273-H3.1 107107 1919 17.8**17.8** 6.38E-066.38E-06 273-H3.2273-H3.2 102102 2222 21.6**21.6** 2.11E-042.11E-04 273-H3.3273-H3.3 209209 1717 8.1**8.1** 4.66E-174.66E-17 273-H2A.1273-H2A.1 103103 1414 13.6**13.6** 1.09E-071.09E-07 273-H2A.2273-H2A.2 6161 1010 16.4**16.4** 1.16E-041.16E-04 273-H2B273-H2B 8383 1616 19.3**19.3** 1.25E-041.25E-04 273-H4273-H4 9494 1818 19.1**19.1** 5.30E-055.30E-05 37-NZ-CZ37-NZ-CZ 7777 1414 18.2**18.2** 8.97E-058.97E-05 37-Jun-Fos37-Jun-Fos 111111 2323 20.7**20.7** 6.88E-056.88E-05 273-NZ-CZ273-NZ-CZ 117117 2424 20.5**20.5** 4.22E-054.22E-05 273-Jun-Fos273-Jun-Fos 168168 2222 13.1**13.1** 1.36E-101.36E-10

야생형 벡터의 경우와 비교한 차이에 대한 테스트 P-값이 0.05 미만인 경우 삽입 빈도는 **로 표시If the test P-value for the difference compared to that of the wild-type vector is less than 0.05, the insertion frequency is indicated by **.

Number of integrationsNumber of integrations Number of integrations within 5 kb of cis-regulatory elementsNumber of integrations within 5 kb of cis-regulatory elements Frequency of integrations within 5 kb of cis-regulatory
elements (%)
Frequency of integrations within 5 kb of cis-regulatory
elements (%)
P-value (compared with the frequency of wild-type)P-value (compared with the frequency of wild-type)
RandomRandom 1,000,0001,000,000 68,57268,572 6.86**6.86** 4.05E-554.05E-55 WTWT 234234 102102 43.643.6 37-H3.137-H3.1 268268 2424 9.0**9.0** 9.00E-209.00E-20 37-H3.237-H3.2 257257 2929 11.3**11.3** 2.14E-162.14E-16 37-H3.337-H3.3 126126 3030 23.8**23.8** 1.27E-041.27E-04 273-H3.1273-H3.1 107107 1616 15.0**15.0** 7.86E-087.86E-08 273-H3.2273-H3.2 102102 2121 20.6**20.6** 3.16E-053.16E-05 273-H3.3273-H3.3 209209 1818 8.6**8.6** 9.90E-189.90E-18 273-H2A.1273-H2A.1 103103 1515 14.6**14.6** 7.55E-087.55E-08 273-H2A.2273-H2A.2 6161 99 14.8**14.8** 1.40E-051.40E-05 273-H2B273-H2B 8383 88 9.6**9.6** 2.71E-092.71E-09 273-H4273-H4 9494 1414 14.9**14.9** 2.89E-072.89E-07 37-NZ-CZ37-NZ-CZ 7777 1313 16.9**16.9** 1.14E-051.14E-05 37-Jun-Fos37-Jun-Fos 111111 1212 10.8**10.8** 1.84E-101.84E-10 273-NZ-CZ273-NZ-CZ 117117 2323 19.7**19.7** 5.27E-065.27E-06 273-Jun-Fos273-Jun-Fos 168168 2727 16.1**16.1** 2.19E-092.19E-09

야생형 벡터의 경우와 비교한 차이에 대한 테스트 P-값이 0.05 미만인 경우 삽입 빈도는 **로 표시If the test P-value for the difference compared to that of the wild-type vector is less than 0.05, the insertion frequency is indicated by **.

도 6a 및 도 6b에서 확인할 수 있듯이, 야생형 MLV 삽입은 CpG 섬 (41.9 % 빈도) 및 cis-조절요소 (43.6 % 빈도)로부터 5kb 내의 게놈 부위에서 주로 발생하였다. 대조적으로, 인테그라제 돌연변이는 이들 영역에 대한 삽입 선호도를 상당히 감소시켰다. 돌연변이 벡터는 5.8-22.2 %의 빈도에서 CpG 섬에서 5kb 내에 삽입되었고 8.6 내지 23.8 %의 빈도에서 cis-조절 요소로부터 5kb 내에 삽입되었다. 또한, TSS 영역에 대한 낮은 삽입 빈도에 기초하여 안전한 돌연변이 벡터로 선택된 3개의 돌연변이체의 CpG 섬 영역 삽입 빈도는 7.7 % (37-H3.1), 8.1 % (273-H3.3)) 및 16.4 % (273-H2A.2) 였다. 이러한 빈도는 야생형 벡터보다 5.4 배, 5.2 배 및 2.6 배 낮다. 6A and 6B , wild-type MLV insertions mainly occurred at genomic sites within 5 kb from CpG islands (41.9% frequency) and cis-regulatory elements (43.6% frequency). In contrast, integrase mutations significantly reduced the insertion preference for these regions. Mutant vectors were inserted within 5 kb of CpG islands at frequencies of 5.8-22.2% and within 5 kb of cis-regulatory elements at frequencies of 8.6-23.8%. In addition, the CpG island region insertion frequencies of the three mutants selected as safe mutation vectors based on the low insertion frequency into the TSS region were 7.7% (37-H3.1), 8.1% (273-H3.3)) and 16.4 % (273-H2A.2). These frequencies are 5.4-fold, 5.2-fold and 2.6-fold lower than that of the wild-type vector.

한편, 도 6b에서 확인할 수 있듯이, 인테그라제 내부에 히스톤을 삽입하는 것은 돌연변이 벡터의 삽입을 cis-조절 요소로부터 멀어지게 만들었다. cis-조절 요소의 5 kb 내 게놈 부위에 대한 돌연변이체 273-H3.3의 삽입 빈도는 야생형 벡터보다 5.1 배 낮은 8.6 %였다. 또한, 돌연변이체 37-H3.1 및 273-H2A.2는 cis-조절 도메인 근처에 각각 야생형보다 낮은 8.9 % 및 9.8 % (4.9-배 및 4.5-배 낮음)의 빈도로 삽입되었다.On the other hand, as can be seen in Figure 6b, the insertion of histone inside the integrase made the insertion of the mutant vector away from the cis-regulatory element. The insertion frequency of mutant 273-H3.3 to a genomic site within 5 kb of the cis-regulatory element was 8.6%, 5.1-fold lower than that of the wild-type vector. In addition, mutants 37-H3.1 and 273-H2A.2 were inserted near the cis-regulatory domain at frequencies of 8.9% and 9.8% (4.9-fold and 4.5-fold lower) than wild-type, respectively.

또한, CpG 섬과 cis-조절 요소 위치 5kb 이내 레트로바이러스 벡터 삽입 사이트를 해당 게놈 구성 요소에서 시작하여 1kb 간격의 하위 집합으로 나누어, 그 결과를 도 7a에 나타내었다. In addition, the retroviral vector insertion site within 5 kb of the CpG island and the cis-regulatory element position was divided into subsets with an interval of 1 kb starting from the corresponding genomic component, and the results are shown in FIG. 7A .

도 7a에서 확인할 수 있듯이, 야생형 MLV 삽입은 CpG 섬으로부터 2kb 이내에 집중되어 있었다. 대조적으로, 2개의 돌연변이 벡터 37-H3.1 및 273-H3.3은 CpG 섬 근처에서 강한 집중적 삽입을 보이지 않았다. As can be seen in Figure 7a, wild-type MLV insertion was concentrated within 2 kb from the CpG island. In contrast, the two mutant vectors 37-H3.1 and 273-H3.3 did not show strong intensive insertion near CpG islands.

도 7b에서 확인할 수 있듯이, CpG 섬 주변의 더 큰 범위 (CpG 섬으로부터 50kb 영역 내)에서 보면 CpG 섬 근처의 야생형 벡터 삽입 집중도가 보다 명확하게 식별될 수 있다. As can be seen in FIG. 7B , the concentration of wild-type vector insertion near the CpG island can be more clearly identified when looking at a larger area around the CpG island (within a region of 50 kb from the CpG island).

< 1 kb< 1 kb < 2 kb< 2 kb < 3 kb< 3 kb < 4 kb< 4 kb < 5 kb< 5 kb RandomRandom 1.6%1.6% 3.1%3.1% 4.5%4.5% 5.8%5.8% 7.2%7.2% WTWT 23.1%23.1% 37.2%37.2% 39.7%39.7% 40.6%40.6% 41.9%41.9% 37-H3.137-H3.1 1.5%1.5% 3.4%3.4% 5.2%5.2% 6.0%6.0% 7.8%7.8% 273-H3.3273-H3.3 2.4%2.4% 3.8%3.8% 4.1%4.1% 6.3%6.3% 7.1%7.1% 273-H2A.2273-H2A.2 11.5%11.5% 14.8%14.8% 14.8%14.8% 16.4%16.4% 16.4%16.4%

도 7c 및 표 17에서 확인할 수 있듯이, CpG 섬으로부터의 거리에 따른 레트로바이러스 벡터 삽입 누적 빈도에 대한 분석은 야생형 벡터 삽입이 CpG 섬 주위에 고도로 집중되어 있음을 보여준다. 한편, 돌연변이체 37-H3.1 및 273-H3.3은 CpG 섬 주위에높은 수준으로 집중된 삽입 패턴을 나타내지 않았다. 오히려, 돌연변이체는 무작위 경우와 비슷하게, CpG 섬으로부터의 거리에 따른 삽입 빈도가 선형으로 증가하는 형태를 보인다. 보다 정량적으로 나타내면, 야생형 MLV 삽입의 37.2 %가 CpG 섬으로부터 2kb 이내에 발생하였다. 그러나 37-H3.2 및 273-H3.3의 경우 삽입이 3.4 % 및 3.8 % 정도만 해당 영역에 발생했다. 돌연변이체 273-H2A.2는 다른 돌연변이체보다 높은 빈도 (14.8 %)로 동일한 게놈 영역에 삽입되었다. 그러나 이 빈도는 여전히 야생형 벡터의 경우 보다 2.5 배 낮다.As can be seen in Figure 7c and Table 17, analysis of the cumulative frequency of retroviral vector insertions according to distance from CpG islands shows that wild-type vector insertions are highly concentrated around CpG islands. On the other hand, mutants 37-H3.1 and 273-H3.3 did not show a highly concentrated insertion pattern around CpG islands. Rather, the mutants show a linear increase in insertion frequency with distance from the CpG island, similar to the random case. More quantitatively, 37.2% of wild-type MLV insertions occurred within 2 kb of CpG islands. However, in the case of 37-H3.2 and 273-H3.3, insertions occurred in the corresponding regions in only 3.4% and 3.8% of cases. Mutant 273-H2A.2 was inserted into the same genomic region with a higher frequency (14.8%) than the other mutants. However, this frequency is still 2.5 times lower than for wild-type vectors.

< 1 kb< 1 kb < 2 kb< 2 kb < 3 kb< 3 kb < 4 kb< 4 kb < 5 kb< 5 kb RandomRandom 2.2%2.2% 3.4%3.4% 4.6%4.6% 5.7%5.7% 6.9%6.9% WTWT 29.9%29.9% 36.8%36.8% 40.6%40.6% 42.7%42.7% 43.6%43.6% 37-H3.137-H3.1 3.7%3.7% 4.9%4.9% 6.0%6.0% 7.8%7.8% 9.0%9.0% 273-H3.3273-H3.3 3.3%3.3% 3.3%3.3% 5.6%5.6% 7.1%7.1% 8.2%8.2% 273-H2A.2273-H2A.2 6.6%6.6% 6.6%6.6% 8.2%8.2% 9.8%9.8% 14.8%14.8%

도 7d 및 표 18에서 확인할 수 있듯이, 이와 유사하게, 야생형 MLV 인간유전체 삽입은cis-조절 요소로부터 2 kb 내에서 고도로 집중된 반면 (빈도: 36.8 %)에, 돌연변이체는 cis-조절 요소 근처에서 고도로 집중된 삽입 경향을 나타내지 않았다. 예를 들어, 돌연변이체 273-H3.3의 삽입은 cis-조절 요소로부터 2kb 내에 야생형의 경우 보다 11.2 배 낮은, 3.3%의 빈도로 발생하였다. 돌연변이체 벡터 37-H3.1 및 273-H3.3은 또한 무작위 삽입의 경우와 유사한 누적 빈도 형태를 나타내었다 (cis-조절 요소로부터의 거리에 따라 선형적으로 증가함). 얻어진 모든 결과로부터, MLV 인테그라제 내부에 히스톤 또는 루신 지퍼를 삽입함으로써 인간 게놈 조절 영역에 대한 레트로바이러스 고유의 삽입 선호도를 실질적으로 감소시킬 수 있다는 결론에 도달하였다.As can be seen in Figure 7d and Table 18, similarly, wild-type MLV human genome insertions were highly concentrated within 2 kb from cis-regulatory elements (frequency: 36.8%), whereas mutants were highly concentrated near cis-regulatory elements. It did not show a concentrated insertion tendency. For example, insertion of mutant 273-H3.3 occurred at a frequency of 3.3%, 11.2 fold lower than for wildtype, within 2 kb from the cis-regulatory element. Mutant vectors 37-H3.1 and 273-H3.3 also exhibited a form of cumulative frequency similar to that of random insertion (increasing linearly with distance from the cis-regulatory element). From all the obtained results, it was concluded that by inserting a histone or leucine zipper inside the MLV integrase, it is possible to substantially reduce the intrinsic insertion preference of retroviruses for the human genome regulatory region.

돌연변이체 인테그라제의 구조 예측Structure prediction of mutant integrase

DNA-결합 단백질의 내부 도입에 의한 인테그라제의 구조적 교란으로 MLV 삽입을 인간 게놈 상 발현을 조절하는 영역으로부터 멀리 이동시킬 것으로 예상할 수 있다. 야생형 MLV 인테그라제의 구조가 아직 밝혀지지 않았기 때문에, 얻어진 돌연변이 인테그라제 구조 역시 실험적으로 밝히기 어려운 상황이다. 이에 본 발명자들은 실험적으로 돌연변이 인테그라제 구조를 푸는 시도 대신 가장 진보된 단백질 구조 예측 도구 중 하나인 I-TASSER (Zhang, 2008)를 사용하여, 히스톤 또는 루신 지퍼 도입이 MLV 인테그라제 구조에 어떤 영향을 끼치는지 이론적으로 예측해보았다.Structural perturbation of integrase by internal introduction of DNA-binding proteins would be expected to shift MLV insertions away from regions regulating expression on the human genome. Since the structure of wild-type MLV integrase has not yet been elucidated, the structure of the obtained mutant integrase is also difficult to experimentally elucidate. Therefore, the present inventors used I-TASSER (Zhang, 2008), which is one of the most advanced protein structure prediction tools, instead of trying to unravel the structure of the mutant integrase experimentally. It was predicted theoretically.

MLV 인테그라제는 다수의 구조적 하위 도메인, N-말단 확장 도메인 (NED), N-말단 도메인 (NTD), 촉매 코어 도메인 (CCD) 및 C-말단 도메인 (CTD)을 포함하는 것으로 알려져 있다. MLV integrase is known to contain a number of structural subdomains, an N-terminal extension domain (NED), an N-terminal domain (NTD), a catalytic core domain (CCD) and a C-terminal domain (CTD).

도 8a에서 확인할 수 있듯이, 인테그라제 273 번째 아미노산 잔기 위치에 히스톤을 삽입하면 273-H3.3의 예시에서 보듯이 CTD의 구조에 변화가 유발된다. 이 구조 교란에 대한 잠재적인 이유를 파악하기 위해, 우리는 '인테그라제 sub-d main'과 '돌연변이체 인테그라제에 삽입된 히스톤' 사이에 새로이 형성된 수소 결합을 분석하였다. As can be seen in FIG. 8a , when a histone is inserted at the 273 th amino acid residue position of integrase, a change in the structure of the CTD is induced as shown in the example of 273-H3.3. To understand the potential reasons for this structural perturbation, we analyzed the newly formed hydrogen bonds between the 'integrase sub-d main' and the 'histone inserted into the mutant integrase'.

도 8b에서 확인할 수 있듯이, 히스톤과 3개의 인테그라제 서브 도메인 (CCD, 링커 및 CTD; 도 8B) 사이에 13 개의 새로운 수소 결합이 발생하였다. 삽입된 H3.3 히스톤은 CCD의 아미노산 2개와 수소 결합 (286K (하단, 인테그라제 부분 아미노산은 "i"로 표시))-437T (하단, 히스톤 부분 아미노산은 "h"로 표시) 및 286K(i)-438R(h); 도 8b)을 형성한다. 삽입된 H3.3 히스톤은 인테그라제의 링커와 7개의 수소결합 (285T(i)-442S(h), 287Q(i)-442S(h), 405D(h)-473R(i), 409A(h)-473R(i), 413R(h)-472D(i), 413R(h)-473R(i), 421V(h)-470Q(i))을 형성한다.As can be seen in Figure 8b, 13 new hydrogen bonds occurred between histones and three integrase subdomains (CCD, linker and CTD; Figure 8B). The inserted H3.3 histone is hydrogen-bonded with two amino acids of CCD (286K (lower, integrase partial amino acids indicated by "i"))-437T (lower, histone partial amino acids indicated by "h") and 286K (i) )-438R(h); 8b) is formed. The inserted H3.3 histone is an integrase linker and 7 hydrogen bonds (285T(i)-442S(h), 287Q(i)-442S(h), 405D(h)-473R(i), 409A(h) )-473R(i), 413R(h)-472D(i), 413R(h)-473R(i), 421V(h)-470Q(i)).

도 8a에서 확인할 수 있듯이, 이러한 새로운 수소 결합은 부분적으로 CCD와 링커 구조의 교란을 유발할 수 있다. 또한, 도 8b에서 확인할 수 있듯이, H3.3과 CTD 사이에는 4개의 수소 결합 (351R(h)-495N(i), 387E(h)-489R(i), 387E(h)-527H(i), 390N(h)-529K(i)) 이 존재했다. 이러한 새로운 상호 작용으로 CTD에서 베타 시트가 부분적으로 파괴될 수 있다.As can be seen in Fig. 8a, this new hydrogen bonding may in part cause disturbance of the CCD and linker structures. In addition, as can be seen in FIG. 8b, there are four hydrogen bonds between H3.3 and CTD (351R(h)-495N(i), 387E(h)-489R(i), 387E(h)-527H(i)) , 390N(h)-529K(i)) were present. This novel interaction could lead to partial disruption of the beta sheet in CTD.

서열
번호
order
number
명명denomination 서열목록 (5'-> 3')Sequence Listing (5'-> 3') 비고note
8383 Integrases_DNA sequenceIntegrases_DNA sequence atagaaaattcatcaccctacacctcagaacattttcattacacagtgactgatataaaggacctaaccaagttgggggccatttatgataaaacaaagaagtattgggtctaccaaggaaaacctgtgatgcctgaccagtttacttttgaattattagactttcttcatcagctgactcacctcagcttctcaaaaatgaaggctctcctagagagaagccacagtccctactacatgctgaaccgggatcgaacactcaaaaatatcactgagacctgcaaagcttgtgcacaagtcaacgccagcaagtctgccgttaaacagggaactagggtccgcgggcatcggcccggcactcattgggagatcgatttcaccgagataaagcccggattgtatggctataaatatcttctagtttttatagataccttttctggctggatagaagccttcccaaccaagaaagaaaccgccaaggtcgtaaccaagaagctactagaggagatcttccccaggttcggcatgcctcaggtattgggaactgacaatgggcctgccttcgtctccaaggtgagtcagacagtggccgatctgttggggattgattggaaattacattgtgcatacagaccccaaagctcaggccaggtagaaagaatgaatagaaccatcaaggagactttaactaaattaacgcttgcaactggctctagagactgggtgctcctactccccttagccctgtaccgagcccgcaacacgccgggcccccatggcctcaccccatatgagatcttatatggggcacccccgccccttgtaaacttccctgaccctgacatgacaagagttactaacagcccctctctccaagctcacttacaggctctctacttagtccagcacgaagtctggagacctctggcggcagcctaccaagaacaactggaccgaccggtggtacctcacccttaccgagtcggcgacacagtgtgggtccgccgacaccagactaagaacctagaacctcgctggaaaggaccttacacagtcctgctgaccacccccaccgccctcaaagtagacggcatcgcagcttggatacacgccgcccacgtgaaggctgccgaccccgggggtggaccatcctctagactgacatggcgcgttcaacgctctcaaaaccccttaaaaataaggttaacccgcgaggccccctaaatagaaaattcatcaccctacacctcagaacattttcattacacagtgactgatataaaggacctaaccaagttgggggccatttatgataaaacaaagaagtattgggtctaccaaggaaaacctgtgatgcctgaccagtttacttttgaattattagactttcttcatcagctgactcacctcagcttctcaaaaatgaaggctctcctagagagaagccacagtccctactacatgctgaaccgggatcgaacactcaaaaatatcactgagacctgcaaagcttgtgcacaagtcaacgccagcaagtctgccgttaaacagggaactagggtccgcgggcatcggcccggcactcattgggagatcgatttcaccgagataaagcccggattgtatggctataaatatcttctagtttttatagataccttttctggctggatagaagccttcccaaccaagaaagaaaccgccaaggtcgtaaccaagaagctactagaggagatcttccccaggttcggcatgcctcaggtattgggaactgacaatgggcctgccttcgtctccaaggtgagtcagacagtggccgatctgttggggattgattggaaattacattgtgcatacagaccccaaagctcaggccaggtagaaagaatgaatagaaccatcaaggagactttaactaaattaacgcttgcaactggctctagagactgggtgctcctactccccttagccctgtaccgagcccgcaacacgccgggcccccatggcctcaccccatatgagatcttatatggggcacccccgccccttgtaaacttccctgaccctgacatgacaagagttactaacagcccctctctccaagctcacttacaggctctctacttagtccagcacgaagtctggagacctctggcggcagcctaccaagaacaactggaccgaccggtggtacctcacccttaccgagtcggcgacacagtgt gggtccgccgacaccagactaagaacctagaacctcgctggaaaggaccttacacagtcctgctgaccacccccaccgccctcaaagtagacggcatcgcagcttggatacacgccgcccacgtgaaggctgccgaccccggtaccgtggaccatcctctagactgacacatggctagcgttacca

서열
번호
order
number
명명denomination 서열목록sequence list 비고note
8484 Integrases_Amino acid sequenceIntegrases_Amino acid sequence iensspytsehfhytvtdikdltklgaiydktkkywvyqgkpvmpdqftfelldflhqlthlsfskmkallershspyymlnrdrtlknitetckacaqvnasksavkqgtrvrghrpgthweidfteikpglygykyllvfidtfsgwieafptkketakvvtkklleeifprfgmpqvlgtdngpafvskvsqtvadllgidwklhcayrpqssgqvermnrtiketltkltlatgsrdwvlllplalyrarntpgphgltpyeilygappplvnfpdpdmtrvtnspslqahlqalylvqhevwrplaaayqeqldrpvvphpyrvgdtvwvrrhqtknleprwkgpytvllttptalkvdgiaawihaahvkaadpgggpssrltwrvqrsqnplkirltreapiensspytsehfhytvtdikdltklgaiydktkkywvyqgkpvmpdqftfelldflhqlthlsfskmkallershspyymlnrdrtlknitetckacaqvnasksavkqgtrvrghrpgthweidfteikpglygykyllvfidtfsgwieafptkketakvvtkklleeifprfgmpqvlgtdngpafvskvsqtvadllgidwklhcayrpqssgqvermnrtiketltkltlatgsrdwvlllplalyrarntpgphgltpyeilygappplvnfpdpdmtrvtnspslqahlqalylvqhevwrplaaayqeqldrpvvphpyrvgdtvwvrrhqtknleprwkgpytvllttptalkvdgiaawihaahvkaadpgggpssrltwrvqrsqnplkirltreap

<110> Sookmyung Women's university industry-academic cooperation foundation <120> Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase <130> PN200017 <160> 82 <170> KoPatentIn 3.0 <210> 1 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 1 Asp Asp Pro Val Ala Thr 1 5 <210> 2 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> H2A_sense_primer <400> 2 aaaaagcgct gatccaccgg tcgccaccat gtctggacgt ggcaagcag 49 <210> 3 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> H2A_antisense_primer <400> 3 aaaagctagc ggtggcgacc ggtggatcct tgcccttagc tttgtggtgg 50 <210> 4 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> H2B_sense_primer <400> 4 aaaaggcgcc gatccaccgg tcgccaccat gcctgagcca gcgaaatcc 49 <210> 5 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> H2B_antisense_primer <400> 5 aaaagctagc ggtggcgacc ggtggatcct tggagctggt gtacttggta acg 53 <210> 6 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> H3.1_sense_primer <400> 6 aaaaagcgct gatccaccgg tcgccaccat ggcacgcacg aagcaaac 48 <210> 7 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> H3.1_antisense_primer <400> 7 aaaagctagc ggtggcgacc ggtggatctg ccctctctcc gcgaatg 47 <210> 8 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> H3.2_sense_primer <400> 8 aaaaagcgct gatccaccgg tcgccaccat ggcccgtact aagcagactg c 51 <210> 9 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> H3.2_antisense_primer <400> 9 aaaagctagc ggtggcgacc ggtggatcag cccgctctcc acggatg 47 <210> 10 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> H3.3_sense_primer <400> 10 aaaaagcgct gatccaccgg tcgccaccat ggctcgtaca aagcagactg cc 52 <210> 11 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> H3.3_antisense_primer <400> 11 aaaagctagc ggtggcgacc ggtggatcag cacgttctcc acgtatgcg 49 <210> 12 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> H4_sense_primer <400> 12 aaaaagcgct gatccaccgg tcgccaccat gtccggcaga ggaaaggg 48 <210> 13 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> H4_antisense_primer <400> 13 aaaaggcgcc gatccaccgg tcgccaccat gcctgagcca gcgaaatcc 49 <210> 14 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> biotinylated oligonucleotide <400> 14 atttgttaaa gavaggatat cagtggtcca g 31 <210> 15 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> linker+ <400> 15 gtaatacgac tcactatagg gctccgctta agggac 36 <210> 16 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Linker- <400> 16 tagtccctta gcggag 16 <210> 17 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer_F <400> 17 gacttgtggt ctcgctgttc cttgg 25 <210> 18 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Primer_R <400> 18 gtaatacgac tcactatagg gctccccgct taag 34 <210> 19 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for adaptor addition <400> 19 tcgtcggcag cgtcagatgt gtataagaga cagggagggt ctcctctgag tgattgacta 60 cc 62 <210> 20 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for adaptor addition <400> 20 gtctcgtggg ctcggagatg tgtataagag acagactcac tatagggctc cgcttaaggg 60 ac 62 <210> 21 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for index addition <400> 21 aatgatacgg cgaccaccga gatctacact cgtcggcagc gtc 43 <210> 22 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for index addition <400> 22 caagcagaag acggcatacg agatrrrrrr rrgtctcgtg ggctcgg 47 <210> 23 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S502 <400> 23 ctctctat 8 <210> 24 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S503 <400> 24 tatcctct 8 <210> 25 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S505 <400> 25 gtaaggag 8 <210> 26 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S506 <400> 26 actgcata 8 <210> 27 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S507 <400> 27 aaggagta 8 <210> 28 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S508 <400> 28 ctaagcct 8 <210> 29 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S510 <400> 29 cgtctaat 8 <210> 30 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S511 <400> 30 tctctccg 8 <210> 31 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S513 <400> 31 tcgactag 8 <210> 32 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S515 <400> 32 ttctagct 8 <210> 33 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S516 <400> 33 cctagagt 8 <210> 34 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S517 <400> 34 gcgtaaga 8 <210> 35 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S518 <400> 35 ctattaag 8 <210> 36 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S520 <400> 36 aaggctat 8 <210> 37 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S521 <400> 37 gagcctta 8 <210> 38 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S522 <400> 38 ttatgcga 8 <210> 39 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N701 <400> 39 tcgcctta 8 <210> 40 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N702 <400> 40 ctagtacg 8 <210> 41 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N703 <400> 41 ttctgcct 8 <210> 42 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N704 <400> 42 gctcagga 8 <210> 43 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N705 <400> 43 aggagtcc 8 <210> 44 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N706 <400> 44 catgccta 8 <210> 45 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N707 <400> 45 gtagagag 8 <210> 46 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N710 <400> 46 cagcctcg 8 <210> 47 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N711 <400> 47 tgcctctt 8 <210> 48 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N712 <400> 48 tcctctac 8 <210> 49 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N714 <400> 49 tcatgagc 8 <210> 50 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N715 <400> 50 cctgagat 8 <210> 51 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> viral 3 LTR sequence <400> 51 ggagggtctc ctctgagtga ttgactaccc gtcagcgggg gtctttca 48 <210> 52 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> H3.1 <400> 52 atggcacgca cgaagcaaac agctcgtaag tccactggcg gcaaagcccc gcgcaagcag 60 ctggccacta aggcggctcg caaaagcgcg ccagccaccg gtggcgtgaa gaagccccac 120 cgctacaggc ctggtactgt cgccctccgt gaaatccgcc gctatcagaa atcgactgag 180 ctactgattc gcaagctacc attccagcgt ctggtacgtg agatcgcgca ggacttcaag 240 accgacctgc gcttccagag ctcggctgtg atggcgctgc aggaggcctg cgaggcttac 300 ctggtggggc tctttgagga caccaacctg tgtgctatcc acgccaagcg agtgactatc 360 atgcccaagg acatccagct cgctcgccgc attcgcggag agagggca 408 <210> 53 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> H3.2 <400> 53 atggcccgta ctaagcagac tgctcgcaag tcgaccggcg gcaaggcccc gaggaagcag 60 ctggccacca aggcggcccg caagagcgcg ccggccacgg gcggggtgaa gaagccgcac 120 cgctaccggc ccggcaccgt agccctgcgg gagatccggc gctaccagaa gtccacggag 180 ctgctgatcc gcaagctgcc cttccagcgg ctggtacgcg agatcgcgca ggactttaag 240 acggacctgc gcttccagag ctcggccgtg atggcgctgc aggaggccag cgaggcctac 300 ctggtggggc tgttcgaaga cacgaacctg tgcgccatcc acgccaagcg cgtgaccatt 360 atgcccaagg acatccagct ggcccgccgc atccgtggag agcgggct 408 <210> 54 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> H3.3 <400> 54 atggctcgta caaagcagac tgcccgcaaa tcgaccggtg gtaaagcacc caggaagcaa 60 ctggctacaa aagccgctcg caagagtgcg ccctctaccg gaggggtgaa gaaacctcat 120 cgttacaggc ctggtactgt ggcgctccgt gaaattagac gttatcagaa gtccactgaa 180 cttctgattc gcaaacttcc cttccagcgt ctggtgcgag aaattgctca ggactttaaa 240 acagatctgc gcttccagag cgcagctatc ggtgctttgc aggaggcaag tgaggcctat 300 ctggttggcc tttttgaaga caccaacctg tgtgctatcc atgccaaacg tgtaacaatt 360 atgccaaaag acatccagct ggcacgccgc atacgtggag aacgtgct 408 <210> 55 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> H2A.1 <400> 55 atgtctggac gtggcaagca gggcggcaag gctcgcgcca aggccaaaac ccgctcctct 60 agagctgggc tccaatttcc tgtaggacga gtgcaccgcc tgctccgcaa gggcaactac 120 gctgagcggg tcggggccgg cgcgccggtt tacctggcgg cggtgctgga gtacctaact 180 gccgagatcc tggagctggc gggcaacgca gcccgcgaca acaaaaagac ccgcatcatc 240 ccgcgccact tgcagctggc catccgcaac gacgaggagc tcaacaagct gcttggtaaa 300 gttaccatcg ctcagggcgg tgttctgcct aacatccagg ccgtactgct ccccaagaag 360 actgagagcc accacaaagc taagggcaag 390 <210> 56 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> H2A.2 <400> 56 atgtctggtc gtggcaagca aggaggcaag gcccgcgcca aggccaagtc gcgctcgtcc 60 cgcgctggcc ttcagttccc ggtagggcga gtgcatcgct tgctgcgcaa aggcaactac 120 gcggagcgag tgggggccgg cgcgcccgtc tacatggctg cggtcctcga gtatctgacc 180 gccgagatcc tggagctggc gggcaacgcg gctcgggaca acaagaagac gcgcatcatc 240 cctcgtcacc tccagctggc catccgcaac gacgaggaac tgaacaagct gctgggcaaa 300 gtcaccatcg cccagggcgg cgtcttgcct aacatccagg ccgtactgct ccctaagaag 360 acggagagtc accacaaggc aaagggcaag 390 <210> 57 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> H2B <400> 57 atgcctgagc cagcgaaatc cgctcccgcc ccgaagaagg gctccaagaa ggccgtgacc 60 aaggcgcaga agaaggacgg caagaagcgc aagcgcagcc gcaaggagag ctactccgta 120 tacgtgtaca aggtgctgaa acaggtccac cccgacaccg gcatctcctc taaagccatg 180 gggatcatga attcctttgt caacgacatc ttcgagcgca tcgccggcga ggcttcccgc 240 ctggcgcatt acaacaagcg ctcgaccatc acctccaggg agatccagac ggccgtgcgc 300 ctgctgcttc ccggggagct ggccaagcac gctgtgtcag agggcaccaa ggccgttacc 360 aagtacacca gctccaag 378 <210> 58 <211> 309 <212> DNA <213> Artificial Sequence <220> <223> H4 <400> 58 atgtccggca gaggaaaggg cggaaaaggc ttaggcaaag ggggcgctaa gcgccaccgc 60 aaggtcttga gagacaacat tcagggcatc accaagcctg ccattcggcg tctagctcgg 120 cgtggcggcg ttaagcggat ctctggcctc atttacgagg agacccgcgg tgtgctgaag 180 gtgttcctgg agaatgtgat tcgggacgca gtcacctaca ccgagcacgc caagcgcaag 240 accgtcacag ccatggatgt ggtgtacgcg ctcaagcgcc aggggcgcac cctgtacggc 300 ttcggaggc 309 <210> 59 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> L1 <400> 59 gatccaccgg tcgccacc 18 <210> 60 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> NZ <400> 60 gcactgaaaa aggaactgca ggctaacaaa aaggaactgg cacagctgaa gtgggagctg 60 caggccctga agaaagaact ggctcag 87 <210> 61 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> CZ <400> 61 gagcagctgg aaaagaaact gcaggcactg gagaagaaac tggcccagct ggaatggaaa 60 aaccaggctc tggaaaagaa actggcacag 90 <210> 62 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Jun <400> 62 atcgcaagac tggaggagaa ggtgaagaca ctgaaggcac agaatagtga gctggcctca 60 actgctaaca tgctgcgaga acaggtggct cagctg 96 <210> 63 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Fos <400> 63 ctgaaggaga aagaaaagct gctgaatgca atcgagaccc agctggccag taaagaggac 60 gaactgcagg atacagaagc acagctgacc gataca 96 <210> 64 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-1 <400> 64 tcagggggca cctctgggtc aacatctggc actggctcta cc 42 <210> 65 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-2 <400> 65 agtggaggga ccagcggatc cacctctgga acaggctcca ct 42 <210> 66 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-3 <400> 66 agcggcggga caagcgggag cacctcaggg actgggagca ct 42 <210> 67 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-4 <400> 67 tccggcggga caagcggcag cacatccggg actggctcaa ca 42 <210> 68 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-5 <400> 68 agcggaggga ccagcgggtc cacctctgga acaggctcca ct 42 <210> 69 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-6 <400> 69 tctgggggca cctctggctc aacctctggg acaggctcca ct 42 <210> 70 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> H3.1 <400> 70 Met Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala 1 5 10 15 Pro Arg Lys Gln Leu Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ala 20 25 30 Thr Gly Gly Val Lys Lys Pro His Arg Tyr Arg Pro Gly Thr Val Ala 35 40 45 Leu Arg Glu Ile Arg Arg Tyr Gln Lys Ser Thr Glu Leu Leu Ile Arg 50 55 60 Lys Leu Pro Phe Gln Arg Leu Val Arg Glu Ile Ala Gln Asp Phe Lys 65 70 75 80 Thr Asp Leu Arg Phe Gln Ser Ser Ala Val Met Ala Leu Gln Glu Ala 85 90 95 Cys Glu Ala Tyr Leu Val Gly Leu Phe Glu Asp Thr Asn Leu Cys Ala 100 105 110 Ile His Ala Lys Arg Val Thr Ile Met Pro Lys Asp Ile Gln Leu Ala 115 120 125 Arg Arg Ile Arg Gly Glu Arg Ala 130 135 <210> 71 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> H3.2 <400> 71 Met Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala 1 5 10 15 Pro Arg Lys Gln Leu Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ala 20 25 30 Thr Gly Gly Val Lys Lys Pro His Arg Tyr Arg Pro Gly Thr Val Ala 35 40 45 Leu Arg Glu Ile Arg Arg Tyr Gln Lys Ser Thr Glu Leu Leu Ile Arg 50 55 60 Lys Leu Pro Phe Gln Arg Leu Val Arg Glu Ile Ala Gln Asp Phe Lys 65 70 75 80 Thr Asp Leu Arg Phe Gln Ser Ser Ala Val Met Ala Leu Gln Glu Ala 85 90 95 Ser Glu Ala Tyr Leu Val Gly Leu Phe Glu Asp Thr Asn Leu Cys Ala 100 105 110 Ile His Ala Lys Arg Val Thr Ile Met Pro Lys Asp Ile Gln Leu Ala 115 120 125 Arg Arg Ile Arg Gly Glu Arg Ala 130 135 <210> 72 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> H3.3 <400> 72 Met Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala 1 5 10 15 Pro Arg Lys Gln Leu Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ser 20 25 30 Thr Gly Gly Val Lys Lys Pro His Arg Tyr Arg Pro Gly Thr Val Ala 35 40 45 Leu Arg Glu Ile Arg Arg Tyr Gln Lys Ser Thr Glu Leu Leu Ile Arg 50 55 60 Lys Leu Pro Phe Gln Arg Leu Val Arg Glu Ile Ala Gln Asp Phe Lys 65 70 75 80 Thr Asp Leu Arg Phe Gln Ser Ala Ala Ile Gly Ala Leu Gln Glu Ala 85 90 95 Ser Glu Ala Tyr Leu Val Gly Leu Phe Glu Asp Thr Asn Leu Cys Ala 100 105 110 Ile His Ala Lys Arg Val Thr Ile Met Pro Lys Asp Ile Gln Leu Ala 115 120 125 Arg Arg Ile Arg Gly Glu Arg Ala 130 135 <210> 73 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> H2A.1 <400> 73 Met Ser Gly Arg Gly Lys Gln Gly Gly Lys Ala Arg Ala Lys Ala Lys 1 5 10 15 Thr Arg Ser Ser Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Val His 20 25 30 Arg Leu Leu Arg Lys Gly Asn Tyr Ala Glu Arg Val Gly Ala Gly Ala 35 40 45 Pro Val Tyr Leu Ala Ala Val Leu Glu Tyr Leu Thr Ala Glu Ile Leu 50 55 60 Glu Leu Ala Gly Asn Ala Ala Arg Asp Asn Lys Lys Thr Arg Ile Ile 65 70 75 80 Pro Arg His Leu Gln Leu Ala Ile Arg Asn Asp Glu Glu Leu Asn Lys 85 90 95 Leu Leu Gly Lys Val Thr Ile Ala Gln Gly Gly Val Leu Pro Asn Ile 100 105 110 Gln Ala Val Leu Leu Pro Lys Lys Thr Glu Ser His His Lys Ala Lys 115 120 125 Gly Lys 130 <210> 74 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> H2A.2 <400> 74 Met Ser Gly Arg Gly Lys Gln Gly Gly Lys Ala Arg Ala Lys Ala Lys 1 5 10 15 Ser Arg Ser Ser Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Val His 20 25 30 Arg Leu Leu Arg Lys Gly Asn Tyr Ala Glu Arg Val Gly Ala Gly Ala 35 40 45 Pro Val Tyr Met Ala Ala Val Leu Glu Tyr Leu Thr Ala Glu Ile Leu 50 55 60 Glu Leu Ala Gly Asn Ala Ala Arg Asp Asn Lys Lys Thr Arg Ile Ile 65 70 75 80 Pro Arg His Leu Gln Leu Ala Ile Arg Asn Asp Glu Glu Leu Asn Lys 85 90 95 Leu Leu Gly Lys Val Thr Ile Ala Gln Gly Gly Val Leu Pro Asn Ile 100 105 110 Gln Ala Val Leu Leu Pro Lys Lys Thr Glu Ser His His Lys Ala Lys 115 120 125 Gly Lys 130 <210> 75 <211> 126 <212> PRT <213> Artificial Sequence <220> <223> H2B <400> 75 Met Pro Glu Pro Ala Lys Ser Ala Pro Ala Pro Lys Lys Gly Ser Lys 1 5 10 15 Lys Ala Val Thr Lys Ala Gln Lys Lys Asp Gly Lys Lys Arg Lys Arg 20 25 30 Ser Arg Lys Glu Ser Tyr Ser Val Tyr Val Tyr Lys Val Leu Lys Gln 35 40 45 Val His Pro Asp Thr Gly Ile Ser Ser Lys Ala Met Gly Ile Met Asn 50 55 60 Ser Phe Val Asn Asp Ile Phe Glu Arg Ile Ala Gly Glu Ala Ser Arg 65 70 75 80 Leu Ala His Tyr Asn Lys Arg Ser Thr Ile Thr Ser Arg Glu Ile Gln 85 90 95 Thr Ala Val Arg Leu Leu Leu Pro Gly Glu Leu Ala Lys His Ala Val 100 105 110 Ser Glu Gly Thr Lys Ala Val Thr Lys Tyr Thr Ser Ser Lys 115 120 125 <210> 76 <211> 103 <212> PRT <213> Artificial Sequence <220> <223> H4 <400> 76 Met Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala 1 5 10 15 Lys Arg His Arg Lys Val Leu Arg Asp Asn Ile Gln Gly Ile Thr Lys 20 25 30 Pro Ala Ile Arg Arg Leu Ala Arg Arg Gly Gly Val Lys Arg Ile Ser 35 40 45 Gly Leu Ile Tyr Glu Glu Thr Arg Gly Val Leu Lys Val Phe Leu Glu 50 55 60 Asn Val Ile Arg Asp Ala Val Thr Tyr Thr Glu His Ala Lys Arg Lys 65 70 75 80 Thr Val Thr Ala Met Asp Val Val Tyr Ala Leu Lys Arg Gln Gly Arg 85 90 95 Thr Leu Tyr Gly Phe Gly Gly 100 <210> 77 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> L1 <400> 77 Asp Pro Pro Val Ala Thr 1 5 <210> 78 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> NZ <400> 78 Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu 1 5 10 15 Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln 20 25 <210> 79 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> CZ <400> 79 Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln 1 5 10 15 Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala Gln 20 25 30 <210> 80 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Jun <400> 80 Ile Ala Arg Leu Glu Glu Lys Val Lys Thr Leu Lys Ala Gln Asn Ser 1 5 10 15 Glu Leu Ala Ser Thr Ala Asn Met Leu Arg Glu Gln Val Ala Gln Leu 20 25 30 <210> 81 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Fos <400> 81 Leu Lys Glu Lys Glu Lys Leu Leu Asn Ala Ile Glu Thr Gln Leu Ala 1 5 10 15 Ser Lys Glu Asp Glu Leu Gln Asp Thr Glu Ala Gln Leu Thr Asp Thr 20 25 30 <210> 82 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> L2 <400> 82 Ser Gly Gly Thr Ser Gly Ser Thr Ser Gly Thr Gly Ser Thr 1 5 10 <110> Sookmyung Women's university industry-academic cooperation foundation <120> Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase <130> PN200017 <160> 82 <170> KoPatentIn 3.0 <210> 1 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Linker <400> 1 Asp Asp Pro Val Ala Thr 1 5 <210> 2 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> H2A_sense_primer <400> 2 aaaaagcgct gatccaccgg tcgccaccat gtctggacgt ggcaagcag 49 <210> 3 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> H2A_antisense_primer <400> 3 aaaagctagc ggtggcgacc ggtggatcct tgcccttagc tttgtggtgg 50 <210> 4 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> H2B_sense_primer <400> 4 aaaaggcgcc gatccaccgg tcgccaccat gcctgagcca gcgaaatcc 49 <210> 5 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> H2B_antisense_primer <400> 5 aaaagctagc ggtggcgacc ggtggatcct tggagctggt gtacttggta acg 53 <210> 6 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> H3.1_sense_primer <400> 6 aaaaagcgct gatccaccgg tcgccaccat ggcacgcacg aagcaaac 48 <210> 7 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> H3.1_antisense_primer <400> 7 aaaagctagc ggtggcgacc ggtggatctg ccctctctcc gcgaatg 47 <210> 8 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> H3.2_sense_primer <400> 8 aaaaagcgct gatccaccgg tcgccaccat ggcccgtact aagcagactg c 51 <210> 9 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> H3.2_antisense_primer <400> 9 aaaagctagc ggtggcgacc ggtggatcag cccgctctcc acggatg 47 <210> 10 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> H3.3_sense_primer <400> 10 aaaaagcgct gatccaccgg tcgccaccat ggctcgtaca aagcagactg cc 52 <210> 11 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> H3.3_antisense_primer <400> 11 aaaagctagc ggtggcgacc ggtggatcag cacgttctcc acgtatgcg 49 <210> 12 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> H4_sense_primer <400> 12 aaaaagcgct gatccaccgg tcgccaccat gtccggcaga ggaaaggg 48 <210> 13 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> H4_antisense_primer <400> 13 aaaaggcgcc gatccaccgg tcgccaccat gcctgagcca gcgaaatcc 49 <210> 14 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> biotinylated oligonucleotide <400> 14 atttgttaaa gavaggatat cagtggtcca g 31 <210> 15 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> linker+ <400> 15 gtaatacgac tcactatagg gctccgctta agggac 36 <210> 16 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Linker- <400> 16 tagtccctta gcggag 16 <210> 17 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer_F <400> 17 gacttgtggt ctcgctgttc cttgg 25 <210> 18 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Primer_R <400> 18 gtaatacgac tcactatagg gctccccgct taag 34 <210> 19 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for adapter addition <400> 19 tcgtcggcag cgtcagatgt gtataagaga cagggagggt ctcctctgag tgattgacta 60 cc 62 <210> 20 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for adapter addition <400> 20 gtctcgtggg ctcggagatg tgtataagag acagactcac tatagggctc cgcttaaggg 60 ac 62 <210> 21 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for index addition <400> 21 aatgatacgg cgaccaccga gatctacact cgtcggcagc gtc 43 <210> 22 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for index addition <400> 22 caagcagaag acggcatacg agatrrrrrr rrgtctcgtg ggctcgg 47 <210> 23 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S502 <400> 23 ctctctat 8 <210> 24 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S503 <400> 24 tatcctct 8 <210> 25 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S505 <400> 25 gtaaggag 8 <210> 26 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S506 <400> 26 actgcata 8 <210> 27 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S507 <400> 27 aaggagta 8 <210> 28 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S508 <400> 28 ctaagcct 8 <210> 29 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S510 <400> 29 cgtctaat 8 <210> 30 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S511 <400> 30 tctctccg 8 <210> 31 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S513 <400> 31 tcgactag 8 <210> 32 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S515 <400> 32 ttctagct 8 <210> 33 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S516 <400> 33 cctaggt 8 <210> 34 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S517 <400> 34 gcgtaaga 8 <210> 35 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S518 <400> 35 ctattag 8 <210> 36 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S520 <400> 36 aaggctat 8 <210> 37 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S521 <400> 37 gagcctta 8 <210> 38 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> FFFFFFFF_S522 <400> 38 ttatgcga 8 <210> 39 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N701 <400> 39 tcgcctta 8 <210> 40 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N702 <400> 40 ctagtacg 8 <210> 41 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N703 <400> 41 ttctgcct 8 <210> 42 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N704 <400> 42 gctcagga 8 <210> 43 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N705 <400> 43 aggagtcc 8 <210> 44 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N706 <400> 44 catgccta 8 <210> 45 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N707 <400> 45 gtagagag 8 <210> 46 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N710 <400> 46 cagcctcg 8 <210> 47 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N711 <400> 47 tgcctctt 8 <210> 48 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N712 <400> 48 tcctctac 8 <210> 49 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N714 <400> 49 tcatgagc 8 <210> 50 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> RRRRRRRR_N715 <400> 50 cctgagat 8 <210> 51 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> viral 3 LTR sequence <400> 51 ggagggtctc ctctgagtga ttgactaccc gtcagcgggg gtctttca 48 <210> 52 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> H3.1 <400> 52 atggcacgca cgaagcaaac agctcgtaag tccactggcg gcaaagcccc gcgcaagcag 60 ctggccacta aggcggctcg caaaagcgcg ccagccaccg gtggcgtgaa gaagccccac 120 cgctacaggc ctggtactgt cgccctccgt gaaatccgcc gctatcagaa atcgactgag 180 ctactgattc gcaagctacc attccagcgt ctggtacgtg agatcgcgca ggacttcaag 240 accgacctgc gcttccagag ctcggctgtg atggcgctgc aggaggcctg cgaggcttac 300 ctggtggggc tctttgagga caccaacctg tgtgctatcc acgccaagcg agtgactatc 360 atgcccaagg acatccagct cgctcgccgc attcgcggag agagggca 408 <210> 53 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> H3.2 <400> 53 atggcccgta ctaagcagac tgctcgcaag tcgaccggcg gcaaggcccc gaggaagcag 60 ctggccacca aggcggcccg caagagcgcg ccggccacgg gcggggtgaa gaagccgcac 120 cgctaccggc ccggcaccgt agccctgcgg gagatccggc gctaccagaa gtccacggag 180 ctgctgatcc gcaagctgcc cttccagcgg ctggtacgcg agatcgcgca ggactttaag 240 acggacctgc gcttccagag ctcggccgtg atggcgctgc aggaggccag cgaggcctac 300 ctggtggggc tgttcgaaga cacgaacctg tgcgccatcc acgccaagcg cgtgaccatt 360 atgcccaagg acatccagct ggcccgccgc atccgtggag agcgggct 408 <210> 54 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> H3.3 <400> 54 atggctcgta caaagcagac tgcccgcaaa tcgaccggtg gtaaagcacc caggaagcaa 60 ctggctacaa aagccgctcg caagagtgcg ccctctaccg gaggggtgaa gaaacctcat 120 cgttacaggc ctggtactgt ggcgctccgt gaaattagac gttatcagaa gtccactgaa 180 cttctgattc gcaaacttcc cttccagcgt ctggtgcgag aaattgctca ggactttaaa 240 acagatctgc gcttccagag cgcagctatc ggtgctttgc aggaggcaag tgaggcctat 300 ctggttggcc tttttgaaga caccaacctg tgtgctatcc atgccaaacg tgtaacaatt 360 atgccaaaag acatccagct ggcacgccgc atacgtggag aacgtgct 408 <210> 55 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> H2A.1 <400> 55 atgtctggac gtggcaagca gggcggcaag gctcgcgcca aggccaaaac ccgctcctct 60 agagctgggc tccaatttcc tgtaggacga gtgcaccgcc tgctccgcaa gggcaactac 120 gctgagcggg tcggggccgg cgcgccggtt tacctggcgg cggtgctgga gtacctaact 180 gccgagatcc tggagctggc gggcaacgca gcccgcgaca acaaaaagac ccgcatcatc 240 ccgcgccact tgcagctggc catccgcaac gacgaggagc tcaacaagct gcttggtaaa 300 gttaccatcg ctcagggcgg tgttctgcct aacatccagg ccgtactgct ccccaagaag 360 actgagagcc accacaaagc taagggcaag 390 <210> 56 <211> 390 <212> DNA <213> Artificial Sequence <220> <223> H2A.2 <400> 56 atgtctggtc gtggcaagca aggaggcaag gcccgcgcca aggccaagtc gcgctcgtcc 60 cgcgctggcc ttcagttccc ggtagggcga gtgcatcgct tgctgcgcaa aggcaactac 120 gcggagcgag tgggggccgg cgcgcccgtc tacatggctg cggtcctcga gtatctgacc 180 gccgagatcc tggagctggc gggcaacgcg gctcgggaca acaagaagac gcgcatcatc 240 cctcgtcacc tccagctggc catccgcaac gacgaggaac tgaacaagct gctgggcaaa 300 gtcaccatcg cccagggcgg cgtcttgcct aacatccagg ccgtactgct ccctaagaag 360 acggagagtc accacaaggc aaagggcaag 390 <210> 57 <211> 378 <212> DNA <213> Artificial Sequence <220> <223> H2B <400> 57 atgcctgagc cagcgaaatc cgctcccgcc ccgaagaagg gctccaagaa ggccgtgacc 60 aaggcgcaga agaaggacgg caagaagcgc aagcgcagcc gcaaggagag ctactccgta 120 tacgtgtaca aggtgctgaa acaggtccac cccgacaccg gcatctcctc taaagccatg 180 gggatcatga attcctttgt caacgacatc ttcgagcgca tcgccggcga ggcttcccgc 240 ctggcgcatt acaacaagcg ctcgaccatc acctccaggg agatccagac ggccgtgcgc 300 ctgctgcttc ccggggagct ggccaagcac gctgtgtcag agggcaccaa ggccgttacc 360 aagtacacca gctccaag 378 <210> 58 <211> 309 <212> DNA <213> Artificial Sequence <220> <223> H4 <400> 58 atgtccggca gaggaaaggg cggaaaaggc ttaggcaaag ggggcgctaa gcgccaccgc 60 aaggtcttga gagacaacat tcagggcatc accaagcctg ccattcggcg tctagctcgg 120 cgtggcggcg ttaagcggat ctctggcctc atttacgagg agacccgcgg tgtgctgaag 180 gtgttcctgg agaatgtgat tcgggacgca gtcacctaca ccgagcacgc caagcgcaag 240 accgtcacag ccatggatgt ggtgtacgcg ctcaagcgcc aggggcgcac cctgtacggc 300 ttcggaggc 309 <210> 59 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> L1 <400> 59 gatccaccgg tcgccacc 18 <210> 60 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> NZ <400> 60 gcactgaaaa aggaactgca ggctaacaaa aaggaactgg cacagctgaa gtgggagctg 60 caggccctga agaaagaact ggctcag 87 <210> 61 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> CZ <400> 61 gagcagctgg aaaagaaact gcaggcactg gagaagaaac tggcccagct ggaatggaaa 60 aaccaggctc tggaaaagaa actggcacag 90 <210> 62 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> Jun <400> 62 atcgcaagac tggaggagaa ggtgaagaca ctgaaggcac agaatagtga gctggcctca 60 actgctaaca tgctgcgaga acaggtggct cagctg 96 <210> 63 <211> 96 <212> DNA <213> Artificial Sequence <220> <223> <400> 63 ctgaaggaga aagaaaagct gctgaatgca atcgagaccc agctggccag taaagaggac 60 gaactgcagg atacagaagc acagctgacc gataca 96 <210> 64 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-1 <400> 64 tcagggggca cctctgggtc aacatctggc actggctcta cc 42 <210> 65 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-2 <400> 65 agtggaggga ccagcggatc cacctctgga acaggctcca ct 42 <210> 66 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-3 <400> 66 agcggcggga caagcgggag cacctcaggg actgggagca ct 42 <210> 67 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-4 <400> 67 tccggcggga caagcggcag cacatccggg actggctcaa ca 42 <210> 68 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-5 <400> 68 agcggaggga ccagcgggtc cacctctgga acaggctcca ct 42 <210> 69 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> L2-6 <400> 69 tctgggggca cctctggctc aacctctggg acaggctcca ct 42 <210> 70 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> H3.1 <400> 70 Met Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala 1 5 10 15 Pro Arg Lys Gln Leu Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ala 20 25 30 Thr Gly Gly Val Lys Lys Pro His Arg Tyr Arg Pro Gly Thr Val Ala 35 40 45 Leu Arg Glu Ile Arg Arg Tyr Gln Lys Ser Thr Glu Leu Leu Ile Arg 50 55 60 Lys Leu Pro Phe Gln Arg Leu Val Arg Glu Ile Ala Gln Asp Phe Lys 65 70 75 80 Thr Asp Leu Arg Phe Gln Ser Ser Ala Val Met Ala Leu Gln Glu Ala 85 90 95 Cys Glu Ala Tyr Leu Val Gly Leu Phe Glu Asp Thr Asn Leu Cys Ala 100 105 110 Ile His Ala Lys Arg Val Thr Ile Met Pro Lys Asp Ile Gln Leu Ala 115 120 125 Arg Arg Ile Arg Gly Glu Arg Ala 130 135 <210> 71 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> H3.2 <400> 71 Met Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala 1 5 10 15 Pro Arg Lys Gln Leu Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ala 20 25 30 Thr Gly Gly Val Lys Lys Pro His Arg Tyr Arg Pro Gly Thr Val Ala 35 40 45 Leu Arg Glu Ile Arg Arg Tyr Gln Lys Ser Thr Glu Leu Leu Ile Arg 50 55 60 Lys Leu Pro Phe Gln Arg Leu Val Arg Glu Ile Ala Gln Asp Phe Lys 65 70 75 80 Thr Asp Leu Arg Phe Gln Ser Ser Ala Val Met Ala Leu Gln Glu Ala 85 90 95 Ser Glu Ala Tyr Leu Val Gly Leu Phe Glu Asp Thr Asn Leu Cys Ala 100 105 110 Ile His Ala Lys Arg Val Thr Ile Met Pro Lys Asp Ile Gln Leu Ala 115 120 125 Arg Arg Ile Arg Gly Glu Arg Ala 130 135 <210> 72 <211> 136 <212> PRT <213> Artificial Sequence <220> <223> H3.3 <400> 72 Met Ala Arg Thr Lys Gln Thr Ala Arg Lys Ser Thr Gly Gly Lys Ala 1 5 10 15 Pro Arg Lys Gln Leu Ala Thr Lys Ala Ala Arg Lys Ser Ala Pro Ser 20 25 30 Thr Gly Gly Val Lys Lys Pro His Arg Tyr Arg Pro Gly Thr Val Ala 35 40 45 Leu Arg Glu Ile Arg Arg Tyr Gln Lys Ser Thr Glu Leu Leu Ile Arg 50 55 60 Lys Leu Pro Phe Gln Arg Leu Val Arg Glu Ile Ala Gln Asp Phe Lys 65 70 75 80 Thr Asp Leu Arg Phe Gln Ser Ala Ala Ile Gly Ala Leu Gln Glu Ala 85 90 95 Ser Glu Ala Tyr Leu Val Gly Leu Phe Glu Asp Thr Asn Leu Cys Ala 100 105 110 Ile His Ala Lys Arg Val Thr Ile Met Pro Lys Asp Ile Gln Leu Ala 115 120 125 Arg Arg Ile Arg Gly Glu Arg Ala 130 135 <210> 73 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> H2A.1 <400> 73 Met Ser Gly Arg Gly Lys Gln Gly Gly Lys Ala Arg Ala Lys Ala Lys 1 5 10 15 Thr Arg Ser Ser Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Val His 20 25 30 Arg Leu Leu Arg Lys Gly Asn Tyr Ala Glu Arg Val Gly Ala Gly Ala 35 40 45 Pro Val Tyr Leu Ala Ala Val Leu Glu Tyr Leu Thr Ala Glu Ile Leu 50 55 60 Glu Leu Ala Gly Asn Ala Ala Arg Asp Asn Lys Lys Thr Arg Ile Ile 65 70 75 80 Pro Arg His Leu Gln Leu Ala Ile Arg Asn Asp Glu Glu Leu Asn Lys 85 90 95 Leu Leu Gly Lys Val Thr Ile Ala Gln Gly Gly Val Leu Pro Asn Ile 100 105 110 Gln Ala Val Leu Leu Pro Lys Lys Thr Glu Ser His His Lys Ala Lys 115 120 125 Gly Lys 130 <210> 74 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> H2A.2 <400> 74 Met Ser Gly Arg Gly Lys Gln Gly Gly Lys Ala Arg Ala Lys Ala Lys 1 5 10 15 Ser Arg Ser Ser Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Val His 20 25 30 Arg Leu Leu Arg Lys Gly Asn Tyr Ala Glu Arg Val Gly Ala Gly Ala 35 40 45 Pro Val Tyr Met Ala Ala Val Leu Glu Tyr Leu Thr Ala Glu Ile Leu 50 55 60 Glu Leu Ala Gly Asn Ala Ala Arg Asp Asn Lys Lys Thr Arg Ile Ile 65 70 75 80 Pro Arg His Leu Gln Leu Ala Ile Arg Asn Asp Glu Glu Leu Asn Lys 85 90 95 Leu Leu Gly Lys Val Thr Ile Ala Gln Gly Gly Val Leu Pro Asn Ile 100 105 110 Gln Ala Val Leu Leu Pro Lys Lys Thr Glu Ser His His Lys Ala Lys 115 120 125 Gly Lys 130 <210> 75 <211> 126 <212> PRT <213> Artificial Sequence <220> <223> H2B <400> 75 Met Pro Glu Pro Ala Lys Ser Ala Pro Ala Pro Lys Lys Gly Ser Lys 1 5 10 15 Lys Ala Val Thr Lys Ala Gln Lys Lys Asp Gly Lys Lys Arg Lys Arg 20 25 30 Ser Arg Lys Glu Ser Tyr Ser Val Tyr Val Tyr Lys Val Leu Lys Gln 35 40 45 Val His Pro Asp Thr Gly Ile Ser Ser Lys Ala Met Gly Ile Met Asn 50 55 60 Ser Phe Val Asn Asp Ile Phe Glu Arg Ile Ala Gly Glu Ala Ser Arg 65 70 75 80 Leu Ala His Tyr Asn Lys Arg Ser Thr Ile Thr Ser Arg Glu Ile Gln 85 90 95 Thr Ala Val Arg Leu Leu Leu Pro Gly Glu Leu Ala Lys His Ala Val 100 105 110 Ser Glu Gly Thr Lys Ala Val Thr Lys Tyr Thr Ser Ser Lys 115 120 125 <210> 76 <211> 103 <212> PRT <213> Artificial Sequence <220> <223> H4 <400> 76 Met Ser Gly Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala 1 5 10 15 Lys Arg His Arg Lys Val Leu Arg Asp Asn Ile Gln Gly Ile Thr Lys 20 25 30 Pro Ala Ile Arg Arg Leu Ala Arg Arg Gly Gly Val Lys Arg Ile Ser 35 40 45 Gly Leu Ile Tyr Glu Glu Thr Arg Gly Val Leu Lys Val Phe Leu Glu 50 55 60 Asn Val Ile Arg Asp Ala Val Thr Tyr Thr Glu His Ala Lys Arg Lys 65 70 75 80 Thr Val Thr Ala Met Asp Val Val Tyr Ala Leu Lys Arg Gln Gly Arg 85 90 95 Thr Leu Tyr Gly Phe Gly Gly 100 <210> 77 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> L1 <400> 77 Asp Pro Pro Val Ala Thr 1 5 <210> 78 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> NZ <400> 78 Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu 1 5 10 15 Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln 20 25 <210> 79 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> CZ <400> 79 Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln 1 5 10 15 Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala Gln 20 25 30 <210> 80 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Jun <400> 80 Ile Ala Arg Leu Glu Glu Lys Val Lys Thr Leu Lys Ala Gln Asn Ser 1 5 10 15 Glu Leu Ala Ser Thr Ala Asn Met Leu Arg Glu Gln Val Ala Gln Leu 20 25 30 <210> 81 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> <400> 81 Leu Lys Glu Lys Glu Lys Leu Leu Asn Ala Ile Glu Thr Gln Leu Ala 1 5 10 15 Ser Lys Glu Asp Glu Leu Gln Asp Thr Glu Ala Gln Leu Thr Asp Thr 20 25 30 <210> 82 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> L2 <400> 82 Ser Gly Gly Thr Ser Gly Ser Thr Ser Gly Thr Gly Ser Thr 1 5 10

Claims (28)

히스톤 또는 루신 지퍼를 코딩하는 유전자가 도입된 레트로바이러스 벡터.A retroviral vector into which a gene encoding a histone or leucine zipper is introduced. 제1항에 있어서, 상기 히스톤 또는 루신 지퍼를 코딩하는 유전자는 인테그라제를 코딩하는 유전자에 도입된 것인, 레트로바이러스 벡터.The retroviral vector according to claim 1, wherein the gene encoding the histone or leucine zipper is introduced into a gene encoding an integrase. 제2항에 있어서, 상기 인테그라제를 코딩하는 유전자는 서열번호 83의 염기서열을 포함하는 것인, 레트로바이러스 벡터.The retroviral vector according to claim 2, wherein the gene encoding the integrase comprises the nucleotide sequence of SEQ ID NO: 83. 제1항에 있어서, 상기 히스톤은 서열번호 70 내지 76로 이루어진 군에서 선택된 아미노산 서열을 포함하는 것인, 레트로바이러스 벡터.The retroviral vector according to claim 1, wherein the histone comprises an amino acid sequence selected from the group consisting of SEQ ID NOs: 70 to 76. 제1항에 있어서, 상기 히스톤을 코딩하는 유전자는 서열번호 52 내지 58로 이루어진 군에서 선택된 염기서열을 포함하는 것인, 레트로바이러스 벡터.The retroviral vector according to claim 1, wherein the gene encoding the histone comprises a nucleotide sequence selected from the group consisting of SEQ ID NOs: 52 to 58. 제1항에 있어서, 상기 히스톤은 C-말단, N-말단 또는 양 말단에 제1 링커를 포함하는 것인, 레트로바이러스 벡터.The retroviral vector according to claim 1, wherein the histone comprises a first linker at the C-terminus, the N-terminus or both ends. 제1항에 있어서, 상기 히스톤을 코딩하는 유전자는 3', 5'또는 이들 모두에 제1 링커를 코딩하는 유전자를 포함하는 것인, 레트로바이러스 벡터.The retroviral vector according to claim 1, wherein the gene encoding the histone comprises a gene encoding the first linker at 3', 5' or both. 제1항에 있어서, 상기 루신 지퍼는 서열번호 78의 아미노산 서열을 포함하는 NZ 서열 및 서열번호 79의 아미노산 서열을 포함하는 CZ 서열; 또는 서열번호 80의 아미노산 서열을 포함하는 Jun 서열 및 서열번호 81의 아미노산 서열을 포함하는 Fos 서열을 포함하는 것인, 레트로바이러스 벡터.The method of claim 1, wherein the leucine zipper comprises a NZ sequence comprising the amino acid sequence of SEQ ID NO: 78 and a CZ sequence comprising the amino acid sequence of SEQ ID NO: 79; or a Jun sequence comprising the amino acid sequence of SEQ ID NO: 80 and a Fos sequence comprising the amino acid sequence of SEQ ID NO: 81. 제8항에 있어서, 상기 NZ 서열을 코딩하는 유전자는 서열번호 60의 염기서열을 포함하는 염기서열이고, 상기 CZ 서열을 코딩하는 유전자는 서열번호 61의 염기서열을 포함하는 염기서열인 것인, 레트로바이러스 벡터.The method of claim 8, wherein the gene encoding the NZ sequence is a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 60, and the gene encoding the CZ sequence is a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 61, Retrovirus vector. 제8항에 있어서, 상기 Jun 서열을 코딩하는 유전자는 서열번호 62의 염기서열을 포함하는 염기서열이고, 상기 Fos 서열을 코딩하는 유전자는 서열번호 63의 염기서열을 포함하는 염기서열인 것인, 레트로바이러스 벡터.The method of claim 8, wherein the gene encoding the Jun sequence is a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 62, and the gene encoding the Fos sequence is a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 63, Retrovirus vector. 제1항에 있어서, 상기 루신 지퍼는 C-말단, N-말단 또는 양 말단에 제2 링커를 포함하는 것인, 레트로바이러스 벡터.The retroviral vector according to claim 1, wherein the leucine zipper comprises a second linker at the C-terminus, the N-terminus or both ends. 제8항에 있어서, 상기 NZ 서열과 CZ 서열; 또는 Jun 서열과 Fos 서열은 제2 링커를 통해 연결된 것인, 레트로바이러스 벡터.The method of claim 8, wherein the NZ sequence and the CZ sequence; or wherein the Jun sequence and the Fos sequence are linked via a second linker. 제2항에 있어서, 상기 히스톤을 코딩하는 유전자 또는 루신 지퍼를 코딩하는 유전자는 인테그라제를 코딩하는 유전자의 108 또는 816 번 위치 다음에 삽입된 것인, 레트로바이러스 벡터.The retroviral vector according to claim 2, wherein the gene encoding the histone or the gene encoding the leucine zipper is inserted after position 108 or 816 of the gene encoding integrase. 제2항에 있어서, 상기 히스톤 또는 루신 지퍼는 인테그라제의 37 또는 273 번 잔기 앞에 삽입된 것인, 레트로바이러스 벡터.The retroviral vector according to claim 2, wherein the histone or leucine zipper is inserted before residues 37 or 273 of integrase. 다음의 단계를 포함하는 히스톤 또는 루신 지퍼를 코딩하는 유전자가 도입된 레트로바이러스 벡터 구축 방법:
히스톤 또는 루신 지퍼를 코딩하는 유전자를 준비하는 유전자 준비 단계; 및
유전자를 레트로바이러스에 도입하는 도입 단계.
A method for constructing a retroviral vector into which a gene encoding a histone or leucine zipper is introduced, comprising the steps of:
A gene preparation step of preparing a gene encoding a histone or leucine zipper; and
An introduction step in which a gene is introduced into a retrovirus.
제15항에 있어서, 상기 도입 단계는 히스톤 또는 루신 지퍼를 코딩하는 유전자를 인테그라제를 코딩하는 유전자에 도입하는 것인, 방법.The method according to claim 15, wherein the introducing step is to introduce a gene encoding a histone or leucine zipper into a gene encoding an integrase. 제16항에 있어서, 상기 인테그라제를 코딩하는 유전자는 서열번호 83의 염기서열을 포함하는 것인, 방법.The method of claim 16, wherein the gene encoding the integrase comprises the nucleotide sequence of SEQ ID NO: 83. 제15항에 있어서, 상기 히스톤은 서열번호 65 내지 71로 이루어진 군에서 선택된 아미노산 서열을 포함하는 것인, 방법.The method of claim 15 , wherein the histone comprises an amino acid sequence selected from the group consisting of SEQ ID NOs: 65 to 71. 제15항에 있어서, 상기 히스톤을 코딩하는 유전자는 서열번호 52 내지 58로 이루어진 군에서 선택된 염기서열을 포함하는 것인, 방법.The method of claim 15, wherein the gene encoding the histone comprises a nucleotide sequence selected from the group consisting of SEQ ID NOs: 52 to 58. 제15항에 있어서, 상기 히스톤은 C-말단, N-말단 또는 양 말단에 제1 링커를 포함하는 것인, 방법.The method of claim 15 , wherein the histone comprises a first linker at the C-terminus, the N-terminus or both ends. 제15항에 있어서, 상기 히스톤을 코딩하는 유전자는 3', 5'또는 이들 모두에 제1 링커를 코딩하는 유전자를 포함하는 것인, 방법.The method of claim 15 , wherein the gene encoding the histone comprises a gene encoding the first linker at 3', 5' or both. 제15항에 있어서, 상기 루신 지퍼는 서열번호 73의 아미노산 서열을 포함하는 NZ 서열 및 서열번호 74의 아미노산 서열을 포함하는 CZ 서열; 또는 서열번호 75의 아미노산 서열을 포함하는 Jun 서열 및 서열번호 76의 아미노산 서열을 포함하는 Fos 서열을 포함하는 것인, 방법.16. The method of claim 15, wherein the leucine zipper comprises a NZ sequence comprising the amino acid sequence of SEQ ID NO: 73 and a CZ sequence comprising the amino acid sequence of SEQ ID NO: 74; or a Jun sequence comprising the amino acid sequence of SEQ ID NO: 75 and a Fos sequence comprising the amino acid sequence of SEQ ID NO: 76. 제22항에 있어서, 상기 NZ 서열을 코딩하는 유전자는 서열번호 60의 염기서열을 포함하는 염기서열이고, 상기 CZ 서열을 코딩하는 유전자는 서열번호 61의 염기서열을 포함하는 염기서열인 것인, 방법.The method of claim 22, wherein the gene encoding the NZ sequence is a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 60, and the gene encoding the CZ sequence is a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 61, Way. 제22항에 있어서, 상기 Jun 서열을 코딩하는 유전자는 서열번호 62의 염기서열을 포함하는 염기서열이고, 상기 Fos 서열을 코딩하는 유전자는 서열번호 63의 염기서열을 포함하는 염기서열인 것인, 방법.The method of claim 22, wherein the gene encoding the Jun sequence is a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 62, and the gene encoding the Fos sequence is a nucleotide sequence including the nucleotide sequence of SEQ ID NO: 63, Way. 제15항에 있어서, 상기 루신 지퍼는 C-말단, N-말단 또는 양 말단에 제2 링커를 포함하는 것인, 방법.16. The method of claim 15, wherein the leucine zipper comprises a second linker at the C-terminus, the N-terminus or both ends. 제22항에 있어서, 상기 NZ 서열과 CZ 서열; 또는 Jun 서열과 Fos 서열은 제2 링커를 통해 연결된 것인, 방법.23. The method of claim 22, wherein the NZ sequence and the CZ sequence; or the Jun sequence and the Fos sequence are linked via a second linker. 제15항에 있어서 상기 히스톤 또는 루신 지퍼를 코딩하는 유전자는 인테그라제를 코딩하는 유전자의 108 또는 816 번 위치 다음에 도입하는 것인, 방법.The method according to claim 15, wherein the gene encoding the histone or leucine zipper is introduced after position 108 or 816 of the gene encoding integrase. 제15항에 있어서, 상기 히스톤 또는 루신 지퍼는 인테그라제의 37 또는 273 번 잔기 앞에 도입된 것인, 방법.The method of claim 15, wherein the histone or leucine zipper is introduced before residues 37 or 273 of integrase.
KR1020200038994A 2020-03-31 2020-03-31 Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase KR102541652B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200038994A KR102541652B1 (en) 2020-03-31 2020-03-31 Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200038994A KR102541652B1 (en) 2020-03-31 2020-03-31 Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase

Publications (2)

Publication Number Publication Date
KR20210121756A true KR20210121756A (en) 2021-10-08
KR102541652B1 KR102541652B1 (en) 2023-06-13

Family

ID=78610020

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200038994A KR102541652B1 (en) 2020-03-31 2020-03-31 Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase

Country Status (1)

Country Link
KR (1) KR102541652B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114933658A (en) * 2022-04-24 2022-08-23 深圳市鹏泰生物科技有限公司 Short peptide element and application method thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020146701A1 (en) * 2000-05-12 2002-10-10 Hamilton Andrew D. Methods of detecting interactions between proteins, peptides or libraries thereof using fusion proteins

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020146701A1 (en) * 2000-05-12 2002-10-10 Hamilton Andrew D. Methods of detecting interactions between proteins, peptides or libraries thereof using fusion proteins

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
GenBank No. NC_001501.1 *
GenBank No. NM_021018.3 *
Nature Communications, 2019, Vol.10, 4189, pp 1-10 *
한국생물공학회 학술대회 초록, (2018.10.) p174.* *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114933658A (en) * 2022-04-24 2022-08-23 深圳市鹏泰生物科技有限公司 Short peptide element and application method thereof
CN114933658B (en) * 2022-04-24 2023-07-11 深圳市鹏泰生物科技有限公司 Short peptide element and application method thereof

Also Published As

Publication number Publication date
KR102541652B1 (en) 2023-06-13

Similar Documents

Publication Publication Date Title
CN114085836B (en) Oligonucleotides for reducing PD-L1 expression
Cubellis et al. Isolation and sequencing of a new β-galactosidase-encoding archaebacterial gene
McBurney et al. The mouse Pgk-1 gene promoter contains an upstream activator sequence
JP5931812B2 (en) Polynucleotides encoding MHC class I restricted hTERT epitopes, analogs or polyepitope thereof
KR20220113442A (en) Particle Delivery System
Laverty et al. Murine CASK is disrupted in a sex-linked cleft palate mouse mutant
KR20090031897A (en) Pan-cell surface receptor-specific therapeutics
KR102403547B1 (en) Human cytomegalovirus comprising exogenous antigens
JP5740473B2 (en) Composition for prevention or treatment of cervical cancer comprising human papillomavirus variant and immunopotentiator
JP2017513484A (en) Codon-optimized nucleic acid encoding retinitis pigmentosa GTPase regulator (RPGR)
JPH11505128A (en) Chimeric integrase protein-mediated site-specific integration of vector constructs into eukaryotic genomes
KR102541652B1 (en) Safe retroviral vectors developed by insertion of histone or leucine zipper into the viral integrase
KR20160011645A (en) LENTIVIRAL VECTORS CONTAINING AN MHC CLASS I, MHC CLASS II OR β2 MICROGLOBULIN UPSTREAM PROMOTER SEQUENCE
JP6702863B2 (en) Transgene expression vector
TW202227476A (en) Recombinant adeno associated virus (raav) encoding gjb2 and uses thereof
WO2021033635A1 (en) Method for treating muscular dystrophy by targeting lama1 gene
WO2022045366A1 (en) Method for treating facioscapulohumeral muscular dystrophy (fshd) by targeting dux4 gene
Wolz et al. Genomic sequence and organization of the human gene for cytochrome c oxidase subunit (COX7A1) VIIa-M
AU2017208848A1 (en) Cancer vaccines
Inazu et al. Cloning and expression of pleckstrin 2, a novel member of the pleckstrin family
KR101806601B1 (en) Crystal structure of human Mus81-Eme1-DNA complex and preparing method thereof
CN115074344B (en) Multi-level strict regulation suicide protein rCas8 activity system and application thereof
JP7412832B2 (en) A gene therapy vector with minimal recombination occurrence, a recombinant retrovirus containing the vector, and a pharmaceutical composition containing the recombinant retrovirus for preventing or treating cancer.
JP2001510464A (en) &#34;Basic helix loop helix&#34; bHLH family polypeptides, corresponding nucleic acid sequences
JP4723133B2 (en) Novel human BMCC1 gene

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant