KR20090083804A - Selection method of sirna sequence for selectively inhibiting expression of target subtype mrna - Google Patents

Selection method of sirna sequence for selectively inhibiting expression of target subtype mrna Download PDF

Info

Publication number
KR20090083804A
KR20090083804A KR1020080009813A KR20080009813A KR20090083804A KR 20090083804 A KR20090083804 A KR 20090083804A KR 1020080009813 A KR1020080009813 A KR 1020080009813A KR 20080009813 A KR20080009813 A KR 20080009813A KR 20090083804 A KR20090083804 A KR 20090083804A
Authority
KR
South Korea
Prior art keywords
target
subtype
sequence
mrna
mrnas
Prior art date
Application number
KR1020080009813A
Other languages
Korean (ko)
Inventor
박영규
김영주
원미선
Original Assignee
한국생명공학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생명공학연구원 filed Critical 한국생명공학연구원
Priority to KR1020080009813A priority Critical patent/KR20090083804A/en
Publication of KR20090083804A publication Critical patent/KR20090083804A/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/14Type of nucleic acid interfering N.A.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

A method for selecting a sequence of siRNA(small interfering RNA) which selectively suppresses the expression of specific subtype mRNA at the same time is provided to simplify the selection process through direct comparison without unnecessary analysis process and error. A method for selecting siRNA sequence to suppress selective expression of target subtype mRNA comprises: a step (S1) of selecting a target subtype mRNA and non-target subtype mRNA; a step of extracting common sequence domain(A) of target subtype mRNAs; and a step of determining target domain sequence by extracting a sequence domain(B) which specifically presents in the target mRNA by removing common sequence domain with each non-target subtype mRNA.

Description

표적 아형 mRNA의 선택적 발현 억제를 위한 siRNA 서열을 선정하는 방법 {Selection method of siRNA sequence for selectively inhibiting expression of target subtype mRNA}{Selection method of siRNA sequence for selectively inhibiting expression of target subtype mRNA}

본 발명은 표적 아형 mRNA의 선택적 발현 억제를 위한 siRNA 서열을 선정하는 방법에 관한 것으로서, 더욱 상세하게는 여러 개의 아형이 존재하는 유전자에서 특정한 아형 표적 mRNA 또는 둘 이상의 특정 아형 표적 mRNA들의 발현을 선택적으로 동시에 억제할 수 있는 공통 siRNA 서열을 선정하는 방법에 관한 것이다.The present invention relates to a method for selecting siRNA sequences for selective expression suppression of target subtype mRNA, and more particularly, to selectively express the expression of a specific subtype target mRNA or two or more specific subtype target mRNAs in a gene having several subtypes. The present invention relates to a method for selecting consensus siRNA sequences that can be simultaneously inhibited.

RNA 간섭 (RNA interference 또는 RNAi)은 표적 유전자의 mRNA와 상동인 서열을 가지는 센스 RNA와 이것과 상보적인 서열을 가지는 안티센스 RNA로 구성되는 이중나선 RNA(double-stranded RNA, dsRNA)를 세포 등에 도입하여 선택적으로 표적유전자의 mRNA의 분해를 유도하고 표적유전자의 발현을 억제할 수 있는 현상이다. RNAi는 선택적으로 표적유전자의 발현을 억제할 수 있기 때문에 종래의 비효율적인 상동 재조합에 의한 유전자 파괴방법을 대신하는 간단한 유전자 넉다운(knock- down) 방법 또는 유전자치료의 방법으로서 상당한 관심을 모으고 있다. 1998년 Fire와 Mello에 의해 C. elegans(선충)에서 처음 밝혀진 이후, Drosophila(초파리), Trypanosoma(편모충의 일종), 척추동물에서도 보고되었다(Tabara H, Grishok A, Mello CC, Science, 282(5388), 430-1, 1998). RNA interference (RNA interference) is a double-stranded RNA (dsRNA) composed of a sense RNA having a sequence homologous to the mRNA of a target gene and an antisense RNA having a sequence complementary thereto, and the like to introduce a cell into a cell. It is a phenomenon that can selectively induce the degradation of mRNA of the target gene and inhibit the expression of the target gene. Since RNAi can selectively inhibit the expression of target genes, it has attracted considerable attention as a simple gene knock-down method or gene therapy method that replaces conventional methods of gene destruction by inefficient homologous recombination. Since it was first identified in C. elegans (nematodes) by Fire and Mello in 1998, it has also been reported in Drosophila, Drosophila, Trypanosoma, and vertebrates (Tabara H, Grishok A, Mello CC, Science, 282 (5388). ), 430-1, 1998).

인간의 경우에는 dsRNA를 세포에 도입할 때 항바이러스성 인터페론 경로(antiviral interferon pathway)가 유발되어 RNAi를 관측하기 어려웠으나, 2001년 Elbashir와 Tuschl 등에 의해 21 nt(nucleotide)의 작은 dsRNA를 인간 세포에 도입하는 경우에는 항바이러스성 인터페론 기작이 없이 RNAi가 일어나는 것으로 밝혀졌다(Elbashir,S.M., Harborth,J., Lendeckel,W., Yalcin,A., Weber, K., Tuschl,T., Nature, 411, 494-498, 2001; Elbashir,S.M., Lendeckel,W., Tuschl,T., Genes & Dev., 15, 188-200, 2001; Elbashir,S.M., Martinez,J., Patkaniowska,A., Lendeckel,W., Tuschl,T., EMBO J., 20, 6877-6888, 2001). 이후 21nt dsRNA는 small interfering RNA (siRNA)로 불리며 효과적인 기능유전체학(functional genomics) 도구로서 각광을 받기 시작하였고, 2002년 Science 저널에서 “Breakthrough of the year” 1번으로 선정되었으며(Jennifer Couzin, BREAKTHROUGH OF THE YEAR:Small RNAs Make Big Splash, Jennifer Couzin, Science 20 December 2002: 2296-2297), 2006년에는 RNAi를 발견한 앤드루 Z. 파이어(미국 스탠퍼드대)와 크레이그 C. 멜로(미국 메사추세츠대)가 노벨 생리의학상 공동 수상자로 선정될 정도로 중요성이 인정되었다.In humans, when the dsRNA was introduced into cells, the antiviral interferon pathway was induced, making it difficult to observe RNAi.However, in 2001, Elbashir and Tuschl et al. When introduced, RNAi was found to occur without antiviral interferon mechanisms (Elbashir, SM, Harborth, J., Lendeckel, W., Yalcin, A., Weber, K., Tuschl, T., Nature, 411). , 494-498, 2001; Elbashir, SM, Lendeckel, W., Tuschl, T., Genes & Dev., 15, 188-200, 2001; Elbashir, SM, Martinez, J., Patkaniowska, A., Lendeckel, W., Tuschl, T., EMBO J., 20, 6877-6888, 2001). Since then, 21nt dsRNA, called small interfering RNA (siRNA), has been in the spotlight as an effective functional genomics tool.In 2002, it was selected as “Breakthrough of the year” by Science Journal (Jennifer Couzin, BREAKTHROUGH OF THE YEAR: Small RNAs Make Big Splash, Jennifer Couzin, Science 20 December 2002: 2296-2297), and in 2006, Andrew Z. Fire (Stanford, USA) and Craig C. Melo (Massachusetts, USA) discovered RNAi. The importance was recognized as being a co-winner of the medical award.

siRNA의 이용은 기존의 안티센스 RNA(antisense RNA) 기술에 비해 효율을 예 측할 수 있는 알고리즘들이 연구되어 있어 적은 수의 실험을 통해서도 효율이 높은 siRNA를 찾을 수 있으며, 폴리펩타이드 산물의 발현 수준을 변화시키기 위해 당 분야에서 사용하고 있는 서열-특이적 변형 또는 유전자 발현의 조절에 이용되는 다른 폴리뉴클레오타이드에 비해, 사용되는 siRNA 폴리뉴클레오타이드 유효농도가 낮으며, 증진된 안정성을 갖고, 다른 폴리뉴클레오타이드(예: 안티센스, 리보좀 또는 트리플렉스 폴리뉴클레오타이드)에 비해 짧은 길이를 갖는 등의 장점을 갖는다. 또한, 세포에 의해 용이하게 수용되며 화학적으로 변형된 뉴클레오타이드의 사용이 필요하지 않는 등 다수의 장점을 갖는다. The use of siRNA has been studied to predict the efficiency compared to the existing antisense RNA (antisense RNA) technology, so that a small number of experiments can find a high efficiency siRNA, changing the expression level of the polypeptide product Compared to other polynucleotides used in the regulation of sequence-specific modifications or gene expression used in the art, the siRNA polynucleotide effective concentration used is low, has enhanced stability, and other polynucleotides such as antisense. , Ribosomes or triplex polynucleotides), and shorter lengths. It also has a number of advantages, including the ease of acceptance by the cell and the need for the use of chemically modified nucleotides.

siRNA를 이용한 연구에 있어서 가장 중요한 부분은 효율이 높은 표적 염기서열을 선별하는 방법과 목적하는 조직으로 siRNA를 전달(drug delivery)하는 방법이라고 할 수 있다. siRNA의 염기서열에 따라 물리 화학적 특성과 효율이 다르며, 고효율의 siRNA를 사용해야 실험결과가 분명하고, 또한 적은 양의 치료제로 사용이 가능하기 때문에, 표적 염기서열을 찾는 과정에 있어서 효율적인 siRNA 서열, 즉 표적 영역을 찾는 알고리즘의 개발은 매우 중요하다.The most important part of the research using siRNA is to select high efficiency target sequences and to deliver siRNA to a desired tissue. The physicochemical properties and efficiencies vary depending on the nucleotide sequence of the siRNA, and the high-efficiency siRNA clarifies the experimental results and can be used as a small amount of therapeutic agent. The development of an algorithm to find the target area is very important.

한편, 선택적 스플라이싱 현상이 유전자의 최종 산물인 단백질들의 다양성에 큰 역할을 한다는 것은 매우 잘 알려진 사실이다(Graveley, B.R., Trends Genet., 100-107, 2001). 인간 유전자의 74%가 선택적 스플라이싱 mRNA를 가지고 있는 것으로 알려져 있으며(Johnson, J.M., 등, Science(302), 2141-2144, 2003), 초파리의 경우에도 매우 다양한 선택적 스플라이싱 mRNA들을 가지고 있는 것으로 알려져 있 다(Schmucker, D., 등, Cell(101), 671-684, 2000). 또한, 선택적 스플라이싱은 질병 여부, 조직특이성, 발생 단계 등에 따라 아형(isoform)들의 발현 양상이 각각 다르게 나타나는 것으로 알려져 있다(Sigalas I, Calvert AH, Anderson JJ, Neal DE, Lunec J, Nat Med. 1996 Aug;2(8):912-7; Weng MW, Lai JC, Hsu CP, Yu KY, Chen CY, Lin TS, Lai WW, Lee H, Ko JL, Environ Mol Mutagen. 2005 Jul;46(1):1-11; Ando S, Sarlis NJ, Krishnan J, Feng X, Refetoff S, Zhang MQ, Oldfield EH, Yen PM, Mol Endocrinol. 2001 Sep;15(9):1529-38; Nakahata S, Kawamoto S, Nucleic Acids Res. 2005 Apr 11;33(7):2078-89; Lees-Murdock DJ, Shovlin TC, Gardiner T, De Felici M, Walsh CP, Dev Dyn. 2005 Apr;232(4):992-1002). On the other hand, it is well known that selective splicing plays a large role in the diversity of proteins, the end products of genes (Graveley, B.R., Trends Genet., 100-107, 2001). 74% of human genes are known to have selective splicing mRNA (Johnson, JM, et al., Science (302), 2141-2144, 2003), and in the case of Drosophila they contain a wide variety of selective splicing mRNAs. (Schmucker, D., et al., Cell (101), 671-684, 2000). In addition, selective splicing is known to show different expression patterns of isoforms depending on disease, tissue specificity, stage of development, etc. (Sigalas I, Calvert AH, Anderson JJ, Neal DE, Lunec J, Nat Med. 1996 Aug; 2 (8): 912-7; Weng MW, Lai JC, Hsu CP, Yu KY, Chen CY, Lin TS, Lai WW, Lee H, Ko JL, Environ Mol Mutagen. 2005 Jul; 46 (1) Ando S, Sarlis NJ, Krishnan J, Feng X, Refetoff S, Zhang MQ, Oldfield EH, Yen PM, Mol Endocrinol. 2001 Sep; 15 (9): 1529-38; Nakahata S, Kawamoto S, Nucleic Acids Res. 2005 Apr 11; 33 (7): 2078-89; Lees-Murdock DJ, Shovlin TC, Gardiner T, De Felici M, Walsh CP, Dev Dyn. 2005 Apr; 232 (4): 992-1002) .

따라서, RNAi를 이용하여 생명현상의 주체인 단백질의 기능 연구 및 조절을 효과적으로 수행하기 위하여는 siRNA 서열의 설계에 있어서 선택적 스플라이싱 기작의 고려가 필수적으로 요구된다. 즉, 개개의 특정 단백질들에 대하여 생성을 제어하기 위하여는 임의의 유전자에서 발현된 다수의 선택적 스플라이싱 산물들(spliced-variants)중에 특정한 아형이나 두 개 이상의 아형 조합에 대하여 선택적으로 발현을 억제하는 siRNA를 설계하여야 한다. 그러나, 선택적 스플라이싱에 의하여 생성되는 아형들은 엑손(exon)들의 다양한 조합에 의하여 구성이 되며, 아형들 간에 일부의 공통 엑손들을 공유하거나 각자 특이적 엑손들을 포함하고 있으므로 그러한 특정 아형 mRNA 또는 mRNA들의 조합을 발현 억제하기 위한 공통 siRNA를 설계하는 것은 간단하지 않다. 또한, 발현을 억제하고자 하는 아형 mRNA들의 조합은 연구의 목적과 필요에 따라 달라질 수 있기 때문에, 전체 유전체의 유전자를 고려한 수많은 아형 mRNA들의 조합에 대한 공통 siRNA 라이브러리들을 미리 설계하여 둔다는 것은 현실적으로 불가능하다. 따라서, 연구목적과 필요에 따라 발현 억제할 아형 mRNA나 조합이 결정되면 그에 맞추어 실시간으로 siRNA의 공통 표적 영역을 결정하여 siRNA를 설계하여야 하며, 그를 위하여 아형 mRNA 조합에 대한 공통 siRNA의 표적영역을 구하기 위한 효과적인 방법이 필요하다. Therefore, in order to effectively perform the function research and regulation of the protein, which is the subject of life phenomena using RNAi, consideration of selective splicing mechanism is essential in the design of siRNA sequences. In other words, in order to control production for individual specific proteins, expression of a specific subtype or combination of two or more subtypes among a plurality of selective spliced-variants expressed in any gene is selectively suppressed. SiRNA should be designed. However, subtypes produced by selective splicing are constituted by various combinations of exons, and because they share some common exons or contain specific exons among subtypes, Designing consensus siRNAs to inhibit expression of combinations is not straightforward. In addition, since the combination of subtype mRNAs to suppress expression may vary depending on the purpose and needs of the study, it is practically impossible to design common siRNA libraries for the combination of numerous subtype mRNAs in consideration of the genes of the whole genome. . Therefore, if the subtype mRNA or combination to be suppressed is determined according to the purpose of the study and the necessity, siRNA should be designed by determining the common target region of siRNA in real time accordingly, and for that, to obtain the target region of the common siRNA for the subtype mRNA combination. An effective way is needed.

siRNA 염기서열을 이용하여 표적 mRNA 발현을 억제하는 방법과 관련된 선행특허로는 대한민국 공개특허공보 제2007-0094601호 및 대한민국 공개특허공보 제2004-0022449 등이 있으나, 이들은 각각의 mRNA에 대한 siRNA를 제조하고, 대상 mRNA의 발현을 억제하는 방법으로, 다수개의 표적 mRNA에 적용시키기 어렵다는 한계가 있다. Prior patents related to a method of inhibiting target mRNA expression using siRNA sequences include Korean Patent Application Publication No. 2007-0094601 and Korean Patent Application Publication No. 2004-0022449, but these prepare siRNAs for respective mRNAs. In addition, as a method of suppressing the expression of a target mRNA, there is a limit that it is difficult to apply to a plurality of target mRNA.

다수 개의 표적 mRNA의 발현 억제가 가능한 siRNA를 제조하는 방법과 관련된 선행특허로는 대한민국 등록특허공보 제0793505호가 있으나, 이는 각각의 염기서열마다 서열 모티프를 형성하고, 이로부터 키워드 트라이를 생성하는 과정을 반복적으로 수행해야 하기 때문에, 번거로운 단점이 있다. 또한, 아형 mRNA 조합에 대한 공통 siRNA의 표적영역을 구하는 방법과 관련된 선행특허로는 대한민국 등록특허공보 제0794705호가 있으나, 상기 방법은 표적 영역을 결정하기 위하여 UCSC (University of California Santa Cruz)의 게놈 생명정보학(genome bioinformatics) 데이터베이스 (http://www.genome.ucsc.edu)에서 제공하는 엑손들의 DNA상 위치정보를 사용하기 때문에, mRNA 서열을 직접 사용하는 본 발명과 차이가 있으며, DNA의 서열정보가 변경되더라도 엑손의 위치 정보에 반영되어 제공될 때까지 기다려야 하는 문제점이 있다. 게다가, 공통 siRNA를 설계하기 위한 표적 영역을 구하는 과정에 있어서 DNA상 좌표 및 mRNA상 좌표를 상호 변환하면서 계산해야 하는 복잡한 다단계의 분석 과정이 필요하기 때문에 분석과정에서 오류가 발생할 가능성 또한 많다는 점을 예상할 수 있다.Prior patents related to a method for preparing siRNA capable of inhibiting the expression of a plurality of target mRNAs include Korean Patent Publication No. 0,93,505, which forms a sequence motif for each nucleotide sequence and generates a keyword tri from it. Since it must be performed repeatedly, it has a cumbersome disadvantage. In addition, although there is a prior patent related to a method for obtaining a target region of a common siRNA for subtype mRNA combination, there is a Korean Patent Publication No. 0794705, which is a method for determining genomic life of the University of California Santa Cruz (UCSC) to determine a target region. Since the location information on the DNA of exons provided by the genome bioinformatics database (http://www.genome.ucsc.edu) is used, there is a difference from the present invention that directly uses the mRNA sequence, DNA sequence information Even if is changed, there is a problem to wait until it is provided reflected in the location information of the exon. In addition, it is expected that errors in the analysis process are likely to occur because a complicated multi-step analysis process that requires calculations by translating DNA coordinates and DNA coordinates is required to obtain a target region for designing a common siRNA. can do.

이에, 본 발명자들은 임의의 유전자에서 발현되는 각각의 아형 mRNA들의 서열 비교를 통하여 표적 아형 mRNA들이 갖는 공통 서열과 비표적 mRNA들의 서열을 대수적으로 조합하면 특정 표적 아형 mRNA들만이 특이적으로 갖는 공통 서열 영역을 도출할 수 있음을 착안하였고, 이를 이용하여 표적 아형 mRNA의 선택적 발현 억제를 위한 siRNA 서열을 선정하는 방법을 개발하여 본 발명을 완성하였다. Accordingly, the present inventors have compared the sequence of each subtype mRNAs expressed in an arbitrary gene to logarithmically combine the common sequence of the target subtype mRNAs with the sequence of the non-target mRNAs, and thus the common sequence having only specific target subtype mRNAs. It was conceived that a region could be derived, and a method for selecting siRNA sequences for suppressing selective expression of target subtype mRNAs was developed to complete the present invention.

이러한 방법은 아형 mRNA들의 염기서열을 직접 비교하는 방법을 고안하여 적용함으로써, 엑손의 유전체 상 좌표를 이용하여 표적 영역을 선정하는 종래의 방법이 가지는 상기 문제점들이 발생하지 않으며, 간단한 방법으로 단백질 수준의 발현 제어나, 실험 목표에 따라 다양한 조합의 표적 mRNA를 발현 억제할 수 있는 siRNA 설계를 위한 표적 영역을 보다 용이하게 구할 수 있는 장점이 있다. 또한, 본 발명의 방법은 mRNA 염기서열을 직접 사용하기 때문에, 엑손들의 유전체 상 위치정보가 필요 없으며, 좌표 계산 등의 복잡한 분석 과정이 불필요하다. 개념이 단순하여 오류의 발생 가능성도 적으며, 분석 과정에서의 오류 확인이 용이하고, 프로그램으로 구현하여 자동화 하기도 용이하다. 또한, 엑손 위치정보를 사용하는 경우와 달리 데이터베이스에서 일차 데이터인 mRNA 염기 서열 관련 정보가 갱신되더라도 그에 따른 정보 반영에 있어서의 시간적인 지연문제도 없다. By devising and applying a method of directly comparing nucleotide sequences of subtype mRNAs, the above-mentioned problems do not occur with the conventional method of selecting a target region using the coordinates of the exon genome. There is an advantage that it is possible to more easily obtain a target region for siRNA design that can suppress expression control or expression of various combinations of target mRNAs according to experimental targets. In addition, since the method of the present invention directly uses mRNA sequences, it does not require location information on the genomes of exons, and does not require complicated analysis processes such as coordinate calculation. The concept is simple, so there is little possibility of error, it is easy to check the error in the analysis process, and it is easy to implement and automate it as a program. In addition, unlike the case where exon position information is used, even if the mRNA base sequence information, which is the primary data in the database, is updated, there is no time delay in reflecting the information.

본 발명의 목적은 1) 임의의 유전자의 아형 mRNA 중에서 발현을 억제하기 원하는 표적 아형 mRNA 및 비표적 아형 mRNA를 각각 선정하는 단계; 2) 상기 표적 아형 mRNA들 모두의 공통된 서열 영역(A)을 추출하는 단계; 및 3) 상기 (A) 영역에서 각 비표적 아형 mRNA들에 공통된 서열 영역을 제외하여 표적 mRNA들에만 특이적으로 존재하는 서열 영역(B)을 추출하여 표적 영역 서열을 결정하는 단계를 포함하는 표적 아형 mRNA의 선택적 발현 억제를 위한 siRNA 서열을 선정하는 방법을 제공하는 것이다.It is an object of the present invention to 1) select a target subtype mRNA and a non-target subtype mRNA, each of which is desired to inhibit expression among subtype mRNAs of any gene; 2) extracting a common sequence region (A) of all of the target subtype mRNAs; And 3) extracting a sequence region (B) specifically present only in target mRNAs except for a sequence region common to each non-target subtype mRNA in the region (A) to determine a target region sequence. It is to provide a method for selecting siRNA sequences for the selective suppression of subtype mRNA.

하나의 양태로서, 본 발명은 1) 임의의 유전자의 아형 mRNA 중에서 발현을 억제하기 원하는 표적 아형 mRNA 및 비표적 아형 mRNA를 각각 선정하는 단계; 2) 상기 표적 아형 mRNA들 모두의 공통된 서열 영역(A)을 추출하는 단계; 및 3) 상기 (A) 영역에서 각 비표적 아형 mRNA들에 공통된 서열 영역을 제외하여 표적 mRNA들에만 특이적으로 존재하는 서열 영역(B)을 추출하여 표적 영역 서열을 결정하는 단계를 포함하는 표적 아형 mRNA의 선택적 발현 억제를 위한 siRNA 서열을 선정하는 방법에 관한 것이다.In one aspect, the present invention provides a method for producing a subtype mRNA, comprising the steps of: 1) selecting a target subtype mRNA and a non-target subtype mRNA, each of which is desired to inhibit expression among subtype mRNAs of any gene; 2) extracting a common sequence region (A) of all of the target subtype mRNAs; And 3) extracting a sequence region (B) specifically present only in target mRNAs except for a sequence region common to each non-target subtype mRNA in the region (A) to determine a target region sequence. It relates to a method of selecting siRNA sequences for the selective inhibition of subtype mRNA.

본 발명에서 사용된 용어 "아형 mRNA"는 선택적 스플라이싱에 의해 생성되는 서로 다른 형태의 엑손 조합을 가지는 mRNA들을 말한다. 인간을 포함하는 진핵생물체들에 있어서 임의의 유전자로부터 전사 직후에 생성되는 미성숙 mRNA (premature mRNA 또는 pre-mRNA)로부터 선택적 스플라이싱 과정을 거친다. 스플라이싱이란 일종의 편집과정으로서, 유전자로부터 전사된 RNA에서 인트론(introns)을 제거하고 엑손(exons)을 연결함으로써 성숙한 mRNA를 만드는 과정인데, 선택적인 (alternative) 스플라이싱은 pre-mRNA의 엑손들을 서로 다른 패턴으로 연결하기 때문에 한 pre-mRNA로부터 여러 개의 아형 mRNA를 만들 수 있다. The term "subtype mRNA" as used herein refers to mRNAs having different forms of exon combinations produced by selective splicing. In eukaryotes, including humans, selective splicing is performed from premature mRNA (premature mRNA or pre-mRNA) produced immediately after transcription from any gene. Splicing is a type of editing process that removes introns from genes transcribed from genes and connects exons to make mature mRNAs.Alternative splicing is the exon of pre-mRNA By linking them together in different patterns, several subtype mRNAs can be made from a single pre-mRNA.

본 발명에서 "엑손"은 유전체 상에서 임의의 유전자에 해당하는 영역 중 실제로 단백질의 아미노산 정보를 암호화 하고 있는 한 개 이상의 부분 영역을 의미하며, 선택적 스플라이싱을 통하여 mRNA를 구성하게 된다. 진핵생물의 경우 임의의 한 유전자에 1개 이상의 엑손이 존재한다. 또한, 본 발명에서“인트론”은 유전체 상에서 임의의 유전자에 해당하는 영역 중 엑손들 사이에 존재하는 염기서열을 의미하며, 전사된 미성숙 mRNA에 포함되어 있다가 선택적 스플라이싱 과정에서 제거되어 분해된다. 따라서, mRNA의 서열에 포함되어 있지 않으며, 단백질의 번역에 기여하지 않는다. In the present invention, "exon" refers to one or more partial regions that actually encode amino acid information of a protein among regions corresponding to any gene on the genome, and constitutes mRNA through selective splicing. In eukaryotes there is more than one exon in any one gene. In addition, in the present invention, "intron" means a nucleotide sequence existing between exons among regions corresponding to any gene on the genome, and is included in the transcribed immature mRNA and is removed and degraded during selective splicing. . Thus, it is not included in the mRNA sequence and does not contribute to the translation of the protein.

본 발명에서 사용된 용어, "표적 아형 mRNA"는 임의의 유전자의 아형 mRNA 중 발현 억제 대상이 되는 하나 이상의 mRNA를 의미하고, "비표적 아형 mRNA"는 상기 표적 아형 mRNA를 제외한 나머지 아형 mRNA를 의미한다.As used herein, the term "target subtype mRNA" refers to one or more mRNAs that are subject to inhibition of expression among subtype mRNAs of any gene, and "non-target subtype mRNA" refers to the remaining subtype mRNAs except for the target subtype mRNA. do.

이하, 본 발명을 단계별로 상세히 설명한다.Hereinafter, the present invention will be described in detail step by step.

먼저, 본 발명의 '1)임의의 유전자의 아형 mRNA 중에서 발현을 억제하기 원하는 표적 아형 mRNA 및 비표적 아형 mRNA를 각각 선정하는 단계'는 특정 유전자의 아형 mRNA들 중 억제시키고자 하는 표적 아형 mRNA를 선정하는 단계를 의미한다. First, '1) selecting each target subtype mRNA and a non-target subtype mRNA to suppress expression among subtype mRNAs of any gene of the present invention is to target subtype mRNAs to be suppressed among subtype mRNAs of a specific gene. It means the stage of selection.

본 발명의 표적 아형 mRNA 및 비표적 아형 mRNA는 하나 또는 둘 이상일 수 있으며, 표적 아형 mRNA를 선정하기 위한 각 아형 mRNA들의 정보는 미국 국립생물정보센터 홈페이지 (http:// www.ncbi.nlm.nih.gov/) 등에서 얻을 수 있다. The target subtype mRNA and the non-target subtype mRNA of the present invention may be one or more than one, and the information of each subtype mRNA for selecting the target subtype mRNA is located in the US National Center for Biological Information (http: //www.ncbi.nlm.nih) .gov /), etc.

본 발명의 '2) 상기 표적 아형 mRNA들 모두의 공통된 서열 영역(A)을 추출하는 단계'는 단계 1)에서 선정한 표적 아형 mRNA들의 염기서열 정보만을 이용하여, 이들 모두의 공통 서열을 구하는 단계로서, 공통 서열영역 (A)를 수학적으로 표기하면, A = T1∩T2∩T3∩...∩Tn 이고, 상기 n은 자연수로서 임의의 유전자의 아형 mRNA 중에서 발현을 억제하기 원하는 표적 아형 mRNA(T)의 개수를 의미하며, Tn은 n번째 표적 mRNA의 염기서열을 의미한다.'2) extracting a common sequence region (A) of all the target subtype mRNAs of the present invention is a step of obtaining a common sequence of all of them using only base sequence information of the target subtype mRNAs selected in step 1); In mathematical expression of the consensus sequence region (A), A = T 1 ∩T 2 ∩T 3 ∩ ... ∩T n , where n is a natural number and a target desired to inhibit expression in subtype mRNA of any gene. The number of subtype mRNA (T), T n means the base sequence of the n-th target mRNA.

공통 서열을 추출하는 방법은 바람직하게는 표적 아형 mRNA 가 복수 개인 경우, 하나의 표적 아형 mRNA를 먼저 선정하고, 나머지 표적 아형 mRNA들을 하나씩 순차적으로 비교함으로써, 공통된 서열을 추출할 수 있다. 즉, 표적 아형 mRNA 하나를 선정한 후, 나머지 표적 아형 mRNA들 중 하나를 앞서 선정한 표적 아형 mRNA와 비교하여 1차 공통서열을 추출하고, 거기서 추출된 공통서열을 비교하지 않은 표적 아형 RNA들 중 하나와 비교하여 2차 공통서열을 추출하는 등의 순차적 방법으 로 공통 서열을 추출해가는 것이다.In the method of extracting a common sequence, preferably, when there are a plurality of target subtype mRNAs, a common sequence may be extracted by first selecting one target subtype mRNA and sequentially comparing the remaining target subtype mRNAs one by one. That is, after selecting one target subtype mRNA, one of the remaining target subtype mRNAs is compared with the previously selected target subtype mRNA, and the primary common sequence is extracted, and the target subtype RNAs are not compared with the extracted common sequences. By comparison, the common sequence is extracted by a sequential method such as extracting a second common sequence.

본 발명의 '3) 상기 (A) 영역에서 각 비표적 아형 mRNA들에 공통된 서열 영역을 제외하여 표적 mRNA들에만 특이적으로 존재하는 서열 영역(B)을 추출하여 표적 영역 서열을 결정하는 단계'는 단계 2)에서 추출한 표적 아형 mRNA들의 공통 서열(A)에서 비표적 mRNA들에 존재하는 모든 서열 영역(B)을 제외시키는 단계로서, 서열 영역 (B)를 수학적으로 표기하면, B = A - (Q1∪Q2∪Q3∪...∪Qm) 이고, m은 자연수로서 임의의 유전자의 아형 mRNA 중 비표적 아형 mRNA(Q)의 개수를 의미하며, Qm은 m번째 비표적 mRNA의 염기서열을 의미한다.'3) Determining a target region sequence by extracting the sequence region (B) specifically present only in the target mRNAs except for the sequence region common to the respective non-target subtype mRNAs in the region (A) Excluding all sequence regions (B) present in non-target mRNAs from the consensus sequence (A) of target subtype mRNAs extracted in step 2), where the sequence region (B) is mathematically represented, B = A − (Q 1 ∪Q 2 ∪Q 3 ∪ ... ∪Q m ), m is a natural number, which means the number of non-target subtype mRNAs (Q) among subtype mRNAs of any gene, and Q m is the mth non-target Means the nucleotide sequence of mRNA.

표적 아형 mRNA들의 공통 서열(A)로부터 비표적 아형 mRNA들의 서열을 제외시키는 방법은 바람직하게는 비표적 아형 mRNA 가 복수 개인 경우, 비표적 아형 mRNA를 하나씩 순차적으로 단계 2)에서 추출된 표적 아형 mRNA들의 공통서열과 비교함으로써, 공통된 서열을 제외시킬 수 있다. 즉, 비표적 아형 mRNA 하나를 선정한 후, 단계 1)에서 추출된 공통 서열(A)와 비교하여 공통된 부분을 공통 서열(A)로부터 제외시켜 새로운 서열을 정립하고, 이를 나머지 비표적 아형 mRNA들 중 하나와 비교하여, 공통된 부분을 새로운 서열로부터 제외시키는 등의 순차적 방법을 통해 수행하는 것이다.The method of excluding the sequence of non-target subtype mRNAs from the common sequence (A) of the target subtype mRNAs is preferably a target subtype mRNA extracted from the target subtype mRNAs sequentially in step 2) one by one when there are a plurality of non-target subtype mRNAs. By comparing with the common sequence of these, the common sequence can be excluded. That is, after selecting one non-target subtype mRNA, a new sequence is established by excluding the common part from the common sequence (A) compared to the common sequence (A) extracted in step 1), and the new non-target subtype mRNAs are established. Compared to one, the sequential method is performed to exclude common parts from the new sequence.

각 표적 및 비표적 아형 mRNA들의 공통서열 분석은 각 mRNA들의 염기서열 정 보를 비교함으로써 수행될 수 있는데, 이러한 염기서열 정보는 미국 국립생물정보센터 홈페이지 (http://www.ncbi.nlm.nih.gov/) 및 UCSC의 게놈 생명정보학(genome bioinformatics) 홈페이지(http://genome.ucsc.edu/) 등의 공공 데이터베이스를 통해 용이하게 입수할 수 있다. 또한, 각 표적 및 비표적 아형 mRNA 서열들 간의 공통영역을 구하기 위한 공통서열 분석은 염기 서열을 서열정렬 (sequence alignment) 알고리즘을 제공하는 범용의 프로그램을 사용할 수 있으며, 미국 국립생물정보센터에서 제공하는 BLAST 프로그램 (ftp://ftp.ncbi.nlm.nih.gov/blast/)이나 유럽 생물정보학 협회(European Bioinformatics Institute, http:// www.ebi.ac.uk/fasta33/)에서 제공하는 FASTA 프로그램이 대표적인 예이다.Common sequence analysis of each target and non-target subtype mRNAs can be performed by comparing the sequence information of each mRNA. Such sequence information can be found in the US National Institute of Biological Information (http: //www.ncbi.nlm.nih. gov /) and UCSC's public databases such as the homepage of the genome bioinformatics (http://genome.ucsc.edu/). In addition, the common sequence analysis for finding the common region between each target and non-target subtype mRNA sequences can use a general-purpose program that provides a sequence alignment algorithm, which is provided by the US National Center for Biological Information. FASTA program offered by the BLAST program (ftp://ftp.ncbi.nlm.nih.gov/blast/) or the European Bioinformatics Institute (http: // www.ebi.ac.uk/fasta33/). This is a representative example.

본 발명의 구체적 양태로서, 단계 1)의 표적 아형 mRNA 및 비표적 아형 mRNA의 서열을 포함하는 모든 mRNA정보를 데이터베이스화시키고, 단계 2) 및 단계 3)를 수행하기 위한 일련의 명령들을 프로그램화시킴으로써, 표적 아형 mRNA의 선택적 발현 억제용 siRNA 서열을 선정하기 위한 최종 표적 영역을 결정하는 과정을 자동화 시스템에 적용시켜, 효율적인 siRNA 서열 선정을 위한 소프트웨어를 개발할 수도 있다.In a specific embodiment of the present invention, by databaseting all the mRNA information including the sequence of the target subtype mRNA and the non-target subtype mRNA of step 1), by programming a series of instructions for performing steps 2) and 3) In addition, the process of determining the final target region for selecting siRNA sequences for selective expression suppression of target subtype mRNA may be applied to an automated system to develop software for efficient siRNA sequence selection.

이하, 본 발명을 도면을 통해 좀 더 구체적으로 설명한다.Hereinafter, the present invention will be described in more detail with reference to the drawings.

임의의 유전자의 특정한 아형 mRNA 또는 두 개 이상의 아형 mRNA들의 발현을 억제하는 공통 siRNA를 디자인하기 위해서는 본 발명이 제공하는 결과와 같이 공통 siRNA 설계를 위한 표적 영역 서열로서 표적 mRNA들에만 특이적으로 존재하는 영역의 서열을 결정하여야 한다. 예를 들어, 3가지 다른 아형 mRNA가 존재하는 유전자의 경우를 도 1을 참조하여 설명하면 다음과 같다: In order to design a common siRNA that inhibits the expression of a particular subtype mRNA or two or more subtype mRNAs of any gene, as presently provided, only specific target mRNAs exist as target region sequences for the design of the common siRNA. The sequence of the region should be determined. For example, the case of a gene with three different subtype mRNAs is described with reference to FIG. 1 as follows:

표적 유전자는 도 1의 A에 나타낸 바와 같이 4개의 엑손영역들과 그 들 사이의 인트론 영역들로 구성되어 있으며, 아형1(isoform1), 아형2(isoform2), 아형3(isoform3)의 3가지 아형 mRNA로 발현이 된다. 그 중 아형2와 아형3을 발현 억제시켜야 하는 표적 mRNA로 결정하였다. 도 1의 B에 나타낸 바와 같이 표적 mRNA인 아형2는 엑손1(exon1), 엑손2(exon2), 엑손4(exon4)의 3개 엑손으로 이루어져 있으며, 아형3은 엑손1, 엑손2, 엑손3(exon3), 엑손4의 4개의 엑손으로 이루어져 있다. 비표적 mRNA인 아형1은 엑손1과 엑손3의 2개의 엑손으로 이루어져 있다. 보다 일반화 된 형태의 유전자 구조를 예로 들기 위하여 아형1의 엑손1, 엑손3과 아형3의 엑손4는 나머지 아형들의 해당 엑손들과 비교하여 점선으로 구분된 여분의 엑손 영역을 가지고 있다고 가정하였다. 선택적 스플라이싱이 일어난 후 세포의 핵에서 세포질로 이동한 성숙한 mRNA (matured mRNA)는 도 1의 C에 나타낸바와 같이 인트론들이 제거되고 엑손들이 차례로 연결된 형태를 하고 있다. 아형2와 아형3을 표적으로 하는 공통 siRNA 설계를 위한 표적 영역은 도 1의 D에 나타낸 바와 같이, 표적 아형 mRNA들의 공통 영역인 첫째, 엑손1과 엑손2로 이루어진 영역과 둘째, 엑손4의 일부 영역의 2개 표적 후보 영역들을 구하고, 그것들과 비표적 아형 mRNA와의 공통 영역인 엑손1 영역을 제외하여 얻을 수 있으며, 따라서 최종 표적 영역은 엑손2 영역과 엑손4의 일부 영역 두 곳이 된다.The target gene is composed of four exon regions and intron regions therebetween, as shown in A of FIG. 1, and three subtypes of isoform1, isoform2 and isoform3. It is expressed by mRNA. Among them, subtype 2 and subtype 3 were determined as target mRNAs to be suppressed. As shown in B of FIG. 1, subtype 2, which is a target mRNA, consists of three exons of exon 1, exon 2, and exon 4, and subtype 3 is exon 1, exon 2, and exon 3. (exon3), which consists of four exons of exon 4. Subtype 1, a non-target mRNA, consists of two exons, exon 1 and exon 3. To illustrate the more generalized gene structure, it is assumed that exon 1 of subtype 1, exon 3 and exon 4 of subtype 3 have extra exon regions separated by dotted lines compared to the corresponding exons of the other subtypes. The mature mRNA (matured mRNA), which migrated from the nucleus of the cell to the cytoplasm after selective splicing occurs, has a form in which introns are removed and exons are sequentially connected as shown in FIG. Target regions for the design of common siRNAs targeting subtype 2 and subtype 3 are regions of the first, exon 1 and exon 2, which are the common regions of target subtype mRNAs, as shown in D of FIG. Two target candidate regions of the region can be obtained and obtained by excluding the exon 1 region, which is a common region between them and the non-target subtype mRNA, so that the final target region is two regions of exon 2 region and some regions of exon 4 region.

한편, 본 발명의 표적 아형 mRNA의 선택적 발현 억제를 위한 siRNA 서열을 선정하는 방법을 도 2에 도시된 흐름도를 통해 좀 더 구체적으로 설명한다.Meanwhile, a method of selecting siRNA sequences for selective expression inhibition of target subtype mRNA of the present invention will be described in more detail with reference to a flowchart shown in FIG. 2.

모든 표적 아형 mRNA들의 공통영역인 A 영역을 찾는 과정은 도 2의 흐름도에 나타낸 바와 같이 바람직하게는 다음과 같이 이루어진다:The process for finding the A region, which is a common region of all target subtype mRNAs, is preferably performed as shown in the flow chart of FIG.

(ⅰ) 선정한 표적 아형 mRNA 중 하나의 서열을 선택하여 siRNA를 설계할 표적 영역 후보로 정한다(도 2의 S2). 표적 아형 mRNA가 하나 밖에 없다면 모든 표적 아형 mRNA들의 공통 영역은 상기 표적 영역 후보 서열이 되며, 하기의 (ii), (iii), (iv)단계를 수행할 필요 없이 각 비표적 아형 mRNA 서열들과의 공통 부분을 제외하기 위한 (v)단계로 넘어간다(도 2의 S3). (Iii) A sequence of one of the selected target subtype mRNAs is selected to be a target region candidate for siRNA design (S2 in FIG. 2). If there is only one target subtype mRNA, the common region of all target subtype mRNAs becomes the target region candidate sequence, and each of the non-target subtype mRNA sequences without the need to perform steps (ii), (iii) and (iv) below. Proceed to step (v) to exclude the common part of (S3 of FIG. 2).

(ii) 표적 아형 mRNA가 2개 이상인 경우, 아직 고려되지 않은 표적 아형 mRNA 서열 중 하나를 선정하여 상기의 표적 영역 후보 서열과 서열 정렬 프로그램을 이용하여 정렬한다(도 2의 S4).(ii) If there are two or more target subtype mRNAs, one of the target subtype mRNA sequences not yet considered is selected and aligned using the target region candidate sequence and the sequence alignment program (S4 in FIG. 2).

(iii) 상기 표적 영역 후보 서열과 고려중인 표적 아형 mRNA 서열이 정확하게 정렬된 공통 서열 영역이 존재한다면 공통 서열을 추출하여 새 표적 영역 후보 서열로 선택한다(도 2의 S5와 S6). 공통 서열 영역은 2곳 이상이 존재할 수 있으며, 그럴 경우 모든 공통 서열 영역을 별개의 새 표적 영역 후보로 선정한다. 만약, 공통 서열 영역이 존재하지 않는다면, 모든 아형 mRNA들 간의 공통 서열 영역이 존재하지 않는 것이며, 그러할 경우 모든 표적 아형 mRNA를 동시에 발현 억제할 수 있는 공통 siRNA를 설계할 수 있는 표적 영역이 존재하지 않는다는 의미이다. 그러한 경우, 모든 표적 아형 mRNA를 발현 억제 시키기 위해서는 반드시 2종 이상의 siRNA를 적용하여야 하며, 그러한 경우는 본 발명에서의 고려 대상이 아니다. (iii) If there is a consensus sequence region in which the target region candidate sequence and the target subtype mRNA sequence under consideration are correctly aligned, the consensus sequence is extracted and selected as a new target region candidate sequence (S5 and S6 in Fig. 2). There may be more than one consensus sequence region, in which case all consensus sequence regions are selected as separate new target region candidates. If there is no consensus sequence region, there is no consensus sequence region among all subtype mRNAs, and if so, there is no target region to design a common siRNA capable of simultaneously suppressing all target subtype mRNAs. It means. In such cases, two or more siRNAs must be applied to suppress the expression of all target subtype mRNAs, which is not considered in the present invention.

(iv) 상기 (ii)와 (iii)단계를 모든 표적 아형 mRNA를 고려할 때까지 반복한다.(iv) Repeat steps (ii) and (iii) until all target subtype mRNAs are considered.

또한, 표적 아형 mRNA들의 공통 siRNA 설계를 위한 표적 영역 서열은 상기의 과정을 거쳐서 얻은 모든 표적 아형 mRNA들의 공통영역이며 동시에 표적 영역 후보인 A 서열 또는 서열 집합에서, 각각의 비표적 아형 mRNA들과의 공통 영역의 서열을 제외하여 표적 mRNA들에만 특이적으로 존재하는 서열 또는 서열 집합(B)을 구하고, 그것을 최종 표적 영역 서열로 선정하여 구하게 된다. 상기 과정도 도 2의 흐름도에 나타내었으며 바람직하게는 다음과 같이 이루어진다:In addition, the target region sequence for the common siRNA design of the target subtype mRNAs is a common region of all target subtype mRNAs obtained through the above process and simultaneously with each non-target subtype mRNA in the A sequence or sequence set that is the target region candidate. The sequence or sequence set (B) which exists only in target mRNAs except for the sequence of the common region is obtained, and it is determined by selecting it as the final target region sequence. The process is also shown in the flow chart of FIG. 2 and preferably consists of:

(v) 비표적 아형 mRNA 중 하나를 선택하여 상기 모든 표적 아형 mRNA들의 공통영역 서열인 표적 영역 후보 서열 또는 서열 집합 A와 서열 정렬한다(도 2의 S8). 만약 비표적 아형 mRNA가 없는 경우라면 상기의 표적 영역 후보 서열 A는 그대로 최종 표적 영역 서열이 된다(도 2의 S7).(v) One of the non-target subtype mRNAs is selected and aligned with the target region candidate sequence or sequence set A, which is the consensus sequence of all the target subtype mRNAs (S8 in FIG. 2). If there is no non-target subtype mRNA, the target region candidate sequence A is the final target region sequence as it is (S7 in FIG. 2).

(vi) 상기 표적 영역 후보 서열 A와 고려중인 비표적 아형 mRNA 서열 간에 정확하게 정렬된 공통 서열 영역이 존재한다면 공통 영역의 서열을 표적 영역 후보 서열 A에서 제거 하여 얻은 서열을 새로운 표적 영역 후보 서열로 선택한다.(도 2의 S9와 S10). 공통 서열 영역이 존재하지 않는다면, 공통 영역 서열의 제거과정 없이 다음 단계로 넘어간다(도 2의 S9).(vi) if there is a consensus sequence region precisely aligned between the target region candidate sequence A and the nontarget subtype mRNA sequence under consideration, the sequence obtained by removing the sequence of the consensus region from the target region candidate sequence A is selected as a new target region candidate sequence (S9 and S10 in Fig. 2). If there is no consensus sequence region, it proceeds to the next step without removing the consensus region sequence (S9 of FIG. 2).

(vii) 상기 (v)와 (vi)단계를 모든 비표적 아형 mRNA를 고려할 때까지 반복한다. 모든 비표적 아형 mRNA가 고려된 후에 남은 표적 영역 후보 서열 또는 서열 집합(B)가 최종 표적 영역 서열이 된다.(vii) Steps (v) and (vi) are repeated until all nontarget subtype mRNAs are considered. After all non-target subtype mRNAs are considered, the remaining target region candidate sequence or sequence set (B) becomes the final target region sequence.

한편, 본 발명의 상기 단계 1), 2) 및 3)을 통해 얻어진 최종 표적 영역 서열로부터 표적 아형 mRNA의 선택적 발현 억제를 위한 효율적 siRNA 서열을 선정해낼 수 있다. 이는 공지된 방법을 통해 가능하며, 예를 들면, Tuschl rule 등의 방법(S.M. Elbashir, J. Harborth, W. Lendeckel, A. Yalcin, Klaus Weber, T. Tuschl, Nature, 411, 494-498, 2001a; S.M. Elbashir, W. Lendeckel, T. Tuschl, Genes & Dev., 15, 188-200, 2001b; S.M. Elbashir, J. Martinez, A. Patkaniowska, W. Lendeckel, T. Tuschl, EMBO J., 20, 6877-6888, 2001c)에 따라 수행할 수 있으며, 이때 3'overhang의 형태, GC 함량, 특정염기의 반복, 염기서열내의 SNP(single nucleotide polymorphism), RNA 이차구조(secondary structure), 표적이 아닌 mRNA 염기서열과의 상동성 등을 고려할 수 있다. 또한 siRNA의 이중나선을 이루는 부분이 어떤 결합에너지 상태를 하고 있느냐를 고려하여 이를 siRNA 디자인에 반영할 수도 있다(Khvorova,A., Reynolds,A., Jayasena,S.D., Cell, 115(4), 505, 2003; Reynolds,A., Leake,D., Boese,Q., Scaringe,S., Marshall,W.S., Khvorova,A., Nat. Biotechnol., 22(3), 326-330, 2004). 결합에너지의 상태를 siRNA 디자인에 반영하는 가장 대표적인 예로는, RISC (RNAi-induced silencing complex)가 dsRNA인 siRNA의 두 가닥 중 어느 쪽과 결합하느냐 에 따라 siRNA의 효율에 결정적인 영향을 미치게 된다는 것에 착안하여 5'말단과 3'말단의 에너지 차이를 siRNA 효율 예측에 도입한 것을 들 수 있으며(Schwarz DS, Hutvagner G, Du T, Xu Z, Aronin N, Zamore PD., Cell, 115(2), 199-208, 2003), 또한, '상대적인 결합에너지 형태 판별을 적용한 siRNA 디자인의 최적화 방법'(대한민국 특허출원 제2004-0103283호 및 PCT 특허출원 제PCT/KR2005/004207호)을 사용할 수도 있다.Meanwhile, efficient siRNA sequences for selective expression inhibition of target subtype mRNAs can be selected from the final target region sequences obtained through steps 1), 2) and 3) of the present invention. This is possible through known methods, for example, by methods such as Tuschl rule (SM Elbashir, J. Harborth, W. Lendeckel, A. Yalcin, Klaus Weber, T. Tuschl, Nature, 411, 494-498, 2001a). SM Elbashir, W. Lendeckel, T. Tuschl, Genes & Dev., 15, 188-200, 2001b; SM Elbashir, J. Martinez, A. Patkaniowska, W. Lendeckel, T. Tuschl, EMBO J., 20, 6877-6888, 2001c), wherein 3'overhang morphology, GC content, repetition of specific bases, single nucleotide polymorphism (SNP) in sequence, RNA secondary structure, and non-target mRNA The homology with the base sequence can be considered. In addition, considering the binding energy state of the double helix portion of the siRNA may be reflected in the siRNA design (Khvorova, A., Reynolds, A., Jayasena, SD, Cell, 115 (4), 505). , 2003; Reynolds, A., Leake, D., Boese, Q., Scaringe, S., Marshall, WS, Khvorova, A., Nat. Biotechnol., 22 (3), 326-330, 2004). The most representative example of reflecting the state of the binding energy in the siRNA design is that the RISC (RNAi-induced silencing complex) binds to either of the two strands of the siRNA, the dsRNA, which affects the siRNA efficiency. The energy difference between the 5 'and 3' ends was introduced to predict siRNA efficiency (Schwarz DS, Hutvagner G, Du T, Xu Z, Aronin N, Zamore PD., Cell, 115 (2), 199-). 208, 2003), and an 'optimizing method of siRNA design using relative binding energy type discrimination' (Korean Patent Application No. 2004-0103283 and PCT Patent Application No. PCT / KR2005 / 004207) can also be used.

본 발명의 방법은 mRNA 염기서열을 직접 사용하여 공통서열을 비교 분석하는 간단한 방법으로 표적 아형 mRNA의 선택적 발현 억제를 위한 siRNA 서열을 선정할 수 있으며, 엑손들의 유전체 상 위치정보가 필요 없고, 좌표 계산 등의 복잡한 분석 과정이 불필요하며, 개념이 단순하여 오류의 발생 가능성도 적은 장점이 있다. According to the method of the present invention, siRNA sequences for selective expression inhibition of target subtype mRNAs can be selected by a simple method of directly comparing common sequences using mRNA sequences, and do not require location information on the genome of exons, and coordinate calculations are performed. No complicated analysis process is required, and the concept is simple, so that there is little possibility of error.

이하, 본 발명을 실시예에 의해 상세히 설명한다.Hereinafter, the present invention will be described in detail by way of examples.

단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 내용이 하기 실시예에 의해 한정되는 것은 아니다.However, the following examples are only for illustrating the present invention, and the content of the present invention is not limited by the following examples.

실시예Example : : MDM2MDM2 유전자의 특정 아형 조합에 대한 표적 영역 선정 Target region selection for specific subtype combinations of genes

인간의 MDM2 (transformed 3T3 cell double minute 2, p53 binding protein) 유전자는 6개의 선택적 스플라이싱에 의한 아형 mRNA들을 갖고 있으며, 이 아형 mRNA들의 발현에 따라 몇몇 암(난소암, 방광암 등)의 발생에 큰 영향을 미치는 것으로 알려져 있다(Sigalas I, Calvert AH, Anderson JJ, Neal DE, Lunec J, Nat Med. 1996 Aug;2(8):912-7; Weng MW, Lai JC, Hsu CP, Yu KY, Chen CY, Lin TS, Lai WW, Lee H, Ko JL, Environ Mol Mutagen. 2005 Jul;46(1):1-11; Ando S, Sarlis NJ, Krishnan J, Feng X, Refetoff S, Zhang MQ, Oldfield EH, Yen PM, Mol Endocrinol. 2001 Sep;15(9):1529-38). MDM2의 유전자가 선택적 스플라이싱에 의해서 발현되어 나타날 수 있는 아형들과 이를 구성하는 도메인(protein domain)에 대한 정보를 도 3에 나타내었다. The human transformed 3T3 cell double minute 2, p53 binding protein (MDM2) gene contains subtype mRNAs by six selective splicing, and the expression of these subtype mRNAs may lead to the development of some cancers (ovarian cancer, bladder cancer, etc.). It is known to have a significant effect (Sigalas I, Calvert AH, Anderson JJ, Neal DE, Lunec J, Nat Med. 1996 Aug; 2 (8): 912-7; Weng MW, Lai JC, Hsu CP, Yu KY, Chen CY, Lin TS, Lai WW, Lee H, Ko JL, Environ Mol Mutagen. 2005 Jul; 46 (1): 1-11; Ando S, Sarlis NJ, Krishnan J, Feng X, Refetoff S, Zhang MQ, Oldfield EH, Yen PM, Mol Endocrinol. 2001 Sep; 15 (9): 1529-38). FIG. 3 shows information on subtypes in which the gene of MDM2 can be expressed and expressed by selective splicing and a domain constituting the same.

MDM2 유전자의 도메인이 암의 발생과 어떤 관계가 있는지 살펴보기 위하여, 이의 발현을 선택적으로 억제할 수 있는 siRNA들을 설계하기 위한 표적영역을 다음의 과정을 통하여 선택하였다.In order to examine how the domain of the MDM2 gene is related to the development of cancer, a target region for designing siRNAs that can selectively inhibit its expression was selected through the following procedure.

도 3에서 나타난 6개의 아형들 중에서 산성 도메인(acidic domain)을 갖는 것은 mdm2-FL(NM_002392)와 mdm2-a(NM_006878), mdm2-d(NM_006881)의 3개이다. 이 산성 도메인의 암과의 연관성을 알기 위한 좋은 방법은 이 3개의 아형들의 발현만을 선택적으로 억제시키는 siRNA를 이용해 그 발현을 억제시킨 뒤 세포의 변화를 관찰하는 것이다. Among the six subtypes shown in FIG. 3, acidic domains include three of mdm2-FL (NM_002392), mdm2-a (NM_006878), and mdm2-d (NM_006881). A good way to determine the association of these acidic domains with cancer is to inhibit their expression with siRNA that selectively inhibits the expression of these three subtypes, and then observe cell changes.

이를 위하여, 먼저 표적 mRNA를 NM_006881로 정하고 미국 국립생물정보센터 홈페이지 (http://www.ncbi.nlm.nih.gov/)에서 NM_006881을 검색어로 사용하여 추 가적으로 5개의 아형인 NM_002392, NM_006878, NM_006879, NM_006880, NM_006882에 대하여 염기 서열을 포함하는 관련 정보를 찾아내었다. 이 중, NM_006880은 서열 내부에 가지는 돌연변이 특성에 의하여 nonsense-mediated mRNA decay (NMD)기작에 의하여 발현이 스스로 억제된다고 보고되어 있다. To this end, first, target mRNA was set to NM_006881, and NM_006881 was used as a search term in the US National Institute of Biological Information (http://www.ncbi.nlm.nih.gov/). Relevant information including base sequences was found for NM_006879, NM_006880, NM_006882. Among them, NM_006880 is reported to suppress self-expression by the nonsense-mediated mRNA decay (NMD) mechanism due to the mutational characteristics in the sequence.

NM_006880를 제외한 상기 5개의 아형 mRNA들의 염기서열의 일부를 하기 표 1에 나타내었으며, 상기 5개의 아형 mRNA들을 이루는 엑손들이 염색체상에 어떻게 분포되어 있는지 유럽 생물정보학 협회 (European Bioinformatics Institute)의 Ensembl 유전체 브라우저 (Ensembl Genome Browser, http://www.ensembl.org/)을 검색하여 얻은 결과를 유전체 지도(genome map) 형태로 도 4에 나타내었다. 상기 5개의 아형 mRNA들의 실제 염기 서열은 도 5a, 도 5b, 도 5c, 도 5d 및 도 5e에 나타낸 바와 같다.Some of the base sequences of the five subtype mRNAs except NM_006880 are shown in Table 1 below, and how the exons constituting the five subtype mRNAs are distributed on the chromosome, and the Ensembl genome browser of the European Bioinformatics Institute The results obtained by searching (Ensembl Genome Browser, http://www.ensembl.org/) are shown in FIG. 4 in the form of a genome map. The actual nucleotide sequence of the five subtype mRNAs is as shown in Figures 5a, 5b, 5c, 5d and 5e.

mRNA 접근번호mRNA access number 염기 서열 길이Sequence length 염기 서열 (앞 부분 일부)Base sequence (part of first part) NM_002392NM_002392 2357 bp2357 bp CGAGCTTGGCTGCTTCTGGGGCCTGTGTGGCCCTGTGTGTCGGAAAGATGGAGCAAGAAGCCGAGCCCGAGGGGCGGCCGCGACCCCTCTGACCGAG....CGAGCTTGGCTGCTTCTGGGGCCTGTGTGGCCCTGTGTGTCGGAAAGATGGAGCAAGAAGCCGAGCCCGAGGGGCGGCCGCGACCCCTCTGACCGAG .... NM_006878NM_006878 1613 bp1613 bp CGAGCTTGGCTGCTTCTGGGGCCTGTGTGGCCCTGTGTGTCGGAAAGATGGAGCAAGAAGCCGAGCCCGAGGGGCGGCCGCGACCCCTCTGACCGAG....CGAGCTTGGCTGCTTCTGGGGCCTGTGTGGCCCTGTGTGTCGGAAAGATGGAGCAAGAAGCCGAGCCCGAGGGGCGGCCGCGACCCCTCTGACCGAG .... NM_006879NM_006879 1143 bp1143 bp CGAGCTTGGCTGCTTCTGGGGCCTGTGTGGCCCTGTGTGTCGGAAAGATGGAGCAAGAAGCCGAGCCCGAGGGGCGGCCGCGACCCCTCTGACCGAG....CGAGCTTGGCTGCTTCTGGGGCCTGTGTGGCCCTGTGTGTCGGAAAGATGGAGCAAGAAGCCGAGCCCGAGGGGCGGCCGCGACCCCTCTGACCGAG .... NM_006881NM_006881 1540 bp1540 bp CGAGCTTGGCTGCTTCTGGGGCCTGTGTGGCCCTGTGTGTCGGAAAGATGGAGCAAGAAGCCGAGCCCGAGGGGCGGCCGCGACCCCTCTGACCGAG....CGAGCTTGGCTGCTTCTGGGGCCTGTGTGGCCCTGTGTGTCGGAAAGATGGAGCAAGAAGCCGAGCCCGAGGGGCGGCCGCGACCCCTCTGACCGAG .... NM_006882NM_006882 1403 bp1403 bp CGAGCTTGGCTGCTTCTGGGGCCTGTGTGGCCCTGTGTGTCGGAAAGATGGAGCAAGAAGCCGAGCCCGAGGGGCGGCCGCGACCCCTCTGACCGAG....CGAGCTTGGCTGCTTCTGGGGCCTGTGTGGCCCTGTGTGTCGGAAAGATGGAGCAAGAAGCCGAGCCCGAGGGGCGGCCGCGACCCCTCTGACCGAG ....

상기 5개의 아형 mRNA 중 산성 도메인(acidic domain)을 갖는 NM_002392, NM_006878, NM_006881을 표적 아형 mRNA로 선정하고 나머지 3개는 비표적 아형 mRNA로 선정하여, 세계의 표적 아형 mRNA을 동시에 발현 억제 시킬 수 있는 공통 siRNA를 설계하기 위한 표적 영역을 선정하고자 하였다. 본 발명이 제시하는 방법에 따라 상기 3개의 표적 mRNA 발현 억제용 공통 siRNA를 설계하기 위한 표적 영역의 선정 방법은 다음과 같다.Of the five subtype mRNAs, NM_002392, NM_006878, and NM_006881 having acidic domains are selected as target subtype mRNAs, and the other three are selected as non-target subtype mRNAs, thereby simultaneously suppressing expression of target subtype mRNAs around the world. The target region for designing common siRNAs was intended. According to the method of the present invention, a method of selecting a target region for designing the common siRNA for inhibiting the three target mRNA expressions is as follows.

1단계: 도 6에 나타낸 바와 같이 표적 아형 mRNA 중 임의의 하나인 NM_002392를 선정하여 염기서열 전체를 표적 영역 후보로 선정한다 (1단계 표적 영역 후보).Step 1: As shown in FIG. 6, NM_002392, which is any one of target subtype mRNAs, is selected to select the entire sequence as a target region candidate (step 1 target region candidate).

2단계: 또 다른 표적 아형 mRNA인 NM_006878을 선택하여 상기 표적 영역 후보 서열과 서열 정렬하고 공통 서열 부분을 추출하여 새로운 표적 영역 후보로 선정한다. 서열 정렬되는 두 서열은 모두 한 유전자에서 발현되었고, 대부분 같은 엑손을 공유하기 때문에 도 7에 나타낸 바와 같이 정렬되는 부분은 서열 동정 (sequencing)과정의 오류나 단일 염기 다형성(Single Nucleotide Polymorphism, SNP)이 존재하지 않는 한 동일한 염기 서열을 가진다. 본 실시 예에서는 서열 정렬 프로그램으로 미국 국립생물정보센터에서 제공하는 BLAST 프로그램을 사용하였다. 도 7에 나타낸 바와 같이 서열정렬에 의하여 확인된 공통 서열 부분을 추출하여 새로운 표적 영역 후보로 선정한다. 도 8의 1단계 표적 영역 후보 서열에 대문자로 나타내었듯이 처음의 약 3분의 1부분 (NM_002392 염기서열의 처음부터 807번째 염기영역)과 뒤의 약 3분의 1부분 (NM_002392 염기서열의 1545번째 염기부터 2357번째 염기까지)의 두 영역에 걸쳐 공통 서열 부분이 존재 한다. 따라서, 상기의 두 공통 서열 영역을 추출하여 도 9에 나타낸 바와 같이 새로운 표적 영역 후보(2단계 표적 영역 후보1, 2단계 표적 영역 후보2)들로 선정한다.Step 2: Select another target subtype mRNA, NM_006878, to align with the target region candidate sequence and extract a consensus sequence portion to select a new target region candidate. Since both sequences to be sequenced are expressed in one gene, and most share the same exon, as shown in FIG. 7, there is a single sequence polymorphism (SNP) or an error in sequencing process. Unless they have the same base sequence. In this example, the BLAST program provided by the US National Center for Biological Information was used as the sequence alignment program. As shown in FIG. 7, the consensus sequence portion identified by sequencing is extracted and selected as a new target region candidate. As shown in capital letters in the first-stage target region candidate sequence of FIG. 8, the first one-third portion (the 807th base region from the beginning of the NM_002392 sequence) and the first one-third portion (the 1545th sequence of the NM_002392 sequence) after There is a consensus sequence portion across the two regions (base to base 2357). Therefore, the two common sequence regions are extracted and selected as new target region candidates (two-stage target region candidate 1 and two-stage target region candidate 2) as shown in FIG.

3단계: 상기의 방법과 같이 두개의 2단계 표적 영역 후보들과 나머지 표적 아형 mRNA인 NM_006881의 서열을 정렬하고, 공통 서열 부분을 추출하여 도 10에 나타낸 바와 같이 두개의 새로운 표적 영역 후보(3단계 표적 영역 후보1, 3단계 표적 영역 후보2)를 선정한다. 3단계 표적 영역 후보2는 2단계에 비하여 변화가 없지만, 후보1은 2단계에 비하여 뒷 부분 염기 서열이 71염기 정도 단축되었다.Step 3: Align the two two-stage target region candidates with the sequence of the remaining target subtype mRNA NM_006881 as described above, extract the consensus sequence portion, and display two new target region candidates (three-stage target) as shown in FIG. Region candidate 1, 3 step target region candidate 2) are selected. Stage 3 target region candidate 2 has no change compared to stage 2, but candidate 1 has a shorter base sequence of 71 bases compared to stage 2.

4단계: 상기 과정을 거쳐 3개의 모든 표적 아형 mRNA의 공통 서열을 구한 후에는, 각 비표적 아형 mRNA서열과의 공통 부분을 제외하여야 한다. 상기 3단계 표적 영역 후보1과 2의 서열을 비표적 아형 mRNA중의 하나인 NM_006879와 정렬하고 도 11의 염기 서열에 소문자로 나타낸 바와 같이 공통영역을 구하여 표적 영역 후보 서열에서 제외한다. 그리하여, 도 12에 나타낸 바와 같이 두 개의 새로운 표적 영역 후보 (4단계 표적영역 후보1, 후보2) 서열을 구한다.Step 4: After obtaining the consensus sequence of all three target subtype mRNAs, the common part with each non-target subtype mRNA sequence should be excluded. The three-stage target region candidates 1 and 2 sequences are aligned with NM_006879, which is one of the non-target subtype mRNAs, and the common region is obtained from the target region candidate sequence as shown in lowercase in the nucleotide sequence of FIG. 11. Thus, as shown in Fig. 12, two new target region candidate (four-step target region candidate 1, candidate 2) sequences are obtained.

5단계: 상기와 같은 방법으로 마지막 비표적 아형 mRNA인 NM_006882 서열과 상기에서 구한 두 개의 4단계 표적 영역 후보 서열들을 정렬하여 공통영역을 제외하고 도 13에 나타낸 바와 같이 최종 표적 영역을 구한다. 4단계 표적 영역 후보2는 비표적 아형 mRNA인 NM_006882의 서열과 완전히 정렬되어 최종 표적 영역에서 제외되었으며, 후보 1도 시작부분에서 45염기가 제외되어 최종적으로는 NM_002392 염기서열의 582번째 염기부터 736번째 염기까지 길이 155염기인 하나의 표적 영역 서열이 선정되었다.Step 5: As described above, the final non-target subtype mRNA NM_006882 sequence and the two 4-step target region candidate sequences obtained above are aligned to obtain a final target region as shown in FIG. 13 except for the common region. Stage 4 target region candidate 2 was completely aligned with the sequence of NM_006882, a nontarget subtype mRNA, and was excluded from the final target region. Candidate 1 also excluded 45 bases from the beginning and finally 736th from base 582 of NM_002392 sequence One target region sequence of 155 bases in length was selected.

상기 표적 영역을 선정하는 과정에서 각 단계별로 고려되는 표적 아형 mRNA들과 비표적 아형 mRNA들의 종류, 서열 정렬에 의하여 확인된 공통영역, 산출되는 표적 영역 후보 서열의 범위를 하기 표 2에 정리하였으며, 도 14에 표적 영역 선정 과정을 유전체 지도상에서의 위치로 표시하여 나타내었다. Table 2 summarizes the types of target subtype mRNAs and non-target subtype mRNAs considered in each step in selecting the target region, the common region identified by sequence alignment, and the range of the target region candidate sequences to be calculated. In Fig. 14, the target region selection process is represented by the position on the genome map.

처리내용Treatment contents 단계step 단계별 추가 고려대상 mRNAStep-by-step further consideration mRNA 단계별 누적 고려대상 mRNACumulative Considerations for Stages 단계별 표적 영역 변화 (기준 mRNA: NM_002392)Staged Target Region Change (Reference mRNA: NM_002392) NM_006878NM_006878 비표적 mRNANon-target mRNA 표적 후보 영역 (시작..끝)Target candidate area (start..end) 공통 영역 (시작..끝)Common Area (Start..End) 새 표적 후보 영역 (시작..끝)New Target Candidate Area (Start..End) 표적 mRNA의 공통영역 산출Calculation of the common domain of the target mRNA 1One NM_002392NM_002392 NM_002392NM_002392 -- -- -- 1..23571..2357 22 NM_006878NM_006878 NM_002392NM_006878NM_002392NM_006878 -- 1..23571..2357 1..8071..807 1..8071..807 1545..23571545..2357 1545..23571545..2357 33 NM_006881NM_006881 NM_002392NM_006878NM_006881NM_002392NM_006878NM_006881 - - 1..8071..807 1..7361..736 1..7361..736 1545..23571545..2357 1545..23571545..2357 1545..23571545..2357 비표적 mRNA부분 제외Exclude nontarget mRNA 44 NM_006879NM_006879 NM_002392NM_006878NM_006881NM_002392NM_006878NM_006881 NM_006879NM_006879 1..7361..736 1..5361..536 537..736537..736 1545..23571545..2357 1741..23571741..2357 1545..17401545..1740 55 NM_006882NM_006882 NM_002392NM_006878NM_006881NM_002392NM_006878NM_006881 NM_006879NM_006882NM_006879NM_006882 537..736537..736 537..581537..581 582..736582..736 1545..17401545..1740 1545..17401545..1740 남은 부분 Remainder 없음none 최종 결과Final result - - NM_002392NM_006878NM_006881NM_002392NM_006878NM_006881 NM_006879NM_006882NM_006879NM_006882 기준 mRNA NM_002392 의 582..736 영역 582..736 region of the reference mRNA NM_002392

이와 같은 방법으로 MDM2의 여러 아형들 중에서 산성 도메인을 갖는 아형들의 발현만을 선택적으로 억제할 수 있는 siRNA를 디자인할 수 있는 표적 영역을 선택할 수 있으며, 선택된 표적 영역의 서열 범위 내에서 기존에 알려진 효과적인 siRNA를 선정하기 위한 기준들을 적용하여 siRNA를 디자인할 수 있다. 이와 같은 방법에 의해 선정된 siRNA는 MDM2 유전자의 산성 도메인이 암과 어떤 상관관계를 지니는지 밝히는 연구에 적용될 수 있다.In this way, among the various subtypes of MDM2, it is possible to select a target region for designing an siRNA capable of selectively inhibiting the expression of subtypes having an acidic domain, and an effective siRNA known in the sequence range of the selected target region. SiRNA can be designed by applying criteria for selecting. The siRNA selected by this method can be applied to studies to find out how the acidic domain of the MDM2 gene correlates with cancer.

본 발명의 방법은 mRNA 염기서열을 직접 사용하여 공통서열을 비교 분석하는 간단한 방법으로 선택적 스플라이싱에 의해 여러 개의 아형이 발현되는 유전자에 있어서 특정 아형 표적 mRNA 또는 둘 이상의 특정 아형 표적 mRNA들의 발현만을 선택적으로 억제할 수 있는 siRNA를 용이하게 설계할 수 있으며, 특정 단백질 또는 둘 이상의 단백질의 선택적인 번역 억제를 가능하게 하여 기능유전체학 연구에 효과적으로 사용할 수 있다.The method of the present invention is a simple method of comparatively analyzing common sequences using direct mRNA sequencing. In a gene in which several subtypes are expressed by selective splicing, only specific subtype target mRNA or expression of two or more specific subtype target mRNAs is expressed. The siRNA capable of selectively inhibiting can be easily designed, and the selective translation inhibition of a specific protein or two or more proteins can be effectively used for functional genomics research.

도 1은 표적 유전자의 여러 아형 mRNA들 중에서 하나 이상의 아형 mRNA를 표적 mRNA로 정하여 동시에 발현 억제시키고자 할 때, 표적 mRNA들에 대한 공통 siRNA를 설계하기 위한 표적 영역을 선정하는 방법을 도식화한 것이다.1 is a diagram illustrating a method for selecting a target region for designing a common siRNA for target mRNAs when one or more subtype mRNAs of target genes are designated as target mRNAs and simultaneously suppressed expression.

도 2는 표적 mRNA들에 대한 공통 siRNA를 설계하기 위한 표적 영역을 선정하는 과정에 대한 흐름도이다.2 is a flow chart for selecting a target region for designing a common siRNA for target mRNAs.

도 3은 실시예에서 MDM2 유전자의 선택적 스플라이싱(alternative splicing)에 의해 발현될 수 있는 아형들과 이를 구성하는 단백질 도메인(protein domain)에 대한 정보를 도식화한 것이다.FIG. 3 is a schematic diagram of information on subtypes that can be expressed by alternative splicing of the MDM2 gene and protein domains constituting the same.

도 4는 실시예에서 MDM2 유전자의 선택적 스플라이싱(alternative splicing)에 의해 발현될 수 있는 아형 mRNA들의 구조를 유전체 지도(genome map)상의 엑손과 인트론의 분포로 나타낸 것이다.Figure 4 shows the structure of subtype mRNAs that can be expressed by alternative splicing of the MDM2 gene in the examples by the distribution of exons and introns on the genome map.

도 5 (도 5a, 도5b, 도 5c, 도 5d 및 도 5e)는 실시예에서 MDM2 유전자의 선택적 스플라이싱(alternative splicing)에 의해 발현될 수 있는 아형 mRNA들인 NM_002392, NM_006878, NM_006879, NM_006881 및 NM_006882의 염기서열이다.FIG. 5 (FIGS. 5A, 5B, 5C, 5D and 5E) shows subtype mRNAs NM_002392, NM_006878, NM_006879, NM_006881 and subtype mRNAs that may be expressed by alternative splicing of the MDM2 gene in the Examples. The base sequence of NM_006882.

도 6은 실시예에서 MDM2 유전자의 아형 mRNA 중 NM_002392, NM_006878 및 NM_006881을 동시에 발현 억제시킬 수 있는 공통 siRNA를 설계하기 위한 표적 영역을 선정하기 위한 과정 중, 1단계에서 표적영역 후보로 선정한 첫 번째 표적 아형 mRNA인 NM_002392의 서열이다. FIG. 6 illustrates a first target selected as a target region candidate in step 1 of a process for selecting a target region for designing a common siRNA capable of simultaneously inhibiting expression of NM_002392, NM_006878, and NM_006881 among subtype mRNAs of the MDM2 gene The subtype mRNA is NM_002392.

도 7은 실시예에서 MDM2 유전자의 아형 mRNA 중 NM_002392, NM_006878 및 NM_006881을 동시에 발현 억제시킬 수 있는 공통 siRNA를 설계하기 위한 표적 영역을 선정하기 위한 과정 중 2단계로서, 1단계 표적영역 후보와 두 번째 표적 아형 mRNA인 NM_006878의 공통영역을 서열정렬 프로그램인 BLAST로 정렬하여 얻은 결과의 일부이다. 7 is a step 2 of selecting a target region for designing a common siRNA capable of simultaneously inhibiting expression of NM_002392, NM_006878, and NM_006881 among subtype mRNAs of the MDM2 gene in Examples, a step 1 target region candidate and a second step It is a part of the result obtained by aligning the common region of NM_006878 which is a target subtype mRNA by BLAST which is a sequencing program.

도 8은 실시예에서 MDM2 유전자의 아형 mRNA 중 NM_002392, NM_006878 및 NM_006881을 동시에 발현 억제시킬 수 있는 공통 siRNA를 설계하기 위한 표적 영역을 선정하기 위한 과정 중 2단계로서, 1단계 표적영역 후보와 두 번째 표적 아형 mRNA인 NM_006878의 공통영역을 대문자로 나타낸 서열이다. 8 is a step 2 of selecting a target region for designing a common siRNA capable of simultaneously inhibiting expression of NM_002392, NM_006878, and NM_006881 among subtype mRNAs of the MDM2 gene in Examples, a step 1 target region candidate and a second step The sequence of capitalization of the common region of NM_006878, which is a target subtype mRNA.

도 9는 실시예에서 MDM2 유전자의 아형 mRNA 중 NM_002392, NM_006878 및 NM_006881을 동시에 발현 억제시킬 수 있는 공통 siRNA를 설계하기 위한 표적 영역을 선정하기 위한 과정 중, 2단계로서, 1단계 표적영역 후보와 두 번째 표적 아형 mRNA인 NM_006878의 공통영역으로부터 구한 새로운 2개의 후보 표적영역(2단계 표적 영역 후보 1 및 후보 2)을 나타낸 서열이다. FIG. 9 shows a target region for selecting a target region for designing a common siRNA capable of simultaneously suppressing NM_002392, NM_006878, and NM_006881 among subtype mRNAs of the MDM2 gene in Examples. The sequence shows two new candidate target regions (stage 2 target region candidate 1 and candidate 2) obtained from the common region of the first target subtype mRNA, NM_006878.

도 10은 실시예에서 MDM2 유전자의 아형 mRNA 중 NM_002392, NM_006878 및 NM_006881을 동시에 발현 억제시킬 수 있는 공통 siRNA를 설계하기 위한 표적 영역을 선정하기 위한 과정 중 3단계로서, 모든 표적 아형 mRNA들의 공통영역으로부터 구한 2개의 후보 표적영역(3단계 표적 영역 후보 1 및 후보 2)을 나타낸 서열이다. FIG. 10 is a third step of a process for selecting a target region for designing a common siRNA capable of simultaneously inhibiting expression of NM_002392, NM_006878, and NM_006881 among subtype mRNAs of the MDM2 gene in an embodiment, from a common region of all target subtype mRNAs. This sequence shows the two candidate target regions (stage 3 target region candidate 1 and candidate 2) obtained.

도 11은 실시예에서 MDM2 유전자의 아형 mRNA 중 NM_002392, NM_006878 및 NM_006881을 동시에 발현 억제 시킬 수 있는 공통 siRNA를 설계하기 위한 표적 영역을 선정하기 위한 과정 중 4단계로서, 3단계 표적 영역 후보 1 및 후보 2와 첫 번째 비표적 아형 mRNA인 NM_006879의 공통영역을 소문자로 나타낸 서열들이다. 11 is a fourth step of a process for selecting a target region for designing a common siRNA capable of simultaneously inhibiting expression of NM_002392, NM_006878, and NM_006881 among subtype mRNAs of the MDM2 gene in Examples, a step 3 target region candidate 1 and a candidate 2 and the first non-target subtype mRNA NM_006879 are shown in lowercase.

도 12은 실시예에서 MDM2 유전자의 아형 mRNA 중 NM_002392, NM_006878 및 NM_006881을 동시에 발현 억제 시킬 수 있는 공통 siRNA를 설계하기 위한 표적 영역을 선정하기 위한 과정 중 4단계로서, 3단계 표적 영역 후보 1 및 후보 2에서 첫 번째 비표적 아형 mRNA인 NM_006879의 공통영역을 제외시켜서 얻은 새로운 2개의 표적영역(4단계 표적 영역 후보 1 및 후보 2)을 나타낸 서열들이다. 12 is a fourth step of a process for selecting a target region for designing a common siRNA capable of simultaneously inhibiting expression of NM_002392, NM_006878, and NM_006881 among subtype mRNAs of the MDM2 gene in Examples, a step 3 target region candidate 1 and a candidate Sequences showing two new target regions (stage 4 target region candidate 1 and candidate 2) obtained by excluding the common region of NM_006879, the first non-target subtype mRNA in 2.

도 13은 실시예에서 MDM2 유전자의 아형 mRNA 중 NM_002392, NM_006878 및 NM_006881을 동시에 발현 억제시킬 수 있는 공통 siRNA를 설계하기 위한 표적 영역을 선정하기 위한 과정 중, 최종 단계에서 얻은 표적영역을 나타낸 서열이다. FIG. 13 is a sequence showing a target region obtained in a final step during a process for selecting a target region for designing a common siRNA capable of simultaneously inhibiting expression of NM_002392, NM_006878, and NM_006881 among subtype mRNAs of the MDM2 gene.

도 14는 실시예에서 MDM2 유전자의 아형 mRNA 중 NM_002392, NM_006878 및 NM_006881을 동시에 발현 억제시킬 수 있는 공통 siRNA를 설계하기 위한 표적 영역을 선정한 과정을 유전체 지도상에서의 위치로 표시한 결과를 보여주는 그림이다.FIG. 14 is a diagram showing the result of selecting a target region for designing a common siRNA capable of simultaneously suppressing expression of NM_002392, NM_006878, and NM_006881 among subtype mRNAs of the MDM2 gene in a position indicated on a genomic map. FIG.

Claims (5)

1) 임의의 유전자의 아형 mRNA 중에서 발현을 억제하기 원하는 표적 아형 mRNA 및 비표적 아형 mRNA를 각각 선정하는 단계;1) selecting a target subtype mRNA and a non-target subtype mRNA, each of which is desired to inhibit expression, among subtype mRNAs of any gene; 2) 상기 표적 아형 mRNA들 모두의 공통된 서열 영역(A)을 추출하는 단계; 및2) extracting a common sequence region (A) of all of the target subtype mRNAs; And 3) 상기 (A) 영역에서 각 비표적 아형 mRNA들에 공통된 서열 영역을 제외하여 표적 mRNA들에만 특이적으로 존재하는 서열 영역(B)을 추출하여 표적 영역 서열을 결정하는 단계를 포함하는, 표적 아형 mRNA의 선택적 발현 억제를 위한 siRNA 서열을 선정하는 방법.3) determining a target region sequence by extracting a sequence region (B) that is specifically present only in target mRNAs except for a sequence region common to each non-target subtype mRNA in the region (A). A method of selecting siRNA sequences for suppressing selective expression of subtype mRNAs. 제1항에 있어서, 상기 영역(A) 및 영역(B)는The method of claim 1, wherein the area A and the area B are A = T1∩T2∩T3∩...∩Tn 이고,A = T 1 ∩T 2 ∩T 3 ∩ ... ∩T n , B = A - (Q1∪Q2∪Q3∪...∪Qm) 이며,B = A-(Q 1 ∪Q 2 ∪Q 3 ∪ ... ∪Q m ), 상기 n은 자연수로서 임의의 유전자의 아형 mRNA 중에서 발현을 억제하기 원하는 표적 아형 mRNA(T)의 개수이고, m은 자연수로서 임의의 유전자의 아형 mRNA 중 비표적 아형 mRNA(Q)의 개수이고, Tn은 n번째 표적 mRNA의 염기서열이고, Qm은 m번째 비표적 mRNA의 염기서열인 것을 특징으로 하는 방법.N is a natural number, the number of target subtype mRNAs (T) desired to suppress expression in subtype mRNAs of any genes, m is the number of non-target subtype mRNAs (Q) in subtype mRNAs of any genes as natural numbers, T n is the nucleotide sequence of the n-th target mRNA, Q m is a nucleotide sequence of the m-th non-target mRNA. 제1항에 있어서, 상기 단계 2)는 표적 아형 mRNA 가 복수 개인 경우, 하나의 표적 아형 mRNA를 먼저 선정하고, 나머지 표적 아형 mRNA들을 하나씩 순차적으로 비교함으로써, 공통된 서열을 추출하는 것을 특징으로 하는 방법.The method of claim 1, wherein step 2) comprises extracting a common sequence by first selecting one target subtype mRNA and sequentially comparing the remaining target subtype mRNAs one by one when there are a plurality of target subtype mRNAs. . 제1항에 있어서, 상기 단계 3)은 비표적 아형 mRNA 가 복수 개인 경우, 비표적 아형 mRNA를 하나씩 순차적으로 단계 2)에서 추출된 표적 아형 mRNA들의 공통서열과 비교함으로써, 공통된 서열을 제외하는 것을 특징으로 하는 방법.The method of claim 1, wherein step 3) excludes the common sequence by comparing the non-target subtype mRNAs with the common sequences of the target subtype mRNAs extracted in step 2) one by one, when there are a plurality of non-target subtype mRNAs. How to feature. 제1항에 있어서, 단계 2) 및 단계 3)의 공통서열 분석은 서열정렬 알고리즘에 의해 수행되는 것을 특징으로 하는 방법.The method of claim 1, wherein the common sequence analysis of steps 2) and 3) is performed by a sequence alignment algorithm.
KR1020080009813A 2008-01-30 2008-01-30 Selection method of sirna sequence for selectively inhibiting expression of target subtype mrna KR20090083804A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080009813A KR20090083804A (en) 2008-01-30 2008-01-30 Selection method of sirna sequence for selectively inhibiting expression of target subtype mrna

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080009813A KR20090083804A (en) 2008-01-30 2008-01-30 Selection method of sirna sequence for selectively inhibiting expression of target subtype mrna

Publications (1)

Publication Number Publication Date
KR20090083804A true KR20090083804A (en) 2009-08-04

Family

ID=41204539

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080009813A KR20090083804A (en) 2008-01-30 2008-01-30 Selection method of sirna sequence for selectively inhibiting expression of target subtype mrna

Country Status (1)

Country Link
KR (1) KR20090083804A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9217149B2 (en) 2009-11-30 2015-12-22 Korea Research Institute Of Bioscience And Biotechnology Pharmaceutical composition for treating cancer

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9217149B2 (en) 2009-11-30 2015-12-22 Korea Research Institute Of Bioscience And Biotechnology Pharmaceutical composition for treating cancer

Similar Documents

Publication Publication Date Title
Bevilacqua et al. Genome-wide analysis of RNA secondary structure
Yang et al. snoSeeker: an advanced computational package for screening of guide and orphan snoRNA genes in the human genome
Adai et al. Computational prediction of miRNAs in Arabidopsis thaliana
Sterne-Weiler et al. Loss of exon identity is a common mechanism of human inherited disease
Tian et al. MicroRNA–target pairs in the rat kidney identified by microRNA microarray, proteomic, and bioinformatic analysis
Gu et al. The role of RNA structure at 5′ untranslated region in microRNA-mediated gene regulation
Tafer et al. RNAplex: a fast tool for RNA–RNA interaction search
US8445666B2 (en) Ribonucleic acid interference molecules
Lee et al. Emerging roles of DROSHA beyond primary microRNA processing
Guan et al. Inferring targeting modes of Argonaute-loaded tRNA fragments
Yuan et al. Origin and evolution of a placental-specific microRNA family in the human genome
Xu et al. The evolution of evolvability in microRNA target sites in vertebrates
Androsavich et al. Disease-linked microRNA-21 exhibits drastically reduced mRNA binding and silencing activity in healthy mouse liver
Bompfünewerer et al. Evolutionary patterns of non-coding RNAs
Guan et al. Computational meta-analysis of ribosomal RNA fragments: potential targets and interaction mechanisms
US20070111227A1 (en) Small regulatory RNAs and methods of use
US20080280848A1 (en) Structures of Active Guide Rna Molecules and Method of Selection
Smith et al. Rapid divergence and high diversity of miRNAs and miRNA targets in the Camelineae
KR20060006782A (en) Statistical analysis of regulatory factor binding sites of differentially expressed genes
Gan et al. Identification of circular RNA in the Bombyx mori silk gland
Michalak et al. Testis-derived microRNA profiles of African clawed frogs (Xenopus) and their sterile hybrids
KR20090083804A (en) Selection method of sirna sequence for selectively inhibiting expression of target subtype mrna
Li et al. Regulation by bisoprolol for cardiac microRNA expression in a rat volume-overload heart failure model
KR101007346B1 (en) METHOD OF INHIBITING EXPRESSION OF TARGET mRNA USING siRNA CONSISTING OF NUCLEOTIDE SEQUENCE COMPLEMENTARY TO SAID TARGET mRNA
Jeremias et al. MiRNA-Regulated HspB8 as potent biomarkers in low-grade gliomas

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application