KR20030049499A - Method for scoring and selection for optimum probes in probes design - Google Patents

Method for scoring and selection for optimum probes in probes design Download PDF

Info

Publication number
KR20030049499A
KR20030049499A KR1020010079722A KR20010079722A KR20030049499A KR 20030049499 A KR20030049499 A KR 20030049499A KR 1020010079722 A KR1020010079722 A KR 1020010079722A KR 20010079722 A KR20010079722 A KR 20010079722A KR 20030049499 A KR20030049499 A KR 20030049499A
Authority
KR
South Korea
Prior art keywords
function
factor
probe
probes
factors
Prior art date
Application number
KR1020010079722A
Other languages
Korean (ko)
Other versions
KR100442839B1 (en
Inventor
김영주
박경희
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR10-2001-0079722A priority Critical patent/KR100442839B1/en
Publication of KR20030049499A publication Critical patent/KR20030049499A/en
Application granted granted Critical
Publication of KR100442839B1 publication Critical patent/KR100442839B1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J19/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J19/0093Microreactors, e.g. miniaturised or microfabricated reactors
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00781Aspects relating to microreactors
    • B01J2219/00993Design aspects
    • B01J2219/00995Mathematical modeling

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

PURPOSE: A method for scoring and selecting optimum probes in probes design is provided, thereby designing optimum oligonucleotide probes, and increasing the efficiency of designing and production of a DNA chip. CONSTITUTION: A method for scoring and selection for optimum probes in probes design comprises the steps of: (a) setting up at least one factor selected from the group consisting of hybridization melting point(TM), difference of hybridization melting point(ΔTM), self-alignment, mutation site, probe length, repetitive sequence content and GC content; (b) representing the response function of the selected factors of the step (a) as simple cosine, an exponential function and a hyperlolic function, and determining used factors; and (c) preparing the optimum function for selection of probes by combination of response functions for each of the factors of the step (b) and scoring each probe to select the optimum probes.

Description

최적 탐침 설계를 위한 탐침의 점수화 및 선택에 관한 방법{Method for scoring and selection for optimum probes in probes design}Method for scoring and selection for optimum probes in probes design

본 발명은 최적 탐침 설계를 위한 탐침의 점수화 및 선택에 관한 방법에 관한 것으로, 더욱 구체적으로 (a) 혼성화 융점(TM), 혼성화 융점차(△TM), 자기 정렬(self-alignment), 변이 위치, 탐침 길이, 반복서열 정도 및 GC 함량의 탐침선택 기준 인자들로 구성되는 그룹으로부터 선택되는 하나 이상의 인자를 설정하는 단계; (b) (a) 단계에서 선택된 각 인자들의 거동함수를 간략화한 코사인(cosine), 지수, 쌍곡선 함수에 의하여 표시하고, 여기에 사용되는 인수들을 정의하는 단계; 및 (c) (b) 단계의 각 인자들의 거동함수의 조합에 의하여 탐침 선택의 최적화 함수를 만들고 각 탐침을 점수화하여 최적 탐침을 선택하는 단계로 구성되는 최적화된 올리고핵산 탐침을 설계하는 방법에 관한 것이다.The present invention relates to a method for scoring and selection of probes for optimal probe design, and more particularly to (a) hybridization melting point (T M ), hybridization melting point difference (ΔT M ), self-alignment, Setting one or more factors selected from the group consisting of mutation location, probe length, degree of repetition sequence and probe selection criteria factors of GC content; (b) expressing the behavior function of each factor selected in step (a) by a simplified cosine, exponent, and hyperbolic function, and defining the arguments used therein; And (c) a method for designing an optimized oligonucleic acid probe consisting of creating an optimization function of probe selection and scoring each probe to select an optimal probe by combining the behavioral functions of the factors in step (b). will be.

인간의 유전체에는 SNPs (Single Nucleotide Polymorphisms), 반복염기서열 (microsatellite), 삽입, 소실 등 여러 가지 종류의 변이가 존재하고 있다 (Kleyn PW and Vesell ES, 1998). 고생산성 변이 검색과 서열결정(genotyping)하는 의약유전체 연구의 여러 기법들에는 겔 전기영동서열법 (Gel electrophoresis-basedgenotyping), 형광염료서열법 (fluerescent dye-based genotyping), 분자표지발광서열법 (molecular beacon genotyping), 질량분석 서열법 (mass spectrometry genotyping), DNA 칩 배열법 (DNA chip-based microarray) 등이 있다 (Shi MM, 2001).There are several types of mutations in the human genome, including single nucleotide polymorphisms (SNPs), microsatellite, insertions and deletions (Kleyn PW and Vesell ES, 1998). Several techniques in the search for sequencing and genotyping of high-productivity mutations include the use of gel electrophoresis-based genotyping, fluorescent dye-based genotyping, and molecular labeled sequencing. beacon genotyping, mass spectrometry genotyping, and DNA chip-based microarrays (Shi MM, 2001).

현재, 지노믹스 (genomics), 의학, 생화학 분야에서의 실험, 진단 및 치료의 도구로서 DNA 칩은 없어서는 안 될 중요한 도구로 발전이 되어왔다. 현재 DNA 칩에 의한 유전자 발현 분석(expression analysis)은 기능성 게놈분석학에서 가장 널리 쓰이는 도구 중의 하나이다. 또한, DNA 칩을 사용하여 핵산 서열을 결정하거나, SNP 및 핵산 서열의 돌연변이를 판단하는 것이 가능하다 (Yershov and Barsky et.al., 1996).Currently, DNA chips have been developed as an indispensable tool for experimentation, diagnosis, and treatment in genomics, medicine, and biochemistry. Gene expression analysis by DNA chips is currently one of the most widely used tools in functional genomics. It is also possible to determine nucleic acid sequences using DNA chips or to determine mutations in SNPs and nucleic acid sequences (Yershov and Barsky et. Al., 1996).

DNA 칩에서는 특정 질병의 진단 및 치료의 목적으로 질병 관련 유전자의 변이를 검출하기 위한 핵산 탐침의 설계가 필요하다.  이러한 탐침의 설계는 표적핵산과의 혼성화 결합반응을 통하여 표적핵산에 존재하는 변이를 특이성 있게, 높은 신뢰도로서 검출하는 것이 중요하다. 변이를 가지고 있는 표적핵산(mutant target oligonucleotide)과 변이가 없는 표적핵산 (normal target oligonucleotide)을 탐침과 혼성화반응을 시켰을 때, 변이의 검출력이 증가될 수 있도록, 즉 각 시그널의 차이가 극대화가 될 수 있도록 탐침을 설계할 필요가 있다.DNA chips require the design of nucleic acid probes to detect mutations in disease-related genes for the purpose of diagnosing and treating specific diseases. The design of such a probe is important to detect the mutations present in the target nucleic acid specifically and with high reliability through hybridization with the target nucleic acid. When hybridizing with a probe between a mutant target oligonucleotide and a mutant normal target oligonucleotide, the detection power of the mutation can be increased, that is, the difference in each signal can be maximized. The probe needs to be designed so that it

참조 서열과 정확히 상보적이거나 또는 하나 이상의 변이를 가지는 탐침의 배열을 고정상 위에 만드는 것이 가능하고 이러한 과정을 탐침의 설계라고 한다. cDNA 칩과 같이 cDNA의 한 가닥을 고정상 위에 탐침으로서 심는 경우와 달리, 올리고 핵산 DNA 칩에서는 혼성화 결합에 기초한 수백의 탐침들로부터 최적화된 탐침을 제대로 선택하는 과정이 중요하다. 탐침의 설계에 있어서 여러 가지 고려하여야 할 인자들이 많이 있는데, 특히 올리고 핵산의 탐침의 경우, 탐침의 구간과 길이의 결정은 혼성화 융점(TM), 혼성화 융점 차이(△TM), 자기 정렬 (self-alignment; hairpin, self-alignment),변이 위치, 탐침 길이, 반복 서열 정도, GC 함량 등의 인자들을 고려하여 정하게 된다.It is possible to make an array of probes on the stationary phase that are exactly complementary to the reference sequence or have one or more variations, and this process is called probe design. Unlike planting one strand of cDNA as a probe on a stationary phase, such as a cDNA chip, the process of properly selecting an optimized probe from hundreds of probes based on hybridization bonds is important in oligonucleotide DNA chips. There are many factors to consider in the design of probes, especially in the case of oligonucleotide probes, the determination of the length and length of the probes is based on hybridization melting point (T M ), hybridization melting point difference (ΔT M ), and self-alignment ( Self-alignment (hairpin, self-alignment), mutation location, probe length, repeat sequence degree, GC content is determined by considering the factors.

표적핵산의 변이나 SNP를 판독하기 위한 올리고 핵산 탐침을 설계할 경우, 그 표적핵산과 염기서열이 정확히 상보적인 지, 다른 지를 판단하는 것이 제일 중요하다. 미국특허 제 6,228,575 B1호를 보면 변이 위치에 대한 실험 데이터를 제시하고 있다. 즉 8개의 올리고핵산으로 구성된 탐침(변이의 위치를 5'을 기준으로 첫 번째 핵산에서 여덟 번째 핵산까지 변화시킴)을 DNA 칩에 심은 후에 표적샘플을 적용하였을 때의 형광 시그널의 세기차이를 비교하였다. 변이의 위치가 탐침의 중간이었을 때 (즉 4번째와 5번째의 핵산이 변화하였을 때) 시그널의 세기 차이가 최대가 되었다. 이 DNA 칩은 탐침의 3' 부분을 고정상 위에 결합시켰는데, 5'을 기준으로 첫 번째 핵산에 변이가 위치하였을 때가 여덟 번째 핵산에 변이를 위치시켰을 때보다 형광의 세기차이가 더 큼을 발견하였다. 따라서 변이의 위치 (5'을 기준으로)를 가로 축으로 그리고 형광 시그널의 세기차이를 세로축으로 하여 그림을 그렸을 때 오른쪽에 꼬리를 가진 코사인(cosine) 형태의 그림을 그리게 되었다. 이 그림으로부터 변이 위치가 중간 (50%)일 때, 표적핵산의 변이나 SNP를 가장 높은 시그널로 분별할 수 있다는 것을 알 수 있다. 그러나 이 특허에서는 변이 위치와 시그널에 대한 그림을 그리기는 하였으나, 코사인(cosine) 함수를 정의하지는 않았다.When designing an oligonucleotide probe for reading a target nucleic acid mutation or SNP, it is most important to determine whether the target nucleic acid and nucleotide sequence are exactly complementary or different. U. S. Patent No. 6,228, 575 B1 presents experimental data on the position of mutations. That is, the intensity difference of the fluorescence signal when the target sample was applied after planting a probe consisting of eight oligonucleotides (change position of the mutation from the first nucleic acid to the eighth nucleic acid based on 5 ') was compared. . When the position of the mutation was in the middle of the probe (ie when the fourth and fifth nucleic acids changed), the difference in signal intensity was maximized. The DNA chip bound the 3 'portion of the probe onto the stationary phase and found that the variation in fluorescence intensity was greater when the mutation was located at the first nucleic acid relative to the 5' than when the mutation was located at the eighth nucleic acid. Therefore, when drawing the position of the mutation (relative to 5 ') on the horizontal axis and the intensity difference of the fluorescence signal on the vertical axis, a cosine shape with a tail on the right was drawn. From this figure, it can be seen that when the mutation position is medium (50%), the target nucleic acid mutation or SNP can be identified as the highest signal. The patent, however, did draw a picture of the mutation location and signal, but did not define a cosine function.

국제특허 WO 01/06013 A1은 표적핵산의 혼성화에 대한 감도(sensitivity)와 특이도(specificity)를 최대화할 수 있는 하나 이상의 탐침을 평가할 수 있는 방법에 관한 내용이다. 또한 유럽특허공개 제 1,103,910호(EP 1,103,910 A1)에는 DNA 변이를 검출하기 위한 올리고핵산 탐침을 자동으로 선택하기 위한 방법을 개시하고 있다. 이러한 특허들은 탐침의 감도와 특이성을 구하기 위하여 열역학적 인접이웃모델 (nearest neighbour model)을 사용하여 혼성화 융점을 계산하고 여러 가지 인자들을 구하는 방법을 구체적으로 나열하고 있으나, 본 발명처럼 이미 계산된 인자로부터 간단한 모사식에 의한 최적화 함수를 이용한 올리고핵산 탐침의 점수화 및 선택에 관한 방법은 언급하고 있지 않다.International patent WO 01/06013 A1 describes a method for evaluating one or more probes that can maximize the sensitivity and specificity for hybridization of a target nucleic acid. In addition, European Patent Publication No. 1,103,910 (EP # 1,103,910 A1) discloses a method for automatically selecting an oligonucleic acid probe for detecting DNA mutations. These patents specifically list the method of calculating hybridization melting points and obtaining various factors using a thermodynamic neighboring model to obtain the sensitivity and specificity of the probe. There is no mention of methods for scoring and selecting oligonucleic acid probes using optimization functions by simulation.

미국특허 제 5,556,749호는 최적화 올리고핵산 탐침을 설계하기 위한 컴퓨터 시스템에 관한 것으로,DNA 또는 mRNA 혼성화 과정에 있어서 핵산 탐침에 관련된 계산과 설계에 관한 발명이다. 이 발명에서 설계된 탐침은 GenBank의 DNA, mRNA 서열 그리고 후보 탐침의 특정성 혹은 공유성 등을 고려하였다. 미국특허 제 6,228,593 B1호는 바이오 칩에서 핵산 탐침의 혼성화에 의한 형광 강도를 분석하여 미지의 염기에 대한 확률을 계산하여 핵산의 서열을 분석하는 컴퓨터 시스템이다.U. S. Patent No. 5,556, 749 relates to a computer system for designing optimized oligonucleotide probes and relates to calculations and designs relating to nucleic acid probes in DNA or mRNA hybridization processes. The probe designed in this invention takes into account the specificity or covalentness of GenBank DNA, mRNA sequence and candidate probe. U.S. Patent No. 6,228,593 B1 is a computer system that analyzes the sequence of nucleic acid by analyzing the fluorescence intensity by hybridization of nucleic acid probes in the biochip to calculate the probability for an unknown base.

미국특허 제 5,837,832호에는 참조 서열과 정확히 상보적인 탐침 및 하나 혹은 그 이상의 염기에 차이가 있는 탐침을 이용하여 탐침 배열을 만들어 DNA 칩을제작하는 방법이 개시되어 있다. 전기 방식을 타일배열(tiled array) 방식이라고 부르는데 탐침의 길이가 정해지면 (대개 12-18개) 대개 5개의 행으로 된 탐침 배열을 사용한다(도 1). 즉, 최상위 행은 정상 DNA와 완전히 상보적인 탐침을 위치시키고, 그 아래의 4열은 각 탐침의 중간 정도 위치에 변이를 탐침할 수 있는 A, G, C, T 변이를 각각 위치시킨다. 경우에 따라서 그 아래의 열에 백그라운드 시그널을 재기 위한 공백을 두거나, 염기의 삽입 혹은 소실을 검침할 수 있는 탐침을 위치시키기도 한다. 이와 같은 탐침의 설계법은 매우 신뢰도 높은 서열 변이를 검출할 수 있는 것은 사실이나, 탐침과 표적 샘플과의 열역학적 결합력의 고려가 없으며, 탐침의 설계를 유연하게 할 수가 없을 뿐만 아니라 하나의 변이를 찾아내기 위한 탐침의 수가 매우 많아져서, DNA 칩의 집적밀도를 높이는 등 많은 탐침을 심지 않으면 안된다.US Pat. No. 5,837,832 discloses a method of making a DNA chip by making a probe array using a probe that is exactly complementary to a reference sequence and a probe that differs in one or more bases. The former method is called a tiled array method, and once the probe length is determined (usually 12-18), a five-row probe array is usually used (Figure 1). That is, the top row places probes that are completely complementary to normal DNA, and the four columns below place A, G, C, and T mutations, each of which can probe the mutation at the midpoint of each probe. In some cases, there may be a space in the lower row for measuring the background signal, or a probe that can be used to detect insertion or loss of bases. It is true that the design of such probes can detect highly reliable sequence variations, but it does not take into account the thermodynamic coupling force between the probe and the target sample, and it is not flexible to design the probe, but also to find one variation. The number of probes has become so large that many probes must be planted, such as increasing the density of DNA chips.

이에, 본 발명자들은 상기 종래기술들의 문제점들을 극복하기 위하여 예의 연구노력한 결과, 혼성화 융점 (TM), 혼성화 융점 차이(△TM), 자기 정렬(self-alignment; hairpin, self-alignment), 변이 위치, 탐침 길이, 반복 서열 정도 및 GC 함량 등의 인자들에 대한 정보들을 탐침설계에 반영하는 경우 (도 2), 최적화된 올리고핵산 탐침을 쉽게 선택하여 DNA 칩의 제작을 용이하게 할 수 있음을 확인하고, 본 발명을 완성하게 되었다.Accordingly, the present inventors have diligently researched to overcome the problems of the prior art, and as a result, hybridization melting point (T M ), hybridization melting point difference (ΔT M ), self-alignment (hairpin, self-alignment), and variation If information about factors such as location, probe length, repeat sequence degree and GC content are reflected in the probe design (Fig. 2), it is possible to easily select an optimized oligonucleotide probe to facilitate the fabrication of DNA chips. It confirmed and completed this invention.

따라서, 본 발명의 주된 목적은 효율이 좋고 간편한 DNA 칩 제작을 위한 최적화된 올리고핵산 탐침을 설계하는 방법을 제공하는 데 있다.Therefore, the main object of the present invention is to provide a method for designing an optimized oligonucleic acid probe for efficient and simple DNA chip fabrication.

도 1은 종래 기술의 타일배열 탐침 설계법을 나타낸 도이다.1 is a view showing a tile array probe design method of the prior art.

도 2는 본 발명의 올리고핵산 탐침 설계법을 나타낸 도이다.Figure 2 is a diagram showing the oligonucleic acid probe design method of the present invention.

도 3은 코사인 함수로서 혼성화 융점 (TM) X1인자의 거동함수 φ1을 나타낸 그래프이다.3 is a graph showing the behavior function φ 1 of the hybridization melting point (T M ) X 1 as a cosine function.

도 4은 지수 함수로서 혼성화 융점차(△TM) X2인자의 거동함수 φ2를 나타낸 그래프이다.4 is a graph showing the behavior function φ 2 of the hybridization melting point difference ΔT M X 2 factor as an exponential function.

도 5은 쌍곡선 함수로서 자기 정렬(self-alignment) X3인자의 거동함수 φ3을 나타낸 그래프이다.5 is a graph showing the behavior function φ 3 of the self-alignment X 3 factor as a hyperbolic function.

도 6은 코사인 함수로서 변이 위치(position) X4인자의 거동함수 φ4를 나타낸 그래프이다.Fig. 6 is a graph showing the behavior function φ 4 of the shift position X 4 factor as a cosine function.

도 7은 코사인 함수로서 탐침 길이(length) X5인자의 거동함수 φ5를 나타낸 그래프이다.7 is a graph showing the behavior function φ 5 of the probe length X 5 factor as a cosine function.

도 8은 쌍곡선 함수로서 반복 서열 정도 (repeated) X6인자의 거동함수 φ6를 나타낸 그래프이다.Figure 8 is a graph showing the behavior of the function φ 6 as a hyperbolic function repeat sequence level (repeated) X 6 factor.

도 9은 코사인 함수로서 GC 함량 X7인자의 거동함수 φ7를 나타낸 그래프이다.9 is a graph showing the behavior function φ 7 of the GC content X 7 factor as a cosine function.

본 발명의 목적을 달성하기 위하여, 본 발명은 최적화된 올리고핵산 탐침을 설계하는 방법을 제공한다.In order to achieve the object of the present invention, the present invention provides a method of designing an optimized oligonucleic acid probe.

본 발명의 최적화된 올리고핵산 탐침을 설계하는 방법은 하기와 같은 단계로 구성된다:The method for designing an optimized oligonucleic acid probe of the present invention consists of the following steps:

(a) 혼성화 융점(TM), 혼성화 융점차(△TM), 자기 정렬(self-alignment), 변이 위치, 탐침 길이, 반복서열 정도 및 GC 함량의 탐침선택 기준 인자들로 구성되는 그룹으로부터 선택되는 하나 이상의 인자를 설정하는 단계;(a) from a group consisting of hybridization melting point (T M ), hybridization melting point difference (ΔT M ), self-alignment, mutation location, probe length, repeat sequence degree and probe selection criteria factors Setting one or more factors to be selected;

(b) (a) 단계에서 선택된 각 인자들의 거동함수를 간략화한 코사인(cosine), 지수, 쌍곡선 함수에 의하여 표시하고, 여기에 사용되는 인수들을 정의하는 단계; 및(b) expressing the behavior function of each factor selected in step (a) by a simplified cosine, exponent, and hyperbolic function, and defining the arguments used therein; And

(c) (b) 단계의 각 인자들의 거동함수들의 조합에 의하여 탐침 선택의 최적화 함수를 만들고 각 탐침을 점수화하여 최적 탐침을 선택하는 단계.(c) creating an optimization function of probe selection by combining the behavioral functions of each of the factors in step (b) and scoring each probe to select the optimal probe.

탐침의 설계에 있어서 여러 가지 고려하여야 할 인자들이 많이 있는데, 특히 올리고 핵산의 탐침의 경우, 탐침의 구간과 길이의 결정은 혼성화 융점 (TM), 혼성화 융점 차이(△TM), 자기 정렬(self-alignment; hairpin, self-alignment), 변이 위치, 탐침 길이, 반복 서열 정도, GC 함량 등의 인자들을 고려하여 정하게 된다. 변이를 가지고 있는 표적핵산 (mutant target oligonucleotide)과 변이가 없는 표적핵산 (normal target oligonucleotide)을 탐침과 혼성화반응 시켰을 때, 변이의 검출력이 증가할 수 있도록, 즉, 각 시그널의 차이가 극대화가 되고 높은 신뢰도를가질 수 있도록 탐침을 설계할 필요가 있다. 본 발명은 SNP, 핵산서열의 변이를 검출하기 위한 다수의 올리고 핵산을 최적 탐침으로서 선택하는 방법으로서, 이러한 각 인자들의 거동함수를 구한 후 이들을 조합하여 하나의 최적화 공식으로 설정하고, 각 탐침 후보군에 대한 점수화를 통하여 간략하고 효율 높은 탐침의 선택을 가능케 하는 방법이다.There are many factors to consider in the design of probes, especially in the case of oligonucleotide probes, the determination of the length and length of the probes is based on hybridization melting point (T M ), hybridization melting point difference (ΔT M ), and self-alignment ( Self-alignment (hairpin, self-alignment), mutation location, probe length, repeat sequence degree, GC content is determined by considering the factors. When hybridizing the target target nucleic acid (mutant and normal target oligonucleotide) with the probe, the detection power of the mutation increases, that is, the difference between each signal is maximized and high Probes need to be designed to have reliability. The present invention is a method for selecting a plurality of oligonucleotides for the detection of mutations in SNPs and nucleic acid sequences as an optimal probe, and after obtaining the behavior function of each of these factors, combining them to set one optimization formula, and to each probe candidate group It is a method that enables the selection of simple and efficient probes through scoring.

본 발명에 있어서, 바람직하게는 혼성화 융점 (TM) X1인자의 거동함수 φ1는 다음 식1로 나타낼 수 있다In the present invention, preferably the behavior function φ 1 of the hybridization melting point (T M ) X 1 factor can be represented by the following equation (1).

[식1] φ1= cos((X1- T0)*π/ (T0/2) + A0 (X1- A1) /(T0/2)[Equation 1] φ 1 = cos ((X 1 -T0) * π / (T0 / 2) + A0 (X 1 -A1) / (T0 / 2)

(상기 식에서, T0 = φ1이 최대일 때의 X1값;(Wherein, X 1 value when T0 = φ 1 is maximum);

A0 = 비대칭성을 조정하기 위한 상수, A0 > 0 이면 T0가 높게 이동 (φ1는 왼쪽 꼬리), A0 < 0 이면 T0가 낮게 이동 (φ1는 오른쪽 꼬리), A0 =0 이면 T0는 불변이며 φ1는 대칭, A0의 절대값이 커질수록 비대칭성이 증가됨;A0 = constant to adjust the asymmetry, if A0> 0, T0 moves higher (φ 1 is the left tail), if A0 <0, T0 moves lower (φ 1 is the right tail), and if A0 = 0, T0 is unchanged. φ 1 is symmetric, the asymmetry increases as the absolute value of A 0 increases;

A1 = 3/4 T0).A1 = 3/4 T0).

본 발명에 있어서, 바람직하게는 혼성화 융점차(△TM) X2인자의 거동함수 φ2는 다음 식2로 나타낼 수 있다.In the present invention, preferably, the behavior function φ 2 of the hybridization melting point difference ΔT M X 2 factor can be expressed by the following equation (2).

[식2] φ2= exp (X2- dT0)/ A0[Equation 2] φ 2 = exp (X 2 -dT0) / A0

(상기 식에서, dT0 = {(X2) at 50% φ2} - ln (A0/2);Wherein dT0 = {(X 2 ) at 50% φ 2 } − ln (A0 / 2);

{( X2) at 50% φ2}= 50%의 φ2를 갖는 X2; {(X 2) at 50% φ 2} X 2 having a φ of 2 = 50%;

A0 = 지수함수의 경사도를 조절하는 상수, 클수록 경사가 급격함).A0 = constant that controls the slope of the exponential function, the larger the slope).

본 발명에 있어서, 바람직하게는 자기 정렬(self-alignment) X3인자의 거동함수 φ3는 다음 식3으로 나타낼 수 있다.In the present invention, preferably, the behavior function φ 3 of the self-alignment X 3 factor can be expressed by the following equation (3).

[식3] φ3= A0 / (X3)[Equation 3] φ 3 = A0 / (X 3 )

(상기 식에서, A0 = 쌍곡선 함수의 경사도를 조절하는 상수, 클수록 완만해짐).(Wherein, A 0 = constant to adjust the slope of the hyperbolic function, the larger the smoother).

본 발명에 있어서, 바람직하게는 변이 위치(position) X4인자의 거동함수 φ4는 다음 식4로 나타낼 수 있다.In the present invention, preferably, the behavior function φ 4 of the shift position X 4 factor can be expressed by the following expression (4).

[식4] φ4= cos(X4- p0)*π/ (p0*2) + A0 * X4/(p0*2)[Equation 4] φ 4 = cos (X 4 -p0) * π / (p0 * 2) + A0 * X 4 / (p0 * 2)

(상기 식에서, p0 = φ4가 최대일 때의X4값; (4 X value when the above formula, p0 = φ 4 up;

A0 = 비대칭성을 조정하기 위한 상수, A0 > 0 이면 p0가 높게 이동 (φ4는 왼쪽 꼬리), A0 < 0 이면 p0가 낮게 이동 (φ4는 오른쪽 꼬리), A0 =0 이면 p0는 불변이며 φ4는 대칭, A0의 절대값이 커질수록 비대칭성이 증가됨).A0 = constant to adjust the asymmetry, p0 moves high if A0> 0 (φ 4 is left tail), p0 moves low if A0 <0 (φ 4 is right tail), p0 is unchanged if A0 = 0 φ 4 is symmetric, the asymmetry increases as the absolute value of A0 increases.

본 발명에 있어서, 바람직하게는 탐침 길이(length) X5인자의 거동함수 φ5는 다음 식5로 나타낼 수 있다.In the present invention, preferably, the behavior function φ 5 of the probe length X 5 factor can be expressed by the following expression (5).

[식5] φ5= cos(X5- L0)*π/ (L0*2) + A0 * X5/(L0*2)[Equation 5] φ 5 = cos (X 5 -L0) * π / (L0 * 2) + A0 * X 5 / (L0 * 2)

(상기 식에서, L0 = φ5가 최대일 때의 X5값;(Wherein, X 5 value when L0 = φ 5 is maximum;

A0 = 비대칭성을 조정하기 위한 상수, A0 > 0 이면 L0가 높게 이동 (φ5는 왼쪽 꼬리), A0 < 0 이면 L0가 낮게 이동 (φ5는 오른쪽 꼬리), A0 =0 이면 L0는 불변이며 φ5는 대칭, A0의 절대값이 커질수록 비대칭성이 증가됨).A0 = constant to adjust the asymmetry, if A0> 0, L0 moves high (φ 5 is left tail), if A0 <0, L0 moves low (φ 5 is right tail), if A0 = 0, L0 is unchanged φ 5 is symmetric, the asymmetry increases as the absolute value of A0 increases.

본 발명에 있어서, 바람직하게는 반복 서열 정도 (repeated) X6인자의 인자함수 φ6는 다음 식6으로 나타낼 수 있다.In the present invention, the factor function φ 6 of the repeated sequence degree (X 6 ) factor is preferably represented by the following formula (6).

[식6] φ6= A0 / (X6)[Equation 6] φ 6 = A0 / (X 6 )

(상기 식에서, A0 = 쌍곡선 함수의 경사도를 조절하는 상수, 클수록 완만해짐).(Wherein, A 0 = constant to adjust the slope of the hyperbolic function, the larger the smoother).

본 발명에 있어서, 바람직하게는 GC 함량 X7인자의 인자함수 φ7는 다음 식7로 나타낼 수 있다.In the present invention, the printing function φ 7 of the GC content X 7 factor is preferably represented by the following equation (7).

[식7] φ7= cos(X7- GC0)*π/ (GC0*2) + A0 * X7/(GC0*2) 7 = cos (X 7 -GC0) * π / (GC0 * 2) + A0 * X 7 / (GC0 * 2)

(상기 식에서, GC0 = φ7이 최고값이 되는 X7(In the above formula, the value of X 7 where GC0 = φ 7 is the highest value.

A0 = 비대칭성 을 조정하기 위한 상수, GC0 > 0 이면 GC0가 높게 이동 (φ7는 왼쪽 꼬리), A0 < 0 이면 GC0가 낮게 이동 (φ7는 오른쪽 꼬리), A0 =0 이면 GC0는 불변이며 φ7는 대칭, A0의 절대값이 커질수록 비대칭성이 증가됨).A0 = constant to adjust the asymmetry, if GC0> 0, GC0 moves high (φ 7 is left tail), if A0 <0, GC0 moves low (φ 7 is right tail), and if A0 = 0, GC0 is invariant φ 7 is symmetric, the asymmetry increases as the absolute value of A0 increases.

본 발명에 있어서, 최적화 함수는 바람직하게는 하기 식8과 같이 2개 이상의 인자에 대해 각 인자 거동함수를 지수승으로 하여 각 인자의 효과 정도를 상관관계로 나타낸 것으로, 각 탐침을 상기 최적화 함수에 의해 점수화함으로써 최적 탐침을 선택하게 된다.In the present invention, the optimization function preferably represents the degree of effect of each factor in correlation with each factor behavior function as an exponential power for two or more factors as shown in Equation 8 below. By scoring, the optimal probe is selected.

[식8] ψ = φ1(X1)a1φ2(X2)a2φ3(X3)a3φ4(X4)a4φ5(X5)a5φ6(X6)a6φ7(X7)a7 (8) ψ = φ 1 (X 1 ) a1 φ 2 (X 2 ) a2 φ 3 (X 3 ) a3 φ 4 (X 4 ) a4 φ 5 (X 5 ) a5 φ 6 (X 6 ) a6 φ 7 (X 7 ) a7

(상기 식에서, 인자 Xi, i=1,2, ...,7와 거동함수φi, i=1,2, ...,7들의 정의는 상기 식1 내지 식7의 정의와 같고(이중 선정되지 않은 인자는 생략가능), 지수 ai , i=1,2, ...,7는 각각 φi, i=1,2, ...,7 인자함수의 무게상수 (weighting factor)로서 정의된다).(In the above formula, the definitions of the factors X i , i = 1, 2, ..., 7 and the behavior function φ i , i = 1, 2, ..., 7 are the same as those of the formulas 1 to 7 above ( The non-selected factors can be omitted), and the exponents ai, i = 1,2, ..., 7 are the weighting factors of φ i , i = 1,2, ..., 7, respectively. Defined).

이하, 실시예와 첨부도면을 참조하여 본 발명을 더욱 상세히 설명하기로 한다. 이들 실시예는 단지 본 발명을 예시하기 위한 것이므로, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지는 않는다.Hereinafter, the present invention will be described in more detail with reference to Examples and accompanying drawings. Since these examples are only for illustrating the present invention, the scope of the present invention is not to be construed as being limited by these examples.

(실시예)(Example)

1. 혼성화 융점(TM) X1인자의 거동함수 φ1 1.Behavior function φ 1 of the hybridization melting point (T M ) X 1 factor

거동함수 φ1은 혼성화 융점 (TM) X1인자가 변함에 따른 혼성화 반응의 시그널의 차이를 나타낸다. 시그널의 차이가 없을 때를 0으로, 시그널의 차이가 가잘 클 때를 1로 정규화한다. 도 3은 코사인(cosine) 함수로서 혼성화 융점이 60oC일 경우에 거동함수 φ1이 1로서 가장 좋은 시그널의 차이를 나타냄을 모사하고 있다.즉 수식으로 나타내면 다음과 같으며,도 3은 A0 = 0인 경우를 나타낸다.The behavior function φ 1 represents the difference in the signal of the hybridization reaction as the hybridization melting point (T M ) X 1 factor changes. Normalize to 0 when there is no signal difference and to 1 when the difference between signals is large. FIG. 3 is a cosine function to simulate the best signal difference when the hybridization melting point is 60 ° C. When the function φ 1 is 1, that is, the equation is as follows, and FIG. 3 is A0. = 0.

여기서 A0는 비대칭성을 조정하기 위한 상수이며 A0 > 0 이면 최대값을 갖는 TM이 60oC보다 높게 이동 (φ1는 왼쪽 꼬리), A0 < 0 이면 최대값을 갖는 TM이 60oC보다 낮게 이동 (φ1는 오른쪽 꼬리), A0 =0 이면 최대값을 갖는 TM이 60oC이며 φ1는 대칭이 된다. A0의 절대값이 커질수록 비대칭성이 증가된다.Where A0 is a constant to adjust the asymmetry and if A0> 0, T M with the maximum value moves higher than 60 o C (φ 1 is the left tail); if A0 <0, T M with the maximum value is 60 o C Moving lower (φ 1 is the right tail), if A0 = 0, T M with the maximum value is 60 o C and φ 1 is symmetric. As the absolute value of A 0 increases, asymmetry increases.

2. 혼성화 융점차(△TM) X2인자의 거동함수 φ2 2. hybridization raised gradually (△ T M) behavior function of factor X 2 φ 2

거동함수 φ2은 혼성화 융점차 (△TM) X2인자가 변함에 따른 혼성화 반응의 시그널의 차이를 나타낸다. 시그널의 차이가 없을 때를 0으로, 시그널의 차이가 가잘 클 때를 1로 정규화한다. 도 4는 지수함수로서 혼성화 융점차가 10oC 이상일 경우에 거동함수 φ2이 1로서 가장 좋은 시그널의 차이를 나타냄을 모사하고 있다. 즉 수식으로 나타내면 다음과 같다.The behavior function φ 2 represents the difference in the signal of the hybridization reaction as the hybridization melting point difference (ΔT M ) X 2 factor changes. Normalize to 0 when there is no signal difference and to 1 when the difference between signals is large. FIG. 4 is an exponential function that simulates the best signal difference when the behavior function φ 2 is 1 when the hybridization melting point difference is 10 ° C or more. In other words, it is as follows.

여기서 exp3은 경사도를 조절하는 상수로서 그 값을 크게 할수록 경사가 급하게 된다. 또 상수 6은 혼성화 융점차가 6oC일 때, φ2가 0.5가 되도록 조절하는상수로서 사용을 하였으며, 지수함수에서 φ2가 1보다 큰 값을 가질 경우는 1이 되도록 수식보정을 하였다. 즉 모든 거동함수 φ17는 0에서 1 사이의 값을 갖도록 다음과 같이 정의한다.Where exp3 is a constant that adjusts the slope, and the larger the value, the steeper the slope. In addition, the constant 6 was used as a constant to adjust φ 2 to 0.5 when the hybridization melting point difference was 6 ° C. The equation was corrected to 1 when φ 2 had a value greater than 1 in the exponential function. That is, all behavior functions φ 1 to φ 7 are defined as follows to have a value between 0 and 1.

φi= 0 if φi< 0, i = 1, 2, ..., 7φ i = 0 if φ i <0, i = 1, 2, ..., 7

φi= φiif 0 ≤ φi≤ 1,i = 1, 2, ..., 7φ i = φ i if 0 ≤ φ i ≤ 1, i = 1, 2, ..., 7

φi= 1 if φi> 1,i = 1, 2, ..., 7φ i = 1 if φ i > 1, i = 1, 2, ..., 7

3. 자기 정렬(self-alignment) X3인자의 거동함수 φ3 3. The behavior of the function of the self-alignment (self-alignment) X 3 factor φ 3

거동함수 φ3은 자기 정렬 (self-alignment) X3인자가 변함에 따른 혼성화 반응의 시그널의 차이를 나타낸다. 자기 정렬은 탐침이 헤어핀 모양을 형성하거나 크로스 혼성화를 이루는 값을 말하며 자기 정렬을 하지 않을 때 0을 가지며 탐침으로서 더 바람직하다. 도 5는 쌍곡선 함수로서 자기 정렬값이 클수록 φ3는 0에 접근하여 좋지 않은 시그널의 차이를 나타냄을 모사하고 있다. 즉 수식으로 나타내면 다음과 같다.The behavior function φ 3 represents the difference in the signal of the hybridization reaction as the self-alignment X 3 factor changes. Self-alignment refers to the value at which the probe forms a hairpin or cross hybridization, and has zero when no self-alignment and is more preferred as a probe. 5 is a hyperbolic function, and the larger the self-alignment value, the more the φ 3 approaches 0 and represents the difference in the bad signal. In other words, it is as follows.

여기서 0.5는 쌍곡선함수의 경사도를 조절하는 상수로서 그 값을 크게 할수록 경사가 완만하게 된다.Where 0.5 is a constant that controls the slope of the hyperbolic function, and as the value increases, the slope becomes smooth.

4. 변이 위치 X4인자의 거동함수 φ4 4. Behavior function φ 4 of transition position X 4 factor

거동함수 φ4은 변이 위치 X4인자가 변함에 따른 혼성화 반응의 시그널의 차이를 나타낸다. 변이 위치는 서열 중에서 알고자하는 변이의 위치를 5' 위치에서부터 0~1의 값으로 나타낸다. 도 6은 코사인(cosine) 함수로서 변이 위치가 50%일 경우에 거동함수 φ4가 1로서 가장 좋은 시그널의 차이를 나타냄을 모사하고 있다. 즉 수식으로 나타내면 다음과 같으며 도 6은 A0 = 0인 경우를 나타낸다.The behavior function φ 4 represents the difference in the signal of the hybridization reaction as the variation position X 4 factor changes. Mutation position indicates the position of the mutation in the sequence from the 5 'position to a value of 0-1. FIG. 6 illustrates that the behavior function φ 4 shows the best signal difference when the variation position is 50% as a cosine function. In other words, the equation is as follows, and FIG. 6 shows a case where A0 = 0.

여기서 A0는 비대칭성을 조정하기 위한 상수이며 A0 > 0 이면 최대값을 갖는 변이위치가 50%보다 높게 이동 (φ4는 왼쪽 꼬리), A0 < 0 이면 최대값을 갖는 변이위치가 50%보다 낮게 이동 (φ4는 오른쪽 꼬리), A0 =0 이면 최대값을 갖는 변이위치가 50%이며 φ4는 대칭이 된다. A0의 절대값이 커질수록 비대칭성이 증가된다.Where A0 is a constant to adjust the asymmetry, and if A0> 0, the shift position with the maximum value moves higher than 50% (φ 4 is the left tail); if A0 <0, the shift position with the maximum value is lower than 50% If the shift (φ 4 is the right tail), A0 = 0, the maximum shift is 50% and φ 4 is symmetric. As the absolute value of A 0 increases, asymmetry increases.

5. 탐침 길이 X5인자의 거동함수 φ5 5. Behavior function φ 5 of probe length X 5 factor

거동함수 φ5은 탐침 길이 X5인자가 변함에 따른 혼성화 반응의 시그널의 차이를 나타낸다. 시그널의 차이가 없을 때를 0으로, 시그널의 차이가 가잘 클 때를 1로 정규화한다. 도 7은 코사인(cosine) 함수로서 탐침 길이가 20 염기일 경우에 거동함수 φ5가 1로서 가장 좋은 시그널의 차이를 나타냄을 모사하고 있다. 즉 수식으로 나타내면 다음과 같으며 도 7은 A0 = 0인 경우를 나타낸다.The behavior function φ 5 represents the difference in the signal of the hybridization reaction as the probe length X 5 factor changes. Normalize to 0 when there is no signal difference and to 1 when the difference between signals is large. FIG. 7 simulates the best signal difference when the behavior function φ 5 is 1 when the probe length is 20 bases as a cosine function. In other words, the equation is as follows, and FIG. 7 shows a case where A0 = 0.

여기서 A0는 비대칭성을 조정하기 위한 상수이며 A0 > 0 이면 최대값을 갖는 탐침 길이가 20 염기보다 높게 이동 (φ5는 왼쪽 꼬리), A0 < 0 이면 최대값을 갖는 탐침 길이가 20 염기보다 낮게 이동 (φ5는 오른쪽 꼬리), A0 =0 이면 최대값을 갖는 탐침 길이가 20 염기이며 φ5는 대칭이 된다. A0의 절대값이 커질수록 비대칭성이 증가된다.Where A0 is a constant to adjust the asymmetry, and if A0> 0, the probe length with maximum value moves higher than 20 bases (φ 5 is the left tail); if A0 <0, the probe length with maximum value is lower than 20 bases If the shift (φ 5 is the right tail), A0 = 0, the maximum probe length is 20 bases, and φ 5 is symmetric. As the absolute value of A 0 increases, asymmetry increases.

6. 반복서열 정도 X6인자의 거동함수 φ6 6. The behavior of the function repeat sequence approximately 6 X 6 factor φ

거동함수 φ6은 반복서열 정도 X6인자가 변함에 따른 혼성화 반응의 시그널의 차이를 나타낸다. 반복서열 정도는 탐침의 염기 중에서 가장 반복이 많은 염기 개수를 나타낸다. 도 8는 쌍곡선 함수로서 반복서열 정도가 클수록 φ6는 0에 접근하여 좋지 않은 시그널의 차이를 나타냄을 모사하고 있다. 즉 수식으로 나타내면 다음과 같다.The behavior function φ 6 represents the difference in the signal of the hybridization reaction with the change in the degree of repetition sequence X 6 . The degree of repetition sequence indicates the number of bases with the highest repetition among the bases of the probe. 8 is a hyperbolic function, and as the degree of the repetition sequence increases, φ 6 approaches 0, indicating that the difference between the signals is poor. In other words, it is as follows.

여기서 0.8은 쌍곡선함수의 경사도를 조절하는 상수로서 그 값을 크게 할수록 경사가 완만하게 된다.0.8 is a constant that controls the slope of the hyperbolic function. The larger the value is, the gradual the slope becomes.

7. GC 함량 X7인자의 거동함수 φ7 7.Behavior Function φ 7 of GC Content X 7 Factor

거동함수 φ7은 GC 함량 X7인자가 변함에 따른 혼성화 반응의 시그널의 차이를 나타낸다. 시그널의 차이가 없을 때를 0으로, 시그널의 차이가 가잘 클 때를 1로 정규화한다. 도 9는 코사인(cosine) 함수로서 GC 함량이 50%일 경우에 거동함수 φ7이 1로서 가장 좋은 시그널의 차이를 나타냄을 모사하고 있다. 즉 수식으로 나타내면 다음과 같으며 도 6은 A0 = 0인 경우를 나타낸다.The behavior function φ 7 represents the difference in the signal of the hybridization reaction as the GC content X 7 factor changes. Normalize to 0 when there is no signal difference and to 1 when the difference between signals is large. FIG. 9 simulates the best signal difference when the behavior function φ 7 is 1 when the GC content is 50% as a cosine function. In other words, the equation is as follows, and FIG. 6 shows a case where A0 = 0.

여기서 A0는 비대칭성을 조정하기 위한 상수이며 A0 > 0 이면 최대값을 갖는 GC 함량이 50%보다 높게 이동 (φ7는 왼쪽 꼬리), A0 < 0 이면 최대값을 갖는 GC 함량이 50%보다 낮게 이동 (φ7는 오른쪽 꼬리), A0 =0 이면 최대값을 갖는 GC 함량이 50%이며 φ7는 대칭이 된다. A0의 절대값이 커질수록 비대칭성이 증가된다.Where A0 is a constant to adjust the asymmetry, where A0> 0 moves the GC content with the maximum value higher than 50% (φ 7 is the left tail), and when A0 <0, the GC content with the maximum value is lower than 50% Movement (φ 7 is the right tail), if A0 = 0, the GC content with the maximum value is 50% and φ 7 is symmetric. As the absolute value of A 0 increases, asymmetry increases.

8. 최적화 함수 ψ에 의한 탐침의 점수화8. Scoring the Probe by the Optimization Function ψ

상기 제 1 ~7항의 인자를 사용하여 다음과 같은 탐침의 최적화 함수 ψ를 사용하여 각 인자의 효과 정도를 상관관계로 나타내어 점수화하였다. 2개 이상의 인자에 대해 각 인자 함수의 지수승으로 하여 각 인자의 효과 정도를 상관관계로 나타내어 점수화하여 최적 프로브를 선택하였다.Using the factors of the above 1 to 7 using the optimization function ψ of the following probe was correlated and scored the degree of effect of each factor. The optimal probe was selected by correlating the scores of two or more factors as the exponential power of each factor function and correlating the degree of effect of each factor.

ψ = φ1(X1)a1φ2(X2)a2φ3(X3)a3φ4(X4)a4φ5(X5)a5φ6(X6)a6φ7(X7)a7 ψ = φ 1 (X 1 ) a1 φ 2 (X 2 ) a2 φ 3 (X 3 ) a3 φ 4 (X 4 ) a4 φ 5 (X 5 ) a5 φ 6 (X 6 ) a6 φ 7 (X 7 ) a7

여기에서 지수 ai , i=1,2, ...,7는 각각 φi, i=1,2, ...,7 인자함수의 무게상수 (weighting factor)로서 정의될 수 있는데 이번 실시예에서는 모두 1로 놓았다.Here, the exponents ai, i = 1,2, ..., 7 can be defined as the weighting factors of the factor functions φ i , i = 1,2, ..., 7 respectively. Set all to 1.

여기서는 다음 세 가지 탐침에 대한 실시예를 보여준다.Here, examples for the following three probes are shown.

SequenceSequence 혼성화융점 ( TM)Hybrid Melting Point (T M ) 혼성화융점차(△TM)Hybrid Melting Point Difference (△ T M ) 자기정렬 (self-alignment)Self-alignment 변이위치(%)% Of variation 탐침길이Probe length 반복서열정도Repetition Sequence GC 함량GC content Optimum function, ψOptimum function, ψ ctgtgggAtgttgtgctgtgggAtgttgtg 53.653.6 7.37.3 00 53.353.3 1515 33 53.353.3 0.030.03 gtgtggcgAagatgggtgtggcgAagatgg 56.356.3 9.69.6 00 6060 1515 22 6060 0.560.56 tggcgAagatggtcatggcgAagatggtca 55.155.1 12.012.0 00 4040 1515 22 53.353.3 0.300.30

여기서 서열 중에 대문자 염기는 원하는 염기의 변이가 위치하는 장소를 나타낸다. 혼성화 융점, 혼성화융점차, 자기정렬 값은 MeltCalcTM프로그램 (Schutz and von Ahsen, 1999)를 이용하여 구하였으나, 비슷한 소프트웨어를 이용하여 구하여도 된다. 위 세 가지 탐침 중에서 하나를 선택해야 한다면 두 번째 서열 gtgtggcgAagatgg이 ψ = 0.56로서 가장 높은 최적화 함수를 가지므로 선택할 수 있다. 따라서 이러한 발명에 따르면 연구자나 실험자로 하여금 최적화된 올리고핵산 탐침을 설계할 수 있도록 하여 DNA 칩의 설계 및 제작 효율을 증대시킬 수 있다.Here, the uppercase base in the sequence indicates where the mutation of the desired base is located. Hybridization melting point, hybridization melting point difference, and self-alignment values were obtained using MeltCalc program (Schutz and von Ahsen, 1999), but may be obtained using similar software. If one of the above three probes is to be selected, the second sequence gtgtggcgAagatgg has the highest optimization function as ψ = 0.56 and can be selected. Therefore, according to the present invention, it is possible to increase the design and fabrication efficiency of DNA chips by allowing researchers or experimenters to design optimized oligonucleotide probes.

이상 설명한 바와 같이, 본 발명에 따르면 연구자나 실험자로 하여금 최적화된 올리고핵산 탐침을 설계할 수 있도록 하여 DNA 칩의 설계 및 제작 효율을 증대시킬 수 있다.As described above, according to the present invention, a researcher or an experimenter can design an optimized oligonucleotide probe, thereby increasing the design and manufacturing efficiency of the DNA chip.

[References][References]

1. Burchard J, "Methods for determining the specificity and sensitivity of oligonucleotides for hybridization, " WO 01/06013 A1(2001).1.Burchard J, "Methods for determining the specificity and sensitivity of oligonucleotides for hybridization," WO 01/06013 A1 (2001).

2. Chee M, Cronin MT, et. al., "Arrays of nucleic acid probes and biological chips," US Patent 5,837,832 (1998).2. Chee M, Cronin MT, et. al., “Arrays of nucleic acid probes and biological chips,” US Patent 5,837,832 (1998).

3. Gingeras TR, Mack D, et al., "Chip-based species identification and phenotypic characterization of microorganisms," US Patent 6,228,575 B1 (2001).3. Gingeras TR, Mack D, et al., "Chip-based species identification and phenotypic characterization of microorganisms," US Patent 6,228,575 B1 (2001).

4. Kleyn PW, Vesell ES, "Genetic variation as a guide to drug development," Science 281:1820-1821 (1998).Kleyn PW, Vesell ES, "Genetic variation as a guide to drug development," Science 281: 1820-1821 (1998).

5. Lipshutz R, Walker MG, "Computer-aided probability base calling for arrays of nucleic acid probes on chips," US Patent 6,228,593 B1 (2001).5. Lipshutz R, Walker MG, "Computer-aided probability base calling for arrays of nucleic acid probes on chips," US Patent 6,228,593 B1 (2001).

6. Mitsuhashi M, Cooper AJ, Waterman MS and Pevzner PA, "Oligoprobe designstation: A computerized method for designing optimal DNA probes," US Patent 5,556,749 (1996).6. Mitsuhashi M, Cooper AJ, Waterman MS and Pevzner PA, "Oligoprobe designstation: A computerized method for designing optimal DNA probes," US Patent 5,556,749 (1996).

7. Schutz E, "Method of automatically selecting oligonucleotide hybridization probes," European Patent 1,103,910 A1 (2001).7. Schutz E, "Method of automatically selecting oligonucleotide hybridization probes," European Patent 1,103,910 A1 (2001).

8. Schutz E and Ahsen, "Spreadsheet software for thermodynamic melting point prediction of oligonucleotide hybridization with and without mismatches," Biotechniques 27:1218-1224 (1999).8. Schutz E and Ahsen, "Spreadsheet software for thermodynamic melting point prediction of oligonucleotide hybridization with and without mismatches," Biotechniques 27: 1218-1224 (1999).

9. Shi MM, "Enabling large-scale pharmacogenetic studies by high-throughput mutation detection and genotyping technologies," Clinical Chemistry 47(2):164-172 (2001).9. Shi MM, "Enabling large-scale pharmacogenetic studies by high-throughput mutation detection and genotyping technologies," Clinical Chemistry 47 (2): 164-172 (2001).

10. Yershov G, Barsky V, et al., "DNA analysis and diagnostics on oligonucleotide microchips (sequencing by hybridization/ hybridization pattern), " Proc. Natl. Acad. Sci. USA, 93: 4913-4918 (1996).10. Yershov G, Barsky V, et al., "DNA analysis and diagnostics on oligonucleotide microchips (sequencing by hybridization / hybridization pattern)," Proc. Natl. Acad. Sci. USA, 93: 4913-4918 (1996).

Claims (9)

하기 각 단계로 구성되는 최적화된 올리고핵산 탐침을 설계하는 방법:How to design an optimized oligonucleic acid probe consisting of the following steps: (a) 혼성화 융점(TM), 혼성화 융점차(△TM), 자기 정렬(self-alignment), 변이 위치, 탐침 길이, 반복서열 정도 및 GC 함량의 탐침선택 기준 인자들로 구성되는 그룹으로부터 선택되는 하나 이상의 인자를 설정하는 단계;(a) from a group consisting of hybridization melting point (T M ), hybridization melting point difference (ΔT M ), self-alignment, mutation location, probe length, repeat sequence degree and probe selection criteria factors Setting one or more factors to be selected; (b) (a) 단계에서 선택된 각 인자들의 거동함수를 간략화한 코사인(cosine), 지수, 쌍곡선 함수에 의하여 표시하고, 여기에 사용되는 인수들을 정의하는 단계; 및(b) expressing the behavior function of each factor selected in step (a) by a simplified cosine, exponent, and hyperbolic function, and defining the arguments used therein; And (c) (b) 단계의 각 인자들의 거동함수의 조합에 의하여 탐침 선택의 최적화 함수를 만들고 각 탐침을 점수화하여 최적 탐침을 선택하는 단계.(c) creating an optimization function of probe selection by combining the behavioral functions of each of the factors in step (b) and scoring each probe to select the optimal probe. 제 1항에 있어서, 혼성화 융점 (TM) X1인자의 거동함수 φ1The method of claim 1, wherein the behavior function φ 1 of the hybridization melting point (T M ) X 1 factor is φ1= cos((X1- T0)*π/ (T0/2) + A0 (X1- A1) /(T0/2)φ 1 = cos ((X 1 -T0) * π / (T0 / 2) + A0 (X 1 -A1) / (T0 / 2) (상기 식에서, T0 = φ1이 최대일 때의 X1값;(Wherein, X 1 value when T0 = φ 1 is maximum); A0 = 비대칭성을 조정하기 위한 상수, A0 > 0 이면 T0가 높게 이동 (φ1는 왼쪽 꼬리), A0 < 0 이면 T0가 낮게 이동 (φ1는 오른쪽 꼬리), A0 =0 이면 T0는 불변이며 φ1는 대칭, A0의 절대값이 커질수록 비대칭성이 증가됨;A0 = constant to adjust the asymmetry, if A0> 0, T0 moves higher (φ 1 is the left tail), if A0 <0, T0 moves lower (φ 1 is the right tail), and if A0 = 0, T0 is unchanged. φ 1 is symmetric, the asymmetry increases as the absolute value of A 0 increases; A1 = 3/4 T0)A1 = 3/4 T0) 인 것을 특징으로 하는 방법.Method characterized in that. 제 1항에 있어서, 혼성화 융점차(△TM) X2인자의 거동함수 φ2The method of claim 1, wherein the behavior function φ 2 of the hybridization melting point difference (ΔT M ) X 2 factor is φ2= exp (X2- dT0)/ A0φ 2 = exp (X 2 -dT0) / A0 (상기 식에서, dT0 = {(X2) at 50% φ2} - ln (A0/2);Wherein dT0 = {(X 2 ) at 50% φ 2 } − ln (A0 / 2); {( X2) at 50% φ2}= 50%의 φ2를 갖는 X2; {(X 2) at 50% φ 2} X 2 having a φ of 2 = 50%; A0 = 지수함수의 경사도를 조절하는 상수, 클수록 경사가 급격함)A0 = constant to adjust the slope of the exponential function, the larger the slope is) 인 것을 특징으로 하는 방법.Method characterized in that. 제 1항에 있어서, 자기 정렬(self-alignment) X3인자의 거동함수 φ3The method of claim 1, wherein the behavior function φ 3 of the self-alignment X 3 factor is φ3= A0 / (X3)φ 3 = A0 / (X 3 ) (상기 식에서, A0 = 쌍곡선 함수의 경사도를 조절하는 상수, 클수록 완만해짐)(Wherein, A0 = a constant that adjusts the slope of the hyperbolic function, the larger the smoother) 인 것을 특징으로 하는 방법.Method characterized in that. 제 1항에 있어서, 변이 위치(position) X4인자의 거동함수 φ4The method of claim 1, wherein the behavior function φ 4 of the variation position X 4 factor is φ4= cos(X4- p0)*π/ (p0*2) + A0 * X4/(p0*2)φ 4 = cos (X 4 -p0) * π / (p0 * 2) + A0 * X 4 / (p0 * 2) (상기 식에서, p0 = φ4가 최대일 때의X4값; (4 X value when the above formula, p0 = φ 4 up; A0 = 비대칭성을 조정하기 위한 상수, A0 > 0 이면 p0가 높게 이동 (φ4는 왼쪽 꼬리), A0 < 0 이면 p0가 낮게 이동 (φ4는 오른쪽 꼬리), A0 =0 이면 p0는 불변이며 φ4는 대칭, A0의 절대값이 커질수록 비대칭성이 증가됨)A0 = constant to adjust the asymmetry, p0 moves high if A0> 0 (φ 4 is left tail), p0 moves low if A0 <0 (φ 4 is right tail), p0 is unchanged if A0 = 0 φ 4 is symmetric, and the asymmetry increases as the absolute value of A0 increases.) 인 것을 특징으로 하는 방법.Method characterized in that. 제 1항에 있어서, 탐침 길이(length) X5인자의 거동함수 φ5The method of claim 1, wherein the behavior function φ 5 of the probe length X 5 factor φ5= cos(X5- L0)*π/ (L0*2) + A0 * X5/(L0*2)φ 5 = cos (X 5 -L0) * π / (L0 * 2) + A0 * X 5 / (L0 * 2) (상기 식에서, L0 = φ5가 최대일 때의 X5값;(Wherein, X 5 value when L0 = φ 5 is maximum; A0 = 비대칭성을 조정하기 위한 상수, A0 > 0 이면 L0가 높게 이동 (φ5는 왼쪽 꼬리), A0 < 0 이면 L0가 낮게 이동 (φ5는 오른쪽 꼬리), A0 =0 이면 L0는 불변이며 φ5는 대칭, A0의 절대값이 커질수록 비대칭성이 증가됨)A0 = constant to adjust the asymmetry, if A0> 0, L0 moves high (φ 5 is left tail), if A0 <0, L0 moves low (φ 5 is right tail), if A0 = 0, L0 is unchanged φ 5 is symmetric, asymmetry increases as the absolute value of A0 increases) 인 것을 특징으로 하는 방법.Method characterized in that. 제 1항에 있어서, 반복 서열 정도 (repeated) X6인자의 거동함수 φ6The method of claim 1, wherein the behavior function φ 6 of the repeated sequence X 6 factor is φ6= A0 / (X6)φ 6 = A0 / (X 6 ) (상기 식에서, A0 = 쌍곡선 함수의 경사도를 조절하는 상수, 클수록 완만해짐)(Wherein, A0 = a constant that adjusts the slope of the hyperbolic function, the larger the smoother) 인 것을 특징으로 하는 방법Method characterized by 제 1항에 있어서, GC 함량 X7인자의 거동함수 φ7The method according to claim 1, wherein the behavior function φ 7 of the GC content X 7 factor is φ7= cos(X7- GC0)*π/ (GC0*2) + A0 * X7/(GC0*2)φ 7 = cos (X 7 -GC0) * π / (GC0 * 2) + A0 * X 7 / (GC0 * 2) (상기 식에서, GC0 = φ7이 최고값이 되는 X7(In the above formula, the value of X 7 where GC0 = φ 7 is the highest value. A0 = 비대칭성 을 조정하기 위한 상수, GC0 > 0 이면 GC0가 높게 이동 (φ7는 왼쪽 꼬리), A0 < 0 이면 GC0가 낮게 이동 (φ7는 오른쪽 꼬리), A0 =0 이면 GC0는 불변이며 φ7는 대칭, A0의 절대값이 커질수록 비대칭성이 증가됨)A0 = constant to adjust the asymmetry, if GC0> 0, GC0 moves high (φ 7 is left tail), if A0 <0, GC0 moves low (φ 7 is right tail), and if A0 = 0, GC0 is invariant φ 7 is symmetric, and as the absolute value of A0 increases, asymmetry increases) 인 것을 특징으로 하는 방법Method characterized by 제 1항에 있어서, 최적화 함수는 2개 이상의 인자에 대해 각 인자 함수를 지수승으로 하여 각 인자의 효과 정도를 하기 식과 같은 상관관계로 나타낸 것을 특징으로 하는 방법:The method of claim 1, wherein the optimization function correlates the degree of effect of each factor with the power of each factor function with respect to two or more factors as shown in the following equation: ψ = φ1(X1)a1φ2(X2)a2φ3(X3)a3φ4(X4)a4φ5(X5)a5φ6(X6)a6φ7(X7)a7 ψ = φ 1 (X 1 ) a1 φ 2 (X 2 ) a2 φ 3 (X 3 ) a3 φ 4 (X 4 ) a4 φ 5 (X 5 ) a5 φ 6 (X 6 ) a6 φ 7 (X 7 ) a7 (상기 식에서, 인자 Xi, i=1,2, ...,7와 거동함수φi, i=1,2, ...,7들의 정의는 제 2항 내지 제 8항의 정의와 같고(이중 설정되지 않은 인자들은 생략가능), 지수 ai , i=1,2, ...,7는 각각 φi, i=1,2, ...,7 인자함수의 무게상수 (weighting factor)로서 정의된다).(Wherein, the definitions of the factors X i , i = 1, 2, ..., 7 and the behavior functions φ i , i = 1, 2, ..., 7 are the same as those of claims 2 to 8 The non-set factors can be omitted), and the exponents ai, i = 1,2, ..., 7 are the weighting factors of φ i , i = 1,2, ..., 7 respectively. Defined).
KR10-2001-0079722A 2001-12-15 2001-12-15 Method for scoring and selection for optimum probes in probes design KR100442839B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0079722A KR100442839B1 (en) 2001-12-15 2001-12-15 Method for scoring and selection for optimum probes in probes design

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0079722A KR100442839B1 (en) 2001-12-15 2001-12-15 Method for scoring and selection for optimum probes in probes design

Publications (2)

Publication Number Publication Date
KR20030049499A true KR20030049499A (en) 2003-06-25
KR100442839B1 KR100442839B1 (en) 2004-08-02

Family

ID=29575299

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0079722A KR100442839B1 (en) 2001-12-15 2001-12-15 Method for scoring and selection for optimum probes in probes design

Country Status (1)

Country Link
KR (1) KR100442839B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100450816B1 (en) * 2002-03-06 2004-10-01 삼성전자주식회사 Selection method of probe set for genotyping
KR100682894B1 (en) * 2004-10-26 2007-02-15 삼성전자주식회사 A method for designing a probe from a polynucleotide group comprising a plurality of polynucleotides

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6040138A (en) * 1995-09-15 2000-03-21 Affymetrix, Inc. Expression monitoring by hybridization to high density oligonucleotide arrays
US5556749A (en) * 1992-11-12 1996-09-17 Hitachi Chemical Research Center, Inc. Oligoprobe designstation: a computerized method for designing optimal DNA probes
CA2379212A1 (en) * 1999-07-16 2001-01-25 Rosetta Inpharmatics, Inc. Methods for determining the specificity and sensitivity of oligonucleotides for hybridization
KR100474840B1 (en) * 2001-11-15 2005-03-08 삼성전자주식회사 Method and system with directory for providing a genotyping microarray probe design

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100450816B1 (en) * 2002-03-06 2004-10-01 삼성전자주식회사 Selection method of probe set for genotyping
KR100682894B1 (en) * 2004-10-26 2007-02-15 삼성전자주식회사 A method for designing a probe from a polynucleotide group comprising a plurality of polynucleotides

Also Published As

Publication number Publication date
KR100442839B1 (en) 2004-08-02

Similar Documents

Publication Publication Date Title
RU2390561C2 (en) Virtual sets of fragments of nucleotide sequences
US6361937B1 (en) Computer-aided nucleic acid sequencing
Dalma‐Weiszhausz et al. [1] the Affymetrix GeneChip® platform: an overview
US8036835B2 (en) Probe design methods and microarrays for comparative genomic hybridization and location analysis
US20020098496A1 (en) Polymorphism detection
EP0785280A2 (en) Polymorphism detection
US20070248975A1 (en) Methods for monitoring the expression of alternatively spliced genes
WO2005010200A2 (en) Concurrent optimization in selection of primer and capture probe sets for nucleic acid analysis
US20100286924A1 (en) Polymorphism detection
AU746682B2 (en) Biallelic markers for use in constructing a high density disequilibrium map of the human genome
US20060281126A1 (en) Methods for monitoring the expression of alternatively spliced genes
US20030138778A1 (en) Prediction of disease-causing alleles from sequence context
KR100442839B1 (en) Method for scoring and selection for optimum probes in probes design
Kuo et al. Gene expression profiling by DNA microarrays and its application to dental research
JP2002357606A (en) Method for predicting nucleic acid hybridization affinity and computer software product
Steinmetz et al. High-density arrays and insights into genome function
CN114250279B (en) Construction method of haplotype
Lockhart et al. DNA arrays and gene expression analysis in the brain
US20030138790A1 (en) Dynamic sequencing by hybridization
US20030134291A1 (en) Polymorphism detection
KR100442837B1 (en) Probe design method for the detection of neighboring SNPs or nucleotide sequence mutations
CN118186103A (en) Lateolabrax japonicus 100k liquid phase chip and application thereof
CA2302193A1 (en) Techniques for identifying, confirming, mapping and categorizing polymers
Schaffrath et al. Gene arrays
EP1390526A1 (en) Methods for identifying the evolutionarily conserved sequences

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120615

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20130624

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee