KR102084684B1 - 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법과 이를 이용한 다중 핵산 프로브 - Google Patents

다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법과 이를 이용한 다중 핵산 프로브 Download PDF

Info

Publication number
KR102084684B1
KR102084684B1 KR1020180055315A KR20180055315A KR102084684B1 KR 102084684 B1 KR102084684 B1 KR 102084684B1 KR 1020180055315 A KR1020180055315 A KR 1020180055315A KR 20180055315 A KR20180055315 A KR 20180055315A KR 102084684 B1 KR102084684 B1 KR 102084684B1
Authority
KR
South Korea
Prior art keywords
sequence
nucleic acid
sequences
analog
representative
Prior art date
Application number
KR1020180055315A
Other languages
English (en)
Other versions
KR20190130778A (ko
Inventor
신승원
엄숭호
이정헌
이병상
Original Assignee
주식회사 디나노
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 디나노 filed Critical 주식회사 디나노
Priority to KR1020180055315A priority Critical patent/KR102084684B1/ko
Priority to PCT/KR2019/005809 priority patent/WO2019221498A1/ko
Priority to JP2021514265A priority patent/JP2021522868A/ja
Priority to US17/055,392 priority patent/US20210115501A1/en
Priority to CN201980042141.0A priority patent/CN112602154A/zh
Priority to EP19803857.2A priority patent/EP3796321A4/en
Publication of KR20190130778A publication Critical patent/KR20190130778A/ko
Application granted granted Critical
Publication of KR102084684B1 publication Critical patent/KR102084684B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/204Modifications characterised by specific length of the oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)

Abstract

본 발명은 다중 핵산 검출 바이오마커에 결합하는 단일 염기 서열을 이용한 다중 핵산 프로브에 관한 것이다. 본 발명의 인공 염기서열 설계 방법을 통해 설계된 염기서열은 모든 유사체에 대해 보다 우수한 혼성화 반응성을 나타내며, 이를 이용한 다중 핵산 프로브는 하나의 진단 프로브를 사용하여 유의성을 지닌 다종의 핵산 서열과 동시다발적으로 결합이 가능하도록 설계되어 시료 내 전반적인 발현 양상을 진단함으로써, 하나의 진단 프로브를 사용한 핵산 바이오마커의 초-다중 진단이 가능하며 이를 통해 진단능 향상과 검진 비용을 획기적으로 줄일 수 있는 효과가 있다.

Description

다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법과 이를 이용한 다중 핵산 프로브{A method for designing an artificial base sequence for binding to multiple nucleic acid biomarkers, and multiple nucleic acid probes}
본 발명은 다중 핵산 검출 바이오마커에 결합하는 단일 염기 서열 설계 및 이를 이용한 다중 핵산 프로브에 관한 것이다.
유전자 검사는 질병의 증상이 있는 환자에서 의심되는 유전 질환을 확진하거나 감별할 수 있으며, 질환의 원인이 되는 유전자의 돌연변이 유무 검사를 통해 질병의 발병 가능성과 발병 위험도가 높아지는 질환의 예측 또한 가능하다. 이러한 유전형 검사는 질병의 예방, 조기 진단, 치료 및 관리에 도움을 주어 질환의 이환율과 사망률을 감소시킬 수 있다고 보고되고 있다.
이러한 유전자 검사는 인체 내의 모든 세포는 유전적으로 동일하게 구성되어 있다는 전제로 인체의 어떤 조직으로도 유전자 검사가 가능하지만, 가장 쉽게는 혈액에서 핵산을 추출하여 사용할 수 있다.
핵산의 진단 분야는 단일염기다형성(single nucleotide polymorphism; SNP)의 구별, 병원성 세균 또는 바이러스의 탐지 및 동정, 유전병 진단 등에 활용되고 있다. 이에 특정 핵산을 신속하고 정확하게 검출하기 위한 많은 방법들이 제시되어 왔고, 현재에도 이와 관련된 많은 연구가 진행되고 있으며(W. Shen et al., 2013, Biosen. and Bioele., 42:165-172.; M.L. Ermini et al., 2014, Biosen. and Bioele., 61:28-37.; K. Chang et al., 2015, Biosen. and Bioele., 66:297-307.), 특정 핵산을 검출하기 위해 가장 보편적으로 사용하는 방법으로 중합효소 연쇄반응(polymerase chain reaction, PCR)을 이용하는 방법, 다중 중합효소 연쇄반응(multiplex polymerase chain reaction, Multiplex PCR) 방법과 다중 중합효소 연쇄반응을 사용하지 않고 공통 프라이머를 사용하여 다수의 핵산을 동시에 증폭하여 대량 분석을 가능하게 하는 기술로서 SNPlex, Goldengate assay, molecular inversion probes(MIPs) 등이 있다.
최근에는 검출하고자 하는 표적 핵산과 상보적 결합이 가능한 염기서열로 구성된 핵산 프로브가 개발되었다. 상기 핵산 프로브는 바이오마커를 생물학적 시료와 혼성화시켜 측정하는 방식으로, 질병 진단 및 예후 예측의 유의성을 높이기 위해 다중 바이오마커를 동시에 진단하는 방식이 필수적으로 사용되고 있으며, 기존 방식은 단일 핵산 바이오마커에 결합하는 단일의 상보적 결합이 가능한 염기서열을 다수로 이용하여 다중 진단하는 방식이었다.
다만, 다중 진단을 위한 비용이 매우 높아 초기 단계에서의 사용이 어렵고 지속적인 모니터링 및 예후 관찰이 힘들다는 한계가 있었다. 예로서, 대표적인 유방암 바이오마커인 BRCA1과 BRCA2의 경우 실제 환자군 내에서 돌연변이 발견 확률이 약 13.9%정도로 낮은 편이며 (대한방사선종양학회지), 정확한 진단을 위해 시판되어 사용되는 진단 키트의 경우 평균적으로 십여 종류의 유전인자를 동시 진단할 수 있으나 회당 비용이 $3,000 이상 소요되어 예방적 진단 및 지속적 모니터링에 큰 한계가 있다.
한편, k-평균 클러스터링 알고리즘은 클러스터링 방법 중 분할법에 속한다. 분할법은 주어진 데이터를 여러 그룹으로 나누는 방법이다. 예를 들어 n개의 데이터 오브젝트를 입력받았다고 가정하고, 이 때 분할법은 입력 데이터를 n보다 작거나 같은 k개의 그룹으로 나누는데, 이 때 각 군집은 클러스터를 형성하게 된다. 즉, 데이터를 한 개 이상의 데이터 오브젝트로 구성된 k개의 그룹으로 나누는 것이다. 이 때 그룹을 나누는 과정은 거리 기반의 그룹간 비유사도(dissimilarity)와 같은 비용 함수(cost function)를 최소화하는 방식으로 이루어지며, 이 과정에서 같은 그룹 내 데이터 오브젝트간의 유사도는 증가하고, 다른 그룹에 있는 데이터 오브젝트와의 유사도는 감소하게 된다. k-평균 알고리즘은 각 그룹의 중심(centroid)과 그룹 내의 데이터 오브젝트와의 거리의 제곱합을 비용 함수로 정하고, 이 함수값을 최소화하는 방향으로 각 데이터 오브젝트의 소속 그룹을 업데이트함으로써 클러스터링을 수행하게 된다.
본 발명자들은 상기와 같은 단점을 극복하면서 환자의 생체 시료에서 검출가능한 핵산 바이오마커의 전체적 양상을 저렴하고 빠르게 진단할 수 있는 방법을 개발하고자 노력하던 중, k-평균 클러스터링 알고리즘을 포함한 열역학 원리와 소셜 네트워크 분석을 이용하여 다중 핵산 바이오마커에 대해 최적의 선택성을 갖는 인공 염기서열을 모델링하는 방법을 개발할 수 있고, 이를 통해 많은 표적 핵산을 신속하고 정확하게 검출할 수 있음을 확인하고 본 발명을 완성하였다.
본 발명의 목적은 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법을 제공하는 것이다.
본 발명의 또다른 목적은 상기 인공 염기서열을 이용한 다중 핵산 프로브를 제공하는 것이다.
본 발명의 또다른 목적은 상기 인공 염기서열을 이용한 다중 핵산 검출 방법을 제공하는 것이다.
본 발명은 a) 표적 핵산과 유사성을 갖는 무작위 유사체(Analog) 서열 세트(기본 서열)를 각각 제조하는 단계;
b) 상기 유사체 서열 세트 중 혼성화 프로파일 유사성이 가장 높은 2개의 유사체 서열을 최근접(nearest neighbor) 알고리즘을 이용하여 선정하는 단계;
c) 상기 선정된 2개의 유사체 서열과 임의의 핵산 서열로 구성된 세가닥의 염기서열의 다중 평형 반응을 설정하고 하기 식 1을 이용하여 가장 높은 평형상수(K)의 합을 나타내는 공통 보체(complement)를 선정하는 단계로서,
[식 1]
Figure 112018047562366-pat00001
상기 식에서, ΔG는 표준 상태에서의 깁스 자유 에너지를 나타내며, x는 농도를 나타내는 단계;
d) 상기 공통 보체와 상보적인 가닥으로서, 2개의 유사체 서열을 대표하는 대표 서열(representative sequence)을 선정하는 단계; 및
e) 단일 가닥이 남을 때까지 a) 내지 e) 과정을 반복하는 단계;를 포함하는, 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법을 제공한다.
또한, 본 발명은 상기 염기서열 및 형광물질을 포함하는, 다중 핵산 바이오마커 탐지용 프로브를 제공한다.
본 발명의 인공 염기서열 설계 방법을 통해 설계된 염기서열은 모든 유사체에 대해 보다 우수한 혼성화 반응성을 나타내며, 이를 이용한 다중 핵산 프로브는 하나의 진단 프로브를 사용하여 유의성을 지닌 다종의 핵산 서열과 동시다발적으로 결합이 가능하도록 설계되어 시료 내 전반적인 발현 양상을 진단함으로써, 하나의 진단 프로브를 사용한 핵산 바이오마커의 초-다중 진단이 가능하며 이를 통해 진단능 향상과 검진 비용을 획기적으로 줄일 수 있는 효과가 있다.
도 1a는 CANADA 2.0으로부터 얻은 무작위 염기 서열(기본 서열)과 그 돌연변이 서열 정보를 나타낸 도이다.
도 1b는 이들의 소시오그램을 도시한 것으로, 기본 서열과 돌연변이는 노드(파란색 원)로 표시되고, 깁스 자유 에너지가 가장 높은 상위 100개의 상보적 서열(흰색 원)이 이들의 보체와 연결되었다. 상보적 서열은 노란색 동그라미로 표시된 두 개 이상의 링크를 갖는다.
도 1c는 가장 높은 깁스 자유 에너지를 갖는 1000 개의 서열과 돌연변이의 상보적 공통 서열 수(Closeness; 근접도) 프로파일을 나타낸 도이다.
도 2a는 두 개의 유사체로부터 대표 서열을 계산하기 위한 순서도를 나타낸 도로서, 검증 과정에서 수정된 최근접 모델이 사용되었다. 염기쌍 내에서 일치하지 않는 인접 매개 변수는 깁스 자유 에너지에 영향을 미치지 않는다고 가정하고, 초기 염기쌍 또한 계산에서 고려되지 않았다. 대표 서열은 최상위 공통 보체 (common complement)로부터 얻어졌으며, 농도는 유사체에 대해 동등한 양의 혼성화를 생성하도록 조정하였다.
도 2b는 다중 반응의 평형 상수 계산으로부터 얻은 쌍곡선 그래프로서, 쌍곡선 그래프가 반응 상수(K)의 증가로 (1,1) 좌표에 접근하고 있으며, 두 쌍곡선의 교차점은 반응의 평형 상태를 나타낸다.
도 3a는 대표 서열을 계산하는데 사용된 유사체의 서열 정보를 나타낸다. 유사체 서열에는 3가지 차이점이 있으며, 계산된 대표 서열은 두 유사체 모두에 대해 헤테로 시퀀싱되었다.
도 3b는 보체 및 반-유사체의 다중 반응 평형을 나타낸 도이다.
도 3c는 대표 서열이 유사체와 더 상보적 후보를 공유함을 보여주는 소시오그램을 나타낸 도이다.
도 3d는 유사체들과 대표 서열 사이의 전체 상보적 서열에 대한 깁스 자유 에너지 값의 피어슨 상관 계수를 유사체들간의 상보적 서열에 대한 깁스 자유 에너지 값의 피어슨 상관 계수와 비교하여 나타낸 도이다.
도 4a는 유사체에 대한 공통 보체 (294346 및 281802)의 혼성화 효율을 나타낸 도이다.
도 4b는 유사체의 농도 변화에 따른 반-유사체 및 공통 보체와의 혼성화 효율을 계산한 결과를 나타낸 도이다.
도 4c는 두 가지 유사체가 함께 존재할 때 공통 보체와의 혼성화 효율을 나타낸 도이다.
도 4d는 상이한 유사체 농도로부터 계산된 최적화된 대표 서열을 나타낸 도이다.
도 4e는 유사체에 대하여 최적화된 대표 서열의 피어슨 상관 계수를 나타낸 도이다.
도 5a는 여러 유사체의 서열 정보와 서열 간의 깁스 에너지와 피어슨 상관 계수를 나타낸 도이다.
도 5b는 유사체에 대해 계산된 공통 보체의 깁스 프리 에너지 및 혼성화 수율을 나타낸 도이다.
도 5c는 5개의 유사체 및 3개의 미스 매치 염기를 갖는 대표 서열을 사용하여 기본 서열 및 초기 유사체에 대한 대표 서열의 평균 피어슨 상관 계수를 나타낸 도이다.
도 5d는 다양한 돌연변이 염기의 혼성화 수율 및 피어슨 상관 계수의 비율을 나타낸 도이다.
본 발명은 다중 핵산 검출 바이오마커에 결합하는 단일 염기 서열을 이용한 다중 핵산 프로브 및 다중 핵산 검출 방법에 관한 것이다.
아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였다.
본원 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
본원 명세서 전체에서 사용되는 정도의 용어 "약", "실질적으로" 등은 언급된 의미에 고유한 제조 및 물질 허용오차가 제시될 때 그 수치에서 또는 그 수치에 근접한 의미로 사용되고, 본원의 이해를 돕기 위해 정확하거나 절대적인 수치가 언급된 개시 내용을 비양심적인 침해자가 부당하게 이용하는 것을 방지하기 위해 사용된다. 본원 명세서 전체에서 사용되는 정도의 용어 "~(하는) 단계" 또는 "~의 단계"는 "~ 를 위한 단계"를 의미하지 않는다.
먼저, 본 발명은 하기 단계를 포함하는, 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법을 제공한다:
a) 표적 핵산과 유사성을 갖는 무작위 유사체(Analog) 서열 세트를 각각 제조하는 단계;
b) 상기 유사체 서열 세트 중 혼성화 프로파일 유사성이 가장 높은 2개의 유사체 서열을 최근접(nearest neighbor) 알고리즘을 이용하여 선정하는 단계;
c) 상기 선정된 2개의 유사체 서열과 임의의 핵산 서열로 구성된 세가닥의 염기서열의 다중 평형 반응을 설정하고 하기 식 1을 이용하여 가장 높은 평형상수(K)의 합을 나타내는 공통 보체(complement)를 선정하는 단계로서,
[식 1]
Figure 112018047562366-pat00002
상기 식에서, ΔG는 표준 상태에서의 깁스 자유 에너지를 나타내며, x는 농도를 나타내는 단계;
d) 상기 공통 보체와 상보적인 가닥으로서, 2개의 유사체 서열을 대표하는 대표 서열(representative sequence)을 선정하는 단계; 및
e) 단일 가닥이 남을 때까지 a) 내지 d) 과정을 반복하는 단계.
만일, 상기 유사체 서열이 3 이상의 다중 가닥인 경우,
f) 상기 d) 단계의 대표 서열과 그 농도를 이용하여 하기 식 2를 통해 가장 높은 평형상수(K)의 합을 나타내는 공통 보체(complement)를 선정하는 단계로서,
[식 2]
Figure 112018047562366-pat00003
상기 식에서, ΔG는 표준 상태에서의 깁스 자유 에너지를 나타내며, x는 농도를 나타내는 단계;
h) 상기 공통 보체와 상보적인 가닥으로서, 2개의 유사체 서열을 대표하는 대표 서열(representative sequence)을 선정하는 단계; 및
i) 단일 가닥이 남을 때까지 a) 내지 h) 과정을 반복하는 단계;를 더 포함할 수 있다.
상기 다중 가닥은 바람직하게는 3 내지 5개의 가닥일 수 있다.
상기 "유사체(Analog) 서열 세트를 각각 제조하는 단계"의 경우, 유사체 서열세트는 표적서열과 상보적인 서열 세트를 프로그램을 이용하여 무작위적으로 자동으로 생성시키는 단계일 수 있다.
상기 "표적(target) 핵산"은 생물학적 시료에 존재할 수 있는 임의의 관심 핵산을 지칭하기 위한 것으로, "관심 핵산(nucleic acid of interest)"을 의미한다.
상기 "바이오마커(biomarker)"는 개인에서 정상 또는 비정상적 진행의 표시 또는 개인에서 질병 또는 다른 상태의 표시이거나 그것을 나타내는 표적 분자를 지칭하기 위하여 사용되는 것으로, 정상 또는 비정상, 그리고 비정상이라면 만성 또는 급성의 특정 생리학적 상태 또는 진행의 존재와 관련된 해부적, 생리학적, 생화학적 또는 분자학적 파라미터이다.
바이오마커가 개인에서의 비정상적인 진행 또는 질병 또는 다른 상태를 나타내거나 그것의 표시이면, 그 바이오마커는 일반적으로 개인에서의 정상적인 진행 또는 질병 또는 다른 상태의 부재를 나타내거나 그것의 표시인 바이오마커의 발현 레벨 또는 값과 비교하여, 과대 발현(over-expressed) 또는 과소 발현 (under expressed) 중 하나로 표현된다. "상향 조절(up-regulation)", "상향 조절된(up-regulated)", "과대 발현(over-expression)", "과대 발현된(over-expressed)" 및 이 표현들의 변화형은, 건강한 또는 정상적인 개인의 유사한 생물학적 시료에서 전형적으로 검출되는 바이오마커의 값 또는 레벨(또는 값 또는 레벨의 범위)보다 더 큰 생물학적 시료에서의 바이오마커 값 또는 레벨을 지칭하기 위하여 혼용된다.
상기 대표 서열의 검증을 위하여 깁스 자유 에너지 값의 피어슨 상관 계수(Pearson's correlation coefficient)를 이용할 수 있으며, 바람직하게는 평균 피어슨 상관계수가 상기 a) 단계의 유사체 서열 세트를 구성하는 모든 유사체보다 높다.
상기 검증을 통해 대표 서열이 상기 두 유사체의 서열 및 혼성화 프로파일을 대표함을 확인할 수 있다.
본 발명에서 얻은 인공 염기서열은 a) 단계의 유사체 서열 세트를 구성하는 모든 유사체보다 높은 혼성화 반응성을 나타낼 수 있다.
상기 a) 단계에서, 유사체 서열은 바람직하게는 8 내지 10개의 염기로 구성될 수 있다.
상기 c) 단계에서 2개의 유사체 서열은 상보적 공통 서열의 개수를 근접도(Closeness)로 나타낸 후, 근접도가 높은 염기 서열부터 계산될 수 있다.
상기 c) 단계에서 적용되는 최인접(nearest neighbor) 알고리즘은 표적 서열과 가장 유사성이 높은 서열을 계산한다. 구체적으로, 최인접 알고리즘은 한 개체의 유사체와 모든 개체들 각각의 유사체 사이에 모든 짝(pairwise) "거리들"을 계산한다. 상기 알고리즘은 이미 공지된 문헌인 Bremner D, et al.,(2005). "Output-sensitive algorithms for computing nearest-neighbor decision boundaries". Discrete and Computational Geometry 33 (4):593604)를 참고할 수 있다.
다양한 방법을 사용하여 임의의 요소의 네트워크를 식별할 수 있지만 가장 직관적인 방법은 다차원 공간에서 각 요소를 조정한 다음 이들 간의 유클리드 거리(Euclidian distance)를 측정하는 것이다. 이를 뉴클레오티드에 적용하면 두 개의 뉴클레오티드를 나타내는 점들이 서로 가깝게 위치할 때 높은 서열 유사성을 나타내는 것을 알 수 있으며, 반대로, 뉴클레오티드의 서열이 서로 상당히 다르다면, 두 점 사이의 거리는 더 멀리 떨어져 있을 것이다. 따라서 뉴클레오티드를 공간 배열로 조정하는 것은 네트워크 해석에 이상적으로 사용될 수 있다.
그러나 뉴클레오티드의 서열이 다양하고 상호 작용이 복잡하기 때문에 단일 좌표계로 투영하는 것은 거의 불가능하다. 따라서 기본적인 소셜 네트워크 방법론이 뉴클레오티드의 유사성을 나타내는데 도움이 될 수 있다. 본 발명에서는 소시오그램을 도시하여 유사성을 확인하였다.
또한, 본 발명은 상기 방법을 통해 설계된 염기서열 및 형광물질을 포함하는, 다중 핵산 바이오마커 탐지용 프로브를 제공한다.
상기 형광물질은 바람직하게는 시아닌(Cyanine) 형광분자, 로다민(Rodamine) 형광분자, 알렉사(Alexa) 형광분자, FITC(fluorescein isothiocyanate) 형광분자, FAM(5-carboxy fluorescein) 형광분자 및 텍사스 레드(Texas Red) 형광분자 및 플루오레세인(fluorescein)으로 이루어진 군으로부터 선택된 1 이상일 수 있으며, 더 바람직하게는 시아닌일 수 있다.
또한, 본 발명은 하기 단계를 포함하는 다중 핵산 검출 방법을 제공한다:
a) 표적 핵산을 포함하는 시료를 수득하는 단계;
b) 상기 시료, 상기 시료와 상보적인 염기서열을 가지는 프라이머 세트, 절단시약 및 제8항에 따라 제조된 프로브를 혼합한 후 신장반응을 통해 표적 핵산-프로브 복합체를 증폭시키는 단계; 및
d) 상기 c) 단계에서 증폭된 복합체로부터 분리된 프로브 단편의 양을 측정하는 단계.
상기 시료는 개인으로부터 획득하거나 그외 달리 도출된 물질, 생물학적 체액, 조직 또는 세포를 말하는 것으로, 본원에서 혼용된다. 이는 (전혈(whole blood), 백혈구(leukocytes), 말초혈액 단핵 세포(peripheral blood mononuclear cells), 백혈구 연층(buffy coat), 혈장(plasma) 및 혈청(serum)을 포함하는) 혈액, 객담(sputum), 눈물(tears), 점액(mucus), 세비액 (nasal washes), 비강 흡인물(nasal aspirate), 호흡(breath), 소변(urine), 정액(semen), 침(saliva), 복막 세척액(peritoneal washing), 낭종액(cystic fluid), 양수(amniotic fluid), 선액(glandular fluid), 림프액(lymph fluid), 세포액(cytologic fluid), 복수(ascites), 흉수(pleural fluid), 유두 흡인물(nipple aspirate), 기관지 흡인물(bronchial aspirate), 기관지 찰과물(bronchial brushing), 활액(synovial fluid), 관절 흡인물(joint aspirate), 조직 분비물(organ secretions), 세포(cell), 세포 추출물(cell extract) 및 뇌척수액(cerebrospinal fluid)을 포함한다. 이는 또한 상기 열거한 것들에서 실험적으로 분리된 단편(fractions)을 포함한다. 예를 들어, 혈액 샘플은 혈청, 혈장 또는 적혈구 세포 또는 백혈구 세포와 같은 특정 형태의 혈액 세포를 포함하는 단편으로 분리될 수 있다. 원하는 경우, 시료는 조직 시료 및 체액 시료의 조합처럼, 개인의 시료 조합일 수 있다. 또한 예를 들어, 대변 샘플, 조직 시료 또는 조직 생검으로부터의 샘플과 같은 균질화된 고체 물질을 포함하는 물질을 포함한다. 또한 조직 배양 또는 세포 배양으로부터 유래된 물질을 포함한다. 생물학적 시료를 얻기 위한 적절한 방법이 사용될 수 있고; 대표적인 방법은 예를 들어, 채혈, 면봉법(예를 들어, 구강상피세포 면봉법) 및 세침 흡인 조직검사를 포함한다. 세침 흡인을 할만한 대표적인 조직은 림프절, 폐, 폐 세척액, BAL(기관지폐포 세척액, bronchoalveolar lavage), 갑상선, 유방 및 간(liver)을 포함한다. 시료들은 또 예를 들어, 미세절 개(예를 들어, 레이저 포획 미세절개(laser capture microdissection; LCM) 또는 레이저 미세 절개(laser micro dissection; LMD)), 방광 세척, 도말(예를 들어, PAP 도말) 또는 유즙도관 세척법에 의해 수집될 수 있다. 개인으로부터 얻어지거나 유래되는 생물학적 "시료"는 개인으로부터 얻은 후 적절한 방법으로 처리된 시료를 포함한다.
또한, 생물학적 시료는 다수의 사람으로부터 생물학적인 시료들을 얻어서 그 시료들을 풀(pool)로 만들거나 각 개인의 생물학적 시료의 부분 표본을 풀로 만들어서 도출할 수 있다. 풀로 만든 시료는 한 개인으로부터 나온 시료로서 처리될 수 있다.
이하, 본 발명의 이해를 돕기 위하여 바람직한 실시예를 제시한다. 그러나 하기의 실시예는 본 발명을 보다 쉽게 이해하기 위하여 제공되는 것일 뿐, 실시예에 의해 본 발명의 내용이 한정되는 것은 아니다.
준비예 1. 실험 준비
실험에 사용된 모든 뉴클레오티드는 Integrated DNA Technologies, Inc. (Coralville, IA, USA)로부터 구입하였다. 먼저, 동결 건조된 뉴클레오티드를 TE 완충액 (10 mM Tris, pH 8.0, 0.1 mM EDTA)에 100 μM 농도로 용해시켰다. 뉴클레오티드는 혼성화 과정을 위해 100 mM NaCl과 각 실험의 비율로 혼합되었다. 어닐링 공정은 에펜도르프(Eppendorf) (Westbury, NY, USA)의 Mastercycler Pro가 제공하는 열 순환기(thermocycler)에서 수행하였다. 95 ℃에서 5분간 가열한 후 온도를 분당 0.5℃씩 95 ℃에서 25 ℃로 점차 감소시켰다. 형광 강도는 Molecular Devices, Inc. (Sunnyvale, CA, USA)의 SpectraMax M5를 사용하여 측정하였다 (Sunnyvale, CA, USA).
준비예 2. 깁스 자유 에너지, 피어슨 상관 계수, 다중 평형 상수 및 근접도 계산
깁스 자유 에너지, 피어슨 상관 계수, 다중 평형 상수 및 근접도를 포함한 모든 계산은 Python v2.7을 사용하여 수행되었다. NumPy v1.8.0rc1 및 SciPy v0.13.0b1은 알고리즘 효율성을 위해 사용되었다. 보충 정보에는 상세한 계산 방법과 공식이 제시되어있다.
준비예 3. 소시오그램( Sociogram )
Cytoscape v3.6.0을 사용하여 소시오그램을 도시하였다. 기본 서열, 유사체 및 상보적 후보가 노드로 사용되었다. 상보적 후보는 이의 관련 기본 서열 또는 유사체와 연결되어 있다. 노드의 위치는 prefuse force directed layout을 통해 결정되었다.
실시예 1. 인공 염기서열 합성
1-1. 서열 유사성에 따른 뉴클레오티드 매핑
먼저, CANADA 2.0으로부터 10개의 무작위 염기(기본)의 모델 뉴클레오티드 서열을 얻었고, 기본 서열의 염기를 누적 방식으로 변화시킴으로써 유사체 서열(돌연변이)을 합성하였다. Mut-1은 기본 서열의 단일 염기 무작위 돌연변이에 의해 생성하였으며 돌연변이된 염기는 다음 돌연변이 Mut-2로 옮겨졌다. 따라서, Mut-2는 Mut-1 중 하나와 그 자신의 것 중 하나인 기본 염기로부터 2개의 불일치 서열을 보유한다. 이 방법으로 총 10 개의 돌연변이가 생성되었다. 돌연변이 수가 높아지면(돌연변이의 축적) 기본 서열과 돌연변이의 서열 차이가 커진다.
기본 염기 서열과 돌연변이 염기 서열 정보는 도 1a에 나타내었으며, 기본 및 돌연변이에 대한 모든 상보적인 가닥의 깁스 자유 에너지(Gibb's free energy)를 계산하였다.
서열은 10개의 염기로 구성되기 때문에, 총 410개의 상보적인 서열이 존재하였다. 또한, 가능한 모든 상보적인 가닥들 중에서, 가장 높은 깁스 자유 에너지를 가진 100개의 뉴클레오티드를 선택하고(상보적 후보), 각각의 기본 또는 돌연변이에 연결하여 무방향성 소시오그램(Sociogram)을 도시하였으며, 이를 도 1b에 나타내었다.
도 1b에 나타낸 바와 같이, 모델 뉴클레오티드 서열에서 돌연변이의 축적이 클수록 상보적 후보를 공유하는 서열이 적음을 확인하였다. 기본 서열은 단 하나의 염기 미스 매치 돌연변이인 Mut-1와 상보적 후보의 대부분을 공유하였다. 또한, 미스 매치 뉴클레오티드는 상보적 후보의 대부분을 그들의 가장 유사한 유사체와 공유하였다.
공유되는 상보적 후보의 수는 근접도(closeness)로 나타내고, 근접도의 값은 뉴클레오티드 사이의 유사 유클리드 거리를 나타내기 위해 사용되었다. 상위 1000개의 상보적 후보를 갖는 기본 염기와 돌연변이의 근접도 프로파일을 도 1c에 나타내었다.
동일한 서열에 기여한 세포는 황색으로 표시하고, 공통 서열 수가 더 많은 세포는 붉은 색으로 표시하였으며, 도 1c에 나타낸 바와 같이, 모든 뉴클레오티드가 가장 유사한 염기와 가장 근접도가 높다는 것은 분명하였다. 이는 뉴클레오티드 서열을 맵핑하고 뉴클레오티드 중간에 위치하는 서열을 마이닝함으로써 다중 스트랜드로부터 대표적인 서열을 생성하는 것이 가능함을 나타낸다.
1-2. 두 가지 유사체로부터 대표 서열 생성
초기 단계에서 대표 서열의 존재를 증명하기 위한 모델로 두 가지 유사체를 사용하였다. 계산 과정은 도 2a에 나타내었으며, 하기와 같다.
1. 두 유사체에 대한 모든 상보적 가닥의 깁스 자유 에너지가 계산되고, 깁스 자유 에너지의 합이 가장 높은 상보적 가닥(상보적인 후보)을 선택한다.
2. 상보적 후보들과 깁스 자유 에너지 값의 다중 반응의 평형이 계산되고, 가장 큰 반응 평형 합을 갖는 가장 좋은 상보적 가닥(공통 보체)을 선택한다.
3. 공통 보체에 대한 완벽한 역배열(anti-sense)의 대표 서열이 생성되고, 2개의 유사체와 공통 보체와의 반응 평형의 동등한 합계를 갖는 대표 서열의 농도가 계산된다.
먼저, 깁스 자유 에너지 계산 절차에서 최근접(Nearest-neighbor) 모델을 약간 수정하여 사용하였다. 일반적인 사용시, 핵산 이중 염기의 최근접 매개변수 및 말단 염기쌍 매개변수가 혼성화 엔탈피 및 엔트로피를 계산하기 위해 포함되어야 하나, 상보적 염기쌍에서 최근접 매개변수만을 고려하였다. 최근접 매개변수는 이전 연구에서 참조하였다. 계산 후, 2개의 유사체에 대한 각 상보적인 가닥의 깁스 자유 에너지 값이 추가되고, 가장 높은 1000개의 가닥이 하기 평형 계산 단계의 상보적 후보로 선택되었다.
유사체와 상보적 후보 사이의 깁스 자유 에너지 값은 단일 반응 조건에 대해 계산되었으므로, 상기 깁스 자유 에너지 값을 유사체와 상보적 후보를 모두 포함하는 다중 반응의 반응 상수로 변환해야 한다. 두 유사체의 반응 상수의 합은 혼성화에 대한 상보적 후보의 관여를 나타낸다. 그 후 상보적 후보로부터 가장 높은 반응 상수의 합을 갖는 공통 보체를 선택하였다. 기본 공식 및 계산 과정은 하기와 같다.
Figure 112018047562366-pat00004
도 2b에 나타낸 바와 같이, 반응 상수 (K)의 식은 쌍곡선 그래프로 나타내었고, 합리적인 범위의 교차점은 다중 반응 평형 상태 (x)를 나타낸다. 공통 보체로부터 대표 서열 및 그 농도를 계산하였다. 대표 서열은 공통 보체의 서열에 대한 완벽한 역배열로 지정되었고, 대표 서열의 농도는 유사체의 반응 상수의 합으로 표준화되었다. 공통 보체와 대표 서열 사이의 깁스 자유 에너지 또한 계산에 사용되었다.
2개의 염기 불일치를 갖는 뉴클레오티드의 2개의 상이한 서열이 유사체에 대해 임의로 선택되었다. 가장 유리한 공통 보체 및 대표 서열은 계산을 통해 결정하였다. 대표 서열을 계산하는데 사용된 유사체의 서열 정보와 혼성화 깁스 자유 에너지는 도 3a에 나타내었다. 유사체 서열에는 3 가지 차이점이 있으며, 계산된 대표 서열은 두 유사체 모두에 대해 헤테로 시퀀싱되었다.
도 3a에 나타낸 바와 같이, 대표 서열은 2개의 유사체의 혼성 형태였다. 공통 보체와 유사체에 대한 유사체의 완전한 보체의 깁스 자유 에너지를 비교한 결과, 공통 보체는 극대화된 깁스 자유 에너지를 갖지 않는 것을 확인하였다. 그러나, 혼성화 반응의 합은 완전한 상보적 서열보다 높았다.
또한, 보체 및 반-유사체의 다중 반응 평형을 도 3b에 나타내었다.
도 3b에 나타낸 바와 같이, 계산된 다중 반응 평형 좌표는 완전한 상보적 서열의 좌표보다 (1,1) 좌표에 더 가까운 거리를 나타냈다.
또한, 대표 서열과 유사체간의 공유하는 상보적 후보를 소시오그램을 통해 도 3c에 나타내었다.
도 3c에 나타낸 바와 같이, 대표 서열은 2개의 유사체보다 상보적 후보를 더 공유함을 확인하였다.
또한, 유사체들과 대표 서열 사이의 전체 상보적 서열에 대한 깁스 자유 에너지 값의 피어슨 상관 계수를 유사체들간의 상보적 서열에 대한 깁스 자유 에너지 값의 피어슨 상관 계수와 비교하여 도 3d에 나타내었다.
도 3d에 나타낸 바와 같이, 깁스의 자유 에너지의 피어슨 상관 계수는 혼성화 프로파일의 유사성을 나타내며, 예상한 바와 같이 대표 서열과 유사체와의 평균 피어슨 상관 계수가 더 높은 것을 확인하였다.
상기 결과를 통해 대표 서열이 두 유사체의 서열 및 혼성화 프로파일을 대표할 수 있음을 확인하였다.
1-3. 여러 서열에서 대표 서열 생성
좌표계에서 k-평균 클러스터링 알고리즘은 클러스터링을 위한 직관적이고 합리적인 대표 중심을 생성할 수 있다. k-평균 알고리즘을 사용한 클러스터링의 경우 중심으로부터 데이터 객체까지의 거리의 합이 측정되고 좌표 중력의 합이 최소화되도록 업데이트된다. 중심 자체는 실제 데이터가 아니지만 다른 데이터 개체와 마찬가지로 좌표를 갖는다. 따라서 중심은 클러스터에서 데이터 객체의 속성을 나타낸다. 이는 유사체 서열로부터 대표 서열을 계산하는 것과 매우 유사하다. 본 발명자들은 k-평균 클러스터링 알고리즘을 다중 서열을 갖는 대표 서열의 생성에 적용하려고 시도하였다.
기존의 k-평균 클러스터링 알고리즘에서 중심의 거리는 클러스터의 데이터 객체의 중심까지 재조정되어 거리의 합을 최소화한다. 그러나 많은 수의 염기를 가지고 뉴클레오티드의 중심을 계산하는 것은 거의 불가능하다. 최근 다중 뉴클레오티드 평형 상태를 계산하기 위한 몇 가지 주목할만한 접근법이 개발되었다. 예를 들어, Robert Dirt와 그의 동료들은 그래프 이론과 분할 함수의 조합으로 다중 가닥 상호 작용과 2차 구조의 형성을 위한 방법론을 개발한 바 있다. 이는 비록 많은 자원과 계산 시간이 필요하지만 동시에 수천 개의 반응에 대한 합리적인 결과를 제공할 수 있다. 따라서 k-평균 클러스터링 알고리즘을 단계적으로 적용하였다.
k-평균 클러스터링 알고리즘의 단계별 계산에서 발생하는 차이는 데이터에 질량을 할당하여 극복할 수 있다. 예를 들어, 하기와 같이 2차원 공간에서 3개의 점 (a, b, c)의 중심 좌표 (x, y)는 좌표의 평균이다.
Figure 112018047562366-pat00005
Figure 112018047562366-pat00006
Figure 112018047562366-pat00007
한편, 일정 질량 (α, β, γ)을 포함하면 중심 좌표는 다음과 같이 표현된다.
Figure 112018047562366-pat00008
이 경우, 중심 좌표의 단계별 계산은 다음과 같으며 좌표 중심 끝은 단일 계산의 것과 동일할 것이다.
실시예 2. 합성된 염기서열의 실험적 검증
유사체와 공통 보체 간의 다중 반응과 혼성화를 실험적으로 입증하기 위하여, 두 가지 공통 보체 (코드번호: 294346 및 281802)를 선택하고, 유사체에 대한 공통 보체의 혼성화 효율을 도 4a에 나타내었다. 측정을 위해, 유사체를 형광 염료 (Cy3 및 Cy5)로 표지하고, 공통 보체를 IOWA 블랙 소광체로 표지하였다. 유사체와 공통 보체 간의 혼성화가 발생하면 형광 강도가 약해진다.
도 4a에 나타낸 바와 같이, 먼저 1 ㎛의 각 유사체(유사체 1및 유사체 2)는 2 μM의 그들의 완전한 상보적 서열(anti-analogs; 반-유사체)과 별도로 반응하였다. 예상대로, 반-유사체는 자신의 유사체와 가장 높은 혼성화 효율을 보였다. 그러나 다른 유사체와의 혼성화는 효과적이지 못했다. 반-유사체 2의 경우, 유사체 2와 완전한 혼성화를 나타내었다. 반면, 반-유사체 2는 50.4 %의 효율로 유사체 1에 혼성화되었다. 공통 보체가 완전한 반-유사체에 비해 낮은 혼화 효율을 보였음에도 불구하고, 두 유사체의 평균 혼성화가 더 우수하였다. 더욱이, 혼합 유사체 용액에서 공통 보체(코드번호: 294346 및 281802)는 전체 혼성화에서 가장 높은 수율을 보였다.
이러한 현상은 유사체의 농도가 증가한 경우에도 관찰되었다. 실제 실험 전에 유사체의 다양한 농도에서 반-유사체와 공통 보체의 혼성화 효율을 계산하였으며, 그 결과를 도 4b에 나타내었다.
도 4b에 나타낸 바와 같이, 유사체의 농도는 0 μM에서 2 μM로 증가하였고, 농도의 합은 2 μM로 고정되었다. 유사체 1 또는 유사체 2가 2 μM에서 지배적인 뉴클레오티드를 차지하는 종단점 및 부근에서 반-유사체는 가장 높은 혼성화 효율을 나타내었다. 그러나 반-유사체의 혼성화는 그 자신의 보체가 감소함에 따라 유의하게 감소하였다. 대조적으로 공통 보체는 모든 농도에서 지속적인 혼성화 효율을 나타내었다.
또한, 두 가지 유사체가 함께 존재할 때 공통 보체와의 혼성화 효율을 도 4c에 나타내었다.
도 4c에 나타낸 바와 같이, 두 가지 유사체가 함께 존재할 때, 공통 보체는 더 높은 혼성화 효율을 나타내었다. 또한, 유사체의 비율과 관련하여 중간 영역에서 더 나은 혼성화 효율이 관찰되었다. 상기 도 4b에서 공통 보체가 더 높은 혼성화 효율을 나타내는 삼각형 영역은 공통 보체 및 대표 서열의 잠재력을 잘 나타내고 있으며, 이는 도 4c에서도 관찰되었다. 반-유사체의 혼성화 효율은 호환성이 낮은 타겟의 수가 증가할수록 낮아지나, 공통 보체는 유사체 1/유사체 2 비율이 0.4/1.6 내지 1.2/0.8일 때, 더 양호한 혼성화를 나타내어 대표 서열의 가능성을 입증하였다.
이 결과를 보다 신뢰성 있게 만들기 위해 100개의 임의의 유사체 세트를 사용하여 100개의 대표 서열을 생성한 결과, 혼성화 효율 값에 차이가 있음에도 불구하고 대표 서열과 동일한 기능의 확실한 증거를 보여 주었다. 모든 가능한 상보적인 서열에 대한 유사체 및 대표 서열의 깁스 자유 에너지 프로파일을 피어슨 상관 계수를 사용하여 비교하였다. 두 염기쌍의 뉴클레오티드 사이에서 평균 피어슨 상관 계수는 0.636±0.049이었다. 대조적으로, 대표 서열과 유사체 사이의 평균 피어슨 상관 계수는 0.805±0.042이었다. 이 계수의 증가는 대표 서열이 유사체 서열의 혼성화 프로파일을 대표할 수 있음을 나타낸다.
또한, 다양한 농도의 유사체로부터 최적화된 대표 서열을 계산하는 것이 가능하였으며, 그 결과를 도 4d에 나타내었다.
도 4d에 나타낸 바와 같이, 총 8개의 염기 중 5개를 공유하는 2개의 유사체를 사용하여 대표 서열을 다양한 농도로 계산하였다. 유사체 농도를 0:10000 내지 10000:0으로 적용하고, 최적의 대표 서열을 수득하였다.
또한, 유사체들에 대하여 최적화된 대표 서열의 피어슨 상관 계수를 계산하였으며, 그 결과를 도 4e에 나타내었다.
도 4e에 나타낸 바와 같이, 농도 편향으로, 최적화된 대표 서열은 더 큰 근접도를 가지며 지배적인 유사체에 대한 더 높은 피어슨 상관 계수를 나타내었다.
실시예3 . 합성된 염기서열의 이론적 검증
대표 서열을 검증하기 위하여 여러 유사체의 서열 정보와 서열 간의 깁스 에너지 및 피어슨 상관 계수를 계산하여 도 5a에 나타내었다. 
도 5a에 나타낸 바와 같이, 2개의 염기 변이를 가진 단일 기본 염기에서 3개의 유사체가 생성되었다. 두 유사체의 분석에서 알 수 있듯이 유사체 2/3의 깁스 자유 에너지 값은 완전한 역배열 서열보다 낮았으나, 반-유사체의 깁스 자유 에너지보다 높았다. 기본 서열에 대한 초기 유사체의 피어슨 상관 계수는 0.550이고, 서로의 평균 계수는 0.597이었다. 유사체 2와 유사체 3 (0.746 및 0.936)에 대한 유사체 2/3의 계수는 0.675로 유사체 2와 유사체 3 사이의 계수보다 높았다. 이 결과는 유사체 2/3이 유사체 2와 유사체 3을 대표함을 나타낸다.
반대로 유사체 2/3의 깁스 자유 에너지와 상관 계수는 유사체 1에 비해 증가하지 않았으며, 기본 서열에 대한 피어슨 상관 계수의 증가는 없었다. 이는 계산된 대표 서열이 표적 유사체에 특이적이라는 것을 나타낸다. 한편, 유사체 1과 유사체 2/3에서 계산 된 대표적인 서열은 기본 서열에 대한 피어슨 상관 계수와 깁스 자유 에너지 값의 증가를 나타냈으며, 계수 값은 다른 유사체의 계수 값보다 높은 0.664이다. 평균 계수는 모든 유사체 내에서 증가하였으며, 대표 서열에 대한 초기 유사체의 평균 피어슨 상관 계수는 기본 서열에 대한 것보다 높았다. 이 결과는 대표 서열을 만드는 것이 가능하다는 것을 보여줄 뿐만 아니라 그 성능이 기본 서열의 성능보다 좋을 수 있음을 나타낸다.
대표 서열의 잠재력은 또한 평형 상수 계산에서도 나타났으며, 이를 도 5b에 나타내었다.
도 5b에 나타낸 바와 같이, 기본 서열의 역배열 서열인 유사체 2/3 및 대표 서열을 사용하여 혼성화 효율을 측정하였다. 혼성화에 대한 평형 상수는 다중 반응 평형 계산식에 의해 계산되었다. 역배열 기본 서열의 평형 상수는 3개의 유사체에서 유사하였으며, 상수의 합은 2,980이었다. 유사체 2와 유사체 3에서 계산된 역배열 유사체 2/3의 경우 유사체 2와 유사체 3의 평형 상수가 역배열 기본 서열에 비해 증가하였다. 그러나, 유사체 1의 상수는 유의하게 감소되었다. 따라서 상수의 합은 전체적으로 감소하였다 (2,960). 또한, 역배열 대표 서열은 유사체 1의 회복된 상수를 나타내었고, 상수의 합은 가장 높았다 (2,984). 이 결과는 생성된 대표 서열의 잠재력을 직접적으로 나타낸다.
또한, 다중 뉴클레오티드의 분석을 위해, 5개의 유사체 및 3개의 미스 매치 염기를 갖는 동일한 절차에 의해 수득된 대표 서열을 사용하여 기본 서열 및 초기 유사체에 대한 대표서열의 평균 피어슨 상관 계수를 계산하여 도 5c에 나타내었다.
도 5c에 나타낸 바와 같이, 대표 서열의 피어슨 상관 계수는 서열 의존적 방식으로 기본 서열의 피어슨 상관관계보다 높거나 낮았으나, 일반적으로 유사체의 계수보다 높았다.
또한, 다양한 돌연변이 염기의 혼성화 수율 및 피어슨 상관 계수의 비율을 도 5d에 나타내었다.
도 5d에 나타낸 바와 같이, 서열의 차이로 인해 혼성화 프로파일의 유사성이 적어지기 때문에, 유사체에 대한 기본 서열의 피어슨 상관 계수는 돌연변이의 수의 증가에 따라 감소하였다. 피어슨 상관 계수의 감소는 대표 서열에서도 관찰되었다. 그러나 감소량은 기본 서열의 감소량보다 적었다. 따라서, 피어슨 상관 계수(대표/기본)의 비율은 돌연변이의 수에 따라 증가하였다. 돌연변이의 수가 4일 때, 대표 서열의 평균 계수는 기본 서열보다 높았다. 이는 본 발명의 과정이 다중 뉴클레오티드로부터 대표 서열을 생성할 수 있음을 나타내지만, 기본서열에서와 같이 최적화되지는 않음을 나타내며, 이는 깁스 자유 에너지와 평형 상수에 대한 부정확한 계산으로 인한 것으로 생각된다. 특히, 이차 구조와 같은 뉴클레오티드 혼성화에서 고려해야할 몇 가지 요인이 있기 때문에 간단한 열역학 원리를 이용한 평형 상수 계산은 대표적인 서열 생성을 위한 최적화에 충분하지 않을 수 있다. 이러한 부정확성을 극복하기 위해 깁스 자유 에너지 및 평형 상태 계산 과정에 보다 복잡하고 동시적인 계산을 적용할 수 있다. 그러나 대표 서열은 임의의 단일 유사체보다 유사체와의 상관관계가 훨씬 더 높은 것을 확인하였다.

Claims (9)

  1. a) 표적 핵산과 유사성을 갖는 무작위 유사체(Analog) 서열 세트를 각각 제조하는 단계;
    b) 상기 유사체 서열 세트 중 혼성화 프로파일 유사성이 가장 높은 2개의 유사체 서열을 최근접(nearest neighbor) 알고리즘을 이용하여 선정하는 단계;
    c) 상기 선정된 2개의 유사체 서열과 임의의 핵산 서열로 구성된 세가닥의 염기서열의 다중 평형 반응을 설정하고 하기 식 1을 이용하여 가장 높은 평형상수(K)의 합을 나타내는 임의의 핵산 서열을 공통 보체(complement)로 선정하는 단계로서,
    [식 1]
    Figure 112018047562366-pat00009

    상기 식에서, ΔG는 표준 상태에서의 깁스 자유 에너지를 나타내며, x는 농도를 나타내는 단계; 및
    d) 상기 공통 보체와 상보적인 가닥으로서, 2개의 유사체 서열을 대표하는 대표 서열(representative sequence)을 선정하는 단계;
    를 포함하는, 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법.
  2. 제1항에 있어서, 상기 유사체 서열이 3 이상의 다중 가닥인 경우,
    e) 상기 d) 단계의 대표 서열과 그 농도를 이용하여 하기 식 2를 통해 가장 높은 평형상수(K)의 합을 나타내는 공통 보체(complement)를 선정하는 단계로서,
    [식 2]
    Figure 112018047562366-pat00010

    상기 식에서, ΔG는 표준 상태에서의 깁스 자유 에너지를 나타내며, x는 농도를 나타내는 단계; 및
    f) 상기 공통 보체와 상보적인 가닥으로서, 2개의 유사체 서열을 대표하는 대표 서열(representative sequence)을 선정하는 단계;를 더 포함하는 인공 염기서열 설계 방법.
  3. 제1항 또는 제2항에 있어서, 상기 대표 서열의 평균 피어슨 상관계수가 상기 a) 단계의 유사체 서열 세트를 구성하는 모든 유사체보다 높은 것을 특징으로 하는, 인공 염기서열 설계 방법.
  4. 제1항 또는 제2항에 있어서, 상기 인공 염기서열은 상기 a) 단계의 유사체 서열 세트를 구성하는 모든 유사체보다 높은 혼성화 반응성을 나타내는 것을 특징으로 하는, 인공 염기서열 설계 방법.
  5. 제1항 또는 제2항에 있어서, 상기 유사체 서열은 8 내지 10개의 염기로 구성된 것을 특징으로 하는, 인공 염기서열 설계 방법.
  6. 제1항 또는 제2항에 있어서, 상기 c) 단계에서 2개의 유사체 서열은 상보적 공통 서열의 개수를 근접도(Closeness)로 나타낸 후, 근접도가 높은 염기 서열부터 계산하는 것을 특징으로 하는, 인공 염기서열 설계 방법.
  7. 제2항에 있어서, 상기 다중 가닥은 3 내지 5개의 가닥인 것을 특징으로 하는, 인공 염기서열 설계 방법.
  8. 제1항 또는 제2항에 따라 설계된 염기서열 및 형광물질을 포함하는, 다중 핵산 바이오마커 탐지용 프로브.
  9. 제8항에 있어서, 상기 형광물질은, 시아닌(Cyanine) 형광분자, 로다민(Rodamine) 형광분자, 알렉사(Alexa) 형광분자, FITC(fluorescein isothiocyanate) 형광분자, FAM(5-carboxy fluorescein) 형광분자 및 텍사스 레드(Texas Red) 형광분자 및 플루오레세인(fluorescein)으로 이루어진 군으로부터 선택된 1 이상인 것을 특징으로 하는, 다중 핵산 바이오마커 탐지용 프로브.
KR1020180055315A 2018-05-15 2018-05-15 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법과 이를 이용한 다중 핵산 프로브 KR102084684B1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020180055315A KR102084684B1 (ko) 2018-05-15 2018-05-15 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법과 이를 이용한 다중 핵산 프로브
PCT/KR2019/005809 WO2019221498A1 (ko) 2018-05-15 2019-05-15 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법과 이를 이용한 다중 핵산 프로브
JP2021514265A JP2021522868A (ja) 2018-05-15 2019-05-15 多重核酸バイオマーカーに結合するための人工塩基配列設計方法及びこれを用いた多重核酸プローブ
US17/055,392 US20210115501A1 (en) 2018-05-15 2019-05-15 Method for designing artificial base sequence for binding to polynucleic acid biomarker, and polynucleic acid probe using same
CN201980042141.0A CN112602154A (zh) 2018-05-15 2019-05-15 设计用于与多核酸生物标志物结合的人工碱基序列以及使用所述人工碱基序列的多核酸探针的方法
EP19803857.2A EP3796321A4 (en) 2018-05-15 2019-05-15 METHOD OF DESIGNING AN ARTIFICIAL BASE SEQUENCE FOR BINDING TO POLYNUCLEAR ACID BIOMARKERS AND POLYNUCLEAR ACID PROBE THEREOF

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180055315A KR102084684B1 (ko) 2018-05-15 2018-05-15 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법과 이를 이용한 다중 핵산 프로브

Publications (2)

Publication Number Publication Date
KR20190130778A KR20190130778A (ko) 2019-11-25
KR102084684B1 true KR102084684B1 (ko) 2020-03-04

Family

ID=68540525

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180055315A KR102084684B1 (ko) 2018-05-15 2018-05-15 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법과 이를 이용한 다중 핵산 프로브

Country Status (6)

Country Link
US (1) US20210115501A1 (ko)
EP (1) EP3796321A4 (ko)
JP (1) JP2021522868A (ko)
KR (1) KR102084684B1 (ko)
CN (1) CN112602154A (ko)
WO (1) WO2019221498A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210127626A (ko) * 2020-04-14 2021-10-22 성균관대학교산학협력단 인공 염기 서열 설계 방법 및 장치와 이를 이용한 프로브

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4883750A (en) * 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US7375198B2 (en) * 1993-10-26 2008-05-20 Affymetrix, Inc. Modified nucleic acid probes
US7117095B2 (en) * 2000-11-21 2006-10-03 Affymetrix, Inc. Methods for selecting nucleic acid probes
AU2002252297A1 (en) * 2001-03-10 2002-09-24 Bioinformatics Dna Codes, Llc Methods and tools for nucleic acid sequence analysis selection and generation
EP1960555A4 (en) * 2005-11-29 2011-09-07 Intelligent Med Devices Inc METHOD AND SYSTEMS FOR CONSTRUCTING PRIMERS AND PROBES
FR2933410B1 (fr) * 2008-07-04 2010-08-20 Biomerieux Sa Nouvelle sonde de detection
US20110039735A1 (en) * 2009-08-13 2011-02-17 Agilent Technologies, Inc. Probe design for oligonucleotide fluorescence in situ hybridization (fish)
US9336349B2 (en) * 2010-07-29 2016-05-10 Takara Bio Inc. Method for producing RNA-containing probe for detecting a target nucleotide
CN102242211A (zh) * 2011-07-08 2011-11-16 无锡锐奇基因生物科技有限公司 检测突变核酸序列的方法及试剂盒
ITUB20159170A1 (it) * 2015-12-24 2017-06-24 Diasorin S P A Metodo basato su calcolatore per la progettazione di un set di primer

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Q.Ma, "Synthetic genetic polymers: advances and applications", Polymer Chemistry, pp.5199-5216, 2016.

Also Published As

Publication number Publication date
US20210115501A1 (en) 2021-04-22
EP3796321A1 (en) 2021-03-24
EP3796321A4 (en) 2022-01-26
JP2021522868A (ja) 2021-09-02
KR20190130778A (ko) 2019-11-25
WO2019221498A1 (ko) 2019-11-21
CN112602154A (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
DeConde et al. Combining results of microarray experiments: a rank aggregation approach
US10266902B2 (en) Methods for prognosis prediction for melanoma cancer
CN104903468B (zh) 用于帕金森氏病的新诊断MiRNA标志物
US20060195266A1 (en) Methods for predicting cancer outcome and gene signatures for use therein
DK2638398T3 (en) Hitherto UNKNOWN MARKET FOR THE DETECTION OF BLADE CANCER AND / OR INFLAMMATORY CONDITIONS IN THE BLADE.
JP2017512304A (ja) バイオマーカーシグネチャー法ならびにそのための装置およびキット
KR20130105764A (ko) 직장결장암용 예후 예측
JP2003021630A (ja) 臨床診断サービスを提供するための方法
US20120178093A1 (en) Methods of assessing a risk of cancer progression
AU2016263590A1 (en) Methods and compositions for diagnosing or detecting lung cancers
CN106399304B (zh) 一种与乳腺癌相关的snp标记
EP2825673A1 (en) Method, kit and array for biomarker validation and clinical use
KR102084684B1 (ko) 다중 핵산 바이오마커에 결합하기 위한 인공 염기서열 설계 방법과 이를 이용한 다중 핵산 프로브
CN107075586B (zh) 用于鉴定多种癌症类型和亚型的糖基转移酶基因表达谱
CN101457254B (zh) 用于肝癌预后的基因芯片和试剂盒
CN113201590A (zh) 用于评估肝细胞癌早期复发风险的lncRNA、评估方法及装置
Hamada et al. Diagnostic usefulness of PCR profiling of the differentially expressed marker genes in thyroid papillary carcinomas
WO2007137366A1 (en) Diagnostic and prognostic indicators of cancer
CN106636351B (zh) 一种与乳腺癌相关的snp标记及其应用
CN106811528B (zh) 一种乳腺癌治病基因新突变及其应用
Wong et al. Identifying patterns of DNA for tumor diagnosis using capillary electrophoresis-amplified fragment length polymorphism (CE-AFLP) screening
DeConde et al. Combining results of microarray experiments: a rank aggregation approach
Kelmansky Where statistics and molecular microarray experiments biology meet
WO2019015549A1 (en) METHOD AND SYSTEM OF CELLULAR TYPE IDENTIFICATION
CN117568469A (zh) 一种用于甲状腺恶性肿瘤和甲状腺良性肿瘤鉴别诊断的甲基化标志物

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant