KR102488671B1 - Dna 연성 정보 연산 방법, 이를 위한 dna 저장 장치 및 이를 위한 프로그램 - Google Patents

Dna 연성 정보 연산 방법, 이를 위한 dna 저장 장치 및 이를 위한 프로그램 Download PDF

Info

Publication number
KR102488671B1
KR102488671B1 KR1020200118384A KR20200118384A KR102488671B1 KR 102488671 B1 KR102488671 B1 KR 102488671B1 KR 1020200118384 A KR1020200118384 A KR 1020200118384A KR 20200118384 A KR20200118384 A KR 20200118384A KR 102488671 B1 KR102488671 B1 KR 102488671B1
Authority
KR
South Korea
Prior art keywords
information
base
equation
soft information
error
Prior art date
Application number
KR1020200118384A
Other languages
English (en)
Other versions
KR20220036447A (ko
Inventor
박호성
박지연
김정현
노혜진
손세희
Original Assignee
전남대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전남대학교산학협력단 filed Critical 전남대학교산학협력단
Priority to KR1020200118384A priority Critical patent/KR102488671B1/ko
Publication of KR20220036447A publication Critical patent/KR20220036447A/ko
Application granted granted Critical
Publication of KR102488671B1 publication Critical patent/KR102488671B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 컴퓨터가 원시 데이터를 획득하는 단계와, 상기 컴퓨터가 상기 원시 데이터(Y)에 대하여 염기 판독 알고리즘을 기반으로 각 염기를 판독하여, 상기 각 염기에 대한 오차(ε)를 계산하는 단계와, 상기 컴퓨터가 상기 각 염기에 대한 오차(ε)를 기반으로, 상기 각 염기에 대한 복수의 연성 정보를 계산하는 단계를 포함하여 이루어지는 DNA 연성 정보 연산 방법, 이를 위한 DNA 저장 장치 및 이를 위한 프로그램에 관한 것이다.
“본 발명은 삼성전자 미래기술육성센터의 지원을 받아 수행된 연구임 (과제번호 SRFC-IT1802-09)”

Description

DNA 연성 정보 연산 방법, 이를 위한 DNA 저장 장치 및 이를 위한 프로그램{METHOD FOR CALCULATING SOFT INFORMATION OF DNA AND DNA STORAGE DEVICE AND PROGRAM}
본 발명은 DNA 저장 및 염기서열 분석에 관한 것으로, 특히 DNA 연성 정보를 연산하는 방법, DNA 저장 장치 및 프로그램에 관한 것이다.
현대 사회에서는 스마트 기기들의 보급, SNS 사용량의 증가 및 IoT 시스템의 보급 등으로 데이터가 넘쳐나고 있으며, 2020년이면 44조 GB 이상의 데이터가 인터넷에 존재할 것으로 예상된다.
이와 같이, 많은 양의 데이터는 일반적으로 하드웨어 장치 자체, 외장 하드 및 웹 하드 등 많은 저장 장치를 이용하여 곳곳에 데이터를 보관하고 있다.
그러나, 이러한 데이터의 보관 방식은 용량이나 비용뿐만 아니라 불편함까지 초래하는 많은 한계들이 있어, 최근 DNA 스토리지 기술에 대한 많은 연구가 이루어지고 있다.
DNA 스토리지 기술이란, DNA의 염기를 0과 1로 치환하여 디지털 데이터를 저장하는 방식으로서, DNA에 유전이 아닌 디지털 데이터를 저장한다면 1g의 DNA에 4550억 GB 정도의 데이터를 저장할 수 있게 되며, 이는 1TB 하드디스크보다 215,000배 더 많은 데이터 저장 능력인 것이다.
따라서 최근, 각 디지털 데이터를 DNA 데이터로 인코딩 하는 방법과 DNA 데이터를 디지털 데이터로 복호화하는 디코딩 방법에 대한 연구가 계속해서 이루어지고 있다.
한편 DNA 염기서열 판독은 핵산의 염기서열(DNA의 뉴클레오타이드의 순서)을 결정하는 과정이다. DNA 염기서열 판독은 아데닌, 구아닌, 사이토신, 티아닌 4가지의 순서를 결정하는 어떠한 방법이나 기술을 포함한다. 빠른 DNA 시퀀싱 방법의 출현은 생물학적, 의학적 연구의 개발을 크게 가속화했다.
DNA 염기서열은 기초적인 생물학적 연구와, 의학적 진단, 생명공학, 법의생물학, 바이러스학, 계통분류학 등의 여러 분야에서 필수적인 개념이 되었다.
정상적인 DNA 염기서열과 변형된 DNA 염기서열의 비교를 통해 다양한 암을 포함한 여러 질병을 진단하고, 항체 목록을 특징짓고, 환자를 치료하는데 지표가 될 수 있다.
이에 따라, DNA 시퀀스를 빠르게 하는 기술이 개발된다면, 더 빠르고 개별적인 의학적 치료를 운영하고, 보다 많은 유기체들을 식별하고 분류할 수 있게 한다.
현대 DNA 염기서열 판독 기술의 빠른 속도는 사람의 유전자와 많은 동물, 식물, 미생물들의 완전한 DNA 염기서열을 시퀀싱하는데 중요한 역할을 한다.
DNA 시퀀스는 2차원의 색층 분석법을 기초로 한 어려운(힘든, 고된) 방법을 사용하여 1970년대 초에 처음으로 얻었다.
DNA 염기서열 분석의 형광 기반 염기서열 판독 방법의 개발에 따라, DNA 염기서열 판독이 더 쉬워지고, 수의 비교가 빨라졌다.
DNA 염기서열 판독은 개별 유전자, 더 큰 유전적 영역(즉, 유전자나 오퍼론의 군집), 전체 염색체 또는 모든 유기체의 게놈의 순서를 결정하는 데 사용될 수 있다.
DNA 염기서열은 RNA나 단백질의 (열린 판독 프레임을 통해) 간접적으로 배열하는 가장 효율적인 방법이다.
사실, DNA 염기서열 판독은 생물학의 많은 분야와 의학, 포렌식, 인류학과 같은 다른 과학에서 핵심 기술이 되었다.
현재까지 염기서열 판독을 통해 생성되는 데이터는 신호 레벨의 원시 데이터, 염기 판독 데이터, 그리고 그 판정이 옳을 확률을 의미하는 품질점수로 구성되어 있다.
이러한 판독 염기서열을 통해 원래의 DNA의 염기서열을 최종적으로 정확히 판정해야 하는데, 각 판독 염기서열에 오류 확률이 존재한다.
판독 염기서열의 수가 충분할 때는 오류가 별 문제가 발생하지 않지만, 판독 염기서열의 수가 작고, 각 판독 염기서열의 품질이 매우 좋지 못한 상황에서 품질점수만으로는 다수 개의 판독 염기서열의 위치 동기 병합의 정확성이 떨어지게 된다.
특히, DNA 저장 장치에서는 염기서열 판독 장비의 최대 판독 염기서열 수가 제한되어 있는데 반해 한 번에 많은 양의 정보를 읽어내는 것이 요구되므로 위치 동기 병합을 위한 판독 염기서열의 수가 충분하지 않아 위와 같은 문제가 발생하게 된다.
대한민국 공개특허공보 제10-2014-0006846호 (2014. 01. 16.)
상술한 바와 같은 문제점을 해결하기 위한 본 발명은, 기존 염기서열 판독 장비에서 제공하는 판독 염기의 품질점수 외에 해당 위치의 4가지 염기에 대한 모든 확률 정보(연성정보)를 획득하여, 판독 염기서열들을 위치 동기 병합하는데 더 정확성이 높이도록 하는 DNA 저장 장치의 연성 정보 연산 방법 및 이를 위한 프로그램을 제공하고자 한다.
또한, 본 발명은, DNA 저장 장치에서는 데이터 오류를 극복하기 위해 오류 정정 부호를 사용하여 부호화하여 데이터를 저장하고, 상기 저장된 데이터에 대해 복호를 수행할 때에 상기 획득된 연성정보를 이용하여 오류 정정 성능을 높이도록 하는 DNA 저장 장치의 연성 정보 연산 방법 및 이를 위한 프로그램을 제공하고자 한다.
상술한 과제를 해결하기 위한 본 발명에 따른 DNA 연성 정보 연산 방법은, 컴퓨터가 원시 데이터를 획득하는 단계와, 상기 컴퓨터가 상기 원시 데이터(Y)에 대하여 염기 판독 알고리즘을 기반으로 각 염기를 판독하여, 상기 각 염기에 대한 오차(ε)를 계산하는 단계와, 상기 컴퓨터가 상기 각 염기에 대한 오차(ε)를 기반으로, 상기 각 염기에 대한 복수의 연성 정보를 계산하는 단계를 포함하여 이루어진다.
이때, 상기 오차(ε)는 이하의 수학식1을 이용하여 계산될 수 있다
[수학식 1]
Figure 112020097830092-pat00001
Y는 하나의 올리고의 모든 염기서열에 대한 측정값이고, λ는 해당 올리고에서 측정값의 크기를 결정하는 상수이고, M은 채널 측정값 간의 상관 관계를 나타내고, S는 원래 해당 올리고의 염기 서열을 나타내고, P는 다른 위치의 염기의 측정값을 나타내며, N은 전체 올리고에 대해 공통적으로 측정되는 잡음 성분을 나타냄.
또한, 상기 복수의 연성 정보는, 상기 각 염기에 대한 확률 정보와 관련된 제1종 연성 정보(
Figure 112020097830092-pat00002
)와, 상기 제1종 연성 정보(
Figure 112020097830092-pat00003
)를 기반으로 올리고(Oligo) 자체의 오류가 고려된 제2종 연성 정보(
Figure 112020097830092-pat00004
)와, 상기 제2종 연성 정보(
Figure 112020097830092-pat00005
) 및 보정된 품질 점수에 기반한 제3종 연성 정보(
Figure 112020097830092-pat00006
)를 포함할 수 있다.
이때, 상기 제1종 연성 정보(
Figure 112020097830092-pat00007
)는, 이하의 수학식2를 이용하여 계산될 수 있다.
[수학식 2]
Figure 112020097830092-pat00008
Figure 112020097830092-pat00009
는 올리고에서
Figure 112020097830092-pat00010
번째 위치한 염기
Figure 112020097830092-pat00011
의 확률이고,
Figure 112020097830092-pat00012
는 염기
Figure 112020097830092-pat00013
에 대한 확률밀도 함수임.
또한, 상기 제2종 연성 정보(
Figure 112020097830092-pat00014
)는, 이하의 수학식3을 이용하여 계산될 수 있다.
[수학식 3]
Figure 112020097830092-pat00015
또한, 상기 제3종 연성 정보(
Figure 112020097830092-pat00016
)는, 이하의 수학식4, 수학식5, 수학식6 및 수학식7을 순차적으로 이용하여 계산될 수 있다.
[수학식 4]
Figure 112020097830092-pat00017
상기
Figure 112020097830092-pat00018
는 염기
Figure 112020097830092-pat00019
의 확률에 대한 품질 점수이고, 염기
Figure 112020097830092-pat00020
임.
[수학식 5]
Figure 112020097830092-pat00021
상기
Figure 112020097830092-pat00022
는 보정된 품질 점수이고,
Figure 112020097830092-pat00023
는 상수이며,
Figure 112020097830092-pat00024
는 앞뒤 위치에서 결정된 염기임.
[수학식 6]
Figure 112020097830092-pat00025
[수학식 7]
Figure 112020097830092-pat00026
또한, 본 발명에 따른 DNA 연성 정보 연산 방법은, 상기 컴퓨터가 양방향 판독 염기서열을 위치 동기 병합 시에, 상기 각 염기에 대한 복수의 연성 정보를 기반으로 병합 판독 염기서열을 결정하여 해당 병합 연성 정보를 계산하는 단계와, 상기 컴퓨터가 상기 계산된 병합 연성 정보의 확률 정보를 계산하는 단계를 더 포함할 수 있다.
이때, 상기 병합 연성 정보의 확률 정보는, 이하의 수학식8을 이용하여 계산될 수 있다.
[수학식 8]
Figure 112020097830092-pat00027
f는 정방향을 나타내고, b는 역방향을 나타내고,
Figure 112020097830092-pat00028
는 양방향에 대한 확률 밀도 함수를 나타냄.
또한, 본 발명은 컴퓨터인 하드웨어와 결합되어, 제1항 내지 제9항 중 어느 한 항의 방법을 실행하기 위해 컴퓨터 판독 가능한 기록매체에 저장된 프로그램을 제공한다.
또한, 본 발명에 따른 DNA 저장 장치는, 획득된 원시 데이터(Y)에 대하여 염기 판독 알고리즘(Y)을 기반으로 각 염기를 판독하고, 상기 판독된 각 염기에 대한 오차(ε)를 계산하는 오차 계산부와, 상기 계산된 각 염기에 대한 오차(ε)를 기반으로, 상기 각 염기에 대한 복수의 연성 정보를 계산하는 연성 정보 계산부와, 상기 오차 계산부가 상기 각 염기에 대한 오차(ε)를 계산하도록 제어하고, 상기 연성 정보 계산부가 상기 복수의 연성 정보를 계산하도록 제어하는 프로세서를 포함하여 이루어진다.
상기와 같은 본 발명에 따르면, DNA의 염기서열을 판독하는데 정확성을 높이게 되고, 실험을 여러 번 반복해야 하는 상황을 방지하며, 특히 여러 번 실험할 수 없는 소량의 DNA를 보유하고 있는 경우에도 본 발명은 실험의 성공/실패를 결정하는 중요한 요소가 되어 시퀀싱 기술의 큰 발전을 가져올 수 있는 효과를 제공한다.
또한, 본 발명에 따르면, DNA 저장 장치에서 데이터를 읽을 때 소량의 판독 시퀀스만을 요구하게 되므로, 데이터를 저장할 때 더 많은 양의 데이터를 저장할 수 있어서 저장 비용이 절감되는 효과를 제공한다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명에 따른 DNA 저장장치의 연성 정보 연산 및 병합 과정을 나타낸 흐름도이다.
도 2는 본 발명에 따른 하나의 올리고의 모든 염기서열에 대한 측정값을 모델링하기 위한 수학식 1을 나타낸 도면이다.
도 3은 본 발명에 따른 제1종 연성 정보를 구하기 위한 수학식 2 및 수학식 3을 나타낸 도면이다.
도 4는 본 발명에 따른 제2종 연성 정보를 구하기 위한 수학식 4를 나타낸 도면이다.
도 5는 본 발명에 따른 3종 연성 정보를 구하기 위한 수학식 5 및 수학식 6을 나타낸 도면이다.
도 6은 본 발명에 따른 병합 연성 정보의 확률 정보를 구하기 위한 수학식 7, 수학식 8 및 수학식 9를 나타낸 도면이다.
도 7은 본 발명에 따른 연성 정보의 연산 및 병합을 수행하는 DNA 저장장치를 나타낸 블록도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
본 명세서에서 본 발명에 따른 DNA 저장장치는 컴퓨터 형태의 디바이스를 포함하고, 상기 컴퓨터는 연산처리를 수행할 수 있는 다양한 장치들이 모두 포함된다. 예를 들어, 컴퓨터는 데스크 탑 PC, 노트북(Note Book) 뿐만 아니라 스마트폰(Smart phone), 태블릿 PC, 셀룰러폰(Cellular phone), 피씨에스폰(PCS phone; Personal Communication Service phone), 동기식/비동기식 IMT-2000(International Mobile Telecommunication-2000)의 이동 단말기, 팜 PC(Palm Personal Computer), 개인용 디지털 보조기(PDA; Personal Digital Assistant) 등도 해당될 수 있다. 또한, 컴퓨터는 클라이언트로부터 정보를 수신하는 서버컴퓨터가 해당될 수도 있다. 또한, 본 발명에 따른 DNA 저장장치의 연성 정보 연산 과정은 상술한 컴퓨터에 의해 모든 동작이 수행될 수 있다.
또한, 이하에서 설명되는 본 발명의 모든 동작들은 프로그램 형태로 구성될 수 있고, 이러한 프로그램은 기록매체나, 컴퓨터를 통해 실행될 수 있다.
본 명세서에서 "4개의 염기 각각"은 아데닌(A, Adenine), 구아닌(G, Guanine), 시토신(C, Cytosine) 및 티민(T, Thymine)를 포함한다.
또한, 본 명세서에서 "해독 염기 서열 파일"은 DNA 염기 서열을 나타내는 텍스트 기반의 표준 염기 데이터 형식의 파일이며, 일 예로 FASTQ 파일을 포함한다.
해독 염기 서열 파일은 강성 정보 및 연성 정보를 포함한다.
강성 정보란, 각 리드(read)의 식별정보(순서, 길이 등), 각 리드의 시퀀스(즉, 염기 서열) 정보를 포함할 수 있다. 연성 정보에 대해서는 이하 상세히 후술한다.
한편, 본 발명은 앞에서 설명된 FASTQ 파일이 아닌, 원시 데이터 파일 (CIF 파일)을 토대로 새로운 방법으로 연성 정보 (염기 확률)를 연산하는 과정에 대해 상세히 설명한다.
즉, 본 발명은 FASTQ 파일을 얻기 전에 시퀀싱 장비에서의 생화학적 동작 절차에 따라 수치들로만 이루어져 있는 원시 데이터 파일 (CIF 파일)을 이용하여 상기 연성 정보를 연산하는 것이다.
본 발명은 하나의 사이클에 하나의 염기 위치에서의 측정값을 모든 올리고(oligo)에 대해 한꺼번에 얻는 경우에 대한 모델 기반 염기 판정을 하는 방법에 기초하여 설명하나, 본 발명의 범위는 이에 국한되지 않고, 일반적인 염기서열 판독 방법으로 측정값을 얻는 경우에 대해 일반적인 염기 판정 방법에 대해서도 동일하게 모두 적용이 가능하다.
본 명세서에서 올리고(oligo)는 특정한 염기(아데닌, 구아닌, 시토신 또는 티민)를 포함하는 복수개의 뉴클레오타이드(nucleotide) 단위체가 합성된 중합체를 의미한다.
이하, 도 1 내지 도 6을 참조하여, 본 발명에 따른 DNA 저장장치의 연성 정보 연산 및 병합 과정에 대해 상세히 설명한다.
도 1은 본 발명에 따른 DNA 저장장치의 연성 정보 연산 및 병합 과정을 나타낸 흐름도이다.
도 1을 참조하면, 컴퓨터는 원시 데이터 파일(CIF)을 획득하고[S110], 이하의 도 2의 과정을 통해 상기 원시 데이터(Y)에 대하여 염기 판독 알고리즘을 기반으로 각 염기를 판독하여, 상기 각 염기에 대한 오차(ε)를 계산한다[S120].
이때, 원시 데이터 파일 내의 하나의 올리고의 모든 염기서열에 대한 측정값은 이하의 도 2에 도시된 수학식 1에 기반하여 컴퓨터에 의해 모델링될 수 있다.
도 2는 본 발명에 따른 하나의 올리고의 모든 염기서열에 대한 측정값을 모델링하기 위한 수학식 1을 나타낸 도면이다.
도 2를 참조하면, Y는 원시 데이터로써, (채널의 수) × (사이클) 크기를 갖는 행렬로 염기서열에 대한 측정값을 나타낸다.
λ는 해당 올리고에서 측정값의 크기를 결정하는 상수를 나타낸다.
M은 (채널의 수) × (염기의 종류=4) 크기를 갖는 행렬로써, 채널 측정값 간의 상관 관계를 나타내며 전체 올리고에 대해 동일한 값으로 적용된다.
S는 (염기의 종류=4) × (판독하고자 하는 염기의 수) 크기를 갖는 행렬로써, 원래 해당 올리고의 염기 서열을 나타낸다.
P는 (판독하고자 하는 염기의 수) × (사이클) 크기를 갖는 행렬로써, 사이클마다 해당 위치가 아닌 다른 위치의 염기의 측정값을 얻게 되는 경우를 모델링하고, 전체 올리고에 대해 동일한 값으로 적용된다.
N은 (채널의 수) × (사이클) 크기를 갖는 행렬로써, 전체 올리고에 대하여 시스템에서 공통적으로 측정되는 잡음 성분을 나타낸다.
ε은 (채널의 수) × (사이클) 크기를 갖는 행렬으로 S, N, P, M, λ를 최대한 정확히 추정했음에도 불구하고, 해당 올리고에 대한 측정값이 정확히 모델링되지 않아 발생하는 오차를 나타낸다.
하나의 올리고에 대한 염기서열 판독은 Y가 측정되었을 때 N, P, M, λ를 최대한 정확히 추정하여, S가 원래의 해당 올리고의 염기서열과 일치하도록 하는 과정이며, 이때 ε는 오차에 해당하므로 염기 결정이 정확할 확률을 얻는데 사용된다.
결정된 염기뿐 아니라 그 외의 3가지 염기에 대해서도 동일한 방법으로 확률을 얻을 수 있으며, 이에 대한 방법은 다음과 같이 설명된다.
그 다음으로, 컴퓨터는 상기 각 염기에 대한 오차(ε)를 기반으로, 상기 각 염기에 대한 복수의 연성 정보인 제1종 내지 제3종 연성 정보를 계산한다[S130].
이하, 도 3 내지 도 5를 참조하여, 본 발명에 따른 제1종 내지 제3종 연성 정보의 계산 과정에 대해 상세히 설명한다.
도 3은 본 발명에 따른 제1종 연성 정보를 구하기 위한 수학식 2 및 수학식 3을 나타낸 도면이다.
도 3의 (a) 및 (b)를 참조하면, 올리고에서 i번째 위치에 대한 염기 χ∈{A,C,G,T}의 확률을 Pi,x라고 하고, 평균 오차 제곱을 Li,x라고 한다.
이때, 염기 결정 방법에 따라 염기 x에 대한 확률밀도 함수 fi,x를 Li,x로 표현할 수 있으며, 4가지 염기에 대해 이러한 표현은 동일하다.
만일 오차 ε이 타원형 분포를 가지는 경우 도 3의 (a)에 도시된 수학식 2로 표현된다. 여기서 n은 타원형의 차원을 의미한다.
그러면 확률 Pi,x는 도 3의 (b)에 도시된 수학식 3과 같이 표현된다.
즉, 본 발명에서는 각 염기에 대해서 이렇게 얻은 확률 정보를 제1종 연성정보라고 명칭하여 설명하고, Pi,x (1)로 표기하며, 수학식 3을 이용하여 계산한다.
이러한, 제1종 연성 정보는 염기서열 판독을 시도하는 올리고 자체에는 오류가 없다는 가정 하에 정확할 수 있지만, 올리고 자체의 오류 확률을 고려하지 않았다. 올리고 자체의 오류는 올리고 합성 단계와 중합 연쇄 반응을 통한 올리고 증폭 과정에서 나타날 수 있다.
도 4는 본 발명에 따른 제2종 연성 정보를 구하기 위한 수학식 4를 나타낸 도면이다.
도 4에 도시된 바와 같이, 모든 위치에 대해 원래의 염기가 다른 3개의 염기로 바뀌었을 오류 확률을 각각 p/3으로 모델링하면, 해당 염기에 오류가 발생되지 않을 확률은 1-p/3이 된다.
이때, 올리고 자체의 오류까지 고려한 확률 정보를 제2종 연성 정보라고 하고, Pi,x (2)로 표기하며, 수학식 4를 이용하여 계산한다.
마지막으로 이론과 실제 실험 상의 불일치를 보완하기 위하여 확률 정보를 보정할 수 있는데, 상기 확률 정보를 보정하는 방법은 각 염기 결정 방법에서 다르게 정의한다. 이러한 보정은 이하의 도 5에 도시된 수학식 5 및 수학식 6를 참조하여 수행될 수 있다.
도 5는 본 발명에 따른 제3종 연성 정보를 구하기 위한 수학식 5 및 수학식 6을 나타낸 도면이다.
도 5의 (a)에 도시된 수학식 5와 같이 결정된 염기 bi에 대해서만 해당 확률을 품질 점수 Qi로 변환한 후 수행하게 되며, 보정된 품질 점수를 Qi cal로 표기한다.
아래 식과 같이 결정된 염기 bi에 대해서만 해당 확률을 품질 점수 Qi로 변환한 후 수행하게 되며 보정된 품질 점수를 Qi cal로 표기하며, 수학식 5를 이용하여 계산한다.
이때, 도 5의 (a)에 도시된 수학식 5에서,α,β 상수들은 각 염기 결정 방법에서 정의하는 값을 나타내며, bi-1, bi+1는 앞뒤 위치에서 결정된 염기를 나타낸다.
그리고, 도 5의 (b)에 도시된 바와 같이, 보정된 품질 점수(Qi cal)를 기반으로 제3종 연성 정보를 수학식 6을 이용하여 계산한다. 이때, 수학식 6은 결정된 염기를 제외한 염기 χ≠bi에 대한 수학식이다.
한편 염기서열 판독은 많은 경우 양방향으로 이루어지게 되고, 양방향 판독 결과를 위치 동기 병합하여 해당 올리고를 판정하게 된다.
이때, 위치 동기 병합 알고리즘은 양방향 판독이 중첩되는 위치들의 시작 지점과 종료 지점을 찾고, 중첩되는 염기들에 대해서 최종 판정을 내리게 된다.
본 발명에서는 중첩되는 위치들에 대해 연성 정보인 4가지 확률 정보를 가지고 있으므로, 중첩되는 하나의 위치에 대해서 두 연성 정보들을 병합하는 방법을 기술한다.
상기 병합 방법은 상기 기술된 제1종 연성 정보에 대한 것이며, 병합 후 얻는 연성 정보도 제1종이므로 병합 후 제2종, 제3종의 연성 정보를 얻는 방법은 상기 기술된 방법과 동일한 방법으로 얻을 수 있다.
즉, 컴퓨터는 양방향 판독 염기서열을 위치 동기 병합 시에, 상기 각 염기에 대한 복수의 연성 정보를 기반으로 병합 판독 염기서열을 결정하여 해당 병합 연성 정보를 계산하고[S140], 상기 계산된 병합 연성 정보의 확률 정보를 계산한다[S150].
이하, 도 6을 참조하여, 본 발명의 S140 및 S150 과정에 대해 상세히 설명한다.
도 6은 본 발명에 따른 병합 연성 정보의 확률 정보를 구하기 위한 수학식 7, 수학식 8 및 수학식 9를 나타낸 도면이다.
도 6의 (a)의 수학식 7을 참조하면, 위 첨자 (f)는 정방향을 나타내고, 위 첨자 (b)는 역방향을 나타내고, 중첩되는 하나의 위치에 대해 두 개의 오차 ε(f), ε(b)가 존재하고, 이들은 독립적인 특성을 가진다.
이에 따라, 도 6의 (b)의 수학식 8과 같이, 평균 오차 제곱인 Li,x (f), Li,x (b)도 독립적은 특성을 가지므로 평균 오차 제곱의 합 Li,x (fb) = Li,x (f) + Li,x (b)으로 수학식 7을 이용하여 확률 밀도 함수(fi,x (fb))를 계산할 수 있다. 여기서 연산자 *는 컨벌루션을 의미한다.
그리고, 도 6의 (c)에 도시된 바와 같이, 양방향 측정값을 바탕으로 병합한 확률 정보를 수학식 9를 이용하여 계산한다.
그 다음으로, 컴퓨터는 상기 계산된 확률 정보를 바탕으로 복호기 입력으로 사용할 연성 정보를 계산하고, 연성 정보 기반으로 데이터 복호화한다[S160].
도 7은 본 발명에 따른 연성 정보의 연산 및 병합을 수행하는 DNA 저장 장치를 나타낸 블록도이다.
도 7을 참조하면, 본 발명에 따른 DNA 저장 장치(700)는, 오차 계산부(710), 연성 정보 계산부(720), 복호부(730) 및 프로세서(740)를 포함하여 이루어진다.
프로세서(740)는 오차 계산부(710), 연성 정보 계산부(720) 및 복호부(730)의 모든 동작을 제어하고, 앞서 설명된 도 1 내지 도 6의 모든 동작 과정을 자체적으로 수행하거나 또는 오차 계산부(710), 연성 정보 계산부(720) 및 복호부(730)를 제어하여 각각 해당 동작을 수행할 수 있다.
오차 계산부(710)는 프로세서(740)의 제어에 따라, 획득된 원시 데이터(
Figure 112020097830092-pat00029
)에 대하여 염기 판독 알고리즘을 기반으로 각 염기를 판독하고, 앞서 설명한 수학식 1을 이용하여 도 2의 설명과 동일한 과정을 수행하여 상기 각 염기에 대한 오차(
Figure 112020097830092-pat00030
)를 계산한다.
연성 정보 계산부(720)는 앞서 설명한 수학식 2 내지 6을 이용하여 앞서 설명한 도 3 내지 도 5의 설명과 동일한 과정을 수행하여, 프로세서(740)의 제어에 따라, 오차 계산부(710)를 통해 계산된 상기 각 염기에 대한 오차(ε)를 기반으로, 상기 각 염기에 대한 복수의 연성 정보인 제1종 내지 제3종 연성 정보를 계산한다.
프로세서(740)는 앞서 설명한 수학식 7 내지 9를 이용하여 앞서 설명한 도 6의 설명과 동일한 과정을 수행하여, 양방향 판독 염기서열을 위치 동기 병합 시에, 상기 각 염기에 대한 복수의 연성 정보를 기반으로 병합 판독 염기서열을 결정하여 해당 병합 연성 정보를 계산하고, 상기 계산된 병합 연성 정보의 확률 정보를 계산한다.
그리고, 프로세서(740)는 상기 계산된 확률 정보를 바탕으로 복호부(730)의 입력으로 사용할 연성 정보를 계산하고, 복호부(740)가 연성 정보 기반으로 데이터를 복호하도록 제어한다.
이상, 본 발명에 따른 DNA 연성 정보 연산 방법, DNA 저장 장치 및 프로그램은, 양방향 측정값에 대한 위치 동기 병합에서 사용될 뿐 아니라, 염기서열 판독 결과들을 클러스터링하여 클러스터 내의 복수의 판독 염기서열을 위치 동기 병합할 때에도 해당 연성 정보에 대해서 동일하게 적용될 수 있다.
본 발명의 실시예와 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다.
이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.
700 : DNA 저장 장치 710: 오차 계산부
720: 연성 정보 계산부 730: 복호부
740: 프로세서

Claims (14)

  1. 컴퓨터에 의해 수행되는 방법에 있어서,
    상기 컴퓨터가 원시 데이터를 획득하는 단계;
    상기 컴퓨터가 상기 원시 데이터(Y)에 대하여 염기 판독 알고리즘을 기반으로 각 염기를 판독하여, 상기 각 염기에 대한 오차(ε)를 계산하는 단계;
    상기 컴퓨터가 상기 각 염기에 대한 오차(ε)를 기반으로, 상기 각 염기에 대한 복수의 연성 정보를 계산하는 단계;
    상기 컴퓨터가 양방향 판독 염기서열을 위치 동기 병합 시에, 상기 각 염기에 대한 복수의 연성 정보를 기반으로 병합 판독 염기서열을 결정하여 해당 병합 연성 정보를 계산하는 단계; 및
    상기 컴퓨터가 상기 계산된 병합 연성 정보의 확률 정보를 계산하는 단계;를 포함하고,
    상기 병합 연성 정보의 확률 정보는, 이하의 수학식8을 이용하여 계산되는, DNA 연성 정보 연산 방법.
    [수학식 8]
    Figure 112022128529397-pat00071

    f는 정방향을 나타내고, b는 역방향을 나타내고,
    Figure 112022128529397-pat00072
    는 양방향에 대한 확률 밀도 함수를 나타냄.
  2. 제1항에 있어서, 상기 오차(ε)는, 이하의 수학식1을 이용하여 계산되는, DNA 연성 정보 연산 방법.
    [수학식 1]
    Figure 112020097830092-pat00031

    Y는 하나의 올리고의 모든 염기서열에 대한 측정값이고, λ는 해당 올리고에서 측정값의 크기를 결정하는 상수이고, M은 채널 측정값 간의 상관 관계를 나타내고, S는 원래 해당 올리고의 염기 서열을 나타내고, P는 다른 위치의 염기의 측정값을 나타내며, N은 전체 올리고에 대해 공통적으로 측정되는 잡음 성분을 나타냄.
  3. 제1 항에 있어서, 상기 복수의 연성 정보는,
    상기 각 염기에 대한 확률 정보와 관련된 제1종 연성 정보(
    Figure 112020097830092-pat00032
    );
    상기 제1종 연성 정보(
    Figure 112020097830092-pat00033
    )를 기반으로 올리고(Oligo) 자체의 오류가 고려된 제2종 연성 정보(
    Figure 112020097830092-pat00034
    ); 및
    상기 제2종 연성 정보(
    Figure 112020097830092-pat00035
    ) 및 보정된 품질 점수에 기반한 제3종 연성 정보(
    Figure 112020097830092-pat00036
    )를 포함하는, DNA 연성 정보 연산 방법.
  4. 제3 항에 있어서,
    상기 제1종 연성 정보(
    Figure 112020097830092-pat00037
    )는, 이하의 수학식2를 이용하여 계산되는, DNA 연성 정보 연산 방법.
    [수학식 2]
    Figure 112020097830092-pat00038

    Figure 112020097830092-pat00039
    는 올리고에서
    Figure 112020097830092-pat00040
    번째 위치한 염기
    Figure 112020097830092-pat00041
    의 확률이고,
    Figure 112020097830092-pat00042
    는 염기
    Figure 112020097830092-pat00043
    에 대한 확률밀도 함수임.
  5. 제4 항에 있어서,
    상기 제2종 연성 정보(
    Figure 112020097830092-pat00044
    )는, 이하의 수학식3을 이용하여 계산되는, DNA 연성 정보 연산 방법.
    [수학식 3]
    Figure 112020097830092-pat00045
  6. 제5 항에 있어서,
    상기 제3종 연성 정보(
    Figure 112020097830092-pat00046
    )는, 이하의 수학식4, 수학식5, 수학식6 및 수학식7을 순차적으로 이용하여 계산되는, DNA 연성 정보 연산 방법.
    [수학식 4]
    Figure 112020097830092-pat00047

    상기
    Figure 112020097830092-pat00048
    는 염기
    Figure 112020097830092-pat00049
    의 확률에 대한 품질 점수이고, 염기
    Figure 112020097830092-pat00050
    임.
    [수학식 5]
    Figure 112020097830092-pat00051

    상기
    Figure 112020097830092-pat00052
    는 보정된 품질 점수이고,
    Figure 112020097830092-pat00053
    는 상수이며,
    Figure 112020097830092-pat00054
    는 앞뒤 위치에서 결정된 염기임.
    [수학식 6]
    Figure 112020097830092-pat00055

    [수학식 7]
    Figure 112020097830092-pat00056
  7. 삭제
  8. 삭제
  9. 삭제
  10. 컴퓨터인 하드웨어와 결합되어, 제1항 내지 제6항 중 어느 한 항의 방법을 실행하기 위해 컴퓨터 판독 가능한 기록매체에 저장된 프로그램.
  11. 획득된 원시 데이터(Y)에 대하여 염기 판독 알고리즘을 기반으로 각 염기를 판독하고, 상기 판독된 각 염기에 대한 오차(ε)를 계산하는 오차 계산부;
    상기 계산된 각 염기에 대한 오차(ε)를 기반으로, 상기 각 염기에 대한 복수의 연성 정보를 계산하는 연성 정보 계산부; 및
    상기 오차 계산부가 상기 각 염기에 대한 오차(ε)를 계산하도록 제어하고, 상기 연성 정보 계산부가 상기 복수의 연성 정보를 계산하도록 제어하는 프로세서;를 포함하고,
    상기 프로세서는,
    양방향 판독 염기서열을 위치 동기 병합 시에, 상기 각 염기에 대한 복수의 연성 정보를 기반으로 병합 판독 염기서열을 결정하여 해당 병합 연성 정보를 계산하고, 및
    상기 계산된 병합 연성 정보의 확률 정보를 계산하며,
    상기 병합 연성 정보의 확률 정보는, 이하의 수학식8을 이용하여 계산되는, DNA 저장 장치.
    [수학식 8]
    Figure 112022128529397-pat00073

    f는 정방향을 나타내고, b는 역방향을 나타내고,
    Figure 112022128529397-pat00074
    는 양방향에 대한 확률 밀도 함수를 나타냄.
  12. 제11 항에 있어서, 상기 복수의 연성 정보는,
    상기 각 염기에 대한 확률 정보와 관련된 제1종 연성 정보(
    Figure 112020097830092-pat00059
    );
    상기 제1종 연성 정보(
    Figure 112020097830092-pat00060
    )를 기반으로 올리고(Oligo) 자체의 오류가 고려된 제2종 연성 정보(
    Figure 112020097830092-pat00061
    ); 및
    상기 제2종 연성 정보(
    Figure 112020097830092-pat00062
    ) 및 보정된 품질 점수에 기반한 제3종 연성 정보(
    Figure 112020097830092-pat00063
    )를 포함하는, DNA 저장 장치.
  13. 삭제
  14. 삭제
KR1020200118384A 2020-09-15 2020-09-15 Dna 연성 정보 연산 방법, 이를 위한 dna 저장 장치 및 이를 위한 프로그램 KR102488671B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200118384A KR102488671B1 (ko) 2020-09-15 2020-09-15 Dna 연성 정보 연산 방법, 이를 위한 dna 저장 장치 및 이를 위한 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200118384A KR102488671B1 (ko) 2020-09-15 2020-09-15 Dna 연성 정보 연산 방법, 이를 위한 dna 저장 장치 및 이를 위한 프로그램

Publications (2)

Publication Number Publication Date
KR20220036447A KR20220036447A (ko) 2022-03-23
KR102488671B1 true KR102488671B1 (ko) 2023-01-13

Family

ID=80963507

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200118384A KR102488671B1 (ko) 2020-09-15 2020-09-15 Dna 연성 정보 연산 방법, 이를 위한 dna 저장 장치 및 이를 위한 프로그램

Country Status (1)

Country Link
KR (1) KR102488671B1 (ko)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2823061A1 (en) 2010-12-29 2012-07-05 Dow Agrosciences Llc Data analysis of dna sequences

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Ashley Cacho 외, A Comparison of Base-calling Algorithms for Illumina Sequencing Technology, Briefings in Bioinformatics, 2015.10.05., Vol.17, No.5, pp.786-795.
Chengxi Ye 외, BlindCall: ultra-fast base-calling of high-throughput sequencing data by blind deconvolution, Bioinformatics, 2014.01.09., Vol.30, No.9, pp.1214-1219.
Meinolf Blawat 외, Forward Error Correction for DNA Data Storage, Procedia Computer Science, 2016.06.08., Vol.80, pp.1011-1022.
Tim Massingham 외, All Your Base: a fast and accurate probabilistic approach to base calling, Genome Biology, 2012.02.29., Vol.13, No.R13, pp.1-15.*

Also Published As

Publication number Publication date
KR20220036447A (ko) 2022-03-23

Similar Documents

Publication Publication Date Title
US11560598B2 (en) Systems and methods for analyzing circulating tumor DNA
US11697835B2 (en) Systems and methods for epigenetic analysis
US20230357842A1 (en) Systems and methods for mitochondrial analysis
US20210217490A1 (en) Method, computer-accessible medium and system for base-calling and alignment
US8725422B2 (en) Methods for estimating genome-wide copy number variations
US10192026B2 (en) Systems and methods for genomic pattern analysis
US9165109B2 (en) Sequence assembly and consensus sequence determination
US20230238081A1 (en) Artificial intelligence analysis of rna transcriptome for drug discovery
US20160117444A1 (en) Methods for determining absolute genome-wide copy number variations of complex tumors
CN104169927A (zh) 紧凑的下一代测序数据集及使用其的高效测序处理
CN116741397B (zh) 基于多组学数据融合的癌症分型方法、系统及存储介质
US20180247016A1 (en) Systems and methods for providing assisted local alignment
US20200105375A1 (en) Models for targeted sequencing of rna
KR102488671B1 (ko) Dna 연성 정보 연산 방법, 이를 위한 dna 저장 장치 및 이를 위한 프로그램
Ng Recent developments in expectation‐maximization methods for analyzing complex data
Majoros et al. Modeling the evolution of regulatory elements by simultaneous detection and alignment with phylogenetic pair HMMs
CN111164701A (zh) 针对靶标定序的定点噪声模型
Huang et al. Reveel: large-scale population genotyping using low-coverage sequencing data
Cascitti et al. RNACache: A scalable approach to rapid transcriptomic read mapping using locality sensitive hashing
CN113234835A (zh) 预后相关基因及风险模型预测胰腺癌预后的应用
EP4138003A1 (en) Neural network for variant calling
Liu et al. Imputation approaches and quality standards for single-cell epigenetic age predictions
KR20230134429A (ko) 무세포 dna를 이용한 암 진단 장치 및 그 방법
Lutteropp Error-profile-aware correction of next generation sequencing reads
CN113322323A (zh) 胰腺癌预后诊断模型的构建方法及应用

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant