KR20200098475A - 생물학적 표적과 연관된 정량화에서 표적 연관 분자를 이용한 서열분석 출력값 측정 및 분석 - Google Patents

생물학적 표적과 연관된 정량화에서 표적 연관 분자를 이용한 서열분석 출력값 측정 및 분석 Download PDF

Info

Publication number
KR20200098475A
KR20200098475A KR1020207006309A KR20207006309A KR20200098475A KR 20200098475 A KR20200098475 A KR 20200098475A KR 1020207006309 A KR1020207006309 A KR 1020207006309A KR 20207006309 A KR20207006309 A KR 20207006309A KR 20200098475 A KR20200098475 A KR 20200098475A
Authority
KR
South Korea
Prior art keywords
target
sequence
abundance
region
molecules
Prior art date
Application number
KR1020207006309A
Other languages
English (en)
Other versions
KR102372572B1 (ko
Inventor
데이비드 타오
오구즈한 아타이
Original Assignee
빌리언투원, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 빌리언투원, 인크. filed Critical 빌리언투원, 인크.
Publication of KR20200098475A publication Critical patent/KR20200098475A/ko
Application granted granted Critical
Publication of KR102372572B1 publication Critical patent/KR102372572B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/101Sanger sequencing method, i.e. oligonucleotide sequencing using primer elongation and dideoxynucleotides as chain terminators

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

방법 및/또는 시스템의 실시양태는 하나 이상의 생물학적 표적과 연관된 표적 연관 분자(예컨대, 스파이크 인 분자)의 세트를 생성하는 단계; 하나 이상의 생물학적 표적을 포함하는 하나 이상의 샘플과 표적 연관 분자의 세트의 프로세싱에 기초하여 하나 이상의 스파이크 인 혼합물을 생성하는 단계; 하나 이상의 스파이크 인 혼합물에 대해 하나 이상의 생어 서열분석 작동을 수행하는 단계; 하나 이상의 생어 서열분석 작동으로부터의 크로마토그램 관련 출력값에 기초하여 하나 이상의 존재량 메트릭을 측정하는 단계; 및/또는 하나 이상의 존재량 메트릭에 기초하여 하나 이상의 의학적 병태의 특징화를 용이하게 하는 단계를 포함할 수 있다.

Description

생물학적 표적과 연관된 정량화에서 표적 연관 분자를 이용한 서열분석 출력값 측정 및 분석
관련 출원에 대한 상호 참조
본 출원은 2017년 8월 4일 출원된 미국 가출원 시리얼 번호 제62/541,565호의 이익을 주장하며, 상기 가출원은 그 전문이 본원에서 참조로 포함된다.
기술분야
본 개시내용은 게놈학 분야에 관한 것이다.
도면의 간단한 설명
도 1a-1c는 방법의 실시양태의 변형을 대표적으로 나타낸 흐름도를 포함하고;
도 2는 방법의 실시양태의 변형을 개략적으로 나타낸 개략도를 포함하고;
도 3은 표적 서열, 표적 연관 서열, 및 연관 프라이머의 구체적인 예를 포함하고;
도 4는 헤어핀 서열을 포함하는 PCR 프라이머의 구체적인 예를 포함하고;
도 5a-5e는 방법의 실시양태의 변형에서 헤어핀 서열을 포함하는 PCR 프라이머를 이용한 증폭으로부터 얻은 생성물의 구체적인 예를 포함하고;
도 6a-6b는 크로마토그램 관련 출력값 및 존재량 메트릭의 구체적인 예를 포함하고;
도 7a-7b는 크로마토그램 관련 출력값 및 존재량 메트릭의 구체적인 예를 포함하고;
도 8은 방법의 실시양태의 변형을 개략적으로 나타낸 개략도를 포함하고;
도 9는 방법의 실시양태의 변형을 개략적으로 나타낸 개략도를 포함하고;
도 10은 방법의 실시양태의 변형의 일부분을 그래프로 나타낸 대표도를 포함하고;
도 11은 표적 서열 및 표적 연관 서열의 구체적인 예를 포함하고;
도 12a-12b는 방법의 실시양태의 변형의 일부분의 검증으로부터 얻은 결과를 그래프로 나타낸 대표도를 포함하고;
도 13a-13b는 방법의 실시양태의 변형의 일부분을 개략적으로 나타낸 개략도를 포함한다.
실시양태 설명
(예컨대, 실시양태의 변형, 실시양태의 예, 실시양태의 구체적인 예, 다른 적합한 변형 등을 포함하는) 하기의 실시양태에 관한 설명은 이러한 실시양태로 제한하고자 하는 것이 아니라, 당업자가 제조 및 사용할 수 있도록 하는 것으로 의도되는 것이다.
1. 개요.
도 1a-1c 및 2에 제시된 바와 같이, (예컨대, 생물학적 표적 존재량을 측정하기 위한; 하나 이상의 병태의 특징화 용이 등을 위한) 방법(100)의 실시양태는 하나 이상의 생물학적 표적과 연관된 표적 연관 분자 (예컨대, 스파이크 인(spike-in) 분자 등) 세트를 생성하는 단계(S110); (예컨대, 하나 이상의 생물학적 표적 등을 포함하는, 하나 이상의 샘플, 예컨대, 생물학적 샘플 및/또는 합성 샘플을 이용하여 표적 연관 분자의 세트를 프로세싱하는 것에 기초하여) 하나 이상의 스파이크 인 혼합물을 생성하는 단계(S120)로서, 예컨대, 여기서, 하나 이상의 스파이크 인 혼합물은 (예컨대, 하나 이상의 생물학적 표적 등과 표적 연관 분자의 동시 증폭에 기초하여, 예컨대, 비록 증폭 편향성은 최소화시키지만) 증가된 정확도, 및/또는 (예컨대, 서열분석 기술, 예컨대, 생어 서열분석(Sanger sequencing) 등과의 을 양립성을 통한) 증가된 구현 가능성을 촉진시킬 수 있도록 구성될 수 있는 것인 단계; 예컨대, 하나 이상의 스파이크 인 혼합물에 기초하여 하나 이상의 서열분석 작동(예컨대, 생어 서열분석 등)을 수행하는 단계(S130); 및/또는 예컨대, 하나 이상의 스파이크 인 혼합물에 대한 하나 이상의 서열분석 작동에 기초하여 (예컨대, 내인성 염기와 스파이크 인 염기 사이의 상대적인 크로마토그램 피크 강도 등에 기초하여) 하나 이상의 존재량 메트릭(예컨대, 표적 연관 분자 대비 표적 분자의 존재량 비)를 측정하는 단계(S140)를 포함할 수 있다.
추가로 또는 대안적으로, 방법(100)의 실시양태는 참조 연관 분자의 세트를 프로세싱하는 단계(S115)(예컨대, 샘플 중 참조 분자와 연관된 것으로, 여기서, 참조 연관 분자의 세트와 관련하여 측정된 존재량 메트릭은, 하나 이상의 병태에 대한 특징화 및/또는 치료를 용이하게 하기 위해 표적 관련 존재량 메트릭과 비교할 수 있다); 예컨대, 하나 이상의 존재량 메트릭에 기초하여 하나 이상의 병태의 특징화를 용이하게 하는 단계(S150); (예컨대, 하나 이상의 존재량 메트릭 등에 기초하여 하나 이상의 병태의) 치료를 용이하게 하는 단계(S160); 및/또는 검증하는 단계(S105), 예컨대, 방법(100)의 실시양태의 하나 이상의 일부분을 검증하는 단계; 및/또는 임의의 다른 적합한 프로세스 중 하나 이상의 것을 포함할 수 있다.
구체적인 예에서, (예컨대, 임신부와 연관된 모체 샘플 등으로부터 유전적 장애, 예컨대, 하나 이상의 염색체 장애 및/또는 단일 유전자 장애에 관한 산전 진단을 용이하게 하는) 방법(100)은 생물학적 표적의 표적 서열의 표적 서열 영역과 서열 유사성을 갖는 표적 연관 영역; 및 표적 서열의 서열 영역과 서열 비유사성을 갖는 표적 변이 영역을 포함하는 표적 연관 서열을 포함하는 표적 연관 분자의 세트를 생성하는 단계로서, 여기서, 생물학적 표적은 유전적 장애와 연관되는 것인 단계; 표적 연관 분자의 세트 및 모체 샘플로부터 핵산 분자를 동시 증폭시키는 것에 기초하여 동시 증폭된 스파이크 인 혼합물을 생성하는 단계로서, 여기서, 핵산 분자는 표적 서열 영역을 포함하는 것인 단계; 동시 증폭된 스파이크 인 혼합물에 대해 생어 서열분석하여 표적 연관 영역, 생물학적 표적의 표적 서열 영역, 표적 변이 영역, 및 생물학적 표적의 서열 영역과 연관된 피크를 포함하는 적어도 하나의 크로마토그램 관련 출력값(예컨대, 크로마토그램, 염기에 상응하는 피크, 피크 강도 등); 표적 연관 존재량 비(및/또는 다른 적합한 존재량 메트릭 등)의 세트를 측정하는 단계로서, 여기서, 표적 연관 존재량 비의 세트의 각 표적 연관 존재량 비는 표적 연관 서열의 염기 및 표적 서열의 염기의 상이한 쌍에 상응하고(여기서, 상기 쌍의 염기는 동일한 염기 유형을 공유하고; 여기서, 상기 쌍의 염기는 상이한 염기 유형을 공유한다), 여기서, 표적 연관 존재량 비의 세트를 측정하는 것은 각각의 상이한 쌍에 대하여: 적어도 하나의 크로마토그램 관련 출력값에 기초하여 (예컨대, 생어 서열분석 등에 기초하여 측정된, 피크에 대한 강도 값에 기초하여) 상기 쌍의 표적 연관 서열의 염기에 대한 피크 강도 메트릭(예컨대, 피크에 대한 최대 강도; 피크에 대한 전체 강도 등)을 측정하는 것; 적어도 하나의 크로마토그램 관련 출력값에 기초하여 상기 쌍의 표적 서열의 염기에 대한 피크 강도 메트릭을 측정하는 것; 및 표적 연관 서열의 염기에 대한 피크 강도 메트릭 및 표적 서열의 염기에 대한 피크 강도 메트릭에 기초하여 표적 연관 존재량 비의 세트의 표적 연관 존재량 비(예컨대, 표적 서열의 염기에 대한 피크 강도 메트릭 대 표적 연관 분자 서열의 염기에 대한 피크 강도 메트릭의 비 등)를 측정하는 것을 포함하는 것인 단계; 표적 연관 존재량 비의 세트에 기초하여 전체 표적 연관 존재량 비를 측정하는 단계; 및/또는 전체 표적 연관 존재량 비와, 참조 연관 분자에 대한 생물학적 참조의 존재량을 설명하는 참조 연관 전체 존재량 비(및/또는 다른 적합한 참조 연관 존재량 메트릭 등) 사이의 비교에 기초하여 유전적 장애의 산전 진단을 용이하게 하는 단계를 포함할 수 있다.
구체적인 예에서, (예컨대, 표적 분자를 포함하는 샘플 등으로부터의 의학적 병태, 예컨대, 하나 이상의 유전적 장애 및/또는 암 병태의 특징화를 용이하게 하는) 방법(100)은 생물학적 표적의 표적 서열의 표적 서열 영역과 서열 유사성을 갖는 표적 연관 영역; 및 표적 서열의 서열 영역과 서열 비유사성을 갖는 표적 변이 영역을 포함하는 표적 연관 서열을 포함하는 표적 연관 분자의 세트를 생성하는 단계로서, 여기서, 생물학적 표적은 유전적 장애와 연관되는 것인 단계; 표적 연관 분자의 세트 및 표적 서열을 포함하는 표적 분자에 기초하여 생어 서열분석을 수행함으로써 표적 연관 영역, 생물학적 표적의 표적 서열 영역, 표적 변이 영역, 및 생물학적 표적의 서열 영역과 연관된 피크의 세트를 포함하는 적어도 하나의 크로마토그램 관련 출력값을 측정하는 단계; 적어도 하나의 크로마토그램 관련 출력값의 피크의 세트에 기초하여 상이한 염기쌍의 세트에 대한 표적 연관 존재량 비(및/또는 다른 적합한 존재량 메트릭 등)의 세트를 측정하는 단계로서, 여기서, 상이한 염기쌍의 세트로부터의 각각의 상이한 염기쌍은 표적 연관 서열의 염기와 표적 서열의 염기의 쌍에 상응하는 것인 단계; 및/또는 표적 연관 존재량 비의 세트 및 참조 연관 분자에 대한 생물학적 참조의 존재량을 설명하는 참조 연관 전체 존재량 비(및/또는 다른 적합한 참조 연관 존재량 메트릭 등)에 기초하여 의학적 병태의 특징화(예컨대, 검출, 진단 등)를 용이하게 하는 단계(예컨대, 전체 표적 연관 존재량 비와 전체 참조 연관 존재량 비 사이의 비교에 기초하여 특징화를 용이하게 하는 단계로서; 여기서, 전체 표적 연관 존재량 비는 표적 연관 존재량 비의 세트의 조합에 기초하여 측정될 수 있고; 여기서, 전체 참조 연관 존재량 비는 참조 연관 존재량 비의 세트 등의 조합에 기초하여 측정될 수 있는 것인 단계)를 포함할 수 있다.
구체적인 예에서, (예컨대, 표적 분자를 포함하는 샘플 등으로부터의 생물학적 표적 정량화를 위한) 방법(100)은 (예컨대, 제3자에 의해, 임의의 적합한 엔티티 등에 의해) 표적 연관 분자의 세트 및 표적 분자의 세트와 연관된 생어 서열분석에 기초하여 표적 연관 분자의 세트 및 표적 분자의 세트와 연관된 적어도 하나의 크로마토그램 관련 출력값을 측정하는 단계로서, 표적 연관 분자의 세트는 생물학적 표적의 표적 서열의 표적 서열 영역과 서열 유사성을 갖는 표적 연관 영역; 및 표적 서열의 서열 영역과 서열 비유사성을 갖는 표적 변이 영역을 포함하는 표적 연관 서열을 포함하고, 여기서, 표적 분자의 세트는 표적 서열 영역을 포함하는 것인 단계; 적어도 하나의 크로마토그램 관련 출력값에 기초하여 상이한 염기 세트에 대한 표적 연관 존재량 비(및/또는 다른 적합한 존재량 메트릭 등)의 세트를 측정하는 단계로서, 여기서, 상이한 염기 세트로부터의 각각의 상이한 염기 세트는 표적 연관 서열의 적어도 하나의 염기 및 표적 서열의 적어도 하나의 염기를 포함하는 것인 단계; 및/또는 표적 연관 존재량 비의 세트에 기초하여, 샘플에 대한 생물학적 표적의 존재량을 설명하는 전체 존재량 메트릭을 측정하는 단계를 포함할 수 있다.
구체적인 예에서, 방법(100)은 표적 연관 핵산(예컨대, 스파이크 인 핵산 등)의 세트를 생성하는 단계로서, 여기서, 핵산은 표적 염색체(예컨대, 21번 염색체; 여기서, 표적 연관 핵산의 상이한 세트가 생성될 수 있고, 여기서, 상이한 세트는 21번 염색체의 상이한 상이한 유전자좌에 상응할 수 있고, 표적 서열의 상이한 표적 서열 영역과 서열 유사성을 갖는 상이한 표적 연관 영역을 포함할 수 있고, 여기서, 상이한 표적 서열 영역 또는 표적 서열은 상이한 유전자좌 등에 상응할 수 있다)와 연관된 하나 이상의 표적 연관 영역(예컨대, 표적 연관 영역을 포함하는 표적 연관 핵산 서열을 포함하는 표적 연관 핵산의 세트; 샘플 중 표적 분자의 표적 서열의 표적 서열 영역과 매칭되는 뉴클레오티드 서열을 포함하는 서열 영역, 여기서, 표적 분자는 생물학적 표적 등에 상응한다)을 포함하고, 하나 이상의 변이 영역(예컨대, 서열 삽입; 서열 결실; 표적 서열, 예컨대, 21번 염색체 등을 확인하는 표적 서열 대비 복수의 셔플링된 염기를 갖는 변이 서열)을 포함하는 것인 단계; 표적 연관 핵산의 세트를 샘플(예컨대, 임신한 여성으로부터의 모체 혈액 샘플 등)로부터의 표적 핵산(예컨대, 21번 염색체를 확인하는 내인성 DNA 분자)의 세트와 조합하는 단계; (예컨대, 표적 연관 핵산 및 표적 핵산이 공유하는 서열을 표적화하는) 표적 연관 프라이머의 세트에 기초하여 표적 연관 핵산의 세트 및 표적 핵산의 세트를 동시 증폭시켜 하나 이상의 스파이크 인 혼합물을 생성하는 단계(예컨대, 상이한 유전자좌에 상응하는 표적 연관 핵산의 각각의 상이한 세트의 경우, 표적 연관 핵산의 세트를 유전자좌에 상응하는 표적 핵산의 세트 등과 함께 동시 증폭시키는 단계); 하나 이상의 스파이크 인 혼합물에 대해(및/또는 표적 연관 핵산의 세트를 별개로, 표적 핵산을 별개로, 및/또는 다른 적합한 분자에 대해) 생어 서열분석을 수행하여 하나 이상의 크로마토그램 관련 출력값을 측정하는 단계; 표적 서열 염기 및 표적 연관 서열 염기의 쌍에 대한 (예컨대, 표적 서열에 대한 원래의 서열 위치, 및 표적 연관 서열에 대한 이동된 서열 위치에 상응하는 동일한 염기 유형의 쌍에 대한 것; 예컨대, 여기서, 표적 연관 서열의 변이 영역은 하나 이상의 삽입 및/또는 결실을 포함하고; 변이 영역에 상응하는 위치에서, 예컨대, 여기서, 변이 영역은 표적 서열 대비 셔플링된 염기 유형의 세트 등을 포함한다) 하나 이상의 크로마토그램 관련 출력값(예컨대, 생어 서열분석으로부터의 크로마토그램; 생어 서열분석 등으로부터의 피크 데이터, 예컨대, 피크 강도 메트릭을 포함하는 피크 강도 데이터)에 대해 통계적 추정 분석(예컨대, 일반 선형 회귀, 비음(non-negative) 최소 제곱, 압축 센싱(compressive sensing), 랜덤 샘플 컨센서스(random sample consensus) 등)을 수행하는 단계; 각 쌍에 대하여, 표적 서열 염기에 대한 피크 강도 메트릭(예컨대, 피크에 대한 최대 강도; 피크에 대한 전체 강도 등)(및/또는 다른 적합한 서열분석 출력값)을 표적 연관 서열 염기에 대한 피크 강도 메트릭(및/또는 다른 적합한 서열분석 출력값)과 비교하는 것에 기초하여 스파이크 인에 내인성인 개별 존재량 비를 추출하는 단계; (예컨대, 표적 서열 염기 및 21번 염색체에 대한 복수의 표적 유전자좌와 연관된 표적 연관 서열 염기의 상이한 쌍에 대하여 개별 존재량 비의 평균을 구하고; 유전자좌 간의 존재량 비의 평균을 구하는 등) 개별 존재량 비에 기초하여 전체 존재량 비를 생성하는 단계; 및 존재량 비에 기초하여 (예컨대, 21번 염색체에 대한 전체 존재량 비를, 방법(100)의 실시양태의 일부분에 따라 샘플로부터 참조 분자를 이용하여 참조 연관 분자를 프로세싱하는 것에 기초하여 참조 염색체, 예컨대, 염색체 18에 대해 계산된 참조 전체 존재량 비와 비교하는 것에 기초하여; 여기서, 비교는 다운 증후군 및 에드워드 증후군 등의 특징화를 용이하게 할 수 있다) 하나 이상의 병태의 하나 이상의 특징화(예컨대, 다운 증후군 진단, 다른 병태 특징화, 서열분석 출력값 분석 등)를 용이하게 하는 단계를 포함할 수 있다.
방법(100) 및/또는 시스템(200)의 실시양태는 비용 효과(예컨대, 생어 서열분석 기술 등의 레버리지를 통해), 구현 가능성(예컨대, 게놈 서열분석 시스템 등에의 접근이 제한된 국가에서), 및 하나 이상의 생물학적 표적에 대한 존재량 메트릭(예컨대, 분자 계수) 측정과 관련된 정확도(예컨대, 1% 미만의 변동 계수와 연관된 정확도 및/또는 임의의 적합한 정확도)를 개선시키는 작용을 할 수 있다. 방법(100) 및/또는 시스템(200)의 실시양태는 추가로 또는 대안적으로 존재량 메트릭을 레버리지하여 하나 이상의 병태를 특징화(예컨대, 진단)하고/거나, (예컨대, 치료 결정, 치료 평가 및 시간 경과에 따른 수정 등을 통해) 치료하는 작용을 할 수 있다. 방법(100) 및/또는 시스템(200)의 실시양태는 추가로 또는 대안적으로 예컨대, 적용 간의 다중화 능력을 증가시킴으로써(예컨대, 디지털 PCR), 적용 간의 정확도를 개선시킴으로써(예컨대, qPCR), 및/또는 임의의 다른 적합한 개선에 의해 종래 접근법이 갖는 문제점을 극복하는 작용을 할 수 있다. 그러나, 실시양태는 임의의 적합한 기능성을 포함할 수 있다.
방법(100) 및/또는 시스템(200)의 실시양태는 하나 이상의 병태와 연관되어 (예컨대, 하나 이상의 병태를 특징화, 진단, 치료하고/거나, 하나 이상의 병태와 관련된 프로세스를 수행하는 것과 연관되어) 사용될 수 있고, 여기서, 병태는 비침습적 산전 검사(NIPT: noninvasive prenatal testing)(예컨대, 이수성, 예컨대, 21번 삼염색체증 또는 다운 증후군, 18번 삼염색체증 또는 에드워드 증후군, 13번 삼염색체증 또는 파타우 증후군(Patau syndrome), 성 염색체 이수성, 예컨대, 터너 증후군, 다른 적합한 이수성을 포함하는 염색체 이상; 디조지 증후군(DiGeorge syndrome)을 포함하는 염색체 이상의 존재에 관한 유전적 스크리닝과 관련; 단일 유전자 장애; 희귀 변이체 연관 병태 등에 관한 유전적 스크리닝과 관련); 다른 산전 검사; 산전 환경 밖에서의 이수성 분석 및/또는 다른 적합한 분석; 유전적 장애(예컨대, 겸상 세포 질환 및/또는 희귀 변이체 연관 병태를 포함하는 단일 유전자 장애; 염색체 이상; 유전자 증폭과 연관된 장애; 유전자 결실; 부분 염색체 이상; 22q11.2 결실 증후군 또는 디조지 증후군; 샤르코-마리-투스 증후군(Charcot-Marie-Tooth syndrome), 낭성 섬유증, 헌팅톤병; 뒤시엔느 근위축증(Duchenne muscular dystrophy); 혈우병, 지중해빈혈; 희귀 변이체 연관 병태 등), 염색체 이상(예컨대, 부가, 누락, 불규칙적인 염색체 DNA 등)과 연관된 다른 병태, 희귀 변이체 연관 병태, 암(예컨대, 종양 생검 중 온코진의 유전자 증폭 분석을 통해; HER2, MET, MYC-N, MYC-C, EGFR, FGFR1, ER/PR, KRAS, UGT1A1, c-KIT, CD20, CD30, FIP1L1-PDGFR알파, PDGFR, VCR/ABL, PML/RAR-알파, TPMT, UGT1A1, EML4/ALK, BRAF, 및/또는 임의의 다른 적합한 온코진, 암 바이오마커, 및/또는 다른 암 연관 표적 중 하나 이상의 것과 연관된 분석을 통해; 치료, 예컨대, 허셉틴 등을 측정 및/또는 평가하는 데에서 생검 샘플을 분석하여 시간 경과에 따른 순환 종양 DNA의 확산을 평가함으로써), 및/또는 임의의 다른 적합한 병태 중 하나 이상의 것을 포함하고/거나, 다르게는 그와 연관될 수 있다. 병태는 추가로 또는 대안적으로 정신적 및 행동 병태(예컨대, 심리적 장애; 우울증; 정신병 등); 의사소통 관련 병태(예컨대, 표현 언어 장애; 발음장애; 음운 장애; 자폐 장애; 음성 병태; 청각 병태; 눈 병태 등); 수면 관련 병태(예컨대, 불면증, 수면 무호흡 등); 심혈관 관련 병태(예컨대, 관상 동맥 질환; 고혈압 등); 대사 관련 병태(예컨대, 당뇨병 등), 류머티스 관련 병태(예컨대, 관절염 등); 체중 관련 병태(예컨대, 비만 등); 통증 관련 병태; 내분비 관련 병태; 유전자 관련 병태; 만성 질환; 및/또는 임의의 다른 적합한 유형의 병태를 포함할 수 있다.
방법(100) 및/또는 시스템(200)의 실시양태는 추가로 또는 대안적으로 엔티티(예컨대, 샘플, 표적, 참조, 합성된 분자, 사용자, 샘플 처리 시스템, 서열분석 시스템, 전산 시스템 등)를 상이한 상태 또는 것으로 변환시킬 수 있다. 예를 들어, 방법(100)은 공유된 영역(예컨대, 공유된 뉴클레오티드 서열), 및 생물학적 표적 대비 변이 영역(예컨대, 셔플링된 뉴클레오티드 서열)을 포함하는 스파이크 인 분자(예컨대, 표적 연관 분자 등)를 합성하는 단계를 포함할 수 있고, 여기서, 상기 스파이크 인 분자는 예컨대, 생어 서열분석, 및 스파이크 인 혼합물을 이용한 생어 서열분석으로부터의 결과에 기초한 연관된 전산 분석을 실행함으로써, 증폭 편향을 최소화시키면서, 정확한 존재량 측정에 적합한 형태로의 변환을 위해 표적 분자와 함께 프로세싱될 수 있다(예컨대, 동일한 프라이머 등을 이용하여 표적 분자와 함께 동시 증폭될 수 있다)(여기서, 동시 증폭은 표적 연관 분자 및 표적 분자 등, 둘 모두에 대하여 동일한 효율로 이루어진다). 상기 프로세스는 이전에 수행불가능했던 (예컨대, 표적 분자에 대한, 참조 분자 등에 대한) 존재량 정량화, 병태 특징화(예컨대, 하나 이상의 병태에 대한 개선된 진단 등), 및/또는 치료(예컨대, 스파이크 인 분자 및 표적 분자, 예컨대, 상이한 유전자좌와 연관된 표적 분자의 유의미한 정량화 및 비교를 위한 개선된 정확도를 촉진시킴으로써; 시간 경과 에 따른 치료 제공 및 평가를 위해 시간 경과에 따른 존재량 측정을 용이하게 함으로써)를 가능하게 할 수 있다. 그러나, 방법(100) 및/또는 시스템(200)의 실시양태는 예컨대, 방법(100)의 실시양태 중 비통상적인 일부분을 수행하기 위해 시스템(200)의 실시양태의 일부분의 비일반화된 성분을 사용하는 것과 관련하여 임의의 다른 적합한 이점(들)을 제공할 수 있다.
추가로 또는 대안적으로, 본원에 기술된 데이터(예컨대, 존재량 메트릭; 특징화; 서열분석 출력값; 비; 식별자; 분자 디자인 예컨대, 표적 연관 분자 디자인, 참조 연관 분자 디자인, 프라이머 디자인, 실험 디자인; 서열 디자인; 서열 영역 디자인; 실험 결과; 검증 결과; 병태 관련 데이터; 치료 관련 데이터 등)는 데이터가 수집, 측정, 전송, 수신, 및/또는 다르게는 프로세싱되었을 때는 나타내는 시간 기준 지표; 데이터에 의해 기술된 컨텐트에 컨텍스트를 제공하는 시간 기준 지표, 예컨대, 스파이크 인 혼합물 생성 및/또는 적합한 서열분석 라이브러리 제조 및/또는 서열분석으로 이루어진 상이한 단계들을 나타내는 시간 기준 지표; 시간 기준 지표의 변화(예컨대, 시간 경과에 따른 데이터, 예컨대, 시간 경과에 따른 존재량 메트릭, 이는 하나 이상의 병태의 특징화를 용이하게 하는 데, 및/또는 예컨대, 암 병태 모니터링과 관련하여 치료를 용이하게 하는 데 사용될 수 있는 것; 데이터 변화, 데이터 패턴; 데이터 추세; 데이터 외삽 및/또는 다른 예측 등); 및/또는 시간과 관련된 임의의 다른 적합한 지표 중 하나 이상의 것을 포함하는, 임의의 적합한 시간 기준 지표(예컨대, 초, 분, 시간, 일, 주, 기간, 시점, 타임 스탬프 등)와 연관될 수 있다.
추가로 또는 대안적으로, 본원에 기술된 파라미터, 메트릭, 입력값, 출력값, 및/또는 다른 적합한 데이터는 점수, 이진 값, 등급, 신뢰 수준, 식별자(예컨대, 샘플 식별자, 본원에 기술된 임의의 적합한 분자에 대한 분자 식별자 등), 스펙트럼에 따른 값, 및/또는 임의의 다른 적합한 유형의 값 중 임의의 하나 이상의 것을 포함하는 값 유형과 연관될 수 있다. 본원에 기술된 임의의 적합한 유형의 데이터는 입력값으로서 사용될 수 있고/거나, 출력값으로서 생성될 수 있고/거나, 방법(100) 및/또는 시스템(200)의 실시양태와 연관된 임의의 적합한 성분을 위해 임의의 적합한 방식으로 조작될 수 있다.
본원에 기술된 방법(100) 및/또는 프로세스의 실시양태의 하나 이상의 인스턴스 및/또는 일부분은 본원에 기술된 시스템(200), 성분, 및/또는 엔티티의 하나 이상의 인스턴스에 의해 및/또는 그를 사용하여 트리거 이벤트와의 시간적 관계로, 및/또는 임의의 적합한 시간 및 빈도로 임의의 다른 적합한 순서로 비동기적으로(예컨대, 순차적으로), 동시에(예컨대, 병행하여; 다중, 자동 방식으로 샘플을 동시에 프로세싱; 시스템 프로세싱 능력을 향상시키기 위해, 생어 서열분석으로 생성된 출력값, 예컨대, 피크 데이터 및/또는 크로마토그램을 동시에 전산 방식으로 프로세싱; 임의의 적합한 개수의 샘플, 혼합물, 서열분석 출력값, 및/또는 다른 성분에 대한 임의의 적합한 동시 수행 전산 프로세싱; 다중 샘플 제조 및/또는 서열분석 작동 등) 수행될 수 있다.
시스템(200)의 실시양태는 분자(예컨대, 표적 연관 분자; 참조 연관 분자 등)를 생성하고/거나, 샘플(예컨대, 생물학적 샘플; 합성 샘플; 사용자로부터의 샘플 등)을 프로세싱하고/거나, 다른 적합한 프로세스를 수행하도록 구성된 하나 이상의 샘플 처리 네트워크; 스파이크 인 혼합물, 다른 혼합물, 및 적합한 샘플, 및/또는 임의의 적합한 성분으로부터 프로세싱된 유전 물질을 서열분석하도록 구성된 하나 이상의 서열분석 시스템(예컨대, 생어 서열분석 시스템 등); (예컨대, 하나 이상의 존재량 메트릭을 측정하는 데; 하나 이상의 병태의 특징화를 용이하게 하는 데; 치료를 용이하게 하는 데에서 등) 하나 이상의 서열분석 시스템의 서열분석 출력값을 분석하도록 구성된 하나 이상의 컴퓨팅 시스템(예컨대, 원격 컴퓨팅 시스템, 로컬 컴퓨팅 시스템 등); 및/또는 임의의 다른 적합한 성분을 포함할 수 있다. 방법(100) 및/또는 시스템(200)의 실시양태의 일부분은 바람직하게, 제1 당사자에 의해 수행될 수 있지만, 추가로 또는 대안적으로, 하나 이상의 제3자, 사용자, 및/또는 임의의 적합한 엔티티(예컨대, 의료 제공자, 연구실 기술자 등)에 의해 수행될 수 있다.
그러나, 방법(100) 및 시스템(200)은 임의의 적합한 방식으로 구성될 수 있다.
2.1 표적 연관 분자 생성
방법(100)의 실시양태 (예컨대, 하나 이상의 하나 이상의 생물학적 표적 등과 연관된) 하나 이상의 표적 연관 분자를 생성하는 단계(S110)를 포함할 수 있으며, 이는 하나 이상의 표적(예컨대, 생물학적 표적 등)과 하나 이상의 특징(예컨대, 서열 특징, 기능적 특징, 구조적 특징, 진화적 특징 등)을 공유하는 하나 이상의 분자를 합성하는 작용을 할 수 있고, 편향(예컨대, 증폭 편향 등)을 감소시키고/거나, (예컨대, 통계적 추정, 예컨대, 선형 회귀; 피크 분석; 존재량 비 측정을 위한 상이한 서열의 염기쌍 및/또는 그의 세트의 연관 및/또는 확인; 디콘볼루션; 시간 경과에 따른 방법(100)의 실시양태의 다중 인스턴스 수행 등을 위해) 하류 프로세싱 동안 정확도를 향상시키도록 유사한 샘플 프로세싱 파라미터(예컨대, 표적 연관 분자 및 표적 분자를 포함하는 스파이크 인 혼합물의 서열분석을 위한, 표적 연관 분자를 개별적으로, 또는 표적 분자를 개별적으로 서열분석하기 위한 생어 서열분석 조건; 예컨대, 표적 연관 분자 및 표적 분자의 동시 증폭을 통한, 참조 연관 분자 및 참조 분자 등의 동시 증폭을 통한 PCR 기반 증폭 도안의 유사한 증폭 파라미터)를 촉진시킬 수 있다.
표적 연관 분자는 바람직하게, 하나 이상의 표적 연관 서열(예컨대, 뉴클레오티드 서열; 동일하거나, 또는 유사한 유사한 표적 연관 분자 서열 등에 상응하는 표적 연관 분자의 세트의 각각의 표적 연관 분자)을 포함하고, 여기서, 표적 연관 서열은 하나 이상의 표적 연관 영역을 포함할 수 있다. 예를 들어, 표적 연관 서열은 하나 이상의 생물학적 표적의 하나 이상의 표적 서열(예컨대, 생물학적 표적 등에 상응하는 표적 서열)의 하나 이상의 표적 서열 영역과 서열 유사성(예컨대, 완전한 서열 유사성; 임계치 백분율 및/또는 양보다 큰 서열 유사성)을 갖는 표적 연관 영역을 포함할 수 있고, 여기서, 하나 이상의 생물학적 표적은 하나 이상의 의학적 병태와 연관될 수 있다.
표적 연관 영역(및/또는 표적 연관 분자 및/또는 표적 연관 서열)은 바람직하게, 하나 이상의 생물학적 표적 및/또는 표적 분자(예컨대, 생물학적 표적에 상응하는 표적 분자; 생물학적 표적의 표적 서열 영역을 포함하는 표적 분자 등)와 연관된다(예컨대, 그와 뉴클레오티드 서열을 공유하거나; 상응하는 위치에서 표적 서열을 갖는 염기 세트를 공유하거나; 그를 이용하여 프로세싱될 수 있거나; 그를 이용하여 생어 서열분석될 수 있거나; 예컨대, 동시 증폭을 통해 그와 함께 증폭될 수 있거나; 동일한 프라이머에 의해 표적화될 수 있거나; 그에 상보적이거나; 표적화하거나; 컴퓨팅 시스템에서 디지털 방식으로 연관되는 등 그러하다). 생물학적 표적(예컨대, 표적 마커; 하나 이상의 의학적 병태에 상응하고/거나, 그를 유발하고/거나, 그의 원인이 되고/거나, 그와 관련하여 치료적이고/거나, 그와 상관관계가 있고/거나, 다르게는 그와 연관되는 것; 관심 표적; 공지 또는 확인된 표적; 비공지 또는 이전에 확인되지 않는 표적 등)은 표적 서열 영역(예컨대, 염색체를 확인하는 서열; 병태를 나타내는 서열; 집단간 및/또는 임의의 적합한 피험체 세트간 불변이 서열; 보존 서열; 돌연변이, 다형성을 포함하는 서열; 뉴클레오티드 서열; 아미노산 서열 등), 유전자(예컨대, 하나 이상의 단일 유전자 장애와 연관된 유전자 등), 유전자좌, 염색체(예컨대, 하나 이상의 염색체 이상과 연관된 염색체 등), 단백질(예컨대, 혈청 단백질, 항체 등), 펩티드, 탄수화물, 지질, 핵산(예컨대, 세포외 RNA, 마이크로RNA, 메신저 RNA, 여기서, RNA 표적에 대한 존재량 측정은 적합한 역전사 중합효소 작동 등을 포함할 수 있다), 세포(예컨대, 전체 세포 등), 대사산물, 천연 생성물, 암 바이오마커(예컨대, 종양에 의해 분비되는 분자; 암의 존재에 대한 반응으로 분비되는 분자 등), 유전적 소인 바이오마커, 진단 바이오마커, 예후 바이오마커, 예측 바이오마커, 다른 분자 바이오마커, 유전자 발현 마커, 영상화 바이오마커, 및/또는 다른 적합한 표적 중 임의의 하나 이상의 것을 포함할 수 있다. 표적은 바람직하게, 본원에 기술된 병태와 연관되고, 이는 추가로 또는 대안적으로 증상, 원인, 질환, 장애, 및/또는 병태와 연관된 임의의 다른 적합한 측면을 비롯한, 하나 이상의 병태와 연관될 수 있다. 한 예에서, 표적 연관 분자는 (예컨대, 21번 염색체를 확인하는) 표적 분자의 표적 서열의 하나 이상의 영역과 동일한 뉴클레오티드 서열을 포함할 수 있고, 여기서, 프라이머는 (예컨대, 동시 증폭을 용이하게 하기 위해, 예컨대, 증폭 편향 등을 감소시키기 위해) 동일한 영역을 표적화함으로써 표적 연관 분자 및 표적 분자, 둘 모두를 동시에 표적화할 수 있다. 한 예에서, 도 3에 제시된 바와 같이, 표적 연관 서열(예컨대, "spk" 서열)은 표적 서열(예컨대, "hg19" 서열)의 표적 서열 영역과 서열 유사성을 갖는 표적 연관 영역을 포함할 수 있고, 예컨대, 여기서, 프라이머 세트(예컨대, 1차 PCR 프로세스를 위해, 2차 PCR 프로세스를 위해; "chr21:14439004_PCR2_FP," "chr21:14439076_PCR2_RP_hp," "chr21:14439004_PCR1_FP," "chr21:14439076_PCR1_RP"; 하나 이상의 헤어핀 서열을 포함하는 PCR 프라이머 등)는 (예컨대, 동시 증폭 및 상응하여 증폭 편향 감소를 용이하게 하기 위해) 표적 연관 서열 및 표적 서열, 둘 모두를 표적화할 수 있다. 한 예에서, 표적 연관 분자는 표적 서열과 임의의 적합한 서열 동일성을 갖는 서열을 포함할 수 있고, 여기서, 표적 연관 분자 및 표적 분자를 동시에 또는 별개로 표적화하는 데 임의 개수 및/또는 유형의 프라이머가 사용될 수 있다. 구체적인 예에서, 생물학적 표적은 (예컨대, 21번, 18번, 13번 염색체 등에서의 이수성에 대한 NIPT와 관련된) 이수성 연관 병태에 상응하는 염색체를 확인하는 표적 서열을 포함할 수 있다. 구체적인 예에서, 생물학적 표적은 (예컨대, 암 병태 메트릭 측정, 암 치료 평가 등과 관련된) 온코진을 확인하는 표적 서열을 포함할 수 있다. 그러나, 표적(예컨대, 생물학적 표적 등)은 임의의 적합한 방식으로 구성될 수 있다. 추가로 또는 대안적으로, 표적 연관 분자(예컨대, 표적 연관 분자의 표적 연관 영역 등)는 예컨대, 후속하여 유사한 샘플 프로세싱 파라미터가 표적 연관 분자 및 표적 분자에 대한 존재량 메트릭 사이의 유의미한 비교를 생성할 수 있도록 하기 위해 생물학적 표적과(예컨대, 생물학적 표적과 상응하는 표적 분자 등과) 임의의 적합한 특징(예컨대, 성분 등)을 공유할 수 있다. 그러나, 표적 연관 분자는 임의의 적합한 방식으로 구성될 수 있다.
도 11에 제시된 바와 같이, 표적 연관 분자는 바람직하게, 표적 변이 영역(예컨대, 표적 연관 분자의 표적 연관 서열의 변이 영역; 각 표적 연관 분자는 하나 이상의 변이 영역 등을 포함)을 포함하고, 여기서, 변이 영역은 표적 분자의 특징과 상이한 특징을 포함할 수 있다. 변이 영역은 바람직하게, 하나 이상의 변이(예컨대, 삽입, 결실, 치환 등), 예컨대, (예컨대, 서열분석 출력값을 측정하는 동안; 예컨대, 통계적 추정 분석을 수행하여 존재량 메트릭을 측정하는 동안; 하나 이상의 의학적 병태의 특징화 및/또는 치료를 용이하게 하기 위해; 스파이크 인 혼합물 및/또는 적합한 샘플로부터의 크로마토그램 관련 출력값의 후속 프로세싱 동안; 예컨대, 표적 연관 염기 및 표적 염기의 쌍, 예컨대, 변이 영역 및/또는 다른 적합한 영역의 위치에 상응하는 쌍에 대한 중복 피크의 디콘볼루션 동안; 표적 연관 서열 및 표적 서열에 대한 존재량을 피팅하기 위한 통계적 추정 분석 동안 등) 표적 분자로부터의 표적 연관 분자의 차별화를 용이하게 하면서, 상응하는 표적 연관 분자(예컨대, 변이 영역 등을 포함하는 표적 연관 서열을 포함하는 표적 연관 분자)가 상응하는 표적 분자(예컨대, 생물학적 표적 등의 표적 서열 영역을 포함하는 핵산)과 유사한 방식으로 샘플 프로세싱 작동을 통해 계속해서 진행될 수 있도록 하는 변이를 포함한다. 상기 차별화는 유의미한 비교가 가능한(예컨대, 염기쌍 및/또는 그의 세트의 피크 강도 사이의 정량적 비교; 예컨대, 개별 존재량 메트릭의 비교 및/또는 전체 존재량 메트릭 측정을 위해 개별 존재량 메트릭 조합; 예컨대, 특징화 및/또는 치료 등을 용이하게 하기 위해) 상이한 상응하는 존재량 메트릭의 측정을 용이하게 할 수 있다. 한 예에서, 변이 영역은 표적 분자의 표적 서열의 서열 영역과 상이한 뉴클레오티드 서열을 포함하는 서열 변이 영역을 포함할 수 있다. 구체적인 예에서, 도 3에 제시된 바와 같이, 표적 연관 서열(예컨대, "spk" 서열 등)은 표적 서열의 서열 영역 대비(예컨대, "hg19" 표적 서열 등의 "att" 서열 영역의 대비) 결실(예컨대, 3개의 뉴클레오티드 결실 등)을 포함할 수 있다. 추가로 또는 대안적으로, 변이 영역은 임의의 적합한 염기 및/또는 염기 유형과 관련하여 임의의 적합한 개수의 치환, 삽입, 결실, 및/또는 임의의 적합한 크기의 다른 변형(예컨대, 임의의 적합한 개수의 뉴클레오티드의 삽입 및/또는 결실; 임의의 적합한 개수의 점 돌연변이, 예컨대, 10개의 점 돌연변이 등)을 포함할 수 있다.
구체적인 예에서, 변이 영역은 (예컨대, 표적 연관 서열 등의) 임의의 표적 연관 염기 및/또는 (예컨대, 표적 서열 등의) 표적 염기에 대한 서열분석 출력값(예컨대, 피크 강도, 피크 면적, 피크 데이터, 크로마토그램 등)의 측정을 용이하게 할 수 있고, 예컨대, 여기서, 예컨대, 하나 이상의 존재량 메트릭을 측정하기 위하여 하나 이상의 영역(예컨대, 표적 연관 영역, 변이 영역 등)에서의 표적 연관 염기에 대한 서열분석 출력값(예컨대, 피크 강도 메트릭)을 상이한 위치(예컨대, 여기서, 상응하는 염기의 위치는 변이 영역의 하나 이상의 삽입 및/또는 결실 등에 기인하여 이동될 수 있다), 또는 동일한 위치(예컨대, 변이 영역의 점 치환 등의 경우)에서의 상응하는 표적 염기에 대한 서열분석 출력값(예컨대, 피크 강도 메트릭 등)을 비교할 수 있다. 구체적인 예에서, 도 11에 제시된 바와 같이, 표적 연관 분자는 10개만큼의 염기가 상응하는 표적 뉴클레오티드 서열과 상이한 뉴클레오티드 서열 변이 영역을 포함할 수 있고(예컨대, 여기서, 표적 서열은 "TCTTGGATAG" 영역을 포함하고, 여기서, 변이 영역은 상이하는 위치에 "CTGGTTTAGA" 영역 등을 포함한다), 여기서, 각각의 10개의 염기 차이는 정확도가 향상된 전체 존재량 비를 생성하는 데 사용될 수 있는 스파이크 인에 내인성인 상이한 개별 존재량 비 메트릭을 가능하게 할 수 있다. 추가로 또는 대안적으로, 변이 영역은 임의의 적합한 개수의 염기의 차이(예컨대, 상대적인 표적 서열 등)를 포함할 수 있다.
변이 영역은 각각 적절한 서열 비유사성 및 서열 유사성을 촉진시키기 위해 표적 연관 영역과 함께 디자인될 수 있다(예컨대, 서열분석 기술, 예컨대, 생어 서열분석 등과 연관된 서열분석 파라미터를 고려하여 서열분석 출력값의 개선을 용이하게 하기 위해 변이 영역 및/또는 표적 연관 영역의 특징을 측정).
서열 변이 영역은 임의의 적합한 개수 및 유형의 염기에 의해, 임의의 적합한 위치에서(예컨대, 순차적 위치, 비순차적 위치 등), 임의의 적합한 유전자좌 간에, 임의의 적합한 염색체 및/또는 다른 표적에 대하여 표적 서열과 상이할 수 있고/거나, 임의의 적합한 방식으로 표적 서열과 상이할 수 있다. 서열 변이 영역은 치환, 삽입, 결실, 임의의 적합한 돌연변이 유형, 및/또는 임의의 적합한 변형(예컨대, 상대적인 하나 이상의 서열 영역 of 표적 서열 및/또는 생물학적 표적 등) 중 임의의 하나 이상의 것을 포함할 수 있다.
변형으로, 서열 변이 영역은 (예컨대, 동일한 비율의 염기 유형으로, 염기 유형에 대해 미리 결정된 일부분에서 등) 무작위로 셔플링된 염기를 포함할 수 있다. 변형으로, 방법(100)은 (예컨대, 서열 중 염기 및 염기 유형의 순서에의 생어 출력값 품질 의존성의 원인이 되는 염기 유형의 특이적인 서열을 선택함으로서 생어 서열분석 출력값 결과를 최적화시키는 것에 기초하여; 전산 후속 프로세싱 동안의 통계적 추정, 분리(unmixing), 디콘볼루션을 촉진시키는 것에 기초하여; 증폭 편향을 최소화시키면서, 임계값 존재량 메트릭 정확도를 달성하는 데 필요한 다수의 염기 차이 등에 기초하여) 변형시키기 위해 표적 서열의 염기를 선택하는 단계를 포함할 수 있다.
추가로 또는 대안적으로, 변이 영역은 (예컨대, 임의의 적합한 유형 등의) 하나 이상의 표적 분자특징과 상이한 기능적, 구조적, 진화적, 및/또는 다른 적합한 특징을 갖는 비서열 변이 영역을 포함할 수 있다. 그러나, 변이 영역은 임의의 적합한 방식으로 구성될 수 있고, 표적 연관 분자는 임의의 적합한 뉴클레오티드 서열 영역을 포함할 수 있다.
변형으로, 표적 연관 분자는 서열분석 작동(예컨대, 서열분석 시스템의 작동; 예컨대, 정확도가 증가된 및/또는 정량적 비교 및/또는 정량화를 가능하게 하는 형태의 서열분석 출력값의 측정 등)(S130), 존재량 메트릭 측정(S140), 및/또는 방법(100)의 임의의 적합한 일부분(예컨대, 특징화 용이(S150) 및/또는 치료 용이(S160) 등)을 지원하도록 구성된 (예컨대, 서열분석 분자 등의) 하나 이상의 서열분석 영역을 포함할 수 있다. 변형으로, 표적 연관 분자(예컨대, 표적 연관 분자의 표적 연관 서열 등)는 하나 이상의 생어 연관 서열 영역 (예컨대, 생어 서열분석 출력값 등을 개선시키기 위해 구성된 것) 및/또는 임의의 적합한 서열분석 영역을 (예컨대, 그의 부가를 통해) 포함할 수 있고, 이는 추가의 표적 연관 영역 (예컨대, 하나 이상의 생물학적 표적, 예컨대, 동일한 또는 상이한 생물학적 표적의 하나 이상의 표적 서열, 예컨대, 동일한 또는 상이한 표적 서열의 추가의 표적 서열 영역 등과 서열 유사성을 갖는 것); 서열 반복부(예컨대, 표적 연관 분자, 표적 분자, 참조 연관 분자, 참조 분자, 임의의 적합한 서열, 영역, 및/또는 본원에 기술된 분자의 임의의 적합한 영역 등의 것); 및/또는 임의의 적합한 서열 영역(예컨대, 하나 이상의 분자에 부가되는 것과 관련된 본원에 기술된 서열분석 영역 등) 중 임의의 하나 이상의의 것을 포함할 수 있다.
변형으로, 생어 연관 서열 영역은 표적 연관 분자의 서열 변이 영역 및/또는 다른 적합한 영역 앞에 (및/또는 그와 임의의 적합한 위치상 관련하여) 특이적인 뉴클레오티드 서열(예컨대, 미리결정된 길이의 것으로서, 구체적으로 선택된 뉴클레오티드 등을 포함하는 것)을 포함할 수 있으며, 이는 개선된 생어 서열분석 크로마토그램 관련 출력값에 상응하는 위치에(예컨대, 염기 100-500에, 염기 200-500에, 생어 서열분석 동안, 및/또는 임의의 적합한 위치에) 서열 변이 영역을 재배치하는 것을 용이하게 할 수 있다. 구체적인 예에서, 생어 BigDye 1.1 화학법이 서열의 시작 영역과 관련하여 개선된 정확도를 위해 적용될 수 있다(예컨대, 도 13a-13b에 제시된 바와 같이, LCR 및/또는 RCA가 생략될 수 있는 경우 등). 구체적인 예에서, 생어 빅다이 3.1 화학법은 더욱 긴 서열분석 리드를 가능하게 하기 위해 적용될 수 있고, 여기서, 정확도 개선을 위해(예컨대, 예로서, 도 13a-13b에 제시된 바와 같이, LCR 및/또는 RCA를 통해, 이는 다중화를 가능하게 할 수 있다)(예컨대, 표적 서열 영역 및/또는 표적 연관 서열 영역 앞에 삽입된) 시작 서열 영역(예컨대, 약 200 bp 및/또는 다른 적합한 크기)이 사용될 수 있다. 그러나, 생어 연관 서열 영역은 임의의 적합한 방식으로 구성될 수 있다.
추가로 또는 대안적으로, 서열분석 분자는 서열분석 시스템에 의한 프로세스를 용이하게 하도록 구성된 서열분석 프라이머, 어댑터 서열, 및/또는 임의의 적합한 서열분석 시스템과 연관된 다른 적합한 성분을 포함할 수 있다. 그러나, 서열분석 분자는 임의의 적합한 방식으로 구성될 수 있다.
표적 연관 분자 (및/또는 본원에 기술된 다른 적합한 성분, 예컨대, 참조 연관 분자, 스파이크 인 혼합물의 성분 등)는 임의의 적합한 크기일 수 있다(예컨대, 100-500개의 염기쌍, 200-500개의 염기쌍 길이 및 서열 영역, 예컨대, 표적 연관 영역 및/또는 변이 영역의 반복부 포함; 표적 분자와 유사하거나, 또는 상이한 길이; 80-150개의 염기쌍 길이, 10개의 염기쌍의 셔플링된 염기 유형으로 이루어진 변이 영역 등 포함). 표적 연관 분자 세트는 임의의 적합한 개수의 표적(예컨대, 임의의 개수의 유전자좌, 염색체, 암 바이오마커, 표적 바이오마커 등과 연관된 임의의 개수의 표적 서열), 샘플(예컨대, 다중 사용자 간의 샘플 사용을 위해 분자 배치를 동시에 합성하는 경우, 단일 사용자를 위한 다중 샘플을 사용하는 사용자를 위해, 샘플 처리 시스템의 효능 개선 등을 위해), 병태(예컨대, 상이한 병태와 연관된 생물학적 표적과 연관된 표적 연관 분자 세트 등), 및/또는 다른 적합한 측면과 연관된 임의의 개수의 표적 연관 분자를 포함할 수 있다.
변형으로, 표적 연관 분자를 생성하는 것은 상이한 유형의 표적 연관 분자(예컨대, 상이한 표적 연관 영역, 상이한 변이 영역, 상이한 서열 분자 등 포함), 예컨대, 표적 연관 분자의 세트(예컨대, 각 세트는 상이한 유형의 표적 연관 분자 등에 상응한다)를 생성하는 것을 포함할 수 있다. 표적 연관 분자는 표적 연관 분자의 세트(예컨대, 복수의 상이한 세트 등)를 포함할 수 있으며, 각 세트는 상이한 표적 서열 영역(예컨대, 동일한 표적 서열 및/또는 생물학적 표적, 예컨대, 염색체의 상이한 표적 서열 영역; 상이한 표적 서열 및/또는 생물학적 표적, 예컨대, 상이한 유전자의 상이한 표적 서열 영역 등)과 연관된(예컨대, 그와 서열 유사성 등을 갖는) 상이한 표적 연관 영역을 포함하고, 이는 표적 연관 영역 유형(예컨대, 특이적인 표적 연관 영역 서열에 상응하는 것 등) 및 표적 서열 영역 유형(예컨대, 생물학적 표적의 특이적인 표적 서열에 상응하는 것 등)의 상이한 쌍 및/또는 세트, 및/또는 염기의 상이한 쌍 및/또는 세트(예컨대, 여기서, 쌍 및/또는 세트의 염기는 표적 연관 서열 및 표적 서열 등으로부터의 것일 수 있다)가 예컨대, 상응하는 존재량 메트릭, 예컨대, 개별 존재량 비(예컨대, 상이한 쌍에 상응하는 것; 예컨대, 염기의 상이한 세트에 상응하는 개별 존재량 비, 여기서, 염기의 상이한 세트는 염색체 생물학적 표적의 상이한 유전자좌 등에 상응할 수 있다)를 측정하는 것을 용이하게 할 수 있고, 이는 예를 들어, 평균을 구하고/거나, 개별 존재량 메트릭과의 임의의 적합한 조합 작동을 수행함으로써 증가된 정확도로 전체 존재량 메트릭를 측정하는 데 사용될 수 있다.
구체적인 예에서, 표적 연관 분자의 상이한 세트는 상이한 유전자좌 간의 상이한 표적 서열(및/또는 표적 서열 영역 등)과 연관될 수 있다. 구체적인 예에서, 각 세트는 동일한 염색체에 대한 상이한 유전자좌와 연관될 수 있고(예컨대, 도 9에 제시된 바와 같이, 한 염색체에 대해 제1, 제2, 제3, 및 제4 유전자좌), 여기서, 주어진 세트의 표적 연관 분자의 서열은 상기 세트에 상응하는 유전자좌가 공유하는 서열 영역을 포함할 수 있고, 상기 유전자좌에 대한 서열과 (예컨대, 삽입, 결실, 치환 등에 의해) 상이한 서열 변이 영역을 포함할 수 있다.
임의의 개수의 표적 연관 분자의 세트 및/또는 임의의 개수의 표적 연관 분자의 유형이 생성될 수 있고/거나, 임의의 적합한 개수의 생물학적 표적과 연관될 수 있다. 한 예에서, 상이한 표적 연관 분자 세트를 선택하는 것은 서열분석 파라미터, 주어진 조건 및/또는 적용에 대한 정확도 요건에 기초할 수 있고/거나(예컨대, 다수의 세트를 선택하여 다운 증후군 진단을 위한 표적 정확도를 달성하는 데 사용되는 상응하는 적합한 개수의 개별 존재량 메트릭을 유도할 수 있다), 임의의 적합한 기준(예컨대, 최적화시키고자 하는 파라미터)에 기초하여 선택될 수 있다. 그러나, 표적 연관 분자의 상이한 세트를 생성하는 것은 임의의 적합한 방식으로 수행될 수 있다.
표적 연관 분자를 생성하는 것은 표적 서열(예컨대, 표적 서열의 표적 서열 영역; 표적 서열의 임의의 적합한 영역 등)을 결정하는 것을 포함할 수 있고, 이는 표적 연관 분자의 생성에 기초가 될 수 있는 표적 서열을 선택하는 작용할 수 있다. 표적 서열을 결정하는 것은 병태(예컨대, 다운 증후군 진단을 용이하게 하기 위해 21번 염색체를 확인하는 표적 서열 선택; 온코진을 확인하는 표적 서열 선택 등), 서열분석 파라미터(예컨대, 생어 서열분석으로부터의 크로마토그램 관련 출력값의 품질을 최적화시키기 위해; 통계적 추정 분석에 적합한 크로마토그램 관련 출력값 및/또는 다른 적합한 것을 생성하기 위해; 비용 절감, 정확도 개선, 재현성 개선을 위해 및/또는 서열분석 시스템 및/또는 작동과 관련된 다른 적합한 최적화 등을 위해 특정 길이, 뉴클레오티드 서열, 및/또는 다른 파라미터의 표적 서열 선택); 증폭 파라미터(예컨대, 중합효소 연쇄 반응 증폭과 관련된 표적 서열에 대한 프라이머 특이성과 관련된 것과 같은, 증폭 특이성 최적화 등을 위해 특정 길이, 뉴클레오티드 서열, 및/또는 다른 파라미터의 표적 서열 선택), 다른 샘플 프로세싱 파라미터, 및/또는 다른 적합한 기준 중 임의의 하나 이상의 것에 기초할 수 있다. 한 예에서, 표적 서열을 결정하는 것은 데이터베이스(예컨대, DNA 데이터베이스, 게놈 데이터베이스, 유전자 발현 데이터베이스, 표현형 데이터베이스, RNA 데이터베이스, 단백질 데이터염기 등)를 전산 방식으로 검색하여 표적 서열 후보 목록을 작성하고; 본원에 기술된 기준, 및/또는 임의의 적합한 기준에 기초하여 표적 서열 후보 목록을 필터링하는 것을 포함할 수 있다. 구체적인 예에서, 표적화 서열을 결정하는 것은 (예컨대, 엑솜 풀 다운; 청크 크기의 적합한 개수의 염기쌍으로의 병합 등에 기초하여) 표적 서열 후보 목록을 추출하고; 정의된 유형의 돌연변이 및/또는 다형성을 포함하는 후보를 필터링하고(예컨대, 공통된 단일 뉴클레오티드 다형성과 연관된 후보를 필터링하여 집단의 피험체들 간의 상대적 불변성을 갖는 후보를 수득하고); (예컨대, 80-150 bp 앰플리콘에 대해 프라이머-BLAST를 사용하여) 남은 후보에 대한 프로이머를 확인하고; (예컨대, 정방향 프라이머에 대해 상대적인 위치에서의 스크램블링 염기 및/또는 서열의 다른 영역 등을 통해) 표적 연관 분자의 변이 영역을 생성하는 데 변이로 적합한 후보 영역을 결정하는 것을 포함한다. 그러나, 표적 서열을 결정하는 것은 임의의 적합한 방식으로 수행될 수 있다.
표적 연관 분자를 생성하는 것은 증폭(예컨대, PCR 증폭, 예컨대, 하나 이상의 헤어핀 서열을 포함하는 PCR 프라이머를 이용하는 것 등), 플라스미드 기반 핵산 합성(예컨대, 둘 모두 각각 표적 염색체 및 참조 염색체의 상이한 유전자좌에 상응하는 표적 연관 분자 및 참조 연관 분자 포함; 임의의 적합한 절단 부위, 복제 기점 부위, 다중 클로닝 부위, 선별가능 마커, 리포터 마커, 백본, 및/또는 다른 성분 등을 포함하는 플라스미드 사용), 다른 인공 유전자 합성 기술, 증폭 기술(예컨대, 중합효소 연쇄 반응, 롤링 써클 증폭 등), 라이게이션 기술(예컨대, 리가제 사이클링 반응 등), 포스포르아미다이트 접근법, 합성 후 프로세싱, 정제(예컨대, 고성능 액체 크로마토그래피 또는 다른 크로마토그래피 접근법, 탈염, 세척, 원심분리 등 사용), 태그부착 기술(예컨대, 분자 태그부착 기술, 형광 태그부착 기술, 입자 표지 기술 등), 분자 클로닝 기술, 및/또는 임의의 적합한 샘플 프로세싱 기술 중 임의의 하나 이상의 것을 수행함으로써 분자를 합성하는 것을 포함할 수 있다.
변형으로, 표적 연관 분자를 합성하는 것은 상이한 표적(예컨대, 동일한 염색체 간의 상이한 유전자좌, 상이한 염색체의 상이한 유전자좌, 상이한 온코진 등)과 연관된 복수의 서열 영역을 포함하는 표적 연관 서열을 생성하는 것을 포함할 수 있다. 구체적인 예에서, 표적 연관 분자의 한 유형은 필요한 서열분석 작동 횟수를 감소시키도록 구성될 수 있지만(예컨대, 복수의 표적에 관한 유용한 정보를 주고, 단일 생어 서열분석 실행을 사용하여 생성된 크로마토그램 관련 출력값의 생성을 용이하게 하는 표적 연관 분자 등); 그러나, 표적 연관 분자 유형은 임의의 적합한 파라미터에의 최적화를 위해 합성될 수 있다. 추가로 또는 대안적으로, 임의의 적합한 개수의 분자 및/또는 임의의 개수의 표적과 연관된 분자 유형은 임의의 적합한 시간 및 빈도로 생성될 수 있다.
그러나, 표적 연관 분자를 생성하는 단계(S110)는 임의의 적합한 방식으로 수행될 수 있다.
2.2 스파이크 인 혼합물을 생성하는 단계
방법(100)의 실시양태는 (예컨대, 사용자로부터의 하나 이상의 샘플로부터의 표적 분자를 이용하여 표적 연관 분자의 세트를 프로세싱하는 것 등에 기초하여) 하나 이상의 스파이크 인 혼합물을 생성하는 단계(예컨대, 그의 생성을 용이하게 하는 단계 등)를 포함할 수 있고, 이는 표적 연관 분자, 표적 분자, 및/또는 다른 적합한 분자(예컨대, 참조 연관 분자, 참조 분자 등)를 후속 분석(예컨대, 생어 서열분석 등) 및 존재량 메트릭 측정(예컨대, 생어 서열분석으로부터의 결과 등에 기초하여 측정)에 적합한 형태로 (예컨대, 유사한 증폭 파라미터 하에서) 증폭시키고/거나, 사전 프로세싱을 수행하고/거나(예컨대, 샘플 제조, 용해, 비드 기반 프로세스, 다른 정제 및/또는 핵산 추출 기술 등), 변형시키고/거나(예컨대, 서열 반복부 생성, 상이한 표적과 연관된 서열 조합 등) 및/또는 다르게는 프로세싱하는 기능을 할 수 있다. 수집된 샘플(예컨대, 생물학적 샘플; 사용자에게 제공된 샘플 수집 키트 중의 샘플 용기를 사용하여 수집된 것)로는 혈액, 혈장, 혈청, 조직, 생검(예컨대, 종양 생검 등), 땀, 소변, 대변, 정맥, 질 분비물, 눈물, 간질액, 다른 체액 및/또는 임의의 다른 적합한 샘플(예컨대, 인간 사용자, 동물, 관심의 대상, 예컨대, 식품, 미생물 등과 연관된 것) 중 하나 이상의 것을 포함할 수 있다. 예에서, 예컨대, NIPT의 경우, 생물학적 샘플은 하나 이상의 모체 샘플을 포함할 수 있다. 샘플은 바람직하게, 표적 분자(예컨대, 하나 이상의 표적 서열 및/또는 표적 서열 영역 등을 포함하는 핵산 분자) 및/또는 참조 분자(예컨대, 하나 이상의 참조 서열 및/또는 참조 서열 영역 등을 포함하는 핵산 분자)를 포함하고, 예컨대, 여기서, 표적 분자는 유사한 파라미터하에서 표적 연관 분자와 함깨 증폭될 수 있고; 여기서, 참조 분자는 유사한 파라미터하에서 참조 연관 분자와 함깨 증폭될 수 있다. 추가로 또는 대안적으로, 샘플은 다중 사용자로부터의 성분(예컨대, 표적 분자)(예컨대, 모체로부터의 핵산 및 모체의 태아로부터의 핵산을 포함하는 혈액 샘플, 여기서, 핵산 혼합물은 21번 염색체의 비정상적인 존재량 등을 나타낼 수 있다), 다중 시간에 걸쳐 수집된 성분, 및/또는 임의의 적합한 병태마다 다른 성분을 포함할 수 있고, 이로써, 스파이크 인 혼합물(들)을 생성하는 단계는 엔티티의 임의의 적합한 개수 및 유형에 대하여 수행될 수 있다.
하나 이상의 스파이크 인 혼합물을 생성하는 단계는 바람직하게, 표적 연관 분자를 샘플로부터의 표적 분자(예컨대, 표적 서열 영역 및/또는 표적 서열 등을 포함하는 핵산)과 조합하고/거나; 참조 연관 분자를 참조 분자와 조합하고/거나; 임의의 적합한 분자를 조합하는 것을 포함한다. 조합하는 것은 각 분자를 단일 혼합물(예컨대, 표적 연관 분자의 상이한 서브세트 및 표적 분자의 상응하는 서브세트 등을 포함하는 것)로 조합하는 것; 샘플(예컨대, 미리 프로세싱된 샘플)을 각각이 (예컨대, 표적 염색체 등에 대한 상이한 표적 유전자좌에 상응하는) 표적 연관 분자의 상이한 서브세트에 대해 지정된 것인 복수의 혼합물로 서브샘플링하는 것; 샘플을 표적 연관 분자 및 참조 연관 분자에 대한 상이한 혼합물로 서브샘플링하는 것; 및/또는 분자를 조합하는 임의의 다른 적합한 접근법 중 하나 이상의 것을 포함할 수 있다. 한 예에서, 표적 분자 및 표적 연관 분자(예컨대, 표적 분자 및 표적 연관 분자 유형의 상이한 쌍; 표적 연관 영역 및 표적 서열 영역의 상이한 쌍에 상응; 복수의 상이한 표적 등과 연관)는 예컨대, 다중 PCR PCR 및/또는 적합한 증폭 프로세스를 통해 동일한 구획(예컨대, 튜브 등)(및/또는 임의의 적합한 개수의 구획)에서 증폭될 수 있고, 이는 귀한 샘플의 보존을 용이하게 할 수 있고; 이어서, 생성된 증폭 생성물은 (예컨대, 표적 연관 영역 및 표적 서열 영역이 공유하는, 불변 영역, 예컨대, 서열 유사성을 갖는 영역과 연관된 생어 서열분석 프라이머 등을 사용하여) 상이한 표적 유형을 표적화하는 후속 개별 생어 서열분석을 위한 별개의 혼합물로 서브샘플링될 수 있다. 예에서, 서브샘플링 및/또는 다른 샘플 변형 작동은 임의의 적합한 순서로 수행될 수 있다.
추가로 또는 대안적으로, 별개의 샘플(예컨대, 혼합물, 용액 등)은 (예컨대, 상이한 유형의 분자를 조합하지 않고) 상이한 유형의 분자에 대해 생성될 수 있다. 예를 들어, (예컨대, 표적 분자 없이) 표적 연관 분자를 포함하는 제1 샘플이 생성될 수 있고, (예컨대, 표적 연관 분자 없이) 표적 분자를 포함하는 샘플 혼합물이 생성될 수 있고, 제1 및 제2 혼합물은 하류 프로세싱(예컨대, 존재량 메트릭 등의 측정을 위해, 별개의 생어 서열분석 실행을 수행하여 별개의 크로마토그램 관련 출력값, 예컨대, 통계적 추정, 디콘볼루션, 및/또는 다른 전산 프로세싱 작동 동안 사용될 수 있는 별개의 크로마토그램을 작성하는 것)에서 별개로 사용될 수 있다. 그러나, 임의의 적합한 별개의 분자 유형 또는 그의 조합을 포함하는 임의의 적합한 개수의 샘플이 생성 및/또는 프로세싱될 수 있다.
분자를 조합하는 것은 바람직하게, 존재량이 공지된 표적 연관 분자를 사용하는 것을 포함하지만, 대안적으로, 존재량이 알려지지 않은 표적 분자도 사용될 수 있다(예컨대, 존재량이 알려지지 않은 상태에서의 선행 서열분석 실행으로부터 얻은 결과는 후속 서열분석 실행 등으로부터의 결과를 알아내는 데 사용될 수 있다). 추가로, 분자를 조합하는 것은 바람직하게, (예컨대, 상이한 유전자좌와 연관된) 표적 연관 분자의 상이한 서브세트 간의 동일한 또는 실질적으로 유사한 존재량, 및/또는 참조 연관 분자 대비 동일한 또는 유사한 존재량을 사용하는 것을 포함한다. 추가로 또는 대안적으로, 상이한 분자 유형에 대한 임의의 적합한 존재량이 사용될 수 있다.
변형으로, 분자를 조합하는 것은 (예컨대, 사전 프로세싱 동안) 표적 연관 분자, 참조 연관 분자, 및/또는 다른 적합한 성분의 존재량을 변형시키는 것을 포함할 수 있다. 예를 들어, 분자의 존재량을 변형시키는 것은 분자의 초기 존재량(예컨대, 표적 연관 분자의 존재량)을 측정하고; 표적 분자의 존재량의 예측치(예컨대, 샘플 중 내인성 표적 분자 계수의 예측치 등)에 기초하여 (예컨대, 희석, 증폭 등을 통해) 존재량을 변형시키는 것을 포함할 수 있다. 변형으로, 스파이크 인 혼합물을 생성하는 것은 (예컨대, 사전 프로세싱 동안) 존재량 변형을 생략할 수 있다(예컨대, 방법(100)의 실시양태의 제1 경우에 대한 존재량 결과는 방법(100)의 실시양태의 후속 경우에서 사용되는 보정 계수 등을 결정하는 데 사용될 수 있다). 그러나, 분자를 조합하는 것은 임의의 적합한 방식으로 수행될 수 있다.
스파이크 인 혼합물을 생성하는 것은 바람직하게, 표적 연관 분자를 표적 분자와 함께 증폭시키는 것을 포함한다. 증폭은 중합효소 연쇄 반응 기반 기술(예컨대, 고체상 PCR, RT-PCR, qPCR, 다중 PCR, 터치다운 PCR, 나노PCR, 네스티드 PCR, 핫 스타트 PCR 등), 헬리카제 의존성 증폭(HDA: helicase-dependent amplification), 루프 매개 등온 증폭(LAMP: loop mediated isothermal amplification), 자기 부양 서열 복제(3SR: self-sustained sequence replication), 핵산 서열 기반 증폭(NASBA: nucleic acid sequence based amplification), 가닥 치환 증폭(SDA: strand displacement amplification), 롤링 써클 증폭(RCA: rolling circle amplification), 리가제 연쇄 반응, 리가제 사이클링 반응(LCR: ligase cycling reaction), 및/또는 임의의 다른 적합한 증폭 기술 및/또는 연관된 프로토콜(예컨대, 증폭 병목현상을 최소화시키는 프로토콜)중 임의의 하나 이상의 것을 수행하는 것을 포함할 수 있다. 한 예에서, 도 3에 제시된 바와 같이, 스파이크 인 혼합물을 생성하는 것은 복수의 PCR 라운드(예컨대, 임의의 회차의 PCR 라운드)를 수행하여 표적 분자와 함께 표적 연관 분자를 동시 증폭시키는 것을 포함할 수 있다(예컨대, 표적 연관 분자 및 표적 분자, 둘 모두가 공유하는 서열을 표적화하는 프라이머 세트 사용; 상이한 프라이머 유형 및 서열에 상응하는 상이한 프라이머 세트 사용, 도 3에 제시된 바와 같이, 프라이머 세트 중 하나 이상의 것은 예컨대, 서열 반복부의 부가를 용이하게 하기 위해 하나 이상의 헤어핀 서열을 포함할 수 있다).
변형으로, 스파이크 인 혼합물을 생성하는 것 및/또는 방법(100)의 실시양태의 적합한 일부분(예컨대, 변형으로, 표적 연관 분자를 포함하는 샘플을 독립적으로 제조하고, 표적 분자를 포함하는 샘플로부터 서열분석하는 경우; 변형으로, 참조 연관 분자를 포함하는 샘플을 독립적으로 제조하고, 참조 분자를 포함하는 샘플로부터 서열분석하는 경우 등)은 하나 이상의 서열 영역을 하나 이상의 분자에(예컨대, 하나 이상의 분자의 하나 이상의 영역 및/또는 서열; 표적 연관 분자에, 표적 분자에, 참조 연관 분자에, 참조 분자 등에) 첨가하는 것을 포함할 수 있다.
서열 영역을 첨가하는 것은 서열 반복부를 생성하는 것(예컨대, 표적 연관 서열 및/또는 표적 서열의 반복부를 포함하는 변형된 서열을 생성하는 것 등); 상이한 표적을 확인하는 서열 영역(예컨대, 원래의 표적에 의해 확인되는 염색체의 상이한 유전자좌; 상이한 염색체의 유전자좌; 상이한 병태와 연관된 서열 영역 등)을 첨가하는 것; 및/또는 임의의 적합한 뉴클레오티드 서열을 첨가하는 것 중 하나 이상의 것을 포함할 수 있다. 예를 들어, 방법(100)은 적어도 하나의 서열 영역을 표적 연관 분자 및 표적 분자의 세트 중 적어도 하나에 첨가하는 것을 포함할 수 있고, 여기서, 적어도 하나의 서열 영역은 (a) 제2 표적 서열 영역과 서열 유사성을 갖는 제2 표적 연관 영역(예컨대, 여기서, 표적 분자의 세트는 생물학적 표적 등의 표적 서열의 제1 표적 서열 영역과 서열 유사성을 갖는 제1 표적 연관 영역을 포함한다), 및 (b) 표적 연관 서열의 영역 및 표적 서열의 영역 중 적어도 하나의 적어도 하나의 서열 반복부 중 적어도 하나를 포함한다.
서열 영역을 첨가하는 것은 예컨대, 위치상 존재량 메트릭 추출의 기초가 되는 변이 영역 앞에 서열 영역을 첨가함으로써 서열분석 시스템으로부터의 결과 품질(예컨대, 크로마토그램 결과의 품질) 개선을 용이하게 하거나(예컨대, 여기서, 첨가된 서열 영역은 변이 영역이 서열분석 출력값 등에 상응하는 위치에 존재하도록 재배치시킬 수 있다); (예컨대, 상응하는 표적 염기 등과 관련된 변이 영역의 서열 반복부를 분석함으로써) 첨가된 서열 영역에 대한 추가의 개별 존재량 메트릭의 측정을 용이하게 하고, 이는 정확도가 개선된 전체 존재량 메트릭을 계산하는 데 사용될 수 있으며; 예컨대, 상이한 표적과 연관된 상이한 서열을 라이게이션시킴으로써, 요구되는 서열분석 작동의 횟수 및/또는 비용 감소(예컨대, 더 적은 횟수의 생어 서열분석 실행 등)를 용이하게 하여 (예컨대, 상이한 유전자좌, 염색체 등 간의) 복수의 표적을 분석하도록 하는 작용을 할 수 있다.
한 예에서, 방법(100)은 적어도 하나의 서열 반복부(예컨대, 동일한 또는 상이한 서열분석 실행으로 다중 패스 서열분석을 용이하게 하기 위해, 예컨대, 복수의 회차에 걸쳐 서열을 서열분석하기 위해, 예컨대, 서열분석 출력값 데이터를 증가시켜 서열분석 출력값 데이터 및/또는 연관된 존재량 메트릭의 평균을 구하고/거나, 다르게는 예컨대, 잡음 감소를 위해 조합하기 위해)를 하나 이상의 표적 연관 분자(예컨대, 표적 연관 분자의 표적 연관 서열의 하나 이상의 영역 등) 및/또는 하나 이상의 표적 분자(예컨대, 표적 분자의 표적 서열의 하나 이상의 영역 등)에 첨가하는 것을 포함할 수 있고, 예컨대, 여기서, 적어도 하나의 크로마토그램 관련 출력값(예컨대, 크로마토그램, 피크 강도, 다른 피크 데이터 등)의 제1의 피크 세트는 표적 연관 영역, 생물학적 표적의 표적 서열 영역, 표적 변이 영역, 및 생물학적 표적의 서열 영역에 대한 (예컨대, 생어 서열분석 작동으로부터의) 제1 서열분석에 상응하고, 여기서, 적어도 하나의 크로마토그램 관련 출력값은 표적 연관 영역, 생물학적 표적의 표적 서열 영역, 표적 변이 영역, 및 생물학적 표적의 서열 영역에 대한 (예컨대, 동일한 생어 서열분석 작동으로부터의) 제2 서열분석에 상응하는 제2의 피크 세트를 포함하고, 여기서, 표적 연관 존재량 비의 세트를 측정하는 것은 제1의 피크 세트 및 제2의 피크 세트에 기초할 수 있다(예컨대, 표적 서열 및 표적 연관 서열의 염기쌍에 대한 제1 및 제2의 피크 세트로부터의 피크 강도의 개별 존재량 비에 기초할 수 있다).
변형으로, 하나 이상의 서열 영역(예컨대, 서열 반복부 등)을 첨가하는 것은 하나 이상의 헤어핀 서열(예컨대, 프라이머의 헤어핀 서열, 예컨대, PCR 증폭에서 사용되는 것 등)에 기초할 수 있고, 예컨대, 여기서, 하나 이상의 헤어핀 서열을 포함하는 PCR 프라이머를 이용한 증폭은 생어 서열분석될 수 있는 서열 반복부 첨가를 위한 (예컨대, 자기 프라이밍을 통해) 복수의 뉴클레오티드 연장 인스턴스를 가능하게 할 수 있다. 한 예에서, 도 3에 제시된 바와 같이, 하나 이상의 서열 반복부를 (예컨대, 임의의 적합한 분자 등에) 첨가하는 것은 하나 이상의 헤어핀 서열(예컨대, 도 3 및 4에 제시된 바와 같이, "chr21:14439076_PCR2_RP_hp")을 포함하는 하나 이상의 프라이머 세트를 이용하여 샘플(예컨대, 모체 샘플; 생물학적 샘플 등)로부터의 표적 연관 분자 및 핵산 분자의 세트를 공동을 증폭(및/또는 별개로 증폭)시키는 것을 포함할 수 있고, 여기서, 핵산 분자는 표적 서열 영역을 포함한다. 한 예에서, 헤어핀 서열을 포함하는 프라이머(예컨대, PCR 프라이머)는 도 3 및 4에 제시된 서열("chr21:14439076_PCR2_RP_hp")의 하나 이상의 부위(예컨대, 서열 부위, 구조적 부위 등)를 포함할 수 있다. 한 예에서, 하나 이상의 헤어핀 서열에 기초하여 하나 이상의 서열 영역(예컨대, 서열 반복부 등) 첨가로부터 생성된 생성물(예컨대, 생성된 분자 등)은 도 5a-5e에 제시된 서열의 하나 이상의 부위(예컨대, 서열 부위, 구조적 부위 등)를 포함할 수 있다(예컨대, 여기서, 도 5a-5e는 전장의 서열을 도시한 것으로서, 여기서, 도 5a의 서열은 도 5b에 연결되고, 이는 도 5c에 연결되고, 이는 도 5d에 연결되고, 이는 도 5e 등에 연결된다).
예에서, 헤어핀이 오직 서열(예컨대, PCR 프라이머 서열)의 한쪽 단부에서만 사용되는 경우, 2 패스 생어 서열분석이 수득된다(예컨대, 서열의 2 패스에 대한, 피크 결과를 포함하는 크로마토그램 관련 출력값). 한 예에서, 2 패스 생어 서열분석의 중요한 공헌은, 상기 증가된 길이에서의 프라이머-이량체의 감소된 효과 때문에, 및 빅 다이(Big Dye) 3.1 화학법으로 더욱 긴 길이에서 품질이 개선되었기 때문에, 2차 서열(예컨대, 서열에 대한 제2의 피크 데이터 및/또는 적합한 크로마토그램 관련 출력값 세트 등)이 1차 패스 서열(예컨대, 서열에 대한 제1의 피크 데이터 및/또는 적합한 크로마토그램 관련 출력값 세트 등)보다 더욱 유용하고, 크로마토그램 콘텐츠가 더욱 뚜렷할 수 있다는 점이다. 예에서, 헤어피이 양쪽 단부 모두에서 사용되는 경우, 2개 초과의 복수의(예컨대, 다수, 다중 등)(예컨대, 2개 초과의 복수의) 동일한 서열에 대한 생어 크로마토그램이 수득될 것이며; 이는 평균화에 기인하여 존재량 측정과 연관된 임의의 잡음을 유의적으로 감소시킬 수 있지만, 프라이머-이량체의 효과를 유의적으로 감소시킬 수는 없다.
변형으로, (예컨대, 프라이머 등의) 헤어핀 서열은 표적 연관 분자 및 참조 연관 분자를 위해 구성, 그를 위해 생성, 그를 위해 사용될 수 있고/거나, 다르게는 그의 부재하에 프로세싱될 수 있다. 예를 들어, (예컨대, 하나 이상의 헤어핀 서열을 포함하는 PCR 프라이머를 이용한 증폭을 통해 생성된) 하나 이상의 서열 반복부는 표적 분자에, 참조 분자에, 및/또는 복수의 인스턴스를 위한 특정 서열의 생어 서열분석(및/또는 적합한 서열분석 기술)(예컨대, 다중의 데이터 세트가 단일 서열분석 실행에서 동일한 서열에 대해 생성될 수 있도록 하는 다중 패스 서열분석 등)을 가능하게 하는 적합한 분자에 첨가될 수 있다. 한 예에서, 주(major) 대립유전자 피크(예컨대, 피크 강도 메트릭)(및/또는 적합한 크로마토그램 관련 출력값 등) 대 부(minor) 대립유전자 피크(예컨대, 피크 강도 메트릭)(및/또는 적합한 크로마토그램 관련 출력값 등)의 비는 (예컨대, 헤어핀 서열 사용 등으로부터 생성된) 서열 반복부를 생어 서열분석하여 얻은 결과에 기초하여 복수의 회차에 걸쳐 측정될 수 있고, 이로써, 전체 존재량 비를 측정할 수 있다. 추가로 또는 대안적으로, 하나 이상의 서열 영역을 첨가하는 것은 표적 연관 분자 및/또는 참조 연관 분자의 프로세싱 없이 수행될 수 있고, 예컨대, 여기서, 하나 이상의 서열 영역을 첨가하는 것은 독립적으로 크로마토그램 관련 출력값, 존재량 메트릭, 특징화, 및/또는 치료를 개선시킬 수 있다(예컨대, 그의 정확도; 그에 관한 편향 감소; 그에 관한 잡음 감소 등).
그러나, 헤어핀 서열은 임의의 적합한 방식으로 구성될 수 있고, 헤어핀 서열에 기초하여 하나 이상의 서열 영역을 첨가하는 것은 임의의 적합한 방식으로 수행될 수 있다.
구체적인 예에서, 도 13a-13b에 제시된 바와 같이(예컨대, 스파이크 인 염기의 포지셔닝을 위해 약 150 염기쌍 길이의 앰플리콘의 연쇄 반복부를 미리 결정된 생어 품질 윈도우, 예컨대, 개선된 서열분석 출력값을 촉진시키는 윈도우로 생성하는 것을 도시; 여기서, 내인성 및 스파이크 인 대립유전자의 앰플리콘 혼합물은 LCR에 의해 원형화될 수 있고, 이어서, 여기서, 연쇄 반복부는 원형화된 앰플리콘의 RCA에 의해 생성될 수 있고, 여기서, 스파이크 인 염기의 위치는 음염 처리된 부위로 표시될 수 있고, 여기서, 크로마토그램은 다중 스파이크 인 유전자좌에 대한 다중 생어 서열분석으로부터 생성될 수 있고, 여기서, 4개의 유전자좌로부터 기원하는 앰플리콘을 LCR에 의해 원형 DNA로 어셈블리하고, 생성물을 RCA에 의해 증폭시키고, 생어 서열분석 등을 하였다), 서열 영역을 첨가하는 것은 표적 연관 핵산 및 표적 핵산을 동시 증폭시켜 생성된 앰플리콘 혼합물에 대해 라이게이션 작동(예컨대, Taq 리가제 및/또는 다른 적합한 리가제를 이용하는 리가제 사이클링 반응 등)을 수행하여 원형화된 앰플리콘을 생성하고; 원형화된 앰플리콘에 대해 증폭 작동(예컨대, 롤링 써클 증폭)을 수행하여 서열 반복부(예컨대, 연쇄 반복부)를 포함하는 하나 이상의 변형된 서열, 및/또는 상이한 표적을 확인하는 추가의 서열 영역을 생성하는 것을 포함할 수 있고, 여기서, 생성된 스파이크 인 혼합물(예컨대, 변형된 서열을 포함하는 선형 핵산 포함)은 후속 서열분석 작동(예컨대, 생어 서열분석 등)에서 사용될 수 있다. 서열 영역을 첨가하는 것은 바람직하게, 서열 영역을 표적 분자 기반 앰플리콘(예컨대, 내인성 표적 분자로부터 생성된 앰플리콘) 및 표적 연관 분자 기반 앰플리콘(예컨대, 스파이크 인 표적 연관 분자로부터 생성된 앰플리콘)을 포함하는 앰플리콘의 혼합물에 첨가하는 것은 포함한다. 대안적으로, 서열 영역을 첨가하는 것은 표적 분자과 별개로 표적 연관 분자에 대해 수행될 수 있다. 추가로 또는 대안적으로, 서열 영역이 먼저 (예컨대, 표적 연관 분자, 참조 연관 분자 등의 생성 동안) 예컨대, 초기 표적 연관 서열 및/또는 참조 연관 서열의 일부가 되도록 생성될 수 있다. 서열 영역을 첨가하는 것 및/또는 방법(100)의 실시양태의 임의의 적합한 일부분은 본원에 기술된 샘플 프로세싱 작동, 및/또는 다른 적합한 작동 중 임의의 것을 수행하는 것을 포함할 수 있다. 그러나, 서열 영역은 임의의 적합한 방식으로 구성될 수 있고, 서열 영역을 첨가하는 것은 임의의 적합한 방식으로 수행될 수 있다.
그러나, 표적 연관 서열, 표적 서열, 및/또는 다른 적합한 서열은 임의의 적합한 샘플 프로세싱 작동을 사용하여 임의의 적합한 방식으로(예컨대, 영역 결실, 특정 위치에서의 뉴클레오티드 변형 등) 변형될 수 있다. 그러나, 스파이크 인 혼합물을 생성하는 단계(S120)는 임의의 적합한 방식으로 수행될 수 있다.
2.3 서열분석 작동 수행.
방법(100)의 실시양태는 (예컨대, 하나 이상의 스파이크 인 혼합물 등에 기초하여) 하나 이상의 서열분석 작동을 수행하는 단계(S130)를 포함할 수 있고, 이는 하나 이상의 성분(예컨대, 하나 이상의 스파이크 인 혼합물 등)을 서열분석하고/거나, 하나 이상의 서열분석 출력값을 생성하는 작용을 할 수 있다. 서열분석 작동을 수행하는 것은 바람직하게, (예컨대, 스파이크 인 혼합물에 대해, 표적 분자에 대해 별개로, 표적 연관 분자 등에 대해 별개로) 생어 서열분석을 수행하는 것을 포함한다. 생어 서열분석은 바람직하게, 쇄 종결 접근법 및/또는 생어 서열분석과 관련된 임의의 적합한 작동(예컨대, 예컨대, 시험관내 DNA 복제 동안 표시된 디데옥시뉴클레오티드 및 DNA 폴리머라제 사용; 표적 연관 서열, 표적 서열, 참조 연관 분자 서열, 참조 서열, 임의의 적합한 서열의 염기에 대한 염기 위치를 커버하는 핵산 단편 세트 생성; 예컨대, 모세관 겔 전기영동, 표지된 염기의 레이저 검출을 통한 핵산 단편의 분석 수행; 임의의 적합한 생어 서열분석 관련 작동, 예컨대, 염료 종결인자 서열분석, 생어 서열분석과 연관된 자동화 및/또는 샘플 제조, 미세유체 생어 서열분석, 서열분석 출력값을 측정하는 전산 프로세스 등 수행)을 포함한다. 그러나, 생어 서열분석은 임의의 적합한 방식으로 수행될 수 있다.
서열분석 작동을 수행하는 것은 바람직하게, 하나 이상의 동시 증폭된 스파이크 인 혼합물(예컨대, 동시 증폭된, 표적 연관 분자 및 연관된 표적 서열 영역을 포함하는 핵산을 포함하는 스파이크 인 혼합물 등)을 서열분석하는 것을 포함하지만, 추가로 또는 대안적으로는, 임의 회차의 서열분석 작동(예컨대, 임의의 회차의 생어 서열분석 실행 등)을 이용하여 임의의 적합한 성분을 서열분석할 수 있다(예컨대, 제1 샘플로부터의 표적 연관 분자 및 제2 샘플로부터의 표적 분자; 스파이크 인 혼합물; 사용자로부터의 샘플; 참조 연관 분자 및/또는 참조 분자를 포함하는 샘플 등을 별개로 서열분석할 수 있다).
서열분석 작동을 수행함으로써 바람직하게는 하나 이상의 서열분석 출력값(예컨대, 그에 대한 존재량 메트릭이 측정될 수 있는 정량적 서열분석 출력값 등)을 측정할 수 있다. 서열분석 출력값은 크로마토그램 관련 출력값, 서열 리드, 고처리량 서열분석 출력값, 텍스트 데이터, 정렬, 및/또는 임의의 적합한 서열분석 기술로부터의 임의의 다른 적합한 결과 중 임의의 하나 이상의 것을 포함할 수 있다. 크로마토그램 관련 출력값은 크로마토그램(예컨대, 본원에 기술된 임의의 적합한 분자의 임의의 적합한 연관된 영역의 표적 연관 분자 서열, 표적 서열, 참조 연관 분자 서열, 참조 서열의 서열분석된 염기에 대한 피크 포함), 정렬 위치(예컨대, 피크 및/또는 생어 서열분석에 의해 서열분석된 염기에 상응; 각 정렬 위치는 하나 이상의 피크 및/또는 하나 이상의 염기에 상응; 복수의 정렬된 서열의 염기, 예컨대, 표적 연관 서열 및 표적 서열의 염기에 상응; 도 6a 및 7a 등에 제시된 바와 같음), 임의의 적합한 서열분석 관련 위치, 피크 강도, 피크 면적, 피크 유사성, 피크 차이, 동일한 또는 상이한 염기 유형에 대한 피크 대비의 피크 메트릭; 평균 강도; 강도 중간값; 높이; 너비; 동일한 위치 또는 상이한 위치에서의 표적 연관 염기 및 표적 염기의 피크 사이의 중복 및/또는 다른 비교, 텍스트 데이터(예컨대, 생어 서열분석으로부터의 텍스트 결과 등), 및/또는 임의의 다른 적합한 결과(예컨대, 생어 서열분석과 관련된 것 등) 중 임의의 하나 이상의 것을 포함할 수 있다. 예를 들어, 도 8에 제시된 바와 같이, 크로마토그램 관련 출력값은 상이한 혼합물에 대한 크로마토그램(예컨대, 스파이크 인 혼합물에 대한 제1 크로마토그램, 표적 연관 분자만 단독인 것에 대한 제2 크로마토그램, 표적 분자만 단독인 것에 대한 제3 크로마토그램 등)을 포함할 수 있고, 예컨대, 상이한 염기에 대한 크로마토그램 피크는 서열분석 출력값 추출을 위해 전산 방식으로 프로세싱될 수 있다.
하나 이상의 특정 염기에 대한 (예컨대, 생어 서열분석에 대한 피크와 관련된) 서열분석 출력값은 특정 염기 앞의 염기의 개수 및/또는 유형에 대한 의존을 포함할 수 있고(그리고/또는 다르게는 특정 염기와 관련이 있고), 여기서, 스파이크 인 혼합물 생성에서 서열 영역(예컨대, 서열 반복부) 첨가가 상기 의존의 원인이 될 수 있다. 추가로 또는 대안적으로, 표적 연관 서열 및/또는 참조 연관 분자 서열에 대한 변이 영역 서열을 측정하는 것은 (예컨대, 서열 중 선행 염기의 개수 및/또는 유형에의) 의존 및/또는 다른 적합한 서열분석 파라미터(예컨대, 서열분석 기술의 특징, 예컨대, 생어 서열분석의 특징 등)에 기초할 수 있고, 예컨대, 여기서, 변이 영역에 대한 미리 결정된 삽입 및/또는 결실은 존재량 메트릭 측정을 용이하게 하는 데에서 피크 강도 및/또는 다른 적합한 크로마토그램 관련 출력값을 정확하게 비교할 수 있도록 하는 데 보정(예컨대, 자동 보정)을 가능하게 할 수 있다. 예를 들어, 표적 변이 영역은 하나 이상의 삽입 및 하나 이상의 결실 중 적어도 하나를 포함하고, 여기서, 적어도 하나의 크로마토그램 관련 출력값은 (예컨대, 제1 표적 연관 영역, 생물학적 표적의 표적 서열 영역, 표적 변이 영역, 및 생물학적 표적의 서열 영역 등과 연관된) 피크에 상응하는 정렬 위치를 포함하고, 여기서, 각 상이한 쌍의 경우(예컨대, 표적 연관 서열의 염기 및 표적 서열의 염기 등), 제1 표적 연관 서열의 염기는 (예컨대, 도 6a 및 7a에 제시된 바와 같이) 제1 표적 서열의 염기에 상응하는 제2 정렬과 상이한 제1 정렬 위치에 상응하고, 여기서, 적어도 하나의 크로마토그램 관련 출력값의 정렬 위치는 제1 및 제2 정렬 위치를 포함한다.
한 예에서, 변이 영역은 존재량 메트릭 측정에서의 개선된 정확도를 위해 보정 및/또는 적합한 프로세싱 작동(예컨대, 디콘볼루션, 보정 계수 결정 및 적용 등)을 가능하게 할 수 있는 미리 결정된 셔플링된 염기(예컨대, 염기 치환 등)를 포함할 수 있다. 그러나, 임의의 적합한 영역 및/또는 서열 결정은 임의의 적합한 방식으로 임의의 적합한 서열분석 파라미터에 기초할 수 있다. 추가로 또는 대안적으로, 특정 염기 및/또는 다른 서열 영역에 대한 서열분석 출력값, 및/또는 임의의 적합한 영역 및/또는 서열 결정은 다른 서열 영역 및/또는 적합한 서열분석 파라미터와는 독립적일 수 있다.
변형으로, 하나 이상의 서열분석 작동을 수행하는 것은 서열 영역(예컨대, 서열 반복부 등)이 첨가된 하나 이상의 생성물(예컨대, 스파이크 인 혼합물의 성분; 표적 연관 분자, 표적 분자 및/또는 다른 적합한 분자 등), 예컨대, 헤어핀 서열에 기초하여(예컨대, 하나 이상의 헤어핀 서열을 포함하는 PCR 프라이머를 이용한 증폭 등에 기초하여) 생성된 하나 이상의 생성물에 대한 것일 수 있다. 서열 반복부를 포함하는 생성물에 대에 서열분석 작동을 수행하는 것은 추가의 서열분석 출력값 생성을 위해 복수의 회차에 걸쳐 하나 이상의 서열 및/또는 서열 영역을 서열분석하는 작용을 할 수 있고, 이는 잡음을 감소시킬 수 있고/거나, 추가의 존재량 메트릭 측정을 위해(예컨대, 개선된 정확도로 전체 존재량 메트릭 등을 측정하기 위해), 및/또는 임의의 적합한 목적을 위해(예컨대, 특징화 및/또는 치료 용이 등을 위해) 사용될 수 있다.
추가로 또는 대안적으로, 서열분석 작동(및/또는 방법(100) 및/또는 시스템(200)의 실시양태의 임의의 적합한 일부분)을 수행하는 것은 임의의 적합한 서열분석 및/또는 서열분석 관련 기술, 예컨대, 고처리량 서열분석을 결정, 적용, 수행 및/또는 다르게는 그를 사용하는 것을 포함할 수 있고, 이는 NGS, NGS 연관 기술, 대량 병렬 시그너처 서열분석, 폴로니(Polony) 서열분석, 454 피로시퀀싱, 일루미나(Illumina) 서열분석, SOLiD 서열분석, 이온 토렌트(Ion Torrent) 반도체 서열분석, DNA 나노볼 서열분석, 헬리스코프(Heliscope) 단일 분자 서열분석, 단일 분자 실시간(SMRT: Single molecule real time) 서열분석, 나노포어 DNA 서열분석, 임의의 세대의 서열분석 기술(예컨대, 제2세대 서열분석 기술, 제3세대 서열분석 기술, 제4세대 서열분석 기술 등), 앰플리콘 연관 서열분석(예컨대, 표적화된 앰플리콘 서열분석), 메타게놈 연관 서열분석, 합성에 의한 서열분석, 터널링 전류 서열분석, 하이브리드화에 의한 서열분석, 질량 분석법 서열분석, 현미경검사법 기반 기술, 및/또는 고처리량 서열분석과 관련된 임의의 적합한 기술 중 임의의 하나 이상의 것을 포함할 수 있고/거나, 그와 연관될 수 있다. 추가로 또는 대안적으로, 서열분석 및/또는 서열분석 관련 기술은 임의의 적합한 기술(예컨대, 모세관 서열분석 등)을 포함할 수 있다.
그러나, 서열분석 작동을 수행하는 단계(S130)는 임의의 적합한 방식으로 수행될 수 있다.
2.4 존재량 메트릭 측정.
방법(100)의 실시양태는 (예컨대, 하나 이상의 샘플에 대해; 하나 이상의 스파이크 인 혼합물에 대한 하나 이상의 서열분석 작동의 결과 등에 기초하여) 하나 이상의 존재량 메트릭을 측정하는 단계(S140)을 포함할 수 있고, 이는 존재량 메트릭, 예컨대, 의미 있게 분석 및 비교될 수 있는 (예컨대, 존재량 비 생성을 위해 표적 분자 및 표적 연관 분자에 대한 개별 존재량을 비교, 표적 대 참조에 대한 존배량 비 비교 등) 존재량 메트릭, 예컨대, 특징화 및/또는 치료를 용이하게 하는 데 사용될 수 있는 존재량 메트릭을 정확하게 측정하는 작용을 할 수 있다. 존재량 메트릭은 존재량 비(예컨대, 제1 피크에 대한 제1 피크 강도 메트릭 대 제2 피크에 대한 제2 피크 강도 메트릭의 비(예컨대, 여기서, 제1 및 제2 피크는 동일한 또는 상이한 정렬 위치에 상응한다); 임의의 적합한 서열분석 출력값의 비; 내인성 표적 분자 계수 대 표적 연관 분자 계수의 계수 비; 내인성 대 스파이크 인의 서열분석 출력값 비, 예컨대, 표적 서열 염기 및 상응하는 표적 연관 서열 염기에 대한 피크 강도 메트릭 비; 임의의 적합한 분자 및 분모로의 비; 예컨대, 전체 존재량 비 및/또는 존재량 메트릭을 측정하는 데 이용가능한 개별 존재량 비 등) 중 임의의 하나 이상의 것을 포함할 수 있지만, 이는 추가로 또는 대안적으로, 개별 존재량(예컨대, 개별 피크 강도; 계수 등), 상대적인 존재량, 절대 존재량, 및/또는 다른 적합한 존재량 메트릭을 포함할 수 있다. 구체적인 예에서, 내인성 분자 대 스파이크 인 분자의 비(예컨대, 내인성 DNA와 스파이크 인 DNA 사이의 비 등)는 서열분석 출력값 비(예컨대, 내인성 연관 피크에 대한 피크 강도 대 스파이크 인 연관 피크의 비) 및 (예컨대, 스파이크 인 혼합물을 생성하는 데 사용된) 스파이크 인 분자의 공지된 존재량에 기초하여 계산될 수 있다.
존재량 메트릭 측정은 바람직하게, 하나 이상의 서열분석 출력값에 기초하지만, 이는 추가로 또는 대안적으로 임의의 적합한 데이터(예컨대, 공지된 존재량을 포함하는 보충 데이터, 생물측정 데이터, 병력 데이터, 인구 통계 데이터, 유전적 이력, 조사 데이터, 식이 데이터, 행동 데이터, 환경 데이터, 샘플 유형, 및/또는 다른 적합한 콘텍스트 데이터)에 기초할 수 있다. 예를 들어, 존재량 비(예컨대, 표적 연관 존재량 비 등)(및/또는 임의의 적합한 존재량 메트릭) 측정은 하나 이상의 피크 강도, 피크 면적, 염기 유형을 공유하는 염기에 대한 피크 메트릭, 염기 유형이 상이한 염기에 대한 피크 메트릭을 포함하는 하나 이상의 크로마토그램 관련 출력값, 및/또는 임의의 다른 적합한 크로마토그램 관련 출력값 및/또는 서열분석 출력값에 기초할 수 있다. 존재량 메트릭 측정은 (예컨대, 원격 컴퓨팅 시스템, 예컨대, 클라우드 컴퓨팅 시스템을 이용, 로컬 컴퓨팅 시스템 등을 이용하는) 전산 프로세싱, 예컨대, 하나 이상의 서열분석 출력값(예컨대, 크로마토그램, 피크 데이터 등) 및/또는 다른 적합한 데이터를 전산 방식으로 프로세싱하는 것을 포함할 수 있지만, 이는 추가로 또는 대안적으로 임의의 적합한 프로세싱(예컨대, 수동 프로세싱 등)을 포함할 수 있다. (예컨대, 존재량 메트릭 등을 측정하는) 프로세싱 및/또는 방법(100)의 실시양태의 적합한 일부분(예컨대, 특징화 및/또는 치료를 용이하게 하는 것 등)은 데이터에 대한 통계적 추정(예컨대, 보통 최소 제곱 회귀, 비음 최소 제곱 회귀, 주성분 분석, 능형 회귀 등)을 수행, 디콘볼루션 (예컨대, 크로마토그램으로부터의 중복 피크의 디콘볼루션, 부적절한 분리도를 갖는 피크의 디콘볼루션, 임의의 적합한 피크의 디콘볼루션; 푸리에(Fourier) 디콘볼루션; 가우스 함수(Gaussian function) 기반 디콘볼루션; 루시-리차드슨(Lucy- Richardson) 디콘볼루션 등), (예컨대, 크로마토그램의 임의의 적합한 개수의 피크 등에 대한) 특징 추출, 데이터에 대한 패턴 인식 수행, 다중 소스로부터의 데이터 융합, 값 조합(예컨대, 값 평균화 등), 압축, 변환(예컨대, 디지털-아날로그 변환, 아날로그-디지털 변환), 파 변조, 정규화, 업데이팅, 순위화, 검증하는, (예컨대, 기준선 보정, 데이터 크로핑 등을 위한) 필터링, 잡음 감소, 평활, 필링 (예컨대, 갭 필링), 정렬, 모델 피팅, 윈도잉, 클립핑, 변환, 수학적 연산(예컨대, 도함수, 이동 평균, 합산, 감산, 곱셈, 나눗셈 등), 다중화, 역다중화, 내삽화, 외삽화, 클러스터링, 다른 신호 프로세싱 작동, 다른 영상 프로세싱 작동, 시각화, 및/또는 임의의 다른 적합한 프로세싱 작동 중 임의의 하나 이상의 것을 포함할 수 있다.
변형으로, 존재량 메트릭 측정은 하나 이상의 삽입(예컨대, 뉴클레오티드 삽입 등) 및/또는 하나 이상의 결실(예컨대, 뉴클레오티드 결실 등) 및/또는 임의의 적합한 변형을 갖는 변이 영역을 포함하는 표적 연관 서열(및/또는 참조 연관 서열)과 연관된 하나 이상의 서열분석 출력값에 기초할 수 있고/거나, 다르게는 그와 연관될 수 있다. 예를 들어, 표적 연관 존재량 비의 세트 측정은 피크의 세트(예컨대, 표적 서열 및 표적 연관 서열의 서열분석된 염기에 상응하는 피크에 대한 피크 강도 데이터 등) 및 치환, 삽입, 및 결실(예컨대, 하나 이상의 치환, 삽입, 및/또는 결실의 특징; 예컨대, 뉴클레오티드 개수와 관련된 변형의 크기; 예컨대, 염기 유형 변이와 관련된 변형의 유형; 변형이 적용된 위치 등) 중 적어도 하나에 기초할 수 있다. 도 6a 및 7a에 제시된 바와 같이, 하나 이상의 삽입 및/또는 결실을 포함하는 변이 영역은 정렬 위치를 이동시킬 수 있다(예컨대, 염기 표적 서열 기준으로, 표적 연관 서열의 염기에 대하여; 예컨대, 표적 연관 영역 및 표적 서열 영역의 염기 사이의 서열 유사성은 하나 이상의 삽입 및/또는 결실 등에 기인하여 위치와 관련하여 이동이 있을 수 있다). 한 예에서, 표적 변이 영역(예컨대, 표적 연관 서열 등의 것)은 삽입 및 결실 중 적어도 하나를 포함할 수 있고, 여기서, 하나 이상의 크로마토그램 관련 출력값은 피크의 세트(예컨대, 표적 연관 분자의 표적 연관 영역, 생물학적 표적의 표적 서열 영역, 표적 연관 분자의 표적 변이 영역, 및 생물학적 표적의 서열 영역에 대한 및/또는 그와 연관된 피크 데이터 등)에 상응하는 정렬 위치를 포함할 수 있고, 여기서, 표적 연관 존재량 비(및/또는 적합한 존재량 메트릭)의 세트를 측정하는 것은 (예컨대, 표적 연관 서열의 염기 및 표적 서열의 염기 등의) 각 상이한 쌍에 대하여 적어도 하나의 크로마토그램 관련 출력값에 기초하여(예컨대, 서열분석된 염기에 대한 피크 강도 데이터에 기초하여; 크로마토그램 등에 기초하여) 쌍의 표적 연관 서열의 염기에 대해 정렬 위치의 제1 정렬 위치에서 피크 강도 메트릭(예컨대, 피크에 대한 최대 강도; 피크에 대한 전체 강도 등)을 측정하고/거나; 적어도 하나의 크로마토그램 관련 출력값에 기초하여(예컨대, 서열분석된 염기에 대한 피크 강도 데이터에 기초하여; 크로마토그램 등에 기초하여) 쌍의 표적 서열의 염기에 대해 정렬 위치의 제2 정렬 위치에서 피크 강도 메트릭을 측정하는 것을 포함하고/거나, 여기서, 제1 정렬 위치는 제2 정렬 위치와 상이하고, 여기서, 정렬 위치는 제1 및 제2 정렬 위치를 포함하고; 표적 연관 서열의 염기에 대한 피크 강도 메트릭, 및 제1 표적 서열의 염기에 대한 피크 강도 메트릭에 기초하여 표적 연관 존재량 비의 세트(및/또는 적합한 존재량 메트릭의 세트 등)의 표적 연관 존재량 비(및/또는 적합한 존재량 메트릭 등)를 측정하는 것을 포함한다. 한 예에서, 도 6a 및 7a에 제시된 바와 같이, 제1 정렬 위치는 제1 피크 세트의 제1 피크 및 제2 피크(예컨대, 동일한 정렬 위치에 상응하는; 동일한 또는 상이한 염기 유형에 상응하는 중복 피크 등)에 상응할 수 있고, 여기서, 제1 피크는 표적 연관 서열의 중복 염기에 상응하고(예컨대, 여기서, 표적 연관 서열 염기는 도 6a 및 7a에 제시된 바와 같이 "*"로 마킹되어 있다), 여기서, 제1 피크는 표적 연관 존재량 비의 세트의 표적 연관 존재량 비(예컨대, 표적 연관 서열의 중복 염기, 및 표적 서열의, 정렬 위치가 이동된 상응하는 염기의 쌍에 대한 것, 여기서, 정렬 위치 이동량은 하나 이상의 삽입 및/또는 결실의 특징, 예컨대, 하나 이상의 삽입 및/또는 결실의 크기 등에 기초한다)에 상응하고, 여기서, 제2 피크는 표적 서열의 중복 염기에 상응하고/거나(예컨대, 여기서, 표적 서열 염기는 도 6a 및 7a에 제시된 바와 같이 "O"로 마킹되어 있다), 제2 피크는 표적 연관 존재량 비의 세트의 제2 표적 연관 존재량 비(제1 표적 연관 존재량 비와는 별개인 것; 표적 서열의 중복 서열, 및 표적 연관 서열의, 정렬 위치가 이동된 상응하는 염기의 쌍에 대한 것)에 상응한다.
구체적인 예에서, 도 6a-6b에 제시된 바와 같이, 영역 chr21: 15811326-15811417에 대한 샘플 DNA의 초기 존재량은 (예컨대, 표적 연관 분자 및 표적 서열을 포함하는 표적 분자의 동시 증폭으로부터 생성된 스파이크 인 혼합물의 생어 서열분석 등의 이후에) hg19, "참조" DNA 강도 대 스파이크 인 "Spk" 강도의 비를 추정함으로써 측정될 수 있고; 여기서, 표적 연관 서열(예컨대, 스파이크 인 서열; 표적 연관 분자의 것 등)을 3개의 뉴클레오티드 결실을 포함하고, 이로써, 표적 연관 서열 및 표적 서열로부터의 염기의 상응하는(예컨대, 유사한 서열 등) 쌍에 대한 정렬 위치에서 3개의 위치 이동이 이루어지고; 여기서, 개별 표적 연관 존재량 비는 상응하는 쌍의 피크 강도(예컨대, 크로마토그램의 피크에서 "*" 및 "O"의 위치에 의해 표시된 것)에 기초하여 측정될 수 있고(예컨대, 여기서, 표적 연관 서열의 "C" 염기에 상응하고, "*"로 표시된 정렬 위치 161에 대한 개별 존재량 비는 표적 연관 서열의 "C" 염기에 대한 피크 강도 메트릭(예컨대, 피크에 대한 최대 강도) 대 "O"로 표시되고, 표적 연관 서열의 변이 영역에서의 3개의 뉴클레오티드 결실로부터의 정렬 위치 이동에 기인하여 164번 위치에 있는, 표적 서열의 "C" 염기에 대한 피크 강도 메트릭(예컨대, 피크에 대한 최대 강도)의 비 등에 기초하여 측정될 수 있다), 예컨대, 여기서, 표적 연관 비는 플롯팅될 수 있고/거나(예컨대, 도 6b에 제시된 바와 같이; 예컨대, 여기서, 각각 161 및 164번 위치의 "C" 염기의 쌍에 대한 개별 존재량 비는 플롯 등에서 정렬 위치 번호 "161"로 표시되어 있다), 예컨대, 여기서, 데이터 점의 기울기(예컨대, 0.185; 표적 연관 존재량 비 데이터 점에 대한 선형 회귀; 플롯의 것 등)는 표적 연관 분자의 존재량 대비 샘플 중 표적 분자의 존재량을 설명하는 존재량 메트릭일 수 있다(예컨대, 내인성 DNA 대 스파이크 인 DNA의 존재량; 샘플 DNA는 스파이크 인 DNA 수준의 0.185로 존재하였다).
구체적인 예에서, 도 7a-7b에 제시된 바와 같이, 영역 chr21: 22231528+22231612에 대한 샘플 DNA의 초기 존재량은 (예컨대, 표적 연관 분자 및 표적 서열을 포함하는 표적 분자의 동시 증폭으로부터 생성된 스파이크 인 혼합물의 생어 서열분석 등의 이후에) hg19, "참조" DNA 강도 대 스파이크 인 "Spk" 강도의 비를 추정함으로써 측정될 수 있고; 여기서, 표적 연관 서열(예컨대, 스파이크 인 서열; 표적 연관 분자의 것 등)을 3개의 뉴클레오티드 결실을 포함하고, 이로써, 표적 연관 서열 및 표적 서열로부터의 염기의 상응하는(예컨대, 유사한 서열 등) 쌍에 대한 정렬 위치에서 3개의 위치 이동이 이루어지고; 여기서, 개별 표적 연관 존재량 비는 상응하는 쌍의 피크 강도(예컨대, 크로마토그램의 피크에서 "*" 및 "O"의 위치에 의해 표시된 것)에 기초하여 측정될 수 있고(예컨대, 여기서, 표적 연관 서열의 "G" 염기에 상응하고, "*"로 표시된 정렬 위치 15에 대한 개별 존재량 비는 표적 연관 서열의 "G" 염기에 피크 강도 메트릭(예컨대, 피크에 대한 최대 강도) 대 "O"로 표시되고, 표적 연관 서열의 변이 영역에서의 3개의 뉴클레오티드 결실로부터의 정렬 위치 이동에 기인하여 18번 위치에 있는, 표적 서열의 "G" 염기에 대한 피크 강도 메트릭(예컨대, 피크에 대한 최대 강도)의 비 등에 기초하여 측정될 수 있다), 예컨대, 여기서, 표적 연관 비는 플롯팅될 수 있고/거나(예컨대, 도 7b에 제시된 바와 같이; 예컨대, 여기서, 각각 15 및 18번 위치의 "G" 염기의 쌍에 대한 개별 존재량 비는 플롯 등에서 정렬 위치 번호 "15"로 표시되어 있다), 예컨대, 여기서, 데이터 점의 기울기(예컨대, 0.34; 표적 연관 존재량 비 데이터 점에 대한 선형 회귀; 플롯의 것 등)는 표적 연관 분자의 존재량 대비 샘플 중 표적 분자의 존재량을 설명하는 존재량 메트릭일 수 있다(예컨대, 내인성 DNA 대 스파이크 인 DNA의 존재량; 샘플 DNA는 스파이크 인 DNA 수준의 0.34로 존재하였다).
그러나, 하나 이상의 삽입, 결실, 및/또는 적합한 변형을 포함하는 변이 영역과 연관된 서열분석 출력값에 기초하는 및/또는 다르게는 그와 연관된 존재량 메트릭을 측정하는 것은 임의의 적합한 방식으로 수행될 수 있다.
변형으로, 존재량 메트릭을 추출하는 것은 변이 영역 위치의 표적 연관 서열 염기(예컨대, "A" 염기)에 상응하는 제1 피크, 및 상기 위치의 표적 서열 염기(예컨대, "T" 염기)에 상응하는 제2 피크를 포함하는 중복 피크(예컨대, 크로마토그램 피크 등)를 디콘볼루션하고; 디콘볼루션 피크에 대한 서열분석 출력값 및/또는 존재량 메트릭(예컨대, "T" 염기 대 "A" 염기에 대한 피크 강도의 비)를 계산하는 것을 포함할 수 있다. 변형으로, 디콘볼루션은 제1 유전자좌(예컨대, 18번 염색체)의 염기와 제2 유전자좌의(예컨대, 동일한 염색체의, 예컨대, 21번 염색체와 같이, 상이한 염색체 등의) 염기 사이의 중복 피크에 대한 것일 수 있다.
변형으로, 도 8에 제시된 바와 같이, 스파이크 인 혼합물 크로마토그램으로부터의 표적 및 표적 연관 서열의 상대적인 존재량의 통계적 추정은 표적 분자 단독의 것에 대한 제1 크로마토그램(및/또는 임의의 적합한 서열분석 출력값 예컨대, 피크 데이터 등) 및/또는 표적 연관 분자단독의 것에 대한 제2 크로마토그램(및/또는 임의의 적합한 서열분석 출력값 등)에 기초할 있다(예컨대, 여기서, 크로마토그램 및/또는 서열분석 출력값의 세트 간의 염기 염기에 대한 피크는 다중 선형 회귀 등에 대해 프로세싱될 수 있다). 변형으로, 디콘볼루션(예컨대, 루시-리차드슨 디콘볼루션)은 크로마토그램의 피크를 분석하는 데 (예컨대, 동일한 색상의 피크 사이의 개선된 분리를 달성하는 데), 및/또는 다른 적합한 결과를 분석하는 데 적용될 수 있다. 구체적인 예에서, 방법(100)은 크로마토그램의 세트(예컨대, 스파이크 인 혼합물에 대한 것, 표적 연관 분자만 단독인 것에 대한 것, 표적 분자만 단독인 것에 대한 것 등)를 생성하는 단계; 디콘볼루션을 통해 크로마토그램의 세트의 피크를 분석하는 단계(예컨대, 여기서, 상기의 것 및/또는 다른 적합한 작동 등은 생략될 수 있다); 및 프로세싱된 크로마토그램에 대해 회귀 분석을 수행하는 단계를 포함할 수 있다. 추가로 또는 대안적으로, 디콘볼루션, 회귀 분석, 또는 다른 전산 작동은 임의의 적합한 개수의 크로마토그램 피크 및/또는 서열분석 시스템 결과의 다른 성분에 대해 및 그의 조합으로 수행될 수 있다
변형으로, 존재량 메트릭을 측정하는 것은 복수의 개별 존재량 메트릭으로부터 전체 존재량 메트릭을 측정하는 것을 포함할 수 있고, 이는 존재량 메트릭의 정확도를 증가시킬 수 있다. 한 예에서, 방법(100)은 표적 연관 분자의 제1 세트(예컨대, 제1 표적 서열의 제1 표적 서열 영역과 서열 유사성을 갖는 제1 표적 연관 영역을 포함하는 제1 표적 연관 서열을 포함), 표적 분자의 세트, 및 표적 연관 분자의 제2 세트와 연관된 생어 서열분석에 기초하여 적어도 하나의 크로마토그램 관련 출력값을 측정하는 단계로서, 여기서, 표적 연관 분자의 제2 세트는 제2 표적 서열의 제2 표적 서열 영역과 서열 유사성을 갖는 제2 표적 연관 영역을 포함하는 제2 표적 연관 서열을 포함하는 것인 단계; 적어도 하나의 크로마토그램 관련 출력값에 기초하여 제1 표적 연관 서열 및 제1 표적 서열의 상이한 염기 세트에 대한 표적 연관 존재량 비의 제1 세트를 측정하는 단계(예컨대, 여기서, 상이한 염기 세트로부터의 각각의 상이한 염기 세트는 제1 표적 연관 서열의 적어도 하나의 염기 및 제1 표적 서열의 적어도 하나의 염기 등을 포함한다); 적어도 하나의 크로마토그램 관련 출력값에 기초하여 제2 표적 연관 서열 및 제2 표적 서열의 상이한 염기 세트에 대한 표적 연관 존재량 비의 제2 세트를 측정하는 단계(예컨대, 여기서, 상이한 염기 세트로부터의 각각의 상이한 염기 세트는 제2 표적 연관 서열의 적어도 하나의 염기 및 제2 표적 서열의 적어도 하나의 염기 등을 포함한다); 및/또는 표적 연관 존재량 비의 제1 및 제2 세트에 기초하여 (예컨대, 샘플에 대한 생물학적 표적의 존재량 등을 설명하는) 하나 이상의 전체 존재량 메트릭을 측정하는 단계를 포함할 수 있다. 한 예에서, 제1 표적 서열은 염색체의 제1 유전자좌에 상응할 수 있고, 여기서, 제2 표적 서열은 상기 염색체의 제2 유전자좌에 상응할 수 있고, 여기서, 하나 이상의 병태의 특징화를 용이하게 하는 것은 하나 이상의 전체 존재량 메트릭에 기초하여 염색체 이상의 특징화를 용이하게 하는 것을 포함할 수 있다.
예를 들어, 도 9에 제시된 바와 같이, 전체 존재량 비 메트릭을 측정하는 것은 변이 영역의 각 위치의 염기에 대한 내인성 연관 피크 및 상응하는 스파이크 인 연관 피크의 쌍에 대한 서열분석 출력값(예컨대, 피크 강도 등)에 기초하여 상기 변이 영역의 각 위치에 대한 개별 서열분석 출력값 비를 측정하는 단계로서, 여기서, 개별 서열분석 출력값 비는 임의의 개수의 유전자좌(예컨대, 여기서, 상이한 유전자좌에 대한 개별 서열분석 출력값 비는 상이한 유전자좌에 대한 상이한 크로마토그램으로부터 추출된 것이고; 여기서, 비는 복수의 유전자좌 등에 대한 데이터를 비롯한 동일한 크로마토그램으로부터 추출된 것이다), 염색체, 표적, 및/또는 다른 적합한 측면 간의 임의의 개수의 염기 위치에 걸쳐 존재할 수 있는 단계; 및 개별 서열분석 출력값 비를 조합(예컨대, 평균화)하는 단계)에 기초할 수 있다. 추가로 또는 대안적으로, 개별 존재량 메트릭으로부터 전체 존재량 메트릭을 측정하는 것은 임의의 적합한 통계 접근법(예컨대, 평균화, 중간값 등)을 레버리지할 수 있고/거나, 임의의 적합한 방식으로 수행될 수 있다. 변형으로, 상이한 존재량 메트릭 세트는 별개로 제조 및/또는 서열분석 샘플(예컨대, 표적 연관 분자를 포함하는 제1 샘플, 및 표적 분자를 포함하는 제2 샘플에 대한 것, 여기서, 제1 및 제2 샘플은 별개로 제조 및/또는 서열분석, 예컨대, 생어 서열분석 등이 수행될 수 있다)에 대해 측정될 수 있다. 예를 들어, 방법(100)은 표적 연관 분자의 세트를 포함하는 제1 샘플 생어 서열분석; 및 표적 분자의 세트를 포함하는 제2 샘플의 생어 서열분석을 포함하는 생어 서열분석(예컨대, 제1 당사자, 제3자, 사용자, 및/또는 임의의 적합한 엔티티 등에 의해 수행)을 포함할 수 있고, 여기서, 적어도 하나의 크로마토그램 관련 출력값(예컨대, 피크 강도의 세트; 크로마토그램 등)을 측정하는 것은 제1 샘플의 생어 서열분석에 기초하여 표적 연관 분자의 세트(예컨대, 표적 연관 분자의 세트의 표적 연관 서열의 염기에 대한 피크 강도 데이터 등)와 연관된 제1 크로마토그램 관련 출력값(예컨대, 크로마토그램, 피크 강도의 세트 등)를 측정하고; 제2 샘플의 생어 서열분석에 기초하여 표적 분자의 세트(예컨대, 표적 연관 분자의 세트의 표적 연관 서열의 염기에 대한 피크 강도 데이터 등)와 연관된 제1 크로마토그램 관련 출력값(예컨대, 크로마토그램, 피크 강도의 세트 등)를 측정하는 것을 포함할 수 있고, 여기서, 표적 연관 존재량 비(및/또는 임의의 적합한 존재량 메트릭)의 세트를 측정하는 것은 제1 크로마토그램 관련 출력값 및 제2 크로마토그램 관련 출력값에 기초하여 표적 연관 존재량 비의 세트를 측정하는 것을 포함할 수 있다(예컨대, 제1 크로마토그램 관련 출력값에 기초하여 표적 연관 분자 세트에 대한 개별 존재량 비의 제1 세트 측정; 제2 크로마토그램 관련 출력값에 기초하여 표적 분자 세트에 대한 개별 존재량 비의 제2 세트 측정; 여기서, 전체 존재량 비는 개별 존재량 비 등에 기초하여 측정될 수 있다).
변형으로, 존재량 메트릭은 (예컨대, 시간 경과에 따라 상이한 샘플에 대해; 시간 경과에 따라 방법(100)의 실시양태의 다중 인스턴스 등을 수행함으로써) 시간 경과에 따라 측정될 수 있고, 여기서, 존재량 메트릭 시리즈는 하나 이상의 병태의 특징화(예컨대, 시간 경과에 따라 암 연관 분자 계수 모니터링 등), 치료(예컨대, 시간 경과에 따라 암 치료 효능 평가 등), 및/또는 다른 적합한 정보 중 하나 이상의 것을 용이하게 하는 데에서 분석될 수 있다. 예를 들어, 하나 이상의 병태(예컨대, 의학적 병태 등)가 단일 유전자 장애 및 암 병태(및/또는 임의의 적합한 병태 등) 중 적어도 하나를 포함할 수 있는 경우, 방법(100)은 (예컨대, 방법(100)의 실시양태 등의 하나 이상의 일부분을 수행하는 제1 인스턴스와 연관된) 제1 기간과 연관된 (예컨대, 생물학적 표적의 제1 존재량 등을 설명하는) 제1 전체 존재량 메트릭(및/또는 임의의 적합한 제1 존재량 메트릭 등)을 측정하는 단계; (예컨대, 생물학적 표적의 제2 존재량 등을 설명하는) 제2 전체 존재량 메트릭을 측정하는 단계로서, 여기서, 제2 전체 존재량 메트릭은 (예컨대, 방법(100)의 실시양태 등의 하나 이상의 일부분을 수행하는 제2 인스턴스와 연관된) 제2 기간과 연관된 것인 단계; 및/또는 제1 전체 존재량 메트릭(예컨대, 제1 전체 존재량 메트릭과 제1 참조 연관 존재량 메트릭, 예컨대, 제1 전체 참조 연관 존재량 메트릭 사이의 제1 비교 등) 및 제2 전체 존재량 메트릭 (예컨대, 제2 전체 존재량 메트릭과, 동일한 생물학적 참조 또는 상이한 생물학적 참조의 제2 존재량을 설명하는 제2 전체 참조 연관 존재량 메트릭 사이의 제2 비교(여기서, 제2 전체 참조 연관 존재량 메트릭은 제2 기간 및/또는 임의의 적합한 기간과 연관될 수 있다); 제2 전체 존재량 메트릭과 제1 전체 참조 연관 존재량 메트릭 사이의 제2 비교 등)에 기초하여 하나 이상의 병태의 특징화를 용이하게 하는 단계를 포함할 수 있다.
변형으로, 존재량 메트릭을 측정하는 것은 확률론적 특성, 경험적 특정, 결정적 특성, 및/또는 임의의 다른 적합한 특성 중 임의의 하나 이상의 것을 포함하는 존재량 측정 모델을 적용시키는 것을 포함할 수 있다.
그러나, 존재량 메트릭을 측정하는 단계(S140)는 임의의 적합한 방식으로 수행될 수 있다.
2.5 참조 연관 분자 프로세싱
추가로 또는 대안적으로, 방법(100)의 실시양태는 참조 연관 분자의 세트(예컨대, 참조 연관 영역 및 참조 변이 영역을 포함하는 참조 서열 포함, 예컨대, 여기서, 서열 및/또는 영역은 표적 연관 분자의 서열 및/또는 영역과 유사하고, 예컨대, 여기서, 상기 분자, 서열 및/또는 영역은 유사한 방식으로, 예컨대, (S110), (S120), 및/또는 본원과 관련하여 기술된 것과 유사한 방식으로 구성, 생성, 적용, 프로세싱, 및/또는 사용될 수 있다)를 프로세싱하는 단계(S115)를 포함할 수 있고, 이는 예컨대, 표적 21번 염색체에 대한 존재량 비를 참조 18번 염색체에 대한 존재량 비와 비교하여 21번 삼염색체증 및/또는 18번 삼염색체증에 대해 스크리닝하기 위해 표적에 대한 존재량 메트릭과 비교될 수 있고/거나(예컨대, 상대적인 존재량을 측정하는 데; 표적 연관 존재량 메트릭과 비교 등), 다르게는 (예컨대, 특징화 및/또는 치료 등을 용이하게 하기 위해) 프로세싱될 수 있는 참조 존재량 메트릭(예컨대, 참조 연관 존재량 메트릭 등)를 측정하기 위해 참조 분자(예컨대, 참조 염색체, 예컨대, 21번 염색체를 확인한 참조 서열을 포함하는 참조 핵산; 단일 유전자 장애에 대한 야생형 버전과 연관된 참조 서열을 포함하는 참조 핵산), 예컨대, 샘플(예컨대, 표적 분자가 추출된 생물학적 샘플) 중에 존재하는 참조 분자와 연관된 분자를 (예컨대, 방법(100)의 실시양태의 하나 이상의 적합한 일부분 등을 적용시킴으로써) 생성 및/또는 프로세싱하는 작용을 할 수 있다. 참조 연관 분자를 프로세싱하는 것(예컨대, 분자를 생성; 분자를 프로세싱하여 참조 스파이크 인 혼합물을 생성; 서열분석; 전산 프로세싱 등) 및/또는 참조 분자를 프로세싱하는 것은 표적 연관 분자, 표적 분자, 및/또는 다른 적합한 성분을 프로세싱하는 것과 유사한 임의의 방식으로 수행될 수 있다. 그러나, 참조 연관 분자를 프로세싱하는 단계(S115)는 임의의 적합한 방식으로 수행될 수 있다.
2.6 병태의 특징화 용이
추가로 또는 대안적으로, 방법(100)의 실시양태는 하나 이상의 병태의 특징화를 용이하게 하는 단계(S150)(예컨대, 의학적 병태, 예컨대, 유전적 장애; 하나 이상의 존재량 메트릭 등에 기초)를 포함할 수 있고, 이는 하나 이상의 병태를 검출, 진단, 분석, 그에 대한 특징화를 결정, 그와 관련하여 하나 이상의 하나 이상의 의료 제공자를 지원하고/거나, 그에 관한 데이터(예컨대, 파라미터 등)를 제공하고/거나; 다르게는 그의 특징화를 용이하게 하는 작용을 할 수 있다.
특징화는 하나 이상의 병태의 진단, 위험 사정, 원인(예컨대, 사용자 행동, 인구 통계, 병력, 유전적 성질, 및/또는 상기 병태의 원인이 되는 다른 적합한 측면), 및 그에 관한 유용한 정보를 주는 다른 적합한 정보 중 임의의 하나 이상의 것을 포함할 수 있다. 변형으로, 하나 이상의 특징화는 치료를 결정하는 데, 사용자에게 정보를 제공하는 데, 의료 제공자에게 정보를 제공하는 데(예컨대, 진단에서 의료 제공자를 가이드 등을 하는 데) 및/또는 임의의 적합한 작동을 수행하는 데 그 중 임의의 하나 이상의 것에서 사용될 수 있다. 하나 이상의 특징화를 용이하게 하는 것은 바람직하게, 존재량 비의 비교(예컨대, 전체 참조 연관 존재량 비 대비 전체 표적 연관 존재량 비 비교)에 기초하지만, 이는 추가로 또는 대안적으로 임의의 개수 및/또는 유형의 존재량 메트릭(예컨대, 존재량 메트릭을 생성하는 데 적용 및/또는 사용되는, 임의의 적합한 분석 기술, 예컨대, 통계적 추정 분석 등)에 기초할 수 있지만, 추가로 또는 대안적으로 임의의 적합한 존재량 메트릭에 기초할 수 있다. 한 예에서, 생물학적 표적은 하나 이상의 의학적 병태와 연관될 수 있고, 하나 이상의 의학적 병태의 특징화를 용이하게 하는 것은 제1 전체 존재량 메트릭(예컨대, 전체 표적 연관 존재량 메트릭 등)과 제2 전체 존재량 메트릭(예컨대, 생물학적 참조의 존재량을 설명하는 전체 참조 연관 존재량 메트릭 등) 사이의 비교에 기초할 수 있다.
한 예에서, 병태(예컨대, 의학적 병태 등)는 염색체 이상 및 단일 유전자 장애 중 적어도 하나를 포함하는 유전적 장애를 포함할 수 있고; 여기서, (예컨대, 표적 연관 분자의 제1 세트의 제1 표적 서열 등의) 제1 표적 서열 영역은 제1 염색체 및 돌연변이중 적어도 하나와 연관될 수 있고; 여기서, 생물학적 참조의 참조 서열 영역은 제2 염색체 및 돌연변이 부재 중 적어도 하나와 연관되고/거나; 여기서, 유전적 장애의 산전 진단(및/또는 적합한 특징화 등)을 용이하게 하는 것은 전체 표적 연관 존재량 비(예컨대, 제1 표적 연관 서열의 염기 및 제1 표적 서열의 염기의 상이한 쌍의 피크 강도에 상응하는 표적 연관 존재량 비의 제1 세트에 기초하여 측정된 것 등)와 참조 연관 전체 존재량 비(예컨대, 참조 연관 서열의 염기 및 참조 서열의 염기의 상이한 쌍의 피크 강도에 상응하는 참조 연관 존재량 비의 세트에 기초하여 측정된 것 등) 사이의 비교에 기초하여 염색체 이상 및 단일 유전자 장애 중 적어도 하나의 산전 진단을 용이하게 하는 것을 포함한다. 한 예에서, 병태는 염색체 이상을 포함하는 유전적 장애를 포함할 수 있고, 여기서, 제1 표적 서열은 제1 염색체의 제1 유전자좌에 상응하고, 여기서, 방법(100)은 제1 염색체의 제2 유전자좌에 상응하는 제2 표적 서열의 제2 표적 서열 영역과 서열 유사성을 갖는 제2 표적 연관 영역을 포함하는 제2 표적 연관 서열을 포함하는 표적 연관 분자의 제2 세트를 생성하는 단계; 및 적어도 하나의 크로마토그램 관련 출력값에 기초하여 표적 연관 존재량 비의 제2 세트를 측정하는 단계를 포함할 수 있고, 여기서, 표적 연관 존재량 비의 제2 세트의 각각의 표적 연관 존재량 비는 제2 표적 연관 서열의 염기 및 제2 표적 서열의 염기의 상이한 쌍에 상응하고, 여기서, 전체 표적 연관 존재량 비를 측정하는 것은 표적 연관 존재량 비의 제1 세트 및 표적 연관 존재량 비의 제2 세트에 기초하여 전체 표적 연관 존재량 비를 측정하는 것을 포함하고, 여기서, 생물학적 참조의 참조 서열 영역은 제2 염색체와 연관되는 것이다.
한 예에서, 병태(예컨대, 의학적 병태 등)는 하나 이상의 염색체 이상, 하나 이상의 단일 유전자 장애, 및/또는 하나 이상의 암 병태 중 적어도 하나를 포함할 수 있고, 여기서, 표적 서열 영역은 (예컨대, 염색체 이상과 연관된; 암 병태 등과 연관된) 제1 염색체 및 (예컨대, 염색체 이상과 연관된; 암 병태 등과 연관된) 돌연변이 중 적어도 하나와 연관되고, 여기서, 생물학적 참조의 참조 서열 영역은 제2 염색체 및 돌연변이 부재 중 적어도 하나와 연관되고/거나, 의학적 병태의 특징화를 용이하게 하는 것은 하나 이상의 존재량 메트릭(예컨대, 표적 연관 존재량 비의 세트 참조 연관 존재량 비의 세트, 예컨대, 표적 연관 존재량 비의 세트로부터 측정된 전체 표적 연관 존재량 비, 및 참조 연관 존재량의 세트로부터 측정된 전체 참조 연관 존재량 비 등)에 기초하여 하나 이상의 염색체 이상, 하나 이상의 단일 유전자 장애, 및/또는 하나 이상의 암 병태 중 적어도 하나의 특징화를 용이하게 하는 것을 포함한다.
변형으로, 하나 이상의 특징화를 용이하게 하는 것은 하나 이상의 태아 분율 측정값(및/또는 임의의 다른 적합한 데이터, 예컨대, 하나 이상의 존재량 메트릭 등)에 기초할 수 있다. 예를 들어, 산전 진단을 용이하게 하는 것은 태아 분율 측정값 및/또는 하나 이상의 존재량 메트릭(예컨대, 전체 표적 연관 존재량 비, 참조 연관 전체 존재량 비, 상기 비 사이의 비교 등)에 기초하여 하나 이상의 유전적 장애의 산전 진단을 용이하게 하는 것을 포함할 수 있다. 그러나, 태아 분율 측정값에 기초하여 특징화를 용이하게 하는 것은 임의의 적합한 방식으로 수행될 수 있다.
하나 이상의 병태의 특징화를 용이하게 하는 것 및/또는 방법(100)의 실시양태의 임의의 다른 적합한 일부분(예컨대, 존재량 메트릭을 측정하는 것; 치료를 용이하게 하는 것 등)은 지도 학습(예컨대, 로지스틱 회귀 사용, 역전파 신경망 사용, 랜덤 포레스트 사용, 의사 결정 트리 등), 비지도 학습(예컨대, 어프라이어리(Apriori) 알고리즘 사용, K-평균 클러스터링 사용), 반지도 학습, 심층 학습 알고리즘(예컨대, 신경망, 제한된 볼츠만(Boltzmann) 기계, 심층 신뢰망 방법, 콘볼루션 신경망 방법, 순환 신경망 방법, 스태킹 오토인코더 방법 등), 강화 학습(예컨대, Q-학습 알고리즘 사용, 시간차 학습 사용), 회귀 알고리즘(예컨대, 보통 최소 제곱, 로지스틱 회귀, 단계식 회귀, 다변량 적응 회귀 스플라인, 국소 추정 산점도 평활 등), 인스턴스 기반 방법(예컨대, k-최근접 이웃, 학습 벡터 양자화, 자기 조직화 지도 등), 정규화 방법(예컨대, 능형 회귀, 최소 절대 수축 및 선택 연산자, 신축망 등), 의사 결정 트리 학습 방법(예컨대, 분류 및 회귀 트리, 반복 이분법 3, C4.5, 카이-제곱 자동 상호 작용 탐지, 의사 결정 스텀프, 랜덤 포레스트, 다변량 적응 회귀 스플라인, 그라디언트 부스팅 기계 등), 베이시안(Bayesian) 방법(예컨대, 나이브 베이즈(naive Bayes), 평균 1-의존 추정량, 베이시안 신뢰망 등), 커널 방법(예컨대, 서포트 벡터 머신, 방사형 기저 함수, 선형 판별 분석 등), 클러스터링 방법(예컨대, k-평균 클러스터링, 기댓값 최대화 등), 연관 규칙 학습 알고리즘(예컨대, 어프라이어리 알고리즘, 이클렛(Eclat) 알고리즘 등), 인공 신경망 모델(예컨대, 퍼셉트론(Perceptron) 방법, 역전파 방법, 홉필드 네트워크(Hopfield network) 방법, 자기 조직화 지도 방법, 학습 벡터 양자화 방법 등), 차원 축소 방법(예컨대, 주성분 분석, 부분 최소 제굽 회귀, 새몬 매핑(Sammon mapping), 다차원 척도법, 프로젝션 추적 등), 앙상블 방법(예컨대, 부스팅, 붓스트랩 어그리게이션(bootstrapped aggregation), 아다부스트(AdaBoost), 스태킹 일반화, 그라디언트 부스팅 기계 방법, 랜덤 포레스트 방법 등), 및/또는 임의의 적합한 인공 지능 접근법 중 임의의 하나 이상의 것을 포함하는 하나 이상의 인공 지능 접근법(예컨대, 기계 학습 접근법 등)을 적용시키는 것을 포함할 수 있다.
그러나, 하나 이상의 병태의 특징화를 용이하게 하는 단계(S150)는 임의의 적합한 방식으로 수행될 수 있다.
2.7 치료 용이
추가로 또는 대안적으로, 방법(100)의 실시양태는 (예컨대, 하나 이상의 존재량 메트릭에 기초하여; 하나 이상의 병태의 하나 이상의 특징화 등에 기초하여) 치료를 용이하게 하는 단계(S160)를 포함할 수 있고, 이는 존재량 데이터를 레버리지하여 하나 이상의 병태에 대한 치료 제공(예컨대, 개인 맞춤형 치료 제공 등)을 결정, 제공, 수행, 장려, 권장, 및/또는 다르게는 용이하게 하는 작용을 할 수 있다. 치료를 용이하게 하는 것은 (예컨대, 하나 이상의 특징화를 용이하게 하기 위해; 유사한 또는 상이한 통계 연산 또는 알고리즘을 사용하여; 동일한 또는 상이한 존재량 메트릭, 보충 데이터, 다른 적합한 데이터 등을 사용하여) 존재량 메트릭을 분석하는 것과 연관된 임의의 적합한 기술을 적용시키는 것을 포함할 수 있다. 치료는 치료 조성물(예컨대, 임신 관련 조성물, 약물 기반 치료, 프로바이오틱 기반 치료, 국소 기반 치료 등), 외과적 치료, 의료 장치 기반 치료, 존재량 메트릭에 기초하여 도출된 병태 관련 및/또는 치료 관련 정보를 포함하는 건강 관련 통지(예컨대, 피험체에게, 의료 제공자 등에게 전송되는 것); 식이 관련 치료; 인지/행동 치료; 물리 요법; 임상 관련 치료(예컨대, 원격 의료, 의료 제공자와의 스케줄 예약 등); 대체 의학 기반 치료; 환경 기반 치료; 및/또는 임의의 다른 적합한 유형의 치료 중 임의의 하나 이상의 것을 포함할 수 있다. 그러나, 치료를 용이하게 하는 단계(S160)는 임의의 적합한 방식으로 수행될 수 있다.
2.8 검증.
추가로 또는 대안적으로, 방법(100)의 실시양태는 검증하는 단계(S105)(예컨대, 방법(100) 및/또는 시스템(200)의 실시양태의 하나 이상의 일부분 등을 검증하는 단계)를 포함할 수 있고, 이는 방법(100) 및/또는 시스템(200)의 실시양태와 연관된 임의의 적합한 파라미터(예컨대, 정확도, 비용, 효능, 구현 가능성 등)을 평가하는 작용을 할 수 있다. 구체적인 예에서, 도 10은 스파이크 인 DNA를 질량이 비공지된 샘플에 첨가하는 습식 실험실 프로토콜을 나타내는 대표도를 포함할 수 있고; 여기서, 스파이크 인 DNA 서열은 10 bp 가변 영역을 제외하면, 내인성 DNA와 동일하고, 여기서, 이어서, 스파이크 인 및 내인성 DNA는 PCR에 의해 증폭되고, 생성된 앰플리콘은 정제되고, 예컨대, BigDye V3.3 화학법을 이용하여 생어 서열분석되고; 여기서, 도 10은 스파이크 인 및 내인성 DNA, 개별적으로 서열분석된 내인성 및 스파이크 인 DNA의 순수한 시료의 크로마토그램을 포함하고; 여기서, 내인성/스파이크 인 혼합물의 크로마토그램은 순수한 스파이크 인 및 내인성 크로마토그램의 선형 조합이고; 여기서, 도 10은 내인성 DNA 질량 계산을 위한 크로마토그램 데이터의 전산 분석의 결과를 포함하고; 여기서, 스파이크 인 및 내인성 DNA의 비율은 선형 회귀 분석으로부터 측정되고; 여기서, 형광 표지된 디데옥시뉴클레오티드에 상응하는 생어 크로마토그램의 각 채널은 개별적으로 분석되고; 여기서, "A" 채널에 대한 분석이 표시되고; 여기서, 내인성 또는 스파이크 인 중 "A" 피크를 나타낼 것으로 예상되는 염기 위치에서의 피크 강도가 크로마토그램에 대해 측정된다. 구체적인 예에서, 도 10에 제시된 바와 같이, 검증하는 것은 스파이크 인 혼합물 및/또는 다른 적합한 성분에 대한 존재량 메트릭을 측정하는 데에서 방법(100)의 실시양태에 대한 정확도를 평가하기 위해 (예컨대, 본원에 기술된 임의의 적합한 기술 등을 사용하여) 샘플 프로세싱 및 전산 프로세싱을 수행하는 것을 포함할 수 있고; 여기서, 검증 메트릭(예컨대, 존재량이 공지된 성분을 포함하는 스파이크 인 혼합물에 대한 내인성 대 스파이크 인의 비율)는 표적 분자 존재량이 비공지된 샘플에 대해 계산된 존재량 비 메트릭을 조정하기 위한 보정 계수로서 사용될 수 있고/거나, 임의의 적합한 목적을 위해 사용될 수 있는 방식으로 계산될 수 있다.
변형으로, 도 12a-12b에 제시된 바와 같이, 표적 연관 분자(예컨대, 스파이크 인 분자)의 (예컨대, 연속 희석액 등으로부터의) 임의의 적합한 존재량은 정확도, 정밀도, 및 및/또는 방법(100)의 실시양태의 일부분과 연관된 다른 적합한 파라미를 평가하는 데 사용될 수 있다. 구체적인 예에서, (예컨대, 방법(100)의 실시양태의 일부분을 적용시키는 것의 정확도 및/또는 정밀도를 나타내는) 도 12a-12b에 제시된 바와 같이, 42 ng의 NA12878 인간 게놈 DNA를 다양한 양의 스파이크 인 DNA와 혼합하고, 30 라운드의 PCR로 증폭시키고, 각 샘플 중의 스파이크 인 DNA의 비율을 방법(100)의 실시양태의 일부분을 적용시켜 측정하였고; 여기서, 회귀선은 4개의 샘플로 피팅되었고, 이로써, 스파이크 인 비율 > 0을 얻었고, 회귀 피트에 기초하여, 0.0226 amol, 또는 44.9 ng으로 스파이크 인 비율 ½을 얻을 것으로 예상되고; 여기서, 1 fmol의 참조 DNA를 스파이크 인 DNA와 명시된 비율로 혼합하였고; 여기서, 혼합물을 20x PCR 동안 증폭시키고, 정제하였고, 방법(100)의 실시양태의 일부분을 수행할 수 있다.
그러나, 검증(S105)은 임의의 적합한 방식으로 수행될 수 있다.
그러나, 방법(100)의 실시양태는 임의의 적합한 방식으로 수행될 수 있다.
방법(100) 및/또는 시스템(200)의 실시양태는 임의의 변형(예컨대, 실시양태, 변형, 실시예, 구체적인 예, 도면 등)을 포함하는 다양한 시스템 성분 및 다양한 방법 프로세스의 모든 조합 및 순열을 포함할 수 있고, 여기서, 본원에 기술된 방법(100)의 실시양태 및/또는 프로세스의 일부분은 본원에 기술된 시스템(200) 및/또는 다른 엔티티의 하나 이상의 인스턴스, 요소, 성분에 의해 및/또는 그를 사용하여 비동기적으로(예컨대, 순차적으로), 동시에(예컨대, 병행하여), 또는 임의의 다른 적합한 순서로 수행될 수 있다.
본원에 기술된 변형 중 임의의 것(예컨대, 실시양태, 변형, 실시예, 구체적인 예, 도면 등) 및/또는 본원에 기술된 변형의 임의의 일부분은 추가로 또는 대안적으로 조합되고/거나, 종합되고/거나, 배제되고/거나, 사용되고/거나, 연속적으로 수행되고/거나, 병렬로 수행되고/거나, 다르게 적용될 수 있다.
방법(100) 및/또는 시스템(200)의 실시양태의 일부분은 적어도 부분적으로는 컴퓨터 판독 가능한 명령어를 저장하는 컴퓨터 판독 가능한 매체를 수용하도록 구성된 기계로서 구현 및/또는 실행될 수 있다. 명령어는 시스템(200)의 실시양태와 통합될 수 있는 컴퓨터 실행 가능한 컴포넌트에 의해 실행될 수 있다. 컴퓨터 판독 가능한 매체는 임의의 적합한 컴퓨터 판독 가능한 매체, 예컨대, RAM, ROM, 플래시 메모리, EEPROM, 광학 장치(CD 또는 DVD), 하드 드라이브, 플로피 디스크, 또는 임의의 적합한 장치에 저장될 수 있다. 컴퓨터 실행 가능한 컴포넌트는 일반 또는 주문형 프로세서일 수 있지만, 대안적으로 또는 추가로, 임의의 적합한 전용 하드웨어 또는 하드웨어/펌웨어 조합 장치가 명령어를 실행할 수 있다.
당업자가 이전의 상세한 설명으로부터 및 도면 및 청구범위로부터 이해할 수 있는 바와 같이, 청구범위에서 정의된 범주로부터 벗어남 없이 방법(100)의 실시양태, 시스템(200), 및/또는 변형에 대해 수정 및 변형이 이루어질 수 있다.
SEQUENCE LISTING <110> BillionToOne, Inc. <120> SEQUENCING OUTPUT DETERMINATION AND ANALYSIS WITH TARGET-ASSOCIATED MOLECULES IN QUANTIFICATION ASSOCIATED WITH BIOLOGICAL TARGETS <130> BLLN-P03-US <140> US 16/056,112 <141> 2018-08-06 <160> 15 <170> PatentIn version 3.5 <210> 1 <211> 92 <212> DNA <213> Homo sapiens <400> 1 ggccaggcct tttccagtat ttacttattt tatggaaaaa ccaaacttta tcactagaca 60 caaaatttaa gtgagcgttg tctgtccctt ga 92 <210> 2 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 2 ggccaggcct tttccagtat ttacttttat ggaaaaacca aactttatca ctagacacaa 60 aatttaagtg agcgttgtct gtcccttga 89 <210> 3 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 3 cgacgctctt ccgatctaaa gggccaggcc ttttccagta t 41 <210> 4 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 4 gaattacgta tgtaattcac tgacgctagt gcatcattct tcaagggaca gacaacgctc 60 <210> 5 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 5 ggccaggcct tttccagtat 20 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 6 tcaagggaca gacaacgctc 20 <210> 7 <211> 361 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 7 gcctacactc tttccctaca cgacgctctt ccgatctaaa gggccaggcc ttttccagta 60 tttacttatt ttatggaaaa accaaacttt atcactagac acaaaattta agtgagcgtt 120 gtctgtccct tgaagaatga tgcactagcg tcagtgaatt acatacgtaa ttcactgacg 180 ctagtgcatc attcttcaag ggacagacaa cgctcactta aattttgtgt ctagtgataa 240 agtttggttt ttccataaaa taagtaaata ctggaaaagg cctggccctt tagatcggaa 300 gagcgtcgtg tagggaaaga gtgtaggcta tagtgtagat ctcggtggtc gccgtatcat 360 t 361 <210> 8 <211> 44 <212> DNA <213> Homo sapiens <400> 8 aaagaacaat acctctatac caaagagcag ctcttggata ggat 44 <210> 9 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 9 aaagaacaat acctctatac caaagagcag cctggtttag agat 44 <210> 10 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 10 aaagaacaat acctctatac caaagagcag cctttgttta agat 44 <210> 11 <211> 129 <212> DNA <213> Homo sapiens <400> 11 accaggtatc catcatccca cgtggcaaag gactaggtta tgctcagtat ttaccaaaag 60 aacaatacct ctataccaaa gagcagctct tggataggat gtgtatgact ttaggtggtc 120 gagtctctg 129 <210> 12 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 12 accaggtatc catcatccca cgtggcaaag gactaggtta tgctcagtat ttaccaaaag 60 aacaatacct ctataccaaa gagcagcctg gtttagagat gtgtatgact ttaggtggtc 120 gagtctctg 129 <210> 13 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 13 tcagatcggg gccccctatg actccaaagg tta 33 <210> 14 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 14 ttaccagaat atcttgaata tatggtaata aag 33 <210> 15 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic construct <400> 15 cggaatccct cagcaaagtc tcaaaaagag gac 33

Claims (20)

  1. · 제1 표적 연관 서열을 포함하는 표적 연관 분자의 제1 세트를 생성하는 단계로서, 상기 제1 표적 연관 서열은
    · 생물학적 표적의 제1 표적 서열의 제1 표적 서열 영역과 서열 유사성을 갖는 제1 표적 연관 영역으로서, 생물학적 표적은 유전적 장애와 연관되는 것인 제1 표적 연관 영역; 및
    · 표적 서열의 서열 영역과 서열 비유사성을 갖는 표적 변이 영역
    을 포함하는 단계;
    · 표적 연관 분자의 제1 세트 및 모체 샘플로부터의 제1 핵산 분자를 동시 증폭시키는 것에 기초하여 동시 증폭된 스파이크 인(spike-in) 혼합물을 생성하는 단계로서, 제1 핵산 분자는 표적 서열 영역을 포함하는 단계;
    · 동시 증폭된 스파이크 인 혼합물에 대해 생어 서열분석(Sanger sequencing)하여 제1 표적 연관 영역, 생물학적 표적의 표적 서열 영역, 표적 변이 영역, 및 생물학적 표적의 서열 영역과 연관된 제1 피크를 포함하는 적어도 하나의 크로마토그램 관련 출력값을 측정하는 단계;
    · 표적 연관 존재량 메트릭의 제1 세트를 측정하는 단계로서, 표적 연관 존재량 메트릭의 제1 세트의 각 표적 연관 존재량 메트릭은 제1 표적 연관 서열의 염기와 제1 표적 서열의 염기의 상이한 쌍에 상응하고, 표적 연관 존재량 메트릭의 제1 세트를 측정하는 것은 각 상이한 쌍에 대하여
    · 적어도 하나의 크로마토그램 관련 출력값에 기초하여, 쌍의 제1 표적 연관 서열의 염기에 대한 피크 강도 메트릭을 측정하는 것;
    · 적어도 하나의 크로마토그램 관련 출력값에 기초하여, 쌍의 제1 표적 서열의 염기에 대한 피크 강도 메트릭을 측정하는 것;
    · 제1 표적 연관 서열의 염기에 대한 피크 강도 메트릭 및 제1 표적 서열의 염기에 대한 피크 강도 메트릭에 기초하여, 표적 연관 존재량 메트릭의 제1 세트의 표적 연관 존재량 메트릭을 측정하는 것
    을 포함하는 단계;
    · 표적 연관 존재량 메트릭의 제1 세트에 기초하여 전체 표적 연관 존재량 메트릭을 측정하는 단계; 및
    · 전체 표적 연관 존재량 메트릭과, 참조 연관 분자에 대한 생물학적 참조의 존재량을 설명하는 참조 연관 전체 존재량 메트릭 사이의 비교에 기초하여 유전적 장애의 산전 진단을 용이하게 하는 단계
    를 포함하는, 임신부와 연관된 모체 샘플로부터 유전적 장애의 산전 진단을 용이하게 하는 방법.
  2. 제1항에 있어서,
    · 유전적 장애가 염색체 이상 및 단일 유전자 장애 중 적어도 하나를 포함하고,
    · 제1 표적 서열 영역이 제1 염색체 및 돌연변이 중 적어도 하나와 연관되고,
    · 생물학적 참조의 참조 서열 영역이 제2 염색체 및 돌연변이 부재 중 적어도 하나와 연관되고,
    · 유전적 장애의 산전 진단을 용이하게 하는 단계가 전체 표적 연관 존재량 메트릭과 참조 연관 전체 존재량 메트릭 사이의 비교에 기초하여 염색체 이상 및 단일 유전자 장애 중 적어도 하나의 산전 진단을 용이하게 하는 것을 포함하는 방법.
  3. 제2항에 있어서, 유전적 장애가 염색체 이상을 포함하고, 제1 표적 서열이 제1 염색체의 제1 유전자좌에 상응하고, 상기 방법은
    · 제2 표적 연관 서열을 포함하는 표적 연관 분자의 제2 세트를 생성하는 단계로서, 제2 표적 연관 서열은
    · 제2 표적 서열의 제2 표적 서열 영역과 서열 유사성을 갖는 제2 표적 연관 영역을 포함하고,
    · 제2 표적 서열은 제1 염색체의 제2 유전자좌에 상응하는 단계; 및
    · 적어도 하나의 크로마토그램 관련 출력값에 기초하여 표적 연관 존재량 메트릭의 제2 세트를 측정하는 단계로서, 표적 연관 존재량 메트릭의 제2 세트의 각 표적 연관 존재량 메트릭은 제2 표적 연관 서열의 염기와 제2 표적 서열의 염기의 상이한 쌍에 상응하는 단계
    를 추가로 포함하고,
    · 전체 표적 연관 존재량 메트릭을 측정하는 것이 표적 연관 존재량 메트릭의 제1 세트 및 표적 연관 존재량 메트릭의 제2 세트에 기초하여 전체 표적 연관 존재량 메트릭을 측정하는 것을 포함하고,
    · 생물학적 참조의 참조 서열 영역이 제2 염색체와 연관되는 것인 방법.
  4. 제1항에 있어서, 산전 진단을 용이하게 하는 단계가 태아 분율 측정값, 전체 표적 연관 존재량 메트릭, 및 참조 연관 전체 존재량 메트릭에 기초하여 유전적 장애의 산전 진단을 용이하게 하는 것을 포함하는 방법.
  5. 제1항에 있어서, 표적 변이 영역이 표적 서열과 비교하여 삽입 및 결실 중 적어도 하나를 포함하고, 적어도 하나의 크로마토그램 관련 출력값이 제1 피크에 상응하는 정렬 위치를 포함하고, 각 상이한 쌍에 대하여 제1 표적 연관 서열의 염기가 제1 표적 서열의 염기에 상응하는 제2 정렬 위치와 상이한 제1 정렬 위치에 상응하고, 적어도 하나의 크로마토그램 관련 출력값의 정렬 위치가 제1 및 제2 정렬 위치를 포함하는 것인 방법.
  6. · 표적 연관 서열을 포함하는 표적 연관 분자의 세트를 생성하는 단계로서, 상기 표적 연관 서열은
    · 생물학적 표적의 표적 서열의 제1 표적 서열 영역과 서열 유사성을 갖는 제1 표적 연관 영역으로서, 생물학적 표적은 유전적 장애와 연관되는 제1 표적 연관 영역; 및
    · 표적 서열의 서열 영역과 서열 비유사성을 갖는 표적 변이 영역
    을 포함하는 단계;
    · 표적 연관 분자의 세트 및 표적 서열을 포함하는 표적 분자에 기초하여 생어 서열분석을 수행하여, 제1 표적 연관 영역, 생물학적 표적의 제1 표적 서열 영역, 표적 변이 영역, 및 생물학적 표적의 서열 영역과 연관된 제1의 피크 세트를 포함하는 적어도 하나의 크로마토그램 관련 출력값을 측정하는 단계;
    · 적어도 하나의 크로마토그램 관련 출력값의 제1의 피크 세트에 기초하여 상이한 염기 쌍 세트에 대한 표적 연관 존재량 메트릭의 세트를 측정하는 단계로서, 상이한 염기 쌍 세트로부터의 각 상이한 염기 쌍은 표적 연관 서열의 염기와 표적 서열의 염기의 쌍에 상응하는 단계; 및
    · 표적 연관 존재량 메트릭의 세트, 및 참조 연관 분자에 대한 생물학적 참조의 존재량을 설명하는 참조 연관 존재량 메트릭의 세트에 기초하여, 의학적 병태의 특징화를 용이하게 하는 단계
    를 포함하는, 표적 분자를 포함하는 샘플로부터 의학적 병태의 특징화를 용이하게 하는 방법.
  7. 제6항에 있어서, 표적 변이 영역이 표적 서열의 서열 영역에 비해 치환, 삽입, 및 결실 중 적어도 하나를 포함하고, 표적 연관 존재량 메트릭의 세트를 측정하는 단계가 제1의 피크 세트, 및 치환, 삽입 및 결실 중 적어도 하나에 기초하여 표적 연관 존재량 메트릭의 세트를 측정하는 것을 포함하는 방법.
  8. 제7항에 있어서, 표적 변이 영역이 삽입 및 결실 중 적어도 하나를 포함하고, 적어도 하나의 크로마토그램 관련 출력값이 제1의 피크 세트에 상응하는 정렬 위치를 포함하고, 표적 연관 존재량 메트릭의 세트를 측정하는 단계가 각각의 상이한 쌍에 대해
    · 적어도 하나의 크로마토그램 관련 출력값에 기초하여, 쌍의 제1 표적 연관 서열의 염기에 대해 정렬 위치의 제1 정렬 위치에서 피크 강도 메트릭을 측정하는 것;
    · 적어도 하나의 크로마토그램 관련 출력값에 기초하여, 쌍의 제1 표적 서열의 염기에 대해 정렬 위치의 제2 정렬 위치에서 피크 강도 메트릭을 측정하고, 제1 정렬 위치는 제2 정렬 위치와 상이하고, 정렬 위치는 제1 및 제2 정렬 위치를 포함하는 것; 및
    · 표적 연관 서열의 염기에 대한 피크 강도 메트릭, 및 제1 표적 서열의 염기에 대한 피크 강도 메트릭에 기초하여, 표적 연관 존재량 메트릭의 세트의 표적 연관 존재량 메트릭을 측정하는 것
    을 포함하는 방법.
  9. 제8항에 있어서,
    · 제1 정렬 위치가 제1의 피크 세트의 제1 피크 및 제2 피크에 상응하고,
    · 제1 피크가 표적 연관 서열의 중복 염기에 상응하고,
    · 제1 피크가 표적 연관 존재량 메트릭의 세트의 제1 표적 연관 존재량 메트릭에 상응하고,
    · 제2 피크가 표적 서열의 중복 염기에 상응하고,
    · 제2 피크가 표적 연관 존재량 메트릭의 세트의 제2 표적 연관 존재량 메트릭에 상응하는 것인 방법.
  10. 제6항에 있어서,
    · 의학적 병태가 염색체 이상, 단일 유전자 장애, 및 암 병태 중 적어도 하나를 포함하고,
    · 제1 표적 서열 영역이 제1 염색체 및 돌연변이 중 적어도 하나와 연관되고,
    · 생물학적 참조의 참조 서열 영역이 제2 염색체 및 돌연변이 부재 중 적어도 하나와 연관되고,
    · 의학적 병태의 특징화를 용이하게 하는 단계가, 표적 연관 존재량 메트릭의 세트 및 참조 연관 존재량 메트릭의 세트에 기초하여, 염색체 이상, 단일 유전자 장애, 및 암 병태 중 적어도 하나의 특징화를 용이하게 하는 것을 포함하는 방법.
  11. 제6항에 있어서, 적어도 하나의 서열 영역을 표적 연관 분자 및 표적 분자의 세트 중 적어도 하나에 부가하는 단계를 추가로 포함하고, 적어도 하나의 서열 영역은 (a) 제2 표적 서열 영역과 서열 유사성을 갖는 제2 표적 연관 영역, 및 (b) 표적 연관 서열의 영역 및 표적 서열의 영역 중 적어도 하나의 하나 이상의 서열 반복부 중 적어도 하나를 포함하는 것인 방법.
  12. 제11항에 있어서,
    · 적어도 하나의 서열 영역을 부가하는 단계가 표적 연관 서열의 영역 및 표적 서열의 영역 중 적어도 하나의 하나 이상의 서열 반복부를 부가하는 것을 포함하고,
    · 적어도 하나의 크로마토그램 관련 출력값의 제1의 피크 세트가 제1 표적 연관 영역, 생물학적 표적의 제1 표적 서열 영역, 표적 변이 영역, 및 생물학적 표적의 서열 영역에 대한 제1 서열분석에 상응하고,
    · 적어도 하나의 크로마토그램 관련 출력값이 제1 표적 연관 영역, 생물학적 표적의 제1 표적 서열 영역, 표적 변이 영역, 및 생물학적 표적의 서열 영역에 대한 제2 서열분석에 상응하는 제2의 피크 세트를 포함하고,
    · 표적 연관 존재량 메트릭의 세트를 측정하는 단계가 제1의 피크 세트 및 제2의 피크 세트에 기초하여 표적 연관 존재량 메트릭의 세트를 측정하는 것을 포함하는 방법.
  13. 제6항에 있어서, 적어도 하나의 서열 반복부를 표적 연관 분자 및 표적 분자의 세트 중 적어도 하나에 부가하는 단계를 추가로 포함하고, 적어도 하나의 서열 반복부를 부가하는 단계가 헤어핀 서열을 포함하는 프라이머 세트를 이용하여 표적 연관 분자 및 표적 분자의 세트를 동시 증폭시키는 것을 포함하는 방법.
  14. · 표적 연관 분자의 제1 세트 및 표적 분자의 세트와 연관된 생어 서열분석에 기초하여, 표적 연관 분자의 제1 세트 및 표적 분자의 세트와 연관된 적어도 하나의 크로마토그램 관련 출력값을 측정하는 단계로서, 표적 연관 분자의 제1 세트는
    · 생물학적 표적의 제1 표적 서열의 제1 표적 서열 영역과 서열 유사성을 갖는 제1 표적 연관 영역으로서, 표적 분자의 세트가 제1 표적 서열 영역을 포함하는 제1 표적 연관 영역; 및
    · 제1 표적 서열의 서열 영역과 서열 비유사성을 갖는 표적 변이 영역
    을 포함하는 제1 표적 연관 서열을 포함하는 단계;
    · 적어도 하나의 크로마토그램 관련 출력값에 기초하여 상이한 염기 세트에 대한 표적 연관 존재량 메트릭의 제1 세트를 측정하는 단계로서, 상이한 염기 세트로부터의 각 상이한 염기 세트는 제1 표적 연관 서열의 적어도 하나의 염기 및 제1 표적 서열의 적어도 하나의 염기를 포함하는 단계; 및
    · 표적 연관 존재량 메트릭의 제1 세트에 기초하여, 샘플에 대한 생물학적 표적의 제1 존재량을 설명하는 제1 전체 존재량 메트릭을 측정하는 단계
    를 포함하는, 표적 분자를 포함하는 샘플로부터 생물학적 표적을 정량화하는 방법.
  15. 제14항에 있어서,
    · 적어도 하나의 크로마토그램 관련 출력값을 측정하는 단계가 표적 연관 분자의 제1 세트, 표적 분자의 세트, 및 표적 연관 분자의 제2 세트와 연관된 생어 서열분석에 기초하여 적어도 하나의 크로마토그램 관련 출력값을 측정하는 것을 포함하고,
    · 표적 연관 분자의 제2 세트가 제2 표적 서열의 제2 표적 서열 영역과 서열 유사성을 갖는 제2 표적 연관 영역을 포함하는 제2 표적 연관 서열을 포함하고,
    · 상기 방법은 적어도 하나의 크로마토그램 관련 출력값에 기초하여 제2 표적 연관 서열 및 제2 표적 서열의 상이한 염기 세트에 대한 표적 연관 존재량 메트릭의 제2 세트를 측정하는 단계를 추가로 포함하는 것인 방법.
  16. 제15항에 있어서, 제1 표적 서열이 염색체의 제1 유전자좌에 상응하고, 제2 표적 서열이 염색체의 제2 유전자좌에 상응하고, 상기 방법이 제1 전체 존재량 메트릭에 기초하여 염색체 이상의 특징화를 용이하게 하는 단계를 추가로 포함하는 것인 방법.
  17. 제14항에 있어서, 생물학적 표적이 의학적 병태와 연관되고, 제1 전체 존재량 메트릭과, 상기 방법이 생물학적 참조의 존재량을 설명하는 전체 참조 연관 존재량 메트릭 사이의 제1 비교에 기초하여 의학적 병태의 특징화를 용이하게 하는 단계를 추가로 포함하는 것인 방법.
  18. 제17항에 있어서,
    · 의학적 병태가 단일 유전자 장애 및 암 병태 중 적어도 하나를 포함하고,
    · 제1 전체 존재량 메트릭이 제1 기간과 연관되고,
    · 상기 방법이 생물학적 표적의 제2 존재량을 설명하는 제2 전체 존재량 메트릭을 측정하는 단계로서, 제2 전체 존재량 메트릭은 제2 기간과 연관되는 단계를 추가로 포함하고,
    · 의학적 병태의 특징화를 용이하게 하는 단계가 제1 비교 및 제2 전체 존재량 메트릭에 기초하여 의학적 병태의 특징화를 용이하게 하는 것을 포함하는 방법.
  19. 제14항에 있어서,
    · 생어 서열분석이
    · 표적 연관 분자의 제1 세트를 포함하는 제1 샘플의 생어 서열분석; 및
    · 표적 분자의 세트를 포함하는 제2 샘플의 생어 서열분석
    을 포함하고,
    · 적어도 하나의 크로마토그램 관련 출력값을 측정하는 단계가
    · 제1 샘플의 생어 서열분석에 기초하여 표적 연관 분자의 제1 세트와 연관된 제1 크로마토그램 관련 출력값을 측정하는 것;
    · 제2 샘플의 생어 서열분석에 기초하여 표적 분자의 세트와 연관된 제2 크로마토그램 관련 출력값을 측정하는 것
    을 포함하고,
    · 표적 연관 존재량 메트릭의 제1 세트를 측정하는 단계가 제1 크로마토그램 관련 출력값 및 제2 크로마토그램 관련 출력값에 기초하여 표적 연관 존재량 메트릭의 제1 세트를 측정하는 것을 포함하는 방법.
  20. 제14항에 있어서, 적어도 하나의 크로마토그램 관련 출력값에 기초하여 표적 연관 존재량 메트릭의 제1 세트를 측정하는 것이 피크 강도, 피크 면적, 염기 유형을 공유하는 염기에 대한 피크 메트릭, 및 염기 유형이 상이한 염기에 대한 피크 메트릭 중 적어도 하나에 기초하여 상이한 염기 세트에 대해 표적 연관 존재량 메트릭의 제1 세트를 측정하는 것을 포함하는 방법.
KR1020207006309A 2017-08-04 2018-08-06 생물학적 표적과 연관된 정량화에서 표적 연관 분자를 이용한 서열분석 출력값 측정 및 분석 KR102372572B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762541565P 2017-08-04 2017-08-04
US62/541,565 2017-08-04
PCT/US2018/045419 WO2019028470A2 (en) 2017-08-04 2018-08-06 DETERMINING AND ANALYZING SEQUENCING OUTPUTS USING TARGET-ASSOCIATED MOLECULES IN QUANTIFICATION ASSOCIATED WITH BIOLOGICAL TARGETS

Publications (2)

Publication Number Publication Date
KR20200098475A true KR20200098475A (ko) 2020-08-20
KR102372572B1 KR102372572B1 (ko) 2022-03-08

Family

ID=65234231

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207006309A KR102372572B1 (ko) 2017-08-04 2018-08-06 생물학적 표적과 연관된 정량화에서 표적 연관 분자를 이용한 서열분석 출력값 측정 및 분석

Country Status (12)

Country Link
US (2) US11430543B2 (ko)
EP (1) EP3662085B1 (ko)
JP (2) JP6955732B2 (ko)
KR (1) KR102372572B1 (ko)
CN (1) CN111094583A (ko)
AU (1) AU2018312117B2 (ko)
BR (1) BR112020002260A2 (ko)
CA (2) CA3202766A1 (ko)
ES (1) ES2923478T3 (ko)
IL (1) IL272399A (ko)
SG (1) SG11202000444PA (ko)
WO (1) WO2019028470A2 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11519024B2 (en) 2017-08-04 2022-12-06 Billiontoone, Inc. Homologous genomic regions for characterization associated with biological targets
CN111051511A (zh) 2017-08-04 2020-04-21 十亿至一公司 用于与生物靶相关的表征的靶相关分子
US20230304084A1 (en) * 2019-02-28 2023-09-28 Inivata Ltd. Method for quantifying the amount of a target sequence in a sample
US20210057038A1 (en) * 2019-07-25 2021-02-25 Prime Discoveries, Inc. Systems and methods for microbiome based sample classification
EP4092135A4 (en) * 2020-01-17 2023-01-18 MGI Tech Co., Ltd. METHODS FOR SYNCHRONOUS SEQUENCING OF SENSE STRAND AND ANTISENSE STRAND OF DNA
US11769332B2 (en) * 2020-06-15 2023-09-26 Lytx, Inc. Sensor fusion for collision detection
US20220340971A1 (en) * 2021-03-23 2022-10-27 Billiontoone, Inc. Fragment analysis for quantitative diagnostics of biological targets

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006111738A1 (en) * 2005-04-22 2006-10-26 Uponor Innovation Ab Electrofusion fitting for a composite pipe
US20120010085A1 (en) * 2010-01-19 2012-01-12 Rava Richard P Methods for determining fraction of fetal nucleic acids in maternal samples
US20160187292A1 (en) * 2013-07-31 2016-06-30 Hitachi, Ltd. Gene Mutation Analyzer, Gene Mutation Analysis System, and Gene Mutation Analysis Method
US20160195164A1 (en) * 2015-01-07 2016-07-07 Valeo Embrayages Device for damping torsion oscillations, notably for a motor vehicle transmission system

Family Cites Families (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7655443B1 (en) * 1999-05-07 2010-02-02 Siemens Healthcare Diagnostics, Inc. Nucleic acid sequencing with simultaneous quantitation
US7709194B2 (en) 2004-06-04 2010-05-04 The Chinese University Of Hong Kong Marker for prenatal diagnosis and monitoring
KR100808312B1 (ko) * 2004-07-26 2008-02-27 홍경만 인위적 에스엔피 서열의 동시증폭을 이용한 염색체,유전자, 혹은 특정 뉴클레오티드 서열의 카피 수 측정방법
US20070009884A1 (en) 2005-04-11 2007-01-11 Ghc Technologies, Inc. Methods and apparatuses for detecting chemical or biological agents
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US20070092869A1 (en) 2005-10-24 2007-04-26 Fulmer-Smentek Stephanie B Spike-in controls and methods for using the same
EP2032265B1 (en) 2006-06-29 2011-08-31 Shell Internationale Research Maatschappij B.V. Cyclonic liquid degassing separator and method for degassing a fluid mixture
US20080124712A1 (en) 2006-10-26 2008-05-29 Hantash Feras M Alpha globin gene dosage assay
PT2334812T (pt) 2008-09-20 2017-03-29 Univ Leland Stanford Junior ¿diagnóstico não invasivo de aneuploidia fetal por sequenciação
TWI350312B (en) 2009-03-16 2011-10-11 Univ Kaohsiung Medical Method for determining smn gene transfer and intragenic mutations
HUE061110T2 (hu) 2009-11-05 2023-05-28 Univ Hong Kong Chinese Magzati genomelemzés anyai biológiai mintából
ES2577017T3 (es) 2009-12-22 2016-07-12 Sequenom, Inc. Procedimientos y kits para identificar la aneuploidia
US20130022973A1 (en) 2010-01-15 2013-01-24 Hansen Carl L G Multiplex Amplification for the Detection of Nucleic Acid Variations
US20120270739A1 (en) 2010-01-19 2012-10-25 Verinata Health, Inc. Method for sample analysis of aneuploidies in maternal samples
US20110245085A1 (en) 2010-01-19 2011-10-06 Rava Richard P Methods for determining copy number variations
US10662474B2 (en) 2010-01-19 2020-05-26 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing
SG186987A1 (en) 2010-06-11 2013-02-28 Pathogenica Inc Nucleic acids for multiplex organism detection and methods of use and making the same
WO2012012703A2 (en) 2010-07-23 2012-01-26 Esoterix Genetic Laboratories, Llc Identification of differentially represented fetal or maternal genomic regions and uses thereof
KR20130041961A (ko) 2010-07-23 2013-04-25 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 체액에서 질환 또는 상태의 특징을 검출하는 방법
EP2633311A4 (en) 2010-10-26 2014-05-07 Univ Stanford NON-INVASIVE F TAL GENE SCREENING BY SEQUENCING ANALYSIS
US8877442B2 (en) 2010-12-07 2014-11-04 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive determination of fetal inheritance of parental haplotypes at the genome-wide scale
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
US8688388B2 (en) 2011-10-11 2014-04-01 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA2865335A1 (en) 2012-03-09 2013-09-12 Caris Life Sciences Luxembourg Holdings, S.A.R.L. Biomarker compositions and methods
EP3178945B1 (en) * 2012-04-06 2018-10-17 The Chinese University Of Hong Kong Method of analyzing a biological sample from a female subject pregnant with a fetus
US20150284783A1 (en) 2012-05-21 2015-10-08 Agena Bioscience, Inc. Methods and compositions for analyzing nucleic acid
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP4036247B1 (en) 2012-09-04 2024-04-10 Guardant Health, Inc. Methods to detect rare mutations and copy number variation
US9944973B2 (en) 2012-11-26 2018-04-17 The University Of Toledo Methods for standardized sequencing of nucleic acids and uses thereof
JP6009096B2 (ja) 2012-11-26 2016-10-19 ザ・ユニバーシティ・オブ・トレド 核酸の標準化された配列決定のための方法およびその使用
US10643738B2 (en) 2013-01-10 2020-05-05 The Chinese University Of Hong Kong Noninvasive prenatal molecular karyotyping from maternal plasma
WO2014127484A1 (en) 2013-02-21 2014-08-28 British Columbia Cancer Agency Branch Spike-in control nucleic acids for sample tracking
SG11201508460TA (en) * 2013-04-25 2015-11-27 Firefly Bioworks Inc Multiplexed analysis of target nucleic acids
JP2016534035A (ja) 2013-10-04 2016-11-04 ラナ セラピューティクス インコーポレイテッド 筋萎縮性側索硬化症を治療するための組成物及び方法
US11901041B2 (en) 2013-10-04 2024-02-13 Bio-Rad Laboratories, Inc. Digital analysis of nucleic acid modification
US11339435B2 (en) 2013-10-18 2022-05-24 Molecular Loop Biosciences, Inc. Methods for copy number determination
KR102649364B1 (ko) 2013-11-07 2024-03-20 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 인간 마이크로바이옴 및 그의 성분의 분석을 위한 무세포 핵산
US10570443B2 (en) 2014-10-01 2020-02-25 Chronix Biomedical Methods of quantifying cell-free DNA
US20180148778A1 (en) * 2014-12-16 2018-05-31 Garvan Institute Of Medical Research Sequencing controls
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
CA2986787A1 (en) 2015-05-28 2016-12-01 Immunexpress Pty Ltd Validating biomarker measurement
KR102326769B1 (ko) 2016-03-25 2021-11-17 카리우스, 인코포레이티드 합성 핵산 스파이크-인
EP3464593B1 (en) 2016-05-31 2022-03-09 The Translational Genomics Research Institute Molecular tagging methods and sequencing libraries
WO2018031486A1 (en) 2016-08-08 2018-02-15 Karius, Inc. Reduction of signal from contaminant nucleic acids
CN111051511A (zh) * 2017-08-04 2020-04-21 十亿至一公司 用于与生物靶相关的表征的靶相关分子
US11519024B2 (en) * 2017-08-04 2022-12-06 Billiontoone, Inc. Homologous genomic regions for characterization associated with biological targets
US20210292829A1 (en) * 2020-03-23 2021-09-23 Billiontoone, Inc. High throughput assays for detecting infectious diseases using capillary electrophoresis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006111738A1 (en) * 2005-04-22 2006-10-26 Uponor Innovation Ab Electrofusion fitting for a composite pipe
US20120010085A1 (en) * 2010-01-19 2012-01-12 Rava Richard P Methods for determining fraction of fetal nucleic acids in maternal samples
US20160187292A1 (en) * 2013-07-31 2016-06-30 Hitachi, Ltd. Gene Mutation Analyzer, Gene Mutation Analysis System, and Gene Mutation Analysis Method
US20160195164A1 (en) * 2015-01-07 2016-07-07 Valeo Embrayages Device for damping torsion oscillations, notably for a motor vehicle transmission system

Also Published As

Publication number Publication date
CA3071366A1 (en) 2019-02-07
KR102372572B1 (ko) 2022-03-08
AU2018312117A1 (en) 2020-02-06
CA3071366C (en) 2023-08-01
AU2018312117B2 (en) 2022-05-12
JP7387110B2 (ja) 2023-11-28
EP3662085A2 (en) 2020-06-10
US20190095577A1 (en) 2019-03-28
CA3202766A1 (en) 2019-02-07
CN111094583A (zh) 2020-05-01
WO2019028470A2 (en) 2019-02-07
EP3662085A4 (en) 2021-05-05
ES2923478T3 (es) 2022-09-27
JP6955732B2 (ja) 2021-10-27
IL272399A (en) 2020-03-31
JP2020529202A (ja) 2020-10-08
EP3662085B1 (en) 2022-06-22
JP2022008482A (ja) 2022-01-13
SG11202000444PA (en) 2020-02-27
US11430543B2 (en) 2022-08-30
US20230197202A1 (en) 2023-06-22
BR112020002260A2 (pt) 2020-09-08
WO2019028470A3 (en) 2019-06-06

Similar Documents

Publication Publication Date Title
KR102372572B1 (ko) 생물학적 표적과 연관된 정량화에서 표적 연관 분자를 이용한 서열분석 출력값 측정 및 분석
CN112020565B (zh) 用于确保基于测序的测定的有效性的质量控制模板
US20230268025A1 (en) Target-associated molecules for characterization associated with biological targets
US20190287649A1 (en) Method and system for selecting, managing, and analyzing data of high dimensionality
US11519024B2 (en) Homologous genomic regions for characterization associated with biological targets
EP3612644B1 (en) Use of off-target sequences for dna analysis
EP3118323A1 (en) System and methodology for the analysis of genomic data obtained from a subject
CA3070317A1 (en) Homologous genomic regions for characterization associated with biological targets
US20240170099A1 (en) Methylation-based age prediction as feature for cancer classification
CN113227396A (zh) 用于定量生物靶的稀释标签

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant