BR122022001849B1 - METHOD FOR ESTIMATING A FRACTION OF FETAL NUCLEIC ACID IN A TEST SAMPLE FROM A PREGNANT WOMAN - Google Patents

METHOD FOR ESTIMATING A FRACTION OF FETAL NUCLEIC ACID IN A TEST SAMPLE FROM A PREGNANT WOMAN Download PDF

Info

Publication number
BR122022001849B1
BR122022001849B1 BR122022001849-1A BR122022001849A BR122022001849B1 BR 122022001849 B1 BR122022001849 B1 BR 122022001849B1 BR 122022001849 A BR122022001849 A BR 122022001849A BR 122022001849 B1 BR122022001849 B1 BR 122022001849B1
Authority
BR
Brazil
Prior art keywords
nucleic acid
fragments
portions
length
reads
Prior art date
Application number
BR122022001849-1A
Other languages
Portuguese (pt)
Inventor
Sung K. Kim
Gregory HANNUM
Jennifer GEIS
Cosmin Deciu
Original Assignee
Sequenom, Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sequenom, Inc filed Critical Sequenom, Inc
Publication of BR122022001849B1 publication Critical patent/BR122022001849B1/en

Links

Abstract

São fornecidos aqui métodos, processos, sistemas, máquinas e aparelhos para a avaliação não invasiva das variações genéticas.Methods, processes, systems, machines and apparatus for the non-invasive evaluation of genetic variations are provided here.

Description

Pedidos de patente relacionadosRelated patent applications

[001]O pedido de patente reivindica o benefício do pedido de patente provisório US n° 61/838.048 depositado em 21 de junho de 2013, intitulado MÉTODOS E PROCESSOS PARA AVALIAÇÃO NÃO INVASIVA DE VARIAÇÕES GENÉTICAS, nomeando Sung Kim K. et al., como inventores, e designado pelo procurador registro n° SEQ-6071-PV. Todo o conteúdo do pedido anterior é aqui incorporado por referência, incluindo todos os textos, tabelas e desenhos.[001] The patent application claims the benefit of US provisional patent application No. 61/838,048 filed on June 21, 2013, entitled METHODS AND PROCESSES FOR NON-INVASIVE ASSESSMENT OF GENETIC VARIATIONS, naming Sung Kim K. et al., as inventors, and designated by the attorney-in-fact registration No. SEQ-6071-PV. The entire contents of the foregoing application are hereby incorporated by reference, including all text, tables and drawings.

CampoField

[002]Tecnologia fornecida aqui se refere em parte a métodos, processos, máquinas e aparelhos para avaliação não invasiva de variações genéticas.[002]Technology provided here refers in part to methods, processes, machines and apparatus for non-invasive evaluation of genetic variations.

FundamentoFundamentals

[003]Informação genética de organismos vivos (por exemplo, animais, plantas e micro-organismos) e outras formas de replicar informação genética (por exemplo, vírus) é codificada no ácido desoxirribonucleico (DNA) ou ácido ribonucleico (RNA). Informação genética é uma sucessão de nucleotídeos ou nucleotídeos modificados que representam a estrutura primária de ácidos nucleicos químicos ou hipotéticos. Em humanos, o genoma completo contém cerca de 30.000 genes localizados em vinte e quatro (24) cromossomos (ver The Human Genome, T. Strachan, BIOS Scientific Publishers, 1992). Cada gene codifica uma proteína específica que, após a expressão através de transcrição e tradução, cumpre uma função bioquímica específica dentro de uma célula viva.[003] Genetic information from living organisms (eg, animals, plants, and microorganisms) and other forms of replicating genetic information (eg, viruses) is encoded in deoxyribonucleic acid (DNA) or ribonucleic acid (RNA). Genetic information is a sequence of nucleotides or modified nucleotides that represent the primary structure of chemical or hypothetical nucleic acids. In humans, the complete genome contains about 30,000 genes located on twenty-four (24) chromosomes (see The Human Genome, T. Strachan, BIOS Scientific Publishers, 1992). Each gene encodes a specific protein that, upon expression through transcription and translation, fulfills a specific biochemical function within a living cell.

[004]Muitas condições médicas são causadas por uma ou mais variações genéticas. Certas variações genéticas causam condições médicas que incluem, por exemplo, hemofilia, talassemia, distrofia muscular de Duchenne (DMD), doença de Huntington (DH), doença de Alzheimer e fibrose cística (FC) (Human Genome Mutations, D.N. Cooper e M. Krawczak, BIOS Publishers, 1993). Tais doenças genéticas podem resultar de uma adição, substituição ou deleção de um único nucleotídeo no DNA de um gene particular. Certos defeitos de nascença são causados por uma anormalidade cromossômica, também referida como uma aneuploidia, tais como Trissomia 21 (Síndrome de down), Trissomia 13 (Síndrome de patau), Trissomia 18 (Síndrome de Edward), monossomia X (Síndrome de Turner) e certas aneuploidias do cromossomo sexual, tal como síndrome de klinefelter (XXY), por exemplo. Outra variação genética é o gênero fetal que pode frequentemente ser determinado com base nos cromossomos sexuais X e Y. Algumas variações genéticas podem predispor um indivíduo a, ou causar, qualquer de um número de doenças, tais como, por exemplo, diabetes, arteriosclerose, obesidade, várias doenças autoimunes e câncer (por exemplo, colorretal, mama, ovário, pulmão).[004]Many medical conditions are caused by one or more genetic variations. Certain genetic variations cause medical conditions including, for example, hemophilia, thalassemia, Duchenne muscular dystrophy (DMD), Huntington's disease (HD), Alzheimer's disease, and cystic fibrosis (CF) (Human Genome Mutations, D.N. Cooper and M. Krawczak, BIOS Publishers, 1993). Such genetic diseases can result from an addition, substitution or deletion of a single nucleotide in the DNA of a particular gene. Certain birth defects are caused by a chromosomal abnormality, also referred to as an aneuploidy, such as Trisomy 21 (Down Syndrome), Trisomy 13 (Patau Syndrome), Trisomy 18 (Edward Syndrome), Monosomy X (Turner Syndrome) and certain aneuploidies of the sex chromosome, such as klinefelter syndrome (XXY), for example. Another genetic variation is the fetal gender which can often be determined based on the X and Y sex chromosomes. Some genetic variations can predispose an individual to, or cause, any of a number of diseases, such as, for example, diabetes, arteriosclerosis, obesity, various autoimmune diseases, and cancer (eg, colorectal, breast, ovarian, lung).

[005]Identificação de uma ou mais variações ou variâncias genéticas pode conduzir a um diagnóstico de, ou predisposição para a determinação de uma condição médica particular. Identificação de uma variação genética pode resultar na facilitação de uma decisão médica e/ou emprego de um procedimento médico útil. Em certas modalidades, a identificação de uma ou mais variações ou variâncias genéticas envolve a análise de DNA isento de célula. DNA isento de célula (CF-DNA) é composto de fragmentos de DNA que se originam da morte celular e circulam no sangue periférico. Altas concentrações de CF-DNA podem ser indicativas de certas condições clínicas, tais como câncer, traumas, queimaduras, enfarte do miocárdio, acidente vascular cerebral, septicemia, infeção e outras doenças. Além disso, DNA fetal isento de célula (CFF-DNA) pode ser detectado na corrente sanguínea materna e usado para vários diagnósticos pré-natais não invasivos.[005]Identification of one or more genetic variations or variances may lead to a diagnosis of, or predisposition towards the determination of, a particular medical condition. Identification of a genetic variation may result in facilitating a medical decision and/or employing a useful medical procedure. In certain embodiments, identifying one or more genetic variations or variances involves analyzing cell-free DNA. Cell-free DNA (CF-DNA) is composed of fragments of DNA that originate from cell death and circulate in peripheral blood. High concentrations of CF-DNA can be indicative of certain clinical conditions, such as cancer, trauma, burns, myocardial infarction, stroke, septicemia, infection and other diseases. Furthermore, cell-free fetal DNA (CFF-DNA) can be detected in maternal bloodstream and used for various non-invasive prenatal diagnoses.

[006]A presença de ácido nucleico fetal no plasma materno permite o diagnóstico pré-natal não invasivo por meio da análise de uma amostra de sangue materno. Por exemplo, mudanças quantitativas de DNA fetal no plasma materno podem ser associadas com um número de desordens associadas com a gravidez, incluindo pré-eclâmpsia, trabalho de parto prematuro, hemorragia pré-parto, placentação invasiva, síndrome de Down fetal, e outras aneuploidias cromossômicas fetais. Assim, a análise do ácido nucleico fetal no plasma materno pode ser um mecanismo útil para o monitoramento do bem-estar feto- maternal.[006] The presence of fetal nucleic acid in maternal plasma allows non-invasive prenatal diagnosis through the analysis of a sample of maternal blood. For example, quantitative fetal DNA changes in maternal plasma may be associated with a number of disorders associated with pregnancy, including preeclampsia, preterm labor, antepartum hemorrhage, invasive placentation, fetal Down syndrome, and other aneuploidies. fetal chromosomes. Thus, analysis of fetal nucleic acid in maternal plasma may be a useful mechanism for monitoring fetal-maternal well-being.

Sumáriosummary

[007]É fornecido aqui, em certos aspectos, um método para estimar uma fração de ácido nucleico fetal em uma amostra de teste de uma mulher grávida, que compreende (a) obter contagens de fragmentos (reads)de sequências mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequência são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, (b) ponderar, usando um microprocessador, (i) as contagens de fragmentos (reads) de sequências mapeados para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica da porção de ácido nucleico fetal de acordo com um fator de ponderação associado independentemente com cada porção fornecendo, desse modo, estimativas da fração fetal específica da porção de acordo com os fatores de ponderação, em que cada dos fatores de ponderação foi determinado a partir de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada uma das várias amostras, e (ii) contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para as várias amostras e (c) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas estimativas da fração fetal específica da porção.[007] Provided herein, in certain aspects, is a method for estimating a fraction of fetal nucleic acid in a test sample from a pregnant woman, comprising (a) obtaining counts of fragments (reads) of sequences mapped to portions of a reference genome, whose sequence reads are circulating cell-free nucleic acid reads from a test sample from a pregnant woman, (b) weight, using a microprocessor, (i) fragment counts ( reads) of sequences mapped to each chunk, or (ii) another chunk-specific parameter, to a chunk-specific fraction of fetal nucleic acid according to a weighting factor independently associated with each chunk, thereby providing estimates of the fetal fraction portion-specific weighting factors, where each of the weighting factors was determined from a ratio adjusted for each portion between (i) a fraction of fetal nucleic acid for each of several samples, and (ii) counts of sequence reads mapped to each portion, or other portion-specific parameter, for the various samples, and (c) estimating a fetal nucleic acid fraction for the test sample based on the portion-specific fetal fraction estimates .

[008]Também é fornecido aqui um método para estimar uma fração de ácido nucleico fetal em uma amostra de teste de uma mulher grávida, compreendendo (a) obter as contagens de fragmentos (reads) de sequências mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, (b)(i) ajustar, usando um microprocessador, as contagens de fragmentos (reads) de sequências mapeados para cada porção de acordo com um fator de ponderação atribuído independentemente para cada porção fornecendo, desse modo, contagens ajustadas para as porções, ou (b)(ii) selecionar, usando um microprocessador, um subconjunto de porções fornecendo, desse modo, um subconjunto de contagens, em que o ajuste em (b)(i) ou a seleção em (b) (ii) está de acordo com as porções para as quais um aumento da quantidade de fragmentos (reads) do ácido nucleico fetal é mapeado, e (c) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas contagens ajustadas ou o subconjunto de contagens.[008] Also provided herein is a method for estimating a fraction of fetal nucleic acid in a test sample from a pregnant woman, comprising (a) obtaining counts of fragments (reads) of sequences mapped to portions of a reference genome, whose sequence reads are circulating cell-free nucleic acid reads from a test sample from a pregnant woman, (b)(i) adjust, using a microprocessor, the sequence read counts mapped to each serving according to an independently assigned weighting factor for each serving, thereby providing adjusted counts for the servings, or (b)(ii) selecting, using a microprocessor, a subset of servings, thereby providing a subset of counts, where the adjustment in (b)(i) or the selection in (b)(ii) is in accordance with the portions to which an increased amount of fetal nucleic acid reads is mapped, and (c) estimating a fetal nucleic acid fraction for the test sample based on the adjusted counts or the subset of counts.

[009]É também fornecido aqui um método para aumentar a precisão da estimativa de uma fração de ácido nucleico fetal em uma amostra de teste de uma mulher grávida, compreendendo obter as contagens de fragmentos (reads) de sequências mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, onde, pelo menos, um subconjunto das contagens obtido é derivado de uma região do genoma que contribui com um maior número de contagens derivada de ácido nucleico fetal em relacionamento a região de contagens de ácido nucleico fetal em relacionamento as contagens total de outra região do genoma.[009] A method is also provided here for increasing the accuracy of estimating a fraction of fetal nucleic acid in a test sample from a pregnant woman, comprising obtaining counts of fragments (reads) of sequences mapped to portions of a genome of reference, whose sequence reads are circulating cell-free nucleic acid fragments (reads) of a test sample from a pregnant woman, where at least a subset of the counts obtained is derived from a region of the genome that contributes with a greater number of counts derived from fetal nucleic acid relative to the region of fetal nucleic acid counts relative to the total counts of another region of the genome.

[010]É também fornecido aqui um sistema, máquina ou aparelho compreendendo um ou mais microprocessadores e memória, em que a memória compreende instruções executáveis por um ou mais microprocessadores e ainda instruções executáveis por um ou mais microprocessadores estão configuradas para (a) acessar fragmentos (reads) da sequência de nucleotídeo mapeadas para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, (b) ponderar (i) as contagens dos fragmentos (reads) de sequências mapeados para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica do ácido nucleico fetal da porção de acordo com um fator de ponderação associado independentemente com cada porção fornecendo, desse modo, estimativas da fração fetal específica da porção de acordo com os fatores de ponderação, em que cada um dos fatores de ponderação foi determinado a partir de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada uma das várias amostras, e (ii) contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para as várias amostras e (c) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas estimativas da fração fetal específica da porção.[010] Also provided herein is a system, machine or apparatus comprising one or more microprocessors and memory, wherein the memory comprises instructions executable by one or more microprocessors and further instructions executable by one or more microprocessors are configured to (a) access fragments Nucleotide sequence reads mapped to portions of a reference genome, the sequence reads of which are circulating cell-free nucleic acid reads from a test sample from a pregnant woman, (b) weight ( i) the sequence reads counts mapped to each portion, or (ii) another portion-specific parameter, to a specific fraction of the portion's fetal nucleic acid according to a weighting factor independently associated with each portion providing, thus estimates of the portion-specific fetal fraction according to the weighting factors, where each of the weighting factors was determined from a ratio adjusted for each portion between (i) a fraction of fetal nucleic acid for each of the various samples, and (ii) counts of sequence reads mapped to each portion, or other portion-specific parameter, for the various samples, and (c) estimating a fraction of fetal nucleic acid for the test sample based on on estimates of portion-specific fetal fraction.

[011]É também fornecida aqui uma máquina que compreende um ou mais microprocessadores e memória, cuja memória compreende instruções executáveis por um ou mais microprocessadores e que a memória compreende fragmentos (reads) de sequências de nucleotídeo mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante uma amostra de teste de uma mulher grávida, e que as instruções executáveis por um ou mais microprocessadores estão configuradas para (a) ponderar, usando um microprocessador, (i) as contagens dos fragmentos (reads) de sequências mapeados para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica da porção do ácido nucleico fetal de acordo com um fator de ponderação associado independentemente com cada porção fornecendo, desse modo, estimativas da fração fetal específica da porção de acordo com os fatores de ponderação, em que cada um dos fatores de ponderação foi determinado de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada de várias amostras, e (ii)contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para as várias amostras e (b) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas estimativas da fração fetal específica da porção.[011] Also provided herein is a machine comprising one or more microprocessors and memory, which memory comprises instructions executable by one or more microprocessors and which memory comprises fragments (reads) of nucleotide sequences mapped to portions of a reference genome, which sequence reads are cell-free nucleic acid reads circulating a test sample from a pregnant woman, and which instructions executable by one or more microprocessors are configured to (a) weight, using a microprocessor, (i) counts of sequence reads mapped to each chunk, or (ii) another chunk-specific parameter, to a chunk-specific fraction of fetal nucleic acid according to a weighting factor independently associated with each chunk providing , therefore, estimates of portion-specific fetal fraction according to weighting factors, where each of the weighting factors was determined from a ratio adjusted for each portion between (i) a fraction of fetal nucleic acid for each of several samples, and (ii) counts of sequence reads mapped to each chunk, or other chunk-specific parameter, for the various samples, and (b) estimating a fraction of fetal nucleic acid for the test sample based on the estimates portion-specific fetal fraction.

[012]É também fornecido aqui um meio de armazenamento legível por computador não transitório com um programa executável armazenado no mesmo, onde o programa instrui um microprocessador para executar o seguinte: (a) acessar os fragmentos (reads) da sequência de nucleotídeo mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, (b) ponderar, usando um microprocessador, (i) as contagens dos fragmentos (reads) de sequências mapeados para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica da porção do ácido nucleico fetal de acordo com um fator de ponderação associado com cada porção independentemente fornecendo, desse modo, estimativas da fração fetal específica da porção de acordo com os fatores de ponderação, em que cada um dos fatores de ponderação foi determinado a partir de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada uma das várias amostras, e (ii)contagens dos fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para as várias amostras e (c) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas estimativas da fração fetal específica da porção.[012] A non-transient computer-readable storage medium with an executable program stored therein is also provided here, where the program instructs a microprocessor to perform the following: (a) access the fragments (reads) of the nucleotide sequence mapped to portions of a reference genome, the sequence reads of which are circulating cell-free nucleic acid reads from a test sample from a pregnant woman, (b) weight, using a microprocessor, (i) the counts of sequence reads mapped to each chunk, or (ii) another chunk-specific parameter, to a chunk-specific fraction of fetal nucleic acid according to a weighting factor associated with each chunk independently, thereby providing estimates of the portion-specific fetal fraction according to the weighting factors, wherein each of the weighting factors was determined from a ratio adjusted for each portion between (i) a fetal nucleic acid fraction for each of several samples, and (ii) counts of sequence reads mapped to each portion, or other portion-specific parameter, for the various samples, and (c) estimating a fraction of fetal nucleic acid for the test sample based on the fraction estimates portion-specific fetus.

[013]Certos aspectos da tecnologia são ainda descritos na descrição, exemplos, reivindicações e desenhos a seguir.[013] Certain aspects of the technology are further described in the following description, examples, claims and drawings.

Breve descrição dos desenhosBrief description of the drawings

[014]Os desenhos ilustram modalidades da tecnologia e não são limitativos. Para clareza e facilidade de ilustração, os desenhos não são feitos em escala e, em alguns casos, vários aspectos podem ser mostrados exagerados ou ampliados para facilitar a compreensão de modalidades particulares.[014] The drawings illustrate technology modalities and are not limiting. For clarity and ease of illustration, the drawings are not drawn to scale and, in some cases, various aspects may be shown exaggerated or enlarged to facilitate understanding of particular modalities.

[015]Figura 1 mostra uma comparação pareada de FRS (eixo vertical esquerdo, histograma superior) e o número de éxons por porção (bin) de 50 kb (eixo vertical direito, histograma inferior) para o cromossomo 13. As porções são mostradas na parte inferior, eixo X horizontal.[015] Figure 1 shows a pairwise comparison of FRS (left vertical axis, top histogram) and the number of exons per 50 kb chunk (bin) (right vertical axis, bottom histogram) for chromosome 13. The chunks are shown in the bottom, horizontal X-axis.

[016]Figura 2 mostra uma comparação pareada de FRS (eixo vertical esquerdo, histograma superior) e o teor de GC por porção (bin) de 50 kb (eixo vertical direito, histograma inferior) para o cromossomo 13. As porções são mostradas na parte inferior, eixo X horizontal.[016] Figure 2 shows a pairwise comparison of FRS (left vertical axis, upper histogram) and GC content per 50 kb portion (bin) (right vertical axis, lower histogram) for chromosome 13. The portions are shown in bottom, horizontal X-axis.

[017]Figura 3 mostra uma comparação pareada do número de éxons por porção de 50 kb (eixo vertical esquerdo, histograma superior) e o teor de GC por porção de 50 kb (eixo vertical direito, histograma inferior) para o cromossomo 13. As porções são mostradas na parte inferior, eixo X horizontal.[017] Figure 3 shows a pairwise comparison of the number of exons per 50 kb chunk (left vertical axis, top histogram) and the GC content per 50 kb chunk (right vertical axis, bottom histogram) for chromosome 13. portions are shown at the bottom, horizontal X-axis.

[018]Figura 4 mostra uma comparação pareada de FRS (eixo vertical esquerdo, histograma superior) e o número de éxons por porção de 50 kb (eixo vertical direito, histograma inferior) para cromossomo 18. As porções são mostradas na parte inferior, eixo X horizontal.[018] Figure 4 shows a paired comparison of FRS (left vertical axis, top histogram) and the number of exons per 50 kb chunk (right vertical axis, bottom histogram) for chromosome 18. The chunks are shown on the bottom, bottom axis X horizontal.

[019]Figura 5 mostra uma comparação pareada de FRS (eixo vertical esquerdo, histograma superior) e o teor de GC por porção de 50 kb (eixo vertical direito, histograma inferior) para o cromossomo 18. As porções são mostradas na parte inferior, eixo X horizontal.[019] Figure 5 shows a pairwise comparison of FRS (left vertical axis, top histogram) and GC content per 50 kb portion (right vertical axis, bottom histogram) for chromosome 18. Portions are shown at the bottom, horizontal X axis.

[020]Figura 6 mostra uma comparação pareada do número de éxons por porção de 50 kb (eixo vertical esquerdo, histograma superior) e o teor de GC por porção de 50 kb (eixo vertical direito, histograma inferior) para o cromossomo 18. As porções são mostradas na parte inferior, eixo X horizontal.[020] Figure 6 shows a pairwise comparison of the number of exons per 50 kb chunk (left vertical axis, top histogram) and the GC content per 50 kb chunk (right vertical axis, bottom histogram) for chromosome 18. portions are shown at the bottom, horizontal X-axis.

[021]Figura 7 mostra uma comparação pareada de FRS (eixo vertical esquerdo, histograma superior) e o número de éxons por porção de 50 kb (eixo vertical direito, histograma inferior) para o cromossomo 21. As porções são mostradas na parte inferior, eixo X horizontal.[021] Figure 7 shows a pairwise comparison of FRS (left vertical axis, top histogram) and the number of exons per 50 kb chunk (right vertical axis, bottom histogram) for chromosome 21. The chunks are shown at the bottom, horizontal X axis.

[022]Figura 8 mostra uma comparação pareada de FRS (eixo vertical esquerdo, histograma superior) e o teor de GC por porção de 50 kb (eixo vertical direito, histograma inferior) para o cromossomo 21. As porções são mostradas na parte inferior, eixo X horizontal.[022] Figure 8 shows a pairwise comparison of FRS (left vertical axis, top histogram) and GC content per 50 kb portion (right vertical axis, bottom histogram) for chromosome 21. Portions are shown at the bottom, horizontal X axis.

[023]Figura 9 mostra uma comparação pareada do número de éxons por porção de 50 kb (eixo vertical esquerdo, histograma superior) e o teor de GC por porção de 50 kb (eixo vertical direito, histograma inferior) para o cromossomo 21. As porções são mostradas na parte inferior, eixo X horizontal.[023] Figure 9 shows a pairwise comparison of the number of exons per 50 kb chunk (left vertical axis, top histogram) and the GC content per 50 kb chunk (right vertical axis, bottom histogram) for chromosome 21. portions are shown at the bottom, horizontal X-axis.

[024]Figura 10 mostra PERUN PAD com índices LOESS (eixo X) versus PERUN PAD com índices LOESS Z com base em porções "fetais não enriquecidas" (eixo Y) para o cromossomo 21. Os quatro quadrantes representam concordância e discordância. As faixas no quadrante são desenhadas em Z = 3. Os quadrantes inferior esquerdo e superior direito são separados por uma faixa tracejada diagonal cinza. A faixa pontilhada-tracejada é uma faixa de regressão para somente amostras não-T21. A faixa pontilhada é uma faixa de regressão para amostras T21 com base em altas porções de FRS.[024] Figure 10 shows PERUN PAD with LOESS indices (X axis) versus PERUN PAD with LOESS Z indices based on "non-enriched fetal" portions (Y axis) for chromosome 21. The four quadrants represent agreement and disagreement. The bands in the quadrant are drawn at Z = 3. The lower left and upper right quadrants are separated by a gray diagonal dashed band. The dotted-dashed band is a regression band for non-T21 samples only. The dotted band is a regression band for T21 samples based on high FRS portions.

[025]Figura 11 mostra PERUN PAD com índices LOESS Z (eixo X) versus PERUN PAD com índices LOESS Z com base em porções "fetais enriquecidas" (isto é, porções com alto FRS) (eixo Y) para o cromossomo 21. Os quatro quadrantes representam concordância e discordância. As faixas no quadrante são desenhadas em Z = 3. Os quadrantes inferior esquerdo e superior direito são separados por uma faixa tracejada diagonal cinza. A faixa pontilhada-tracejada é uma faixa de regressão para somente amostras não-T21. A faixa pontilhada é uma faixa de regressão para amostras T21 com base em altas porções de FRS.[025] Figure 11 shows PERUN PAD with LOESS Z indices (X axis) versus PERUN PAD with LOESS Z indices based on "enriched fetal" portions (ie, portions with high FRS) (Y axis) for chromosome 21. The four quadrants represent agreement and disagreement. The bands in the quadrant are drawn at Z = 3. The lower left and upper right quadrants are separated by a gray diagonal dashed band. The dotted-dashed band is a regression band for non-T21 samples only. The dotted band is a regression band for T21 samples based on high FRS portions.

[026]Figura 12 mostra um método para a determinação do comprimento do fragmento de ácido nucleico que inclui as etapas de 1) hibridização de sonda (P; linha pontilhada) para fragmento (linha cheia), 2) corte da sonda, e 3) medição do comprimento da sonda. A determinação do tamanho do fragmento é apresentada para um fragmento derivado fetal (F) e um fragmento maternalmente derivado (M).[026] Figure 12 shows a method for determining the length of the nucleic acid fragment that includes the steps of 1) probe hybridization (P; dotted line) to fragment (solid line), 2) probe cutting, and 3) Probe length measurement. Fragment size determination is shown for a fetal-derived fragment (F) and a maternally-derived fragment (M).

[027]Figura 13 mostra uma distribuição de comprimentos de fragmentos de três diferentes métodos de preparação de biblioteca. Eles incluem enzimático com o limpeza de grânulo automatizada, enzimático sem limpeza de grânulo automatizada, e TRUSEQ com limpeza de grânulo automatizada. As linhas verticais representam 143 bases e tamanhos de fragmento de 166 bases.[027] Figure 13 shows a distribution of fragment lengths from three different library preparation methods. They include enzymatic with automated bead cleaning, enzymatic without automated bead cleaning, and TRUSEQ with automated bead cleaning. Vertical lines represent 143 bases and 166 base fragment sizes.

[028]Figura 14 mostra representação do cromossomo 13 sem um filtro do tamanho do fragmento.[028] Figure 14 shows representation of chromosome 13 without a fragment size filter.

[029]Figura 15 mostra a representação do cromossomo 13 com um filtro de tamanho do fragmento de 150 bases.[029] Figure 15 shows the representation of chromosome 13 with a fragment size filter of 150 bases.

[030]Figura 16 mostra representação do cromossomo 18 sem um filtro tamanho do fragmento.[030] Figure 16 shows representation of chromosome 18 without a fragment size filter.

[031]Figura 17 mostra a representação do cromossomo 18 com um filtro de tamanho do fragmento de 150 bases.[031] Figure 17 shows the representation of chromosome 18 with a fragment size filter of 150 bases.

[032]Figura 18 mostra representação do cromossomo 21 sem um filtro tamanho do fragmento.[032] Figure 18 shows representation of chromosome 21 without a fragment size filter.

[033]Figura 19 mostra a representação do cromossomo 21 com um filtro de tamanho do fragmento de 150 bases.[033] Figure 19 shows the representation of chromosome 21 with a fragment size filter of 150 bases.

[034]Figura 20 mostra a representação do cromossomo 13 (PERUN PAD com LOESS) com filtros de tamanho variável do fragmento.[034] Figure 20 shows the representation of chromosome 13 (PERUN PAD with LOESS) with filters of variable fragment size.

[035]Figura 21 mostra a representação do cromossomo 18 (PERUN PAD com LOESS) com filtros de tamanho variável do fragmento.[035] Figure 21 shows the representation of chromosome 18 (PERUN PAD with LOESS) with filters of variable fragment size.

[036]Figura 22 mostra a representação do cromossomo 21 (PERUN PAD com LOESS) com filtros de tamanho variável do fragmento.[036] Figure 22 shows the representation of chromosome 21 (PERUN PAD with LOESS) with filters of variable fragment size.

[037]Figura 23 mostra uma tabela que apresenta uma descrição dos dados usados para certas análises.[037]Figure 23 shows a table that presents a description of the data used for certain analyses.

[038]Figura 24 mostra uma modalidade ilustrativa de um sistema em que certas modalidades da tecnologia podem ser implementadas.[038] Figure 24 shows an illustrative embodiment of a system in which certain modalities of the technology can be implemented.

[039]Figura 25A mostra uma relação entre o FRS médio de um subconjunto de porções de Chr21 (eixo X) para os índices Z de contagens normalizadas PERUN (eixo Y) para o mesmo subconjunto de porções para amostras obtidas de mulheres grávidas com feto com trissomia 21 (indicado por um asterisco) ou feto euplóide (indicado por círculos). Cada porção no subconjunto de porções selecionadas para Figura 25A tem um FRS maior que os FRS médio determinado para todas as partes do cromossomo 21 a partir do qual contagens foram obtidas. Figura 25B mostra uma relação de estimativas da fração fetal FQA (eixo X) vs. índices Z de contagens normalizadas PERUN (eixo Y) para Chr21 obtido de mulheres grávidas com um feto com trissomia 21 (indicado por um asterisco) ou feto euplóide (indicado por círculos) para todas as porções de Chr21 das quais as contagens foram obtidas.[039] Figure 25A shows a relationship between the average FRS of a subset of portions of Chr21 (X axis) to the Z indices of normalized PERUN counts (Y axis) for the same subset of portions for samples obtained from pregnant women with a fetus with trisomy 21 (indicated by an asterisk) or euploid fetus (indicated by circles). Each portion in the subset of portions selected for Figure 25A has a FRS greater than the average FRS determined for all parts of chromosome 21 from which counts were obtained. Figure 25B shows a ratio of fetal FQA fraction estimates (X-axis) vs. Z indices of PERUN normalized counts (Y-axis) for Chr21 obtained from pregnant women with a fetus with trisomy 21 (indicated by an asterisk) or euploid fetus (indicated by circles) for all portions of Chr21 from which counts were obtained.

[040]Figura 26 mostra uma relação do teor de GC por leitura (eixo X) para a função de distribuição cumulativa com base no comprimento da leitura (CDF, eixo Y) para fragmentos (reads) da faixa indicada de comprimentos de fragmento (mostrado no inserto inferior direito) para o cromossomo 21.[040] Figure 26 shows a ratio of GC content per read (X axis) to the cumulative distribution function based on read length (CDF, Y axis) for fragments (reads) of the indicated range of fragment lengths (shown in the lower right inset) for chromosome 21.

[041]Figura 27 mostra uma distribuição de interceptos PERUN (eixo X) dividida em quantis (alto, médio alto, médio Baixo e baixo) de acordo com FRS por porção (bin).[041] Figure 27 shows a distribution of PERUN intercepts (X axis) divided into quantiles (high, medium high, medium low and low) according to FRS per portion (bin).

[042]Figura 28 mostra uma distribuição de erros de validação PERUN Max Cross (eixo X) dividido em quantis (Alto, Médio alto, Médio Baixo e Baixo) de acordo com FRS por porção (bin).[042] Figure 28 shows a distribution of PERUN Max Cross validation errors (X axis) divided into quantiles (High, Medium High, Medium Low and Low) according to FRS per portion (bin).

[043]Figura 29 mostra uma correlação (r = 0,81, RMedSE = 1,5) das percentagens de fração fetal previstas para 19.312 amostras de teste a partir de um modelo de BFF baseado em 6000 amostras de treinamento (eixo X) em comparação a percentagens de fração fetal determinadas de níveis de cromossomo Y (ChrFF, eixo Y).[043] Figure 29 shows a correlation (r = 0.81, RMedSE = 1.5) of the predicted fetal fraction percentages for 19,312 test samples from a BFF model based on 6000 training samples (X axis) in comparison to determined fetal fraction percentages of Y chromosome levels (ChrFF, Y-axis).

[044]Figura 30 mostra o erro de predição relativa (eixo X) para porção (bin) (isto é, porções) com alto teor de fração fetal (distribuição mostrada à esquerda) e baixo teor de fração fetal (distribuição mostrada à direita) com base em FRS. Porções (bins) com alto teor fetal têm melhor desempenho e menor erro. Índices preditivos baseiam-se em um processo de regressão de rede elástica, com bootstrapping usado para obter perfis de densidade.[044] Figure 30 shows the relative prediction error (X axis) for portion (bin) (that is, portions) with high fetal fraction content (distribution shown on the left) and low fetal fraction content (distribution shown on the right) based on FRS. Portions (bins) with high fetal content have better performance and lower error. Predictive indices are based on an elastic network regression process, with bootstrapping used to obtain density profiles.

[045]Figura 31 mostra quatro distribuições de coeficientes do modelo (eixo X) determinadas usando um procedimento de regressão de rede elástica em subconjuntos de porções (bins) separadas de acordo com o teor de fração fetal (por exemplo, baixo, médio-baixo, médio-alto, alto). Porções (bins) com maior teor de fração fetal tendem a produzir maiores coeficientes (positivos ou negativos).[045] Figure 31 shows four distributions of model coefficients (X axis) determined using an elastic network regression procedure on subsets of portions (bins) separated according to the fetal fraction content (for example, low, medium-low , medium-high, high). Portions (bins) with higher fetal fraction content tend to produce higher coefficients (positive or negative).

[046]Figura 32 mostra duas distribuições para estimativas de fração fetal (eixo X) determinadas usando um método de BFF para amostras de teste masculinas e femininas. As duas distribuições substancialmente se sobrepõem. Fetos masculinos e femininos não mostram diferença na distribuição da fração fetal (teste KS P = 0,49).[046]Figure 32 shows two distributions for fetal fraction estimates (X axis) determined using a BFF method for male and female test samples. The two distributions substantially overlap. Male and female fetuses show no difference in fetal fraction distribution (KS test P = 0.49).

Descrição detalhadaDetailed Description

[047]São fornecidos aqui métodos para a análise de polinucleotídeos em uma mistura de ácido nucleico que incluem, por exemplo, métodos para a determinação da presença ou ausência de uma variação genética. Avaliação de uma variação genética, tal como, por exemplo, uma aneuploidia fetal, a partir de uma amostra materna tipicamente envolve o sequenciamento do ácido nucleico presente na amostra, o mapeamento dos fragmentos (reads) de sequências em certas regiões do genoma, quantificação dos fragmentos (reads) da sequência para a amostra, e análise da quantificação. Tais métodos frequentemente analisam diretamente o ácido nucleico na amostra e obtém fragmentos (reads) da sequência de nucleotídeo para todo ou substancialmente todo o ácido nucleico na amostra, o que pode ser caro e pode gerar dados supérfluos e/ou irrelevantes. Certas abordagens de separação baseadas no comprimento e/ou baseadas na sequência combinadas com certa análise baseada no comprimento e/ou baseada na sequência, no entanto, podem gerar informações específicas sobre regiões genômicas específicas, tais como, por exemplo, um cromossomo específico, e em alguns casos, podem diferenciar origens de fragmento de ácido nucleico, tal como origem materna versus fetal. Certos métodos podem incluir o uso de métodos de sequenciamento, técnicas de enriquecimento e análise baseada em comprimento. Certos métodos aqui descritos, em algumas modalidades, podem ser realizados sem determinar sequências de nucleotídeo dos fragmentos de ácido nucleico. São fornecidos aqui métodos para a análise de polinucleotídeos em uma mistura de ácido nucleico (por exemplo, a determinação da presença ou ausência de uma aneuploidia fetal) usando uma combinação de abordagens de análise e separação baseada em comprimento e/ou baseada na sequência.[047] Methods are provided here for analyzing polynucleotides in a nucleic acid mixture that include, for example, methods for determining the presence or absence of a genetic variation. Evaluation of a genetic variation, such as, for example, a fetal aneuploidy, from a maternal sample typically involves sequencing the nucleic acid present in the sample, mapping the fragments (reads) of sequences in certain regions of the genome, quantification of the fragments (reads) of the sequence for the sample, and quantitation analysis. Such methods often directly analyze the nucleic acid in the sample and obtain nucleotide sequence reads for all or substantially all of the nucleic acid in the sample, which can be expensive and may generate superfluous and/or irrelevant data. Certain length-based and/or sequence-based separation approaches combined with certain length-based and/or sequence-based analysis, however, can generate specific information about specific genomic regions, such as, for example, a specific chromosome, and in some cases, they can differentiate nucleic acid fragment origins, such as maternal versus fetal origin. Certain methods may include the use of sequencing methods, enrichment techniques, and length-based analysis. Certain methods described herein, in some embodiments, can be performed without determining nucleotide sequences of nucleic acid fragments. Provided herein are methods for analyzing polynucleotides in a nucleic acid mixture (eg, determining the presence or absence of a fetal aneuploidy) using a combination of length-based and/or sequence-based analysis and separation approaches.

[048]São também fornecidos métodos, processos e máquinas úteis para a identificação de uma variação genética. Identificar uma variação genética às vezes compreende a detecção de uma variação do número de cópia e/ou, por vezes, compreende o ajuste de um nível compreendendo uma variação do número de cópia. Em algumas modalidades, um nível é ajustado fornecendo uma identificação de uma ou mais variações genéticas ou variâncias com uma probabilidade reduzida de um diagnóstico falso negativo ou falso positivo. Em algumas modalidades, a identificação de uma variação genética por um método aqui descrito pode conduzir a um diagnóstico de, ou predisposição para a determinação de uma, uma condição médica particular. Identificando uma variação genética pode resultar em facilitar uma decisão médica e/ou empregar um procedimento médico útil.[048] Methods, processes and machines useful for identifying a genetic variation are also provided. Identifying a genetic variation sometimes comprises detecting a copy number variation and/or sometimes comprises adjusting a level comprising a copy number variation. In some embodiments, a level is set providing an identification of one or more genetic variations or variances with a reduced probability of a false negative or false positive diagnosis. In some embodiments, identification of a genetic variation by a method described herein can lead to a diagnosis of, or predisposition towards the determination of, a particular medical condition. Identifying a genetic variation can result in facilitating a medical decision and/or employing a useful medical procedure.

[049]Também aqui são fornecidos sistemas, máquinas e módulos que, em algumas modalidades, executam os métodos aqui descritos.[049] Systems, machines and modules are also provided here that, in some ways, perform the methods described here.

AmostrasSamples

[050]São fornecidos aqui métodos e composições para análise do ácido nucleico. Em algumas modalidades, são analisados os fragmentos de ácidos nucleico em uma mistura de fragmentos de ácido nucleico. Uma mistura de ácido nucleico pode compreender duas ou mais espécies de fragmentos de ácido nucleico tendo sequências de nucleotídeos diferentes, comprimentos de fragmento diferentes, origens diferentes (por exemplo, origens genômicas, origem fetal vs. materna, origem em célula ou tecido, origens da amostra, origens do sujeito, e semelhante), ou combinações dos mesmos.[050] Methods and compositions for nucleic acid analysis are provided here. In some embodiments, nucleic acid fragments are analyzed in a mixture of nucleic acid fragments. A nucleic acid mixture can comprise two or more species of nucleic acid fragments having different nucleotide sequences, different fragment lengths, different origins (e.g., genomic origins, fetal vs. maternal origin, cell or tissue origin, origins of sample, subject origins, and the like), or combinations thereof.

[051]Ácido nucleico ou uma mistura de ácido nucleico usados em métodos e aparelhos aqui descritos, frequentemente, é isolado a partir de uma amostra obtida de um sujeito. Um sujeito pode ser qualquer organismo vivo ou organismo não vivo, incluindo mas não limitado a um humano, um animal não humano, uma planta, uma bactéria, um fungo ou um protista. Qualquer animal humano ou não humano pode ser selecionado, incluindo mas não se limitando a mamíferos, répteis, aves, anfíbios, peixes, ungulados, ruminantes, bovinos (por exemplo, gado), equinos (por exemplo, cavalo), caprinos e ovinos (por exemplo, ovelha, cabra), suínos (por exemplo, porco), camelídeos (por exemplo, camelo, lhama, alpaca), macacos (por exemplo, gorila, chimpanzé), ursídeos (por exemplo, urso), aves, cão, gato, camundongo, rato, peixe, golfinho, baleia e tubarão. Um sujeito pode ser um macho ou fêmea (por exemplo, mulher, uma mulher grávida). Um sujeito pode ser qualquer idade (por exemplo, um embrião, feto, infante, criança, adulto).[051] Nucleic acid or a nucleic acid mixture used in the methods and apparatus described herein is often isolated from a sample obtained from a subject. A subject can be any living organism or non-living organism, including but not limited to a human, a non-human animal, a plant, a bacterium, a fungus or a protist. Any human or non-human animal may be selected, including but not limited to mammals, reptiles, birds, amphibians, fish, ungulates, ruminants, bovine (e.g. cattle), equine (e.g. horse), goat and sheep ( eg sheep, goat), pigs (e.g. pig), camelids (e.g. camel, llama, alpaca), monkeys (e.g. gorilla, chimpanzee), ursids (e.g. bear), birds, dog, cat, mouse, rat, fish, dolphin, whale and shark. A subject can be a male or female (eg female, a pregnant woman). A subject can be any age (for example, an embryo, fetus, infant, child, adult).

[052]O ácido nucleico pode ser isolado a partir de qualquer tipo de amostra ou espécie biológica adequada (por exemplo, uma amostra de teste). Uma amostra ou amostra de teste pode ser qualquer espécie que é isolada ou obtida a partir de um sujeito ou parte do mesmo (por exemplo, um sujeito humano, uma mulher grávida, um feto). Exemplos não limitativos de espécies incluem fluido ou tecido de um sujeito, incluindo, sem limitação, sangue ou um produto derivado do sangue (por exemplo, soro, plasma, ou semelhante), sangue do cordão umbilical, vilosidades coriônicas, fluido amniótico, fluido cerebrospinal, fluido espinal, fluido de lavagem (por exemplo, bronco-alveolar, gástrico, peritoneal, dutal, ouvido, artroscópico), amostra de biopsia (por exemplo, de embrião de pré-implantação), amostra de celocentesis, células (células do sangue, células da placenta, células de embriões ou fetais, células nucleadas fetais ou vestígios celulares fetais) ou suas partes (por exemplo, mitocondrial, núcleo, extratos, ou o semelhante), lavagens do trato reprodutor feminino, urina, fezes, expectoração, saliva, muco nasal, fluido da próstata, lavagem, sémen, fluido linfático, bile, lágrimas, transpiração, leite materno, fluido da mama, ou o semelhante ou combinações dos mesmos. Em algumas modalidades, uma amostra biológica é um cotonete cervical de um sujeito. Em algumas modalidades, uma amostra biológica pode ser sangue e, por vezes, plasma ou soro. O termo "sangue" como aqui usado refere-se a uma amostra de sangue ou preparação de uma mulher grávida ou uma mulher que está sendo testada para uma possível gravidez. O termo inclui sangue total, produtos sanguíneos ou qualquer fração do sangue, tais como soro, plasma, camada leucoplaquetária, ou o semelhante, tal como convencionalmente definido. Sangue ou suas frações frequentemente compreendem nucleossomos (por exemplo, nucleossomos maternos e/ou fetais). Nucleossomos compreendem ácidos nucleicos e são, por vezes, isentos de células ou intracelular. Sangue também compreende camadas leucoplaquetárias. Camadas leucoplaquetárias são, por vezes, isoladas usando um gradiente de Ficoll. Camadas leucoplaquetárias podem compreender células brancas do sangue (por exemplo, leucócitos, células-T, células-B, plaquetas e semelhante). Em certas modalidades camadas leucoplaquetárias compreendem ácido nucleico materno e/ou fetal. O plasma sanguíneo refere-se à fração do sangue total resultante da centrifugação do sangue tratado com anticoagulantes. Soro sanguíneo refere-se à porção aquosa de fluido remanescente após uma amostra de sangue coagular. As amostras de fluido ou tecido frequentemente são coletadas de acordo com protocolos padrão que hospitais ou clínicas geralmente seguem. Para o sangue, uma quantidade adequada de sangue periférico (por exemplo, entre 3 a 40 mililitros) é frequentemente coletada e pode ser armazenada de acordo com os procedimentos padrão antes ou após a preparação. Uma amostra de fluido ou tecido a partir do qual é extraído o ácido nucleico pode ser acelular (por exemplo, isento de célula). Em algumas modalidades, uma amostra de fluido ou tecido pode conter elementos celulares ou restos celulares. Em algumas modalidades células cancerosas ou células fetais podem ser incluídas na amostra.[052] The nucleic acid can be isolated from any type of sample or suitable biological species (for example, a test sample). A sample or test sample can be any species that is isolated or obtained from a subject or part thereof (eg, a human subject, a pregnant woman, a fetus). Non-limiting examples of species include fluid or tissue from a subject, including, without limitation, blood or a blood-derived product (e.g., serum, plasma, or the like), umbilical cord blood, chorionic villi, amniotic fluid, cerebrospinal fluid , spinal fluid, lavage fluid (e.g., bronchoalveolar, gastric, peritoneal, ductal, ear, arthroscopic), biopsy sample (e.g., from pre-implantation embryo), cellocentesis sample, cells (blood cells , placental cells, embryonic or fetal cells, fetal nucleated cells or fetal cell remnants) or parts thereof (e.g., mitochondrial, nucleus, extracts, or the like), female reproductive tract washes, urine, feces, sputum, saliva , nasal mucus, prostate fluid, lavage, semen, lymphatic fluid, bile, tears, perspiration, breast milk, breast fluid, or the like or combinations thereof. In some embodiments, a biological sample is a cervical swab from a subject. In some embodiments, a biological sample can be blood and sometimes plasma or serum. The term "blood" as used herein refers to a blood sample or preparation from a pregnant woman or a woman being tested for pregnancy. The term includes whole blood, blood products, or any fraction of blood, such as serum, plasma, buffy coat, or the like, as conventionally defined. Blood or its fractions often comprise nucleosomes (eg, maternal and/or fetal nucleosomes). Nucleosomes comprise nucleic acids and are sometimes cell-free or intracellular. Blood also comprises buffy coats. Buffy coats are sometimes isolated using a Ficoll gradient. Buffy coats can comprise white blood cells (e.g., leukocytes, T-cells, B-cells, platelets, and the like). In certain embodiments buffy coats comprise maternal and/or fetal nucleic acid. Blood plasma refers to the fraction of whole blood resulting from centrifugation of blood treated with anticoagulants. Blood serum refers to the watery portion of fluid remaining after a blood sample has clotted. Fluid or tissue samples are often collected according to standard protocols that hospitals or clinics commonly follow. For blood, an adequate amount of peripheral blood (eg, between 3 to 40 milliliters) is often collected and can be stored according to standard procedures before or after preparation. A sample of fluid or tissue from which the nucleic acid is extracted can be acellular (e.g., cell-free). In some embodiments, a fluid or tissue sample may contain cellular elements or cellular debris. In some embodiments cancer cells or fetal cells may be included in the sample.

[053]Uma amostra é frequentemente heterogênea, pelo que significa que mais do que um tipo de espécies de ácido nucleico está presente na amostra. Por exemplo, ácido nucleico heterogêneo pode incluir, mas não está limitado a, (i) ácido nucleico derivado maternal e derivado fetal, (ii) ácido nucleico de câncer e não câncer, (iii) ácido nucleico de hospedeiro e patógeno, e mais geralmente, (IV) ácido nucleico do tipo selvagem e mutado. Uma amostra pode ser heterogênea porque mais do que um tipo de célula está presente, tal como uma célula fetal e uma célula materna, uma célula de câncer e não câncer, ou uma célula hospedeira e patogênica. Em algumas modalidades, a minoria de espécies de ácido nucleico e uma maioria das espécies de ácido nucleico estão presentes.[053] A sample is often heterogeneous, which means that more than one type of nucleic acid species is present in the sample. For example, heterogeneous nucleic acid may include, but is not limited to, (i) maternally derived and fetally derived nucleic acid, (ii) cancer and non-cancer nucleic acid, (iii) host and pathogen nucleic acid, and more generally , (IV) wild-type and mutated nucleic acid. A sample may be heterogeneous because more than one cell type is present, such as a fetal cell and a maternal cell, a cancer and non-cancer cell, or a host and pathogenic cell. In some embodiments, a minority of nucleic acid species and a majority of nucleic acid species are present.

[054]Para aplicações de pré-natal da tecnologia aqui descrita, amostra de fluido ou tecido pode ser coletada de uma mulher com uma idade gestacional adequada para o teste, ou de uma mulher que está sendo testada para uma possível gravidez. Idade gestacional adequada pode variar de acordo com o teste de pré-natal a ser executado. Em certas modalidades, uma mulher grávida está, por vezes, no primeiro trimestre de gravidez, às vezes no segundo trimestre da gravidez, ou às vezes no terceiro trimestre de gravidez. Em certas modalidades, um fluido ou tecido é coletado de uma mulher grávida entre cerca de 1 a cerca de 45 semanas de gestação fetal (por exemplo, em 1-4, 4-8, 812, 12-16, 16-20, 20- 24, 24-28, 28-32, 32-36, 36-40 ou 4044 semanas de gestação fetal), e, por vezes, entre cerca de 5 a cerca de 28 semanas de gestação fetal (por exemplo, aos 6, 7, 8, 9,10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 ou 27 semanas de gestação fetal). Em certas modalidades uma amostra de fluido ou tecido é coletada de uma mulher grávida durante ou imediatamente após (por exemplo, 0 a 72 horas depois) o parto (por exemplo, nascimento vaginal ou não vaginal (por exemplo, parto cirúrgico)).[054] For prenatal applications of the technology described herein, a fluid or tissue sample may be collected from a woman with an appropriate gestational age for testing, or from a woman being tested for possible pregnancy. Appropriate gestational age may vary according to the prenatal test to be performed. In certain embodiments, a pregnant woman is sometimes in the first trimester of pregnancy, sometimes in the second trimester of pregnancy, or sometimes in the third trimester of pregnancy. In certain embodiments, a fluid or tissue is collected from a pregnant woman between about 1 to about 45 weeks of fetal gestation (e.g., at 1-4, 4-8, 812, 12-16, 16-20, 20 - 24, 24-28, 28-32, 32-36, 36-40 or 4044 weeks of fetal gestation), and sometimes between about 5 to about 28 weeks of fetal gestation (e.g. at 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26 or 27 weeks of fetal gestation). In certain embodiments a fluid or tissue sample is collected from a pregnant woman during or immediately after (eg, 0 to 72 hours after) delivery (eg, vaginal or non-vaginal birth (eg, surgical delivery)).

Aquisição de amostras de sangue e extração de DNAAcquisition of blood samples and DNA extraction

[055]Os métodos incluem aqui frequentemente separar, enriquecer e analisar DNA fetal encontrado no sangue materno, como um meio não invasivo para detectar a presença ou ausência de uma variação genética materna e/ou fetal e/ou para monitorar a saúde de um feto e / ou uma mulher grávida durante e às vezes após a gravidez. Desse modo, as primeiras etapas de praticar certos métodos aqui incluem frequentemente a obtenção de uma amostra de sangue de uma mulher grávida e extrair o DNA de uma amostra.[055] Methods here often include separating, enriching and analyzing fetal DNA found in maternal blood, as a non-invasive means to detect the presence or absence of a maternal and/or fetal genetic variation and/or to monitor the health of a fetus and/or a pregnant woman during and sometimes after pregnancy. As such, the first steps of practicing certain methods here often include obtaining a blood sample from a pregnant woman and extracting DNA from a sample.

Aquisição de amostras de sangueAcquisition of blood samples

[056]Uma amostra de sangue pode ser obtida de uma mulher grávida com uma idade gestacional adequada para testar usando um método da presente tecnologia. A idade gestacional adequada pode variar dependendo da desordem testada como discutido abaixo. Coleta de sangue de uma mulher frequentemente é executada de acordo com o protocolo padrão que hospitais ou clínicas geralmente seguem. Uma quantidade adequada de sangue periférico, por exemplo, tipicamente entre 5 a 50 mL, frequentemente, é coletada e pode ser armazenada de acordo com o procedimento padrão antes para posterior preparação. As amostras de sangue podem ser coletadas, armazenadas ou transportadas em uma maneira que minimiza a degradação ou a qualidade do ácido nucleico presente na amostra.[056] A blood sample may be obtained from a pregnant woman of an appropriate gestational age for testing using a method of present technology. The appropriate gestational age may vary depending on the disorder being tested as discussed below. Drawing blood from a woman is often performed according to the standard protocol that hospitals or clinics usually follow. An adequate amount of peripheral blood, for example typically between 5 to 50 mL, is often collected and can be stored according to standard procedure prior to further preparation. Blood samples may be collected, stored, or transported in a manner that minimizes degradation or the quality of the nucleic acid present in the sample.

Preparação de amostras de sanguePreparation of blood samples

[057]Uma análise de DNA fetal encontrado no sangue materno pode ser realizada usando, por exemplo, sangue total, soro ou plasma. Os métodos para a preparação de soro ou plasma a partir de sangue materno são conhecidos. Por exemplo, o sangue de uma mulher grávida pode ser colocado em um tubo contendo EDTA ou um produto comercial especializado tal como Vacutainer SST (Becton Dickinson, Franklin Lakes, NJ) para evitar a coagulação do sangue, e, em seguida, o plasma pode ser obtido a partir de sangue total por meio de centrifugação. O soro pode ser obtido com ou sem centrifugação seguindo a coagulação do sangue. Se a centrifugação é utilizada então é tipicamente, mas não exclusivamente, conduzida a uma velocidade adequada, por exemplo, 1.500-3.000 g vezes. Plasma ou soro pode ser submetido a etapas de centrifugação adicional antes de ser transferido para um novo tubo para extração de DNA.[057]An analysis of fetal DNA found in maternal blood can be performed using, for example, whole blood, serum or plasma. Methods for preparing serum or plasma from maternal blood are known. For example, blood from a pregnant woman can be placed in a tube containing EDTA or a specialized commercial product such as Vacutainer SST (Becton Dickinson, Franklin Lakes, NJ) to prevent blood clotting, and then the plasma can be be obtained from whole blood by means of centrifugation. Serum can be obtained with or without centrifugation following blood clotting. If centrifugation is used then it is typically, but not exclusively, conducted at a suitable speed, eg 1500-3000g times. Plasma or serum may undergo additional centrifugation steps before being transferred to a new tube for DNA extraction.

[058]Em adição à porção acelular do sangue total, o DNA também pode ser recuperado a partir da fração celular, enriquecida na camada leucoplaquetária, que pode ser obtida seguindo a centrifugação de uma amostra de sangue total de uma mulher e a remoção do plasma.[058] In addition to the acellular portion of whole blood, DNA can also be recovered from the cellular fraction, enriched in the buffy coat, which can be obtained by following centrifugation of a whole blood sample from a woman and removing the plasma .

Extração do DNADNA extraction

[059]Existem vários métodos conhecidos para a extração de DNA a partir de uma amostra biológica incluindo o sangue. Os métodos gerais de preparação de DNA (por exemplo, descritos por Sambrook e Russell, Molecular Cloning: A Laboratory Manual 3ed, 2001) podem ser seguidos; vários reagentes ou kits disponíveis comercialmente, tais como kit de ácido nucleico circulante QIAamp da Qiagen, mini kit de DNA QIAamp ou mini kit de DNA do sangue QiAmp (Qiagen, Hilden, Alemanha), kit de isolamento de DNA de sangue GenomicPrep™ (Promega, Madison, Wis.), e kit de purificação de DNA do sangue genômico GFX™ (Amersham, Piscataway, NJ), também podem ser usados para obter o DNA a partir de uma amostra de sangue de uma mulher grávida. Podem também ser utilizadas combinações de mais do que um desses métodos.[059] There are several known methods for extracting DNA from a biological sample including blood. General DNA preparation methods (eg described by Sambrook and Russell, Molecular Cloning: A Laboratory Manual 3rd ed, 2001) can be followed; various commercially available reagents or kits, such as Qiagen's QIAamp Circulating Nucleic Acid Kit, QIAamp DNA Mini Kit or QiAmp Blood DNA Mini Kit (Qiagen, Hilden, Germany), GenomicPrep™ Blood DNA Isolation Kit (Promega , Madison, Wis.), and GFX™ Genomic Blood DNA Purification Kit (Amersham, Piscataway, NJ), can also be used to obtain DNA from a blood sample from a pregnant woman. Combinations of more than one of these methods may also be used.

[060]Em algumas modalidades, a amostra pode primeiro ser enriquecida ou relativamente enriquecida como ácido nucleico fetal por um ou mais métodos. Por exemplo, a discriminação do DNA materno e fetal pode ser realizada usando as composições e processos da presente tecnologia sozinhos ou em combinação com outros fatores de discriminação. Exemplos destes fatores incluem, mas não estão limitados a diferenças de um único nucleotídeo entre cromossomo X e Y, sequências específicas do cromossomo Y, polimorfismos localizados em outro local no genoma, diferenças de tamanho entre DNA materno e fetal e diferenças no padrão de metilação entre os tecidos materno e fetal.[060] In some embodiments, the sample may first be enriched or relatively enriched as fetal nucleic acid by one or more methods. For example, discrimination of maternal and fetal DNA can be performed using the compositions and processes of the present technology alone or in combination with other discrimination factors. Examples of these factors include, but are not limited to, single nucleotide differences between X and Y chromosomes, specific Y chromosome sequences, polymorphisms located elsewhere in the genome, size differences between maternal and fetal DNA, and differences in methylation pattern between maternal and fetal tissues.

[061]Outros métodos para o enriquecimento de um extrato de uma espécie particular de ácido nucleico são descritos no pedido de patente PCT número PCT/US07/69991, depositado em 30 de maio de 2007, pedido de patente PCT número PCT/US2007/071.232, depositado em 15 de junho de 2007, pedidos provisórios US de números 60/968.876 e 60/968.878 (depositado pelo requerente), (Pedido de Patente PCT número PCT/EP05/012.707, depositado em 20 de Novembro de 28 de 2005), que são todos aqui incorporados por referência. Em certas modalidades, o ácido nucleico materno é seletivamente removido (ou parcialmente, substancialmente, completamente ou quase completamente) da amostra.[061] Other methods for enriching an extract of a particular species of nucleic acid are described in PCT patent application number PCT/US07/69991, filed on May 30, 2007, PCT patent application number PCT/US2007/071.232 , filed June 15, 2007, US provisional application numbers 60/968,876 and 60/968,878 (filed by the applicant), (PCT Patent Application number PCT/EP05/012,707, filed November 20, 2005), which are all incorporated herein by reference. In certain embodiments, maternal nucleic acid is selectively removed (either partially, substantially, completely or nearly completely) from the sample.

[062]Os termos "ácido nucleico" e "molécula de ácido nucleico" podem ser usados indiferentemente ao longo da invenção. Os termos referem-se a ácidos nucleicos de qualquer composição, tal como o DNA (por exemplo, DNA complementar (DNAc), DNA genômico (DNAg) e semelhante), RNA (por exemplo, RNA mensageiro (RNAm), RNA inibitório curto (siRNA), RNA ribossomal (RNAr), RNAt, microRNA, RNA altamente expresso pelo feto ou placenta, e semelhante), e/ou análogos de DNA ou RNA (por exemplo, contendo análogos de base, análogos de açúcar e/ou uma estrutura não nativa e semelhante), híbridos de RNA/DNA e ácidos nucleicos de poliamida (PNAs), todos os quais podem estar na forma de fita simples ou fita dupla, e, a menos que limitado de outra forma, podem abranger os análogos conhecidos de nucleotídeos naturais que possam funcionar de um modo semelhante como os nucleotídeos que ocorrem naturalmente. Um ácido nucleico pode ser, ou pode ser de um plasmídeo, fago, sequência autonomamente replicativa (ARS), centrômero, cromossomo artificial, cromossomo, ou outro ácido nucleico capaz de se replicar ou de ser replicado in vitro ou em uma célula hospedeira, uma célula, um núcleo de célula ou citoplasma de uma célula, em certas modalidades. Um molde de ácido nucleico em algumas modalidades pode ser um único cromossomo (por exemplo, uma amostra de ácido nucleico pode ser de um cromossomo de uma amostra obtida a partir de um organismo diplóide). A menos que especificamente limitado, o termo engloba ácidos nucleicos contendo análogos conhecidos de nucleotídeos naturais que têm propriedades aglutinantes semelhantes como o ácido nucleico de referência e são metabolizados de forma semelhante aos nucleotídeos de ocorrência natural. Salvo indicação em contrário, uma sequência de ácido nucleico particular abrange também implicitamente variantes modificadas de forma conservadora da mesma (por exemplo, substituições de códons degenerados), alelos, ortólogos, polimorfismos de nucleotídeo único (SNPs), e sequências complementares, desse modo como a sequência indicada explicitamente. Especificamente, substituições de códon degenerado podem ser obtidas através da geração de sequências nas quais a terceira posição de um ou mais códons selecionados (ou todos) é substituída por resíduos desoxi-inosina e/ou de base misturada. O termo ácido nucleico é usado alternadamente com o locus, gene, DNAc, e RNAm codificado por um gene. O termo pode também incluir, como equivalentes, derivados, variantes e análogos de RNA ou DNA sintetizado a partir de análogos de nucleotídeo, polinucleotídeos de fita simples ("sentido" ou "antessentido”, de fita “+” ou fita “-”, quadro legível “adiante” ou quadro legível “reverso”) e de fita dupla. O termo "gene" significa o segmento de DNA envolvido na produção de uma cadeia de polipeptídeo; ele inclui regiões que precedem e seguem a região de codificação (líder e reboque) envolvidas na transcrição/tradução do produto genético e a regulação da transcrição/tradução, bem como sequências intervenientes (íntrons) entre segmentos de codificação individuais (éxons). Desoxirribonucleotídeos incluem desoxiadenosina, desoxicitidina, desoxiguanosina e desoxitimidina. Para RNA, a base citosina é substituída por uracila. Um molde de ácido nucleico pode ser preparado usando um ácido nucleico obtido a partir de um sujeito como um modelo.[062] The terms "nucleic acid" and "nucleic acid molecule" may be used interchangeably throughout the invention. The terms refer to nucleic acids of any composition, such as DNA (e.g., complementary DNA (AcDNA), genomic DNA (gDNA) and the like), RNA (e.g., messenger RNA (mRNA), short inhibitory RNA ( siRNA), ribosomal RNA (rRNA), tRNA, microRNA, RNA highly expressed by the fetus or placenta, and the like), and/or DNA or RNA analogs (e.g., containing base analogs, sugar analogs, and/or a structure non-native and similar), RNA/DNA hybrids and polyamide nucleic acids (PNAs), all of which may be in single-stranded or double-stranded form, and, unless otherwise limited, may encompass the known analogues of natural nucleotides that can function in a similar way to naturally occurring nucleotides. A nucleic acid may be, or may be from, a plasmid, phage, autonomously replicating sequence (ARS), centromere, artificial chromosome, chromosome, or other nucleic acid capable of replicating or being replicated in vitro or in a host cell, a cell, a cell nucleus, or cytoplasm of a cell, in certain embodiments. A nucleic acid template in some embodiments may be a single chromosome (for example, a nucleic acid sample may be from a chromosome of a sample obtained from a diploid organism). Unless specifically limited, the term encompasses nucleic acids containing known analogues of natural nucleotides that have similar binding properties as the reference nucleic acid and are metabolized similarly to naturally occurring nucleotides. Unless otherwise noted, a particular nucleic acid sequence also implicitly encompasses conservatively modified variants thereof (e.g., degenerate codon substitutions), alleles, orthologs, single nucleotide polymorphisms (SNPs), and complementary sequences, as the explicitly specified sequence. Specifically, degenerate codon substitutions can be obtained by generating sequences in which the third position of one or more selected codons (or all) is replaced by deoxyinosine and/or mixed base residues. The term nucleic acid is used interchangeably with the locus, gene, cDNA, and mRNA encoded by a gene. The term may also include, as equivalents, derivatives, variants and analogues of RNA or DNA synthesized from nucleotide analogues, single-stranded polynucleotides ("sense" or "foresense", "+" strand or "-" strand, frame readable "forward" or frame readable "reverse") and double-stranded. The term "gene" means the segment of DNA involved in the production of a polypeptide chain; it includes regions that precede and follow the coding region (leader and trailer) involved in the transcription/translation of the gene product and the regulation of transcription/translation, as well as intervening sequences (introns) between individual coding segments (exons). Deoxyribonucleotides include deoxyadenosine, deoxycytidine, deoxyguanosine, and deoxythymidine. For RNA, the base cytosine is replaced by uracil A nucleic acid template can be prepared using a nucleic acid obtained from a subject as a template.

Isolamento e Processamento do ácido nucleicoNucleic acid isolation and processing

[063]O ácido nucleico pode ser derivado de uma ou mais fontes (por exemplo, células, soro, plasma, camada leucoplaquetária, fluido linfático, pele, sujeira, e semelhante) através de métodos conhecidos na técnica. Qualquer método adequado pode ser usado para isolar, extrair e/ou purificar DNA a partir de uma amostra biológica (por exemplo, a partir de sangue ou um produto derivado de sangue), exemplos não limitativos dos quais incluem os métodos de preparação de DNA (por exemplo, descrito por Sambrook e Russell, Molecular Cloning: A Laboratory Manual 3d ed, 2001), diversos reagentes ou kits disponíveis comercialmente, tais como kit de ácido nucleico circulante QIAamp da Qiagen, mini kit de DNA QIAamp ou mini kit de DNA do sangue QiAmp (Qiagen, Hilden, Alemanha), kit de isolamento de DNA do sangue GenomicPrep™ (Promega, Madison, Wis.), e kit de purificação de DNA do sangue genômico GFX™ (Amersham, Piscataway, NJ), o semelhante ou combinações dos mesmos.[063] The nucleic acid can be derived from one or more sources (e.g., cells, serum, plasma, buffy coat, lymphatic fluid, skin, dirt, and the like) by methods known in the art. Any suitable method can be used to isolate, extract and/or purify DNA from a biological sample (e.g., from blood or a blood-derived product), non-limiting examples of which include DNA preparation methods ( for example, described by Sambrook and Russell, Molecular Cloning: A Laboratory Manual 3d ed, 2001), various commercially available reagents or kits, such as Qiagen's QIAamp Circulating Nucleic Acid Kit, QIAamp DNA Mini Kit, or QIAamp DNA Mini Kit. QiAmp blood (Qiagen, Hilden, Germany), GenomicPrep™ Blood DNA Isolation Kit (Promega, Madison, Wis.), and GFX™ Genomic Blood DNA Purification Kit (Amersham, Piscataway, NJ), the like or combinations thereof.

[064]Procedimentos e reagentes de lise celular são conhecidos na técnica e podem, geralmente, ser realizados por métodos de lise química (por exemplo, detergente, soluções hipotônicas, procedimentos enzimáticos, e semelhante, ou combinação dos mesmos), física (por exemplo, prensa francesa, sonicação e semelhante) ou eletrolítica. Qualquer procedimento de lise adequado pode ser usado. Por exemplo, métodos químicos geralmente empregam agentes de lise para romper células e extrair os ácidos nucleicos das células seguido de tratamento com sais caotrópicos. Métodos físicos, tais como congelamento/descongelamento seguido por moagem, o uso de prensas de células e semelhante são também úteis. Procedimentos de lise de elevado teor de sal são também comumente usados. Por exemplo, pode ser usado um procedimento de lise alcalina. O último procedimento tradicionalmente incorpora o uso de soluções de fenol- clorofórmio, e um procedimento livre de fenol-clorofórmio alternativo envolvendo três soluções que podem ser utilizadas. Nos últimos processos, uma solução pode conter 15 mM de Tris, pH 8,0; 10 mM de EDTA e 100 ug/mL de RNAase A; uma segunda solução pode conter NaOH a 0,2 N e SDS a 1%; e uma terceira solução pode conter KOAc a 3M, pH 5,5. Estes procedimentos podem ser encontrados em Current Protocols in Molecular Biology, John Wiley & Sons, Nova Iorque, 6.3.16.3.6 (1989), aqui incorporado na sua totalidade.[064] Cell lysis procedures and reagents are known in the art and can generally be performed by chemical lysis methods (for example, detergent, hypotonic solutions, enzymatic procedures, and the like, or combination thereof), physical (for example , french press, sonication and similar) or electrolytic. Any suitable lysis procedure can be used. For example, chemical methods commonly employ lysing agents to disrupt cells and extract the cell's nucleic acids followed by treatment with chaotropic salts. Physical methods such as freeze/thaw followed by milling, the use of cell presses and the like are also useful. High salt lysis procedures are also commonly used. For example, an alkaline lysis procedure can be used. The latter procedure traditionally incorporates the use of phenol-chloroform solutions, and an alternative phenol-chloroform-free procedure involving three solutions may be used. In the latter processes, a solution may contain 15 mM Tris, pH 8.0; 10 mM EDTA and 100 ug/ml RNAase A; a second solution may contain 0.2N NaOH and 1% SDS; and a third solution may contain 3M KOAc, pH 5.5. These procedures can be found in Current Protocols in Molecular Biology, John Wiley & Sons, New York, 6.3.16.3.6 (1989), incorporated herein in its entirety.

[065]O ácido nucleico pode ser isolado em um ponto de tempo diferente em comparação com outro ácido nucleico, em que cada uma das amostras é da mesma fonte ou diferente. Um ácido nucleico pode ser de uma biblioteca de ácido nucleico, tal como uma biblioteca de DNAc ou RNA, por exemplo. Um ácido nucleico pode ser um resultado da purificação de ácido nucleico ou isolamento e/ou amplificação de moléculas de ácido nucleico da amostra. O ácido nucleico fornecido para processos aqui descritos pode conter o ácido nucleico de uma amostra ou de duas ou mais amostras (por exemplo, de 1 ou mais, 2 ou mais, 3 ou mais, 4 ou mais, 5 ou mais, 6 ou mais, 7 ou mais, 8 ou mais, 9 ou mais, 10 ou mais, 11 ou mais, 12 ou mais, 13 ou mais, 14 ou mais, 15 ou mais, 16 ou mais, 17 ou mais, 18 ou mais, 19 ou mais, ou 20 ou mais amostras).[065] The nucleic acid can be isolated at a different time point compared to another nucleic acid, where each of the samples is from the same or different source. A nucleic acid can be from a nucleic acid library, such as a cDNA or RNA library, for example. A nucleic acid can be a result of nucleic acid purification or isolation and/or amplification of nucleic acid molecules from the sample. The nucleic acid provided for processes described herein may contain the nucleic acid from one sample or from two or more samples (e.g., from 1 or more, 2 or more, 3 or more, 4 or more, 5 or more, 6 or more , 7 or more, 8 or more, 9 or more, 10 or more, 11 or more, 12 or more, 13 or more, 14 or more, 15 or more, 16 or more, 17 or more, 18 or more, 19 or more, or 20 or more samples).

[066]Os ácidos nucleicos podem incluir ácido nucleico extracelular em certas modalidades. O termo "ácido nucleico extracelular", como aqui usado, pode referir-se ao ácido nucleico isolado de uma fonte tendo substancialmente nenhuma célula e é também referido como ácido nucleico "isento de célula", "ácido nucleico isento de célula circulante" (por exemplo, fragmentos de CCF) e/ou "ácido nucleico isento de célula circulante". Ácido nucleico extracelular pode estar presente em e obtido de sangue (por exemplo, do sangue de uma mulher grávida). Ácido nucleico extracelular frequentemente não inclui células detectáveis e pode conter elementos celulares ou restos celulares. Exemplos não limitativos de fontes acelulares de ácido nucleico extracelular são sangue, plasma sanguíneo, soro sanguíneo e urina. Como aqui usado, o termo "obter ácido nucleico da amostra circulante isenta de célula "inclui a obtenção de uma amostra diretamente (por exemplo, coletar uma amostra, por exemplo, uma amostra de teste) ou obter uma amostra a partir de outra que tem coletado uma amostra. Sem ser limitado pela teoria, o ácido nucleico extracelular pode ser um produto de decomposição celular e apoptose celular, o que proporciona uma base para o ácido nucleico extracelular frequentemente ter uma série de comprimentos através de um espectro (por exemplo, uma "escada").[066] Nucleic acids may include extracellular nucleic acid in certain embodiments. The term "extracellular nucleic acid", as used herein, can refer to nucleic acid isolated from a source having substantially no cells and is also referred to as "cell-free" nucleic acid, "circulating cell-free nucleic acid" (for (e.g., CCF fragments) and/or "circulating cell-free nucleic acid". Extracellular nucleic acid may be present in and obtained from blood (eg, from the blood of a pregnant woman). Extracellular nucleic acid often does not include detectable cells and may contain cellular elements or cellular debris. Non-limiting examples of acellular sources of extracellular nucleic acid are blood, blood plasma, blood serum and urine. As used herein, the term "obtaining nucleic acid from the cell-free circulating sample" includes obtaining a sample directly (e.g., collecting a sample, e.g., a test sample) or obtaining a sample from one that has collected a sample. Without being bound by theory, extracellular nucleic acid can be a product of cellular breakdown and cellular apoptosis, which provides a basis for extracellular nucleic acid often having a range of lengths across a spectrum (e.g., a "ladder") .

[067]Ácido nucleico extracelular pode incluir diferentes espécies de ácido nucleico, e, portanto, é aqui referido como "heterogêneos", em certas modalidades. Por exemplo, soro sanguíneo ou plasma de uma pessoa que tenha câncer pode incluir ácido nucleico de células cancerosas e ácido nucleico de células não cancerígenas. Em outro exemplo, o soro ou plasma do sangue de uma mulher grávida pode incluir ácido nucleico materno e o ácido nucleico fetal. Em alguns casos, o ácido nucleico fetal, por vezes, é de cerca de 5% a cerca de 50% do ácido nucleico total (por exemplo, cerca de 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30,31, 32, 33, 34, 35, 36, 37, 38,39,40,41,42,43, 44, 45, 46, 47, 48, ou 49% do ácido nucleico total é ácido nucleico fetal). Em algumas modalidades, a maior parte do ácido nucleico do ácido nucleico fetal é de um comprimento de cerca de 500 pares de bases ou menos (por exemplo, cerca de 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100% de ácido nucleico fetal é de um comprimento de cerca de 500 pares de bases ou menos). Em algumas modalidades, a maior parte do ácido nucleico do ácido nucleico fetal é de um comprimento de cerca de 250 pares de bases ou menos (por exemplo, cerca de 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100% de ácido nucleico fetal é de um comprimento de cerca de 250 pares de bases ou menos). Em algumas modalidades, a maior parte do ácido nucleico do ácido nucleico fetal é de um comprimento de cerca de 200 pares de bases ou menos (por exemplo, cerca de 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100% de ácido nucleico fetal é de um comprimento de cerca de 200 pares de bases ou menos). Em algumas modalidades, a maior parte do ácido nucleico do ácido nucleico fetal é de um comprimento de cerca de 150 pares de bases ou menos (por exemplo, cerca de 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100% de ácido nucleico fetal é de um comprimento de cerca de 150 pares de bases ou menos). Em algumas modalidades, a maior parte do ácido nucleico do ácido nucleico fetal é de um comprimento de cerca de 100 pares de bases ou menos (por exemplo, cerca de 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100% de ácido nucleico fetal é de um comprimento de cerca de 100 pares de bases ou menos). Em algumas modalidades, a maior parte do ácido nucleico do ácido nucleico fetal é de um comprimento de cerca de 50 pares de bases ou menos (por exemplo, cerca de 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100% de ácido nucleico fetal é de um comprimento de cerca de 50 pares de bases ou menos). Em algumas modalidades, a maior parte do ácido nucleico do ácido nucleico fetal é de um comprimento de cerca de 25 pares de bases ou menos (por exemplo, cerca de 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 ou 100% de ácido nucleico fetal é de um comprimento de cerca de 25 pares de bases ou menos).[067] Extracellular nucleic acid may include different species of nucleic acid, and therefore is referred to herein as "heterogeneous", in certain embodiments. For example, blood serum or plasma from a person who has cancer may include nucleic acid from cancer cells and nucleic acid from non-cancer cells. In another example, the blood serum or plasma of a pregnant woman can include maternal nucleic acid and fetal nucleic acid. In some cases, the fetal nucleic acid sometimes is from about 5% to about 50% of the total nucleic acid (e.g. about 4, 5, 6, 7, 8, 9, 10, 11, 12 , 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37 , 38,39,40,41,42,43, 44, 45, 46, 47, 48, or 49% of the total nucleic acid is fetal nucleic acid). In some embodiments, the majority of the nucleic acid of the fetal nucleic acid is of a length of about 500 base pairs or less (e.g., about 80, 85, 90, 91, 92, 93, 94, 95, 96 , 97, 98, 99 or 100% fetal nucleic acid is of a length of about 500 base pairs or less). In some embodiments, the majority of the nucleic acid of the fetal nucleic acid is of a length of about 250 base pairs or less (e.g., about 80, 85, 90, 91, 92, 93, 94, 95, 96 , 97, 98, 99 or 100% fetal nucleic acid is of a length of about 250 base pairs or less). In some embodiments, the majority of the nucleic acid of the fetal nucleic acid is of a length of about 200 base pairs or less (e.g., about 80, 85, 90, 91, 92, 93, 94, 95, 96 , 97, 98, 99 or 100% fetal nucleic acid is of a length of about 200 base pairs or less). In some embodiments, the majority of the nucleic acid of the fetal nucleic acid is of a length of about 150 base pairs or less (e.g., about 80, 85, 90, 91, 92, 93, 94, 95, 96 , 97, 98, 99 or 100% fetal nucleic acid is of a length of about 150 base pairs or less). In some embodiments, the majority of the nucleic acid of the fetal nucleic acid is of a length of about 100 base pairs or less (e.g., about 80, 85, 90, 91, 92, 93, 94, 95, 96 , 97, 98, 99, or 100% fetal nucleic acid is of a length of about 100 base pairs or less). In some embodiments, the majority of the nucleic acid of the fetal nucleic acid is of a length of about 50 base pairs or less (e.g., about 80, 85, 90, 91, 92, 93, 94, 95, 96 , 97, 98, 99 or 100% fetal nucleic acid is of a length of about 50 base pairs or less). In some embodiments, the majority of the nucleic acid of the fetal nucleic acid is of a length of about 25 base pairs or less (e.g., about 80, 85, 90, 91, 92, 93, 94, 95, 96 , 97, 98, 99, or 100% fetal nucleic acid is of a length of about 25 base pairs or less).

[068]O ácido nucleico pode ser fornecido para a realização de métodos aqui descritos sem processamento da amostra (s) contendo o ácido nucleico, em certas modalidades. Em algumas modalidades, o ácido nucleico é fornecido para a realização de métodos aqui descritos, após o processamento da amostra (s) contendo o ácido nucleico. Por exemplo, um ácido nucleico pode ser extraído, isolado, purificado, parcialmente purificado ou amplificado da amostra (s). O termo "isolado", tal como aqui usado refere- se ao ácido nucleico removido do seu ambiente original (por exemplo, o ambiente natural se for de ocorrência natural, ou uma célula hospedeira se expressa exogenamente), e, portanto, é alterada pela intervenção humana (por exemplo, "pela mão do homem") do seu ambiente original. O termo "ácido nucleico isolado", como aqui usado, pode referir-se a um ácido nucleico removido de um sujeito (por exemplo, um sujeito humano). Um ácido nucleico isolado pode ser fornecido com menos componentes de ácido não-nucleico (por exemplo, proteínas, lipídeos) do que a quantidade de componentes presentes em uma amostra a fonte. Uma composição compreendendo ácido nucleico isolado pode ser de cerca de 50% a mais de 99% isento ácido livre de componentes de ácido não-nucleico. Uma composição compreendendo ácido nucleico isolado pode ser de cerca de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais que 99% isento de componentes de ácido não-nucleico. O termo "purificado" tal como aqui usado pode referir-se a um ácido nucleico, desde que contenha menos quantidade de componentes de ácido não-nucleico (por exemplo, proteína, lipídeo, carboidrato) do que a quantidade de componentes de ácido não-nucleico presentes antes de submeter o ácido nucleico a um processo de purificação. Uma composição compreendendo ácido nucleico purificado pode ser de cerca de 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais do que 99% isento de outros componentes de ácido não-nucleico. O termo "purificado" tal como aqui usado pode referir-se a um ácido nucleico, desde que contenha menos espécies de ácido nucleico do que na fonte da amostra a partir da qual o ácido nucleico é derivado. Uma composição compreendendo ácido nucleico purificado pode ser cerca de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais do que 99% isento de outras espécies de ácido nucleico Por exemplo, ácido nucleico fetal pode ser purificado a partir de uma mistura que compreende ácido nucleico materno e fetal. Em certos exemplos, nucleossomos que compreendem pequenos fragmentos de ácido nucleico fetal podem ser purificados a partir de uma mistura de complexos de maior nucleossomo compreendendo fragmentos maiores de ácido nucleico materno.[068] The nucleic acid can be provided for carrying out methods described herein without processing the sample(s) containing the nucleic acid, in certain embodiments. In some embodiments, the nucleic acid is provided for carrying out methods described herein, after processing the sample(s) containing the nucleic acid. For example, a nucleic acid can be extracted, isolated, purified, partially purified or amplified from the sample(s). The term "isolated" as used herein refers to nucleic acid removed from its original environment (e.g., the natural environment if it is naturally occurring, or a host cell is exogenously expressed), and therefore is altered by human intervention (e.g., "by the hand of man") from its original environment. The term "isolated nucleic acid", as used herein, can refer to nucleic acid removed from a subject (e.g., a human subject). An isolated nucleic acid may be provided with fewer non-nucleic acid components (eg, proteins, lipids) than the amount of components present in a source sample. A composition comprising isolated nucleic acid can be from about 50% to greater than 99% free acid free of non-nucleic acid components. A composition comprising isolated nucleic acid can be about 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or greater than 99% free of acid components non-nucleic. The term "purified" as used herein may refer to a nucleic acid as long as it contains less of the non-nucleic acid components (e.g., protein, lipid, carbohydrate) than the amount of non-nucleic acid components. nucleic acids present before subjecting the nucleic acid to a purification process. A composition comprising purified nucleic acid can be about 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or greater than 99% free of other non-nucleic acid components. The term "purified" as used herein may refer to a nucleic acid as long as it contains fewer species of nucleic acid than in the sample source from which the nucleic acid is derived. A composition comprising purified nucleic acid can be about 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or greater than 99% free of other species of nucleic acid For example, fetal nucleic acid can be purified from a mixture comprising maternal and fetal nucleic acid. In certain examples, nucleosomes comprising small fragments of fetal nucleic acid can be purified from a mixture of larger nucleosome complexes comprising larger fragments of maternal nucleic acid.

[069]Em algumas modalidades ácidos nucleicos são fragmentados ou clivados antes, durante ou depois de um método aqui descrito. Ácido nucleico fragmentado ou clivado pode ter um comprimento nominal, médio ou baixo de cerca de 5 a cerca de 10.000 pares de bases, cerca de 100 a cerca de 1000 pares de bases, cerca de 100 a cerca de 500 pares de bases, ou cerca de 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000 ou 9000 pares de bases. Os fragmentos podem ser gerados por um método adequado conhecido na técnica, e o comprimento médio, baixo ou nominal de fragmentos de ácido nucleico pode ser controlado pela seleção de um procedimento de geração de fragmento adequado.[069] In some embodiments nucleic acids are fragmented or cleaved before, during or after a method described herein. Fragmented or cleaved nucleic acid can have a nominal, medium, or short length of about 5 to about 10,000 base pairs, about 100 to about 1000 base pairs, about 100 to about 500 base pairs, or about from 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 200, 300, 400, 500, 600, 700 , 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000 or 9000 base pairs. Fragments can be generated by a suitable method known in the art, and the average, low, or nominal length of nucleic acid fragments can be controlled by selecting a suitable fragment generation procedure.

[070]Os fragmentos de ácido nucleico podem conter as sequências de nucleotídeos que se sobrepõem, e tais sequências que se sobrepõem podem facilitar a construção de uma sequência de nucleotídeo do ácido nucleico contrário não fragmentado, ou seu segmento. Por exemplo, um fragmento pode ter subsequências x e y e outro fragmento pode ter subsequências y e z, em que x, y e z são sequências de nucleotídeo que podem ser de 5 nucleotídeos de comprimento ou mais. Sequência de sobreposição y pode ser utilizada para facilitar a construção da sequência de nucleotídeo x- y-z no ácido nucleico de uma amostra em certas modalidades. O ácido nucleico pode ser parcialmente fragmentado (por exemplo, a partir de uma reação de clivagem específica incompleta ou terminado) ou totalmente fragmentado em certas modalidades.[070] Nucleic acid fragments may contain overlapping nucleotide sequences, and such overlapping sequences may facilitate the construction of an unfragmented counter nucleic acid nucleotide sequence, or segment thereof. For example, one fragment may have x and y subsequences and another fragment may have y and z subsequences, where x, y, and z are nucleotide sequences that may be 5 nucleotides in length or longer. Y-overlapping sequence can be used to facilitate the construction of the x-y-z nucleotide sequence in the nucleic acid of a sample in certain embodiments. Nucleic acid can be partially fragmented (e.g., from an incomplete or terminated specific cleavage reaction) or fully fragmented in certain embodiments.

[071]Em algumas modalidades, ácido nucleico é fragmentado ou clivado por um método adequado, exemplos não limitativos dos quais incluem métodos físicos (por exemplo, cisalhamento, por exemplo, sonicação, prensa francesa, calor, irradiação de UV, o semelhante), processos enzimáticos (por exemplo, agentes de clivagem enzimática (por exemplo, uma nuclease adequada, uma enzima de restrição adequada, uma enzima de restrição sensível a metilação adequada)), métodos químicos (por exemplo, alquilação, DMS, piperidina, hidrólise ácida, hidrólise básica, calor, semelhante, ou suas combinações), processos descritos na publicação de pedido de patente US n° 20050112590, o semelhante ou combinações dos mesmos.[071] In some embodiments, nucleic acid is fragmented or cleaved by a suitable method, non-limiting examples of which include physical methods (e.g., shear, e.g., sonication, French press, heat, UV irradiation, the like), enzymatic processes (e.g., enzymatic cleavage agents (e.g., a suitable nuclease, a suitable restriction enzyme, a suitable methylation-sensitive restriction enzyme)), chemical methods (e.g., alkylation, DMS, piperidine, acid hydrolysis, basic hydrolysis, heat, the like, or combinations thereof), processes described in US Patent Application Publication No. 20050112590, the like, or combinations thereof.

[072]Tal como aqui usado, "fragmentação" ou "clivagem" refere-se a um procedimento ou condições em que uma molécula de ácido nucleico, tal como um modelo de gene da molécula de ácido nucleico ou seu produto amplificado, pode ser separada em duas ou mais moléculas de ácido nucleico menores. Tal fragmentação ou clivagem pode ser específica de sequência, específica da base, ou não-específica, e pode ser realizada por qualquer um de uma variedade de métodos, reagentes ou condições, incluindo, por exemplo, fragmentação química, enzimática, física.[072] As used herein, "fragmentation" or "cleavage" refers to a procedure or conditions in which a nucleic acid molecule, such as a gene template of the nucleic acid molecule or its amplified product, can be separated into two or more smaller nucleic acid molecules. Such fragmentation or cleavage may be sequence-specific, base-specific, or non-specific, and may be accomplished by any of a variety of methods, reagents or conditions, including, for example, chemical, enzymatic, physical fragmentation.

[073]Como aqui usado, "fragmentos", "produtos de clivagem", "produtos clivados" ou suas variantes gramaticais destes, refere-se a moléculas de ácido nucleico resultantes de uma fragmentação ou clivagem de um modelo de gene da molécula de ácido nucleico ou produto amplificado da mesma. Embora tais fragmentos ou produtos clivados possam se referir a todas as moléculas de ácido nucleico resultantes de uma reação de clivagem, tipicamente tais fragmentos ou produtos clivados referem-se somente a moléculas de ácido nucleico resultantes de uma fragmentação ou a clivagem de um modelo de gene da molécula de ácido nucleico ou segmento de um produto amplificado contendo a mesma sequência de nucleotídeo correspondente de um gene da molécula modelo de ácido nucleico. O termo "amplificação", tal como aqui usado, refere-se a submeter um ácido nucleico alvo em uma amostra a um processo que linearmente ou exponencialmente gera ácidos nucleicos de amplicon tendo a mesma sequência de nucleotídeo ou substancialmente a mesma que o ácido nucleico alvo, ou seu segmento.[073] As used herein, "fragments", "cleavage products", "cleaved products" or their grammatical variants thereof, refers to nucleic acid molecules resulting from a fragmentation or cleavage of a gene model of the acid molecule nucleic acid or amplified product thereof. While such fragments or cleavage products may refer to all nucleic acid molecules resulting from a cleavage reaction, typically such fragments or cleavage products only refer to nucleic acid molecules resulting from a fragmentation or cleavage of a gene template. of the nucleic acid molecule or segment of an amplified product containing the same corresponding nucleotide sequence of a model nucleic acid molecule gene. The term "amplification", as used herein, refers to subjecting a target nucleic acid in a sample to a process that linearly or exponentially generates amplicon nucleic acids having the same or substantially the same nucleotide sequence as the target nucleic acid. , or its thread.

[074]Em certas modalidades, o termo "amplificado" refere-se a um método que compreende uma reação em cadeia de polimerase (PCR). Por exemplo, um produto amplificado pode conter um ou mais nucleotídeos a mais do que a região de nucleotídeo amplificada de uma sequência modelo de ácido nucleico (por exemplo, um iniciador pode conter nucleotídeos "extras", tal como uma sequência de iniciação da transcrição, em adição aos nucleotídeos complementares a um gene da molécula modelo de ácido nucleico, resultando em um produto amplificado contendo nucleotídeos "extras" ou nucleotídeos não correspondentes à região de nucleotídeo amplificada do gene da molécula de ácido nucleico modelo). Por conseguinte, os fragmentos podem incluir fragmentos resultantes de segmentos ou partes de moléculas de ácido nucleico amplificadas contendo, pelo menos em parte, informação da sequência de nucleotídeo a partir de ou com base na molécula de ácido nucleico modelo representativa.[074] In certain embodiments, the term "amplified" refers to a method comprising a polymerase chain reaction (PCR). For example, an amplified product may contain one or more nucleotides more than the amplified nucleotide region of a template nucleic acid sequence (e.g., a primer may contain "extra" nucleotides, such as a transcription initiation sequence, in addition to nucleotides complementary to a template nucleic acid molecule gene, resulting in an amplified product containing "extra" nucleotides or nucleotides not corresponding to the amplified nucleotide region of the template nucleic acid molecule gene). Accordingly, fragments may include resulting fragments of segments or parts of amplified nucleic acid molecules containing, at least in part, nucleotide sequence information from or based on the representative model nucleic acid molecule.

[075]Como aqui usado, o termo "reações de clivagem complementares" refere-se a reações de clivagem que são realizadas no mesmo ácido nucleico usando reagentes de clivagem diferentes ou alterando a especificidade da clivagem do mesmo reagente de clivagem, tais que os padrões de clivagem alternativos do mesmo ácido nucleico ou proteína alvo ou de referência são gerados. Em certas modalidades, o ácido nucleico pode ser tratado com um ou mais agentes específicos de clivagem (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais agentes de clivagem específicos) em um ou mais porções de reação (por exemplo, o ácido nucleico é tratado com cada agente de clivagem específico em um porção separado). O termo "agente de clivagem específico" como aqui usado refere-se a um agente, por vezes, um produto químico ou uma enzima que pode clivar um ácido nucleico em um ou mais sítios específicos.[075] As used herein, the term "complementary cleavage reactions" refers to cleavage reactions that are performed on the same nucleic acid using different cleavage reagents or by changing the cleavage specificity of the same cleavage reagent, such that the standards Alternative cleavage sequences of the same target or reference nucleic acid or protein are generated. In certain embodiments, the nucleic acid can be treated with one or more specific cleavage agents (e.g., 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more specific cleavage agents) in a or more reaction portions (eg, the nucleic acid is treated with each specific cleavage agent in a separate portion). The term "specific cleavage agent" as used herein refers to an agent, sometimes a chemical or an enzyme, that can cleave a nucleic acid at one or more specific sites.

[076]O ácido nucleico também pode ser exposto a um processo que modifica certos nucleotídeos no ácido nucleico antes de fornecer ácido nucleico para um método aqui descrito. Um processo que modifica seletivamente o ácido nucleico com base no estado de metilação de nucleotídeos do mesmo pode ser aplicado ao ácido nucleico, por exemplo. Além disso, as condições tais como alta temperatura, radiação ultravioleta, radiação-X, podem induzir mudanças na sequência de uma molécula de ácido nucleico. O ácido nucleico pode ser fornecido em qualquer forma adequada útil para a condução da análise da sequência adequada.[076] The nucleic acid may also be exposed to a process that modifies certain nucleotides in the nucleic acid before providing nucleic acid for a method described herein. A process that selectively modifies nucleic acid based on its nucleotide methylation state can be applied to nucleic acid, for example. Furthermore, conditions such as high temperature, ultraviolet radiation, X-radiation, can induce changes in the sequence of a nucleic acid molecule. The nucleic acid may be provided in any suitable form useful for conducting the proper sequence analysis.

[077]O ácido nucleico pode ser de fita simples ou dupla. DNA de fita simples, por exemplo, pode ser gerado por desnaturação do DNA de fita dupla por aquecimento ou por tratamento com álcali, por exemplo. Em certas modalidades, o ácido nucleico se encontra em uma estrutura do LASSO D, formado por invasão de fita de uma molécula de DNA duplex por um oligonucleotídeo ou uma molécula do tipo DNA, tal como ácido nucleico de peptídeo (PNA). Formação do LASSO D pode ser facilitada pela adição de proteína RecA de E.coli e/ou pela alteração da concentração de sal, por exemplo, usando métodos conhecidos na técnica.[077] The nucleic acid can be single-stranded or double-stranded. Single-stranded DNA, for example, can be generated by denaturing double-stranded DNA by heating or by treating it with alkali, for example. In certain embodiments, the nucleic acid is in a LASSO D structure, formed by strand invasion of a duplex DNA molecule by an oligonucleotide or a DNA-like molecule, such as peptide nucleic acid (PNA). Formation of LASSO D can be facilitated by the addition of E.coli RecA protein and/or by altering the salt concentration, for example, using methods known in the art.

Alvos genômicosgenomic targets

[078]Em algumas modalidades, os ácidos nucleicos alvos, também aqui referidos como fragmentos alvos, incluem fragmentos de polinucleotídeos de uma região genômica particular ou pluralidade de regiões genômicas (por exemplo, cromossomo único, conjunto de cromossomos, e/ou certas regiões cromossômicas). Em algumas modalidades, tais regiões genômicas podem ser associadas com anormalidades genéticas fetais (por exemplo, aneuploidia), bem como outras variações genéticas, incluindo, mas não se limitando a, mutações (por exemplo, mutações pontuais), inserções, adições, deleções, translocações, desordens de repetição de trinucleotídos, e/ou polimorfismos de nucleotídeo único (SNPs). Em algumas modalidades, os ácidos nucleicos de referência, também aqui referidos como fragmentos de referência, incluem fragmentos de polinucleotídeos de uma região genômica particular ou pluralidade de regiões genômicas não associadas com anormalidades genéticas fetais. Em algumas modalidades, ácidos nucleicos alvos e/ou de referência (isto é, fragmentos alvo e/ou fragmentos de referência) incluem sequências de nucleotídeo que são substancialmente únicas para o cromossomo de interesse ou cromossomo de referência (por exemplo, sequências de nucleotídeo idênticas ou sequências de nucleotídeo substancialmente semelhantes não são encontradas em outras partes do genoma).[078] In some embodiments, target nucleic acids, also referred to herein as target fragments, include fragments of polynucleotides from a particular genomic region or plurality of genomic regions (e.g., single chromosome, set of chromosomes, and/or certain chromosomal regions ). In some embodiments, such genomic regions may be associated with fetal genetic abnormalities (e.g., aneuploidy), as well as other genetic variations, including, but not limited to, mutations (e.g., point mutations), insertions, additions, deletions, translocations, trinucleotide repeat disorders, and/or single nucleotide polymorphisms (SNPs). In some embodiments, reference nucleic acids, also referred to herein as reference fragments, include polynucleotide fragments from a particular genomic region or plurality of genomic regions not associated with fetal genetic abnormalities. In some embodiments, target and/or reference nucleic acids (i.e., target fragments and/or reference fragments) include nucleotide sequences that are substantially unique to the chromosome of interest or reference chromosome (i.e., identical nucleotide sequences or substantially similar nucleotide sequences are not found elsewhere in the genome).

[079]Em algumas modalidades, os fragmentos de uma pluralidade de regiões genômicas são avaliados. Em algumas modalidades, os fragmentos alvos e fragmentos de referência de uma pluralidade de regiões genômicas são avaliados. Em algumas modalidades, os fragmentos de uma pluralidade de regiões genômicas são avaliados para determinar a presença, ausência, quantidade (por exemplo, quantidade relativa) ou o quociente de um cromossomo de interesse, por exemplo. Em algumas modalidades, um cromossomo de interesse é um cromossomo suspeito de ter aneuploidia e pode ser aqui referido como um "cromossomo de teste". Em algumas modalidades, os fragmentos de uma pluralidade de regiões genômicas são avaliados por um cromossomo euplóide presumido. Tal cromossomo pode ser aqui referido como um "cromossomo de referência". Em algumas modalidades, uma pluralidade de cromossomos de teste é avaliada. Em algumas modalidades, os cromossomos de teste são selecionados entre cromossomo 13 (Chr13), cromossomo 18 (Chr18) e cromossomo 21 (Chr21). Em algumas modalidades, os cromossomos de referência são selecionados entre os cromossomos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, X e Y, e, por vezes, os cromossomos de referência são selecionados autossomos (ou seja, não X e Y). Em algumas modalidades, cromossomo 20 (Chr20) é selecionado como um cromossomo de referência. Em algumas modalidades, cromossomo 14 é selecionado como um cromossomo referência. Em algumas modalidades, cromossomo 9 é selecionado como um cromossomo de referência. Em algumas modalidades, um cromossomo de teste e um cromossomo referência são do mesmo indivíduo. Em algumas modalidades, um cromossomo de teste e um cromossomo de referência são de indivíduos diferentes.[079] In some embodiments, fragments from a plurality of genomic regions are evaluated. In some embodiments, target fragments and reference fragments from a plurality of genomic regions are evaluated. In some embodiments, fragments from a plurality of genomic regions are evaluated to determine the presence, absence, amount (e.g., relative amount) or quotient of a chromosome of interest, for example. In some embodiments, a chromosome of interest is a chromosome suspected of having aneuploidy and may be referred to herein as a "test chromosome". In some embodiments, fragments from a plurality of genomic regions are evaluated for a presumed euploid chromosome. Such a chromosome may be referred to herein as a "reference chromosome". In some embodiments, a plurality of test chromosomes are evaluated. In some embodiments, the test chromosomes are selected from among chromosome 13 (Chr13), chromosome 18 (Chr18), and chromosome 21 (Chr21). In some embodiments, the reference chromosomes are selected from chromosomes 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 , 20, 21, 22, X and Y, and sometimes the reference chromosomes are selected autosomes (ie not X and Y). In some embodiments, chromosome 20 (Chr20) is selected as a reference chromosome. In some embodiments, chromosome 14 is selected as a reference chromosome. In some embodiments, chromosome 9 is selected as a reference chromosome. In some embodiments, a test chromosome and a reference chromosome are from the same individual. In some embodiments, a test chromosome and a reference chromosome are from different individuals.

[080]Em algumas modalidades, os fragmentos de pelo menos uma região genômica são avaliados para um cromossomo de teste e/ou de referência. Em algumas modalidades, os fragmentos de pelo menos 10 regiões genômicas (por exemplo, cerca de 20, 30, 40, 50, 60, 70, 80 ou 90 regiões genômicas) são avaliados para um cromossomo de teste e/ou um cromossomo referência. Em algumas modalidades, os fragmentos de pelo menos 100 regiões genômicas (por exemplo, cerca de 200, 300, 400, 500, 600, 700, 800 ou 900 regiões genômicas) são avaliados para um cromossomo de teste e/ou um cromossomo de referência. Em algumas modalidades, os fragmentos de pelo menos 1.000 regiões genômicas (por exemplo, cerca de 2.000, 3.000, 4000, 5.000, 6.000, 7.000, 8.000 ou 9000 regiões genômicas) são avaliados para um cromossomo de teste e/ou um cromossomo de referência. Em algumas modalidades, fragmentos de pelo menos 10.000 regiões genômicas (por exemplo, cerca de 20.000, 30.000, 40.000, 50.000, 60.000, 70.000, 80.000 ou 90.000 regiões genômicas) são avaliados para um cromossomo de teste e/ou um cromossomo de referência. Em algumas modalidades, os fragmentos de pelo menos 100.000 regiões genômicas (por exemplo, cerca de 200.000, 300.000, 400.000, 500.000, 600.000, 700.000, 800.000 ou 900.000 regiões genômicas) são avaliados para um cromossomo de teste e/ou cromossomo de referência.[080] In some embodiments, fragments from at least one genomic region are evaluated for a test and/or reference chromosome. In some embodiments, fragments from at least 10 genomic regions (e.g., about 20, 30, 40, 50, 60, 70, 80, or 90 genomic regions) are evaluated for a test chromosome and/or a reference chromosome. In some embodiments, fragments from at least 100 genomic regions (e.g., about 200, 300, 400, 500, 600, 700, 800, or 900 genomic regions) are evaluated for a test chromosome and/or a reference chromosome . In some embodiments, fragments from at least 1000 genomic regions (e.g., about 2000, 3000, 4000, 5000, 6000, 7000, 8000, or 9000 genomic regions) are evaluated for a test chromosome and/or a reference chromosome. . In some embodiments, fragments from at least 10,000 genomic regions (e.g., about 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, or 90,000 genomic regions) are evaluated for a test chromosome and/or a reference chromosome. In some embodiments, fragments from at least 100,000 genomic regions (e.g., about 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, or 900,000 genomic regions) are evaluated for a test chromosome and/or reference chromosome.

Enriquecimento e separação de subpopulações de ácido nucleicoEnrichment and separation of nucleic acid subpopulations

[081]Em algumas modalidades, o ácido nucleico (por exemplo, ácido nucleico extracelular) é enriquecido ou relativamente enriquecido por uma subpopulação ou espécies de ácido nucleico. Subpopulações de ácido nucleico podem incluir, por exemplo, ácido nucleico fetal, ácido nucleico materno, fragmentos compreendendo ácido nucleico com um comprimento particular ou faixa de comprimentos, ou o ácido nucleico de uma região específica do genoma (por exemplo, cromossomo único, um conjunto de cromossomos, e/ou certas regiões cromossômicas). Tais amostras enriquecidas podem ser usadas em conjunto com um método aqui fornecido. Desse modo, em certas modalidades, métodos da tecnologia compreendem uma etapa adicional de enriquecer uma subpopulação de ácido nucleico em uma amostra, tal como, por exemplo, ácido nucleico fetal. Em certas modalidades, um método para determinar a fração fetal aqui descrito também pode ser usado para enriquecer o ácido nucleico fetal. Em certas modalidades, o ácido nucleico materno é seletivamente removido (parcialmente, substancialmente, completamente ou quase completamente) da amostra. Em certas modalidades, enriquecer espécies de ácido nucleico com baixo número de cópias (por exemplo, ácido nucleico fetal) pode melhorar a sensibilidade quantitativa. Os métodos para enriquecimento de uma amostra para uma espécie particular de ácido nucleico são descritos, por exemplo, na patente US n° 6.927.028, publicação do pedido de patente internacional n° W02007/140417, publicação do pedido de patente internacional n° W02007/147063, publicação do pedido de patente internacional n° W02009/032779, publicação do pedido de patente internacional n° W02009/032781, publicação do pedido de patente internacional n° W02010/033639, publicação do pedido de patente internacional n° W02011/034631, publicação do pedido de patente internacional n° W02006/056480, e publicação do pedido de patente internacional n° W02011/143659, todos os quais são aqui incorporadas por referência.[081] In some embodiments, the nucleic acid (e.g., extracellular nucleic acid) is enriched or relatively enriched by a subpopulation or species of nucleic acid. Nucleic acid subpopulations can include, for example, fetal nucleic acid, maternal nucleic acid, fragments comprising nucleic acid of a particular length or range of lengths, or nucleic acid from a specific region of the genome (e.g., single chromosome, a set of of chromosomes, and/or certain chromosomal regions). Such enriched samples can be used in conjunction with a method provided herein. Thus, in certain embodiments, methods of the technology comprise an additional step of enriching a subpopulation of nucleic acid in a sample, such as, for example, fetal nucleic acid. In certain embodiments, a method for determining fetal fraction described herein can also be used to enrich fetal nucleic acid. In certain embodiments, maternal nucleic acid is selectively removed (partially, substantially, completely or almost completely) from the sample. In certain embodiments, enriching low copy number nucleic acid species (e.g., fetal nucleic acid) can improve quantitative sensitivity. Methods for enriching a sample for a particular species of nucleic acid are described, for example, in US Patent No. 6,927,028, International Patent Application Publication No. WO2007/140417, International Patent Application Publication No. WO2007 /147063, International Patent Application Publication No. WO2009/032779, International Patent Application Publication No. WO2009/032781, International Patent Application Publication No. WO2010/033639, International Patent Application Publication No. W02011/034631 , International Patent Application Publication No. WO2006/056480, and International Patent Application Publication No. WO2011/143659, all of which are incorporated herein by reference.

[082]Em algumas modalidades, o ácido nucleico é enriquecido com certas espécies de fragmento alvo e/ou espécies de fragmento de referência. Em certas modalidades, o ácido nucleico é enriquecido comum comprimento de fragmento de ácido nucleico específico ou faixa de comprimentos de fragmento usando um ou mais métodos de separação baseados em comprimento descritos abaixo. Em certas modalidades, o ácido nucleico é enriquecido com fragmentos de uma região genômica selecionada (por exemplo, cromossomo) usando um ou mais métodos de separação à base de sequência aqui descritos e/ou conhecidos na técnica. Certos métodos para enriquecimento de uma subpopulação de ácido nucleico (por exemplo, ácido nucleico fetal) em uma amostra são descritos em detalhe abaixo.[082] In some embodiments, the nucleic acid is enriched with certain target fragment species and/or reference fragment species. In certain embodiments, the nucleic acid is enriched for a specific nucleic acid fragment length or range of fragment lengths using one or more length-based separation methods described below. In certain embodiments, the nucleic acid is enriched for fragments from a selected genomic region (e.g., chromosome) using one or more sequence-based separation methods described herein and/or known in the art. Certain methods for enriching a subpopulation of nucleic acid (eg, fetal nucleic acid) in a sample are described in detail below.

[083]Alguns métodos para enriquecimento de uma subpopulação de ácido nucleico (por exemplo, ácido nucleico fetal) que podem ser usados com um método descrito aqui incluem métodos que exploram as diferenças entre o ácido nucleico epigenético materno e fetal. Por exemplo, o ácido nucleico fetal pode ser diferenciado e separado de ácido nucleico materno com base nas diferenças de metilação. Métodos de enriquecimento de ácido nucleico fetal baseado na metilação são descritos na publicação do pedido de patente US n° 2010/0105049, que é aqui incorporado por referência. Tais métodos envolvem, por vezes, ligar a um ácido nucleico da amostra a um agente de ligação específico da metilação (proteína de ligação CpG-metila (MBD), anticorpos específicos de metilação, e semelhante) separar o ácido nucleico ligado do ácido nucleico não ligado com base no estado de metilação diferencial. Tais métodos podem também incluir o uso de enzimas de restrição sensíveis à metilação (tal como descrito acima, por exemplo, Hhal e Hpall), que permitem o enriquecimento de regiões de ácido nucleico fetal em uma amostra materna seletivamente digerindo o ácido nucleico da amostra materna com uma enzima que seletivamente e completamente ou substancialmente digere o ácido nucleico materno para enriquecer a amostra por pelo menos uma região de ácido nucleico fetal.[083] Some methods for enriching a subpopulation of nucleic acid (e.g., fetal nucleic acid) that can be used with a method described herein include methods that exploit differences between maternal and fetal epigenetic nucleic acid. For example, fetal nucleic acid can be differentiated and separated from maternal nucleic acid on the basis of methylation differences. Methods of enriching fetal nucleic acid based on methylation are described in US Patent Application Publication No. 2010/0105049, which is incorporated herein by reference. Such methods sometimes involve attaching a sample nucleic acid to a methylation-specific binding agent (CpG-methyl binding protein (MBD), methylation-specific antibodies, and the like) separating bound nucleic acid from unbound nucleic acid. bound based on differential methylation state. Such methods may also include the use of methylation-sensitive restriction enzymes (as described above, e.g., Hhal and Hpall), which allow the enrichment of fetal nucleic acid regions in a maternal sample by selectively digesting the maternal sample's nucleic acid. with an enzyme that selectively and completely or substantially digests maternal nucleic acid to enrich the sample for at least one region of fetal nucleic acid.

[084]Outro método para o enriquecimento de uma subpopulação de ácido nucleico (por exemplo, ácido nucleico fetal) que pode ser usado com um método aqui descrito é uma abordagem de sequência polimórfica melhorada com endonuclease de restrição tal como um método descrito na publicação do pedido de patente US n° 2009/0317818, que é aqui incorporado por referência. Tais métodos incluem a clivagem de ácido nucleico que compreende um alelo não alvo com uma endonuclease de restrição que reconhece o ácido nucleico que compreende o alelo não alvo, mas não o alelo alvo; e amplificar o ácido nucleico clivado, mas não o ácido nucleico clivado, em que o ácido nucleico não clivado, amplificado representa o ácido nucleico alvo enriquecido (por exemplo, ácido nucleico fetal) em relacionamento ao ácido nucleico não alvo (por exemplo, ácido nucleico materno). Em certas modalidades, o ácido nucleico pode ser selecionado tal que compreende um alelo tendo um sítio polimórfico que é suscetível à digestão seletiva por um agente de clivagem, por exemplo.[084] Another method for enriching a subpopulation of nucleic acid (e.g., fetal nucleic acid) that can be used with a method described herein is a restriction endonuclease-enhanced polymorphic sequence approach such as a method described in the publication of the US Patent Application No. 2009/0317818, which is incorporated herein by reference. Such methods include cleaving nucleic acid comprising a non-target allele with a restriction endonuclease that recognizes nucleic acid comprising the non-target allele but not the target allele; and amplifying the cleaved nucleic acid, but not the cleaved nucleic acid, wherein the amplified, uncleaved nucleic acid represents the enriched target nucleic acid (e.g., fetal nucleic acid) in relation to the non-target nucleic acid (e.g., fetal nucleic acid) maternal). In certain embodiments, the nucleic acid can be selected such that it comprises an allele having a polymorphic site that is susceptible to selective digestion by a cleavage agent, for example.

[085]Alguns métodos para enriquecimento de uma subpopulação de ácido nucleico (por exemplo, ácido nucleico fetal) que podem ser usados com um método aqui descrito incluem abordagens de degradação enzimática seletiva. Tais métodos envolvem a proteção de sequências alvos a partir da digestão da exonuclease facilitando desse modo a eliminação em uma amostra de sequências não desejadas (por exemplo, DNA materno). Por exemplo, em uma abordagem, o ácido nucleico da amostra é desnaturado para gerar único ácido nucleico de fita simples, ácido nucleico de fita simples é contato com pelo menos um par de iniciador específico alvo sob condições de hibridização adequadas, iniciadores emparelhados são estendidos por polimerização de nucleotídeo gerando sequências alvos de fita dupla, e digerindo ácido nucleico de fita simples único usando uma nuclease que digere ácido nucleico de fita simples (ou seja, não-alvo). Em certas modalidades, o método pode ser repetido durante pelo menos um ciclo adicional. Em certas modalidades, o mesmo par de iniciador específico alvo é usado para injetar cada um dos primeiro e segundo ciclos de extensão, e em certas modalidades, diferentes pares de iniciador específico alvos são usados para o primeiro e segundo ciclos.[085] Some methods for enriching a subpopulation of nucleic acid (eg, fetal nucleic acid) that can be used with a method described herein include selective enzymatic degradation approaches. Such methods involve protecting target sequences from exonuclease digestion thereby facilitating the elimination in a sample of unwanted sequences (eg, maternal DNA). For example, in one approach, sample nucleic acid is denatured to generate single-stranded nucleic acid, single-stranded nucleic acid is contacted with at least one target-specific primer pair under suitable hybridization conditions, paired primers are extended by nucleotide polymerization generating double-stranded target sequences, and digesting single-stranded nucleic acid using a nuclease that digests single-stranded (i.e., non-targeting) nucleic acid. In certain embodiments, the method can be repeated for at least one additional cycle. In certain embodiments, the same target specific primer pair is used to inject each of the first and second extension cycles, and in certain embodiments, different target specific primer pairs are used for the first and second cycles.

[086]Em algumas modalidades, o ácido nucleico é enriquecido com fragmentos de uma região genômica selecionada (por exemplo, cromossomo) usando um ou mais métodos de separação à base de sequências aqui descritas. Em algumas modalidades, o ácido nucleico é enriquecido com um comprimento de fragmento de polinucleotídeos ou faixa de comprimentos de fragmento específico e fragmentos de uma região genômica selecionada (por exemplo, cromossomo) usando uma combinação de métodos de separação baseados em sequência com base em comprimento. Tais métodos de separação à base de sequência e à base de comprimento são descritos em maior detalhe abaixo.[086] In some embodiments, the nucleic acid is enriched with fragments from a selected genomic region (eg, chromosome) using one or more sequence-based separation methods described herein. In some embodiments, the nucleic acid is enriched with a specific polynucleotide fragment length or range of fragment lengths and fragments from a selected genomic region (e.g., chromosome) using a combination of length-based sequence-based separation methods . Such sequence-based and length-based separation methods are described in greater detail below.

[087]Alguns métodos para enriquecimento de uma subpopulação de ácido nucleico (por exemplo, ácido nucleico fetal) que podem ser usados com um método aqui descrito incluem sequenciamento massiva de assinatura paralela (MPSS). MPSS tipicamente é um método em fase sólida que utiliza uma ligação com adaptador (isto é, marcação), seguida por uma descodificação do adaptador, e leitura da sequência de ácido nucleico em incrementos pequenos. Os produtos de PCR marcados são tipicamente amplificados de tal forma que cada ácido nucleico gera um produto de PCR com um marcador individual. Marcadores são frequentemente usados para ligar os produtos de PCR a microgrânulos. Depois de vários ciclos de determinação da sequência à base de ligação, por exemplo, uma assinatura de sequência pode ser identificada a partir de cada grânulo. Cada sequência de assinatura (marcação com MPSS) em um conjunto de dados de MPSS é analisada, comparada com todas as outras assinaturas, e todas as assinaturas idênticas são contadas.[087] Some methods for enriching a subpopulation of nucleic acid (e.g., fetal nucleic acid) that can be used with a method described herein include massively parallel signature sequencing (MPSS). MPSS is typically a solid phase method that uses adapter ligation (i.e. labeling), followed by adapter decoding, and reading the nucleic acid sequence in small increments. Tagged PCR products are typically amplified such that each nucleic acid generates a PCR product with an individual tag. Labels are often used to link PCR products to microbeads. After several rounds of binding-based sequencing, for example, a sequence signature can be identified from each bead. Each signature string (marked with MPSS) in an MPSS dataset is analyzed, compared to all other signatures, and all identical signatures are counted.

[088]Em certas modalidades, certos métodos de enriquecimento (por exemplo, certos métodos de enriquecimento à base de MPS e/ou MPSS) podem incluir abordagens à base de amplificação (por exemplo, PCR). Em certas modalidades, métodos de amplificação loci- específicos podem ser usados (por exemplo, iniciadores de amplificação loci-específicos). Em certas modalidades, uma abordagem por PCR de alelo de SNP multiplex pode ser usada. Em certas modalidades, uma abordagem por PCR de alelo de SNP multiplex pode ser utilizada em combinação com o sequenciamento uniplex. Por exemplo, tal uma abordagem pode envolver o uso de PCR multiplex (por exemplo, sistema MASSARRAY) e a incorporação de sequências de sonda de captura nos amplicons seguida pelo sequenciamento usando, por exemplo, o sistema MPSS Illiumina. Em certas modalidades, uma abordagem por PCR de alelo de SNP multiplex pode ser utilizada em combinação com um sistema de três iniciadores de sequenciamento indexada. Por exemplo, tal uma abordagem pode envolver o uso de PCR multiplex (por exemplo, sistema MASSARRAY) com iniciadores tendo uma primeira sonda de captura incorporada em certos iniciadores de PCR foward específicos e sequências adaptadoras incorporadas em iniciadores de PCR reverso loci-específico para, desse modo, gerar produtos de amplificação, seguido de um PCR secundário para incorporar sequências de captura reversa e códigos de barras de índice molecular para o sequenciamento usando, por exemplo, o sistema MPSS Illumina. Em certas modalidades, uma abordagem por PCR de alelo de SNP multiplex pode ser utilizada em combinação com um sistema de quatro iniciadores e sequenciamento indexado. Por exemplo, tal uma abordagem pode envolver o uso de PCR multiplex (por exemplo, sistema MASSARRAY) com iniciadores tendo sequências adaptadoras incorporadas em ambos os iniciadores de PCR adiante loci- específico e reverso loci-específico e seguido por uma PCR secundário para incorporar ambas sequências de captura adiante e reverso e códigos de barras de índice molecular para o sequenciamento usando, por exemplo, o sistema MPSS Illumina. Em certas modalidades, uma abordagem de microfluidos pode ser usada. Em certas modalidades, microfluidos baseado em matriz pode ser usado. Por exemplo, tal uma abordagem pode envolver o uso de uma matriz de microfluidos (por exemplo, Fluidigm) para a amplificação em baixo plex e incorporação de índice e sondas de captura, seguida de sequenciamento. Em certas modalidades, uma abordagem de microfluidos em emulsão pode ser utilizada, tal como, por exemplo, gota digital PCR.[088] In certain embodiments, certain enrichment methods (eg, certain MPS and/or MPSS-based enrichment methods) may include amplification-based approaches (eg, PCR). In certain embodiments, loci-specific amplification methods can be used (eg, loci-specific amplification primers). In certain embodiments, a multiplex SNP allele PCR approach can be used. In certain embodiments, a multiplex SNP allele PCR approach can be used in combination with uniplex sequencing. For example, such an approach may involve the use of multiplex PCR (eg, MASSARRAY system) and incorporation of capture probe sequences into amplicons followed by sequencing using, for example, the MPSS Illumina system. In certain embodiments, a multiplex SNP allele PCR approach can be used in combination with a three-primer system of indexed sequencing. For example, such an approach may involve the use of multiplex PCR (e.g. MASSARRAY system) with primers having a first capture probe incorporated into certain specific forward PCR primers and adapter sequences incorporated into loci-specific reverse PCR primers for, thereby generating amplification products, followed by a secondary PCR to incorporate reverse capture sequences and molecular index barcodes for sequencing using, for example, the Illumina MPSS system. In certain embodiments, a multiplex SNP allele PCR approach can be used in combination with a four primer system and indexed sequencing. For example, such an approach may involve the use of multiplex PCR (e.g. MASSARRAY system) with primers having adapter sequences incorporated into both loci-specific forward and reverse loci-specific PCR primers and followed by a secondary PCR to incorporate both forward and reverse capture sequences and molecular index barcodes for sequencing using, for example, the Illumina MPSS system. In certain embodiments, a microfluidic approach can be used. In certain embodiments, matrix-based microfluids can be used. For example, such an approach might involve the use of a microfluidic matrix (eg, Fluidigm) for low plex amplification and incorporation of index and capture probes, followed by sequencing. In certain embodiments, an emulsion microfluidic approach may be used, such as, for example, digital dot PCR.

[089]Em certas modalidades, métodos de amplificação universal podem ser usados (por exemplo, usando os iniciadores de amplificação universal ou não-loci- específicos). Em certas modalidades, métodos de amplificação universal podem ser usados em combinação com abordagens de pulldown. Em certas modalidades, um método pode incluir pulldown ultramer biotinilado (por exemplo, ensaios de pulldown biotinilado de Agilent ou IDT) de uma biblioteca de sequenciamento universalmente amplificada. Por exemplo, tal uma abordagem pode envolver a preparação de uma biblioteca padrão, enriquecimento das regiões selecionadas por um ensaio de pulldown, e uma etapa de amplificação universal secundária. Em certas modalidades, abordagens de pulldown podem ser utilizadas em combinação com métodos baseado em ligação. Em certas modalidades, um método pode incluir pulldown ultramer biotinilado com ligação do adaptador específico à sequência (por exemplo, HALOPLEX PCR, de Halo Genomics). Por exemplo, tal uma abordagem pode envolver o uso de sondas seletoras para capturar fragmentos digeridos por enzimas de restrição, seguida pela ligação de produtos capturados a um adaptador, e amplificação universal seguida por sequenciamento. Em certas modalidades, abordagens de pulldown podem ser utilizadas em combinação com métodos de extensão e baseados em ligação. Em certas modalidades, um método pode incluir ligação e extensão de sonda de inversão molecular (MIP). Por exemplo, tal uma abordagem pode envolver o uso de sondas de inversão molecular em combinação com adaptadores de sequência, seguida pela amplificação universal e sequenciamento. Em certas modalidades, o DNA complementar pode ser sintetizado e sequenciado sem amplificação.[089] In certain embodiments, universal amplification methods may be used (for example, using universal or non-loci-specific amplification primers). In certain embodiments, universal amplification methods can be used in combination with pulldown approaches. In certain embodiments, a method may include biotinylated ultramer pulldown (e.g., Agilent or IDT biotinylated pulldown assays) of a universally amplified sequencing library. For example, such an approach might involve preparing a standard library, enriching selected regions by a pulldown assay, and a secondary universal amplification step. In certain embodiments, pulldown approaches can be used in combination with linkage-based methods. In certain embodiments, a method may include biotinylated ultramer pulldown with sequence-specific adapter ligation (e.g., HALOPLEX PCR, from Halo Genomics). For example, such an approach might involve the use of selector probes to capture restriction enzyme-digested fragments, followed by ligation of captured products to an adapter, and universal amplification followed by sequencing. In certain embodiments, pulldown approaches can be used in combination with extension and binding-based methods. In certain embodiments, a method may include molecular inversion probe (MIP) binding and extension. For example, such an approach might involve the use of molecular inversion probes in combination with sequence adapters, followed by universal amplification and sequencing. In certain embodiments, complementary DNA can be synthesized and sequenced without amplification.

[090]Em certas modalidades, as abordagens de extensão e ligação podem ser realizadas sem um componente de pulldown. Em certas modalidades, um método específico pode incluir hibridização, extensão e ligação do iniciador adiante e reverso loci-específico. Tais métodos podem ainda incluir amplificação universal ou síntese de DNA complementar sem amplificação, seguida de sequenciamento. Tais métodos podem reduzir ou excluir sequências de base durante a análise, em certas modalidades.[090] In certain embodiments, extension and linkage approaches can be performed without a pulldown component. In certain embodiments, a specific method may include loci-specific forward and reverse primer hybridization, extension, and ligation. Such methods may also include universal amplification or complementary DNA synthesis without amplification, followed by sequencing. Such methods can reduce or exclude base sequences during analysis, in certain embodiments.

[091]Em certas modalidades, abordagens de pulldown podem ser utilizadas com um componente de amplificação opcional ou sem componente de amplificação. Em certas modalidades, um método pode incluir um ensaio de pulldown modificado e ligação com a incorporação total de sondas de captura sem amplificação universal. Por exemplo, tal uma abordagem pode envolver o uso de sondas seletoras modificadas para captura de fragmentos digeridos por enzimas de restrição de captura, seguida pela ligação de produtos capturados a um adaptador opcional, amplificação, e sequenciamento. Em certas modalidades, um método pode incluir um ensaio de pulldown biotinilado e com a extensão e ligação da sequência adaptadora em combinação com a ligação de fita simples circular. Por exemplo, tal uma abordagem pode envolver o uso de sondas seletoras para capturar as regiões de interesse (ou seja, as sequências alvo), extensão das sondas, ligação ao adaptador, ligação circular de fita simples, amplificação opcional, e sequenciamento. Em certas modalidades, a análise dos resultados do sequenciamento pode separar as sequências alvos da base.[091] In certain embodiments, pulldown approaches can be used with an optional amplification component or without an amplification component. In certain embodiments, a method may include a modified pulldown assay and binding with total incorporation of capture probes without universal amplification. For example, such an approach may involve the use of modified selector probes to capture fragments digested by capture restriction enzymes, followed by ligation of captured products to an optional adapter, amplification, and sequencing. In certain embodiments, a method may include a biotinylated pulldown assay and with extension and adapter sequence ligation in combination with circular single-stranded ligation. For example, such an approach might involve the use of selector probes to capture regions of interest (i.e., target sequences), probe extension, adapter ligation, single-stranded circular ligation, optional amplification, and sequencing. In certain embodiments, analysis of sequencing results can separate target sequences from background.

[092]Em algumas modalidades, o ácido nucleico é enriquecido com fragmentos de uma região genômica selecionada (por exemplo, cromossomo) usando um ou mais métodos de separação à base de sequências aqui descritos. Separação à base de sequência geralmente baseia-se em sequências de nucleotídeo presentes nos fragmentos de interesse (por exemplo, fragmentos alvo e/ou de referência) e substancialmente não presentes em outros fragmentos da amostra ou presentes em uma quantidade não substancial de outros fragmentos (por exemplo, 5% ou menos). Em algumas modalidades, a separação à base da sequência pode gerar fragmentos alvos separados e/ou fragmentos de referência separados. Fragmentos alvos separados e/ou fragmentos de referência separados são frequentemente isolados dos fragmentos remanescentes na amostra de ácido nucleico. Em certas modalidades, os fragmentos alvo separados e os fragmentos de referência separados são também isolados um do outro (por exemplo, isolados em compartimentos separados no ensaio). Em certas modalidades, os fragmentos alvo separados e os fragmentos de referência separados são isolados em conjunto (por exemplo, isolados no mesmo compartimento de ensaio). Em algumas modalidades, os fragmentos não ligados podem ser removidos diferencialmente ou degradados ou digeridos.[092] In some embodiments, the nucleic acid is enriched with fragments from a selected genomic region (e.g., chromosome) using one or more sequence-based separation methods described herein. Sequence-based separation is generally based on nucleotide sequences present in the fragments of interest (e.g., target and/or reference fragments) and substantially not present in other fragments in the sample or present in an insubstantial amount of other fragments ( for example, 5% or less). In some embodiments, sequence-based separation can generate separate target fragments and/or separate reference fragments. Separate target fragments and/or separate reference fragments are often isolated from the remaining fragments in the nucleic acid sample. In certain embodiments, the separate target fragments and the separate reference fragments are also isolated from one another (e.g., isolated in separate compartments in the assay). In certain embodiments, separate target fragments and separate reference fragments are isolated together (e.g., isolated in the same assay compartment). In some embodiments, unlinked fragments can be differentially removed or degraded or digested.

[093]Em algumas modalidades, um processo de captura de ácido nucleico seletivo é usado para separar fragmentos alvo e/ou de referência da amostra de ácido nucleico. Sistemas de captura de ácido nucleico comercialmente disponíveis incluem, por exemplo, o sistema de captura de sequência de NimbleGen (Roche NimbleGen, Madison, WI); plataforma BEADARRAY da Illumina (Illumina, San Diego, CA); plataforma Affymetrix GeneChip (Affymetrix, Santa Clara, CA); sistema de enriquecimento alvo Agilent SureSelect (Agilent Technologies, Santa Clara, CA); e plataformas relacionadas. Tais métodos envolvem tipicamente a hibridização de um oligonucleotídeo de captura em um segmento ou a totalidade da sequência de nucleotídeo de um fragmento alvo ou de referência e pode incluir o uso de uma fase sólida (por exemplo, matriz de fase sólida) e/ou uma plataforma baseada em solução. Os oligonucleotídeos de captura (por vezes referidos como "isca") podem ser selecionados ou projetados de tal modo que eles hibridizam preferivelmente com fragmentos de ácido nucleico de regiões genômicas ou loci selecionados (por exemplo, um dos cromossomos 21, 18, 13, X ou Y, ou um cromossomo de referência). Em certas modalidades, um método baseado na hibridização (por exemplo, usando matrizes de oligonucleotídeos) pode ser usado para enriquecer sequências de ácido nucleico de certos cromossomos (por exemplo, um cromossomo potencialmente com aneuploidia, cromossomo de referência ou outro cromossomo de interesse) ou seus segmentos de interesse.[093] In some embodiments, a selective nucleic acid capture process is used to separate target and/or reference fragments from the nucleic acid sample. Commercially available nucleic acid capture systems include, for example, the NimbleGen sequence capture system (Roche NimbleGen, Madison, WI); Illumina's BEADARRAY platform (Illumina, San Diego, CA); Affymetrix GeneChip platform (Affymetrix, Santa Clara, CA); Agilent SureSelect target enrichment system (Agilent Technologies, Santa Clara, CA); and related platforms. Such methods typically involve hybridizing a capture oligonucleotide to a segment or the entire nucleotide sequence of a target or reference fragment and may include the use of a solid phase (e.g., solid phase array) and/or a solution-based platform. Capture oligonucleotides (sometimes referred to as "bait") can be selected or designed such that they preferentially hybridize with nucleic acid fragments from selected genomic regions or loci (e.g., one of chromosomes 21, 18, 13, X or Y, or a reference chromosome). In certain embodiments, a hybridization-based method (e.g., using oligonucleotide arrays) can be used to enrich nucleic acid sequences from certain chromosomes (e.g., a potentially aneuploidy chromosome, reference chromosome, or other chromosome of interest) or their segments of interest.

[094]Os oligonucleotídeos de captura compreendem tipicamente uma sequência de nucleotídeo capaz de hibridizar ou recozer um fragmento de ácido nucleico de interesse (por exemplo, fragmento alvo, fragmento de referência) ou uma porção deste. Um oligonucleotídeo de captura pode ser natural ou sintético e pode ser baseado em DNA ou RNA. Os oligonucleotídeos de captura podem permitir a separação específica de, por exemplo, um fragmento alvo e/ou de referência de outros fragmentos em uma amostra de ácido nucleico. O termo "específico" ou "especificidade", como aqui usados, refere-se à ligação ou hibridização de uma molécula a outra molécula, tal como um oligonucleotídeo para um polinucleotídeo alvo. "Específico" ou "especificidade" refere-se ao reconhecimento, contato, e formação de um complexo estável entre as duas moléculas, quando comparado com substancialmente menos reconhecimento, contato ou formação complexa de qualquer uma destas duas moléculas com outras moléculas. Como aqui usado, o termo "recozimento" refere-se à formação de um complexo estável entre as duas moléculas. Os termos "oligonucleotídeo de captura", "oligo captura", "oligo", ou "oligonucleotídeo" podem ser usados alternadamente ao longo do documento, quando se refere a capturar oligonucleotídeos. As seguintes características de oligonucleotídeos podem ser aplicadas aos iniciadores e outros oligonucleotídeos, tais como sondas aqui fornecidas.[094] Capture oligonucleotides typically comprise a nucleotide sequence capable of hybridizing or annealing a nucleic acid fragment of interest (eg, target fragment, reference fragment) or a portion thereof. A capture oligonucleotide can be natural or synthetic and can be DNA or RNA based. Capture oligonucleotides can allow specific separation of, for example, a target and/or reference fragment from other fragments in a nucleic acid sample. The term "specific" or "specificity", as used herein, refers to the binding or hybridization of a molecule to another molecule, such as an oligonucleotide to a target polynucleotide. "Specific" or "specificity" refers to the recognition, contact, and formation of a stable complex between the two molecules, as compared to substantially less recognition, contact, or complex formation of either of these two molecules with other molecules. As used herein, the term "annealing" refers to the formation of a stable complex between the two molecules. The terms "capture oligonucleotide", "capture oligonucleotide", "oligo", or "oligonucleotide" may be used interchangeably throughout the document when referring to capturing oligonucleotides. The following characteristics of oligonucleotides can be applied to primers and other oligonucleotides such as probes provided herein.

[095]Um oligonucleotídeo de captura pode ser projetado e sintetizado usando um processo adequado, e pode ser de qualquer comprimento adequado para hibridizar com uma sequência de nucleotídeos de interesse e que executa processos de separação e/ou de análise aqui descritos. Os oligonucleotídeos podem ser projetados com baseados em uma sequência de nucleotídeo de interesse (por exemplo, sequência de fragmento alvo, sequência de fragmento de referência). Um oligonucleotídeo, em algumas modalidades, pode ser de cerca de 10 a cerca de 300 nucleotídeos, cerca de 10 a cerca de 100 nucleotídeos, cerca de 10 a cerca de 70 nucleotídeos, cerca de 10 a cerca de 50 nucleotídeos, cerca de 15 a cerca de 30 nucleotídeos, ou cerca de 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 ou 100 nucleotídeos em comprimento. Um oligonucleotídeo pode ser composto de nucleotídeos de ocorrência natural e/ou de ocorrência não natural (por exemplo, nucleotídeos marcados), ou uma mistura de destes. Oligonucleotídeos adequados paro o uso com as modalidades aqui descritas, podem ser sintetizados e marcados usando as técnicas conhecidas. Os oligonucleotídeos podem ser sintetizados quimicamente de acordo com o método da fosforamidita triéster em fase sólida descrito pela primeira vez por Beaucage e Caruthers (1981) Tetrahedron Letts. 22: 18591862, usando um sintetizador automático, e/ou como descrito em Needham-VanDevanter et al. (1984) Nucleic Acids Res. 12: 6159-6168. A purificação de oligonucleotídeos pode ser realizada por eletroforese em gel de acrilamida nativo ou por cromatografia líquida de alta performance de troca aniônica (HPLC), por exemplo, tal como descrito em Pearson e Regnier (1983) J. Chrom. 255: 137-149.[095] A capture oligonucleotide can be designed and synthesized using a suitable process, and can be of any length suitable for hybridizing with a nucleotide sequence of interest and performing separation and/or analysis procedures described herein. Oligonucleotides can be designed based on a nucleotide sequence of interest (eg target fragment sequence, reference fragment sequence). An oligonucleotide, in some embodiments, can be from about 10 to about 300 nucleotides, about 10 to about 100 nucleotides, about 10 to about 70 nucleotides, about 10 to about 50 nucleotides, about 15 to about 30 nucleotides, or about 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 or 100 nucleotides in length. An oligonucleotide can be composed of naturally occurring and/or non-naturally occurring nucleotides (e.g., labeled nucleotides), or a mixture of these. Oligonucleotides suitable for use with the embodiments described herein can be synthesized and labeled using known techniques. Oligonucleotides can be chemically synthesized according to the solid phase phosphoramidite triester method first described by Beaucage and Caruthers (1981) Tetrahedron Letts. 22: 18591862, using an automatic synthesizer, and/or as described in Needham-VanDevanter et al. (1984) Nucleic Acids Res. 12: 6159-6168. Purification of oligonucleotides can be accomplished by native acrylamide gel electrophoresis or by anion exchange high performance liquid chromatography (HPLC), for example, as described in Pearson and Regnier (1983) J. Chrom. 255: 137-149.

[096]A totalidade ou uma porção de uma sequência de oligonucleotídeo (ocorrência natural ou sintética) pode ser substancialmente complementar a uma sequência de fragmento alvo e/ou de referência ou sua porção, em algumas modalidades. Como aqui referido, "substancialmente complementar" em relacionamento às sequências refere-se a sequências de nucleotídeo que irão hibridizar uma com a outra. O rigor das condições de hibridização pode ser alterado para tolerar quantidades variáveis de incompatibilidade de sequência.[096] All or a portion of an oligonucleotide sequence (naturally occurring or synthetic) may be substantially complementary to a target and/or reference fragment sequence or portion thereof, in some embodiments. As referred to herein, "substantially complementary" in relation to sequences refers to nucleotide sequences that will hybridize to one another. The stringency of the hybridization conditions can be altered to tolerate varying amounts of sequence mismatch.

[097]São incluídas sequências de oligonucleotídeo alvos/referências que são 55% ou mais, ou mais de 56%, 57% ou mais, 58% ou mais, 59% ou mais, 60% ou mais, 61% ou mais, 62% ou mais, 63% ou mais, 64% ou mais, 65% ou mais, 66% ou mais, 67% ou mais, 68% ou mais, 69% ou mais, 70% ou mais, 71% ou mais, 72% ou mais, 73% ou mais, 74% ou mais, 75% ou mais, 76% ou mais, 77% ou mais, 78% ou mais, 79% ou mais, 80% ou mais, 81% ou mais, 82% ou mais, 83% ou mais, 84% ou mais, 85% ou mais, 86% ou mais, 87% ou mais, 88% ou mais, 89% ou mais, 90% ou mais, 91% ou mais, 92% ou mais, 93% ou mais, 94% ou mais, 95% ou mais, 96% ou mais, 97% ou mais, 98% ou mais ou 99% ou mais complementar uma da outra.[097] Target/reference oligonucleotide sequences are included that are 55% or more, or more than 56%, 57% or more, 58% or more, 59% or more, 60% or more, 61% or more, 62 % or more, 63% or more, 64% or more, 65% or more, 66% or more, 67% or more, 68% or more, 69% or more, 70% or more, 71% or more, 72 % or more, 73% or more, 74% or more, 75% or more, 76% or more, 77% or more, 78% or more, 79% or more, 80% or more, 81% or more, 82 % or more, 83% or more, 84% or more, 85% or more, 86% or more, 87% or more, 88% or more, 89% or more, 90% or more, 91% or more, 92 % or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more complement each other.

[098]Os oligonucleotídeos que são substancialmente complementares a uma sequência de ácido nucleico de interesse (por exemplo, sequência de fragmento alvo, sequência de fragmento de referência) ou sua porção também são substancialmente semelhantes ao complemento da sequência de ácido nucleico alvo ou porção relevante da mesma (por exemplo, substancialmente semelhante à fita antessentido do ácido nucleico). Um teste para determinar se duas sequências de nucleotídeo são substancialmente semelhantes é determinar a percentagem de sequências de nucleotídeo idênticas. Como aqui referido, "substancialmente semelhante" em relação às sequências refere-se a sequências de nucleotídeo que são 55% ou mais, 56% ou mais, 57% ou mais, 58% ou mais, 59% ou mais, 60% ou mais, 61 % ou mais, 62% ou mais, 63% ou mais, 64% ou mais, 65% ou mais, 66% ou mais, 67% ou mais, 68% ou mais, 69% ou mais, 70% ou mais, 71 % ou mais, 72% ou mais, 73% ou mais, 74% ou mais, 75% ou mais, 76% ou mais, 77% ou mais, 78% ou mais, 79% ou mais, 80% ou mais, 81% ou mais, 82% ou mais, 83% ou mais, 84% ou mais, 85% ou mais, 86% ou mais, 87% ou mais, 88% ou mais, 89 % ou mais, 90% ou mais, 91% ou mais, 92% ou mais, 93% ou mais, 94% ou mais, 95% ou mais, 96% ou mais, 97% ou mais, 98% ou mais ou 99 % ou mais idênticas uma a outra.[098] Oligonucleotides that are substantially complementary to a nucleic acid sequence of interest (for example, target fragment sequence, reference fragment sequence) or portion thereof are also substantially similar to the complement of the target nucleic acid sequence or relevant portion same (e.g., substantially similar to the sense nucleic acid strand). One test to determine whether two nucleotide sequences are substantially similar is to determine the percentage of identical nucleotide sequences. As referred to herein, "substantially similar" with respect to sequences refers to nucleotide sequences that are 55% or more, 56% or more, 57% or more, 58% or more, 59% or more, 60% or more , 61% or more, 62% or more, 63% or more, 64% or more, 65% or more, 66% or more, 67% or more, 68% or more, 69% or more, 70% or more , 71% or more, 72% or more, 73% or more, 74% or more, 75% or more, 76% or more, 77% or more, 78% or more, 79% or more, 80% or more , 81% or more, 82% or more, 83% or more, 84% or more, 85% or more, 86% or more, 87% or more, 88% or more, 89% or more, 90% or more , 91% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more or 99% or more identical to each other.

[099]Condições de recozimento (por exemplo, condições de hibridização) podem ser determinadas e/ou ajustadas, dependendo das características dos oligonucleotídeos usados em um ensaio. Sequência e/ou comprimento de oligonucleotídeo, por vezes, pode afetar hibridização em uma sequência de ácido nucleico de interesse. Dependendo do grau de incompatibilidade entre um oligonucleotídeo e ácido nucleico de interesse, condições rigorosas baixa, média ou alta podem ser utilizadas para efetuar o recozimento. Como aqui usado, o termo "condições rigorosas" refere-se a condições de hibridização e lavagem. Os métodos para otimização da condição de temperatura e reação de hibridização são conhecidos na técnica, e podem ser encontrados em Current Protocols in Molecular Biology, John Wiley & Sons, N.Y., 6.3.1-6.3.6 (1989). Métodos aquosos e não aquosos são descritos naquela referência e qualquer um pode ser usado. Exemplos não limitativos de condições rigorosas de hibridização são hibridização em 6X de cloreto de sódio/citrato de sódio (SSC) a cerca de 45°C, seguida por uma ou mais lavagens em 0,2X SSC, 0,1% de SDS a 50°C. Outro exemplo de condições rigorosas de hibridização é hibridização em 6X de cloreto de sódio/citrato de sódio (SSC) a cerca de 45°C, seguida por uma ou mais lavagens em 0,2X SSE, 0,1% de SDS a 55°C. Um exemplo adicional de condições rigorosas de hibridização é a hibridização em 6X de citrato de sódio/cloreto de sódio (SSC) em cerca de 45°C, seguida por uma ou mais lavagens em 0,2X SSE, 0,1% de SDS a 60°c. Frequentemente, as condições rigorosas de hibridização são hibridização em 6X citrato de sódio/cloreto de sódio (SSC) em cerca de 45°C, seguida por uma ou mais lavagens em 0,2X SSE, 0,1% de SDS a 65°C. Mais frequentemente, as condições rigorosas são o fosfato de sódio a 0,5 M, SDS a 7% a 65°C, seguida por uma ou mais lavagens a 0,2X SSC, 1% de SDS a 65°C. Temperaturas de hibridização rigorosas também podem ser alteradas (isto é, diminuídas) com adição de certos solventes orgânicos, por exemplo, formamida. Solventes orgânicos, como formamida, reduzem a estabilidade térmica de polinucleotídeos de fita dupla, de modo que a hibridização pode ser realizada a temperaturas mais baixas, enquanto ainda mantem condições rigorosas e que prolongam a vida útil de ácidos nucleicos que podem ser termo lábeis.[099] Annealing conditions (for example, hybridization conditions) can be determined and/or adjusted, depending on the characteristics of the oligonucleotides used in an assay. Oligonucleotide sequence and/or length can sometimes affect hybridization to a nucleic acid sequence of interest. Depending on the degree of mismatch between an oligonucleotide and the nucleic acid of interest, low, medium, or high stringency conditions can be used to perform annealing. As used herein, the term "stringent conditions" refers to hybridization and wash conditions. Methods for optimizing the hybridization reaction and temperature condition are known in the art, and can be found in Current Protocols in Molecular Biology, John Wiley & Sons, N.Y., 6.3.1-6.3.6 (1989). Aqueous and non-aqueous methods are described in that reference and either can be used. Non-limiting examples of stringent hybridization conditions are hybridization in 6X sodium chloride/sodium citrate (SSC) at about 45°C, followed by one or more washes in 0.2X SSC, 0.1% SDS at 50 °C. Another example of stringent hybridization conditions is hybridization in 6X sodium chloride/sodium citrate (SSC) at about 45°C, followed by one or more washes in 0.2X SSE, 0.1% SDS at 55° W. An additional example of stringent hybridization conditions is hybridization in 6X sodium citrate/sodium chloride (SSC) at about 45°C, followed by one or more washes in 0.2X SSE, 0.1% SDS at 60°C. Often, stringent hybridization conditions are hybridization in 6X sodium citrate/sodium chloride (SSC) at about 45°C, followed by one or more washes in 0.2X SSE, 0.1% SDS at 65°C . Most often, the stringent conditions are 0.5M sodium phosphate, 7% SDS at 65°C, followed by one or more washes in 0.2X SSC, 1% SDS at 65°C. Stringent hybridization temperatures can also be changed (ie, lowered) with the addition of certain organic solvents, eg formamide. Organic solvents such as formamide reduce the thermal stability of double-stranded polynucleotides, so that hybridization can be performed at lower temperatures, while still maintaining stringent conditions that extend the shelf life of nucleic acids that may be thermolabile.

[100]Como aqui utilizada, a frase "hibridização" ou suas variações gramaticais, refere-se ao recozimento de uma primeira molécula de ácido nucleico com uma segunda molécula de ácido nucleico sob condições rigorosas baixa, média ou alta, ou sob condições de síntese de ácido nucleico. Hibridização pode incluir casos em que uma primeira molécula de ácido nucleico hibridiza com uma segunda molécula de ácido nucleico, em que as primeira e segunda moléculas de ácido nucleico são complementares. Como aqui usado, "hibridiza especificamente" refere-se à hibridização preferencial sob condições de síntese de ácido nucleico de um oligonucleotídeo em uma molécula de ácido nucleico tendo uma sequência complementar ao oligonucleotídeo em comparação com a hibridização com uma molécula de ácido nucleico tendo uma sequência não complementar. Por exemplo, a hibridização específica inclui a hibridização de um oligonucleotídeo de captura para uma sequência de fragmento alvo que é complementar ao oligonucleotídeo.[100] As used herein, the phrase "hybridization" or grammatical variations thereof, refers to the annealing of a first nucleic acid molecule with a second nucleic acid molecule under low, medium, or high stringency conditions, or under synthetic conditions. of nucleic acid. Hybridization can include instances where a first nucleic acid molecule hybridizes to a second nucleic acid molecule, where the first and second nucleic acid molecules are complementary. As used herein, "specifically hybridizes" refers to the preferential hybridization under conditions of nucleic acid synthesis of an oligonucleotide to a nucleic acid molecule having a sequence complementary to the oligonucleotide compared to hybridization to a nucleic acid molecule having a sequence not complementary. For example, specific hybridization includes hybridizing a capture oligonucleotide to a target fragment sequence that is complementary to the oligonucleotide.

[101]Em algumas modalidades, um ou mais oligonucleotídeos de captura estão associados com um ligante de afinidade, tal como um membro de um par de ligações (por exemplo, biotina) ou antígeno que pode se ligar a um agente de captura, tais como avidina, estreptavidina, um anticorpo, ou um receptor. Por exemplo, um oligonucleotídeo de captura pode ser biotinilado de tal forma que ele pode ser capturado em um grânulo revestido com estreptavidina.[101] In some embodiments, one or more capture oligonucleotides are associated with an affinity ligand, such as a member of a binding pair (e.g., biotin) or antigen that can bind a capture agent, such as avidin, streptavidin, an antibody, or a receptor. For example, a capture oligonucleotide can be biotinylated in such a way that it can be captured onto a streptavidin-coated bead.

[102]Em algumas modalidades, um ou mais oligonucleotídeos de captura e/ou agentes de captura são efetivamente ligados a um suporte ou substrato sólido. Um suporte ou substrato sólido pode ser qualquer superfície sólida à qual um oligonucleotídeo de captura pode ser diretamente ou indiretamente ligado, incluindo, mas não se limitando a, superfícies fornecidas por microarranjo e poços, e partículas, tais como grânulos (por exemplo, grânulos paramagnéticos, grânulos magnéticos, microgrânulos, nanogrânulos), micropartículas e nanopartículas. Os suportes sólidos podem também incluir, por exemplo, chips, colunas, fibras ópticas, lenços, filtros (por exemplo, filtros de superfície plana), um ou mais capilares, vidro e vidro modificado ou funcionalizado (por exemplo, vidro de poro controlado (CPG)), quartzo, mica, membranas diazotadas (papel ou náilon), poliformaldeído, celulose, acetato de celulose, papel, cerâmica, metais, metalóides, materiais semicondutores, ponto quântico, grânulos ou partículas revestidas, outros materiais cromatográficos, partículas magnéticas; plástico (incluindo acrílico, poliestireno, copolímeros de estireno ou outros materiais, polibutileno, poliuretanos, Teflon™, polietileno, polipropileno, poliamida, poliéster, difluoreto de polivinilideno (PVDF), e semelhante), polissacarídeos, náilon ou nitrocelulose, resinas, sílica ou materiais à base de silício incluindo silício, gel de sílica, e silício modificado, Sephadex®, Sepharose®, carbono, metais (por exemplo, aço, ouro, prata, alumínio, silício e cobre), vidros inorgânicos, polímeros condutores (incluindo polímeros, tais como e polipirrol e poli-indol); superfícies micro ou nano-estruturadas tais como matrizes de ácido nucleico, nanotubos, nanofios ou superfícies nanoparticuladas decoradas; ou superfícies porosas ou géis, tais como metacrilatos, acrilamidas, polímeros de açúcar, celulose, silicatos, ou outros polímeros fibrosos ou de fita. Em algumas modalidades, o suporte ou substrato sólido pode ser revestido usando revestimentos passivos ou quimicamente derivatizados com qualquer número de materiais, incluindo polímeros, tais como dextranas, acrilamidas, gelatinas ou agarose. Grânulos e/ou partículas podem ser livres ou em conexão um com outro (por exemplo, sintetizados). Em algumas modalidades, a fase sólida pode ser uma coleção de partículas. Em algumas modalidades, as partículas podem compreender sílica e a sílica pode compreender o dióxido de sílica. Em algumas modalidades da sílica pode ser porosa e, em certas modalidades, a sílica pode ser não porosa. Em algumas modalidades, as partículas compreendem ainda um agente que confere propriedade paramagnética às partículas. Em certas modalidades, o agente compreende um metal, e, em certas modalidades, o agente é um óxido de metal, (por exemplo, ferro ou óxidos de ferro, em que o óxido de ferro contém uma mistura de Fe2+ e Fe3+). Os oligonucleotídeos podem ser ligados ao suporte sólido através de ligações covalentes ou por interações não covalentes e podem ser ligados ao suporte sólido, direta ou indiretamente (por exemplo, através de um agente intermediário tal como uma molécula espaçadora ou biotina). Uma sonda pode ser ligada ao suporte sólido antes, durante ou após a captura de ácido nucleico.[102] In some embodiments, one or more capture oligonucleotides and/or capture agents are effectively attached to a solid support or substrate. A solid support or substrate can be any solid surface to which a capture oligonucleotide can be directly or indirectly attached, including, but not limited to, microarray-provided surfaces and wells, and particles, such as beads (e.g., paramagnetic beads , magnetic granules, microgranules, nanogranules), microparticles and nanoparticles. Solid supports may also include, for example, chips, columns, optical fibers, wipes, filters (e.g., flat surface filters), one or more capillaries, glass, and modified or functionalized glass (e.g., controlled pore glass (e.g., controlled pore glass). CPG)), quartz, mica, diazotized membranes (paper or nylon), polyformaldehyde, cellulose, cellulose acetate, paper, ceramics, metals, metalloids, semiconductor materials, quantum dot, granules or coated particles, other chromatographic materials, magnetic particles; plastics (including acrylic, polystyrene, styrene copolymers or other materials, polybutylene, polyurethanes, Teflon™, polyethylene, polypropylene, polyamide, polyester, polyvinylidene difluoride (PVDF), and the like), polysaccharides, nylon or nitrocellulose, resins, silica or silicon-based materials including silicon, silica gel, and modified silicon, Sephadex®, Sepharose®, carbon, metals (e.g., steel, gold, silver, aluminum, silicon, and copper), inorganic glasses, conductive polymers (including polymers such as polypyrrole and polyindole); micro- or nano-structured surfaces such as nucleic acid matrices, nanotubes, nanowires or decorated nanoparticulate surfaces; or porous surfaces or gels, such as methacrylates, acrylamides, sugar polymers, cellulose, silicates, or other fibrous or ribbon polymers. In some embodiments, the solid support or substrate can be coated using passive or chemically derivatized coatings with any number of materials, including polymers, such as dextrans, acrylamides, gelatins, or agarose. Granules and/or particles can be free or in connection with each other (eg synthesized). In some embodiments, the solid phase can be a collection of particles. In some embodiments, the particles can comprise silica and the silica can comprise silica dioxide. In some embodiments the silica may be porous and in certain embodiments the silica may be non-porous. In some embodiments, the particles further comprise an agent that imparts a paramagnetic property to the particles. In certain embodiments, the agent comprises a metal, and in certain embodiments, the agent is a metal oxide, (e.g., iron or iron oxides, where the iron oxide contains a mixture of Fe2+ and Fe3+). Oligonucleotides can be attached to the solid support through covalent bonds or by non-covalent interactions, and can be attached to the solid support directly or indirectly (for example, through an intermediate agent such as a spacer molecule or biotin). A probe can be attached to the solid support before, during or after nucleic acid capture.

[103]Em algumas modalidades, o ácido nucleico é enriquecido com um comprimento particular de fragmento de ácido nucleico, a faixa de comprimentos, ou comprimentos sob ou sobre um limite ou de corte particular usando um ou mais métodos de separação baseado no comprimento. Comprimento do fragmento de ácido nucleico refere-se tipicamente ao número de nucleotídeos no fragmento. Comprimento do fragmento de ácido nucleico também é por vezes referido como tamanho do fragmento de ácido nucleico. Em algumas modalidades, um método de separação baseado no comprimento é realizado sem medir comprimentos de fragmentos individuais. Em algumas modalidades, um método de separação baseado no comprimento é realizado em conjunto com um método para a determinação do comprimento de fragmentos individuais. Em algumas modalidades, a separação baseada no comprimento refere-se a um procedimento de fracionamento do tamanho, onde a totalidade ou parte do conjunto fracionado pode ser isolado (por exemplo, retido) e/ou analisado. Procedimentos de fracionamento do tamanho são conhecidos na técnica (por exemplo, separação em uma matriz, a separação por uma peneira molecular, separação por eletroforese em gel, a separação por cromatografia em coluna (por exemplo, colunas de exclusão de tamanho), e abordagens baseadas em microfluidos). Em certas modalidades, abordagens de separação baseada em comprimento podem incluir circularização do fragmento, tratamento químico (por exemplo, formaldeído, polietileno glicol (PEG)), espectrometria de massa e/ou amplificação de ácido nucleico de tamanho específico, por exemplo.[103] In some embodiments, the nucleic acid is enriched for a particular nucleic acid fragment length, range of lengths, or lengths under or over a particular threshold or cutoff using one or more length-based separation methods. Nucleic acid fragment length typically refers to the number of nucleotides in the fragment. Nucleic acid fragment length is also sometimes referred to as nucleic acid fragment size. In some embodiments, a length-based separation method is performed without measuring individual fragment lengths. In some embodiments, a length-based separation method is performed in conjunction with a method for determining the length of individual fragments. In some embodiments, length-based separation refers to a size fractionation procedure, where all or part of the fractionated set can be isolated (e.g., retained) and/or analyzed. Size fractionation procedures are known in the art (e.g., matrix separation, molecular sieve separation, gel electrophoresis separation, column chromatography separation (e.g., size exclusion columns), and approaches based on microfluids). In certain embodiments, length-based separation approaches may include fragment circularization, chemical treatment (e.g., formaldehyde, polyethylene glycol (PEG)), mass spectrometry, and/or size-specific nucleic acid amplification, for example.

[104]Em algumas modalidades, os fragmentos de ácido nucleico de certo comprimento, faixa de comprimentos, ou comprimentos abaixo ou acima de um limite ou corte particular, são separados da amostra. Em algumas modalidades, fragmentos com um comprimento sob um limite ou corte particular (por exemplo, 500 pb, 400 pb, 300 pb, 200 pb, 150 pb, 100 pb) são referidos como fragmentos "curtos" e fragmentos com um comprimento ao longo de um limite ou corte particular (por exemplo, 500 pb, 400 pb, 300 pb, 200 pb, 150 pb, 100 pb) são referidos como fragmentos de "longos". Em algumas modalidades, os fragmentos de certo comprimento, faixa de comprimentos, ou comprimentos abaixo ou acima de um limite ou corte particular, são retidos para análise enquanto fragmentos de um comprimento ou faixa de comprimentos diferentes, ou comprimentos acima ou abaixo do limite ou corte não são retidos para análise. Em algumas modalidades, fragmentos que são menores do que cerca de 500 pb são retidos. Em algumas modalidades, fragmentos que são menores do que cerca de 400 pb são retidos. Em algumas modalidades, fragmentos que são menores do que cerca de 300 pb são retidos. Em algumas modalidades, fragmentos que são menores do que cerca de 200 pb são retidos. Em algumas modalidades, fragmentos que são menores do que cerca de 150 pb são retidos. Por exemplo, fragmentos que são menos do que cerca de 190 pb, 180 pb, 170 pb, 160 pb, 150 pb, 140 pb, 130 pb, 120 pb, 110 pb e 100 pb são retidos. Em algumas modalidades, fragmentos que são cerca de 100 pb a cerca de 200 pb são retidos. Por exemplo, fragmentos que são cerca de 190 pb, 180 pb, 170 pb, 160 pb, 150 pb, 140 pb, 130 pb, 120 pb ou 110 pb são retidos. Em algumas modalidades, fragmentos que estão na faixa de cerca de 100 pb a cerca de 200 pb são retidos. Por exemplo, fragmentos que estão na faixa de cerca de 110 pb a cerca de 190 pb, 130 pb a cerca de 180 pb, 140 pb a cerca de 170 pb, 140 pb a cerca de 150 pb, 150 pb a cerca de 160 bp, ou 145 pb a cerca de 155 pb são retidos. Em algumas modalidades, fragmentos que são cerca de 10 pb a cerca de 30 pb mais curtos do que outros fragmentos de certo comprimento ou faixa de comprimentos são retidos. Em algumas modalidades, fragmentos de cerca de 10 pb a cerca de 20 pb mais curtos do que outros fragmentos de certo comprimento ou faixa de comprimentos são retidos. Em algumas modalidades, fragmentos que são cerca de 10 pb a cerca de 15 pb mais curtos do que outros fragmentos de certo comprimento ou faixa de comprimentos são retidos.[104] In some embodiments, nucleic acid fragments of a certain length, range of lengths, or lengths below or above a particular threshold or cutoff, are separated from the sample. In some embodiments, fragments with a length under a particular threshold or cutoff (e.g., 500 bp, 400 bp, 300 bp, 200 bp, 150 bp, 100 bp) are referred to as "short" fragments and fragments with a length along of a particular boundary or cut (eg, 500bp, 400bp, 300bp, 200bp, 150bp, 100bp) are referred to as "long" fragments. In some embodiments, fragments of a certain length, range of lengths, or lengths below or above a particular threshold or cutoff, are retained for analysis as fragments of a different length or range of lengths, or lengths above or below the threshold or cutoff. are not retained for analysis. In some embodiments, fragments that are smaller than about 500 bp are retained. In some embodiments, fragments that are smaller than about 400 bp are retained. In some embodiments, fragments that are smaller than about 300 bp are retained. In some embodiments, fragments that are smaller than about 200 bp are retained. In some embodiments, fragments that are smaller than about 150 bp are retained. For example, fragments that are less than about 190 bp, 180 bp, 170 bp, 160 bp, 150 bp, 140 bp, 130 bp, 120 bp, 110 bp and 100 bp are retained. In some embodiments, fragments that are about 100 bp to about 200 bp are retained. For example, fragments that are about 190 bp, 180 bp, 170 bp, 160 bp, 150 bp, 140 bp, 130 bp, 120 bp, or 110 bp are retained. In some embodiments, fragments that are in the range of about 100 bp to about 200 bp are retained. For example, fragments that are in the range of about 110 bp to about 190 bp, 130 bp to about 180 bp, 140 bp to about 170 bp, 140 bp to about 150 bp, 150 bp to about 160 bp , or 145 bp to about 155 bp are retained. In some embodiments, fragments that are about 10 bp to about 30 bp shorter than other fragments of a certain length or range of lengths are retained. In some embodiments, fragments from about 10 bp to about 20 bp shorter than other fragments of a certain length or range of lengths are retained. In some embodiments, fragments that are about 10 bp to about 15 bp shorter than other fragments of a certain length or range of lengths are retained.

[105]Em algumas modalidades, o ácido nucleico é enriquecido com um comprimento do fragmento de ácido nucleico particular, faixa de comprimentos, ou comprimentos acima ou abaixo de um limite ou corte particular usando um ou mais métodos baseados na bioinformática (por exemplo, em sílica) métodos. Por exemplo, fragmentos (reads) de sequências de nucleotídeo podem ser obtidos para os fragmentos de ácido nucleico usando um processo de sequenciamento de nucleotídeo adequado. Em alguns casos, tal como quando um método de sequenciamento de extremidade pareada é usado, o comprimento de um fragmento particular pode ser determinado com base nas posições dos fragmentos (reads) de sequências mapeados obtidas a partir de cada terminal do fragmento. Fragmentos (reads) de sequência utilizados para uma análise particular (por exemplo, a determinação da presença ou ausência de uma variação genética) podem ser enriquecidas ou filtradas de acordo com um ou mais comprimentos de fragmento selecionados ou valores limites do comprimento do fragmento de fragmentos correspondentes como descrito em maior detalhe aqui.[105] In some embodiments, the nucleic acid is enriched to a particular nucleic acid fragment length, range of lengths, or lengths above or below a particular threshold or cutoff using one or more bioinformatics-based methods (e.g., in silica) methods. For example, fragments (reads) of nucleotide sequences can be obtained for nucleic acid fragments using a suitable nucleotide sequencing process. In some cases, such as when a paired-end sequencing method is used, the length of a particular fragment can be determined based on the fragment positions (reads) of mapped sequences obtained from each end of the fragment. Sequence reads used for a particular analysis (e.g., determining the presence or absence of a genetic variation) can be enriched or filtered according to one or more selected fragment lengths or fragment fragment length threshold values. correspondents as described in greater detail here.

[106]Certos métodos de separação baseados em comprimento que podem ser usados com os métodos aqui descritos, por vezes, utilizam uma abordagem de marcação de sequência seletiva, por exemplo. O termo "marcação de sequência" refere-se à incorporação de uma sequência reconhecida e distinta em um ácido nucleico ou uma população de ácidos nucleicos. O termo "marcação de sequência" como aqui usado tem um significado diferente do termo "marcador de sequência" descrito posteriormente aqui. Em tais métodos de marcação de sequência, espécies de ácidos nucleicos com tamanho de fragmento (por exemplo, fragmentos curtos) são submetidas à marcação de sequência seletiva em uma amostra que inclui ácidos nucleicos curtos e longos. Tais métodos envolvem tipicamente a realização de uma reação de amplificação de ácido nucleico usando um conjunto de iniciadores internos que incluem iniciadores internos e iniciadores externos. Em certas modalidades, um ou ambos dos internos podem ser marcados para, desse modo, introduzir uma marcação no produto de amplificação alvo. Os iniciadores externos geralmente não são recozidos com os fragmentos curtos que carregam a sequência alvo (interna). Os iniciadores internos podem recozer com os fragmentos curtos e geram um produto da amplificação que carrega uma marcação e a sequência alvo. Tipicamente, a marcação dos fragmentos longos é inibida através de uma combinação de mecanismos que incluem, por exemplo, extensão bloqueada dos iniciadores internos pelo recozimento anterior e extensão dos iniciadores externos. Enriquecimento dos fragmentos marcados pode ser obtido por qualquer de uma variedade de métodos incluindo, por exemplo, digestão de exonuclease de ácido nucleico de fita simples e amplificação dos fragmentos marcados usando os iniciadores de amplificação específicos para pelo menos uma marcação.[106]Certain length-based separation methods that can be used with the methods described here sometimes use a sequence-selective tagging approach, for example. The term "sequence tagging" refers to the incorporation of a recognized and distinct sequence into a nucleic acid or population of nucleic acids. The term "sequence tag" as used herein has a different meaning than the term "sequence tag" described later herein. In such sequence labeling methods, fragment-sized nucleic acid species (eg, short fragments) are subjected to selective sequence labeling in a sample that includes both short and long nucleic acids. Such methods typically involve performing a nucleic acid amplification reaction using a set of nested primers that include nested primers and nested primers. In certain embodiments, one or both of the internals can be labeled to thereby introduce a tag into the target amplification product. Outside primers are generally not annealed with the short fragments that carry the target (internal) sequence. Internal primers can anneal the short fragments and generate an amplification product that carries a tag and the target sequence. Typically, labeling of long fragments is inhibited through a combination of mechanisms including, for example, blocked extension of inner primers by prior annealing and extension of outer primers. Enrichment of the tagged fragments can be achieved by any of a variety of methods including, for example, exonuclease digestion of single-stranded nucleic acid and amplification of the tagged fragments using amplification primers specific for at least one tag.

[107]Outro método de separação baseado no comprimento que pode ser usado com os métodos aqui descritos consiste em submeter uma amostra de ácido nucleico à precipitação por polietileno glicol (PEG). Exemplos de métodos incluem aqueles descritos nas publicações internacionais dos pedidos de patente n°s WO2007/140417 e WO2010/115016. Esse método implica, em geral, o contato de uma amostra de ácido nucleico com PEG na presença de um ou mais sais monovalentes sob condições suficientes para precipitar substancialmente ácidos nucleicos grandes sem precipitar substancialmente ácidos nucleicos pequenos (por exemplo, menos de 300 nucleotídeos).[107] Another length-based separation method that can be used with the methods described herein is to subject a nucleic acid sample to polyethylene glycol (PEG) precipitation. Examples of methods include those described in International Publication Application Nos. WO2007/140417 and WO2010/115016. This method generally entails contacting a nucleic acid sample with PEG in the presence of one or more monovalent salts under conditions sufficient to substantially precipitate large nucleic acids without substantially precipitating small nucleic acids (e.g., less than 300 nucleotides).

[108]Outro método de enriquecimento baseado no tamanho que pode ser usado com os métodos descritos aqui envolve circularização por ligação, por exemplo, usando circligase. Os fragmentos de ácido nucleico curtos podem ser tipicamente circularizados com maior eficiência do que fragmentos longos. Sequências não circularizadas podem ser separadas das sequências circularizadas, e os fragmentos curtos enriquecidos podem ser usados para posterior análise.[108] Another size-based enrichment method that can be used with the methods described here involves ligation circularization, for example using circligase. Short nucleic acid fragments can typically be circularized more efficiently than long fragments. Non-circularized sequences can be separated from circularized sequences, and the short enriched fragments can be used for further analysis.

Determinação do comprimento do fragmentoDetermining the length of the fragment

[109]Em algumas modalidades, o comprimento é determinado para um ou mais fragmentos de ácido nucleico. Em algumas modalidades, o comprimento é determinado para um ou mais fragmentos alvos, desse modo, identificando uma ou mais espécies de tamanho do fragmento alvo. Em algumas modalidades, o comprimento é determinado para um ou mais fragmentos alvos e um ou mais fragmentos de referência, desse modo, identificando uma ou mais espécies de comprimento de fragmento alvo e uma ou mais espécies de comprimento de fragmento de referência. Em algumas modalidades, o comprimento do fragmento é determinado pela medição do comprimento de uma sonda que hibridiza com o fragmento, o que é discutido com mais detalhe abaixo. Fragmento de ácido nucleico ou o comprimento da sonda pode ser determinado usando qualquer método adequado da técnica para a determinação do comprimento do fragmento de ácido nucleico, tais como, por exemplo, um processo sensível de massa (por exemplo, espectrometria de massa (por exemplo, espectrometria de massa por ionização/dessorção a laser assistida por matriz (MALDI) e espectrometria de massa por eletroaspersão (ES)), eletroforese (por exemplo, eletroforese capilar), microscopia (microscopia de tunelamento por varredura, microscopia de força atômica), medindo o comprimento usando um de nanoporo, e determinação do comprimento baseado em sequência (por exemplo, o sequenciamento de extremidade pareada). Em algumas modalidades, o comprimento da sonda ou fragmento pode ser determinado sem o uso de um método de separação com base na carga do fragmento. Em algumas modalidades, o comprimento do fragmento ou sonda pode ser determinado sem o uso de um processo de eletroforese. Em algumas modalidades, o comprimento do fragmento ou sonda pode ser determinado sem o uso de um processo de sequenciamento de nucleotídeo.[109] In some embodiments, the length is determined for one or more nucleic acid fragments. In some embodiments, the length is determined for one or more target fragments, thereby identifying one or more target fragment size species. In some embodiments, the length is determined for one or more target fragments and one or more reference fragments, thereby identifying one or more target fragment length species and one or more reference fragment length species. In some embodiments, the length of the fragment is determined by measuring the length of a probe that hybridizes to the fragment, which is discussed in more detail below. Nucleic acid fragment or probe length can be determined using any method suitable in the art for determining nucleic acid fragment length, such as, for example, a mass sensitive procedure (e.g. mass spectrometry (e.g. , matrix-assisted laser ionization/desorption mass spectrometry (MALDI) and electrospray mass spectrometry (ES)), electrophoresis (e.g., capillary electrophoresis), microscopy (scanning tunneling microscopy, atomic force microscopy), measuring the length using a nanopore, and sequence-based length determination (e.g., paired-end sequencing). In some embodiments, the length of the probe or fragment can be determined without using a sequence-based separation method. fragment charge In some embodiments, the length of the fragment or probe can be determined without using an electrophoresis procedure In some embodiments, the length of the fragment or probe can be determined without using a nucleotide sequencing procedure.

Espectrometria de massaMass spectrometry

[110]Em algumas modalidades, a espectrometria de massa é utilizada para determinar o comprimento do fragmento de ácido nucleico. Métodos de espectrometria de massa tipicamente são usados para determinar a massa de uma molécula, tal como um fragmento de ácido nucleico. Em algumas modalidades, o comprimento do fragmento de ácido nucleico pode ser extrapolado a partir da massa do fragmento. Em algumas modalidades, uma faixa prevista do comprimento do fragmento de ácido nucleico pode ser extrapolada a partir da massa do fragmento. Em algumas modalidades, o comprimento do fragmento de ácido nucleico pode ser extrapolado a partir da massa de uma sonda que hibridiza com o fragmento, o qual é descrito em maior detalhe abaixo. Em algumas modalidades, a presença de um ácido nucleico alvo e/ou de referência com um comprimento fornecido pode ser verificada comparando a massa do sinal detectado com a massa esperada do fragmento alvo e/ou de referência. A intensidade relativa do sinal, por exemplo, pico de massa em um espectro para um comprimento do fragmento e/ou fragmento de ácido nucleico particular, por vezes, pode indicar a população relativa das espécies de fragmento entre outros ácidos nucleicos presentes na amostra (ver, por exemplo, Jurinke et al. (2004) 26, Mol. Biotechnol., 147-164).[110] In some embodiments, mass spectrometry is used to determine the length of the nucleic acid fragment. Mass spectrometry methods are typically used to determine the mass of a molecule, such as a nucleic acid fragment. In some embodiments, the length of the nucleic acid fragment can be extrapolated from the mass of the fragment. In some embodiments, a predicted range of the length of the nucleic acid fragment can be extrapolated from the mass of the fragment. In some embodiments, the length of the nucleic acid fragment can be extrapolated from the mass of a probe that hybridizes to the fragment, which is described in greater detail below. In some embodiments, the presence of a target and/or reference nucleic acid of a given length can be verified by comparing the mass of the detected signal with the expected mass of the target and/or reference fragment. Relative signal strength, e.g. peak mass in a spectrum for a particular fragment length and/or nucleic acid fragment, can sometimes indicate the relative population of fragment species among other nucleic acids present in the sample (see , for example, Jurinke et al (2004) 26, Mol. Biotechnol., 147-164 ).

[111]Espectrometria de massa geralmente funciona por ionização de compostos químicos para gerar moléculas ou fragmentos de moléculas carregados e medindo suas proporções de massa para carga. Um procedimento típico de espectrometria de massa envolve várias etapas, incluindo (1) a carga de uma amostra no instrumento de espectrometria de massa seguida pela vaporização, (2) ionização dos componentes da amostra por qualquer um de uma variedade de métodos (por exemplo, impactando com um feixe de elétrons), resultando em partículas carregadas (íons), (3) separação de íons de acordo com a sua proporção de massa para carga em um analisador por campos eletromagnéticos, (4) detecção de íons (por exemplo, por um método quantitativo), e (5) processamento do sinal dos íons no espectro de massa.[111]Mass spectrometry generally works by ionizing chemical compounds to generate charged molecules or fragments of molecules and measuring their mass-to-charge ratios. A typical mass spectrometry procedure involves several steps, including (1) loading a sample into the mass spectrometry instrument followed by vaporization, (2) ionization of sample components by any of a variety of methods (e.g., impacting with an electron beam), resulting in charged particles (ions), (3) separation of ions according to their mass to charge ratio in an analyzer by electromagnetic fields, (4) detection of ions (e.g., by a quantitative method), and (5) signal processing of the ions in the mass spectrum.

[112]Métodos de espectrometria de massa são bem conhecidos na técnica (ver, por exemplo, Burlingame et al. Anal. Chem. 70:647R-716R (1998)), e incluem, por exemplo, espectrometria de massa tipo quadrupolo, espectrometria de massa por captura de íons, espectrometria de massa por tempo-de-voo, espectrometria de massa com cromatografia gasosa e espectrometria de massa em tandem podem ser usados com os métodos aqui descritos. Os processos básicos associados com um método de espectrometria de massa são a geração de íons em fase gasosa derivados da amostra, e a medição de suas massas. O movimento de íons em fase gasosa pode ser controlado com precisão usando campos eletromagnéticos gerados no espectrômetro de massa. O movimento dos íons nestes campos eletromagnéticos é proporcional à m/z (proporção de massa para carga) do íon e isso forma a base da medição de m/z e, consequentemente, a massa de uma amostra. O movimento de íons nestes campos eletromagnéticos permite a contenção e foco dos íons o que explica a alta sensibilidade da espectrometria de massa. Durante o curso de medição de m/z, os íons são transmitidos com alta eficiência para detectores de partículas que registram a chegada destes íons. A quantidade de íons em cada m/z é demonstrada por picos em um gráfico em que o eixo x é m/z e o eixo y é abundância relativa. Diferentes espectrômetros de massa têm diferentes níveis de resolução, isto é, a capacidade de resolver os picos entre íons estreitamente relacionados em massa. A resolução é definida como R = m/delta m, onde m é a massa do íon e delta m é a diferença em massa entre dois picos em espectro de massa. Por exemplo, um espectrômetro de massa com uma resolução de 1000 pode resolver um íon com m/z de 100,0 de um íon com m/z de 100,1. Certos métodos de espectrometria de massa podem utilizar várias combinações de fontes iônicas e analisadores de massa o que permite flexibilidade na concepção de protocolos de detecção personalizados. Em algumas modalidades, espectrômetros de massa podem ser programados para transmitir todos os íons da fonte iônica no espectrômetro de massa, ou sequencialmente ou ao mesmo tempo. Em algumas modalidades, um espectrômetro de massa pode ser programado para selecionar os íons de uma massa particular para a transmissão no espectrômetro de massa enquanto bloqueia outros íons.[112]Mass spectrometry methods are well known in the art (see, for example, Burlingame et al. Anal. Chem. 70:647R-716R (1998)), and include, for example, quadrupole mass spectrometry, ion capture mass spectrometry, time-of-flight mass spectrometry, gas chromatography mass spectrometry, and tandem mass spectrometry can be used with the methods described here. The basic processes associated with a mass spectrometry method are the generation of sample-derived gas phase ions, and the measurement of their masses. The movement of ions in the gas phase can be precisely controlled using electromagnetic fields generated in the mass spectrometer. The movement of ions in these electromagnetic fields is proportional to the m/z (mass to charge ratio) of the ion and this forms the basis of measuring m/z and hence the mass of a sample. The movement of ions in these electromagnetic fields allows the containment and focus of the ions which explains the high sensitivity of mass spectrometry. During the course of m/z measurement, ions are transmitted with high efficiency to particle detectors which register the arrival of these ions. The amount of ions in each m/z is shown by peaks on a graph where the x-axis is m/z and the y-axis is relative abundance. Different mass spectrometers have different levels of resolution, that is, the ability to resolve peaks between closely related ions by mass. Resolution is defined as R = m/delta m, where m is the mass of the ion and delta m is the difference in mass between two peaks in the mass spectrum. For example, a mass spectrometer with a resolution of 1000 can resolve an ion with m/z of 100.0 from an ion with m/z of 100.1. Certain mass spectrometry methods can utilize various combinations of ion sources and mass analyzers which allows flexibility in designing custom detection protocols. In some embodiments, mass spectrometers can be programmed to transmit all ions from the ion source into the mass spectrometer, either sequentially or at the same time. In some embodiments, a mass spectrometer can be programmed to select ions of a particular mass for transmission into the mass spectrometer while blocking other ions.

[113]Vários tipos de espectrômetros de massa estão disponíveis ou podem ser produzidos com várias configurações. Em geral, um espectrômetro de massa tem os seguintes componentes principais: uma entrada da amostra, uma fonte de íons, um analisador de massa, um detector, um sistema de vácuo, e sistema de controle de instrumento, e um sistema de dados. Diferença na entrada da amostra, fonte de íons, e analisador de massa geralmente define o tipo de instrumento e suas capacidades. Por exemplo, uma entrada pode ser uma fonte de cromatografia líquida em coluna capilar ou pode ser uma sonda direta ou estágio tal como usado na dessorção por laser assistida por matriz. As fontes de íons comuns são, por exemplo, por eletroaspersão, incluindo nanoaspersão e microaspersão ou dessorção por laser assistida por matriz. Analisadores de massa incluem, por exemplo, um filtro de massa tipo quadrupolo, analisador de massa por captura de íon e analisador de massa por tempo-de-voo.[113]Various types of mass spectrometers are available or can be produced in various configurations. In general, a mass spectrometer has the following major components: a sample inlet, an ion source, a mass analyzer, a detector, a vacuum system, and instrument control system, and a data system. Differences in sample input, ion source, and mass analyzer generally define instrument type and capabilities. For example, an input can be a capillary liquid chromatography source or it can be a direct probe or stage as used in matrix-assisted laser desorption. Common ion sources are, for example, electrospray, including nanospray and microspray, or matrix-assisted laser desorption. Mass analyzers include, for example, a quadrupole-type mass filter, ion capture mass analyzer, and time-of-flight mass analyzer.

[114]O processo de formação de íon é o ponto de partida para a análise do espectro de massa. Vários métodos de ionização estão disponíveis e a escolha do método de ionização depende da amostra utilizada para a análise. Por exemplo, para a análise de polipeptídeos um procedimento de ionização relativamente suave, tal como ionização por eletroaspersão (ESI) pode ser desejável. Para ESI, uma solução contendo a amostra é passada através de uma agulha fina com alto potencial que cria um forte campo elétrico que resulta em uma pulverização fina de gotículas altamente carregadas que é direcionada para dentro do espectrômetro de massa. Outros procedimentos de ionização incluem, por exemplo, bombardeamento com átomos rápidos (FAB), que utiliza um feixe de alta energia de átomos neutros para atacar uma amostra sólida causando dessorção e ionização. Ionização por dessorção a laser assistida por matriz (MALDI) é um método no qual um pulso de laser é usado para atacar uma amostra que foi cristalizada em uma matriz de composto que absorve UV (por exemplo, ácido 2,5-di- hidroxibenzóico, ácido alfa-ciano-4-hidroxicinâmico, ácido 3-hidroxipicolínico (3-HPA), di-amôniocitrato (DAC) e combinações dos mesmos). Outros procedimentos de ionização conhecidos na técnica incluem, por exemplo, descarga no plasma e luminescente, ionização por dessorção em plasma, ionização por ressonância, e ionização secundária.[114]The ion formation process is the starting point for mass spectral analysis. Several ionization methods are available and the choice of ionization method depends on the sample used for the analysis. For example, for polypeptide analysis a relatively mild ionization procedure such as electrospray ionization (ESI) may be desirable. For ESI, a solution containing the sample is passed through a fine needle with a high potential that creates a strong electric field that results in a fine spray of highly charged droplets that is directed into the mass spectrometer. Other ionization procedures include, for example, fast atom bombardment (FAB), which uses a high-energy beam of neutral atoms to attack a solid sample causing desorption and ionization. Matrix-assisted laser desorption ionization (MALDI) is a method in which a laser pulse is used to attack a sample that has been crystallized in a matrix of a UV-absorbing compound (e.g., 2,5-dihydroxybenzoic acid, alpha-cyano-4-hydroxycinnamic acid, 3-hydroxypicolinic acid (3-HPA), diammonium citrate (DAC) and combinations thereof). Other ionization procedures known in the art include, for example, plasma and glow discharge, plasma desorption ionization, resonance ionization, and secondary ionization.

[115]Uma variedade de analisadores de massa está disponível que podem ser pareados com fontes iônicas diferentes. Analisadores de massa diferentes têm diferentes vantagens como são conhecidos na técnica e como aqui descritos. O espectrômetro de massa e métodos escolhidos para detecção depende do ensaio particular, por exemplo, um analisador de massa mais sensível pode ser usado quando uma pequena quantidade de íons é gerada para a detecção. Vários tipos de analisadores de massa e métodos de espectrometria de massa são descritos abaixo.[115]A variety of mass analyzers are available that can be paired with different ion sources. Different mass analyzers have different advantages as known in the art and as described herein. The mass spectrometer and methods chosen for detection depend on the particular assay, for example a more sensitive mass analyzer may be used when a small amount of ions is generated for detection. Various types of mass analyzers and mass spectrometry methods are described below.

[116]Espectrometria de massa de mobilidade iônica (IM) é um método de separação em fase gasosa. IM separa íons em fase gasosa com base na sua seção transversal de colisão e pode ser acoplado com espectrometria de massa por tempo-de- voo (TOF). IM-MS é discutido em mais detalhe por Verbeck et al., no Journal of Biomolecular Techniques 13 Vol., Issue 2, 56-61).[116]Ion mobility (IM) mass spectrometry is a gas phase separation method. IM separates gas phase ions based on their collision cross section and can be coupled with time-of-flight (TOF) mass spectrometry. IM-MS is discussed in more detail by Verbeck et al., in Journal of Biomolecular Techniques 13 Vol., Issue 2, 56-61).

[117]Espectrometria de massa tipo quadrupolo utiliza um analisador ou filtro de massa tipo quadrupolo. Esse tipo de analisador de massa é composto por quatro hastes dispostas em dois conjuntos de duas hastes eletricamente ligadas. Uma combinação de voltagens rf e dc são aplicadas a cada par de hastes que produz campos que causam um movimento oscilante dos íons à medida que avançam desde o início do filtro de massa para o fim. O resultado destes campos é a produção de um filtro de massa passo-alto em um par de hastes e um filtro passa-baixo no outro par de hastes. A sobreposição entre os filtros passa-alto e passa-baixo conduz a um m/z definido que pode passar ambos os filtros e atravessar o comprimento do quadrupolo. Esse m/z é selecionado e permanece estável no filtro de massa tipo quadrupolo, enquanto todos os outros m/z têm trajetórias instáveis e não permanecem no filtro de massa. Um espectro de massa resulta aumentando os campos aplicados de tal modo que um aumento em m/z é selecionado para passar através do filtro de massa e atingir o detector. Além disso, quadrupolos também podem ser configurados para conter e transmitir os íons de todos m/z aplicando um campo somente de rf. Isso permite quadrupolo funcionar como uma lente ou sistema de focagem em regiões do espectrômetro de massa onde a transmissão é necessária sem filtragem de massa.[117]Quadrupole-type mass spectrometry uses a quadrupole-type mass analyzer or filter. This type of mass analyzer consists of four rods arranged in two sets of two electrically connected rods. A combination of rf and dc voltages are applied to each pair of rods which produce fields that cause the ions to oscillate in motion as they travel from the beginning of the mass filter to the end. The result of these fields is the production of a high-pass mass filter on one pair of rods and a low-pass filter on the other pair of rods. The overlap between the high-pass and low-pass filters leads to a defined m/z that can pass both filters and traverse the length of the quadrupole. This m/z is selected and remains stable in the quadrupole mass filter, while all other m/z have unstable trajectories and do not remain in the mass filter. A mass spectrum results by increasing the applied fields such that an increase in m/z is selected to pass through the mass filter and reach the detector. In addition, quadrupoles can also be configured to contain and transmit all m/z ions by applying an rf-only field. This allows the quadrupole to function as a lens or focusing system in regions of the mass spectrometer where transmission is required without mass filtering.

[118]Um analisador de massa tipo quadrupolo, bem como os outros analisadores de massa aqui descritos, podem ser programados para analisar um m/z ou faixa de massa definida. Uma vez que a faixa da massa desejada do fragmento de ácido nucleico é conhecida, em alguns casos, um espectrômetro de massa pode ser programado para transmitir íons da faixa de massa correta projetada enquanto exclui os íons de uma faixa de massa maior ou menor. A capacidade de selecionar uma faixa de massa pode diminuir o ruído da base no ensaio e, desse modo, aumentar a proporção do sinal para ruído. Desse modo, em alguns casos, um espectrômetro de massa pode realizar uma etapa de separação, bem como a detecção e identificação de certos fragmentos de ácido nucleico distinguíveis da massa.[118] A quadrupole type mass analyzer, as well as the other mass analyzers described here, can be programmed to analyze a defined m/z or range of mass. Once the desired mass range of the nucleic acid fragment is known, in some cases a mass spectrometer can be programmed to transmit ions of the correct projected mass range while excluding ions of a higher or lower mass range. The ability to select a mass range can decrease background noise in the assay and thereby increase the signal-to-noise ratio. Thus, in some cases, a mass spectrometer can perform a separation step, as well as the detection and identification of certain nucleic acid fragments distinguishable from the mass.

[119]Espectrometria de massa por captura de íon utiliza um analisador de massa por captura de íon. Tipicamente, os campos são aplicados de modo que todos os íons de m/z são inicialmente capturados e oscilam no analisador de massa. Os íons entram na armadilha de íon a partir da fonte iônica através de um dispositivo de focagem, tal como um sistema de lentes octapolo. Captura de íon ocorre na região de captura antes de excitação e ejeção através de um eletrodo para o detector. Análise de massa pode ser realizada por aplicação sequencial de voltagens que aumentam a amplitude das oscilações de um modo que ejeta íons de m/z crescente para fora da armadilha e para o detector. Em contraste com a espectrometria de massa quadrupolo, todos os íons são retidos nos campos do analisador de massa, exceto aqueles com o m/z selecionado. O controle do número de íons pode ser realizado variando o tempo durante o qual os íons são injetados na armadilha.[119]Ion capture mass spectrometry uses an ion capture mass analyzer. Typically, fields are applied so that all m/z ions are initially captured and oscillate in the mass analyzer. Ions enter the ion trap from the ion source through a focusing device, such as an octapole lens system. Ion capture occurs in the capture region before excitation and ejection through an electrode to the detector. Mass analysis can be performed by sequentially applying voltages that increase the amplitude of the oscillations in a way that ejects ions of increasing m/z out of the trap and into the detector. In contrast to quadrupole mass spectrometry, all ions are retained in the mass analyzer fields, except those with m/z selected. Control of the number of ions can be accomplished by varying the time during which the ions are injected into the trap.

[120]Espectrometria de massa por tempo-de-voo utiliza um analisador de massa por tempo-de-voo. Tipicamente, um íon é primeiro fornecido em uma quantidade fixa de energia cinética por aceleração em um campo elétrico (gerado por alta voltagem). Na sequência de aceleração, o íon entra em uma região de campo livre "de arraste", onde ele viaja a uma velocidade que é inversamente proporcional ao m/z. Portanto, os íons com baixo m/z viaja mais rapidamente do que os íons com alto m/z. O tempo necessário para os íons viajar o comprimento da região de campo livre é medido e usado para calcular m/z do íon.[120] Time-of-flight mass spectrometry uses a time-of-flight mass analyzer. Typically, an ion is first given a fixed amount of kinetic energy by accelerating it in an electric field (generated by high voltage). In the acceleration sequence, the ion enters a "drag" free field region, where it travels at a velocity that is inversely proportional to m/z. Therefore, ions with low m/z travel faster than ions with high m/z. The time required for the ions to travel the length of the free field region is measured and used to calculate m/z of the ion.

[121]Cromatografia em fase gasosa acoplada a espectrometria de massa pode, frequentemente, ser um alvo em tempo real. A porção da cromatografia em fase gasosa (CG) do sistema separa a mistura química em pulsos de analito e o espectrômetro de massa (MS) identifica e quantifica o analito.[121] Gas chromatography coupled with mass spectrometry can often be a real-time target. The gas chromatography (GC) portion of the system separates the chemical mixture into pulses of analyte and the mass spectrometer (MS) identifies and quantifies the analyte.

[122]Espectrometria de massa em tandem pode utilizar combinações dos analisadores de massa descritos acima. Espectrômetros de massa em tandem podem utilizar um primeiro analisador de massa para separar íon de acordo com seu m/z, a fim de isolar um íon de interesse para posterior análise. O íon isolado de interesse é então dividido em íons fragmentados (chamado dissociação colisionalmente ativada ou dissociação colisionalmente induzida) e os íons fragmentados são analisados pelo segundo analisador de massa. Estes tipos de sistemas de espectrometria de massa em tandem são chamados tandem em sistemas espaciais porque os dois analisadores de massa são separados no espaço, geralmente por uma célula de colisão. Sistemas de espectrometria de massa em tandem também incluem tandem em sistemas de tempo em que um analisador de massa é usado, no entanto, o analisador de massa é usado sequencialmente para isolar um íon, induzir a fragmentação, e, em seguida, executar a análise de massa.[122]Tandem mass spectrometry can use combinations of the mass analyzers described above. Tandem mass spectrometers can use a first mass analyzer to separate ions according to their m/z in order to isolate an ion of interest for further analysis. The isolated ion of interest is then split into fragmented ions (called collisionally activated dissociation or collisionally induced dissociation) and the fragmented ions are analyzed by the second mass analyzer. These types of tandem mass spectrometry systems are called tandem in space systems because the two mass analyzers are separated in space, usually by a collision cell. Tandem mass spectrometry systems also include tandem in time systems in which a mass analyzer is used, however, the mass analyzer is used sequentially to isolate an ion, induce fragmentation, and then perform the analysis. mass.

[123]Espectrômetros de massa em tandem na categoria espaço tem mais do que um analisador de massa. Por exemplo, um sistema de espectrômetro de massa tipo quadrupolo em tandem pode ter um primeiro filtro de massa quadrupolo, seguido por uma célula de colisão, seguido por um segundo filtro de massa quadrupolo e, em seguida, o detector. Outro arranjo é o uso de um filtro de massa quadrupolo para o primeiro analisador de massa e um analisador de massa de tempo-de-voo para o segundo analisador de massa, com uma célula de colisão que separa os dois analisadores de massa. Outros sistemas em tandem são conhecidos na técnica, incluindo espectrometria de massa quadrupolo-setor, com setor em tandem e por tempo-de-voo contendo espelho eletrostático.[123] Tandem mass spectrometers in the space category have more than one mass analyzer. For example, a tandem quadrupole mass spectrometer system might have a first quadrupole mass filter, followed by a collision cell, followed by a second quadrupole mass filter, and then the detector. Another arrangement is to use a quadrupole mass filter for the first mass analyzer and a time-of-flight mass analyzer for the second mass analyzer, with a collision cell separating the two mass analyzers. Other tandem systems are known in the art, including quadrupole-sector, tandem-sector, and time-of-flight mass spectrometry containing electrostatic mirrors.

[124]Espectrômetros de massa em tandem na categoria tempo tem um analisador de massa que realiza funções diferentes em tempos diferentes. Por exemplo, um espectrômetro de massa por captura de íon pode ser utilizado para capturar íons de todos m/z. Uma série de funções de varredura de rf são aplicadas que ejeta íons de todos m/z da armadilha exceto m/z dos íons de interesse. Após o m/z de interesse ter sido isolado, um pulso de rf é aplicado para produzir as colisões com as moléculas de gás na armadilha para induzir a fragmentação dos íons. Em seguida, os valores de m/z dos íons fragmentados são medidas pelo analisador de massa. Instrumentos de ressonância ciclotrônica iônica, também conhecidos como espectrômetros de massa por transformada de Fourier, são um exemplo de sistemas de tandem-em-tempo.[124] Tandem mass spectrometers in the time category have a mass analyzer that performs different functions at different times. For example, an ion capture mass spectrometer can be used to capture ions of all m/z. A series of rf sweep functions are applied that eject ions from all m/z of the trap except m/z of the ions of interest. After the m/z of interest has been isolated, an rf pulse is applied to produce collisions with the gas molecules in the trap to induce fragmentation of the ions. Then the m/z values of the fragmented ions are measured by the mass analyzer. Ion cyclotron resonance instruments, also known as Fourier transform mass spectrometers, are an example of tandem-time systems.

[125]Vários tipos de experimentos de espectrometria de massa em tandem podem ser realizados por meio do controle dos íons que são selecionados em cada fase do experimento. Os diferentes tipos de experimentos utilizam diferentes modos de operação, às vezes chamados de "varreduras", dos analisadores de massa. Em um primeiro exemplo, chamado de varredura do espectro de massa, o primeiro analisador de massa e a célula de colisão transmitem todos os íons para análise de massa no segundo analisador de massa. Em um segundo exemplo, chamado de uma varredura do íon do produto, os íons de interesse são selecionados em massa no primeiro analisador de massa e, em seguida, fragmentados na célula de colisão. Os íons formados são então analisados pela varredura do segundo analisador de massa. Em um terceiro exemplo, chamado de varredura de íon precursor, o primeiro analisador de massa é varrido para sequencialmente transmitir os íons analisados em massa na célula de colisão para a fragmentação. O segundo analisador de massa seleciona em massa o íon do produto de interesse para a transmissão para o detector. Portanto, o sinal do detector é o resultado de todos os íons precursores que podem ser fragmentados em um íon do produto comum. Outros formatos experimentais incluem varreduras de perda neutra onde uma diferença de massa constante é contabilizada nas varreduras de massa.[125]Various types of tandem mass spectrometry experiments can be performed by controlling the ions that are selected at each stage of the experiment. Different types of experiments use different modes of operation, sometimes called "sweeps", of the mass analyzers. In a first example, called a mass spectrum scan, the first mass analyzer and collision cell transmit all ions for mass analysis to the second mass analyzer. In a second example, called a product ion scan, the ions of interest are selected en masse in the first mass analyzer and then fragmented in the collision cell. The formed ions are then analyzed by scanning the second mass analyzer. In a third example, called a precursor ion scan, the first mass analyzer is scanned to sequentially transmit the analyzed ions en masse into the collision cell for fragmentation. The second mass analyzer mass selects the product ion of interest for transmission to the detector. Therefore, the detector signal is the result of all the precursor ions that can be fragmented into a common product ion. Other experimental formats include neutral loss scans where a constant mass difference is accounted for in the mass scans.

[126]Para quantificação, os controles podem ser usados que podem fornecer um sinal em relação à quantidade do fragmento de ácido nucleico, por exemplo, que está presente ou é introduzido. Um controle para permitir a conversão de sinais de massa relativa em quantidades absolutas pode ser obtido pela adição de uma quantidade conhecida de um marcador de massa ou marcador de massa de cada amostra antes da detecção dos fragmentos de ácido nucleico. Ver, por exemplo, Ding and Cantor (2003) PNAS U S A. Mar 18; 100(6):3059-64. Qualquer marcação de massa que não interfere com a detecção dos fragmentos pode ser usada para normalizar o sinal da massa. Tais padrões tipicamente têm propriedades de separação que são diferentes daqueles de qualquer das marcações moleculares na amostra, e podem ter as mesmas ou diferentes assinaturas da massa.[126] For quantification, controls can be used that can provide a signal regarding the amount of the nucleic acid fragment, for example, that is present or introduced. A control to allow conversion of relative mass signals to absolute amounts can be obtained by adding a known amount of a mass marker or mass marker to each sample prior to detection of the nucleic acid fragments. See, for example, Ding and Cantor (2003) PNAS U S A. Mar 18; 100(6):3059-64. Any mass label that does not interfere with fragment detection can be used to normalize the mass signal. Such patterns typically have separation properties that are different from those of any of the molecular markers in the sample, and may have the same or different mass signatures.

[127]Uma etapa de separação, por vezes, pode ser usada para remover os sais, enzimas, ou outros componentes tampão da amostra de ácido nucleico. Vários métodos bem conhecidos na técnica, tais como cromatografia, eletroforese em gel ou precipitação, podem ser usados para limpar a amostra. Por exemplo, cromatografia de exclusão molecular ou cromatografia de afinidade pode ser usada para remover o sal de uma amostra. A escolha do método de separação pode depender da quantidade de uma amostra. Por exemplo, quando pequenas quantidades de amostra estão disponíveis ou um aparelho miniaturizado é usado, uma etapa de separação por cromatografia de micro-afinidade pode ser usado. Além disso, se uma etapa de separação é desejada, e a escolha do método de separação, pode depender do método de detecção usado. Sais, por vezes, podem absorver a energia do laser na dessorção/ionização a laser assistida por matriz e resultar em menor eficiência de ionização. Desse modo, a eficiência da dessorção/ionização a laser assistida por matriz e ionização por eletroaspersão, por vezes, pode ser melhorada através da remoção de sais de uma amostra.[127] A separation step can sometimes be used to remove salts, enzymes, or other buffer components from the nucleic acid sample. Various methods well known in the art, such as chromatography, gel electrophoresis or precipitation, can be used to clean the sample. For example, size exclusion chromatography or affinity chromatography can be used to remove salt from a sample. The choice of separation method may depend on the amount of a sample. For example, when small amounts of sample are available or a miniaturized apparatus is used, a micro-affinity chromatography separation step can be used. Furthermore, whether a separation step is desired, and the choice of separation method, may depend on the detection method used. Salts can sometimes absorb laser energy in matrix-assisted laser desorption/ionization and result in lower ionization efficiency. Thus, the efficiency of matrix-assisted laser desorption/ionization and electrospray ionization can sometimes be improved by removing salts from a sample.

EletroforeseElectrophoresis

[128]Em algumas modalidades, a eletroforese é utilizada para determinar o comprimento do fragmento de ácido nucleico. Em algumas modalidades, a eletroforese não é utilizada para determinar o comprimento do fragmento de ácido nucleico. Em algumas modalidades, o comprimento de uma sonda correspondente (por exemplo, uma sonda correspondente ajustada aqui descrita) é determinada usando eletroforese. Eletroforese também pode ser usada, em algumas modalidades, como um método de separação baseada no comprimento, tal como aqui descrito. Qualquer método de eletroforese conhecido na técnica, em que os ácidos nucleicos são separados por comprimento, pode ser usado em conjunto com os métodos aqui fornecidos, os quais incluem, mas não estão limitados a, técnicas eletroforéticas padrão e técnicas eletroforéticas especializadas, tais como, por exemplo, eletroforese capilar. Exemplos de métodos para a separação do ácido nucleico e medir o comprimento do fragmento de ácido nucleico usando técnicas eletroforéticas padrão podem ser encontrados na técnica. Um exemplo não limitativo é aqui apresentado. Depois de executar uma amostra de ácido nucleico em uma agarose ou em gel de poliacrilamida, o gel pode ser marcado (por exemplo, manchado) com brometo de etídio (ver, Sambrook e Russell, Molecular Cloning: A Laboratory Manual 3d ed., 2001). A presença de uma banda do mesmo tamanho que um controle padrão é uma indicação da presença de um comprimento da sequência de ácido nucleico particular, a quantidade da qual pode então ser comparada com o controle com base na intensidade da banda, detectando e quantificando desse modo o comprimento da sequência de ácido nucleico de interesse.[128] In some embodiments, electrophoresis is used to determine the length of the nucleic acid fragment. In some embodiments, electrophoresis is not used to determine the length of the nucleic acid fragment. In some embodiments, the length of a matched probe (e.g., a matched fitted probe described herein) is determined using electrophoresis. Electrophoresis can also be used, in some embodiments, as a length-based separation method, as described herein. Any electrophoresis method known in the art, in which nucleic acids are separated by length, can be used in conjunction with the methods provided herein, which include, but are not limited to, standard electrophoretic techniques and specialized electrophoretic techniques, such as, for example, capillary electrophoresis. Examples of methods for separating nucleic acid and measuring nucleic acid fragment length using standard electrophoretic techniques can be found in the art. A non-limiting example is presented here. After running a nucleic acid sample on an agarose or polyacrylamide gel, the gel can be stained (eg, stained) with ethidium bromide (see, Sambrook and Russell, Molecular Cloning: A Laboratory Manual 3d ed., 2001 ). The presence of a band of the same size as a standard control is an indication of the presence of a particular nucleic acid sequence length, the amount of which can then be compared to the control based on the intensity of the band, thereby detecting and quantifying the length of the nucleic acid sequence of interest.

[129]Em algumas modalidades, eletroforese capilar é usada para separar, identificar e algumas vezes quantificar fragmentos de ácido nucleico. A eletroforese capilar (CE) inclui uma família de técnicas de separação relacionadas que utilizam capilares de sílica fundida com furo estreito para separar uma matriz complexa de grandes e pequenas moléculas, tais como, por exemplo, ácidos nucleicos de comprimento variável. Altas resistências do campo eléctrico podem ser usadas para separar moléculas de ácido nucleico com base nas diferenças de carga, tamanho e hidrofobicidade. A introdução da amostra é realizada por imersão da extremidade do capilar em um frasco da amostra e a aplicação de pressão, vácuo ou voltagem. Dependendo dos tipos de capilar e eletrólitos usados, a tecnologia de CE pode ser segmentada em várias técnicas de separação, qualquer das quais pode ser adaptada aos métodos aqui fornecidos. Exemplos não limitativos destas incluem eletroforese capilar de zona (CZE), também conhecida como CE em solução livre (FSCE), foco isoelétrico capilar (CIEF), isotacoforese (ITP), cromatografia eletrocinética (EKC), cromatografia capilar eletrocinética miclear (MECC ou MEKC), cromatografia eletrocinética de microemulsão (MEEKC), eletroforese capilar não aquosa (NACE) e eletrocromatografia capilar (CEC).[129] In some embodiments, capillary electrophoresis is used to separate, identify, and sometimes quantify nucleic acid fragments. Capillary electrophoresis (CE) includes a family of related separation techniques that use narrow-bore fused silica capillaries to separate a complex array of large and small molecules, such as, for example, nucleic acids of varying length. High electric field strengths can be used to separate nucleic acid molecules based on differences in charge, size, and hydrophobicity. Sample introduction is accomplished by immersing the end of the capillary in a sample vial and applying pressure, vacuum, or voltage. Depending on the types of capillaries and electrolytes used, EC technology can be segmented into a number of separation techniques, any of which can be adapted to the methods provided here. Non-limiting examples of these include capillary zone electrophoresis (CZE), also known as free solution CE (FSCE), capillary isoelectric focusing (CIEF), isotachophoresis (ITP), electrokinetic chromatography (EKC), micellar electrokinetic capillary chromatography (MECC or MEKC ), microemulsion electrokinetic chromatography (MEEKC), non-aqueous capillary electrophoresis (NACE) and capillary electrochromatography (CEC).

[130]Qualquer dispositivo, máquina ou aparelho capaz de realizar eletroforese capilar pode ser usado em conjunto com os métodos aqui fornecidos. Em geral, os componentes principais de um sistema de eletroforese capilar são um frasco de amostra, frascos de origem e destino, um capilar, eletrodos, uma fonte de alimentação de alta voltagem, um detector, e um dispositivo de saída e manuseio de dados. O frasco de origem, o frasco de destino e capilar são preenchidos com eletrólito tal como uma solução tampão aquosa. Para introduzir a amostra, a entrada do capilar é colocada em um frasco que contém a amostra e, em seguida, devolvida ao frasco de origem (amostra é introduzida no capilar através da ação capilar, pressão ou sifão). A migração dos analitos (ou seja, ácidos nucleicos) é, então, iniciada por um campo elétrico que é aplicado entre os frascos de origem e de destino e é fornecido aos eletrodos pela fonte de alimentação de alta voltagem. Íons, positivos ou negativos, são puxados através do capilar na mesma direção por fluxo eletro-osmótico. Os analitos (ou seja, ácidos nucleicos) separam à medida que eles migram devido à sua mobilidade eletroforética e são detectados perto da extremidade de saída do capilar. A saída do detector é enviada para um dispositivo de saída e manuseio dos dados, tal como um computador ou integrador. Os dados são então exibidos como um eletroferograma, que pode comunicar a resposta do detector em função do tempo. Ácidos nucleicos separados podem aparecer como picos com diferentes tempos de migração em um eletroferograma.[130]Any device, machine, or apparatus capable of performing capillary electrophoresis may be used in conjunction with the methods provided herein. In general, the main components of a capillary electrophoresis system are a sample vial, source and destination vials, a capillary, electrodes, a high voltage power supply, a detector, and a data output and handling device. The source vial, destination vial and capillary are filled with electrolyte such as an aqueous buffer solution. To introduce the sample, the capillary inlet is placed in a vial containing the sample and then returned to the source vial (sample is introduced into the capillary via capillary action, pressure or siphoning). Migration of the analytes (ie nucleic acids) is then initiated by an electric field that is applied between the source and destination vials and is supplied to the electrodes by the high voltage power supply. Ions, positive or negative, are pulled through the capillary in the same direction by electro-osmotic flow. Analytes (i.e. nucleic acids) separate as they migrate due to their electrophoretic mobility and are detected near the exit end of the capillary. The detector's output is sent to an output and data handling device, such as a computer or integrator. The data is then displayed as an electropherogram, which can communicate the detector's response as a function of time. Separated nucleic acids can appear as peaks with different migration times on an electropherogram.

[131]Separação por eletroforese capilar pode ser detectada por vários dispositivos de detecção. A maioria dos sistemas comerciais utilizam absorbância de UV ou UV- Vis como seu principal modo de detecção. Nestes sistemas, uma seção do próprio capilar é utilizada como a célula de detecção. O uso de detecção no tubo permite a detecção de analitos separados sem perda de resolução. Em geral, os capilares usados em eletroforese capilar podem ser revestidos com um polímero para aumentar a estabilidade. A porção do capilar usado para detecção por UV é frequentemente oticamente transparente. O comprimento do percurso da célula de detecção na eletroforese capilar (~50 micrômetros) é muito menor do que a de uma célula de UV tradicional (~1 cm). De acordo com a lei de Lambert Beer, a sensibilidade do detector é proporcional ao comprimento do percurso da célula. Para melhorar a sensibilidade, o comprimento do percurso pode ser aumentado, embora isso possa resultar em uma perda de resolução. O próprio tubo capilar pode ser expandido no ponto de detecção, criando uma "célula bolha" com um comprimento de percurso mais longo ou tubulação adicional pode ser adicionada no ponto de detecção. Ambos destes métodos, no entanto, podem reduzir a resolução da separação.[131]Separation by capillary electrophoresis can be detected by various detection devices. Most commercial systems use UV absorbance or UV-Vis as their primary mode of detection. In these systems, a section of the capillary itself is used as the detection cell. The use of in-tube detection allows detection of separate analytes without loss of resolution. In general, capillaries used in capillary electrophoresis can be coated with a polymer to increase stability. The portion of the capillary used for UV detection is often optically transparent. The path length of the detection cell in capillary electrophoresis (~50 micrometers) is much smaller than that of a traditional UV cell (~1 cm). According to Lambert Beer's law, the sensitivity of the detector is proportional to the path length of the cell. To improve sensitivity, the path length can be increased, although this may result in a loss of resolution. The capillary tube itself can be expanded at the sensing point, creating a "bubble cell" with a longer path length, or additional tubing can be added at the sensing point. Both of these methods, however, can reduce the resolution of the separation.

[132]A detecção por fluorescência também pode ser usada em eletroforese capilar para as amostras que fluorescem naturalmente ou são quimicamente modificadas para conter marcas fluorescentes, tais como, por exemplo, fragmentos de ácido nucleico ou sondas marcados aqui descritos. Esse modo de detecção de alta sensibilidade oferece uma alta seletividade e melhorada para estas amostras. O método requer que o feixe de luz seja focado no capilar. Fluorescência induzida por laser pode ser usada em sistemas de CE com limites de detecção tão baixo quanto 10-18 a 1021 mol. A sensibilidade da técnica é atribuída à alta intensidade da luz incidente e a capacidade para focar com precisão a luz sobre o capilar.[132] Fluorescence detection can also be used in capillary electrophoresis for samples that naturally fluoresce or are chemically modified to contain fluorescent tags, such as, for example, nucleic acid fragments or labeled probes described herein. This high sensitivity detection mode offers improved high selectivity for these samples. The method requires the light beam to be focused on the capillary. Laser-induced fluorescence can be used in EC systems with detection limits as low as 10-18 to 1021 mol. The sensitivity of the technique is attributed to the high intensity of the incident light and the ability to accurately focus the light onto the capillary.

[133]Várias máquinas de eletroforese capilar são conhecidas na técnica e podem ser usadas em conjunto com os métodos aqui fornecidos. Estas incluem, mas não estão limitadas a CALIPER LAB CHIP GX (Caliper Life Sciences, Mountain View, CA), P/ACE 2000 Series (Beckman Coulter, Brea, CA), HP G1600A CE (Hewlett-Packard, Palo Alto, CA), AGILENT 7100 CE (Agilent Technologies, Santa Clara, CA), e analisador genético ABI PRISM (Applied Biosystems, Carlsbad, CA).[133]Various capillary electrophoresis machines are known in the art and can be used in conjunction with the methods provided herein. These include, but are not limited to, CALIPER LAB CHIP GX (Caliper Life Sciences, Mountain View, CA), P/ACE 2000 Series (Beckman Coulter, Brea, CA), HP G1600A CE (Hewlett-Packard, Palo Alto, CA) , AGILENT 7100 CE (Agilent Technologies, Santa Clara, CA), and ABI PRISM genetic analyzer (Applied Biosystems, Carlsbad, CA).

MicroscopiaMicroscopy

[134]Em algumas modalidades, o comprimento do fragmento de ácido nucleico é determinado usando um método baseado na formação de imagem, tal como um método de microscopia. Em algumas modalidades, o comprimento de uma sonda correspondente (por exemplo, uma sonda correspondente aparada aqui descrita) é determinado usando um método baseado na formação de imagem. Em algumas modalidades, o comprimento do fragmento pode ser determinado pela visualização microscópica de fragmentos de ácido nucleico (ver, por exemplo, patente US n° 5.720.928). Em algumas modalidades, os fragmentos de ácido nucleico são fixados em uma superfície (por exemplo, a superfície de vidro modificado) em um estado alongado, manchada e visualizada microscopicamente. Imagens dos fragmentos podem ser colidas e processadas (por exemplo, medidas pelo comprimento). Em algumas modalidades, formação de imagem e as etapas de análise da imagem podem ser automatizadas. Os métodos para visualizar diretamente fragmentos de ácido nucleico usando microscopia são conhecidos na técnica (ver, por exemplo, Li et al., (1999) Nat Genet 23 (3):309-13; Aston et al., (1999) Trends Biotechnol. 17(7):297-302; Aston et al., (1999) Methods Enzymol. 303:55-73; Jing et al., (1998) Proc Natl Acad Sci USA. 95(14):8046-51; e patente US n° 5.720.928). Outros métodos de microscopia que podem ser usados com os métodos aqui descritos incluem, sem limitação, microscopia de tunelamento por varredura (STM), microscopia de força atômica (ATM), microscopia de varredura por força (SFM), microscopia de varredura por fótons (PSTM), potenciometria de varredura por tunelamento (STP), microscopia de força magnética (MFM), microscopia de varredura por sonda, microscopia de varredura por voltagem, microscopia de força atômica fotocondutiva, microscopia de varredura por tunelamento eletroquímico, microscopia eletrônica, microscopia de varredura por tunelamento em spin polarizado (SPSTM), microscopia de varredura térmica, microscopia de varredura por expansão em joule, microespectroscopia fototérmica, e semelhante.[134] In some embodiments, the length of the nucleic acid fragment is determined using an imaging-based method, such as a microscopy method. In some embodiments, the length of a matched probe (e.g., a trimmed matched probe described herein) is determined using an imaging-based method. In some embodiments, fragment length can be determined by microscopic visualization of nucleic acid fragments (see, for example, US Patent No. 5,720,928). In some embodiments, the nucleic acid fragments are fixed to a surface (e.g., the modified glass surface) in an elongated state, stained, and visualized microscopically. Images of the fragments can be collated and processed (eg measured by length). In some embodiments, image formation and image analysis steps can be automated. Methods for directly visualizing nucleic acid fragments using microscopy are known in the art (see, for example, Li et al., (1999) Nat Genet 23(3):309-13; Aston et al., (1999) Trends Biotechnol 17(7):297-302, Aston et al., (1999) Methods Enzymol., 303:55-73, Jing et al., (1998) Proc Natl Acad Sci USA, 95(14):8046-51; and US Patent No. 5,720,928). Other microscopy methods that may be used with the methods described herein include, without limitation, scanning tunneling microscopy (STM), atomic force microscopy (ATM), scanning force microscopy (SFM), photon scanning microscopy ( PSTM), Scanning Tunneling Potentiometry (STP), Magnetic Force Microscopy (MFM), Scanning Probe Microscopy, Voltage Scanning Microscopy, Photoconductive Atomic Force Microscopy, Electrochemical Scanning Tunneling Microscopy, Electron Microscopy, Electrochemical Scanning Microscopy polarized spin tunneling (SPSTM) scanning, thermal scanning microscopy, joule expansion scanning microscopy, photothermal microspectroscopy, and the like.

[135]Em algumas modalidades, a microscopia de tunelamentocom varredura (STM) pode ser usada para determinar o comprimento de fragmento de ácido nucleico. Métodos de STM frequentemente podem gerar imagens em nível atômico das moléculas, tais como fragmentos de ácido nucleico. STM pode ser realizada, por exemplo, no ar, água, vácuo ultra alto, vários outros ambientes líquidos ou gasosos, e pode ser realizada em temperaturas variando desde próximo de zero Kelvin (-273,15°C) a algumas centenas de graus Celsius, por exemplo. Os componentes de um sistema de STM tipicamente incluem ponta de varredura, altura controlada piezoelétrica, agente de varredura x,y, controle da amostra-para-ponta grosseiro, sistema de isolamento de vibração, e computador. Métodos de STM baseiam-se geralmente no conceito de tunelamento quântico. Por exemplo, quando uma ponta de condução é trazida para perto da superfície de uma molécula (por exemplo, fragmento de ácido nucleico), uma polarização (isto é, diferença de voltagem) aplicada entre os dois pode permitir elétrons para túnel através do vácuo entre eles. A corrente de tunelamento resultante é uma função da posição da ponta, voltagem aplicada, e a densidade local de estados (LDOS) da amostra. A informação é adquirida através do monitoramento da corrente conforme a posição da ponta varre através da superfície, e pode ser exibida em forma de imagem. Se a ponta é movida através da amostra no plano x-y, as mudanças na altura da superfície e densidade de estados causam mudanças na corrente. Estas mudanças podem ser mapeadas em imagens. A mudança da corrente com respeito à posição, por vezes, pode ser medida em si, ou a altura, z, da ponta correspondente a uma corrente constante pode ser medida. Estes dois modos frequentemente são referidos como modo de altura constante e modo de corrente constante, respectivamente.[135] In some embodiments, scanning tunneling microscopy (STM) can be used to determine the length of a nucleic acid fragment. STM methods can often generate atomic-level images of molecules, such as nucleic acid fragments. STM can be performed, for example, in air, water, ultra high vacuum, various other liquid or gaseous environments, and can be performed at temperatures ranging from close to zero Kelvin (-273.15°C) to a few hundred degrees Celsius , for example. Components of an STM system typically include a scanning tip, piezoelectric controlled height, x,y scanning agent, coarse sample-to-tip control, vibration isolation system, and computer. STM methods are generally based on the concept of quantum tunneling. For example, when a conducting tip is brought close to the surface of a molecule (e.g., nucleic acid fragment), a bias (i.e., voltage difference) applied between the two can allow electrons to tunnel through the vacuum between they. The resulting tunneling current is a function of the tip position, applied voltage, and the local density of states (LDOS) of the sample. Information is acquired by monitoring the current as the tip position sweeps across the surface, and can be displayed in image form. If the tip is moved across the sample in the x-y plane, changes in surface height and state density cause changes in current. These changes can be mapped onto images. The current change with respect to position can sometimes be measured itself, or the height, z, of the tip corresponding to a constant current can be measured. These two modes are often referred to as constant height mode and constant current mode, respectively.

[136]Em algumas modalidades, microscopia de força atómica (AFM) pode ser utilizada para determinar o comprimento do fragmento de ácido nucleico. AFM geralmente é um tipo de alta resolução de microscopia em nanoescala. Informações sobre um objeto (por exemplo, fragmento de ácido nucleico) normalmente é coletada "sentindo" a superfície com uma sonda mecânica. Elementos piezoelétricos que facilitam movimentos minúsculos, mas exatos e precisos no comando eletrônico podem facilitar a varredura muito precisa. Em algumas variações, potenciais elétricos podem ser varridos usando cantilevers de condução. Os componentes de um sistema de AFM incluem, tipicamente, um braço de suporte com uma ponta afiada (isto é, a sonda) na sua extremidade que é usada para varrer a superfície de uma amostra (por exemplo, fragmento do ácido nucleico). O cantilever é tipicamente silício ou nitreto de silício com um raio da ponta de curvatura da ordem de nanômetros. Quando a ponta é colocada em proximidade de uma superfície da amostra, as forças entre a ponta e a amostra conduzem a uma deflexão do cantilever de acordo com a lei de Hooke. Dependendo da situação, as forças que são medidas em AFM incluem, por exemplo, força de contato mecânico, de van der Waals, forças de capilaridade, ligação química, forças eletrostáticas, forças magnéticas, forças de Casimir, forças de solvatação, e semelhante. Tipicamente, a deflexão é medida usando um ponto de laser refletido a partir da superfície de topo do cantilever em uma matriz de fotodiodos. Outros métodos que são usados incluem a interferometria ótica, cantilevers de sensibilidade capacitativa ou de AFM piezoresistivos.[136] In some embodiments, atomic force microscopy (AFM) can be used to determine the length of the nucleic acid fragment. AFM is usually a high-resolution type of nanoscale microscopy. Information about an object (eg nucleic acid fragment) is typically gathered by "feeling" the surface with a mechanical probe. Piezoelectric elements that facilitate tiny but exact and precise movements in the electronic control can facilitate very precise scanning. In some variations, electrical potentials can be swept away using conduction cantilevers. Components of an AFM system typically include a support arm with a sharp point (i.e., probe) at its end that is used to scan the surface of a sample (i.e., nucleic acid fragment). The cantilever is typically silicon or silicon nitride with a tip radius of curvature in the order of nanometers. When the tip is placed in close proximity to a sample surface, the forces between the tip and the sample lead to a deflection of the cantilever according to Hooke's law. Depending on the situation, forces that are measured in AFM include, for example, mechanical contact force, van der Waals force, capillary forces, chemical bonding, electrostatic forces, magnetic forces, Casimir forces, solvation forces, and the like. Typically, deflection is measured using a laser spot reflected from the top surface of the cantilever onto an array of photodiodes. Other methods that are used include optical interferometry, capacitive sensing or piezoresistive AFM cantilevers.

Nanoporonanopore

[137]Em algumas modalidades, o comprimento do fragmento de ácido nucleico é determinado usando um nanoporo. Em algumas modalidades, o comprimento de uma sonda correspondente (por exemplo, uma sonda correspondente aparada aqui descrita) é determinado usando um nanoporo. Um nanoporo é um pequeno buraco ou canal, tipicamente da ordem de 1 nanômetro de diâmetro. Certas proteínas celulares transmembranares podem atuar como nanoporos (por exemplo, alfa-hemolisina). Em algumas modalidades, nanoporos podem ser sintetizados (por exemplo, usando uma plataforma de silício). Imersão de um nanoporo em um fluido condutor e a aplicação de um potencial através dele resulta em uma ligeira corrente elétrica devido à condução de íons através da nanoporos. A quantidade de corrente que flui é sensível ao tamanho do nanoporo. Como um fragmento de ácido nucleico passa através de um nanoporo, a molécula de ácido nucleico obstrui o nanoporo a certo grau e gera uma mudança na corrente. A duração da mudança da corrente como o fragmento de ácido nucleico passa através do nanoporo pode ser medida. Em algumas modalidades, o comprimento do fragmento de ácido nucleico pode ser determinado com base nessa medição.[137] In some embodiments, the length of the nucleic acid fragment is determined using a nanopore. In some embodiments, the length of a matched probe (e.g., a trimmed matched probe described herein) is determined using a nanopore. A nanopore is a small hole or channel, typically on the order of 1 nanometer in diameter. Certain cellular transmembrane proteins can act as nanopores (eg, alpha-hemolysin). In some embodiments, nanopores can be synthesized (eg, using a silicon platform). Immersing a nanopore in a conducting fluid and applying a potential across it results in a slight electric current due to conduction of ions through the nanopores. The amount of current flowing is sensitive to the size of the nanopore. As a nucleic acid fragment passes through a nanopore, the nucleic acid molecule clogs the nanopore to some degree and generates a change in current. The duration of the current change as the nucleic acid fragment passes through the nanopore can be measured. In some embodiments, the length of the nucleic acid fragment can be determined based on this measurement.

[138]Em algumas modalidades, o comprimento do fragmento de ácido nucleico pode ser determinado em função do tempo. Os fragmentos de ácidos nucleicos mais longos, por vezes, podem levar relativamente mais tempo para passar através de um nanoporo e fragmentos de ácido nucleico mais curtos podem levar, por vezes, relativamente menos tempo para passar através de um nanoporo. Desse modo, o comprimento relativo de um fragmento pode ser determinado com base no tempo de trânsito do nanoporo, em algumas modalidades. Em algumas modalidades, comprimento absoluto ou aproximado do fragmento pode ser determinado por comparação do tempo de trânsito do nanoporo de fragmentos alvo e/ou fragmentos de referência para os tempos de trânsito para um conjunto de padrões (isto é, com comprimentos conhecidos).[138] In some embodiments, the length of the nucleic acid fragment can be determined as a function of time. Longer nucleic acid fragments can sometimes take relatively longer to pass through a nanopore and shorter nucleic acid fragments can sometimes take relatively less time to pass through a nanopore. Thus, the relative length of a fragment can be determined based on the nanopore transit time, in some embodiments. In some embodiments, absolute or approximate fragment length can be determined by comparing the nanopore transit time of target fragments and/or reference fragments to the transit times for a set of standards (i.e., with known lengths).

SondasProbes

[139]Em algumas modalidades, o comprimento do fragmento é determinado usando uma ou mais sondas. Em algumas modalidades, as sondas são projetadas de tal modo que elas hibridizam com cada ácido nucleico de interesse em uma amostra. Por exemplo, uma sonda pode compreender uma sequência de polinucleotídeos que é complementar a um ácido nucleico de interesse ou pode compreender uma série de monômeros que podem se ligar a um ácido nucleico de interesse. As sondas podem ter qualquer comprimento adequado para hibridizar (por exemplo, hibridizar completamente) com um ou mais fragmentos de ácido nucleico de interesse. Por exemplo, as sondas podem ser de qualquer comprimento, que se estende ou abrange para além do comprimento de um fragmento de ácido nucleico, ao qual se hibridiza. As sondas podem ser de cerca de 100 pb ou mais em comprimento. Por exemplo, as sondas podem ser, pelo menos, cerca de 200, 300, 400, 500, 600, 700, 800, 900 ou 1000 pb de comprimento.[139] In some embodiments, the length of the fragment is determined using one or more probes. In some embodiments, probes are designed such that they hybridize to each nucleic acid of interest in a sample. For example, a probe can comprise a polynucleotide sequence that is complementary to a nucleic acid of interest, or it can comprise a series of monomers that can bind a nucleic acid of interest. Probes can be any length suitable to hybridize (e.g., fully hybridize) to one or more nucleic acid fragments of interest. For example, probes can be of any length that extends or spans beyond the length of a nucleic acid fragment to which it hybridizes. Probes can be about 100 bp or more in length. For example, probes can be at least about 200, 300, 400, 500, 600, 700, 800, 900, or 1000 bp in length.

[140]Em algumas modalidades, as sondas podem compreender uma sequência de polinucleotídeo que é complementar a um ácido nucleico de interesse e uma ou mais sequências de polinucleotídeo que não são complementares a um ácido nucleico de interesse (ou seja, sequências não complementares). Sequências não complementares podem residir, por exemplo, na extremidade 5' e/ou extremidade 3' da sonda. Em algumas modalidades, as sequências não complementares podem compreender sequências de nucleotídeo que não existem no organismo de interesse e/ou sequências que não são capazes de hibridizar com qualquer sequência do genoma humano. Por exemplo, sequências não complementares podem ser derivadas a partir de qualquer genoma não humano conhecido na técnica, tal como, por exemplo, genomas de animal não mamífero, genomas de planta, genomas de fungo, genomas de bactérias, ou genomas virais. Em algumas modalidades, uma sequência não complementar é do genoma PhiX 174. Em algumas modalidades, uma sequência não complementar pode compreender nucleotídeos modificados ou sintéticos que não são capazes de hibridizar com um nucleotídeo complementar.[140] In some embodiments, probes may comprise a polynucleotide sequence that is complementary to a nucleic acid of interest and one or more polynucleotide sequences that are not complementary to a nucleic acid of interest (i.e., non-complementary sequences). Non-complementary sequences can reside, for example, at the 5' end and/or 3' end of the probe. In some embodiments, non-complementary sequences can comprise nucleotide sequences that do not exist in the organism of interest and/or sequences that are not capable of hybridizing to any human genome sequence. For example, non-complementary sequences can be derived from any non-human genome known in the art, such as, for example, non-mammalian animal genomes, plant genomes, fungal genomes, bacterial genomes, or viral genomes. In some embodiments, a non-complementary sequence is from the PhiX 174 genome. In some embodiments, a non-complementary sequence may comprise modified or synthetic nucleotides that are not capable of hybridizing to a complementary nucleotide.

[141]As sondas podem ser projetadas e sintetizadas de acordo com métodos conhecidos na técnica e descritos aqui para oligonucleotídeos (por exemplo, oligonucleotídeos de captura). As sondas também podem incluir qualquer uma das propriedades conhecidas na técnica e aqui descritas para oligonucleotídeos. As sondas aqui descritas podem ser projetadas de tal modo que elas compreendem nucleotídeos (por exemplo, adenina (A), timina (T), citosina (C), guanina (G) e uracila (U)), nucleotídeos modificados (por exemplo, pseudouridina, dihidrouridina, inosina (I), e 7- metilguanosina), nucleotídeos sintéticos, bases degeneradas (por exemplo, 6H, 8H-3,4-hidropirimido[4,5-c][1,2]oxazin-7- ona (P), 2-amino-6-metoxiaminopurina (K), N6-metoxiadenina (Z), e hipoxantina (I)), bases universais e/ou monômeros outros que nucleotídeos, nucleotídeos modificados ou nucleotídeos sintéticos, ou suas combinações e geralmente são projetados de tal modo que eles inicialmente têm comprimentos mais longos do que os fragmentos com que eles hibridizam.[141]Probes can be designed and synthesized according to methods known in the art and described here for oligonucleotides (eg, capture oligonucleotides). Probes can also include any of the properties known in the art and described herein for oligonucleotides. The probes described herein can be designed such that they comprise nucleotides (e.g. adenine (A), thymine (T), cytosine (C), guanine (G) and uracil (U)), modified nucleotides (e.g. pseudouridine, dihydrouridine, inosine (I), and 7-methylguanosine), synthetic nucleotides, degenerate bases (e.g., 6H, 8H-3,4-hydropyrimido[4,5-c][1,2]oxazin-7-one (P), 2-amino-6-methoxyaminopurine (K), N6-methoxyadenine (Z), and hypoxanthine (I)), universal bases and/or monomers other than nucleotides, modified nucleotides or synthetic nucleotides, or combinations thereof and generally are designed such that they initially have longer lengths than the fragments they hybridize to.

[142]Em algumas modalidades, uma sonda compreende uma pluralidade de monômeros que são capazes de hibridizar com qualquer uma das versões que ocorrem naturalmente ou modificadas de nucleotídeos, tais como adenina (A), timina (T), citosina (C), guanina (G) e uracila (VC). Em algumas modalidades, uma sonda compreende uma pluralidade de monômeros que são capazes de hibridizar com pelo menos três de adenina, timina, citosina, e guanina. Por exemplo, uma sonda pode incluir uma espécie de monômero que é capaz de hibridizar com A, T e C; A, T e G; G, C e T; ou G, C e A. Em algumas modalidades, uma sonda compreende uma pluralidade de monômeros que são capazes de hibridizar com todos de adenina, timina, citosina e guanina. Por exemplo, uma sonda pode incluir uma espécie de monômero que é capaz de hibridizar com todos os de A, T, C e G. Em algumas modalidades, as condições de hibridização (por exemplo, rigorosa) podem ser ajustadas de acordo com os métodos aqui descritos, por exemplo, para facilitar a hibridização de certas espécies de monômeros com várias espécies de nucleotídeos. Em algumas modalidades, os monômeros incluem nucleotídeos. Em algumas modalidades, os monômeros incluem nucleotídeos que ocorrem naturalmente. Em algumas modalidades, os monômeros incluem nucleotídeos modificados.[142] In some embodiments, a probe comprises a plurality of monomers that are capable of hybridizing to any of naturally occurring or modified versions of nucleotides, such as adenine (A), thymine (T), cytosine (C), guanine (G) and uracil (VC). In some embodiments, a probe comprises a plurality of monomers that are capable of hybridizing with at least three of adenine, thymine, cytosine, and guanine. For example, a probe can include a monomer species that is capable of hybridizing to A, T, and C; A, T and G; G, C and T; or G, C and A. In some embodiments, a probe comprises a plurality of monomers that are capable of hybridizing to all of adenine, thymine, cytosine and guanine. For example, a probe may include a monomer species that is capable of hybridizing to all of A, T, C, and G. In some embodiments, the hybridization conditions (e.g., stringent) can be adjusted according to the methods described herein, for example, to facilitate the hybridization of certain species of monomers with various species of nucleotides. In some embodiments, the monomers include nucleotides. In some embodiments, the monomers include naturally occurring nucleotides. In some embodiments, the monomers include modified nucleotides.

[143]Em algumas modalidades, os monômeros de uma sonda incluem inosina. Inosina é um nucleotídeo comumente encontrados em RNAt e é capaz, em alguns casos, de hibridizar com A, T e C. Exemplo 9 aqui descreve um método que utiliza sondas de poli-inosina para a determinação do tamanho do fragmento de ácido nucleico. Em algumas modalidades, as sondas de poli-inosina são hibridizadas com os fragmentos de ácido nucleico sob condições de hibridização de baixo rigor ou não rigorosas (por exemplo, tais como baixa temperatura e/ou alto sal em comparação com as condições rigorosas de hibridização aqui descritas). Em algumas modalidades, os fragmentos de ácido nucleico são tratados com bissulfito de sódio, o que provoca a desaminação de resíduos de citosina não metilada em fragmentos para formar resíduos de uracila. Em algumas modalidades, os fragmentos de ácido nucleico tratados com bissulfito de sódio são amplificados (por exemplo, PCR amplificado) antes do tratamento com bissulfito de sódio. Em algumas modalidades, os fragmentos de ácido nucleico são ligados a uma sequência compreendendo um sítio do iniciador de amplificação universal não tendo resíduos de citosina. Uma segunda fita complementar pode então ser gerada, por exemplo, usando um iniciador de amplificação universal e uma reação de extensão. Tipicamente, os resíduos de uracila na primeira fita geram resíduos de adenina complementares na segunda fita. Desse modo, uma segunda fita não tendo resíduos de guanina pode ser gerada. Tais segundas fitas complementares livres de guanina, em alguns casos, podem hibridizar com sondas de poli-inosina sob condições de hibridização rigorosas.[143] In some embodiments, the monomers of a probe include inosine. Inosine is a nucleotide commonly found in tRNA and is capable, in some cases, of hybridizing to A, T and C. Example 9 here describes a method that uses poly-inosine probes for the determination of nucleic acid fragment size. In some embodiments, the polyinosine probes are hybridized to the nucleic acid fragments under low stringency or non-stringent hybridization conditions (e.g., such as low temperature and/or high salt compared to the stringent hybridization conditions herein). described). In some embodiments, the nucleic acid fragments are treated with sodium bisulfite, which causes deamination of unmethylated cytosine residues in fragments to form uracil residues. In some embodiments, sodium bisulfite-treated nucleic acid fragments are amplified (e.g., amplified PCR) prior to sodium bisulfite treatment. In some embodiments, the nucleic acid fragments are ligated to a sequence comprising a universal amplification primer site having no cytosine residues. A second, complementary strand can then be generated, for example using a universal amplification primer and extension reaction. Typically, uracil residues on the first strand generate complementary adenine residues on the second strand. In this way, a second strand having no guanine residues can be generated. Such guanine-free complementary second strands, in some cases, can hybridize with polyinosine probes under stringent hybridization conditions.

[144]Em algumas modalidades, os monômeros de uma sonda incluem monômeros de base universal. Monômeros de base tipicamente universal são análogos de nucleobases ou monômeros sintéticos que podem hibridizar não seletivamente com cada uma das bases nativas (por exemplo, A, G, C, T). Desse modo, uma sonda compreendendo monômeros de base universal, por vezes, pode hibridizar com um fragmento de ácido nucleico independentemente da sequência de nucleotídeos. Bases universais podem incluir, sem limitação, 3-nitropirrol, 4-nitroindol, 5-nitroindol, 6- nitroindol, 3-metil-7-propinil isocarbostiril (PIM), 3- metil isocarbostiril (MICS), e 5-metil isocarbostiril (MICS) (ver, por exemplo, Nichols et al., (1994). Nature 369, 492-493; Bergstrom et al., (1995) J. Am. Chem. Soc. 117, 1201-1209; Loakes and Brown (1994) Nucleic Acids Res. 22, 4.039-4043; Lin and Brown (1992) Nucleic Acids Res. 20, 5149-5152; Lin and Brown (1989) Nucleic Acids Res. 17, 10383; Brown and Lin (1991) Carbohydrate Research 216, 129139; Berger et al., (2000) Nucleic Acids Res. 28 (15):2911- 2914).[144] In some embodiments, the monomers of a probe include universal base monomers. Typically universal base monomers are nucleobase analogues or synthetic monomers that can nonselectively hybridize to each of the native bases (eg, A, G, C, T). Thus, a probe comprising universal base monomers can sometimes hybridize to a nucleic acid fragment regardless of the nucleotide sequence. Universal bases may include, without limitation, 3-nitropyrole, 4-nitroindole, 5-nitroindole, 6-nitroindole, 3-methyl-7-propynyl isocarbostyril (PIM), 3-methyl isocarbostyril (MICS), and 5-methyl isocarbostyril ( MICS) (see, for example, Nichols et al., (1994). Nature 369, 492-493; Bergstrom et al., (1995) J. Am. Chem. Soc. 117, 1201-1209; Loakes and Brown ( 1994) Nucleic Acids Res. 22, 4039-4043; Lin and Brown (1992) Nucleic Acids Res. 20, 5149-5152; Lin and Brown (1989) Nucleic Acids Res. 17, 10383; Brown and Lin (1991) Carbohydrate Research 216, 129139;Berger et al., (2000) Nucleic Acids Res. 28(15):2911-2914).

[145]Em algumas modalidades, os monômeros de uma sonda incluem monômeros não nucleotídicos. Em algumas modalidades, as subunidades de monômeros incluem um polímero sintético. Em algumas modalidades, os monômeros incluem pirrolidona. Pirrolidona é um monômero de polímero sintético polipirrolidona e é capaz, em alguns casos, de hibridizar com todos de A, T, G e C.[145] In some embodiments, the monomers of a probe include non-nucleotide monomers. In some embodiments, the monomer subunits include a synthetic polymer. In some embodiments, the monomers include pyrrolidone. Pyrrolidone is a synthetic polypyrrolidone polymer monomer and is capable, in some cases, of hybridizing with all of A, T, G and C.

[146]Em algumas modalidades, um método para a determinação do comprimento do fragmento inclui a etapa de contatar sob condições de recozimento de fragmentos de ácido nucleico (por exemplo, fragmentos alvo e/ou de referência), com uma pluralidade de sondas que podem recozer com os fragmentos, gerando desse modo espécies de fragmento-sonda tais como, por exemplo, espécies de sonda- alvo e espécies de sonda-referência. Condições de hibridização e/ou sonda (por exemplo, rigor) podem ser otimizadas para favorecer a ligação completa ou substancialmente completa com fragmento (por exemplo, alto rigor). Hibridizações de sonda-fragmento completas ou substancialmente completas geralmente incluem duplexes em que o fragmento não compreende porções não hibridizadas e a sonda pode compreender porções não hibridizadas, como descrito em mais detalhe abaixo.[146] In some embodiments, a method for determining fragment length includes the step of contacting, under annealing conditions, nucleic acid fragments (e.g., target and/or reference fragments), with a plurality of probes that can anneal the fragments, thereby generating fragment-probe species such as, for example, probe-target species and probe-reference species. Hybridization and/or probe conditions (e.g., stringency) can be optimized to favor complete or substantially complete binding with fragment (e.g., high stringency). Full-length or substantially full-length probe-fragment hybridizations generally include duplexes in which the fragment does not comprise unhybridized portions and the probe may comprise unhybridized portions, as described in more detail below.

[147]Em algumas modalidades, tais como quando o comprimento da sonda é mais longo do que o comprimento do fragmento, as espécies de sonda alvo e/ou espécies de sonda-referência podem compreender porções de sonda hibridizada (isto é, porções de sonda de fita simples; ver, por exemplo, Figura 12). Porções de sonda não hibridizada podem estar em cada extremidade da sonda (por exemplo, 3' ou 5' de uma sonda) ou em ambas as extremidades da sonda (isto é, extremidade 3' e 5' de uma sonda), e podem compreender qualquer número de monômeros. Em algumas modalidades, porções da sonda não hibridizada podem compreender cerca de 1 a cerca de 500 monômeros. Por exemplo, porções da sonda não hibridizada podem compreender cerca de 5, 10, 20, 30, 40, 50, 100, 200, 300 ou 400 monômeros.[147] In some embodiments, such as when the probe length is longer than the fragment length, the target probe species and/or reference probe species may comprise hybridized probe portions (i.e., probe portions single strand; see, for example, Figure 12). Unhybridized probe portions can be at either end of the probe (e.g., 3' or 5' end of a probe) or at both ends of the probe (i.e., 3' and 5' end of a probe), and can comprise any number of monomers. In some embodiments, portions of the unhybridized probe can comprise from about 1 to about 500 monomers. For example, portions of the unhybridized probe can comprise about 5, 10, 20, 30, 40, 50, 100, 200, 300 or 400 monomers.

[148]Em algumas modalidades, as porções da sonda não hibridizada podem ser removidas das espécies da sonda alvo e/ou espécies de sonda-referência, gerando desse modo sondas aparadas. A remoção de porções de sonda não hibridizada pode ser obtida por qualquer método conhecido na técnica para a clivagem e/ou digestão de um polímero, tal como, por exemplo, um método para a clivagem ou digestão de um ácido nucleico de fita simples. Porções da sonda não hibridizada podem ser removidas da extremidade 5' da sonda e/ou extremidade 3' da sonda. Tais métodos podem incluir o uso de clivagem química e/ou enzimática ou digestão. Em algumas modalidades, uma enzima capaz de clivar ligações de fosfodiéster entre subunidades de nucleotídeo de um ácido nucleico é usada para remover as porções da sonda não hibridizada. Tais enzimas podem incluir, sem limitação, nucleases (por exemplo, DNAase I, RNAse I), endonucleases (por exemplo, nuclease do feijão Mung, nuclease S1, e semelhante), nucleases de restrição, exonucleases (por exemplo, exonuclease I, exonuclease III, exonuclease T, exonuclease T7, exonuclease lambda, e semelhante), fosfodiesterases (por exemplo, fosfodiesterase II, fosfodiesterase de baço de vitela, fosfodiesterase de veneno de cobra, e semelhante), desoxirribonucleases (DNAse), ribonucleases (RNase), endonucleases flap, 5' nucleases, 3' nucleases, 3'-5' exonucleases, 5'-3' exonucleases e semelhante, ou suas combinações. Sondas aparadas geralmente são do mesmo ou substancialmente mesmo comprimento como o fragmento com o qual elas hibridizam. Desse modo, a determinação do comprimento de uma sonda aparada aqui pode fornecer uma medida do comprimento do fragmento de ácido nucleico correspondente. Comprimento da sonda aparada pode ser medido usando qualquer um dos métodos conhecidos na técnica ou aqui descritos para a determinação do comprimento do fragmento de ácido nucleico. Em algumas modalidades, as sondas podem conter uma molécula ou entidade detectável para facilitar a determinação de detecção e/ou de comprimento (por exemplo, um fluoróforo, radioisótopo, agente colorimétrico, partícula, enzimas, e semelhante). Comprimento da sonda aparada pode ser avaliado com ou sem a separação de produtos de porções não hibridizadas após elas serem removidas.[148] In some embodiments, portions of unhybridized probe may be removed from the target probe species and/or reference probe species, thereby generating trimmed probes. Removal of unhybridized probe portions can be accomplished by any method known in the art for cleaving and/or digesting a polymer, such as, for example, a method for cleaving or digesting a single-stranded nucleic acid. Portions of unhybridized probe can be removed from the 5' end of the probe and/or the 3' end of the probe. Such methods may include the use of chemical and/or enzymatic cleavage or digestion. In some embodiments, an enzyme capable of cleaving phosphodiester bonds between nucleotide subunits of a nucleic acid is used to remove unhybridized portions of the probe. Such enzymes may include, without limitation, nucleases (e.g., DNAase I, RNAse I), endonucleases (e.g., Mung bean nuclease, S1 nuclease, and the like), restriction nucleases, exonucleases (e.g., exonuclease I, exonuclease III, exonuclease T, exonuclease T7, lambda exonuclease, and the like), phosphodiesterases (e.g., phosphodiesterase II, calf spleen phosphodiesterase, snake venom phosphodiesterase, and the like), deoxyribonucleases (DNAse), ribonucleases (RNase), endonucleases flap, 5' nucleases, 3' nucleases, 3'-5' exonucleases, 5'-3' exonucleases and the like, or combinations thereof. Trimmed probes are generally the same or substantially the same length as the fragment with which they hybridize. Thus, determining the length of a trimmed probe here can provide a measure of the length of the corresponding nucleic acid fragment. Length of the trimmed probe can be measured using any of the methods known in the art or described herein for determining nucleic acid fragment length. In some embodiments, the probes may contain a detectable molecule or entity to facilitate detection and/or length determination (e.g., a fluorophore, radioisotope, colorimetric agent, particle, enzymes, and the like). Trimmed probe length can be evaluated with or without separating products from unhybridized portions after they are removed.

[149]Em algumas modalidades, sondas aparadas são dissociadas (isto é, separadas) dos seus fragmentos de ácido nucleico correspondentes. As sondas podem ser separadas dos seus fragmentos de ácido nucleico correspondentes usando qualquer método conhecido na técnica, incluindo, mas não limitado à desnaturação pelo calor. Sondas aparadas podem ser distinguidas dos fragmentos de ácido nucleico correspondentes por um método conhecido na técnica ou aqui descrito para marcação e/ou o isolamento de uma espécie de molécula em uma mistura. Por exemplo, uma sonda e/ou fragmento de ácido nucleico pode compreender uma propriedade detectável de tal modo que uma sonda é distinguível do ácido nucleico com o qual ela hibridiza. Exemplos não limitativos de propriedades detectáveis incluem propriedades óticas, propriedades elétricas, propriedades magnéticas, propriedades químicas, e tempo e/ou velocidade através de uma abertura de tamanho conhecido. Em algumas modalidades, as sondas e os fragmentos de ácido nucleico da amostra são fisicamente separados uns dos outros. A separação pode ser obtida, por exemplo, usando ligantes de captura, tal como biotina ou outros ligantes de afinidade, e agentes de captura, tais como avidina, estreptavidina, um anticorpo, ou um receptor. Uma sonda ou fragmento de ácido nucleico pode conter um ligante de captura tendo atividade de ligação específica a um agente de captura. Por exemplo, fragmentos de uma amostra de ácido nucleico podem ser biotinilados ou ligados a um ligante de afinidade usando métodos bem conhecidos na técnica e separados longe das sondas usando um ensaio de pulldown com grânulos revestidos com estreptavidina, por exemplo. Em algumas modalidades, um ligante de captura e um agente de captura ou de qualquer outra porção (por exemplo, marcação de massa) podem ser usados para adicionar massa aos fragmentos de ácido nucleico de tal forma que eles podem ser excluídos da faixa de massa das sondas detectadas em um espectrômetro de massa. Em algumas modalidades, a massa é adicionada às sondas por meio dos próprios monômeros e/ou adição de um marcador de massa, para mudar a faixa de massa para longe da faixa massa para os fragmentos de ácido nucleico.[149] In some embodiments, trimmed probes are dissociated (i.e., separated) from their corresponding nucleic acid fragments. Probes can be separated from their corresponding nucleic acid fragments using any method known in the art, including, but not limited to, heat denaturation. Trimmed probes can be distinguished from corresponding nucleic acid fragments by a method known in the art or described herein for labeling and/or isolating a species of molecule in a mixture. For example, a probe and/or nucleic acid fragment can comprise a detectable property such that a probe is distinguishable from the nucleic acid to which it hybridizes. Non-limiting examples of detectable properties include optical properties, electrical properties, magnetic properties, chemical properties, and time and/or velocity through an aperture of known size. In some embodiments, probes and nucleic acid fragments from the sample are physically separated from each other. Separation can be achieved, for example, using capture ligands, such as biotin or other affinity ligands, and capture agents, such as avidin, streptavidin, an antibody, or a receptor. A probe or nucleic acid fragment may contain a capture ligand having specific binding activity to a capture agent. For example, fragments of a nucleic acid sample can be biotinylated or linked to an affinity ligand using methods well known in the art and separated away from the probes using a pulldown assay with streptavidin coated beads, for example. In some embodiments, a capture ligand and a capture agent or some other moiety (e.g., mass labeling) can be used to add mass to the nucleic acid fragments such that they can be excluded from the mass range of the probes detected in a mass spectrometer. In some embodiments, mass is added to the probes via the monomers themselves and/or addition of a mass marker to shift the mass range away from the mass range for the nucleic acid fragments.

Biblioteca de ácido nucleiconucleic acid library

[150]Em algumas modalidades uma biblioteca de ácido nucleico é uma pluralidade de moléculas de polinucleotídeo (por exemplo, uma amostra de ácido nucleico) que são preparadas, reunidas e/ou modificadas por um processo específico, exemplos não limitativos dos quais incluem a imobilização em uma fase sólida (por exemplo, um suporte sólido, por exemplo, uma célula de fluxo, um grânulo), enriquecimento, amplificação, clonagem, detecção e/ou para sequenciamento de ácido nucleico. Em certas modalidades, uma biblioteca de ácido nucleico é preparada antes ou durante um processo de sequenciamento. Uma biblioteca de ácido nucleico (por exemplo, biblioteca de sequenciamento) pode ser preparada por um método adequado como é conhecido na técnica. Uma biblioteca de ácido nucleico pode ser preparada por um processo de preparação alvo ou não alvo.[150] In some embodiments, a nucleic acid library is a plurality of polynucleotide molecules (e.g., a nucleic acid sample) that are prepared, assembled, and/or modified by a specific process, non-limiting examples of which include immobilization on a solid phase (e.g., a solid support, e.g., a flow cell, a bead), enrichment, amplification, cloning, detection, and/or for nucleic acid sequencing. In certain embodiments, a nucleic acid library is prepared prior to or during a sequencing process. A nucleic acid library (e.g. sequencing library) can be prepared by a suitable method as is known in the art. A nucleic acid library can be prepared by a targeting or non-targeting preparation process.

[151]Em algumas modalidades uma biblioteca de ácidos nucleicos pode ser modificada para compreender uma porção química (por exemplo, um grupo funcional) configurada para a imobilização dos ácidos nucleicos em um suporte sólido. Em algumas modalidades uma biblioteca de ácidos nucleicos pode ser modificada para compreender uma biomolécula (por exemplo, um grupo funcional) e/ou um membro de um par de ligações configurado para imobilização da biblioteca em um suporte sólido, exemplos não limitativos dos quais incluem globulina de ligação a tiroxina, proteínas de ligação a esteróides, anticorpos, antígenos, haptenos, enzimas, lecitinas, ácidos nucleicos, repressores, proteína A, proteína G, avidina, estreptavidina, biotina, componente do complemento C1q, proteínas de ligação a ácido nucleico, receptores, carboidratos, oligonucleotídeos, polinucleotídeos, sequências de ácido nucleico complementar, e semelhante e suas combinações. Alguns exemplos de pares de ligação específicos incluem, sem limitação: uma porção de avidina e uma porção de biotina; um epítopo antigénico e um anticorpo ou um fragmento imunologicamente reativo do mesmo; um anticorpo e um hapteno; uma porção de digoxigen e um anticorpo anti- digoxigen; uma porção de fluoresceína e um anticorpo anti- fluoresceina; um operador e um repressor; uma nuclease e um nucleotídeo; uma lecitina e um polissacarídeo; um esteróide e uma proteína de ligação ao esteróide; um composto ativo e um receptor de composto ativo; um hormônio e um receptor hormonal; uma enzima e um substrato; uma imunoglobulina e a proteína A; um oligonucleotídeo ou polinucleotídeo e seu complemento correspondente; o semelhante ou combinações dos mesmos.[151] In some embodiments, a nucleic acid library can be modified to comprise a chemical moiety (e.g., a functional group) configured for immobilization of the nucleic acids on a solid support. In some embodiments, a nucleic acid library can be modified to comprise a biomolecule (e.g., a functional group) and/or a linkage pair member configured to immobilize the library on a solid support, non-limiting examples of which include globulin thyroxine binding proteins, steroid binding proteins, antibodies, antigens, haptens, enzymes, lecithins, nucleic acids, repressors, protein A, protein G, avidin, streptavidin, biotin, complement component C1q, nucleic acid binding proteins, receptors, carbohydrates, oligonucleotides, polynucleotides, complementary nucleic acid sequences, and the like, and combinations thereof. Some examples of specific binding pairs include, without limitation: an avidin moiety and a biotin moiety; an antigenic epitope and an antibody or immunologically reactive fragment thereof; an antibody and a hapten; a portion of digoxygen and an anti-digoxigen antibody; a fluorescein moiety and an anti-fluorescein antibody; an operator and a repressor; a nuclease and a nucleotide; a lecithin and a polysaccharide; a steroid and a steroid binding protein; an active compound and an active compound receptor; a hormone and a hormone receptor; an enzyme and a substrate; an immunoglobulin and protein A; an oligonucleotide or polynucleotide and its corresponding complement; the like or combinations thereof.

[152]Em algumas modalidades uma biblioteca de ácidos nucleicos pode ser modificada para compreender um ou mais polinucleotídeos da composição conhecida, exemplos não limitativos dos quais incluem um identificador (por exemplo, uma marca, uma marca de indexação), uma sequência de captura, uma marca, um adaptador, um sítio de restrição da enzima, um promotor, um intensificador, uma origem de replicação, uma haste em LASSO, uma sequência complementar (por exemplo, um sítio de ligação do iniciador, um sítio de recozimento), um sítio de integração adequado (por exemplo, um transposon, um sítio de integração viral), um nucleotídeo modificado, o semelhante ou suas combinações. Os polinucleotídeos de sequência conhecida podem ser adicionados em uma posição adequada, por exemplo, na extremidade 5', na extremidade 3' ou dentro de uma sequência de ácido nucleico. Os polinucleotídeos de sequência conhecida podem ser as mesmas ou diferentes sequências. Em algumas modalidades um polinucleotídeo de sequência conhecida é configurado para hibridizar com um ou mais oligonucleotídeos imobilizados sobre uma superfície (por exemplo, uma superfície em célula de fluxo). Por exemplo, uma molécula de ácido nucleico compreendendo uma sequência 5' conhecida pode hibridizar com uma primeira pluralidade de oligonucleotídeos enquanto a sequência 3' conhecida pode hibridizar com uma segunda pluralidade de oligonucleotídeos. Em algumas modalidades uma biblioteca de ácido nucleico pode compreender marcações específicas no cromossomo, sequências de captura, marcações e/ou adaptadores. Em algumas modalidades uma biblioteca de ácidos nucleicos compreende uma ou mais marcações detectáveis. Em algumas modalidades uma ou mais marcações detectáveis podem ser incorporadas em uma biblioteca de ácido nucleico em uma extremidade 5', em uma extremidade 3', e/ou em qualquer posição do nucleotídeo em um ácido nucleico na biblioteca. Em algumas modalidades uma biblioteca de ácidos nucleicos compreende oligonucleotídeos hibridizados. Em certas modalidades oligonucleotídeos hibridizados são sondas marcadas. Em algumas modalidades uma biblioteca de ácidos nucleicos compreende as sondas de oligonucleotídeo hibridizado antes da imobilização em uma fase sólida.[152] In some embodiments a nucleic acid library can be modified to comprise one or more polynucleotides of known composition, non-limiting examples of which include an identifier (e.g., a tag, an index tag), a capture sequence, a tag, an adapter, an enzyme restriction site, a promoter, an enhancer, an origin of replication, a stem in LASSO, a complementary sequence (e.g., a primer binding site, an annealing site), a suitable integration site (eg, a transposon, a viral integration site), a modified nucleotide, the like, or combinations thereof. Polynucleotides of known sequence can be added at a suitable position, for example at the 5' end, at the 3' end or within a nucleic acid sequence. Polynucleotides of known sequence may be the same or different sequences. In some embodiments a polynucleotide of known sequence is configured to hybridize to one or more oligonucleotides immobilized on a surface (e.g., a flow cell surface). For example, a nucleic acid molecule comprising a known 5' sequence can hybridize to a first plurality of oligonucleotides while the known 3' sequence can hybridize to a second plurality of oligonucleotides. In some embodiments a nucleic acid library may comprise chromosome-specific tags, capture sequences, tags, and/or adapters. In some embodiments a nucleic acid library comprises one or more detectable tags. In some embodiments, one or more detectable tags can be incorporated into a nucleic acid library at a 5' end, at a 3' end, and/or at any nucleotide position in a nucleic acid in the library. In some embodiments a nucleic acid library comprises hybridized oligonucleotides. In certain embodiments hybridized oligonucleotides are labeled probes. In some embodiments a nucleic acid library comprises the oligonucleotide probes hybridized prior to immobilization on a solid phase.

[153]Em algumas modalidades um polinucleotídeo de sequência conhecida compreende uma sequência universal. Uma sequência universal é uma sequência de ácido nucleotídeo específico que é integrada em duas ou mais moléculas de ácido nucleico ou dois ou mais subconjuntos de moléculas de ácido nucleico em que a sequência universal é a mesmo para todos os subconjuntos de moléculas ou moléculas em que ele é integrado. Uma sequência universal é frequentemente projetada para hibridizar e/ou amplificar uma pluralidade de sequências diferentes, usando um único iniciador universal, que é complementar a uma sequência universal. Em algumas modalidades duas (por exemplo, um par) ou mais sequências universais e/ou iniciadores universais são usados. Um iniciador universal compreende frequentemente uma sequência universal. Em algumas modalidades adaptadores (por exemplo, adaptadores universais) compreendem sequências universais. Em algumas modalidades uma ou mais sequências universais são utilizadas para capturar, identificar e/ou detectar várias espécies ou subconjuntos de ácidos nucleicos.[153] In some embodiments a polynucleotide of known sequence comprises a universal sequence. A universal sequence is a specific nucleotide acid sequence that is integrated into two or more nucleic acid molecules or two or more subsets of nucleic acid molecules where the universal sequence is the same for all subsets of molecules or molecules in which it is integrated. A universal sequence is often designed to hybridize and/or amplify a plurality of different sequences using a single universal primer, which is complementary to a universal sequence. In some embodiments two (e.g., a pair) or more universal sequences and/or universal primers are used. A universal primer often comprises a universal sequence. In some embodiments, adapters (e.g., universal adapters) comprise universal sequences. In some embodiments one or more universal sequences are used to capture, identify and/or detect multiple species or subsets of nucleic acids.

[154]Em certas modalidades da preparação de uma biblioteca de ácido nucleico, (por exemplo, em certo sequenciamento por procedimentos de síntese), os ácidos nucleicos são de tamanhos selecionados e/ou fragmentados em comprimentos de várias centenas de pares de bases, ou menos (por exemplo, na preparação para a produção de biblioteca). Em algumas modalidades, a preparação da biblioteca é realizada sem a fragmentação (por exemplo, quando se utiliza ccfDNA).[154] In certain embodiments of preparing a nucleic acid library, (e.g., in certain sequencing synthetic procedures), the nucleic acids are of selected sizes and/or fragmented into lengths of several hundred base pairs, or least (for example, in preparation for library production). In some embodiments, library preparation is performed without fragmentation (e.g., when using ccfDNA).

[155]Em certas modalidades, um método de preparação da biblioteca baseada na ligação é usado (por exemplo, ILLUMINA TRUSEQ, Illumina, San Diego CA). Métodos de preparação da biblioteca baseada na ligação frequentemente fazem uso de um projeto de adaptador (por exemplo, um adaptador metilado) que pode incorporar uma sequência de índice na etapa de ligação inicial e frequentemente pode ser usado para preparar amostras para sequenciamento legível única, sequenciamento da extremidade final e sequenciamento multiplexada. Por exemplo, por vezes, ácidos nucleicos (por exemplo, ácidos nucleicos fragmentados ou ccfDNA) são reparados na extremidade através de uma reação de preenchimento, uma reação de exonuclease ou uma combinação das mesmas. Em algumas modalidades o ácido nucleico reparado de extremidade cega resultante pode então ser estendido por um único nucleotídeo, que é complementar a uma única saliência do nucleotídeo na extremidade 3' de um adaptador/iniciador. Qualquer nucleotídeo pode ser usado para estender/prender nucleotídeos. Em algumas modalidades a preparação da biblioteca de ácido nucleico compreende a ligação de um oligonucleotídeo do adaptador. Oligonucleotídeos do adaptador são normalmente complementares às âncoras da célula de fluxo, e por vezes, são usados para imobilizar uma biblioteca de ácido nucleico a um suporte sólido, tal como a superfície interna de uma célula de fluxo, por exemplo. Em algumas modalidades, um oligonucleotídeo do adaptador compreende um identificador, um ou mais sítios de hibridização do iniciador de sequenciamento (por exemplo, sequências complementares para iniciadores de sequenciamento universal, iniciadores de sequenciamento de extremidade única, iniciadores de sequenciamento de extremidade emparelhado, iniciadores de sequenciamento multiplexados, e semelhante) ou suas combinações (por exemplo, adaptador/sequenciamento, adaptador/identificador, adaptador/identificador/ sequenciamento).[155] In certain embodiments, a linkage-based library preparation method is used (eg, ILLUMINA TRUSEQ, Illumina, San Diego CA). Ligation-based library preparation methods often make use of an adapter design (e.g., a methylated adapter) that can incorporate an index sequence in the initial ligation step and often can be used to prepare samples for single-readable sequencing, sequencing trailing edge and multiplexed sequencing. For example, nucleic acids (eg, fragmented nucleic acids or ccfDNA) are sometimes repaired at the end by a fill-in reaction, an exonuclease reaction, or a combination thereof. In some embodiments, the resulting blunt-ended repaired nucleic acid can then be extended by a single nucleotide, which is complementary to a single nucleotide overhang at the 3' end of an adapter/primer. Any nucleotide can be used to extend/trap nucleotides. In some embodiments, preparing the nucleic acid library comprises ligating an adapter oligonucleotide. Adapter oligonucleotides are usually complementary to flow cell anchors, and are sometimes used to immobilize a nucleic acid library to a solid support, such as the inner surface of a flow cell, for example. In some embodiments, an adapter oligonucleotide comprises an identifier, one or more sequencing primer hybridization sites (e.g., complementary sequences for universal sequencing primers, single-ended sequencing primers, paired-end sequencing primers, multiplexed sequencing, and the like) or combinations thereof (e.g., adapter/sequencing, adapter/tag, adapter/tag/sequencing).

[156]Um identificador pode ser uma marca detectável adequada incorporada no ou ligada a um ácido nucleico (por exemplo, um polinucleotídeo) que permite a detecção e/ou identificação de ácidos nucleicos que constituem o identificador. Em algumas modalidades um identificador é incorporado em ou ligado a um ácido nucleico durante um método de sequenciamento (por exemplo, por uma polimerase). Exemplos não limitativos de identificadores incluem marcas de ácido nucleico, índices ou códigos de barras de ácido nucleico, uma marca radioativa (por exemplo, um isótopo), marca metálica, uma marca fluorescente, uma marca quimioluminescente, uma marca fosforescente, um supressor de fluoróforo, um corante, uma proteína (por exemplo, uma enzima, um anticorpo ou parte dele, um ligante, um membro de um par de ligações), o semelhante ou combinações dos mesmos. Em algumas modalidades de um identificador (por exemplo, um índice ou código de barras de ácido nucleico) é uma sequência única, conhecida e/ou identificável de análogos de nucleotídeos ou nucleotídeos. Em algumas modalidades identificadores são seis ou mais nucleotídeos contíguos. Uma grande variedade de fluoróforos está disponível com uma variedade de espectros de emissão e excitação diferentes. Qualquer tipo e/ou número de fluoróforos adequados pode ser usado como um identificador. Em algumas modalidades 1 ou mais, 2 ou mais, 3 ou mais, 4 ou mais, 5 ou mais, 6 ou mais, 7 ou mais, 8 ou mais, 9 ou mais, 10 ou mais, 20 ou mais, 30 ou mais, ou 50 ou mais identificadores diferentes são usados em um método aqui descrito (por exemplo, um método de detecção e/ou sequenciamento de ácido nucleico). Em algumas modalidades, um ou dois tipos de identificadores (por exemplo, marcas fluorescentes) são ligados a cada ácido nucleico em uma biblioteca. Detecção e/ou quantificação de um identificador pode ser realizada por um método, aparelho ou máquina adequado, exemplos não limitativos dos quais incluem a citometria de fluxo, reação de cadeia polimerase quantitativa (qPCR), eletroforese em gel, um luminômetro, um fluorímetro, um espectrofotômetro, um chip de gene adequado ou análise de microarranjo, Western blot, espectrometria de massa, cromatografia, análise de citometria de fluxo, microscopia de fluorescência, um método de formação de imagem digital ou fluorescência adequado, microscopia de varredura a laser confocal, citometria de varredura a laser, cromatografia de afinidade, separação manual em modo de batelada, suspensão do campo elétrico, um método de sequenciamento de ácido nucleico e/ou aparelho de sequenciamento de ácido nucleico adequados, o semelhante e suas combinações.[156] An identifier may be a suitable detectable tag incorporated into or attached to a nucleic acid (e.g., a polynucleotide) that allows detection and/or identification of nucleic acids that make up the identifier. In some embodiments, a tag is incorporated into or linked to a nucleic acid during a sequencing method (e.g., by a polymerase). Non-limiting examples of identifiers include nucleic acid tags, nucleic acid indices or barcodes, a radioactive tag (e.g., an isotope), metallic tag, a fluorescent tag, a chemiluminescent tag, a phosphorescent tag, a fluorophore quencher , a dye, a protein (e.g., an enzyme, an antibody or part thereof, a linker, a member of a bond pair), the like, or combinations thereof. In some embodiments, an identifier (e.g., a nucleic acid index or barcode) is a unique, known, and/or identifiable sequence of nucleotide or nucleotide analogues. In some embodiments identifiers are six or more contiguous nucleotides. A wide variety of fluorophores are available with a variety of different emission and excitation spectra. Any suitable type and/or number of fluorophores can be used as an identifier. In some modalities 1 or more, 2 or more, 3 or more, 4 or more, 5 or more, 6 or more, 7 or more, 8 or more, 9 or more, 10 or more, 20 or more, 30 or more , or 50 or more different identifiers are used in a method described herein (e.g., a nucleic acid detection and/or sequencing method). In some embodiments, one or two types of identifiers (e.g., fluorescent tags) are attached to each nucleic acid in a library. Detection and/or quantification of a tag can be performed by a suitable method, apparatus or machine, non-limiting examples of which include flow cytometry, quantitative polymerase chain reaction (qPCR), gel electrophoresis, a luminometer, a fluorimeter, a spectrophotometer, a suitable gene chip or microarray analysis, Western blot, mass spectrometry, chromatography, flow cytometry analysis, fluorescence microscopy, a suitable fluorescence or digital imaging method, confocal laser scanning microscopy, laser scanning cytometry, affinity chromatography, manual separation in batch mode, electric field suspension, a suitable nucleic acid sequencing method and/or nucleic acid sequencing apparatus, the like, and combinations thereof.

[157]Em algumas modalidades, um método de preparação da biblioteca baseada em transposon é utilizado (por exemplo, EPICENTER NEXTERA, Epicenter, Madison, WI). Métodos baseados em transposon normalmente usam transposição in vitro para fragmentar simultaneamente e marcar DNA em uma reação de tubo individual (frequentemente permitindo a incorporação de marcas específicas da plataforma e códigos de barras opcionais), e preparar bibliotecas prontas para sequenciador.[157] In some embodiments, a transposon-based library preparation method is used (eg, EPICENTER NEXTERA, Epicenter, Madison, WI). Transposon-based methods typically use in vitro transposition to simultaneously fragment and tag DNA in a single-tube reaction (often allowing the incorporation of platform-specific tags and optional barcodes), and prepare sequencer-ready libraries.

[158]Em algumas modalidades uma biblioteca de ácido nucleico ou suas partes são amplificadas (por exemplo, amplificados por um método baseado em PCR). Em algumas modalidades um método de sequenciamento compreende a amplificação de uma biblioteca de ácido nucleico. Uma biblioteca de ácido nucleico pode ser amplificada antes ou após a imobilização em um suporte sólido (por exemplo, um suporte sólido de uma célula de fluxo). Amplificação de ácido nucleico inclui o processo de amplificação ou aumento dos números de um molde de ácido nucleico e/ou de seu complemento que estão presentes (por exemplo, uma biblioteca de ácido nucleico), através da produção de uma ou mais cópias do molde e/ou o seu complemento. A amplificação pode ser realizada por um método adequado. Uma biblioteca de ácido nucleico pode ser amplificada por um método de termociclagem ou por um método de amplificação isotérmica. Em algumas modalidades um método de amplificação por círculo rolante é usado. Em algumas modalidades a amplificação ocorre em um suporte sólido (por exemplo, dentro de uma célula de fluxo), onde uma biblioteca de ácido nucleico ou parte dela está imobilizada. Em certos métodos de sequenciamento, uma biblioteca de ácido nucleico é adicionada a uma célula de fluxo e imobilizada por hibridização em âncoras sob condições adequadas. Esse tipo de amplificação de ácido nucleico é frequentemente referido como amplificação em fase sólida. Em algumas modalidades da amplificação em fase sólida, todos ou uma porção dos produtos amplificados são sintetizados por uma extensão iniciando de um iniciador imobilizado. Reações de amplificação em fase sólida são análogas às amplificações convencionais em fase de solução, exceto que pelo menos um dos oligonucleotídeos de amplificação (por exemplo, iniciadores) é imobilizado em um suporte sólido.[158] In some embodiments a nucleic acid library or parts thereof are amplified (eg, amplified by a PCR-based method). In some embodiments a sequencing method comprises amplifying a nucleic acid library. A nucleic acid library can be amplified before or after immobilization on a solid support (eg, a solid support of a flow cell). Nucleic acid amplification includes the process of amplifying or increasing the numbers of a nucleic acid template and/or its complement that are present (e.g., a nucleic acid library), by making one or more copies of the template and /or its complement. Amplification can be performed by a suitable method. A nucleic acid library can be amplified by a thermocycling method or an isothermal amplification method. In some embodiments a rolling circle amplification method is used. In some embodiments the amplification takes place on a solid support (e.g., inside a flow cell) where a nucleic acid library or part thereof is immobilized. In certain sequencing methods, a nucleic acid library is added to a flow cell and immobilized by hybridization to anchors under appropriate conditions. This type of nucleic acid amplification is often referred to as solid phase amplification. In some embodiments of solid phase amplification, all or a portion of the amplified products are synthesized by an extension starting from an immobilized primer. Solid phase amplification reactions are analogous to conventional solution phase amplifications, except that at least one of the amplification oligonucleotides (eg, primers) is immobilized on a solid support.

[159]Em algumas modalidades amplificação em fase sólida compreende uma reação de amplificação de ácido nucleico que compreende apenas uma espécie de iniciador de oligonucleotídeo imobilizado em uma superfície. Em certas modalidades amplificação em fase sólida compreende uma pluralidade de diferentes espécies de iniciadores de oligonucleotídeo imobilizados. Em algumas modalidades amplificação em fase sólida pode compreender uma reação de amplificação de ácido nucleico compreendendo uma espécie de iniciador de oligonucleotídeo imobilizado em uma superfície sólida e uma segunda espécie de iniciador de oligonucleotídeo diferente em solução. Várias espécies diferentes de iniciadores imobilizados ou iniciadores baseados em solução podem ser usados. Exemplos não- limitativos de reações de amplificação de ácido nucleico em fase sólida incluem amplificação interfacial, amplificação em ponte, PCR em emulsão, amplificação WildFire (por exemplo, publicação da patente US US20130012399), o semelhante ou combinações dos mesmos.[159] In some embodiments solid phase amplification comprises a nucleic acid amplification reaction comprising only one species of oligonucleotide primer immobilized on a surface. In certain embodiments solid phase amplification comprises a plurality of different species of immobilized oligonucleotide primers. In some embodiments solid phase amplification may comprise a nucleic acid amplification reaction comprising one species of oligonucleotide primer immobilized on a solid surface and a second, different species of oligonucleotide primer in solution. Several different kinds of immobilized primers or solution-based primers can be used. Non-limiting examples of solid phase nucleic acid amplification reactions include interfacial amplification, bridging amplification, emulsion PCR, WildFire amplification (e.g., US patent publication US20130012399), the like, or combinations thereof.

Sequenciamentosequencing

[160]Em algumas modalidades, os ácidos nucleicos (por exemplo, fragmentos de ácido nucleico, amostra de ácido nucleico, ácido nucleico isento de célula) podem ser sequenciados. Em algumas modalidades, uma sequência completa ou substancialmente completa é obtida e, por vezes, uma sequência parcial é obtida. Em algumas modalidades, um ácido nucleico não é sequenciado, e a sequência de um ácido nucleico não é determinada por um método de sequenciamento, quando se realiza um método aqui descrito. Em algumas modalidades, o comprimento do fragmento é determinado usando um método de sequenciamento. Em algumas modalidades, o comprimento do fragmento é determinado sem uso de um método de sequenciamento. Sequenciamento, mapeamento e métodos analíticos relacionados são aqui descritos e são conhecidos na técnica (por exemplo, publicação do pedido de patente dos Estados Unidos US2009/0029377, aqui incorporado por referência). Certos aspectos de tais processos são descritos a seguir.[160] In some embodiments, nucleic acids (e.g., nucleic acid fragments, nucleic acid sample, cell-free nucleic acid) can be sequenced. In some embodiments, a complete or substantially complete sequence is obtained, and sometimes a partial sequence is obtained. In some embodiments, a nucleic acid is not sequenced, and the sequence of a nucleic acid is not determined by a sequencing method, when performing a method described herein. In some embodiments, the length of the fragment is determined using a sequencing method. In some embodiments, the length of the fragment is determined without using a sequencing method. Sequencing, mapping, and related analytical methods are described herein and are known in the art (e.g., US Patent Application Publication US2009/0029377, incorporated herein by reference). Certain aspects of such processes are described below.

[161]Em algumas modalidades, o comprimento do fragmento é determinado usando um método de sequenciamento. Em algumas modalidades, o comprimento do fragmento é determinado usando uma plataforma de sequenciamento de extremidade pareada. Tais plataformas envolvem o sequenciamento de ambas as extremidades de um fragmento de ácido nucleico. Geralmente, as sequências correspondentes a ambas extremidades do fragmento podem ser mapeadas para um genoma de referência (por exemplo, um genoma humano de referência). Em certas modalidades, ambas extremidades são sequenciadas em um comprimento legível que é suficiente para mapear, individualmente para cada extremidade do fragmento, para um genoma de referência. Exemplos de comprimentos legíveis de sequência de extremidade pareada são descritos abaixo. Em certas modalidades, a totalidade ou uma porção dos fragmentos (reads) de sequências podem ser mapeados para um genoma de referência sem incompatibilidade. Em algumas modalidades, cada fragmento (read) é mapeado independentemente. Em algumas modalidades, a informação de ambos fragmentos (reads) de sequências (isto é, de cada extremidade) é consignada no processo de mapeamento. O comprimento de um fragmento pode ser determinado, por exemplo, através do cálculo da diferença entre as coordenadas genômicas atribuídas a cada fragmento (read) de extremidade pareada.[161] In some embodiments, the length of the fragment is determined using a sequencing method. In some embodiments, fragment length is determined using a paired-end sequencing platform. Such platforms involve sequencing both ends of a nucleic acid fragment. Generally, sequences corresponding to both ends of the fragment can be mapped to a reference genome (eg, a reference human genome). In certain embodiments, both ends are sequenced to a readable length that is sufficient to map, individually for each end of the fragment, to a reference genome. Examples of readable lengths of paired-end sequence are described below. In certain embodiments, all or a portion of sequence reads can be mapped to a reference genome without mismatch. In some embodiments, each fragment (read) is mapped independently. In some embodiments, information from both reads of sequences (i.e., from each end) is factored into the mapping process. The length of a fragment can be determined, for example, by calculating the difference between the genomic coordinates assigned to each fragment (read) of paired end.

[162]Em algumas modalidades, o comprimento do fragmento pode ser determinado usando um processo de sequenciamento por meio de que uma sequência completa ou substancialmente completa de nucleotídeos é obtida para o fragmento. Tais processos de sequenciamento incluem plataformas que geram comprimentos legível relativamente longos (por exemplo, Roche 454, Ion Torrent, única molécula (Pacific Biosciences), tecnologia em tempo real SMRT, e semelhante).[162] In some embodiments, the length of the fragment may be determined using a sequencing process whereby a complete or substantially complete sequence of nucleotides is obtained for the fragment. Such sequencing processes include platforms that generate relatively long readable lengths (eg, Roche 454, Ion Torrent, single molecule (Pacific Biosciences), SMRT real-time technology, and the like).

[163]Em algumas modalidades alguns ou todos os ácidos nucleicos de uma amostra são enriquecidos e/ou amplificados (por exemplo, não-especificamente, por exemplo, por um método baseado em PCR) antes ou durante sequenciamento. Em certas modalidades porções específicas de ácido nucleico ou subconjuntos em uma amostra são enriquecidos e/ou amplificados antes ou durante sequenciamento. Em algumas modalidades, uma porção ou um subconjunto de um conjunto pré-selecionado de ácidos nucleicos é sequenciado aleatoriamente. Em algumas modalidades, os ácidos nucleicos de uma amostra não são enriquecidos e/ou amplificados antes ou durante sequenciamento.[163] In some embodiments some or all of the nucleic acids in a sample are enriched and/or amplified (eg, non-specifically, eg, by a PCR-based method) before or during sequencing. In certain embodiments, specific portions of nucleic acid or subsets in a sample are enriched and/or amplified before or during sequencing. In some embodiments, a portion or a subset of a preselected set of nucleic acids is randomly sequenced. In some embodiments, the nucleic acids in a sample are not enriched and/or amplified before or during sequencing.

[164]Como aqui usado, "fragmentos (reads)" (isto é, "um fragmento (read) ", "um fragmento (read) de sequência") são sequências de nucleotídeo curtas produzidas por qualquer processo de sequenciamento aqui descrito ou conhecido na técnica. Fragmentos (reads) podem ser gerados a partir de uma extremidade de fragmentos de ácido nucleico ("fragmentos (reads) de extremidade única"), e, por vezes, são geradas a partir de ambas as extremidades de ácidos nucleicos (por exemplo, fragmentos (reads) de extremidade pareada, fragmentos (reads) de dupla extremidade).[164]As used herein, "reads" (i.e., "a read" or "a sequence read") are short nucleotide sequences produced by any sequencing process described or known herein. in technique. Fragments (reads) can be generated from one end of nucleic acid fragments ("single-ended fragments (reads)"), and sometimes are generated from both ends of nucleic acids (e.g., fragments paired-ended reads, double-ended fragments (reads).

[165]O comprimento de um fragmento (read) de sequência é frequentemente associado com a tecnologia de sequenciamento em particular. Métodos de alto rendimento, por exemplo, fornecem fragmentos (reads) de sequências que podem variar em tamanho, de dezenas a centenas de pares de bases (pb). Sequenciamento de nanoporo, por exemplo, pode fornecer fragmentos (reads) de sequências que podem variar em tamanho, de dezenas a centenas de milhares de pares de bases. Em algumas modalidades, os fragmentos (reads) de sequências são de um comprimento médio, mediano, baixo ou absoluto de cerca de 15 pb a cerca de 900 pb longo. Em certas modalidades fragmentos (reads) de sequências são um comprimento médio, mediano, baixo ou absoluto de cerca de 1000 pb ou mais.[165]The length of a sequence read is often associated with the sequencing technology in particular. High-throughput methods, for example, provide fragments (reads) of sequences that can vary in size from tens to hundreds of base pairs (bp). Nanopore sequencing, for example, can provide fragments (reads) of sequences that can vary in size from tens to hundreds of thousands of base pairs. In some embodiments, the sequence reads are of medium, median, low, or absolute length from about 15 bp to about 900 bp long. In certain embodiments, sequence reads are an average, median, low, or absolute length of about 1000 bp or more.

[166]Em algumas modalidades o comprimento nominal, baixo, médio ou absoluto de fragmentos (reads) de uma extremidade é por vezes e cerca de 1 nucleotídeo a cerca de 500 nucleotídeos contíguos, cerca de 15 nucleotídeos contíguos a cerca de 50 nucleotídeos contíguos, cerca de 30 nucleotídeos contíguos a cerca de 40 nucleotídeos contíguos, e, por vezes, cerca de 35 nucleotídeos contíguos ou cerca de 36 nucleotídeos contíguos. Em certas modalidades, o comprimento nominal, baixo, médio ou absoluto de fragmentos (reads) de uma extremidade é de cerca de 20 a cerca de 30 bases, ou cerca de 24 a cerca de 28 bases de comprimento. Em certas modalidades o comprimento nominal, baixo, médio ou absoluto de fragmentos (reads) de uma extremidade é de cerca de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14, 15, 16, 17, 18, 19, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48 ou 49 bases em comprimento.[166] In some embodiments the nominal, low, average, or absolute length of one-ended reads is sometimes about 1 nucleotide to about 500 contiguous nucleotides, about 15 contiguous nucleotides to about 50 contiguous nucleotides, about 30 contiguous nucleotides to about 40 contiguous nucleotides, and sometimes about 35 contiguous nucleotides or about 36 contiguous nucleotides. In certain embodiments, the nominal, low, average, or absolute length of one-ended reads is from about 20 to about 30 bases, or about 24 to about 28 bases in length. In certain embodiments the nominal, low, average or absolute length of reads from one end is about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48 or 49 bases in length.

[167]Em certas modalidades, comprimento nominal, baixo, médio ou absoluto de fragmentos (reads) de extremidade pareada por vezes é de cerca de 10 nucleotídeos contíguos a cerca de 25 nucleotídeos contíguos (por exemplo, cerca de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 nucleotídeos em comprimento), cerca de 15 nucleotídeos contíguos a cerca de 20 nucleotídeos contíguos, e, por vezes, é de cerca de 17 nucleotídeos contíguos, cerca de 18 nucleotídeos contíguos, cerca de 20 nucleotídeos contíguos, cerca de 25 nucleotídeos contíguos, cerca de 36 nucleotídeos contíguos ou cerca de 45 nucleotídeos contíguos.[167] In certain embodiments, nominal, low, average, or absolute length of paired-end reads is sometimes from about 10 contiguous nucleotides to about 25 contiguous nucleotides (e.g., about 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, or 25 nucleotides in length), about 15 contiguous nucleotides to about 20 contiguous nucleotides, and sometimes is about of 17 contiguous nucleotides, about 18 contiguous nucleotides, about 20 contiguous nucleotides, about 25 contiguous nucleotides, about 36 contiguous nucleotides, or about 45 contiguous nucleotides.

[168]Fragmentos (reads) geralmente são representações de sequências de nucleotídeo em um ácido nucleico físico. Por exemplo, em um fragmento (read) que contém uma representação ATGC de uma sequência, "A" representa um nucleotídeo adenina, "T" representa um nucleotídeo timina, "G" representa um nucleotídeo guanina e "C" representa um nucleotídeo citosina, em um ácido nucleico físico. Fragmentos (reads) de sequências obtidas a partir do sangue de uma mulher grávida podem ser lidos a partir de uma mistura de ácido nucleico fetal e materna. Uma mistura de fragmentos (reads) relativamente curtos pode ser transformada por processos aqui descritos para a representação de um ácido nucleico genômico presente na mulher grávida e/ou no feto. Uma mistura de fragmentos (reads) relativamente curtos pode ser transformada em uma representação de uma variação do número de cópia (por exemplo, uma variação do número de cópia materna e/ou fetal), a variação genética ou uma aneuploidia, por exemplo. Fragmentos (reads) de uma mistura de ácido nucleico materno e fetal podem ser transformadas em uma representação de um cromossomo compósito ou seu segmento compreendendo características de um ou ambos os cromossomos materno e fetal. Em certas modalidades, "obter" fragmentos (reads) de sequências de ácido nucleico de uma amostra de um sujeito e/ou "obter" fragmentos (reads) de sequências de ácido nucleico de uma amostra biológica de uma ou mais pessoas de referência pode envolver diretamente o sequenciamento de ácido nucleico para obter a informação da sequência. Em algumas modalidades, "obter" pode envolver a receber informação sobre a sequência obtida diretamente a partir de um ácido nucleico por outro.[168]Fragments (reads) are usually representations of nucleotide sequences in a physical nucleic acid. For example, in a fragment (read) that contains an ATGC representation of a sequence, "A" represents an adenine nucleotide, "T" represents a thymine nucleotide, "G" represents a guanine nucleotide, and "C" represents a cytosine nucleotide, into a physical nucleic acid. Fragments (reads) of sequences obtained from the blood of a pregnant woman can be read from a mixture of fetal and maternal nucleic acid. A mixture of relatively short fragments (reads) can be transformed by processes described herein for representing a genomic nucleic acid present in the pregnant woman and/or fetus. A mixture of relatively short reads can be transformed into a representation of a copy number variation (for example, a maternal and/or fetal copy number variation), genetic variation, or an aneuploidy, for example. Fragments (reads) of a mixture of maternal and fetal nucleic acid can be transformed into a representation of a composite chromosome or its segment comprising features of one or both of the maternal and fetal chromosomes. In certain embodiments, "obtaining" nucleic acid sequence reads from a sample from a subject and/or "obtaining" nucleic acid sequence reads from a biological sample from one or more reference persons may involve directly sequencing nucleic acid to obtain sequence information. In some embodiments, "getting" may involve receiving sequence information obtained directly from one nucleic acid by another.

[169]Em algumas modalidades, uma fração do genoma é sequenciada, o que por vezes é expressa na quantidade do genoma coberto pelas sequências de nucleotídeo determinadas (por exemplo, cobertura menor do que 1). Quando um genoma é sequenciado com cobertura de cerca de 1 vez, cerca de 100% da sequência de nucleotídeo do genoma é representado por fragmentos (reads). Um genoma também pode ser sequenciado com redundância, em que uma região fornecida do genoma pode ser coberta por duas ou mais fragmentos (reads) ou fragmentos (reads) de sobreposição (por exemplo, cobertura maior que 1). Em algumas modalidades, o genoma é sequenciado com cobertura de cerca de 0,01 vezes a cerca de 100 vezes, cobertura de cerca de 0,2 vezes a 20 vezes, ou cobertura de cerca de 0,2 vezes a cerca de 1 vez (por exemplo, cobertura de cerca de 0,02, 0,03, 0,04, 0,05, 0,06, 0,07, 0,08, 0,09, 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90 vezes).[169] In some embodiments, a fraction of the genome is sequenced, which is sometimes expressed as the amount of genome covered by the determined nucleotide sequences (eg, coverage less than 1). When a genome is sequenced with about 1-fold coverage, about 100% of the genome's nucleotide sequence is represented by fragments (reads). A genome can also be sequenced with redundancy, where a given region of the genome can be covered by two or more fragments (reads) or overlapping fragments (reads) (eg, coverage greater than 1). In some embodiments, the genome is sequenced with about 0.01 fold to about 100 fold coverage, about 0.2 fold to about 20 fold coverage, or about 0.2 fold to about 1 fold coverage ( for example coverage of about 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, 0.1, 0.2, 0.3 , 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30 , 40, 50, 60, 70, 80, 90 times).

[170]Em algumas modalidades, a cobertura do genoma ou a cobertura da sequência é proporcional às contagens legíveis da sequência total. Por exemplo, os ensaios que geram e/ou analisam maiores quantidades de contagens legíveis de sequência são tipicamente associados com os maiores níveis de cobertura da sequência. Os ensaios que geram e/ou analisam menos quantidades de contagens legíveis de sequência são tipicamente associados com níveis menores de cobertura da sequência. Em algumas modalidades, a cobertura da sequência e/ou contagem legível de sequência pode ser reduzida sem diminuir significativamente a precisão (por exemplo, sensibilidade e/ou especificidade) de um método aqui descrito. Uma diminuição significativa na precisão pode ser uma redução na precisão de cerca de 1% a cerca de 20% em comparação com um método que não utiliza contagem legível de sequência reduzida. Por exemplo, uma diminuição significativa na precisão pode ser cerca de 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15% ou mais de redução. Em algumas modalidades, a cobertura de sequência e/ou contagem legível de sequência é reduzida em cerca de 50% ou mais. Por exemplo, a cobertura de sequência e/ou contagem legível de sequência pode ser reduzida em cerca de 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou mais. Em algumas modalidades, a cobertura da sequência e/ ou contagem legível de sequência é reduzida em cerca de 60% a cerca de 85%. Por exemplo, a cobertura de sequência e/ou contagem legível de sequência pode ser reduzida em cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72 %, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83% ou 84%. Em algumas modalidades, a cobertura da sequência e/ou contagem legível de sequência pode ser reduzida através da remoção de certos fragmentos (reads) de sequências. Em alguns casos, os fragmentos (reads) de sequências de fragmentos maiores do que um comprimento particular (por exemplo, fragmentos maiores do que cerca de 160 bases) são removidos.[170] In some embodiments, genome coverage or sequence coverage is proportional to total sequence readable counts. For example, assays that generate and/or analyze the greatest amounts of readable sequence counts are typically associated with the greatest levels of sequence coverage. Assays that generate and/or analyze fewer amounts of readable sequence counts are typically associated with lower levels of sequence coverage. In some embodiments, sequence coverage and/or sequence readable count can be reduced without significantly decreasing the precision (e.g., sensitivity and/or specificity) of a method described herein. A significant decrease in accuracy can be a reduction in accuracy from about 1% to about 20% compared to a method that does not use reduced sequence readable count. For example, a significant decrease in accuracy could be about a 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15% or more reduction. In some embodiments, sequence coverage and/or sequence read count is reduced by about 50% or more. For example, the sequence coverage and/or sequence read count can be reduced by about 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% or more. In some embodiments, sequence coverage and/or sequence read count is reduced by about 60% to about 85%. For example, the sequence coverage and/or sequence readable count can be reduced by about 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83% or 84%. In some embodiments, sequence coverage and/or sequence read count can be reduced by removing certain fragments (reads) of sequences. In some cases, fragments (reads) of fragment sequences longer than a particular length (eg, fragments longer than about 160 bases) are removed.

[171]Em algumas modalidades, um subconjunto de fragmentos (reads) é selecionado para análise e, por vezes, uma certa porção de fragmentos (reads) é removida da análise. A seleção de um subconjunto de fragmentos (reads) pode, em certos casos, enriquecer uma espécie de ácido nucleico (por exemplo, ácido nucleico fetal). Enriquecimento de fragmentos (reads) do ácido nucleico do feto, por exemplo, frequentemente aumentam a precisão do método aqui descrito (por exemplo, detecção de aneuploidia fetal). No entanto, a seleção e remoção de fragmentos (reads) de uma análise frequentemente diminuem a precisão do método aqui descrito (por exemplo, devido a um aumento da variância). Desse modo, sem ser limitado pela teoria, há geralmente um equilíbrio entre o aumento da precisão associada com enriquecimento legível fetal e diminuição da precisão associada com uma quantidade reduzida de fragmentos (reads) em métodos que compreendem a seleção e/ou remoção de fragmentos (reads) (por exemplo, de fragmentos em uma faixa de tamanho particular). Em algumas modalidades, um método compreende a seleção de um subconjunto de fragmentos (reads) enriquecido com fragmentos (reads) de ácido nucleico fetal sem diminuir significativamente a precisão do método. A ponderação desta aparente troca, foi determinada, como aqui descrito, que o uso de um subconjunto de fragmentos (reads) de sequências de nucleotídeo (por exemplo, fragmentos (reads) de fragmentos relativamente curtos), pode melhorar ou manter a precisão das análises genéticas fetais. Por exemplo, em certas modalidades, cerca de 80% ou mais de fragmentos (reads) de sequências de nucleotídeo podem ser descartados, mantendo os valores de sensibilidade e especificidade que são semelhantes aos valores para um método comparável que não descarta tais fragmentos (reads) de sequências de nucleotídeo.[171]In some embodiments, a subset of fragments (reads) is selected for analysis, and sometimes a certain portion of fragments (reads) are removed from analysis. Selection of a subset of fragments (reads) can, in certain cases, enrich a nucleic acid species (eg, fetal nucleic acid). Enrichment of fetal nucleic acid reads, for example, often increases the accuracy of the method described here (eg detection of fetal aneuploidy). However, selecting and removing fragments (reads) from an analysis often decreases the accuracy of the method described here (for example, due to an increase in variance). Thus, without being bound by theory, there is generally a balance between increased accuracy associated with fetal readable enrichment and decreased accuracy associated with a reduced amount of reads in methods comprising selecting and/or removing fragments ( reads) (for example, of fragments in a particular size range). In some embodiments, a method comprises selecting a subset of fragments (reads) enriched with fragments (reads) of fetal nucleic acid without significantly decreasing the accuracy of the method. Considering this apparent trade-off, it was determined, as described herein, that the use of a subset of reads of nucleotide sequences (e.g., reads of relatively short fragments), can improve or maintain the accuracy of analyses. fetal genetics. For example, in certain embodiments, about 80% or more of fragments (reads) of nucleotide sequences can be discarded, maintaining sensitivity and specificity values that are similar to values for a comparable method that does not discard such fragments (reads). of nucleotide sequences.

[172]Em certas modalidades, um subconjunto de fragmentos de ácido nucleico é selecionado antes do sequenciamento. Em certas modalidades, as técnicas à base de hibridização (por exemplo, usando matrizes de oligonucleotídeos) podem ser usadas para primeiro selecionar as sequências de ácido nucleico de certos cromossomos (por exemplo, cromossomos sexuais e/ou um cromossomo potencialmente com aneuploidia e outro cromossomo(s) que não está envolvido na aneuploidia testado). Em algumas modalidades, o ácido nucleico pode ser fracionado pelo tamanho (por exemplo, por eletroforese em gel, cromatografia de exclusão por tamanho ou por abordagem baseada em microfluidos) e, em certos casos, o ácido nucleico fetal pode ser enriquecido por seleção de ácido nucleico com um peso molecular menor (por exemplo, menos do que 300 pares de bases, menos do que 200 pares de bases, menos do que 150 pares de bases, menos do que 100 pares de bases). Em algumas modalidades, o ácido nucleico fetal pode ser enriquecido suprimindo ácido nucleico materno de base, tal como pela adição de formaldeído. Em algumas modalidades, uma porção ou um subconjunto de um conjunto pré-selecionado de fragmentos de ácido nucleico é sequenciado aleatoriamente. Em algumas modalidades, o ácido nucleico é amplificado antes do sequenciamento. Em algumas modalidades, uma porção ou um subconjunto do ácido nucleico é amplificado antes do sequenciamento.[172] In certain embodiments, a subset of nucleic acid fragments is selected prior to sequencing. In certain embodiments, hybridization-based techniques (e.g., using arrays of oligonucleotides) can be used to first select the nucleic acid sequences of certain chromosomes (e.g., sex chromosomes and/or a potentially aneuploidy chromosome and another chromosome (s) that is not involved in the tested aneuploidy). In some embodiments, the nucleic acid can be size-fractionated (e.g., by gel electrophoresis, size exclusion chromatography, or by a microfluidic-based approach) and, in certain cases, fetal nucleic acid can be enriched by acid selection. nucleic acid with a lower molecular weight (e.g., less than 300 base pairs, less than 200 base pairs, less than 150 base pairs, less than 100 base pairs). In some embodiments, fetal nucleic acid can be enriched by suppressing baseline maternal nucleic acid, such as by adding formaldehyde. In some embodiments, a portion or a subset of a preselected set of nucleic acid fragments is randomly sequenced. In some embodiments, the nucleic acid is amplified prior to sequencing. In some embodiments, a portion or a subset of the nucleic acid is amplified prior to sequencing.

[173]Em algumas modalidades, uma amostra de ácido nucleico de um indivíduo é sequenciada. Em certas modalidades, os ácidos nucleicos de cada uma de duas ou mais amostras são sequenciados, em que as amostras são de um indivíduo ou de diferentes indivíduos. Em certas modalidades, as amostras de ácido nucleico de duas ou mais amostras biológicas são reunidas, onde cada amostra biológica é de um indivíduo, ou dois ou mais indivíduos e o conjunto é sequenciado. Nas últimas modalidades, uma amostra de ácido nucleico de cada amostra biológica, frequentemente, é identificada por um ou mais identificadores únicos ou marcas de identificação.[173] In some embodiments, a sample of nucleic acid from an individual is sequenced. In certain embodiments, the nucleic acids from each of two or more samples are sequenced, where the samples are from one individual or different individuals. In certain embodiments, nucleic acid samples from two or more biological samples are pooled, where each biological sample is from an individual, or two or more individuals, and the pool is sequenced. In the latter embodiments, a nucleic acid sample from each biological sample is often identified by one or more unique identifiers or identification tags.

[174]Em algumas modalidades um método de sequenciamento utiliza identificadores que permitem a multiplexação de reações de sequência em um processo de sequenciamento. Quanto maior for o número de identificadores únicos, maior o número de amostras e/ou cromossomos para a detecção, por exemplo, que podem ser multiplexados em um processo de sequenciamento. Um processo de sequenciamento pode ser realizado usando qualquer número adequado de identificadores únicos (por exemplo, 4, 8, 12, 24, 48, 96, ou mais).[174] In some embodiments a sequencing method utilizes identifiers that allow the multiplexing of sequence reactions in a sequencing process. The greater the number of unique identifiers, the greater the number of samples and/or chromosomes for detection, for example, that can be multiplexed in a sequencing process. A sequencing process can be performed using any suitable number of unique identifiers (eg 4, 8, 12, 24, 48, 96, or more).

[175]Um processo de sequenciamento, por vezes, faz uso de uma fase sólida, e, por vezes, a fase sólida compreende uma célula de fluxo no qual o ácido nucleico de uma biblioteca pode ser ligado e reagentes podem ser vertidos e contatados com o ácido nucleico ligado. Uma célula de fluxo, por vezes, inclui faixas de célula de fluxo, e o uso de identificadores podem facilitar a análise de um número de amostras em cada faixa. Uma célula de fluxo é frequentemente um suporte sólido que pode ser configurado para reter e/ou permitir a passagem ordenada de soluções de reagente ao longo dos analitos ligados. As células de fluxo estão frequentemente na forma planar, oticamente transparentes, geralmente na escala milimétrica ou sub- milimétrica, e frequentemente, têm canais ou faixas em que a interação do analito/reagente ocorre. Em algumas modalidades o número de amostras analisadas em uma dada faixa de célula de fluxo é dependente do número de identificadores únicos usados durante a preparação da biblioteca e/ou projeto da sonda, faixa de célula de fluxo única. Multiplexagem usando 12 identificadores, por exemplo, permite a análise simultânea de 96 amostras (por exemplo, igual ao número de poços em uma placa de micropoço de 96 poços) em uma célula de fluxo de 8 faixas. Semelhantemente, multiplexação usando 48 identificadores, por exemplo, permite a análise simultânea de 384 amostras (por exemplo, igual ao número de poços em uma placa de micropoço de 384 poços) em uma célula de fluxo de 8 faixas. Exemplos não limitativos de kits de sequenciamento multiplex comercialmente disponíveis incluem kit de oligonucleotídeos para preparação de amostra de multiplexação de Illumina e iniciadores de sequenciamento de multiplexação e kit de controle PhiX (por exemplo, números de catálogo de Illumina PE-400-1001 e PE-400-1002, respectivamente).[175] A sequencing process sometimes makes use of a solid phase, and sometimes the solid phase comprises a flow cell into which nucleic acid from a library can be bound and reagents can be poured and contacted with the bound nucleic acid. A flow cell sometimes includes flow cell ranges, and the use of identifiers can facilitate the analysis of a number of samples in each range. A flow cell is often a solid support that can be configured to retain and/or allow orderly passage of reagent solutions along bound analytes. Flow cells are often planar in shape, optically transparent, usually in the millimeter or sub-millimeter scale, and often have channels or lanes in which the analyte/reagent interaction takes place. In some embodiments the number of samples analyzed in a given flow cell lane is dependent on the number of unique identifiers used during library preparation and/or probe design, single flow cell lane. Multiplexing using 12 tags, for example, allows simultaneous analysis of 96 samples (eg, equal to the number of wells in a 96-well microwell plate) in an 8-lane flow cell. Similarly, multiplexing using 48 tags, for example, allows simultaneous analysis of 384 samples (eg, equal to the number of wells in a 384-well microwell plate) in an 8-lane flow cell. Non-limiting examples of commercially available multiplex sequencing kits include Illumina Multiplexing Sample Preparation Oligonucleotide Kit and Multiplexing Sequencing Primers and PhiX Control Kit (e.g., Illumina catalog numbers PE-400-1001 and PE- 400-1002, respectively).

[176]Qualquer método adequado para a sequenciamento de ácidos nucleicos pode ser utilizado, exemplos não limitativos dos quais incluem Maxim e Gilbert, métodos de terminação de cadeia, sequenciamento por síntese, sequenciamento por ligação, de sequenciamento por espectrometria de massa, técnicas baseadas em microscopia, o semelhante ou combinações dos mesmos. Em algumas modalidades, uma tecnologia de primeira geração, tais como, por exemplo, métodos de sequenciamento de Sanger incluindo métodos de sequenciamento de Sanger automatizados, incluindo sequenciamento de Sanger de microfluidos, podem ser usados em um método aqui fornecido. Em algumas modalidades tecnologias de sequenciamento que incluem o uso de tecnologias de formação de imagem de ácido nucleico (por exemplo, microscopia eletrônica de transmissão (TEM) e microscopia de força atômica (AFM)), podem ser usadas. Em algumas modalidades, um método de sequenciamento de alto rendimento é usado. Métodos de sequenciamento de alto rendimento geralmente envolvem modelos de DNA amplificado por clonagem de DNA ou moléculas individuais que são sequenciados em uma forma massivamente paralela, às vezes dentro de uma célula de fluxo. Técnicas de sequenciamento de DNA de próxima geração (por exemplo, segunda e terceira geração), capazes de sequenciamento de DNA em uma forma massivamente paralela, podem ser usadas para os métodos aqui descritos e são coletivamente referidos aqui como "sequenciamento massivamente paralelo" (MPS). Em algumas modalidades métodos de sequenciamento MPS utilizam uma abordagem orientada, onde cromossomos específicos, genes ou regiões de interesse são sequências. Em certas modalidades uma abordagem não-orientada é usada onde a maioria ou todos os ácidos nucleicos em uma amostra são sequenciados, amplificados e/ou capturados aleatoriamente.[176] Any suitable method for sequencing nucleic acids may be used, non-limiting examples of which include Maxim and Gilbert, chain termination methods, sequencing by synthesis, sequencing by ligation, sequencing by mass spectrometry, techniques based on microscopy, the like or combinations thereof. In some embodiments, a first generation technology, such as, for example, Sanger sequencing methods including automated Sanger sequencing methods, including microfluidic Sanger sequencing, can be used in a method provided herein. In some embodiments sequencing technologies that include the use of nucleic acid imaging technologies (eg, transmission electron microscopy (TEM) and atomic force microscopy (AFM)), may be used. In some embodiments, a high-throughput sequencing method is used. High-throughput sequencing methods usually involve amplified DNA templates by cloning individual DNA or molecules that are sequenced in a massively parallel fashion, sometimes within a flow cell. Next generation (e.g., second and third generation) DNA sequencing techniques, capable of sequencing DNA in a massively parallel fashion, can be used for the methods described herein and are collectively referred to herein as "massively parallel sequencing" (MPS ). In some embodiments MPS sequencing methods use a targeted approach, where specific chromosomes, genes or regions of interest are sequenced. In certain embodiments a non-targeted approach is used where most or all of the nucleic acids in a sample are randomly sequenced, amplified and/or captured.

[177]Em algumas modalidades um enriquecimento orientado, amplificação e/ou sequenciamento é usado. A abordagem orientada, frequentemente, isola, seleciona e/ou enriquece um subconjunto de ácidos nucleicos em uma amostra para processamento adicional pelo uso de oligonucleotídeos específicos da sequência. Em algumas modalidades uma biblioteca de oligonucleotídeos de sequência específica é utilizada para atingir (por exemplo, para hibridizar) um ou mais conjuntos de ácidos nucleicos em uma amostra. Os oligonucleotídeos e/ou iniciadores de sequência específica são frequentemente seletivos para sequências particulares (por exemplo, sequências de ácido nucleico único) presentes em um ou mais cromossomos, genes, éxons, íntrons, e/ou regiões reguladoras de interesse. Qualquer método ou combinação de métodos adequados pode ser usado para o enriquecimento, a amplificação e/ou o sequenciamento de um ou mais subconjuntos de ácidos nucleicos alvos. Em algumas modalidades sequências alvos são isoladas e/ou enriquecidas por captura em uma fase sólida (por exemplo, uma célula de fluxo, um grânulo) usando uma ou mais âncoras de sequência específica. Em algumas modalidades sequências alvos são enriquecidas e/ou amplificadas por um método baseado em polimerase (por exemplo, um método baseado em PCR, por qualquer extensão baseada em polimerase adequada), usando iniciadores e/ou conjuntos de iniciador de sequência específica. Âncoras de sequência específica, frequentemente, podem ser usadas como iniciadores de sequência específica.[177] In some embodiments a targeted enrichment, amplification and/or sequencing is used. The guided approach often isolates, selects and/or enriches a subset of nucleic acids in a sample for further processing using sequence-specific oligonucleotides. In some embodiments, a library of sequence-specific oligonucleotides is used to target (e.g., to hybridize) one or more sets of nucleic acids in a sample. Sequence-specific oligonucleotides and/or primers are often selective for particular sequences (eg, unique nucleic acid sequences) present in one or more chromosomes, genes, exons, introns, and/or regulatory regions of interest. Any suitable method or combination of methods can be used for the enrichment, amplification and/or sequencing of one or more subsets of target nucleic acids. In some embodiments, target sequences are isolated and/or enriched by capture in a solid phase (e.g., a flow cell, a bead) using one or more sequence-specific anchors. In some embodiments, target sequences are enriched and/or amplified by a polymerase-based method (e.g., a PCR-based method, by any suitable polymerase-based extension), using sequence-specific primers and/or primer sets. Sequence-specific anchors can often be used as sequence-specific primers.

[178]Sequenciamento MPS às vezes faz uso de sequenciamento por síntese e certo processos de formação de imagem. A tecnologia de sequenciamento de ácido nucleico que pode ser usada em um método aqui descrito é o sequenciamento por síntese e sequenciamento à base de terminador reversível (por exemplo, analisador de genoma de Illumina; analisador de genoma II; HISEQ 2000; HISEQ 2500 (Illumina, San Diego, CA)). Com essa tecnologia, milhões de fragmentos de ácido nucleico (por exemplo, DNA) podem ser sequenciados em paralelo. Em um exemplo desse tipo de tecnologia de sequenciamento, uma célula de fluxo é usada que contém um slide oticamente transparente com 8 faixas individuais nas superfícies das quais estão ligadas âncoras de oligonucleotídeo (por exemplo, iniciadores de adaptador). A célula de fluxo é frequentemente um suporte sólido que pode ser configurado para reter e/ou permitir a passagem ordenada de soluções de reagente ao longo dos analitos ligados. As células de fluxo estão frequentemente na forma planar, opticamente transparentes, geralmente na escala milimétrica ou sub-milimétrica, e frequentemente, têm canais ou faixas em que a interação de analito/reagente ocorre.[178]MPS sequencing sometimes makes use of synthesis sequencing and certain imaging processes. Nucleic acid sequencing technology that may be used in a method described herein is sequencing by synthesis and reversible terminator-based sequencing (e.g., Illumina Genome Analyzer; Genome Analyzer II; HISEQ 2000; HISEQ 2500 (Illumina , San Diego, CA)). With this technology, millions of nucleic acid fragments (eg DNA) can be sequenced in parallel. In an example of this type of sequencing technology, a flow cell is used which contains an optically transparent slide with 8 individual lanes on the surfaces of which oligonucleotide anchors (eg adapter primers) are attached. The flow cell is often a solid support that can be configured to retain and/or allow the orderly passage of reagent solutions along the bound analytes. Flow cells are often planar in shape, optically transparent, usually in the millimeter or sub-millimeter scale, and often have channels or lanes in which the analyte/reagent interaction takes place.

[179]O sequenciamento por síntese, em algumas modalidades, compreende iterativamente adicionar (por exemplo, por adição covalente) um nucleotídeo a um iniciador ou fita de ácido nucleico pré-existente de uma maneira direcionada ao molde. Cada adição iterativa de um nucleotídeo é detectada e o processo é repetido várias vezes até que uma sequência de uma fita ácido nucleico é obtida. O comprimento de uma sequência obtida depende, em parte, do número de etapas de adição e de detecção que são executadas. Em algumas modalidades do sequenciamento por síntese, um, dois, três ou mais nucleotídeos do mesmo tipo (por exemplo, A, G, C ou T) são adicionados e detectados em um ciclo de adição de nucleotídeo. Os nucleotídeos podem ser adicionados por qualquer método adequado (por exemplo, enzimaticamente ou quimicamente). Por exemplo, em algumas modalidades uma polimerase ou uma ligase adiciona um nucleotídeo a um iniciador ou a uma fita de ácido nucleico pré-existente em uma maneira direcionada ao molde. Em algumas modalidades de sequenciamento por síntese, são usados diferentes tipos de nucleotídeos, análogos de nucleotídeos e/ou identificadores. Em algumas modalidades terminadores reversíveis e/ou identificadores removíveis (por exemplo, cliváveis) são usados. Em algumas modalidades nucleotídeos marcados fluorescentes e/ou análogos de nucleotídeos são usados. Em certas modalidades sequenciamento por síntese compreende uma clivagem (por exemplo, a clivagem e remoção de um identificador) e/ou uma etapa de lavagem. Em algumas modalidades a adição de um ou mais nucleotídeos é detectada por um método adequado aqui descrito ou conhecido na técnica, exemplos não limitativos dos quais incluem qualquer aparelho ou máquina de formação de imagem adequado, uma câmara adequada, uma câmara digital, um aparelho de formação de imagem baseado em CCD (Dispositivo de carga acoplada) (por exemplo, uma câmera CCD), um aparelho de formação de imagem baseado em CMOS (óxido de silício metálico complementar) (por exemplo, uma câmara CMOS), um fotodiodo (por exemplo, um tubo fotomultiplicador), microscopia eletrônica, um transistor de efeito de campo (por exemplo, um transistor de efeito de campo de DNA), um sensor de íon ISFET (por exemplo, um sensor CHEMFET), o semelhante ou combinações dos mesmos. Outros métodos de sequenciamento que podem ser usados para realizar os métodos aqui incluem PCR digital e sequenciamento por hibridização.[179]Synthetic sequencing, in some embodiments, comprises iteratively adding (e.g., by covalent addition) a nucleotide to a pre-existing primer or strand of nucleic acid in a template-directed manner. Each iterative addition of a nucleotide is detected and the process is repeated several times until a nucleic acid strand sequence is obtained. The length of a sequence obtained depends, in part, on the number of addition and detection steps that are performed. In some embodiments of synthetic sequencing, one, two, three, or more nucleotides of the same type (eg, A, G, C, or T) are added and detected in one nucleotide addition cycle. Nucleotides can be added by any suitable method (eg, enzymatically or chemically). For example, in some embodiments a polymerase or ligase adds a nucleotide to a pre-existing primer or strand of nucleic acid in a template-directed manner. In some embodiments of synthetic sequencing, different types of nucleotides, nucleotide analogues, and/or identifiers are used. In some embodiments, reversible terminators and/or removable (eg, cleavable) identifiers are used. In some embodiments fluorescent labeled nucleotides and/or nucleotide analogues are used. In certain embodiments sequencing per synthesis comprises a cleavage (e.g., the cleavage and removal of a tag) and/or a washing step. In some embodiments the addition of one or more nucleotides is detected by a suitable method described herein or known in the art, non-limiting examples of which include any suitable imaging apparatus or machine, a suitable camera, a digital camera, a charge-coupled device (CCD) based imaging apparatus (e.g. a CCD camera), a CMOS (complementary silicon metal oxide) based imaging apparatus (e.g. a CMOS camera), a photodiode (e.g. e.g., a photomultiplier tube), electron microscopy, a field-effect transistor (e.g., a DNA field-effect transistor), an ISFET ion sensor (e.g., a CHEMFET sensor), the like, or combinations thereof . Other sequencing methods that can be used to perform the methods here include digital PCR and hybridization sequencing.

[180]Outros métodos de sequenciamento que podem ser usados para realizar os métodos aqui incluem PCR digital e sequenciamento por hibridização. Reação de cadeia de polimerase digital (PCR digital ou dPCR) pode ser usada para identificar e quantificar diretamente ácidos nucleicos em uma amostra. PCR digital pode ser realizada em uma emulsão, em algumas modalidades. Por exemplo, ácidos nucleicos individuais são separados, por exemplo, em um dispositivo de câmara de microfluido, e cada ácido nucleico é individualmente amplificado por PCR. Os ácidos nucleicos que podem ser separados de tal modo que não há mais do que um ácido nucleico por poço. Em algumas modalidades, diferentes sondas podem ser usadas para distinguir diferentes alelos (por exemplo, alelos fetais e alelos maternos). Os alelos podem ser enumerados para determinar o número de cópia.[180]Other sequencing methods that can be used to perform the methods here include digital PCR and hybridization sequencing. Digital polymerase chain reaction (digital PCR or dPCR) can be used to directly identify and quantify nucleic acids in a sample. Digital PCR can be performed on an emulsion, in some embodiments. For example, individual nucleic acids are separated, for example in a microfluidic chamber device, and each nucleic acid is individually amplified by PCR. Nucleic acids that can be separated such that there is not more than one nucleic acid per well. In some embodiments, different probes can be used to distinguish different alleles (eg, fetal alleles and maternal alleles). Alleles can be enumerated to determine copy number.

[181]Em certas modalidades, o sequenciamento por hibridização pode ser usado. O método envolve o contato de uma pluralidade de sequências de polinucleotídeo com uma pluralidade de sondas de polinucleotídeo, em que cada pluralidade de sondas de polinucleotídeo pode ser opcionalmente presa a um substrato. O substrato pode ser uma superfície plana com uma matriz de sequências de nucleotídeo conhecidas, em algumas modalidades. O padrão de hibridização com a matriz pode ser usado para determinar as sequências de polinucleotídeo presentes na amostra. Em algumas modalidades, cada uma das sondas está presa a um grânulo, por exemplo, um grânulo magnético ou o semelhante. A hibridização nos grânulos pode ser identificada e usada para identificar a pluralidade de sequências de polinucleotídeo na amostra.[181] In certain embodiments, hybridization sequencing can be used. The method involves contacting a plurality of polynucleotide sequences with a plurality of polynucleotide probes, each plurality of polynucleotide probes optionally being attached to a substrate. The substrate can be a flat surface with an array of known nucleotide sequences, in some embodiments. The template hybridization pattern can be used to determine the polynucleotide sequences present in the sample. In some embodiments, each of the probes is attached to a bead, for example a magnetic bead or the like. Hybridization on the beads can be identified and used to identify the plurality of polynucleotide sequences in the sample.

[182]Em algumas modalidades, sequenciamento de nanoporo pode ser utilizado em um método aqui descrito. Sequenciamento de nanoporo é uma tecnologia de sequenciamento de uma única molécula através do qual uma única molécula de ácido nucleico (por exemplo, DNA) é sequenciada diretamente conforme ela passa através de um nanoporo.[182] In some embodiments, nanopore sequencing can be used in a method described here. Nanopore sequencing is a single molecule sequencing technology whereby a single nucleic acid molecule (eg DNA) is directly sequenced as it passes through a nanopore.

[183]Um método, sistema ou plataforma de tecnologia de MPS adequado para a realização dos métodos aqui descritos pode ser usado para obter fragmentos (reads) de sequenciamento de ácido nucleico. Exemplos não-limitativos de plataformas de MPS incluem Illumina/Solex/HiSeq (por exemplo, analisador de genoma da Illumina; analisador de genoma II; HISEQ 2000; HISEQ), SOLID, Roche/454, PACBIO e/ ou SMRT, Helicos True Single Molecule sequencing, Ion Torrent e sequenciamento à base de semicondutores Ion (por exemplo, como desenvolvido pela Life Technologies), tecnologias baseadas em analisador genético WildFire, 5500, 5500xI W e/ou 5500xI W (por exemplo, como desenvolvida e vendida pela Life Technologies, publicação da patente US n° US20130012399); sequenciamento Polony, pirossequenciamento, sequenciamento de assinatura massivamente paralelo (MPSS), sequenciamento RNA polimerase (RNAP), sistemas e métodos LaserGen, plataformas baseadas em nanoporo, matriz de transistor de efeito de campo sensível químico (CHEMFET), sequenciamento baseado em microscopia eletrônica (por exemplo, como desenvolvido pela ZS Genetics, Halcyon Molecular), sequenciamento de nanobola.[183] A method, system, or MPS technology platform suitable for carrying out the methods described herein can be used to obtain sequencing nucleic acid fragments (reads). Non-limiting examples of MPS platforms include Illumina/Solex/HiSeq (e.g., Illumina Genome Analyzer; Genome Analyzer II; HISEQ 2000; HISEQ), SOLID, Roche/454, PACBIO and/or SMRT, Helicos True Single Molecule sequencing, Ion Torrent, and Ion semiconductor-based sequencing (e.g., as developed by Life Technologies), WildFire, 5500, 5500xI W, and/or 5500xI W genetic analyzer-based technologies (e.g., as developed and sold by Life Technologies) , US Patent Publication No. US20130012399); Polony sequencing, pyrosequencing, massively parallel signature sequencing (MPSS), RNA polymerase (RNAP) sequencing, LaserGen systems and methods, nanopore-based platforms, chemical sensitive field-effect transistor array (CHEMFET), electron microscopy-based sequencing ( e.g. as developed by ZS Genetics, Halcyon Molecular), nanoball sequencing.

[184]Em algumas modalidades, o sequenciamento de cromossomo específico é realizado. Em algumas modalidades, o sequenciamento de cromossomo específico é realizado usando DANSR (análise digital de regiões selecionadas). A análise digital de regiões selecionadas permite quantificação simultânea de centenas de locais por catenação dependente de cfDNA de oligonucleotídeos de dois locais específicos via um oligonucleotídeo "de ligação" interveniente para formar um molde de PCR. Em algumas modalidades, o sequenciamento do cromossomo específico é realizado através da geração de uma biblioteca enriquecida em sequências do cromossomo específico. Em algumas modalidades, os fragmentos (reads) de sequências são obtidos apenas para um conjunto selecionado de cromossomos. Em algumas modalidades, os fragmentos (reads) de sequências são obtidos apenas para cromossomos 21, 18 e 13.[184] In some embodiments, chromosome-specific sequencing is performed. In some embodiments, chromosome-specific sequencing is performed using DANSR (Digital Selected Region Analysis). Digital analysis of selected regions allows simultaneous quantification of hundreds of sites by cfDNA-dependent catenation of oligonucleotides from two specific sites via an intervening "linker" oligonucleotide to form a PCR template. In some embodiments, chromosome-specific sequencing is accomplished by generating a library enriched for chromosome-specific sequences. In some embodiments, sequence reads are obtained only for a selected set of chromosomes. In some embodiments, sequence reads are obtained only for chromosomes 21, 18, and 13.

Fragmentos (reads) de mapeamentoMapping reads

[185]Fragmentos (reads) de sequências podem ser mapeados e o número de fragmentos (reads) de mapeamento para uma região específica de ácido nucleico (por exemplo, um cromossomo, porção ou seu segmento) é referido como contagens. Qualquer método de mapeamento adequado (por exemplo, processo, algoritmo, programa, software, módulo, o semelhante ou combinação dos mesmos) pode ser usado. Certos aspectos dos processos de mapeamento de processos são descritos a seguir.[185]Fragments (reads) of sequences can be mapped, and the number of fragments (reads) mapping to a specific region of nucleic acid (eg, a chromosome, portion, or segment thereof) is referred to as counts. Any suitable mapping method (eg process, algorithm, program, software, module, the like or combination thereof) may be used. Certain aspects of the process mapping processes are described below.

[186]Fragmentos (reads) de sequências de nucleotídeo de mapeamento (ou seja, informação sobre a sequência a partir de um fragmento cuja posição genômica física é desconhecida) podem ser realizadas em um número de maneiras, e frequentemente compreendem alinhamento dos fragmentos (reads) de sequências obtidos com uma sequência correspondente em um genoma de referência. Em tais alinhamentos, fragmentos (reads) de sequências geralmente são alinhados com uma sequência de referência e aqueles que são alinhados como sendo "mapeados", "um fragmento (read) de sequência mapeados" ou "um fragmento (read) mapeado". Em certas modalidades, um fragmento (read) de sequência mapeadas é referida como um "hit", ou "contagens". Em algumas modalidades, os fragmentos (reads) de sequências mapeados são agrupados em conjunto de acordo com vários parâmetros e atribuídas a porções particulares, que são discutidas mais detalhadamente abaixo.[186]Mapping nucleotide sequence reads (i.e., sequence information from a fragment whose physical genomic position is unknown) can be accomplished in a number of ways, and often comprise alignment of the fragments (reads). ) of sequences obtained with a corresponding sequence in a reference genome. In such alignments, sequence reads are usually aligned with a reference sequence and those that are aligned as being "mapped", "a mapped sequence read" or "a mapped read". In certain embodiments, a fragment (read) of mapped sequence is referred to as a "hit", or "counts". In some embodiments, fragments (reads) of mapped sequences are grouped together according to various parameters and assigned to particular portions, which are discussed in more detail below.

[187]Como aqui usados, os termos "alinhado", "alinhamento" ou "alinhando" referem-se a duas ou mais sequências de ácido nucleico que podem ser identificadas como uma compatibilidade (por exemplo, 100% de identidade) ou compatibilidade parcial. Alinhamentos podem ser feitos manualmente ou por um computador (por exemplo, um software, programa, módulo ou algoritmo), exemplos não-limitativos dos quais incluem o programa de computador Efficient Local Alignment of Nucleotide Data (ELAND) distribuído como parte do canalizador de análise genômica da Illumina. Alinhamento do fragmento (read) de sequência pode ser uma compatibilidade de sequência de 100%. Em alguns casos, um alinhamento é menos do que uma compatibilidade de 100% de sequência (ou seja, compatibilidade não-perfeita, compatibilidade parcial, alinhamento parcial). Em algumas modalidades um alinhamento é cerca de 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76% ou 75% de compatibilidade. Em algumas modalidades, um alinhamento compreende uma incompatibilidade. Em algumas modalidades, um alinhamento compreende 1, 2, 3, 4 ou 5 incompatibilidades. Duas ou mais sequências podem ser alinhadas usando qualquer das fitas. Em certas modalidades uma sequência de ácido nucleico é alinhada com o complemento reverso de outra sequência de ácido nucleico.[187] As used herein, the terms "aligned", "aligned" or "aligned" refer to two or more nucleic acid sequences that can be identified as a match (e.g., 100% identity) or partial match . Alignments can be done manually or by a computer (e.g., a software, program, module, or algorithm), non-limiting examples of which include the Efficient Local Alignment of Nucleotide Data (ELAND) computer program distributed as part of the analysis plumber genomics of Illumina. Sequence fragment (read) alignment can be 100% sequence compatibility. In some cases, an alignment is less than a 100% sequence match (ie, non-perfect match, partial match, partial alignment). In some embodiments an alignment is about 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 89%, 88%, 87%, 86%, 85%, 84%, 83%, 82%, 81%, 80%, 79%, 78%, 77%, 76% or 75% compatibility. In some embodiments, an alignment comprises a mismatch. In some embodiments, an alignment comprises 1, 2, 3, 4 or 5 mismatches. Two or more sequences can be aligned using either strand. In certain embodiments, a nucleic acid sequence is aligned with the reverse complement of another nucleic acid sequence.

[188]Vários métodos computacionais podem ser usados para mapear cada fragmento (read) de sequência para uma porção. Exemplos não-limitativos de algoritmos de computador que podem ser usados para alinhar sequências incluem, sem limitação, BLAST, BLITZ, FASTA, BOWTIE 1, BOWTIE 2, ELAND, MAQ, Probematch, SOAP ou SEQMAP, ou variações dos mesmos, ou suas combinações. Em algumas modalidades, os fragmentos (reads) de sequências podem ser alinhados com sequências em um genoma de referência. Em algumas modalidades, os fragmentos (reads) de sequências podem ser encontrados e/ou alinhados com sequências em bases de dados de ácido nucleico conhecidos na técnica, incluindo, por exemplo, GenBank, dbEST, dbSTS, EMBL (European Molecular Biology Laboratory) e DDBJ (DNA Databank of Japan). BLAST ou ferramentas semelhantes podem ser usados para pesquisar as sequências identificadas contra uma base de dados de sequência. Hits de pesquisa podem então ser utilizados para ordenar sequências identificadas em porções adequadas (a seguir descritas), por exemplo.[188]Various computational methods can be used to map each read from a sequence to a chunk. Non-limiting examples of computer algorithms that may be used to align sequences include, without limitation, BLAST, BLITZ, FASTA, BOWTIE 1, BOWTIE 2, ELAND, MAQ, Probematch, SOAP or SEQMAP, or variations thereof, or combinations thereof . In some embodiments, fragments (reads) of sequences can be aligned with sequences in a reference genome. In some embodiments, sequence reads can be found and/or aligned to sequences in nucleic acid databases known in the art, including, for example, GenBank, dbEST, dbSTS, EMBL (European Molecular Biology Laboratory) and DDBJ (DNA Databank of Japan). BLAST or similar tools can be used to search the identified sequences against a sequence database. Search hits can then be used to order identified sequences into suitable portions (described below), for example.

[189]Em algumas modalidades, um fragmento (read) pode exclusivamente ou não exclusivamente mapear porções em um genoma de referência. Um fragmento (read) é considerado como "exclusivamente mapeado" se ele alinha com uma única sequência no genoma de referência. O fragmento (read) é considerado como "não exclusivamente mapeado" se ele alinha com duas ou mais sequências no genoma de referência. Em algumas modalidades, fragmentos (reads) não exclusivamente mapeados são eliminados de análises posteriores (por exemplo, quantificação). Um certo grau pequeno de incompatibilidade (0-1) pode ser permitido para contabilizar polimorfismos de um nucleotídeo que podem existir entre o genoma de referência e os fragmentos (reads) de amostras individuais sendo mapeados, em certas modalidades.[189] In some embodiments, a read may exclusively or non-exclusively map portions of a reference genome. A fragment (read) is considered to be "uniquely mapped" if it aligns with a single sequence in the reference genome. The fragment (read) is considered as "not uniquely mapped" if it aligns with two or more sequences in the reference genome. In some embodiments, fragments (reads) not exclusively mapped are eliminated from further analysis (eg, quantification). A certain small degree of mismatch (0-1) may be allowed to account for single nucleotide polymorphisms that may exist between the reference genome and the individual sample reads being mapped, in certain embodiments.

[190]Em algumas modalidades, nenhum grau de incompatibilidade é permitido para um fragmento (read) mapeado para uma sequência de referência.[190]In some embodiments, no degree of mismatch is allowed for a fragment (read) mapped to a reference sequence.

[191]Tal como aqui usado, o termo "genoma de referência" pode se referir a qualquer genoma conhecido particular, sequenciado ou caracterizado, ou parcial ou completo, de qualquer organismo ou vírus que possa ser usado para fazer referência a sequências identificadas de um sujeito. Por exemplo, um genoma de referência utilizado para seres humanos desse modo como muitos outros organismos pode ser encontrado no National Center for Biotechnology Information em www.ncbi.nlm.nih.gov. Um "genoma" refere-se à informação genética de um organismo ou vírus, expressa em sequências de ácido nucleico. Tal como aqui usado, uma sequência de referência ou genoma de referência, frequentemente, é uma sequência genômica reunida ou parcialmente reunida de um indivíduo ou vários indivíduos. Em algumas modalidades, um genoma de referência é uma sequência genômica reunida ou parcialmente reunida de um ou mais indivíduos humanos. Em algumas modalidades, um genoma de referência compreende sequências atribuídas a cromossomos.[191] As used herein, the term "reference genome" may refer to any particular known genome, sequenced or characterized, or partial or complete, of any organism or virus that can be used to reference identified sequences of a subject. For example, a reference genome used for humans as well as many other organisms can be found at the National Center for Biotechnology Information at www.ncbi.nlm.nih.gov. A "genome" refers to the genetic information of an organism or virus, expressed in nucleic acid sequences. As used herein, a reference sequence or reference genome is often a assembled or partially assembled genomic sequence from an individual or multiple individuals. In some embodiments, a reference genome is a assembled or partially assembled genomic sequence from one or more human individuals. In some embodiments, a reference genome comprises sequences assigned to chromosomes.

[192]Em certas modalidades, em que um ácido nucleico da amostra é de uma mulher grávida, uma sequência de referência, por vezes, não é do feto, a mãe do feto ou do pai do feto, e é aqui referida como uma "referência externa." Uma referência materna pode ser preparada e usada em algumas modalidades. Quando é preparada a partir de uma referência a mulher grávida ("sequência de referência materna") com base em uma referência externa, fragmentos (reads) de DNA da mulher grávida que contem substancialmente nenhum DNA fetal frequentemente são mapeadas para a sequência de referência externa e reunida. Em certas modalidades a referência externa é de DNA de um indivíduo tendo substancialmente a mesma etnia como a mulher grávida. Uma sequência de referência materna pode não cobrir completamente o DNA genômico materno (por exemplo, pode cobrir cerca de 50%, 60%, 70%, 80%, 90% ou mais do DNA genômico materno), e a referência materna não pode perfeitamente corresponder a sequência de DNA genômico materna (por exemplo, a sequência de referência materna pode incluir várias incompatibilidades).[192] In certain embodiments, where a nucleic acid in the sample is from a pregnant woman, a reference sequence sometimes is not from the fetus, the mother of the fetus, or the father of the fetus, and is referred to herein as a " external reference." A maternal reference can be prepared and used in some modalities. When prepared from a pregnant woman reference ("maternal reference sequence") based on an external reference, fragments (reads) of pregnant woman DNA that contain substantially no fetal DNA are often mapped to the external reference sequence. and gathered. In certain embodiments the external reference is DNA from an individual having substantially the same ethnicity as the pregnant woman. A maternal reference sequence may not completely cover the maternal genomic DNA (for example, it may cover about 50%, 60%, 70%, 80%, 90% or more of the maternal genomic DNA), and the maternal reference may not perfectly match the maternal genomic DNA sequence (for example, the maternal reference sequence may include multiple mismatches).

[193]Em certas modalidades, a mapeabilidade é avaliada para uma região do genoma (por exemplo, porção, a porção genômico, porção). Mapeabilidade é a capacidade para alinhar de forma inequívoca um fragmento (read) de sequência de nucleotídeo para uma porção de um genoma de referência, tipicamente até um número específico de incompatibilidades, incluindo, por exemplo, 0, 1, 2 ou mais incompatibilidades. Para uma dada região genômica, a mapeabilidade esperada pode ser estimada usando uma abordagem de janela deslizante de um comprimento pré- definido legível e a média dos valores da mapeabilidade do nível legível resultantes. Regiões genômicas contendo trechos de sequência de nucleotídeo único, por vezes, tem um alto valor de mapeabilidade.[193] In certain embodiments, mappability is evaluated for a region of the genome (eg, portion, genomic portion, portion). Mapability is the ability to unequivocally align a fragment (read) of nucleotide sequence to a portion of a reference genome, typically up to a specified number of mismatches, including, for example, 0, 1, 2 or more mismatches. For a given genomic region, the expected mappability can be estimated using a sliding window approach of a predefined readable length and the average of the resulting readable level mappability values. Genomic regions containing stretches of single nucleotide sequence sometimes have a high mappability value.

PorçõesPortions

[194]Em algumas modalidades, os fragmentos (reads) de sequências mapeados (isto é, as etiquetas de sequências) são agrupados em conjunto de acordo com vários parâmetros e atribuído a porções particulares (por exemplo, porções de uma referência genoma). Frequentemente, fragmentos (reads) de sequências mapeados individuais podem ser usados para identificar uma porção (por exemplo, a presença, ausência ou quantidade de uma porção) presente em uma amostra. Em algumas modalidades, a quantidade de uma porção é indicativa da quantidade de uma sequência maior (por exemplo, um cromossomo) na amostra. O termo "porção" pode também ser referido aqui como uma "seção genômica", "porção" (bin), "região", "partição", "porção de um genoma de referência", "porção de um cromossomo" ou "porção genômica". Em algumas modalidades uma porção é um cromossomo inteiro, um segmento de um cromossomo, um segmento de um genoma de referência, um segmento abrangendo vários cromossomos, vários segmentos de cromossomo, e/ou suas combinações. Em algumas modalidades, uma porção é pré- definida com base em parâmetros específicos (por exemplo, indicadores). Em algumas modalidades, uma porção é arbitrariamente ou não-arbitrariamente definida com base na partição de um genoma (por exemplo, particionada por tamanho, teor de GC, regiões contíguas, regiões contíguas de um tamanho arbitrariamente definido, e semelhante). Em algumas modalidades porções são escolhidas a partir de porções (bins) genômicas discretas, porções (bins) genômicas tendo sequências contínuas de comprimento pré- determinado, porção (bin) de tamanho variável, vistas baseadas em ponto de um mapa de cobertura nivelada, e/ou uma combinação dos mesmos.[194] In some embodiments, fragments (reads) of mapped sequences (ie, sequence tags) are grouped together according to various parameters and assigned to particular portions (eg, portions of a genome reference). Often, individual mapped sequence reads can be used to identify a portion (eg, the presence, absence, or amount of a portion) present in a sample. In some embodiments, the amount of a portion is indicative of the amount of a larger sequence (e.g., a chromosome) in the sample. The term "portion" may also be referred to herein as a "genomic section", "portion" (bin), "region", "partition", "portion of a reference genome", "portion of a chromosome" or "portion genomics". In some embodiments a chunk is an entire chromosome, a segment of a chromosome, a segment of a reference genome, a segment spanning multiple chromosomes, multiple chromosome segments, and/or combinations thereof. In some embodiments, a portion is predefined based on specific parameters (eg indicators). In some embodiments, a portion is arbitrarily or non-arbitrarily defined based on the partition of a genome (e.g., partitioned by size, GC content, contiguous regions, contiguous regions of an arbitrarily defined size, and the like). In some embodiments portions are chosen from discrete genomic portions (bins), genomic portions (bins) having continuous sequences of predetermined length, portion (bin) of variable size, point based views of a flattened coverage map, and /or a combination thereof.

[195]Em algumas modalidades, uma porção é delineada com base em um ou mais parâmetros que incluem, por exemplo, o comprimento ou uma característica particular ou características da sequência. As porções podem ser selecionadas, filtradas e/ou removidas a partir da consideração usando quaisquer critérios adequados conhecidos na técnica ou aqui descritos. Em algumas modalidades, uma porção baseia-se em um comprimento particular da sequência genômica. Em algumas modalidades, um método pode incluir a análise de vários fragmentos (reads) de sequências mapeados para uma pluralidade de porções. As porções podem ser aproximadamente o mesmo comprimento ou porções podem ser de diferentes comprimentos. Em algumas modalidades, as porções são de cerca de igual comprimento. Em algumas modalidades porções de diferentes comprimentos são ajustadas ou pesadas. Em algumas modalidades uma porção é cerca de 10 quilobases (kb) a cerca de 20 kb, cerca de 10 kb a cerca de 100 kb, de cerca de 20 kb a cerca de 80 kb, de cerca de 30 kb a cerca de 70 kb, de cerca de 40 kb a cerca de 60 kb. Em algumas modalidades uma porção é de cerca de 10 kb, 20 kb, 30 kb, 40 kb, 50 kb ou cerca de 60 kb em comprimento. Uma porção não está limitada as execuções contíguas da sequência. Desse modo, as porções podem ser constituídas por sequências contíguas e/ou não contíguas. Uma porção não está limitada a um único cromossomo. Em algumas modalidades, uma porção inclui a totalidade ou parte de um cromossomo ou a totalidade ou parte de dois ou mais cromossomos. Em algumas modalidades, as porções podem abranger um, dois, ou mais cromossomos inteiros. Além disso, porções podem abranger regiões articuladas ou desarticuladas de vários cromossomos.[195] In some embodiments, a portion is delineated based on one or more parameters that include, for example, length or a particular sequence characteristic or characteristics. Portions may be selected, filtered and/or removed from consideration using any suitable criteria known in the art or described herein. In some embodiments, a portion is based on a particular length of genomic sequence. In some embodiments, a method may include analyzing multiple fragments (reads) of sequences mapped to a plurality of portions. Portions can be approximately the same length or portions can be of different lengths. In some embodiments, the portions are of approximately equal length. In some embodiments portions of different lengths are adjusted or weighed. In some embodiments a portion is from about 10 kilobases (kb) to about 20 kb, from about 10 kb to about 100 kb, from about 20 kb to about 80 kb, from about 30 kb to about 70 kb , from about 40 kb to about 60 kb. In some embodiments a chunk is about 10 kb, 20 kb, 30 kb, 40 kb, 50 kb or about 60 kb in length. A portion is not limited to contiguous runs of the sequence. Thus, the portions may be comprised of contiguous and/or non-contiguous sequences. A portion is not limited to a single chromosome. In some embodiments, a portion includes all or part of one chromosome or all or part of two or more chromosomes. In some embodiments, the portions may encompass one, two, or more entire chromosomes. In addition, portions may span jointed or disjointed regions of multiple chromosomes.

[196]Em algumas modalidades, as porções podem ser segmentos particulares do cromossomo em um cromossomo de interesse, tal como, por exemplo, um cromossomo, onde uma variação genética é avaliada (por exemplo, uma aneuploidia dos cromossomos 13, 18 e/ou 21, ou um cromossomo sexual). Uma porção pode também ser um genoma patogênico (por exemplo, bactérias, fungos ou vírus) ou seu fragmento. As porções podem ser genes, fragmentos de gene, sequências reguladoras, íntrons, éxons e semelhante.[196] In some embodiments, the moieties may be particular chromosome segments on a chromosome of interest, such as, for example, a chromosome, where a genetic variation is evaluated (e.g., an aneuploidy of chromosomes 13, 18, and/or 21, or a sex chromosome). A portion may also be a pathogenic genome (for example, bacteria, fungi, or viruses) or a fragment thereof. The moieties can be genes, gene fragments, regulatory sequences, introns, exons and the like.

[197]Em algumas modalidades, um genoma (por exemplo, genoma humano) é dividida em porções com base no conteúdo de informação de regiões particulares. Em algumas modalidades, a partição de um genoma pode eliminar regiões semelhantes (por exemplo, regiões ou sequências idênticas ou homólogas) em todo o genoma e manter apenas as regiões únicas. Regiões removidas durante a partição pode estar dentro de um único cromossomo ou podem abranger vários cromossomos. Em algumas modalidades um genoma particionado é aparado para baixo e otimizado para o alinhamento mais rápido, frequentemente, permitindo focar em sequências exclusivamente identificáveis.[197] In some embodiments, a genome (eg, human genome) is divided into portions based on the information content of particular regions. In some embodiments, partitioning a genome can eliminate similar regions (e.g., identical or homologous regions or sequences) throughout the genome and keep only the unique regions. Regions removed during partition can be within a single chromosome or can span multiple chromosomes. In some embodiments a partitioned genome is trimmed down and optimized for faster alignment, often allowing focus on uniquely identifiable sequences.

[198]Em algumas modalidades, a partição pode diminuir peso de regiões semelhantes. Um processo de diminuir o peso de uma porção é discutido em maior detalhe abaixo.[198] In some embodiments, partitioning can decrease weight of similar regions. A process of decreasing the weight of a serving is discussed in more detail below.

[199]Em algumas modalidades, a partição de um genoma em regiões que transcendem os cromossomos pode ser com base no ganho de informações produzidas no contexto de classificação. Por exemplo, o conteúdo de informação pode ser quantificado usando-se um perfil de p-valor medindo o significado de locais genômicos particulares para distinguir entre grupos de indivíduos normais e anormais confirmados (por exemplo, indivíduos euplóides e com trissomia, respectivamente). Em algumas modalidades, a partição de um genoma em regiões que transcendem os cromossomos pode ser baseado em qualquer outro critério, tal como, por exemplo, a velocidade/conveniência, enquanto alinhar marcas, teor de GC (por exemplo, alto ou baixo teor de GC), uniformidade do teor de GC, outras medidas do teor de sequência (por exemplo, fração de nucleotídeos individuais, fração de pirimidinas ou purinas, fração de ácidos nucleicos naturais versus não-naturais, fração de nucleotídeos metilados e teor de CpG), estado de metilação, temperatura de fusão duplex, receptividade ao sequenciamento ou PCR, valor de incerteza atribuído a porções individuais de um genoma de referência, e/ou uma pesquisa alvo para características particulares.[199] In some embodiments, partitioning a genome into regions that transcend chromosomes may be based on gaining information produced in the context of classification. For example, information content can be quantified using a p-value profile measuring the significance of particular genomic loci to distinguish between groups of confirmed normal and abnormal individuals (eg, euploid and trisomy individuals, respectively). In some embodiments, partitioning a genome into regions that transcend chromosomes can be based on any other criteria, such as, for example, speed/convenience, while align marks, GC content (e.g., high or low GC), GC content uniformity, other measures of sequence content (eg, fraction of individual nucleotides, fraction of pyrimidines or purines, fraction of natural versus unnatural nucleic acids, fraction of methylated nucleotides, and CpG content), methylation state, duplex melting temperature, sequencing or PCR responsiveness, uncertainty value assigned to individual portions of a reference genome, and/or a targeted search for particular traits.

[200]Um "segmento" de um cromossomo é geralmente parte de um cromossomo, e tipicamente é uma parte diferente de um cromossomo do que uma porção. Um segmento de um cromossomo está, por vezes, em uma região de um cromossomo diferente daquela de uma porção, por vezes, não partilha um polinucleotídeo com uma porção, e, por vezes, inclui um polinucleotídeo que está em uma porção. Um segmento de um cromossomo frequentemente contém um maior número de nucleotídeos do que uma porção (por exemplo, um segmento, por vezes, inclui uma porção), e, por vezes, um segmento de um cromossomo contém um menor número de nucleotídeos do que uma porção de (por exemplo, um segmento está, por vezes, dentro de uma porção).[200]A "segment" of a chromosome is usually part of a chromosome, and typically is a different part of a chromosome than a portion. A segment of a chromosome is sometimes in a different region of a chromosome than a chunk, sometimes it does not share a polynucleotide with a chunk, and sometimes it includes a polynucleotide that is on a chunk. A segment of a chromosome often contains a greater number of nucleotides than a chunk (for example, a segment sometimes includes a chunk), and sometimes a segment of a chromosome contains fewer nucleotides than a chunk. portion of (e.g. a segment is sometimes within a portion).

Filtragem e/ou seleção de porçõesFiltering and/or selection of portions

[201]Porções por vezes são processadas (por exemplo, normalizadas, filtradas, selecionadas, o semelhante ou suas combinações) de acordo com uma ou mais características, parâmetros, critérios e/ou métodos aqui descritos ou conhecidos na técnica. As porções podem ser processadas por qualquer método adequado e de acordo com qualquer parâmetro adequado. Exemplos não-limitativos de características e/ou parâmetros que podem ser usados para filtrar e/ou selecionar porções incluem contagens, cobertura, mapeabilidade, variabilidade, um nível de incerteza, teor de guanina-citosina (GC), comprimento do fragmento CCF e/ou leitura do comprimento (por exemplo, uma proporção de comprimento de fragmento (FLR), uma estatística da proporção fetal (FRS)), sensibilidade DNasel, estado de metilação, acetilação, distribuição de histona, estrutura da cromatina, o semelhante ou combinações dos mesmos. As porções podem ser filtradas e/ou selecionadas de acordo com uma característica ou parâmetro adequado que se correlaciona com uma característica ou parâmetro listado ou aqui descrito. As porções podem ser filtradas e/ou selecionadas de acordo com características ou parâmetros que são específicos a uma porção (por exemplo, tal como determinado por uma única porção de acordo com várias amostras) e/ou características ou parâmetros que são específicos para uma amostra (por exemplo, tal como determinado para várias porções dentro de uma amostra). Em algumas modalidades porções são filtradas e/ou removidas de acordo com a mapeabilidade relativamente baixa, variabilidade relativamente alta, um alto nível de incerteza, comprimentos de fragmento CCF relativamente longos (por exemplo, baixo FRS, baixo FLR), percentagem relativamente alta de sequências repetitivas, alto teor de GC, baixo teor de GC, baixas contagens, zero contagens, altas contagens, semelhante, ou suas combinações. Em algumas modalidades porções (por exemplo, um subconjunto de porções) são selecionadas de acordo com o nível adequado de mapeabilidade, variabilidade, nível de incerteza, fração de sequências repetitivas, contagens, teor de GC, semelhante, ou combinação destes. Em algumas modalidades porções (por exemplo, um subconjunto de porções) são selecionadas de acordo com comprimentos relativamente curtos de fragmentos CCF (por exemplo, alto FRS, alto FRS). Contagens e/ou fragmentos (reads) mapeados para porções são por vezes tratados (por exemplo, normalizados) antes e/ou após a filtragem ou seleção de porções (por exemplo, um subconjunto de porções). Em algumas modalidades as contagens e/ou fragmentos (reads) mapeados para porções não são processados antes e/ou depois de filtrar ou selecionar porções (por exemplo, um subconjunto de porções).[201] Portions are sometimes processed (eg, normalized, filtered, selected, the like, or combinations thereof) according to one or more characteristics, parameters, criteria, and/or methods described herein or known in the art. Portions may be processed by any suitable method and according to any suitable parameters. Non-limiting examples of characteristics and/or parameters that can be used to filter and/or select portions include counts, coverage, mappability, variability, an uncertainty level, guanine-cytosine (GC) content, CCF fragment length, and/or or length reading (e.g., a fragment length ratio (FLR), a fetal ratio statistic (FRS)), DNasel sensitivity, methylation status, acetylation, histone distribution, chromatin structure, the like, or combinations of the same. Portions may be filtered and/or selected according to a suitable characteristic or parameter that correlates to a characteristic or parameter listed or described herein. Portions can be filtered and/or selected according to characteristics or parameters that are specific to a portion (e.g., as determined by a single portion according to multiple samples) and/or characteristics or parameters that are specific to a sample (eg, as determined for multiple servings within a sample). In some embodiments portions are filtered and/or removed according to relatively low mappability, relatively high variability, a high level of uncertainty, relatively long CCF fragment lengths (e.g., low FRS, low FLR), relatively high percentage of sequences repetitive, high GC, low GC, low counts, zero counts, high counts, similar, or combinations thereof. In some embodiments portions (eg, a subset of portions) are selected according to the appropriate level of mapability, variability, level of uncertainty, fraction of repetitive sequences, counts, GC content, like, or combination thereof. In some embodiments chunks (eg, a subset of chunks) are selected according to relatively short lengths of CCF fragments (eg, high FRS, high FRS). Counts and/or reads mapped to chunks are sometimes handled (eg, normalized) before and/or after filtering or selecting chunks (eg, a subset of chunks). In some embodiments, counts and/or reads mapped to chunks are not processed before and/or after filtering or selecting chunks (eg, a subset of chunks).

[202]Fragmentos (reads) de sequências de qualquer número adequado de amostras podem ser utilizadas para identificar um subconjunto de porções que satisfazem um ou vários critérios, parâmetros e/ou características aqui descritos. Fragmentos (reads) de sequências de um grupo de amostras de várias mulheres grávidas, por vezes, são usadas. Um ou mais amostras de cada uma das várias mulheres grávidas pode ser direcionada (por exemplo, 1 a cerca de 20 amostras de cada mulher grávida (por exemplo, cerca de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 ou 19 amostras)), e um número adequado de mulheres grávidas pode ser direcionado (por exemplo, cerca de 2 a cerca de 10.000 mulheres grávidas (por exemplo, cerca de 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 500, 600, 700 ,800 ,900 ,1000 ,2000 ,3000 ,4000 ,5000 ,6000, 7000, 8000, 9000 mulheres grávidas)). Em algumas modalidades, os fragmentos (reads) de sequências da mesma amostra (s) de teste da mesma mulher grávida são mapeados para porções no genoma de referência e são usados para gerar o subconjunto de porções.[202]Sequence reads from any suitable number of samples can be used to identify a subset of portions that satisfy one or more of the criteria, parameters and/or characteristics described herein. Fragments (reads) of sequences from a pool of samples from several pregnant women are sometimes used. One or more samples from each of several pregnant women may be targeted (e.g. 1 to about 20 samples from each pregnant woman (e.g. about 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, or 19 samples)), and an adequate number of pregnant women can be targeted (e.g., about 2 to about 10,000 pregnant women (e.g., about 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000 ,5000 ,6000, 7000, 8000, 9000 pregnant women)). In some embodiments, fragments (reads) of sequences from the same test sample(s) from the same pregnant woman are mapped to portions in the reference genome and are used to generate the subset of portions.

[203]Tem sido observado que os fragmentos de ácido nucleico (fragmentos CCF) isentos de célula circulante obtidos de uma mulher grávida que compreendem, geralmente, fragmentos de ácido nucleico provenientes de células fetais (isto é, fragmentos fetais) e fragmentos de ácido nucleico provenientes de células maternas (isto é, fragmentos maternos). Fragmentos (reads) de sequências derivados de fragmentos CCF provenientes de um feto são aqui referidos como " fragmentos (reads) fetais". Fragmentos (reads) de sequências derivados de fragmentos de CCF provenientes do genoma de uma mulher grávida (por exemplo, uma matriz) que carrega um feto são aqui referidos como "fragmentos (reads) maternos". Fragmentos CCF dos quais fragmentos (reads) fetais são obtidos são aqui referidos como modelos fetais e fragmentos CCF a partir dos quais fragmentos (reads) maternos são obtidos são aqui referidos como modelos maternos.[203] It has been observed that circulating cell-free nucleic acid fragments (CCF fragments) obtained from a pregnant woman generally comprise nucleic acid fragments derived from fetal cells (i.e., fetal fragments) and nucleic acid fragments from maternal cells (i.e., maternal fragments). Sequence reads derived from CCF fragments derived from a fetus are referred to herein as "fetal reads". Sequence reads derived from CCF fragments from the genome of a pregnant woman (eg, a mother) carrying a fetus are referred to herein as "maternal reads". CCF fragments from which fetal reads are obtained are referred to herein as fetal templates and CCF fragments from which maternal reads are obtained are referred to herein as maternal templates.

[204]Também tem sido observado que em fragmentos CCF, fragmentos fetais são geralmente relativamente curtos (por exemplo, cerca de 200 pares de bases de comprimento ou menos) e que os fragmentos maternos incluem tais fragmentos relativamente curtos e fragmentos relativamente mais longos. Um subconjunto de porções que são mapeadas para uma quantidade significativa de fragmentos (reads) de fragmentos relativamente curtos pode ser selecionado e/ou identificado. Sem ser limitado pela teoria, espera-se que os fragmentos (reads) mapeados para tais porções sejam enriquecidas com fragmentos (reads) fetais, o que pode melhorar a precisão de uma análise genética fetal (por exemplo, detectando a presença ou ausência de uma variação genética do feto (por exemplo, aneuploidia do cromossomo fetal (por exemplo, T21, T18 e/ou T13))).[204] It has also been observed that in CCF fragments, fetal fragments are generally relatively short (eg, about 200 base pairs in length or less) and that maternal fragments include both relatively short fragments and relatively longer fragments. A subset of portions that map to a significant amount of relatively short fragment reads can be selected and/or identified. Without being bound by theory, it is expected that the reads mapped to such portions will be enriched with fetal reads, which may improve the accuracy of a fetal genetic analysis (e.g., detecting the presence or absence of a genetic variation of the fetus (eg fetal chromosome aneuploidy (eg T21, T18 and/or T13))).

[205]Um número significativo de fragmentos (reads) frequentemente não é considerado, no entanto, quando uma análise genética fetal baseia-se em um subconjunto de fragmentos (reads). A seleção de um subconjunto de fragmentos (reads) mapeados para um subconjunto selecionado de porções, e a remoção de fragmentos (reads) em porções não-selecionadas, para uma análise genética fetal pode diminuir a precisão da análise genética, devido ao aumento da variância, por exemplo. Em algumas modalidades, cerca de 30% a cerca de 70% (por exemplo, cerca de 35%, 40%, 45%, 50%, 55%, 60%, ou 65%) de fragmentos (reads) de sequenciamento obtidos de um sujeito ou mapa de amostra são removidos da consideração sob seleção de um subconjunto de porções para uma análise genética do feto. Em certas modalidades cerca de 30% a cerca de 70% (por exemplo, cerca de 35%, 40%, 45%, 50%, 55%, 60%, ou 65%) de fragmentos (reads) de sequenciamento obtidos de um sujeito ou mapa de amostra para um subconjunto de porções utilizadas para uma análise genética fetal.[205] A significant number of reads is often overlooked, however, when a fetal genetic analysis is based on a subset of reads. The selection of a subset of fragments (reads) mapped to a selected subset of portions, and the removal of fragments (reads) in unselected portions, for a fetal genetic analysis can decrease the precision of the genetic analysis, due to the increase in variance , for example. In some embodiments, about 30% to about 70% (e.g., about 35%, 40%, 45%, 50%, 55%, 60%, or 65%) of sequencing reads obtained from a subject or sample map is removed from consideration under selection of a subset of portions for a genetic analysis of the fetus. In certain embodiments, about 30% to about 70% (e.g., about 35%, 40%, 45%, 50%, 55%, 60%, or 65%) of sequencing reads obtained from a subject or sample map to a subset of portions used for a fetal genetic analysis.

[206]Desse modo, sem ser limitado pela teoria, existe geralmente um equilíbrio entre o aumento da precisão associado com enriquecimento da leitura fetal e diminuição da precisão associada com uma diminuição da quantidade de dados legíveis (por exemplo, remoção de porções e/ou fragmentos (reads)) para uma análise genética fetal. Em algumas modalidades, um método compreende a seleção de um subconjunto de porções enriquecido para fragmentos (reads) de ácido nucleico do feto (por exemplo, fragmentos (reads) fetais) que melhora, ou não diminui significativamente, a precisão de uma análise genética do feto. A ponderação dessa aparente compensação, foi determinada, como descrito aqui, que o uso de um subconjunto de porções, para as quais são mapeadas uma quantidade significativas de fragmentos (reads) de fragmentos relativamente curtos, pode melhorar a precisão das análises genéticas fetais.[206]Thus, without being bound by theory, there is generally a balance between increased accuracy associated with fetal reading enrichment and decreased accuracy associated with a decrease in the amount of readable data (e.g., removal of portions and/or fragments (reads)) for fetal genetic analysis. In some embodiments, a method comprises selecting an enriched subset of portions for fetal nucleic acid reads (e.g., fetal reads) that improves, or does not significantly decrease, the accuracy of a genetic analysis of the fetus. fetus. Considering this apparent trade-off, it was determined, as described here, that the use of a subset of portions, to which a significant amount of fragments (reads) of relatively short fragments are mapped, can improve the accuracy of fetal genetic analyses.

[207]Em algumas modalidades um subconjunto de porções é selecionado de acordo com fragmentos (reads) de fragmentos CCF, onde os fragmentos (reads) mapeados para uma porção têm um comprimento menor do que um comprimento do fragmento selecionado. Às vezes, um subconjunto de porções é selecionado filtrando porções que não atendem a estes critérios de filtragem. Em certas modalidades, um subconjunto das porções é selecionado de acordo com a quantidade de fragmentos (reads) derivados de fragmentos CCF relativamente curtos (por exemplo, cerca de 200 pares de bases ou menos) que mapeiam uma porção. Qualquer método adequado pode ser usado para identificar e/ou selecionar porções em que uma quantidade significativa de fragmentos (reads) de fragmentos CCF com um comprimento menor do que um comprimento do fragmento selecionado (por exemplo, um comprimento do primeiro fragmento selecionado) são mapeadas. Fragmentos CCF tendo um comprimento menor do que um comprimento do fragmento selecionado frequentemente são fragmentos CCF relativamente curtos, e, por vezes, o comprimento do fragmento escolhido é de cerca de 200 pares de bases ou menos (por exemplo, fragmentos CCF que são cerca de 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, ou 80 bases de comprimento). O comprimento de um fragmento CCF pode ser determinado (por exemplo, deduzido ou inferido) mapeando dois ou mais fragmentos (reads) derivados do fragmento (por exemplo, uma ponta de extremidade pareada) para um genoma de referência. Para fragmentos (reads) de extremidade pareada derivadas de um fragmento CCF, por exemplo, fragmentos (reads) podem ser mapeados para um genoma de referência, o comprimento da sequência genômica entre os fragmentos (reads) mapeados pode ser determinado, e o total dos dois comprimentos legíveis e o comprimento da sequência genômica entre os fragmentos (reads) é igual ao comprimento do fragmento CCF.[207] In some embodiments a subset of chunks is selected according to fragments (reads) of CCF fragments, where the fragments (reads) mapped to a chunk have a length less than a length of the selected fragment. Sometimes a subset of servings is selected by filtering out servings that do not meet these filtering criteria. In certain embodiments, a subset of the portions is selected according to the amount of fragments (reads) derived from relatively short CCF fragments (e.g., about 200 base pairs or less) that map a portion. Any suitable method can be used to identify and/or select portions where a significant amount of fragments (reads) of CCF fragments with a length less than a selected fragment length (e.g. a length of the first selected fragment) are mapped . CCF fragments having a length less than a selected fragment length are often relatively short CCF fragments, and sometimes the chosen fragment length is about 200 base pairs or less (e.g., CCF fragments that are about 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, or 80 bases in length). The length of a CCF fragment can be determined (eg, deduced or inferred) by mapping two or more fragments (reads) derived from the fragment (eg, a paired end tip) to a reference genome. For end-paired reads derived from a CCF fragment, for example, reads can be mapped to a reference genome, the length of the genomic sequence between the mapped reads can be determined, and the total of the two readable lengths and the length of the genomic sequence between the fragments (reads) is equal to the length of the CCF fragment.

[208]O comprimento de um modelo de fragmento CCF, por vezes, é determinado diretamente do comprimento de um fragmento (read) derivado do fragmento (por exemplo, fragmento (read) de uma extremidade).[208]The length of a CCF fragment template is sometimes determined directly from the length of a fragment (read) derived from the fragment (eg, fragment (read) from one end).

[209]Em algumas modalidades, um subconjunto de porções, em que uma quantidade significativa de fragmentos (reads) de fragmentos CCF com um comprimento menor do que um comprimento do fragmento selecionado, é selecionado e/ou identificado de acordo se a quantidade legível mapeadas dos fragmentos CCF com um comprimento menor do que um comprimento do primeiro fragmento selecionado é maior do que a quantidade legível mapeadas de fragmentos CCF tendo um comprimento menor do que um comprimento do segundo fragmento selecionado. Em certas modalidades, um subconjunto de porções, em que uma quantidade significativa de fragmentos (reads) de fragmentos CCF tendo um comprimento menor do que um comprimento do fragmento selecionado, é selecionado e/ou identificado de acordo com se a quantidade legível mapeadas de fragmentos CCF tendo um comprimento menor do que um comprimento do primeiro fragmento selecionado de uma porção é maior do que a quantidade baixa, média ou mediana de fragmentos (reads) mapeados de fragmentos CCF tendo um comprimento menor do que um comprimento do segundo fragmento selecionado para porções analisadas. Em algumas modalidades, um subconjunto de porções, em que uma quantidade significativa de fragmentos (reads) de fragmentos de CCF tendo um comprimento menor do que um comprimento do fragmento selecionado, é selecionado e/ou identificado com base em uma proporção do comprimento do fragmento (FLR) determinada para cada porção. Uma "proporção do comprimento de fragmento" é também referida aqui como uma estatística da proporção fetal (FRS).[209] In some embodiments, a subset of chunks, in which a significant amount of fragments (reads) of CCF fragments with a length less than a selected fragment length, is selected and/or identified according to whether the readable amount mapped of CCF fragments with a length less than a length of the first selected fragment is greater than the mapped readable amount of CCF fragments having a length less than a length of the second selected fragment. In certain embodiments, a subset of chunks, wherein a significant amount of fragments (reads) of CCF fragments having a length less than a selected fragment length, is selected and/or identified according to whether the mapped readable amount of fragments CCF having a length less than a selected first fragment length of a chunk is greater than the low, medium, or median amount of mapped fragments (reads) of fragments CCF having a length less than a selected second fragment length for chunks analyzed. In some embodiments, a subset of chunks, wherein a significant amount of fragments (reads) of CCF fragments having a length less than a selected fragment length, is selected and/or identified based on a ratio of fragment length (FLR) determined for each portion. A "fragment length ratio" is also referred to herein as a fetal ratio statistic (FRS).

[210]Em certas modalidades, um FLR é determinado, em parte, de acordo com a quantidade de fragmentos (reads) mapeados para uma porção de fragmentos de CCF tendo um comprimento menor do que um comprimento do fragmento selecionado. Em algumas modalidades, um valor de FLR frequentemente uma proporção de X para Y, onde X é a quantidade de fragmentos (reads) derivados de fragmentos CCF tendo um comprimento menor do que um comprimento do primeiro fragmento selecionado, e Y é a quantidade de fragmentos (reads) derivados de fragmentos CCF tendo um comprimento menor do que um comprimento do segundo fragmento selecionado. Um comprimento do primeiro fragmento selecionado frequentemente é selecionado independentemente do comprimento de um segundo fragmento selecionado, e vice- versa, e o comprimento do segundo fragmento selecionado é tipicamente maior do que o comprimento do primeiro fragmento selecionado. Um comprimento do primeiro fragmento pode ser selecionado de cerca de 200 bases ou menos a cerca de 30 bases ou menos. Em algumas modalidades, um comprimento do primeiro fragmento escolhido é de cerca de 200, 190, 180, 170, 160, 155, 150, 145, 140, 135, 130, 125, 120, 115, 110, 105, 100, 95, 90, 85, 80, 75, 70, 65, 60, 55 ou 50 bases. Em algumas modalidades, um comprimento do primeiro fragmento escolhido é de cerca de 170 a cerca de 130 bases, e, por vezes, é de cerca de 160 a cerca de 140 bases. Em algumas modalidades, um comprimento do segundo fragmento escolhido é de cerca de 2000 bases a cerca de 200 bases. Em certas modalidades um comprimento do segundo fragmento selecionado é de cerca de 1000, 950, 800, 850, 800, 750, 700, 650, 600, 550, 500, 450, 400, 350, 300, 250 bases. Em algumas modalidades o comprimento do primeiro fragmento selecionado é de cerca de 140 a cerca de 160 bases (por exemplo, cerca de 150 bases) e o comprimento do segundo fragmento escolhido é de cerca de 500 a cerca a de 700 bases (por exemplo, cerca de 600 bases). Em algumas modalidades o comprimento do primeiro fragmento selecionado é de cerca de 150 bases de e o comprimento do segundo fragmento selecionado é de cerca de 600 bases.[210] In certain embodiments, a FLR is determined, in part, according to the amount of fragments (reads) mapped to a portion of CCF fragments having a length less than a selected fragment length. In some embodiments, a FLR value is often a ratio of X to Y, where X is the number of fragments (reads) derived from CCF fragments having a length less than a length of the first selected fragment, and Y is the number of fragments (reads) derived from CCF fragments having a length smaller than a length of the second selected fragment. A length of the first selected fragment is often selected independently of the length of a second selected fragment, and vice versa, and the length of the second selected fragment is typically greater than the length of the first selected fragment. A length of the first fragment can be selected from about 200 bases or less to about 30 bases or less. In some embodiments, a chosen first fragment length is about 200, 190, 180, 170, 160, 155, 150, 145, 140, 135, 130, 125, 120, 115, 110, 105, 100, 95, 90, 85, 80, 75, 70, 65, 60, 55 or 50 bases. In some embodiments, a chosen first fragment length is from about 170 to about 130 bases, and sometimes is from about 160 to about 140 bases. In some embodiments, a chosen second fragment length is from about 2000 bases to about 200 bases. In certain embodiments a selected second fragment length is about 1000, 950, 800, 850, 800, 750, 700, 650, 600, 550, 500, 450, 400, 350, 300, 250 bases. In some embodiments, the length of the first selected fragment is from about 140 to about 160 bases (e.g., about 150 bases) and the length of the second selected fragment is from about 500 to about 700 bases (e.g., about 600 bases). In some embodiments, the length of the first selected fragment is about 150 bases and the length of the second selected fragment is about 600 bases.

[211]Em algumas modalidades um FLR é uma média, média aritmética ou mediana de vários valores de FLR. Por exemplo, por vezes um FLR para uma dada porção é uma média, média aritmética ou mediana dos valores de FLR para (i) duas ou mais amostras de teste, (ii) dois ou mais sujeitos, ou (iii) duas ou mais amostras de teste e dois ou mais sujeitos. Em certas modalidades, uma média, média aritmética ou mediana de FLR é derivada dos valores de FLR para duas ou mais porções de um genoma, cromossomo, ou seu segmento. Em algumas modalidades, uma média, média aritmética ou mediana de FLR está associada com uma incerteza (por exemplo, desvio padrão, desvio absoluto mediano).[211]In some embodiments a FLR is an average, arithmetic mean, or median of several FLR values. For example, sometimes a FLR for a given portion is an average, arithmetic mean, or median of the FLR values for (i) two or more test samples, (ii) two or more subjects, or (iii) two or more test samples. test and two or more subjects. In certain embodiments, a mean, arithmetic mean, or median FLR is derived from the FLR values for two or more portions of a genome, chromosome, or segment thereof. In some embodiments, an FLR mean, arithmetic mean, or median is associated with an uncertainty (eg, standard deviation, median absolute deviation).

[212]Em algumas modalidades, um subconjunto de porções é selecionado e/ou identificado de acordo com um ou mais valores de FLR (por exemplo, uma comparação de um ou mais valores de FLR). Em certas modalidades um subconjunto de porções é selecionado e/ou identificado de acordo com um FLR e um limiar (por exemplo, uma comparação de um FLR e um limiar). Em certas modalidades, uma média, média aritmética ou mediana de FLR derivada de uma dada porção é comparada com uma média, média aritmética ou mediana de FLR derivada de duas ou mais porções de um genoma, cromossomo, ou seu segmento. Por exemplo, algumas vezes, uma média de um FLR para uma dada porção é comparada com um FLR mediano para uma dada porção. Em certas modalidades uma porção é selecionada e/ou identificada de acordo com uma média, média aritmética ou mediana de FLR determinada para uma porção e uma média, média aritmética ou mediana de FLR determinada para um conjunto de porções (por exemplo, porção de um genoma, cromossomo, ou seu segmento). Em algumas modalidades, um FLR médio para uma porção está abaixo de um certo limiar determinado de acordo com um FLR mediano e a porção é removida da consideração (por exemplo, em uma análise genética fetal). Em algumas modalidades, uma média, média aritmética ou mediana de FLR para uma porção está acima de um certo limiar determinado de acordo com uma média, média aritmética ou mediana de FLR para um genoma, cromossomo, ou seu segmento, e a porção é selecionada e/ou adicionada a um subconjunto de porções para consideração (por exemplo, quando a determinação da presença ou ausência de uma variação genética). Em algumas modalidades, um FLR para uma porção é igual a ou maior do que cerca de 0,15 a cerca de 0,30 (por exemplo, cerca de 0,16, 0,17, 0,18, 0,19, 0,20, 0,21, 0,21, 0,22, 0,23, 0,24, 0,25, 0,26, 0,27, 0,28, 0,29) e a porção é selecionada para consideração (por exemplo, adicionada ou incorporada em um subconjunto de porções para uma análise genética fetal). Em algumas modalidades, um FLR para uma porção é igual a ou menor do que cerca de 0,20 a cerca de 0,10 (por exemplo, cerca de 0,19, 0,18, 0,17, 0,16, 0,15, 0,14, 0,13, 0,12, 0,11) e a porção é removida da consideração (por exemplo, filtrada).[212]In some embodiments, a subset of portions is selected and/or identified according to one or more FLR values (eg, a comparison of one or more FLR values). In certain embodiments a subset of portions is selected and/or identified according to an FLR and a threshold (e.g., a comparison of a FLR and a threshold). In certain embodiments, a mean, arithmetic mean, or FLR median derived from a given portion is compared with a mean, arithmetic mean, or FLR median derived from two or more portions of a genome, chromosome, or segment thereof. For example, sometimes an average FLR for a given serving is compared to a median FLR for a given serving. In certain embodiments a portion is selected and/or identified according to a determined mean, arithmetic mean, or median FLR for a portion and a determined mean, arithmetic mean, or median FLR for a set of portions (e.g., portion of a genome, chromosome, or segment thereof). In some embodiments, an average FLR for a portion is below a certain threshold determined according to a median FLR and the portion is removed from consideration (eg, in a fetal genetic analysis). In some embodiments, a mean, arithmetic mean, or median FLR for a portion is above a certain threshold determined according to a mean, arithmetic mean, or median FLR for a genome, chromosome, or segment thereof, and the portion is selected and/or added to a subset of portions for consideration (eg, when determining the presence or absence of a genetic variation). In some embodiments, an FLR for a serving is equal to or greater than about 0.15 to about 0.30 (e.g., about 0.16, 0.17, 0.18, 0.19, 0 ,20, 0.21, 0.21, 0.22, 0.23, 0.24, 0.25, 0.26, 0.27, 0.28, 0.29) and the portion is selected for consideration (eg, added to or incorporated into a subset of portions for a fetal genetic analysis). In some embodiments, an FLR for a portion is equal to or less than about 0.20 to about 0.10 (e.g., about 0.19, 0.18, 0.17, 0.16, 0 .15, 0.14, 0.13, 0.12, 0.11) and the portion is removed from consideration (e.g. filtered).

[213]Porções em um subconjunto, por vezes, são selecionadas e/ou identificadas de acordo com, em parte, se uma quantidade significativa de fragmentos (reads) de fragmentos CCF tendo um comprimento menor do que um comprimento do fragmento selecionado são mapeadas para uma porção (por exemplo, de acordo com um FLR). Em algumas modalidades, as porções em um subconjunto podem ser selecionadas e/ou identificadas de acordo com uma ou mais características ou critérios em adição à quantidade de fragmentos (reads) de sequências mapeados de comprimentos de fragmento menores do que um comprimento do fragmento selecionado. Em algumas modalidades, um subconjunto de porções é selecionado e/ou identificado de acordo com se uma quantidade significativa de fragmentos (reads) de fragmentos CCF tendo um comprimento menor do que um comprimento do fragmento selecionado são mapeadas para uma porção (por exemplo, de acordo com um FLR) e uma ou mais outras características. Exemplos não limitativos de outras características incluem o número de éxons em, e/ou teor de CG, um genoma, cromossomo ou segmento do mesmo, e/ou uma ou mais das porções. Por conseguinte, por vezes, porções selecionadas e/ou identificadas de acordo com se uma quantidade significativa de fragmentos (reads) de fragmentos CCF tendo um comprimento menor do que um comprimento do fragmento selecionado são mapeadas para uma porção (por exemplo, de acordo com um FLR) para um subconjunto, são ainda selecionados ou removidos de acordo com o teor de GC da porção e/ou o número de éxons na porção. Em algumas modalidades, uma porção que não é selecionada ou removido da consideração (por exemplo, filtrada), se o teor de GC e/ou o número de éxons na porção não se correlacionam com um FLR para a porção.[213]Portions in a subset are sometimes selected and/or identified according, in part, to whether a significant amount of fragments (reads) of CCF fragments having a length less than a selected fragment length are mapped to a portion (e.g. according to an FLR). In some embodiments, portions in a subset may be selected and/or identified according to one or more characteristics or criteria in addition to the amount of fragments (reads) of mapped sequences of fragment lengths less than a selected fragment length. In some embodiments, a subset of chunks is selected and/or identified according to whether a significant amount of fragments (reads) of CCF fragments having a length less than a selected fragment length are mapped to a chunk (e.g., from according to an FLR) and one or more other characteristics. Non-limiting examples of other characteristics include the number of exons in, and/or CG content, a genome, chromosome or segment thereof, and/or one or more of the portions. Therefore, sometimes portions selected and/or identified according to whether a significant amount of fragments (reads) of CCF fragments having a length less than a selected fragment length are mapped to a portion (e.g., according to a FLR) to a subset, are further selected or removed according to the GC content of the portion and/or the number of exons in the portion. In some embodiments, a moiety is not selected or removed from consideration (e.g., filtered), if the GC content and/or the number of exons in the moiety do not correlate with a FLR for the moiety.

[214]Em algumas modalidades um subconjunto de porções consiste de, consiste essencialmente ou compreende porções que satisfazem um ou mais critérios particulares aqui descritos (por exemplo, porções são caracterizadas por um FLR igual ou maior do que um certo valor). Em certas modalidades porções que não satisfaçam um critério estão incluídas em um subconjunto de porções que satisfazem o critério, por exemplo, para aumentar a precisão de uma análise genética fetal. Em certas modalidades, em um subconjunto de porções que "consiste essencialmente de" porções selecionadas de acordo com um critério (por exemplo, um FLR igual a ou maior do que um certo valor), de cerca de 90% ou mais (por exemplo, cerca de 91%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais) das porções satisfazem o critério e cerca de 10% ou menos (por exemplo, cerca de 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, cerca de 1% ou menos) das porções não satisfazem o critério.[214] In some embodiments, a subset of portions consists of, essentially consists of, or comprises portions that satisfy one or more particular criteria described herein (e.g., portions are characterized by a FLR equal to or greater than a certain value). In certain embodiments, portions that do not meet a criterion are included in a subset of portions that meet the criteria, for example, to increase the accuracy of a fetal genetic analysis. In certain embodiments, in a subset of portions that "consists essentially of" portions selected according to a criterion (e.g., an FLR equal to or greater than a certain value), of about 90% or more (e.g., about 91%, 91%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more) of the servings meet the criterion, and about 10% or less (for example, about 9 %, 8%, 7%, 6%, 5%, 4%, 3%, 2%, about 1% or less) of the servings do not meet the criteria.

[215]As porções podem ser selecionadas e/ou filtradas através de qualquer método adequado. Em algumas modalidades porções são selecionadas de acordo com a inspeção visual de dados, gráficos, diagramas e/ou tabelas. Em certas modalidades porções são selecionadas e/ou filtradas (por exemplo, em parte) por um sistema ou uma máquina que compreende um ou mais microprocessadores e memória. Em algumas modalidades porções são selecionadas e/ou filtradas (por exemplo, em parte) por um meio de armazenamento legível por computador não-transitório com um programa executável armazenada no mesmo, onde o programa instrui um microprocessador a executar a seleção e/ou filtragem.[215]Portions may be selected and/or filtered by any suitable method. In some embodiments portions are selected according to visual inspection of data, graphs, diagrams and/or tables. In certain embodiments portions are selected and/or filtered (e.g., in part) by a system or a machine comprising one or more microprocessors and memory. In some embodiments portions are selected and/or filtered (e.g., in part) by a non-transient computer-readable storage medium with an executable program stored thereon, where the program instructs a microprocessor to perform the selection and/or filtering. .

[216]Um subconjunto de porções selecionado por métodos aqui descritos pode ser usado para uma análise genética fetal de diferentes maneiras. Em certas modalidades fragmentos (reads) derivados de uma amostra são usados em um processo de mapeamento usando um subconjunto pré- selecionado de porções aqui descrito, e não usando a totalidade ou a maioria das porções em um genoma de referência. Aqueles fragmentos (reads) que mapeiam o subconjunto pré-selecionado de porções frequentemente são usadas em etapas adicionais de uma análise genética fetal, e fragmentos (reads) que não mapeiam o subconjunto pré- selecionado de porções não são frequentemente usados em etapas adicionais de uma análise genética fetal (por exemplo, fragmentos (reads) que não mapeiam são removidos ou filtrados).[216] A subset of portions selected by methods described here can be used for a fetal genetic analysis in different ways. In certain embodiments, fragments (reads) derived from a sample are used in a mapping process using a preselected subset of portions described herein, and not using all or most portions in a reference genome. Those reads that map to the preselected subset of portions are often used in further steps of a fetal genetic analysis, and fragments (reads) that do not map to the preselected subset of portions are not often used in further steps of a fetal genetic analysis. fetal genetic analysis (eg, reads that do not map are removed or filtered).

[217]Em algumas modalidades fragmentos (reads) de sequências derivados de uma amostra são mapeados para a totalidade ou a maioria das porções de um genoma de referência e um subconjunto pré-selecionado de porções aqui descrito são posteriormente selecionados. Fragmentos (reads) de um subconjunto selecionado de porções frequentemente são usados em etapas adicionais de uma análise genética fetal. Nas últimas modalidades, fragmentos (reads) de porções não selecionados não são frequentemente usados em etapas posteriores de uma análise genética fetal (por exemplo, fragmentos (reads) nas porções não- selecionadas são removidas ou filtradas).[217] In some embodiments, fragments (reads) of sequences derived from a sample are mapped to all or most portions of a reference genome, and a preselected subset of portions described herein are further selected. Fragments (reads) of a selected subset of portions are often used in additional steps of a fetal genetic analysis. In the latter embodiments, reads from unselected portions are often not used in later steps of a fetal genetic analysis (eg, reads from unselected portions are removed or filtered).

Contagenscounts

[218]Fragmentos (reads) de sequências que são mapeados ou parcionados com base em uma característica ou variável selecionada podem ser quantificadas para determinar o número de fragmentos (reads) que são mapeados para uma ou mais porções (por exemplo, porção de um genoma de referência), em algumas modalidades. Em certas modalidades, a quantidade de fragmentos (reads) de sequências que são mapeados para uma porção são ligações de contagens (por exemplo, umas contagens). Frequentemente, uma contagem está associada a uma porção. Em certas modalidades contagens para duas ou mais porções (por exemplo, um conjunto de porções) são matematicamente manipuladas (por exemplo, em média, adicionada, normalizada, o semelhante ou uma combinação destes). Em algumas modalidades uma contagem é determinada de uma parte ou totalidade dos fragmentos (reads) de sequências mapeados para (isto é, associada com a) uma porção. Em certas modalidades, uma contagem é determinada de um subconjunto pré-definido de fragmentos (reads) de sequências mapeados. Subconjuntos pré-definidos de fragmentos (reads) de sequências mapeados podem ser definidos ou selecionados usando qualquer recurso ou variável adequada. Em algumas modalidades, subconjuntos pré-definidos de fragmentos (reads) de sequências mapeados podem incluir de 1 a n fragmentos (reads) de sequências, em que n representa um número igual à soma de todas os fragmentos (reads) de sequências gerados de um sujeito de teste ou amostra de do sujeito de referência.[218]Sequence reads that are mapped or partitioned based on a selected feature or variable can be quantified to determine the number of reads that are mapped to one or more portions (e.g., portion of a genome of reference), in some modalities. In certain embodiments, the number of fragments (reads) of sequences that are mapped to a portion are count links (e.g., counts). Often, a count is associated with a portion. In certain embodiments counts for two or more portions (eg, a set of portions) are mathematically manipulated (eg, averaged, summed, normalized, similar, or a combination thereof). In some embodiments a count is determined from a portion or all of the reads of sequences mapped to (i.e., associated with) a portion. In certain embodiments, a count is determined from a predefined subset of mapped sequence reads. Predefined subsets of mapped sequence reads can be defined or selected using any suitable resource or variable. In some embodiments, predefined subsets of mapped sequence reads may include from 1 to n sequence reads, where n represents a number equal to the sum of all sequence reads generated from a subject. sample or test sample from the reference subject.

[219]Em certas modalidades uma contagem é derivada de fragmentos (reads) de sequências que são processados ou manipulados por um método, operação ou processo matemático adequado conhecido na técnica. Uma contagem (por exemplo, contagens) pode ser determinada por um método, operação ou processo matemático adequado. Em certas modalidades uma contagem é derivada de fragmentos (reads) de sequências associados com uma porção em que parte ou a totalidade das fragmentos (reads) de sequências são pesados, removidos, filtrados, normalizados, ajustados, tirados a média, derivados como uma média, adicionados ou subtraídos ou processados por uma combinação dos mesmos. Em algumas modalidades, uma contagem é derivada de fragmentos (reads) de sequências brutos e/ou fragmentos (reads) de sequências filtrados. Em certas modalidades um valor de contagens é determinado por um processo matemático. Em certas modalidades um valor de contagens é uma média, média aritmética ou soma de fragmentos (reads) de sequências mapeados para uma porção. Frequentemente, uma contagem é um número médio de contagens. Em algumas modalidades, uma contagem é associada com um valor de incerteza.[219] In certain embodiments a count is derived from sequence reads that are processed or manipulated by a suitable method, operation, or mathematical process known in the art. A count (eg counts) may be determined by a suitable mathematical method, operation or process. In certain embodiments a count is derived from sequence reads associated with a portion in which part or all of the sequence reads are weighed, removed, filtered, normalized, adjusted, averaged, derived as an average , added or subtracted or processed by a combination thereof. In some embodiments, a count is derived from raw sequence reads and/or filtered sequence reads. In certain embodiments a counts value is determined by a mathematical process. In certain embodiments a counts value is an average, arithmetic mean, or sum of sequence reads mapped to a portion. Often, a count is an average number of counts. In some embodiments, a count is associated with an uncertainty value.

[220]Em algumas modalidades, as contagens podem ser manipuladas ou transformadas (por exemplo, normalizada, combinada, adicionada, filtrada, selecionada, tirada a média, derivada como uma média, semelhante, ou uma combinação dos mesmos). Em algumas modalidades, as contagens podem ser transformadas para produzir contagens normalizadas. As contagens podem ser processadas (por exemplo, normalizada) por um método conhecido na técnica e/ou como aqui descrito (por exemplo, normalização em porções, a normalização pelo teor de GC, e regressão dos mínimos quadrados lineares e não lineares, GC LOESS, LOWESS, PERUN, RM, GCRM, cQn e/ou suas combinações).[220]In some embodiments, counts may be manipulated or transformed (eg, normalized, combined, summed, filtered, selected, averaged, derived as an average, similar, or a combination thereof). In some embodiments, the counts can be transformed to produce normalized counts. Counts can be processed (e.g., normalized) by a method known in the art and/or as described herein (e.g., normalization by portions, normalization by GC content, and linear and nonlinear least squares regression, GC LOESS , LOWESS, PERUN, RM, GCRM, cQn and/or combinations thereof).

[221]Contagens (por exemplo, contagens bruta, filtrada e/ou normalizada) podem ser processadas e normalizadas para um ou mais níveis. Níveis e perfis são descritos em maior detalhe aqui adiante. Em certas modalidades as contagens podem ser processadas e/ou normalizadas para um nível de referência. Os níveis de referência são abordados mais adiante. Contagens processadas de acordo com um nível (por exemplo, contagens processada) podem ser associadas com um valor de incerteza (por exemplo, uma variação calculada, um erro, desvio padrão, pontuação Z, valor p, desvio absoluto médio, etc). Em algumas modalidades um valor de incerteza define um intervalo acima e abaixo de um nível. Um valor de desvio pode ser utilizado em lugar de um valor de incerteza, e exemplos não limitativos de medidas de desvio incluem desvio padrão, desvio absoluto médio, desvio absoluto mediano, pontuação padrão (por exemplo, pontuação Z, pontuação Z, pontuação normal, variável padronizada) e semelhante.[221]Counts (eg, raw, filtered, and/or normalized counts) can be processed and normalized to one or more levels. Levels and profiles are described in more detail later on. In certain embodiments the counts may be processed and/or normalized to a reference level. Reference levels are discussed later. Counts processed according to a level (eg, counts processed) can be associated with an uncertainty value (eg, a calculated variance, an error, standard deviation, Z-score, p-value, mean absolute deviation, etc.). In some embodiments an uncertainty value defines a range above and below a level. A deviation value may be used in place of an uncertainty value, and non-limiting examples of measures of deviation include standard deviation, mean absolute deviation, median absolute deviation, standard score (e.g., Z score, Z score, normal score, standardized variable) and the like.

[222]As contagens são frequentemente obtidas de uma amostra de ácido nucleico de uma mulher grávida que carrega um feto. Contagens de fragmentos (reads) de sequências de ácido nucleico mapeados para uma ou mais porções, frequentemente, são contagens representativas de ambos feto e mãe do feto (por exemplo, um sujeito feminino grávido). Em certas modalidades algumas das contagens mapeadas para uma porção são de um genoma fetal e algumas das contagens mapeadas para a mesma porção são de um genoma materno.[222]Counts are often obtained from a nucleic acid sample from a pregnant woman carrying a fetus. Counts of fragments (reads) of nucleic acid sequences mapped to one or more portions are often representative counts of both the fetus and the fetus's mother (eg, a pregnant female subject). In certain embodiments some of the counts mapped to a portion are from a fetal genome and some of the counts mapped to the same portion are from a maternal genome.

Processamento e Normalização de dadosData Processing and Normalization

[223]Fragmentos (reads) de sequências mapeados que foram contados são aqui referidos como dados não processados, uma vez que os dados representam contagens não manipuladas (por exemplo, contagens brutas). Em algumas modalidades, os dados legíveis de sequência em um conjunto de dados podem ser ainda processados (por exemplo, matematicamente e/ou estatisticamente manipulados) e/ou apresentados para facilitar fornecimento de um resultado. Em certas modalidades, os conjuntos de dados, incluindo os conjuntos de dados maiores, podem beneficiar do pré- processamento para facilitar posteriormente análise. Pré- processamento de conjuntos de dados por vezes envolve a remoção de porções redundantes e/ou não informativos ou porções de um genoma de referência (por exemplo, porções de um genoma de referência com dados não informativos, fragmentos (reads) mapeados redundantes, porções com contagens medianas zero, sequências super-representadas ou sobre-representadas). Sem ser limitado pela teoria, o processamento e/ou o pré-processamento de dados pode (i) remover os dados ruidosos, (ii) remover os dados não informativos, (iii) remover dados redundantes, (iv) reduzir complexidade de conjuntos de dados maiores, e/ou (v) facilitar a transformação dos dados de uma forma em uma ou mais outras formas. Os termos "pré-tratamento" e "tratamento", quando usados com respeito aos dados ou conjuntos de dados são coletivamente aqui referidos como "processamento". Processamento pode tornar dados mais propícios para análise posterior, e pode gerar um resultado em algumas modalidades. Em algumas modalidades um ou mais ou todos os métodos de processamento (por exemplo, métodos de normalização, filtragem da porção, mapeamento, validação, o semelhante ou combinações dos mesmos) são executados por um processador, um microprocessador, um computador, em conjunto com a memória e/ou pela uma máquina controlada por microprocessador.[223]Fragments (reads) of mapped sequences that have been counted are referred to herein as raw data, as the data represent unmanipulated counts (eg, raw counts). In some embodiments, sequence readable data in a dataset may be further processed (e.g., mathematically and/or statistically manipulated) and/or displayed to facilitate providing a result. In certain embodiments, datasets, including larger datasets, may benefit from pre-processing to facilitate further analysis. Pre-processing of datasets sometimes involves removing redundant and/or non-informative portions or portions of a reference genome (e.g. portions of a reference genome with non-informative data, redundant mapped reads, portions with zero median counts, over-represented or over-represented sequences). Without being bound by theory, data processing and/or pre-processing can (i) remove noisy data, (ii) remove non-informative data, (iii) remove redundant data, (iv) reduce complexity of data sets. larger data, and/or (v) facilitate transformation of data from one form into one or more other forms. The terms "pre-treatment" and "treatment" when used with respect to data or datasets are collectively referred to herein as "processing". Processing can make data more conducive to further analysis, and can generate a result in some modalities. In some embodiments one or more or all of the processing methods (e.g., normalization methods, portion filtering, mapping, validation, the like, or combinations thereof) are performed by a processor, a microprocessor, a computer, in conjunction with memory and/or a microprocessor-controlled machine.

[224]O termo "dados ruidosos", tal como aqui usado, refere-se a (a) dados que têm uma variação significativa entre os pontos de dados quando analisados ou diagramados, (b) dados que têm um desvio padrão significativo (por exemplo, maior do que 3 desvios-padrão), (c) dados que têm um erro padrão significativo da média, semelhante, e combinações dos anteriores. Dados ruidosos ocorrem, algumas vezes, devido à quantidade e/ou qualidade do material (por exemplo, amostra de ácido nucleico) de partida, e, por vezes, ocorrem como parte dos processos para a preparação ou a replicação de DNA utilizado para gerar fragmentos (reads) de sequências. Em certas modalidades, o ruído resulta de certas sequências sendo super-representadas quando preparadas usando métodos baseados em PCR. Métodos aqui descritos podem reduzir ou eliminar a contribuição de dados ruidosos e, por conseguinte, reduzir o efeito de dados ruidosos sobre o resultado fornecido.[224]The term "noisy data", as used herein, refers to (a) data that has significant variation between data points when analyzed or plotted, (b) data that has a significant standard deviation (for example, greater than 3 standard deviations), (c) data that have a significant standard error of the mean, similar, and combinations of the above. Noisy data sometimes occurs due to the quantity and/or quality of the starting material (e.g., nucleic acid sample), and sometimes occurs as part of processes for preparing or replicating DNA used to generate fragments (reads) of sequences. In certain embodiments, noise results from certain sequences being over-represented when prepared using PCR-based methods. Methods described here can reduce or eliminate the contribution of noisy data and therefore reduce the effect of noisy data on the given result.

[225]Os termos "dados não informativos", "porções não informativas de um genoma de referência", e "porções não informativas" como usados aqui se referem a porções, ou dados derivados dos mesmos, tendo um valor numérico que é significativamente diferente de um valor limite pré- determinado ou que se enquadra fora da faixa de corte pré- determinado de valores. Os termos "limite" e "valor limite" aqui se referem a qualquer número que é calculado usando um conjunto de dados de qualificação e servem como um limite de diagnóstico de uma variação genética (por exemplo, uma variação do número de cópia, uma aneuploidia, uma aberração cromossômica, e semelhante). Em certas modalidades um limite é excedido pelos resultados obtidos por métodos descritos aqui e um sujeito é diagnosticado com uma variação genética (por exemplo, trissomia 21). Um valor limite ou faixa de valores de frequência é calculado matematicamente e/ou estatisticamente manipulando dados legíveis de sequência (por exemplo, de uma referência e/ou sujeito), em algumas modalidades, e em certas modalidades, dados legíveis de sequência manipulados para gerar um valor de limite ou faixa de valores são dados legíveis de sequência (por exemplo, de uma referência e/ou assunto). Em algumas modalidades, um valor de incerteza é determinado. Um valor de incerteza é geralmente uma medida da variância ou erro e pode ser qualquer medida adequada de variância ou erro. Em algumas modalidades um valor de incerteza é um desvio padrão, erro padrão, variância calculada, valor p, ou desvio médio absoluto (MAD). Em algumas modalidades um valor de incerteza pode ser calculado de acordo com uma fórmula no Exemplo 4.[225] The terms "non-informative data", "non-informative portions of a reference genome", and "non-informative portions" as used herein refer to portions, or data derived therefrom, having a numerical value that is significantly different of a predetermined threshold value or that falls outside the predetermined cut-off range of values. The terms "threshold" and "threshold value" here refer to any number that is calculated using a qualifying dataset and serves as a diagnostic threshold of a genetic variation (e.g., a copy number variation, an aneuploidy , a chromosomal aberration, and the like). In certain embodiments a threshold is exceeded by the results obtained by methods described herein and a subject is diagnosed with a genetic variation (eg, trisomy 21). A threshold value or range of frequency values is calculated mathematically and/or statistically by manipulating readable sequence data (e.g., from a reference and/or subject), in some embodiments, and in certain embodiments, readable sequence data manipulated to generate a threshold value or range of values is string readable data (eg from a reference and/or subject). In some embodiments, an uncertainty value is determined. An uncertainty value is usually a measure of variance or error and can be any suitable measure of variance or error. In some embodiments an uncertainty value is a standard deviation, standard error, calculated variance, p-value, or mean absolute deviation (MAD). In some embodiments an uncertainty value can be calculated according to a formula in Example 4.

[226]Qualquer processo adequado pode ser usado para os conjuntos de dados de processamento aqui descritos. Exemplos não limitativos de procedimentos adequados para uso para o processamento de conjuntos de dados incluem filtragem, normalização, ponderação, monitoramento de alturas do pico, monitoramento das áreas de pico, monitoramento dos limites do pico, determinação das proporções de área, processamento matemático dos dados, processamento estatístico dos dados, aplicação de algoritmos estatísticos, análises com variáveis fixas, análise com as variáveis otimizadas, dados de plotagem para identificar padrões ou tendências para processamento adicional, o semelhante e combinações dos anteriores. Em algumas modalidades, os conjuntos de dados são processados com base em diversas características (por exemplo, teor de GC, fragmentos (reads) mapeados redundantes, regiões de centrômero, regiões de telômeros, o semelhante e combinações destes) e/ou variáveis (por exemplo, gênero fetal, idade materna, ploidia materna, contribuição percentual de ácido nucleico fetal, o semelhante ou suas combinações). Em certas modalidades, os conjuntos de dados de processamento como aqui descritos podem reduzir a complexidade e/ou dimensionalidade de grandes conjuntos de dados e/ou complexos. Um exemplo não limitativo de um conjunto de dados complexo inclui dados legíveis de sequência gerados a partir de um ou mais sujeitos de teste e uma pluralidade de sujeitos de referência de diferentes idades e origens étnicas. Em algumas modalidades, os conjuntos de dados podem incluir de milhares a milhões de fragmentos (reads) de sequências para cada sujeito de teste e/ou de referência.[226]Any suitable process may be used for processing the datasets described herein. Non-limiting examples of procedures suitable for use in processing data sets include filtering, normalizing, weighting, monitoring peak heights, monitoring peak areas, monitoring peak boundaries, determining area ratios, mathematically processing the data , statistical processing of data, application of statistical algorithms, analysis with fixed variables, analysis with optimized variables, plotting data to identify patterns or trends for further processing, the similar and combinations of the above. In some embodiments, datasets are processed based on various characteristics (e.g., GC content, redundant mapped reads, centromere regions, telomere regions, the like, and combinations thereof) and/or variables (e.g., (e.g., fetal gender, maternal age, maternal ploidy, percent fetal nucleic acid contribution, peer or combinations thereof). In certain embodiments, processing datasets as described herein can reduce the complexity and/or dimensionality of large and/or complex datasets. A non-limiting example of a complex dataset includes readable sequence data generated from one or more test subjects and a plurality of reference subjects of different ages and ethnic backgrounds. In some embodiments, the data sets may include from thousands to millions of sequence reads for each test and/or reference subject.

[227]O processamento de dados pode ser realizado em qualquer número de etapas, em certas modalidades. Por exemplo, os dados podem ser processados usando apenas um único procedimento de processamento em algumas modalidades, e em certas modalidades dados podem ser processados usando 1 ou mais, 5 ou mais, 10 ou mais, ou 20 ou mais etapas de processamento (por exemplo, 1 ou mais etapas de processamento, 2 ou mais etapas de processamento, 3 ou mais etapas de processamento, 4 ou mais etapas de processamento, 5 ou mais etapas de processamento, 6 ou mais etapas de processamento, 7 ou mais etapas de processamento, 8 ou mais etapas de processamento, 9 ou mais etapas de processamento, 10 ou mais etapas de processamento, 11 ou mais etapas de processamento, 12 ou mais etapas de processamento, 13 ou mais etapas de processamento, 14 ou mais etapas de processamento, 15 ou mais etapas de processamento, 16 ou mais etapas de processamento, 17 ou mais etapas de processamento, 18 ou mais etapas de processamento, 19 ou mais etapas de processamento, ou 20 ou mais etapas de processamento). Em algumas modalidades, as etapas de processamento podem ser a mesma etapa repetida duas ou mais vezes (por exemplo, filtragem de duas ou mais vezes, normalizar duas ou mais vezes), e em certas modalidades, as etapas de processamento podem ser duas ou mais etapas de processamento diferentes (por exemplo, filtragem, normalização; monitoramento da altura dos picos e arestas; filtragem, normalização, normalização a uma manipulação estatística, de referência para determinar os valores de p, e semelhante), realizadas simultaneamente ou sequencialmente. Em algumas modalidades, qualquer número adequado e/ou a combinação das etapas de processamento iguais ou diferentes podem ser usados para processar dados legíveis de sequência para facilitar o fornecimento de um resultado. Em certas modalidades, os conjuntos de dados de processamento pelos critérios aqui descritos podem reduzir a complexidade e/ou dimensionalidade de um conjunto de dados.[227]Data processing can be performed in any number of steps, in certain embodiments. For example, data may be processed using only a single processing procedure in some embodiments, and in certain embodiments data may be processed using 1 or more, 5 or more, 10 or more, or 20 or more processing steps (e.g. , 1 or more processing steps, 2 or more processing steps, 3 or more processing steps, 4 or more processing steps, 5 or more processing steps, 6 or more processing steps, 7 or more processing steps, 8 or more processing steps, 9 or more processing steps, 10 or more processing steps, 11 or more processing steps, 12 or more processing steps, 13 or more processing steps, 14 or more processing steps, 15 or more processing steps, 16 or more processing steps, 17 or more processing steps, 18 or more processing steps, 19 or more processing steps, or 20 or more processing steps). In some embodiments, the processing steps may be the same step repeated two or more times (e.g., filtering two or more times, normalizing two or more times), and in certain embodiments, the processing steps may be two or more different processing steps (eg, filtering, normalizing; monitoring the height of peaks and edges; filtering, normalizing, normalizing to statistical manipulation, reference to determine p-values, and the like), performed simultaneously or sequentially. In some embodiments, any suitable number and/or combination of the same or different processing steps can be used to process readable sequence data to facilitate providing a result. In certain embodiments, processing data sets by the criteria described herein can reduce the complexity and/or dimensionality of a data set.

[228]Em algumas modalidades, uma ou mais etapas de processamento podem compreender uma ou mais etapas de filtragem. O termo "filtragem", como aqui usado, refere-se a remoção de porções ou porções de um genoma de referência a partir de consideração. As porções de um genoma de referência podem ser selecionadas para a remoção de acordo com qualquer critério adequado, incluindo, mas não se limitando aos dados redundantes (por exemplo, fragmentos (reads) mapeados redundantes ou sobrepostos), dados não informativos (por exemplo, porções de um genoma de referência com contagens mediana zero), porções de um genoma de referência com sequências super-representadas ou sub-representadas, dados ruidosos, semelhante, ou combinações dos anteriores. Um processo de filtragem envolve frequentemente a remoção de uma ou mais porções de um genoma de referência a partir de consideração e subtração das contagens em uma ou mais porções de um genoma de referência selecionadas para a remoção das contagens contadas ou somadas para as porções de um genoma de referência, cromossomo ou cromossomos ou genoma sob consideração. Em algumas modalidades, as porções de um genoma de referência podem ser eliminadas sucessivamente (por exemplo, uma de cada vez para permitir a avaliação do efeito de remoção de cada porção individual), e em certas modalidades todas as porções de um genoma de referência marcadas para remoção podem ser removidas ao mesmo tempo. Em algumas modalidades, as porções de um genoma de referência caracterizadas por uma variação acima ou abaixo de um determinado nível são removidas, o que por vezes é referido aqui como filtrar porções "ruidosas" de um genoma de referência. Em certas modalidades, um processo de filtragem compreende a obtenção de pontos de dados de um conjunto de dados que desviam o nível de perfil médio de uma porção, um cromossomo, ou um segmento de um cromossomo por um múltiplo pré-determinado da variância do perfil, e em certas modalidades, um processo de filtragem compreende a remoção de pontos de dados de um conjunto de dados que não desviam do nível de perfil médio de uma porção, um cromossomo ou segmento de um cromossomo por um múltiplo pré-determinado do perfil de variância. Em algumas modalidades, um processo de filtragem é usado para reduzir o número de porções candidatas de um genoma de referência analisado quanto à presença ou ausência de uma variação genética. A redução do número de porções candidatas de um genoma de referência analisado quanto à presença ou ausência de uma variação genética (por exemplo, micro- deleção, micro-duplicação), frequentemente, reduz a complexidade e/ou dimensionalidade de um conjunto de dados, e, por vezes, aumenta a velocidade de procura e/ou identificação de variações genéticas e/ou aberrações genéticas por duas ou mais ordens de magnitude.[228] In some embodiments, one or more processing steps may comprise one or more filtering steps. The term "filtering", as used herein, refers to removing portions or portions of a reference genome from consideration. Portions of a reference genome may be selected for removal according to any suitable criteria, including, but not limited to, redundant data (e.g., redundant or overlapping mapped fragments (reads), non-informative data (e.g., portions of a reference genome with zero median scores), portions of a reference genome with sequences overrepresented or underrepresented, noisy data, similar, or combinations of the foregoing. A filtering process often involves removing one or more portions of a reference genome from consideration and subtracting the counts in one or more portions of a selected reference genome to remove the counts counted or summed for the portions of a reference genome. reference genome, chromosome or chromosomes or genome under consideration. In some embodiments, portions of a reference genome may be deleted successively (e.g., one at a time to allow assessment of the effect of removing each individual portion), and in certain embodiments all portions of a reference genome are labeled for removal can be removed at the same time. In some embodiments, portions of a reference genome characterized by variation above or below a certain level are removed, which is sometimes referred to herein as filtering out "noisy" portions of a reference genome. In certain embodiments, a filtering process comprises obtaining data points from a dataset that deviate from the average profile level of a portion, a chromosome, or a segment of a chromosome by a predetermined multiple of the profile variance. , and in certain embodiments, a filtering process comprises removing data points from a data set that do not deviate from the average profile level of a portion, a chromosome, or segment of a chromosome by a predetermined multiple of the profile. variance. In some embodiments, a filtering process is used to reduce the number of candidate portions of a reference genome analyzed for the presence or absence of a genetic variation. Reducing the number of candidate portions of a reference genome analyzed for the presence or absence of genetic variation (e.g., microdeletion, micro-duplication) often reduces the complexity and/or dimensionality of a dataset, and sometimes increases the speed of looking for and/or identifying genetic variations and/or genetic aberrations by two or more orders of magnitude.

[229]Em algumas modalidades uma ou mais etapas de processamento pode compreender uma ou mais etapas de normalização. A normalização pode ser realizada por um método adequado aqui descrito ou conhecido na técnica. Em certas modalidades normalização compreende ajustar os valores medidos em diferentes escalas para uma escala comum ficticiamente. Em certas modalidades normalização compreende um ajuste matemático sofisticado para trazer distribuições de probabilidade de valores ajustados em alinhamento. Em algumas modalidades normalização compreende distribuições de alinhamento em uma distribuição normal. Em certas modalidades normalização compreende ajustes matemáticos que permitem a comparação dos correspondentes valores normalizados para os diferentes conjuntos de dados de uma forma que elimina os efeitos de certas influências brutas (por exemplo, erros e anomalias). Em certas modalidades normalização compreende dimensionamento. A normalização, por vezes, compreende a divisão de uma ou mais conjuntos de dados por uma variável ou fórmula pré- determinada. Exemplos de métodos de normalização incluem normalização em porções, normalização de teor de GC, regressão dos mínimos quadrados lineares e não lineares, LOESS, GC LOESS, LOWESS (gráfico de dispersão localmente pesado), PERUN, mascaramento repetido (RM), GC-normalização e mascaramento repetido (GCRM), normalização de quantis condicional (cQn) e/ou suas combinações. Em algumas modalidades, a determinação da presença ou ausência de uma variação genética (por exemplo, uma aneuploidia) utiliza um método de normalização (por exemplo, normalização em porções, normalização de teor de GC, regressão dos mínimos quadrados lineares e não lineares, LOESS, GC LOESS, LOWESS (gráfico de dispersão localmente pesado), PERUN, mascaramento repetido (RM), GC-normalização e mascaramento repetido (GCRM), cQn, um método de normalização conhecido na técnica e/ou uma combinação dos mesmos). Em algumas modalidades contagens são normalizadas.[229] In some embodiments one or more processing steps may comprise one or more normalization steps. Normalization can be performed by a suitable method described herein or known in the art. In certain modalities normalization comprises adjusting the values measured on different scales to a fictitious common scale. In certain embodiments normalization comprises a sophisticated mathematical adjustment to bring probability distributions of fitted values into alignment. In some embodiments normalization comprises aligning distributions on a normal distribution. In certain embodiments normalization comprises mathematical adjustments that allow the comparison of corresponding normalized values for different data sets in a way that eliminates the effects of certain gross influences (eg errors and anomalies). In certain embodiments normalization comprises scaling. Normalization sometimes involves dividing one or more sets of data by a predetermined variable or formula. Examples of normalization methods include portion normalization, GC content normalization, linear and nonlinear least squares regression, LOESS, GC LOESS, LOWESS (locally weighted scatterplot), PERUN, repeated masking (RM), GC-normalization and repeated masking (GCRM), conditional quantile normalization (cQn) and/or combinations thereof. In some embodiments, determining the presence or absence of a genetic variation (e.g., an aneuploidy) utilizes a normalization method (e.g., portion normalization, GC content normalization, linear and nonlinear least squares regression, LOESS , GC LOESS, LOWESS (locally weighted scatterplot), PERUN, repeated masking (RM), GC-normalization and repeated masking (GCRM), cQn, an art-known normalization method, and/or a combination thereof). In some modalities counts are normalized.

[230]Por exemplo, LOESS é um método de modelagem de regressão conhecido na técnica que combina vários modelos de regressão em uma meta-modelo baseada no vizinho mais próximo k. LOESS é por vezes referido como uma regressão polinomial localmente pesada. GC LOESS, em algumas modalidades, aplica-se um modelo LOESS à relacionamentos entre as contagens do fragmento (por exemplo, fragmentos (reads) de sequências, contagens) e composição de GC para porções de um genoma de referência. Plotar uma curva suave através de um conjunto de pontos de dados usando LOESS é às vezes ligação de curva LOESS, particularmente quando cada valor suavizado é dado por uma regressão de mínimos quadrados quadráticos ponderados sobre a extensão de valores do critério variável de diagrama de dispersão do eixo x. Para cada ponto de um conjunto de dados, o método LOESS ajusta um polinômio de baixo grau para um subconjunto dos dados, com valores variáveis explanatórios próximos do ponto cuja resposta está sendo avaliada. O polinômio é ajustado usando mínimos quadrados ponderados, fornecendo mais peso para pontos próximos do ponto cuja resposta está sendo estimada e menos peso para pontos mais distantes. O valor da função de regressão para um ponto é então obtido por meio da avaliação do polinômio local usando os valores variáveis explanatórios que aquele ponto de dados. O ajuste LOESS é por vezes considerado completo após os valores da função de regressão terem sido computados para cada um dos pontos de dados. Muitos dos detalhes desse método, tais como o grau do modelo polinomial e os pesos, são flexíveis.[230]For example, LOESS is an art-known regression modeling method that combines several regression models into a meta-model based on nearest neighbor k. LOESS is sometimes referred to as locally weighted polynomial regression. GC LOESS, in some embodiments, applies a LOESS model to relationships between fragment counts (eg, sequence reads, counts) and GC composition for portions of a reference genome. Plotting a smooth curve through a set of data points using LOESS is sometimes LOESS curve binding, particularly when each smoothed value is given by a weighted least squares regression on the range of values of the scatterplot scatter plot variable criterion. X axis. For each point in a dataset, the LOESS method fits a low-degree polynomial to a subset of the data, with explanatory variable values close to the point whose response is being evaluated. The polynomial is fitted using weighted least squares, giving more weight to points close to the point whose response is being estimated and less weight to points farther away. The value of the regression function for a point is then obtained by evaluating the local polynomial using the explanatory variable values that that data point has. The LOESS fit is sometimes considered complete after the regression function values have been computed for each of the data points. Many of the details of this method, such as the degree of the polynomial model and the weights, are flexible.

[231]Qualquer número adequado de normalizações pode ser usado. Em algumas modalidades, os conjuntos de dados podem ser normalizados 1 ou mais, 5 ou mais, 10 ou mais ou mesmo 20 ou mais vezes. Os conjuntos de dados podem ser normalizados para valores (por exemplo, valor normalizado) representativos de qualquer característica ou variável adequada (por exemplo, dados de amostra, dados de referência, ou ambos). Exemplos não-limitativos de tipos de normalizações de dados que podem ser usados incluem normalizar dados de contagens brutas para uma ou mais porções de teste ou de referência selecionadas para o número total de contagens mapeadas para o cromossomo ou o genoma inteiro em que a porção ou seções selecionadas são mapeadas; normalizar dados de contagens brutas para uma ou porções para umas contagens de referência média para uma ou mais porções ou o cromossomo no qual uma porção ou segmento selecionado é mapeado; normalizar dados de contagens bruto para dados previamente normalizados ou seus derivados; e normalizar dados anteriormente normalizados para uma ou mais outras variáveis de normalização pré-determinadas. Normalizar um conjunto de dados, por vezes, tem o efeito de isolamento de erro estatístico, dependendo da característica ou propriedade selecionada como a variável de normalização pré-determinada. Normalizar um conjunto de dados, por vezes, também permite a comparação de características de dados de dados com diferentes escalas, trazendo os dados a uma escala comum (por exemplo, variável de normalização pré-determinada). Em algumas modalidades, uma ou mais normalizações para um valor estatisticamente derivado podem ser utilizadas para minimizar as diferenças de dados e diminuírem a importância de dados remotos. Normalizar porções ou porções de um genoma de referência, no que diz respeito a um valor de normalização, por vezes, é referida como "normalização em porções".[231]Any suitable number of normalizations may be used. In some embodiments, data sets may be normalized 1 or more, 5 or more, 10 or more, or even 20 or more times. Data sets can be normalized to values (eg, normalized value) representative of any suitable characteristic or variable (eg, sample data, reference data, or both). Non-limiting examples of the types of data normalizations that can be used include normalizing raw count data for one or more selected test or reference portions to the total number of counts mapped to the entire chromosome or genome in which the portion or selected sections are mapped; normalize data from raw counts for one or more portions to average reference counts for one or more portions or the chromosome to which a selected portion or segment is mapped; normalize raw count data to previously normalized data or derivatives thereof; and normalizing previously normalized data to one or more other predetermined normalization variables. Normalizing a dataset sometimes has the effect of isolating statistical error, depending on the characteristic or property selected as the predetermined normalization variable. Normalizing a dataset sometimes also allows the comparison of data characteristics of data with different scales, bringing the data to a common scale (eg, predetermined normalization variable). In some embodiments, one or more normalizations to a statistically derived value can be used to minimize data differences and de-emphasize remote data. Normalizing portions or portions of a reference genome with respect to a normalization value is sometimes referred to as "portioning normalization".

[232]Em certas modalidades, uma etapa de processamento compreendendo normalização inclui normalizar a uma janela estática, e em algumas modalidades, uma etapa de processamento compreendendo normalização inclui a normalização para uma janela móvel ou deslizante. O termo "janela", tal como aqui usado refere-se a uma ou mais porções escolhidas para análise e, por vezes, usada como uma referência para comparação (por exemplo, usada para a normalização e/ou outra manipulação matemática ou estatística). O termo "normalizar para uma janela estática" tal como é aqui usado refere-se a um processo de normalização, usando uma ou mais porções selecionadas para efeitos de comparação entre um sujeito de teste e conjunto de dados do sujeito de referência. Em algumas modalidades as porções selecionadas são utilizadas para gerar um perfil. Uma janela estática geralmente inclui um conjunto pré-determinado de porções que não mudam durante as manipulações e/ou análises. Os termos "normalizar uma janela móvel" e "normalizar uma janela deslizante", tais como aqui usados, referem-se a normalizações realizadas para porções localizadas na região do genoma (por exemplo, imediações genéticas imediatas, porções ou seções adjacentes e semelhante) de uma porção de teste selecionada, onde uma ou mais porções de teste selecionadas são normalizados em porções imediatamente em torno da porção de teste selecionada. Em certas modalidades, as porções selecionadas são utilizadas para gerar um perfil. Uma normalização de janela móvel ou deslizante inclui, frequentemente, mover ou deslizar repetidamente uma porção de teste adjacente, e normalizar a porção de teste recentemente selecionada para porções imediatamente circundantes ou adjacentes à porção de teste recentemente selecionada, onde as janelas adjacentes têm uma ou mais porções em comum. Em certas modalidades, uma pluralidade de porções de teste selecionadas e/ou cromossomos podem ser analisadas por um processo de janela deslizante.[232] In certain embodiments, a processing step comprising normalization includes normalizing to a static window, and in some embodiments, a processing step comprising normalization includes normalizing to a moving or sliding window. The term "window" as used herein refers to one or more portions chosen for analysis and sometimes used as a reference for comparison (eg, used for normalization and/or other mathematical or statistical manipulation). The term "normalize to a static window" as used herein refers to a normalization process using one or more portions selected for comparison purposes between a test subject and reference subject data set. In some embodiments the selected portions are used to generate a profile. A static window usually includes a predetermined set of portions that do not change during manipulations and/or analysis. The terms "normalize a sliding window" and "normalize a sliding window", as used herein, refer to normalizations performed to localized portions of the genome region (e.g., immediate genetic surroundings, adjacent portions or sections, and the like) of a selected test portion, where one or more selected test portions are normalized into portions immediately surrounding the selected test portion. In certain embodiments, selected portions are used to generate a profile. A moving or sliding window normalization often includes repeatedly moving or sliding an adjacent test portion, and normalizing the newly selected test portion to portions immediately surrounding or adjacent to the newly selected test portion, where adjacent windows have one or more common portions. In certain embodiments, a plurality of selected test pieces and/or chromosomes can be analyzed by a sliding window process.

[233]Em algumas modalidades, normalizar uma janela deslizante ou móvel pode gerar um ou mais valores, onde cada valor representa a normalização de um conjunto diferente de seleções de porções de referência a partir de diferentes regiões de um genoma (por exemplo, cromossomo). Em certas modalidades, um ou mais valores gerados são somas cumulativas (por exemplo, uma estimativa numérica integral do perfil de contagens normalizados sobre a porção selecionada, domínio (por exemplo, uma parte do cromossomo), ou cromossomo). Os valores gerados pelo processo de janela deslizante ou móvel podem ser usados para gerar um perfil e facilitam chegar a um resultado. Em algumas modalidades, somas cumulativas de uma ou mais porções podem ser apresentadas como uma função da posição genômica. Análise da janela deslizante ou móvel, por vezes, é usada para analisar um genoma pela presença ou ausência de micro-deleções e/ou micro-inserções. Em certas modalidades, apresentação de somas cumulativas de uma ou mais porções é utilizada para identificar a presença ou ausência de regiões de variação genética (por exemplo, micro-deleções, micro-duplicações). Em algumas modalidades, a análise da janela móvel ou deslizante é usada para identificar regiões do genoma que contenham micro-deleções e em certas modalidades, análise da janela deslizante ou móvel é usada para identificar regiões do genoma que contenham micro-duplicações.[233] In some embodiments, normalizing a sliding or moving window can generate one or more values, where each value represents the normalization of a different set of reference portion selections from different regions of a genome (e.g., chromosome) . In certain embodiments, one or more values generated are cumulative sums (eg, a numerically integral estimate of the profile of normalized counts over the selected portion, domain (eg, a portion of the chromosome), or chromosome). The values generated by the sliding or moving window process can be used to generate a profile and make it easier to arrive at a result. In some embodiments, cumulative sums of one or more moieties may be presented as a function of genomic position. Sliding or moving window analysis is sometimes used to analyze a genome for the presence or absence of microdeletions and/or microinserts. In certain embodiments, display of cumulative sums of one or more portions is used to identify the presence or absence of regions of genetic variation (eg, microdeletions, microduplications). In some embodiments, sliding or sliding window analysis is used to identify regions of the genome that contain microdeletions and in certain embodiments, sliding or sliding window analysis is used to identify regions of the genome that contain microduplications.

[234]Uma metodologia de normalização particularmente útil para reduzir o erro associado com indicadores de ácido nucleico é aqui referida como de Remoção de Erro Parametrizado e Normalização Imparcial (PERUN) aqui descrito e, por exemplo, no pedido de patente US n. 13/ 669.136 e pedido de patente internacional n. PCT/US12/ 59123 (W02013/052913) todo o conteúdo do qual é aqui incorporado por referência, incluindo todos os textos, tabelas, equações e desenhos. Metodologia de PERUN pode ser aplicada a uma variedade de indicadores de ácido nucleico (por exemplo, fragmentos (reads) de sequências de ácido nucleico) para o propósito de reduzir os efeitos de erro que confundem previsões com base em tais indicadores.[234] A particularly useful normalization methodology for reducing the error associated with nucleic acid flags is referred to herein as Parameterized Error Removal and Unbiased Normalization (PERUN) described herein and, for example, in US patent application no. 13/669,136 and international patent application n. PCT/US12/59123 (W02013/052913) all content of which is incorporated herein by reference, including all text, tables, equations and drawings. PERUN's methodology can be applied to a variety of nucleic acid indicators (eg, fragments (reads) of nucleic acid sequences) for the purpose of reducing the error effects that confound predictions based on such indicators.

[235]Por exemplo, a metodologia de PERUN pode ser aplicada a fragmentos (reads) de sequências de ácido nucleico de uma amostra e reduz os efeitos de erro que podem prejudicar determinações do nível de seção genômica. Tal uma aplicação é útil para o uso de fragmentos (reads) de sequências de ácido nucleico para determinar a presença ou ausência de uma variação genética em um sujeito manifestado como um nível variável de uma sequência de nucleotídeo (por exemplo, uma porção, um nível de seção genômica). Exemplos não limitativos de variações nas porções são aneuploidias cromossômicas (por exemplo, trissomia 21, trissomia 18, trissomia 13) e presença ou ausência de um cromossomo sexual (por exemplo, XX em mulheres versus XY nos homens). Uma trissomia de um autossomo (por exemplo, um cromossomo diferente do cromossomo sexual) pode ser referido como um autossomo afetado. Outros exemplos não limitativos de variações nos níveis de seção genômica incluem micro-deleções, micro- inserções, duplicações e mosaicismo.[235]For example, PERUN's methodology can be applied to fragments (reads) of nucleic acid sequences from a sample and reduces the effects of error that can impair genomic section-level determinations. Such an application is useful for using fragments (reads) of nucleic acid sequences to determine the presence or absence of a genetic variation in a subject manifested as a variable level of a nucleotide sequence (e.g., a portion, a level genomic section). Non-limiting examples of portion variations are chromosomal aneuploidies (eg, trisomy 21, trisomy 18, trisomy 13) and presence or absence of a sex chromosome (eg, XX in females versus XY in males). A trisomy of an autosome (eg, a chromosome other than the sex chromosome) may be referred to as an affected autosome. Other non-limiting examples of variations in genomic section levels include microdeletions, microinsertions, duplications, and mosaicism.

[236]Em certas aplicações, a metodologia de PERUN pode reduzir a tendência sistemática e/ou experimental pela normalização de indicadores de ácido nucleico para grupos genômicos particulares, este último dos quais são referidos como porções. Porções incluem um conjunto adequado de indicadores de ácido nucleico, um exemplo não limitativo dos quais inclui um comprimento de nucleotídeos contíguos, que é aqui referido como uma seção genômica ou porção de um genoma de referência. Porções (bins) podem incluir outros indicadores de ácido nucleico como aqui descrito. Em tais aplicações, a metodologia de PERUN geralmente normaliza indicadores de ácido nucleico nas porções (bins) particulares através de um número de amostras em três dimensões.[236] In certain applications, the PERUN methodology can reduce systematic and/or experimental bias by normalizing nucleic acid indicators to particular genomic groups, the latter of which are referred to as moieties. Portions include a suitable set of nucleic acid indicators, a non-limiting example of which includes a length of contiguous nucleotides, which is referred to herein as a genomic section or portion of a reference genome. Portions (bins) may include other nucleic acid indicators as described herein. In such applications, the PERUN methodology generally normalizes nucleic acid indicators in particular bins across a number of samples in three dimensions.

[237]Em certas aplicações, metodologia de PERUN pode reduzir a tendência experimental e/ou sistemático, normalizando indicadores de ácido nucleico (por exemplo, fragmentos (reads), contagens) mapeado para segmentos específicos (por exemplo, porções) de um genoma de referência. Em tais aplicações, a metodologia de PERUN geralmente normaliza contagens de fragmentos (reads) de ácido nucleico em porções particulares de uma genoma de referência através de um número de amostras em três dimensões. Uma descrição detalhada de PERUN e de suas aplicações é fornecida na seção de exemplos aqui, no pedido de patente internacional n. PCT/US12/59123 (W02013/052913) e na publicação do pedido de patente n. US20130085681, todo o conteúdo do qual é aqui incorporado por referência, incluindo todos os textos, tabelas, equações e desenhos.[237] In certain applications, PERUN methodology can reduce experimental and/or systematic bias by normalizing nucleic acid indicators (eg, reads, counts) mapped to specific segments (eg, portions) of a genome of reference. In such applications, the PERUN methodology generally normalizes counts of nucleic acid reads in particular portions of a reference genome across a number of samples in three dimensions. A detailed description of PERUN and its applications is provided in the examples section here, in international patent application n. PCT/US12/59123 (W02013/052913) and in patent application publication no. US20130085681, all content of which is incorporated herein by reference, including all text, tables, equations and drawings.

[238]Em certas modalidades, a metodologia de PERUN inclui calcular um nível de seção genômica para porções de um genoma de referência a partir de (a) contagens legíveis de sequência mapeadas para uma porção de um genoma de referência para uma amostra de teste, (b) a tendência experimental (por exemplo, a tendência de CG) para a amostra de teste, e (c) um ou mais parâmetros de ajuste (por exemplo, as estimativas de ajuste) para um relacionamento ajustado entre (i) a tendência experimental para uma porção de um genoma de referência para a qual fragmentos (reads) de sequências são mapeados e (ii) contagens de fragmentos (reads) de sequências mapeados para a porção. A tendência experimental para cada uma das porções de um genoma de referência pode ser determinado através várias amostras de acordo com uma relação ajustada para cada amostra entre (i) as contagens de fragmentos (reads) de sequências mapeados para cada uma das porções de um genoma de referência, e (ii) uma característica de mapeamento para cada uma das porções de um genoma de referência. Esse relacionamento ajustado para cada amostra pode ser reunido de várias amostras em três dimensões. O conjunto pode ser encomendado de acordo com a tendência experimental em certas modalidades, embora a metodologia de PERUN possa ser praticada sem encomendar o conjunto de acordo com a tendência experimental. O relacionamento ajustado para cada amostra e O relacionamento ajustado para cada porção do genoma de referência podem ser ajustados independentemente para uma função linear ou função não linear por um método de ajuste adequado (por exemplo, um modelo de ajuste) conhecido na técnica. Exemplos não limitativos de um modelo adequado que pode ser usado para ajustar uma relacionamento incluem um modelo de regressão linear, modelo de regressão simples, modelo de regressão de mínimos quadrados ordinário, modelo de regressão múltipla, modelo de regressão múltipla geral, modelo de regressão polinomial, modelo linear geral, modelo linear generalizado, modelo de regressão de escolha discreta, modelo de regressão logística, modelo de logit multinomial, modelo de logit misturado, modelo de probit, modelo de probit multinomial, modelo de logit ordenado, modelo de probit ordenado, modelo de Poisson, modelo de regressão de resposta multivariada, modelo multinível, modelo de efeitos fixos, modelo de efeitos aleatórios, modelo misturado, modelo de regressão não-linear, modelo não-paramétrico, modelo semiparamétrico, modelo robusto, modelo quantis, modelo isotônico, modelo de componentes principais, modelo de ângulo mínimo, o modelo local, modelo segmentado, e modelos de erros nas variáveis.[238] In certain embodiments, PERUN's methodology includes calculating a genomic section level for portions of a reference genome from (a) readable counts of sequence mapped to a portion of a reference genome for a test sample, (b) the experimental bias (eg, the GC bias) for the test sample, and (c) one or more fit parameters (eg, the fit estimates) for an adjusted relationship between (i) the bias experimental for a portion of a reference genome to which sequence reads are mapped and (ii) counts of sequence reads mapped to the portion. The experimental bias for each of the portions of a reference genome can be determined across several samples according to a ratio adjusted for each sample between (i) the counts of fragments (reads) of mapped sequences for each of the portions of a genome reference genome, and (ii) a mapping feature for each of the portions of a reference genome. This adjusted relationship for each sample can be pieced together from multiple samples in three dimensions. The set can be ordered according to experimental bias in certain embodiments, although the PERUN methodology can be practiced without ordering the set according to experimental bias. The fitted relationship for each sample and The fitted relationship for each portion of the reference genome can be independently fitted to a linear function or non-linear function by a suitable fitting method (e.g., a fit model) known in the art. Non-limiting examples of a suitable model that can be used to fit a relationship include a linear regression model, simple regression model, ordinary least squares regression model, multiple regression model, general multiple regression model, polynomial regression model , general linear model, generalized linear model, discrete choice regression model, logistic regression model, multinomial logit model, mixed logit model, probit model, multinomial probit model, ordered logit model, ordered probit model, Poisson model, multivariate response regression model, multilevel model, fixed effects model, random effects model, mixed model, nonlinear regression model, nonparametric model, semiparametric model, robust model, quantile model, isotonic model , principal components model, minimum angle model, local model, segmented model, and variable error models.

[239]Em algumas modalidades, um relacionamento é um relacionamento geométrico e/ou gráfico. Os termos "relacionamento" e "relação", tais como aqui usados, são sinônimos. Em algumas modalidades um relacionamento é um relacionamento matemático. Em algumas modalidades, um relacionamento é plotado. Em algumas modalidades um relacionamento é um relacionamento linear. Em certas modalidades um relacionamento é um relacionamento não linear. Em certas modalidades um relacionamento é uma regressão (por exemplo, uma linha de regressão). Uma regressão pode ser uma regressão linear ou uma regressão não-linear. Um relacionamento pode ser expresso por uma equação matemática. Frequentemente, um relacionamento é definido, em parte, por uma ou mais constantes e/ou uma ou mais variáveis. O relacionamento pode ser gerado por um método conhecido na técnica. Um relacionamento em duas dimensões pode ser gerado por uma ou mais amostras, em certas modalidades, e uma variável comprobatória de erro, ou, possivelmente, comprobatória de erro, pode ser selecionada para uma ou mais dimensões. Um relacionamento pode ser gerado, por exemplo, usando software de gráficos conhecido na técnica que traçam um gráfico usando valores de duas ou mais variáveis fornecidas por um usuário. Um relacionamento pode ser ajustado usando um método conhecido na técnica (por exemplo, através da realização de uma regressão, uma análise de regressão, por exemplo, por um programa de regressão adequado, por exemplo, software). Certos relacionamentos podem ser ajustados por regressão linear e regressão linear pode gerar um valor de inclinação e o valor de intercepto. Certos relacionamentos às vezes não são lineares e podem ser ajustados através de uma função não linear, tal como uma função parabólica, hiperbólica ou exponencial (por exemplo, uma função quadrática), por exemplo.[239]In some embodiments, a relationship is a geometric and/or graphic relationship. The terms "relationship" and "relationship" as used herein are synonymous. In some embodiments a relationship is a mathematical relationship. In some embodiments, a relationship is plotted. In some embodiments a relationship is a linear relationship. In certain embodiments a relationship is a non-linear relationship. In certain embodiments a relationship is a regression (for example, a regression line). A regression can be a linear regression or a non-linear regression. A relationship can be expressed by a mathematical equation. Often, a relationship is defined, in part, by one or more constants and/or one or more variables. The relationship can be generated by a method known in the art. A relationship in two dimensions can be generated by one or more samples, in certain embodiments, and an error-proving, or possibly error-proving, variable can be selected for one or more dimensions. A relationship can be generated, for example, using graphing software known in the art which plots a graph using values of two or more variables supplied by a user. A relationship can be fitted using a method known in the art (e.g. by performing a regression, a regression analysis, eg by a suitable regression program, eg software). Certain relationships can be fitted by linear regression, and linear regression can generate a slope value and intercept value. Certain relationships are sometimes non-linear and can be fitted using a non-linear function such as a parabolic, hyperbolic or exponential function (eg a quadratic function) for example.

[240]Na metodologia de PERUN, um ou mais dos relacionamentos ajustados podem ser lineares. Para uma análise do ácido nucleico circulante isento de células de mulheres grávidas, onde a tendência experimental é a tendência de GC e a característica de mapeamento é o teor de GC, um relacionamento ajustado para uma amostra entre (i) as contagens de fragmentos (reads) de sequências mapeados para cada porção isenta de células, e (ii) o teor de GC para cada uma das porções de um genoma de referência, pode ser linear. Para esse último relacionamento ajustado, a inclinação pertence a tendência de GC e um coeficiente da tendência de GC pode ser determinado para cada amostra, quando os relacionados ajustados são reunidos através de várias amostras. Em tais modalidades, o relacionamento ajustado para várias amostras e uma porção entre (i) o coeficiente da tendência de GC para a porção, e (ii) contagens de fragmentos (reads) de sequências mapeados para porção, também pode ser linear. Uma intercepção e inclinação podem ser obtidas a partir do último relacionamento ajustado. Em tais aplicações, a inclinação aborda a tendência específica da amostra com base no teor de GC e a intercepção aborda um padrão de atenuação específico da parte comum a todas as amostras. Metodologia de PERUN pode reduzir significativamente essa tendência específica da amostra e atenuação específica da porção no cálculo dos níveis de seção genômica para fornecer um resultado (por exemplo, presença ou ausência de variação genética, determinação do sexo fetal).[240]In PERUN's methodology, one or more of the fitted relationships can be linear. For an analysis of circulating cell-free nucleic acid from pregnant women, where the experimental bias is the GC bias and the mapping characteristic is the GC content, a one-sample adjusted relationship between (i) the fragment counts (reads ) of mapped sequences for each cell-free portion, and (ii) the GC content for each of the portions of a reference genome, can be linear. For this last adjusted relationship, the slope pertains to the GC trend and a coefficient of the GC trend can be determined for each sample when the adjusted relationships are pooled across multiple samples. In such embodiments, the fit relationship for multiple samples and a portion between (i) the GC bias coefficient for the portion, and (ii) counts of fragments (reads) of mapped sequences to portion, may also be linear. An intercept and slope can be obtained from the last fitted relationship. In such applications, the slope addresses the sample-specific bias based on GC content and the intercept addresses a part-specific attenuation pattern common to all samples. PERUN methodology can significantly reduce this sample-specific bias and portion-specific attenuation when calculating genomic section levels to provide a result (eg, presence or absence of genetic variation, determination of fetal sex).

[241]Em algumas modalidades normalização por PERUN faz uso de ajuste para uma função linear e é descrito pela Equação A, Equação B ou uma derivação das mesmas. Equação A: M = LI + GS (A) Equação B: L = (M-GS)/I (B)[241]In some embodiments normalization by PERUN makes use of fit to a linear function and is described by Equation A, Equation B or a derivation thereof. Equation A: M = LI + GS (A) Equation B: L = (M-GS)/I (B)

[242]Em algumas modalidades L é um nível ou perfil normalizado de PERUN. Em algumas modalidades L é o rendimento pretendido do procedimento de normalização de PERUN. Em certas modalidades L é específico da porção. Em algumas modalidades L é determinado de acordo com várias porções de um genoma de referência e representa um nível normalizado de PERUN de um genoma, cromossomo, ou porções do mesmo segmento. O nível L é frequentemente usado para análises posteriores (por exemplo, para determinar os valores Z, deleções/duplicações maternas, deleções/duplicações fetais, gênero fetal, aneuploidias sexuais, e desse modo por diante). O método de normalização de acordo com a Equação B é nomeado de Remoção de Erro Parametrizado e Normalização Imparcial (PERUN).[242] In some embodiments L is a normalized PERUN level or profile. In some embodiments L is the intended yield of the PERUN normalization procedure. In certain embodiments L is portion specific. In some embodiments L is determined according to various portions of a reference genome and represents a normalized PERUN level of a genome, chromosome, or portions of the same segment. The L level is often used for further analysis (eg, to determine Z values, maternal deletions/duplications, fetal deletions/duplications, fetal gender, sexual aneuploidies, and so on). The normalization method according to Equation B is named Parameterized Error Removal and Unbiased Normalization (PERUN).

[243]Em algumas modalidades G é um coeficiente da tendência de CG medido usando um modelo linear, LOESS, ou qualquer abordagem equivalente. Em algumas modalidades G é uma inclinação. Em algumas modalidades o coeficiente da tendência de CG G é avaliado como a inclinação da regressão para contagens M (por exemplo, contagens brutas) para a porção i e o teor de GC da porção i determinado de um genoma de referência. Em algumas modalidades G representa informação secundária, extraída de M e determinada de acordo com um relacionamento. Em algumas modalidades G representa um relacionamento para um conjunto de contagens específicas de porção e um conjunto de valores de teor de GC específicos da porção para uma amostra (por exemplo, uma amostra de teste). Em algumas modalidades o teor de GC específico da porção é derivado de um genoma de referência. Em algumas modalidades o teor de GC específico da porção é derivado de teor de GC observado ou medido (por exemplo, medido da amostra). Um coeficiente da tendência de CG frequentemente é determinado para cada amostra em um grupo de amostras e geralmente determinado para uma amostra de teste. Um coeficiente da tendência de CG é frequentemente específico da amostra. Em algumas modalidades um coeficiente da tendência de CG é uma constante. Em certas modalidades um coeficiente da tendência de CG, uma vez derivado de uma amostra, não muda.[243] In some embodiments G is a coefficient of the CG trend measured using a linear model, LOESS, or any equivalent approach. In some embodiments G is a slope. In some embodiments the GC G trend coefficient is evaluated as the regression slope for M counts (eg, raw counts) for portion i and the GC content of portion i determined from a reference genome. In some embodiments G represents secondary information, extracted from M and determined according to a relationship. In some embodiments G represents a relationship for a set of portion-specific counts and a set of portion-specific GC content values for a sample (eg, a test sample). In some embodiments the moiety-specific GC content is derived from a reference genome. In some embodiments, portion-specific GC content is derived from observed or measured (e.g., measured from sample) GC content. A GC trend coefficient is often determined for each sample in a sample group and is usually determined for a test sample. A GC trend coefficient is often sample-specific. In some embodiments a CG trend coefficient is a constant. In certain embodiments a GC trend coefficient, once derived from a sample, does not change.

[244]Em algumas modalidades I é uma intercepção e S é uma inclinação derivada de um relacionamento linear. Em algumas modalidades o relacionamento do qual I e S são derivados é diferente do relacionamento do qual G é derivado. Em algumas modalidades o relacionamento do qual I e S são derivados é fixado para uma dada configuração experimental. Em algumas modalidades I e S são derivados de relacionamento linear de acordo com contagens (por exemplo, contagens brutas) e um coeficiente da tendência de CG de acordo com várias amostras. Em algumas modalidades I e S são derivados independentemente da amostra de teste. Em algumas modalidades I e S são derivados de várias amostras. I e S são frequentemente específicos de porção. Em algumas modalidades, I e S são determinados com o pressuposto de que L = 1 para todas as porções de um genoma de referência em amostras euplóides. Em algumas modalidades um relacionamento linear é determinado para as amostras euplóides e valores I e S específicos para uma porção selecionada (assumindo L = 1) são determinados. Em certas modalidades, o mesmo procedimento é aplicado a todas as porções de um genoma de referência em um genoma humano e um conjunto de interceptos I e inclinações S é determinado para cada porção.[244]In some embodiments I is an intercept and S is a slope derived from a linear relationship. In some embodiments the relationship from which I and S are derived is different from the relationship from which G is derived. In some embodiments the relationship from which I and S are derived is fixed for a given experimental setup. In some embodiments I and S are derived from linear relationship according to counts (eg, raw counts) and a CG trend coefficient according to several samples. In some embodiments I and S are derived independently of the test sample. In some embodiments I and S are derived from multiple samples. I and S are often portion specific. In some embodiments, I and S are determined with the assumption that L = 1 for all portions of a reference genome in euploid samples. In some embodiments a linear relationship is determined for the euploid samples and specific I and S values for a selected portion (assuming L = 1) are determined. In certain embodiments, the same procedure is applied to all portions of a reference genome in a human genome and a set of I intercepts and S slopes is determined for each portion.

[245]Em algumas modalidades é aplicada uma abordagem de validação cruzada. A validação cruzada, às vezes, é referida como estimativa de rotação. Em algumas modalidades é aplicada uma abordagem de validação cruzada para avaliar com precisão como um modelo preditivo (por exemplo, como PERUN) vai realizar na prática usando uma amostra de teste. Em algumas modalidades um ciclo de validação cruzada compreende a partição de uma amostra de dados em subconjuntos complementares, realizando uma análise de validação cruzada em um subconjunto (por exemplo, por vezes referido como um conjunto de treinamento), e validar a análise usando outro subconjunto (por exemplo, por vezes, ligação de um conjunto de validação ou conjunto de teste). Em certas modalidades, vários ciclos de validação cruzada são realizados usando diferentes partições e/ou diferentes subconjuntos. Exemplos não limitativos de abordagens de validação cruzada incluem deixando um fora, arestas de deslizamento, por K vezes, 2 vezes, sub-amostragem aleatória repetida, semelhante ou suas combinações. Em algumas modalidades uma validação cruzada seleciona aleatoriamente de um conjunto de trabalho que contém 90% de um conjunto de amostras que compreendem fetos euplóides conhecidos e usa aquele subconjunto para treinar um modelo. Em certas modalidades, a seleção aleatória é repetida 100 vezes, produzindo um conjunto de 100 inclinações e 100 interceptos para cada porção.[245] In some embodiments a cross-validation approach is applied. Cross-validation is sometimes referred to as rotation estimation. In some embodiments a cross-validation approach is applied to accurately assess how a predictive model (eg such as PERUN) will perform in practice using a test sample. In some embodiments a cross-validation cycle comprises partitioning a data sample into complementary subsets, performing a cross-validation analysis on one subset (e.g., sometimes referred to as a training set), and validating the analysis using another subset. (e.g. sometimes linking a validation set or test set). In certain embodiments, multiple cross-validation cycles are performed using different partitions and/or different subsets. Non-limiting examples of cross-validation approaches include leaving one out, sliding edges, by K times, by 2 times, repeated random subsampling, like, or combinations thereof. In some embodiments a cross-validation randomly selects from a working set containing 90% of a set of samples comprising known euploid fetuses and uses that subset to train a model. In certain embodiments, the random selection is repeated 100 times, producing a set of 100 slopes and 100 intercepts for each portion.

[246]Em algumas modalidades o valor de M é um valor medido derivado de uma amostra de teste. Em algumas modalidades M é contagem bruta medida para uma porção. Em algumas modalidades, em que os valores de I e S estão disponíveis para uma porção, medição M é determinada a partir de uma amostra de teste e é usada para determinar o nível normalizado de PERUN L para um genoma, cromossomo, segmento ou porção do mesmo de acordo com a Equação B.[246] In some embodiments the value of M is a measured value derived from a test sample. In some embodiments M is raw count measured for a serving. In some embodiments, where I and S values are available for a portion, measurement M is determined from a test sample and is used to determine the normalized level of PERUN L for a genome, chromosome, segment or portion of the even according to Equation B.

[247]Desse modo, a aplicação da metodologia de PERUN aos fragmentos (reads) de sequências através de várias amostras em paralelo pode reduzir significativamente o erro causado pela (i) tendência experimental específico da amostra (por exemplo, a tendência de CG) e (ii) atenuação específica da porção comum para amostras. Outros métodos em que cada um destas duas fontes de erro são endereçados separadamente ou em série frequentemente não são capazes de reduzir estes de forma tão eficaz como metodologia de PERUN. Sem ser limitado pela teoria, espera-se que a metodologia de PERUN reduza o erro de forma mais eficaz em parte porque os seus processos de aditivos geralmente não espalham muito tanto quanto geralmente processos multiplicativos usados em outras abordagens de normalização (por exemplo, GC-LOESS).[247] Thus, applying the PERUN methodology to sequence reads across multiple samples in parallel can significantly reduce the error caused by (i) sample-specific experimental bias (e.g., GC bias) and (ii) specific attenuation of the common portion for samples. Other methods in which each of these two error sources are addressed separately or in series are often not able to reduce these as effectively as the PERUN methodology. Without being bound by theory, PERUN's methodology is expected to reduce error more effectively in part because its additive processes generally do not spread as much as the multiplicative processes generally used in other normalization approaches (e.g., GC- LOESS).

[248]Normalização adicional e técnicas estatísticas podem ser usadas em combinação com metodologia de PERUN. Um processo adicional pode ser aplicado antes, depois e/ou durante o emprego da metodologia de PERUN. Exemplos não limitativos de processos que podem ser usados em combinação com a metodologia de PERUN são descritos a seguir.[248]Additional normalization and statistical techniques can be used in combination with the PERUN methodology. An additional process can be applied before, after and/or during the use of the PERUN methodology. Non-limiting examples of processes that can be used in combination with the PERUN methodology are described below.

[249]Em algumas modalidades, uma normalização secundária ou ajuste de um nível de seção genômica para teor de GC pode ser usada em conjunto com a metodologia de PERUN. Um ajuste do teor de GC ou procedimento de normalização adequado pode ser usado (por exemplo, GC- LOESS, GCRM). Em certas modalidades, uma amostra particular pode ser selecionada e/ou identificada para a aplicação de um processo de normalização de GC adicional. Por exemplo, a aplicação da metodologia de PERUN pode determinar a tendência de CG para cada amostra, e uma amostra associada com uma tendência de GC acima de um certo limite pode ser selecionada para um processo de normalização de GC adicional. Em tais modalidades, um nível limite pré- determinado pode ser utilizado para selecionar tais amostras para normalização de GC adicional.[249] In some embodiments, a secondary normalization or adjustment of a genomic section level for GC content can be used in conjunction with the PERUN methodology. A suitable GC content adjustment or normalization procedure can be used (eg, GC-LOESS, GCRM). In certain embodiments, a particular sample may be selected and/or identified for application of an additional GC normalization process. For example, applying the PERUN methodology can determine the GC trend for each sample, and a sample associated with a GC trend above a certain threshold can be selected for an additional GC normalization process. In such embodiments, a predetermined threshold level may be used to select such samples for further GC normalization.

[250]Em certas modalidades, um processo de filtragem ou ponderação da porção pode ser usado em conjunto com a metodologia de PERUN. Um processo de filtragem ou ponderação adequado da porção pode ser utilizado, exemplos não limitativos que são aqui descritos, no pedido de patente internacional n. PCT/US12/59123 (W02013/052913) e publicação do pedido de patente US n. US20130085681, todo o conteúdo dos quais são aqui incorporados por referência, incluindo todos os textos, tabelas, equações e desenhos. Em algumas modalidades, uma técnica de normalização que reduz o erro associado com inserções, duplicações e/ou deleções maternas (por exemplo, variações no número de cópia fetal e/ou materna), é utilizada em conjunto com a metodologia de PERUN.[250] In certain embodiments, a portion filtering or weighting process may be used in conjunction with the PERUN methodology. A suitable portion weighting or filtering process can be used, non-limiting examples which are described herein, in International Patent Application No. PCT/US12/59123 (W02013/052913) and US patent application publication no. US20130085681, all contents of which are incorporated herein by reference, including all text, tables, equations and drawings. In some embodiments, a normalization technique that reduces the error associated with maternal insertions, duplications, and/or deletions (eg, variations in fetal and/or maternal copy number), is used in conjunction with the PERUN methodology.

[251]Níveis de seção genômica calculados pela metodologia de PERUN podem ser usados diretamente para o fornecimento de um resultado. Em algumas modalidades, os níveis de seção genômica podem ser usados diretamente para fornecer um resultado para as amostras em que a fração fetal é de cerca de 2% a cerca de 6% ou maior (por exemplo, fração fetal de cerca de 4% ou maior). Níveis de seção genômica calculados pela metodologia de PERUN às vezes são processados posteriormente para o fornecimento de um resultado. Em algumas modalidades, níveis de seção genômica são padronizados. Em certas modalidades, a soma, média aritmética ou mediana dos níveis de seção genômica calculados para uma porção de teste (por exemplo, o cromossomo 21) pode ser dividida pela soma, média aritmética ou mediana dos níveis de seção genômica calculados para porções outras que a porção de teste (por exemplo, autossomos outros que cromossomo 21), para gerar um nível de seção genômica experimental. Um nível de seção genômica experimental ou uma seção de seção genômica bruta pode ser usado como parte de uma análise de normalização, tais como o cálculo de uma pontuação Z ou pontuação Z. Uma pontuação Z pode ser gerada para uma amostra, subtraindo um nível de seção genômica esperado de um nível de seção genômica experimental ou nível de seção genômica bruto e o valor resultante pode ser dividido por um desvio padrão para as amostras. Pontuações Z resultantes podem ser distribuídos para diferentes amostras e analisadas, ou podem estar relacionadas com as outras variáveis, tais como a fração fetal e outros, e analisadas, para fornecer um resultado, em certas modalidades.[251]Genomic section levels calculated by the PERUN methodology can be used directly to provide a result. In some embodiments, genomic section levels can be used directly to provide a result for samples where the fetal fraction is from about 2% to about 6% or greater (e.g., fetal fraction of about 4% or bigger). Genomic section levels calculated by the PERUN methodology are sometimes further processed to provide a result. In some embodiments, genomic section levels are standardized. In certain embodiments, the sum, arithmetic mean, or median of genomic cross-section levels calculated for a test portion (e.g., chromosome 21) may be divided by the sum, arithmetic mean, or median of genomic cross-section levels calculated for portions other than the test portion (eg, autosomes other than chromosome 21), to generate an experimental genomic section level. An experimental genomic section level or a raw genomic section section can be used as part of a normalization analysis, such as calculating a Z score or Z score. A Z score can be generated for a sample by subtracting a level from expected genomic section from an experimental genomic section level or raw genomic section level and the resulting value can be divided by a standard deviation for the samples. Resulting Z scores can be distributed to different samples and analyzed, or can be related to other variables, such as fetal fraction and others, and analyzed to provide a result, in certain modalities.

[252]Como aqui observado, metodologia de PERUN não está limitada à normalização de acordo com a tendência de CG e o teor de CG por si, e pode ser usada para reduzir o erro associado com outras fontes de erro. Um exemplo não- limitativo de uma fonte da tendência do teor de não-GC é capacidade de mapeamento. Quando parâmetros de normalização outros que não teor e a tendência de GC são endereçadas, um ou mais dos relacionamentos ajustados podem ser não lineares (por exemplo, hiperbólica, exponencial). Onde a tendência experimental é determinado de um relacionamento não-linear, por exemplo, uma estimativa da curvatura da tendência experimental pode ser analisada em algumas modalidades.[252]As noted here, PERUN's methodology is not limited to normalization according to GC trend and GC content per se, and can be used to reduce the error associated with other sources of error. A non-limiting example of a source of non-GC content trending is mapping capability. When normalization parameters other than grade and GC bias are addressed, one or more of the fitted relationships may be nonlinear (eg, hyperbolic, exponential). Where the experimental bias is determined from a non-linear relationship, for example, an estimate of the experimental bias curvature can be analyzed in some embodiments.

[253]A metodologia de PERUN pode ser aplicada a uma variedade de indicadores de ácido nucleico. Exemplos não limitativos de indicadores de ácido nucleico são fragmentos (reads) de sequências de ácido nucleico e níveis de ácido nucleico a uma localização particular em um microarranjo. Exemplos não limitativos de fragmentos (reads) de sequências incluem aqueles obtidos de DNA isento de célula circulante, RNA isento de células circulante, DNA celular e RNA celular. A metodologia de PERUN pode ser aplicada a fragmentos (reads) de sequências mapeados para sequências de referência adequadas, tais como DNA genômico de referência, RNA de referência celular (por exemplo, transcriptoma), e porções dos mesmos (por exemplo, parte(s) de um complemento genômico de DNA ou RNA transcriptoma, parte(s) de um cromossomo).[253] The PERUN methodology can be applied to a variety of nucleic acid indicators. Non-limiting examples of nucleic acid markers are fragments (reads) of nucleic acid sequences and levels of nucleic acid at a particular location on a microarray. Non-limiting examples of sequence reads include those obtained from circulating cell-free DNA, circulating cell-free RNA, cellular DNA and cellular RNA. The PERUN methodology can be applied to fragments (reads) of sequences mapped to suitable reference sequences, such as genomic reference DNA, cellular reference RNA (e.g., transcriptome), and portions thereof (e.g., part(s) ) of a genomic complement of DNA or RNA transcriptome, part(s) of a chromosome).

[254]Desse modo, em certas modalidades, o ácido nucleico celular (por exemplo, DNA ou RNA) pode servir como um indicador de ácido nucleico. Fragmentos (reads) de ácido nucleico celular mapeado para porções do genoma de referência podem ser normalizadas usando metodologia de PERUN. Ácido nucleico celular ligado a uma proteína particular são, por vezes, referidos como processos de imunoprecipitação da cromatina (ChIP). Ácido nucleico enriquecido com ChIP é um ácido nucleico em associação com a proteína celular, tal como DNA ou RNA, por exemplo. Fragmentos (reads) de ácido nucleico enriquecido com ChIP podem ser obtidos usando a tecnologia conhecida na especialidade. Fragmentos (reads) de ácido nucleico enriquecido com ChIP podem ser mapeados para uma ou mais porções de um genoma de referência, e os resultados podem ser normalizados usando metodologia de PERUN para fornecer um resultado.[254]Thus, in certain embodiments, cellular nucleic acid (e.g., DNA or RNA) can serve as a nucleic acid indicator. Cellular nucleic acid reads mapped to portions of the reference genome can be normalized using PERUN methodology. Cellular nucleic acid bound to a particular protein are sometimes referred to as chromatin immunoprecipitation (ChIP) processes. ChIP-enriched nucleic acid is nucleic acid in association with cellular protein, such as DNA or RNA, for example. ChIP-enriched nucleic acid reads can be obtained using technology known in the art. ChIP-enriched nucleic acid reads can be mapped to one or more portions of a reference genome, and the results can be normalized using PERUN methodology to provide a result.

[255]Em certas modalidades, fragmentos (reads) de RNA celular podem servir como indicadores de ácido nucleico. Fragmentos (reads) de RNA celular podem ser mapeadas para porções de RNA de referência e normalizadas usando metodologia de PERUN para fornecer resultado. Sequências conhecidas de RNA celular, referidas como um transcriptoma, ou seu segmento, podem ser usadas como uma referência para a qual fragmentos (reads) de RNA de uma amostra podem ser mapeados. Fragmentos (reads) de RNA da amostra podem ser obtidos usando tecnologia conhecida na técnica. Os resultados dos fragmentos (reads) de RNA mapeado para uma referência podem ser normalizados usando metodologia de PERUN para fornecer um resultado.[255] In certain embodiments, cellular RNA reads can serve as nucleic acid markers. Cellular RNA reads can be mapped to reference RNA snippets and normalized using PERUN methodology to provide results. Known sequences of cellular RNA, referred to as a transcriptome, or its segment, can be used as a reference to which RNA reads from a sample can be mapped. Sample RNA reads can be obtained using technology known in the art. Results from RNA reads mapped to a reference can be normalized using PERUN methodology to provide a result.

[256]Em algumas modalidades, os níveis de ácido nucleico de microarranjo podem servir como indicadores de ácidos nucleicos. Os níveis de ácido nucleico através de amostras para um endereço particular, ou hibridização de ácido nucleico, em uma matriz podem ser analisados usando metodologia de PERUN, desse modo normalizando indicadores de ácido nucleico fornecidos pela análise de microarranjo. Desse modo, um endereço particular ou hibridização de ácido nucleico em um microarranjo é análogo a uma porção de fragmentos (reads) de sequências de ácido nucleico mapeado, e metodologia de PERUN pode ser utilizada para normalizar os dados de microarranjo para fornecer um melhor resultado.[256] In some embodiments, microarray nucleic acid levels can serve as indicators of nucleic acids. Nucleic acid levels across samples for a particular address, or nucleic acid hybridization, in an array can be analyzed using PERUN methodology, thereby normalizing nucleic acid indicators provided by microarray analysis. In this way, a particular address or hybridization of nucleic acid in a microarray is analogous to a portion of fragments (reads) of mapped nucleic acid sequences, and PERUN methodology can be used to normalize the microarray data to provide a better result.

[257]Em algumas modalidades, uma etapa de processamento compreende um coeficiente de ponderação. Os termos "pesado", "ponderação" ou "função de peso" ou derivados gramaticais ou equivalentes destes, como aqui usados, referem-se a uma manipulação matemática de uma porção ou a totalidade de um conjunto de dados, por vezes, usado para alterar a influência de certas características ou variáveis do conjunto de dados no que diz respeito a outras características ou variáveis do conjunto de dados (por exemplo, aumento ou diminuição da importância e/ou contribuição de dados contidos em uma ou mais porções ou porções de um genoma de referência, com base na qualidade e utilidade dos dados na porção ou porções de um genoma de referência selecionado). A função de ponderação pode ser usada para aumentar a influência de dados com uma variância de medição relativamente pequena, e/ou para diminuir a influência de dados com uma variância de medição relativamente grande, em algumas modalidades. Por exemplo, porções de um genoma de referência com dados de sequência de baixa qualidade ou sub-representada podem ser "ter peso diminuído" para minimizar a influência de um conjunto de dados, enquanto que porções selecionadas de um genoma de referência podem ser "ter peso aumentado" para aumentar a influência em um conjunto de dados. Um exemplo não- limitativo de uma função de ponderação é [1/(desvio padrão) 2]. Uma etapa de ponderação, por vezes, é realizada de um modo substancialmente semelhante a uma etapa de normalização. Em algumas modalidades, um conjunto de dados é dividido por uma variável pré-determinada (por exemplo, variável de ponderação). Uma variável pré-determinada (por exemplo, a função alvo minimizada, Phi) é frequentemente selecionada para ponderar diferentes partes de um conjunto de dados de diferentemente (por exemplo, aumentar a influência de certos tipos de dados, enquanto diminui a influência de outros tipos de dados).[257] In some embodiments, a processing step comprises a weighting coefficient. The terms "weighing", "weighting" or "weighting function" or grammatical derivatives or equivalents thereof, as used herein, refer to a mathematical manipulation of a portion or the entirety of a data set, sometimes used to change the influence of certain characteristics or variables of the dataset with respect to other characteristics or variables of the dataset (for example, increasing or decreasing the importance and/or contribution of data contained in one or more portions or portions of a reference genome, based on the quality and usefulness of the data on the portion or portions of a selected reference genome). The weighting function can be used to increase the influence of data with a relatively small measurement variance, and/or to decrease the influence of data with a relatively large measurement variance, in some embodiments. For example, portions of a reference genome with low quality or underrepresented sequence data can be "weighted down" to minimize the influence of a dataset, while selected portions of a reference genome can be "weighted down" to minimize the influence of a dataset. increased weight" to increase influence on a dataset. A non-limiting example of a weighting function is [1/(standard deviation) 2]. A weighting step is sometimes performed in substantially the same way as a normalization step. In some embodiments, a data set is divided by a predetermined variable (eg weight variable). A predetermined variable (e.g., the minimized target function, Phi) is often selected to weight different parts of a dataset differently (e.g., increasing the influence of certain types of data, while decreasing the influence of other types). of data).

[258]Em certas modalidades, uma etapa de processamento pode compreender uma ou mais manipulações matemáticas e/ou estatísticas. Qualquer manipulação matemática e/ou estatístico adequada, sozinha ou em combinação, pode ser usada para analisar e/ou manipular um conjunto de dados aqui descrito. Qualquer número de manipulações matemáticas e/ou estatísticas adequado pode ser usado. Em algumas modalidades, um conjunto de dados pode ser matematicamente e/ou estatisticamente manipulado 1 ou mais, 5 ou mais, ou 10 ou mais 20 ou mais vezes. Exemplos não limitativos de manipulações matemáticas e estatísticas que podem ser usadas incluem adição, subtração, multiplicação, divisão, funções algébricas, estimadores de mínimos quadrados, ajuste de curvas, equações diferenciais, polinômios racionais, polinômios de casal, polinômios ortogonais, pontuações Z, valores de p, valores de chi, valores de phi, análise de níveis do pico, determinação de locais da margem de pico, cálculo de proporções da área do pico, análise de nível médio cromossômico, cálculo do desvio médio absoluto, soma dos resíduos quadrados, média, desvio padrão, erro padrão, o semelhante ou suas combinações. A manipulação matemática e/ou estatística pode ser realizada sobre a totalidade ou uma porção dos dados legíveis das sequências, ou seus produtos processados. Exemplos não limitativos de variáveis ou características do conjunto de dados que podem ser manipulados estatisticamente incluem contagens brutas, contagens filtradas, contagens normalizadas, alturas do pico, larguras de pico, áreas de pico, margens de pico, tolerâncias laterais, valores de p, níveis medianos, níveis médios, distribuição das contagens dentro de uma região genômica, representação relativa de espécies de ácido nucleico, semelhante ou suas combinações.[258] In certain embodiments, a processing step may comprise one or more mathematical and/or statistical manipulations. Any suitable mathematical and/or statistical manipulation, alone or in combination, may be used to analyze and/or manipulate a dataset described herein. Any number of suitable mathematical and/or statistical manipulations can be used. In some embodiments, a data set can be mathematically and/or statistically manipulated 1 or more, 5 or more, or 10 or more 20 or more times. Non-limiting examples of mathematical and statistical manipulations that can be used include addition, subtraction, multiplication, division, algebraic functions, least squares estimators, curve fitting, differential equations, rational polynomials, couple polynomials, orthogonal polynomials, Z scores, values p values, chi values, phi values, peak level analysis, determining peak margin locations, calculating peak area proportions, mean chromosome level analysis, calculating mean absolute deviation, sum of squared residuals, mean, standard deviation, standard error, like, or combinations thereof. Mathematical and/or statistical manipulation can be performed on all or a portion of the readable data of the sequences, or their processed products. Non-limiting examples of dataset variables or characteristics that can be statistically manipulated include raw counts, filtered counts, normalized counts, peak heights, peak widths, peak areas, peak margins, side tolerances, p values, levels medians, mean levels, distribution of counts within a genomic region, relative representation of nucleic acid species, like or combinations thereof.

[259]Em algumas modalidades, uma etapa de processamento pode compreender o uso de um ou mais algoritmos estatísticos. Qualquer algoritmo estatístico adequado, sozinho ou em combinação, pode ser usado para analisar e/ou manipular um conjunto de dados aqui descrito. Qualquer número adequado de algoritmos estatísticos pode ser usado. Em algumas modalidades, um conjunto de dados podem ser analisados usando 1 ou mais, 5 ou mais, 10 ou mais, ou 20 ou mais algoritmos estatísticos. Exemplos de algoritmos estatísticos adequados para uso com os métodos aqui descritos incluem árvores de decisão, contagens nula, comparações múltiplas, teste abrangente, problema de Behrens-Fisher, bootstrapping, método de Fisher para a combinação de testes independentes de significado, hipótese nula, erro do tipo I, erro do tipo II, teste exato, teste Z de uma amostra, teste Z de duas amostras Z, teste t de uma amostra, teste t pareado, teste t combinado de duas amostras tendo variâncias iguais, teste t não combinado de duas amostras tendo variâncias desiguais, teste Z de uma proporção, teste z de duas proporções combinadas, teste z de duas proporções não combinadas, um teste de chi-quadrado de uma amostra, teste F de duas amostras para igualdade de variâncias, intervalo de confiança, intervalo de credibilidade, significado, meta-análise, regressão linear simples, regressão linear robusta, o semelhante ou combinações dos anteriores. Exemplos não-limitativos de variáveis ou características do conjunto de dados que podem ser analisados por algoritmos estatísticos incluem contagens brutas, contagens filtradas, contagens normalizadas, alturas do pico, larguras do pico, margens do pico, tolerâncias laterais, valores de p, níveis medianos, níveis médios, distribuição das contagens dentro uma região genômica, representação relativa das espécies de ácido nucleico, semelhante ou suas combinações.[259]In some embodiments, a processing step may comprise the use of one or more statistical algorithms. Any suitable statistical algorithm, alone or in combination, can be used to analyze and/or manipulate a dataset described herein. Any suitable number of statistical algorithms can be used. In some embodiments, a dataset can be analyzed using 1 or more, 5 or more, 10 or more, or 20 or more statistical algorithms. Examples of statistical algorithms suitable for use with the methods described here include decision trees, null counts, multiple comparisons, comprehensive testing, Behrens-Fisher problem, bootstrapping, Fisher's method for combining independent tests of significance, null hypothesis, error type I error, type II error, exact test, one-sample Z-test, two-sample Z-test, one-sample t-test, paired t-test, combined two-sample t-test having equal variances, unpaired t-test two-samples having unequal variances, one-proportion z-test, two-proportions pooled z-test, two-proportions uncomposite z-test, one-sample chi-square test, two-sample F-test for equality of variances, confidence interval , credibility interval, significance, meta-analysis, simple linear regression, robust linear regression, the similar or combinations of the above. Non-limiting examples of dataset variables or characteristics that can be analyzed by statistical algorithms include raw counts, filtered counts, normalized counts, peak heights, peak widths, peak margins, lateral tolerances, p values, median levels , average levels, distribution of counts within a genomic region, relative representation of nucleic acid species, like or combinations thereof.

[260]Em certas modalidades, um conjunto de dados pode ser analisado através do uso de múltiplos algoritmos estatísticos (por exemplo, 2 ou mais) (por exemplo, regressão dos mínimos quadrados, análise do componente principal, análise do discriminante linear, análise do discriminante quadrático, ensacamento, redes neurais, modelos de máquina de vetor de suporte, florestas aleatórias, modelos de árvore de classificação, K vizinhos mais próximos, regressão logística e/ou perda de suavização) e/ou manipulações matemáticas e/ou estatísticas (por exemplo, aqui referidas como manipulações). O uso de várias manipulações podem gerar um espaço N-dimensional que pode ser usado para fornecer um resultado, em algumas modalidades. Em certas modalidades, a análise de um conjunto de dados através do uso de várias manipulações pode reduzir a complexidade e/ou dimensionalidade do conjunto de dados. Por exemplo, o uso de várias manipulações sobre um conjunto de dados de referência pode gerar um espaço N-dimensional (por exemplo, gráfico de probabilidade) que pode ser usado para representar a presença ou a ausência de uma variação genética, dependendo do estado genético das amostras de referência (por exemplo, positivas ou negativas para uma variação genética selecionada). Análise de amostras de ensaio usando um conjunto substancialmente semelhante de manipulações pode ser usada para gerar um espaço N-dimensional para cada uma das amostras de teste. A complexidade e/ou dimensionalidade de um conjunto de dados do sujeito do teste, por vezes, é reduzida a um único valor ou ponto N-dimensional que pode ser prontamente comparado com o espaço N-dimensional gerado a partir dos dados de referência. Dados da amostra de teste que se enquadram dentro do espaço N-dimensional povoada pelos dados do sujeito de referência são indicativos de um estado genético substancialmente semelhante àquele dos sujeitos de referência. Dados de amostra de teste que caem fora do espaço N-dimensional povoado pelos dados de referência são indicativos de um estado genético substancialmente diferente daquele do sujeito de referência. Em algumas modalidades, as referências são euplóides ou de outro modo não tem uma variação genética ou condição médica.[260]In certain embodiments, a dataset may be analyzed using multiple statistical algorithms (e.g., 2 or more) (e.g., least squares regression, principal component analysis, linear discriminant analysis, quadratic discriminant, bagging, neural networks, support vector machine models, random forests, classification tree models, K nearest neighbors, logistic regression and/or loss of smoothing) and/or mathematical and/or statistical manipulations (e.g. example, herein referred to as manipulations). Using various manipulations can generate an N-dimensional space that can be used to provide a result, in some embodiments. In certain embodiments, analyzing a dataset through the use of various manipulations can reduce the complexity and/or dimensionality of the dataset. For example, using various manipulations on a reference dataset can generate an N-dimensional space (e.g., probability plot) that can be used to represent the presence or absence of genetic variation, depending on the genetic state. from the reference samples (eg, positive or negative for a selected genetic variation). Analysis of test samples using a substantially similar set of manipulations can be used to generate an N-dimensional space for each of the test samples. The complexity and/or dimensionality of a test subject dataset is sometimes reduced to a single N-dimensional value or point that can be readily compared to the N-dimensional space generated from the reference data. Test sample data that fall within the N-dimensional space populated by the reference subject data is indicative of a genetic state substantially similar to that of the reference subjects. Test sample data that fall outside the N-dimensional space populated by the reference data is indicative of a genetic state substantially different from that of the reference subject. In some embodiments, the references are euploid or otherwise do not have a genetic variation or medical condition.

[261]Depois de conjuntos de dados terem sido contados, opcionalmente filtrados e normalizados, os conjuntos de dados processados podem ser adicionalmente manipulados por um ou mais procedimentos de filtragem e/ou de normalização, em algumas modalidades. Um conjunto de dados que foi ainda manipulado por um ou mais procedimentos de filtragem e/ou de normalização pode ser usado para gerar um perfil, em certas modalidades. Um ou mais procedimentos de filtragem e/ou normalização, por vezes, pode reduzir a complexidade e/ou dimensionalidade do conjunto de dados, em algumas modalidades. Um resultado pode ser fornecido com base em um conjunto de dados de complexidade e/ou dimensionalidade reduzida.[261]After datasets have been counted, optionally filtered, and normalized, the processed datasets may be further manipulated by one or more filtering and/or normalization procedures, in some embodiments. A dataset that has been further manipulated by one or more filtering and/or normalizing procedures can be used to generate a profile, in certain embodiments. One or more filtering and/or normalization procedures can sometimes reduce the complexity and/or dimensionality of the data set, in some embodiments. A result can be provided based on a dataset of reduced complexity and/or dimensionality.

[262]Em algumas modalidades porções podem ser filtradas de acordo com uma medida de erro (por exemplo, o desvio padrão, erro padrão, variância calculada, valor de p, erro médio absoluto (MAE), desvio mediano absoluto e/ou desvio médio absoluto (MAD). Em certas modalidades uma medida de erro refere-se a contar variabilidade. Em algumas modalidades porções são filtradas de acordo com a variabilidade das contagens. Em certas modalidades variabilidade das contagens é uma medida de erro determinada para as contagens mapeadas para uma porção (ou seja, a porção) de um genoma de referência para várias amostras (por exemplo, várias amostras obtidas de vários sujeitos, por exemplo, 50 ou mais, 100 ou mais, 500 ou mais 1000 ou mais, 5000 ou mais ou 10.000 ou mais sujeitos). Em algumas modalidades porções com uma variabilidade das contagens acima de uma faixa superior pré-determinada, são filtradas (por exemplo, excluídas da consideração). Em algumas modalidades uma faixa superior pré-determinada é um valor MAD igual ou superior a cerca de 50, cerca de 52, cerca de 54, cerca de 56, cerca de 58, cerca de 60, cerca de 62, cerca de 64, cerca de 66, cerca de 68, cerca de 70, cerca de 72, cerca de 74 ou igual ou superior a cerca de 76. Em algumas modalidades porções com uma variabilidade das contagens abaixo de uma faixa inferior pré-determinada são filtradas (por exemplo, excluídas da consideração). Em algumas modalidades uma faixa inferior pré-determinada é um valor MAD igual a ou menor do que cerca de 40, cerca de 35, cerca de 30, cerca de 25, cerca de 20, cerca de 15, cerca de 10, about5, cerca de 1, ou igual ou menor do que cerca de 0. Em algumas modalidades porções com uma variabilidade das contagens fora de uma faixa pré-determinada são filtradas (por exemplo, excluídas da consideração). Em algumas modalidades uma faixa pré-determinada é um valor MAD maior do que zero e menor do que cerca de 76, menor do que cerca de 74, menor do que cerca de 73, menor do que cerca de 72, menor do que cerca de 71, menor do que cerca de 70, menor do que cerca de 69, menor do que cerca de 68, menor do que cerca de 67, menor do que cerca de 66, menor do que cerca de 65, menor do que cerca de 64, menor do que cerca de 62, menor do que cerca de 60, menor do que cerca de 58, menor do que cerca de 56, menor do que cerca de 54, menor do que cerca de 52 ou menor do que cerca de 50. Em algumas modalidades uma faixa pré-determinada é um valor MAD maior do que zero e menor do que cerca de 67,7. Em algumas modalidades porções com uma variabilidade das contagens dentro de uma faixa pré-determinada são selecionadas (por exemplo, usadas para determinar a presença ou ausência de uma variação genética).[262] In some embodiments portions may be filtered according to a measure of error (e.g., standard deviation, standard error, calculated variance, p-value, mean absolute error (MAE), absolute median deviation, and/or mean deviation absolute (MAD). In certain embodiments an error measure refers to count variability. In some embodiments portions are filtered according to the variability of counts. In certain embodiments count variability is a measure of error determined for the counts mapped to a portion (i.e. portion) of a reference genome for multiple samples (e.g. multiple samples obtained from multiple subjects, e.g. 50 or more, 100 or more, 500 or more 1000 or more, 5000 or more or 10,000 or more subjects.) In some embodiments portions with a variability of counts above a predetermined upper range are filtered (eg excluded from consideration). greater than about 50, about 52, about 54, about 56, about 58, about 60, about 62, about 64, about 66, about 68, about 70, about 72, about 74 or equal to or greater than about 76. In some embodiments portions with a variability of counts below a predetermined lower range are filtered (eg, excluded from consideration). In some embodiments a predetermined lower range is a MAD value equal to or less than about 40, about 35, about 30, about 25, about 20, about 15, about 10, about5, about of 1, or equal to or less than about 0. In some embodiments portions with a variability of counts outside a predetermined range are filtered out (eg excluded from consideration). In some embodiments a predetermined range is a MAD value greater than zero and less than about 76, less than about 74, less than about 73, less than about 72, less than about 71, less than about 70, less than about 69, less than about 68, less than about 67, less than about 66, less than about 65, less than about 64 , less than about 62, less than about 60, less than about 58, less than about 56, less than about 54, less than about 52, or less than about 50. In some embodiments a predetermined range is a MAD value greater than zero and less than about 67.7. In some embodiments portions with a variability of counts within a predetermined range are selected (eg used to determine the presence or absence of a genetic variation).

[263]Em algumas modalidades a variabilidade das contagens de porções representa uma distribuição (por exemplo, uma distribuição normal). Em algumas modalidades porções são selecionadas dentro de um quantil de distribuição. Em algumas modalidades porções com um quantil igual ou menor do que cerca de 99,9%, 99,8%, 99,7%, 99,6%, 99,5%, 99,4%, 99,3%, 99,2%, 99,1%, 99,0%, 98,9%, 98,8%, 98,7%, 98,6%, 98,5%, 98,4%, 98,3%, 98,2%, 98,1%, 98,0%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 85%, 80%, ou igual ou menor do que um quantil de cerca de 75% para a distribuição são selecionadas. Em algumas modalidades porções com um quantil de 99% da distribuição da variabilidade das contagens são selecionadas. Em algumas modalidades porções com um MAD > 0 e um MAD < 67,725 com um quantil de 99% e são selecionadas, resultando na identificação de um conjunto de porções estáveis de um genoma de referência.[263]In some embodiments the variability of portion counts represents a distribution (eg, a normal distribution). In some embodiments portions are selected within a distribution quantile. In some embodiments portions with a quantile equal to or less than about 99.9%, 99.8%, 99.7%, 99.6%, 99.5%, 99.4%, 99.3%, 99 .2%, 99.1%, 99.0%, 98.9%, 98.8%, 98.7%, 98.6%, 98.5%, 98.4%, 98.3%, 98 .2%, 98.1%, 98.0%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90%, 85%, 80%, or equal to or less than a quantile of about 75% for the distribution are selected. In some embodiments portions with a 99% quantile of the distribution of count variability are selected. In some embodiments portions with a MAD > 0 and a MAD < 67,725 with a 99% quantile e are selected, resulting in the identification of a set of stable portions of a reference genome.

[264]Exemplos não-limitativos de filtragem da porção em relação à PERUN são fornecidos aqui e no pedido de patente internacional n° PCT/US12/59123 (W02013/052913) todo o conteúdo do qual é aqui incorporado por referência, incluindo todos os textos, tabelas, equações e desenhos. Porções podem ser filtradas com base em, ou baseadas em parte em, uma medida de erro. Uma medida de erro compreendendo valores absolutos de desvio, tal como um fator R, pode ser usada para a remoção da porção ou ponderação em certas modalidades. Um fator R, em algumas modalidades, é definido como a soma de desvios absolutos dos valores de contagens previstos das medições reais divididos pelos valores das contagens previstos das medições reais (por exemplo, Equação B aqui). Enquanto uma medida de erro compreendendo valores absolutos de desvio pode ser usada, uma medida adequada de erro pode ser alternativamente empregada. Em certas modalidades, uma medida de erro não compreendendo valores absolutos de desvio, tal como uma dispersão baseada em quadrados, pode ser usada. Em algumas modalidades, as porções são filtradas ou pesadas de acordo com uma medida da mapeabilidade (por exemplo, uma pontuação da mapeabilidade). Uma porção, por vezes, é filtrada ou pesada de acordo com um número relativamente baixo de fragmentos (reads) de sequências mapeados para a porção (por exemplo, 0, 1, 2, 3, 4, 5 fragmentos (reads) mapeados para a porção). As porções podem ser filtradas ou pesadas de acordo com o tipo de análise que está sendo efetuada. Por exemplo, para análise de aneuploidia do cromossomo 13, 18 e/ou 21, cromossomos sexuais podem ser filtrados, e apenas autossomos, ou um subconjunto de autossomos, podem ser analisados. Para a determinação do sexo fetal, autossomos podem ser filtrados, e apenas cromossomos sexuais (X e Y), ou um dos cromossomos sexuais (X ou Y), podem ser analisados.[264] Non-limiting examples of portion filtering in relation to PERUN are provided herein and in International Patent Application No. PCT/US12/59123 (W02013/052913) all content of which is incorporated herein by reference, including all texts, tables, equations and drawings. Portions can be filtered based on, or based in part on, an error measure. An error measure comprising absolute values of deviation, such as an R-factor, may be used for portion or weight removal in certain embodiments. An R-factor, in some embodiments, is defined as the sum of absolute deviations from the predicted count values of the actual measurements divided by the predicted count values of the actual measurements (eg, Equation B here). While an error measure comprising absolute values of deviation can be used, a suitable measure of error can alternatively be employed. In certain embodiments, an error measure not comprising absolute values of deviation, such as a square-based spread, can be used. In some embodiments, portions are filtered or weighted according to a measure of mappability (eg, a mappability score). A portion is sometimes filtered or weighed according to a relatively low number of sequence reads mapped to the portion (e.g. 0, 1, 2, 3, 4, 5 reads mapped to the portion). portion). Portions can be filtered or weighed according to the type of analysis being performed. For example, for aneuploidy analysis of chromosome 13, 18 and/or 21, sex chromosomes can be filtered out, and only autosomes, or a subset of autosomes, can be analyzed. For determination of fetal sex, autosomes can be filtered, and only sex chromosomes (X and Y), or one of the sex chromosomes (X or Y), can be analyzed.

[265]Em modalidades particulares, o seguinte processo de filtragem pode ser empregado. O mesmo conjunto de porções (por exemplo, porções de um genoma de referência) em um dado cromossomo (por exemplo, cromossomo 21) são selecionados e o número de fragmentos (reads) em amostras afetadas e não afetadas são comparados. A diferença refere- se a trissomia 21 e amostras euplóides e envolve um conjunto de porções que cobrem a maioria do cromossomo 21. O conjunto de porções é o mesmo entre as amostras euplóides e T21. A distinção entre um conjunto de porções e uma única seção não é crucial, já que uma porção pode ser definida. A mesma região genômica é comparada em pacientes diferentes. Esse processo pode ser usado para uma análise da trissomia, tal como para T13 ou T18, além de, ou em vez de, T21.[265]In particular embodiments, the following filtering process may be employed. The same set of portions (eg portions of a reference genome) on a given chromosome (eg chromosome 21) are selected and the number of fragments (reads) in affected and unaffected samples are compared. The difference pertains to trisomy 21 and euploid samples and involves a set of portions that cover the majority of chromosome 21. The set of portions is the same between euploid and T21 samples. The distinction between a set of portions and a single section is not crucial, as a portion can be defined. The same genomic region is compared in different patients. This process can be used for a trisomy analysis, such as for T13 or T18, in addition to, or instead of, T21.

[266]Após os conjuntos de dados terem sido contados, opcionalmente filtrados e normalizados, os conjuntos de dados processados podem ser manipulados ponderando, em algumas modalidades. Uma ou mais porções podem ser selecionadas para ponderação para reduzir a influência de dados (por exemplo, dados ruidosos, dados não informativos) contidos nas porções selecionadas, em certas modalidades, e em algumas modalidades, uma ou mais porções podem ser selecionadas para ponderação para melhorar ou aumentar a influência de dados (por exemplo, dados com pequena variação medida) contidos nas porções selecionadas. Em algumas modalidades, um conjunto de dados é pesado usando uma única função de ponderação que diminui a influência dos dados com grandes variações e aumenta a influência dos dados com pequenas variações. Uma função da ponderação, por vezes, é usada para reduzir a influência dos dados com grandes variações e aumentar a influência dos dados com pequenas variações (por exemplo, [1/(desvio padrão)2]). Em algumas modalidades, um gráfico do perfil dos dados processados posteriormente manipulados por ponderação é gerado para facilitar a classificação e/ou fornecimento de um resultado. Um resultado pode ser fornecido com base em um gráfico do perfil dos dados ponderados.[266]After the datasets have been counted, optionally filtered and normalized, the processed datasets can be manipulated by weighting, in some embodiments. One or more portions may be selected for weighting to reduce the influence of data (e.g., noisy data, uninformative data) contained in the selected portions, in certain embodiments, and in some embodiments, one or more portions may be selected for weighting to improve or increase the influence of data (for example, data with small measured variation) contained in the selected portions. In some embodiments, a dataset is weighted using a single weighting function that decreases the influence of data with large variations and increases the influence of data with small variations. A weighting function is sometimes used to reduce the influence of data with large variations and increase the influence of data with small variations (for example, [1/(standard deviation)2]). In some embodiments, a profile graph of the further processed data manipulated by weighting is generated to facilitate sorting and/or providing a result. A result can be provided based on a profile graph of the weighted data.

[267]Filtragem ou ponderação de porções pode ser realizada em um ou mais pontos adequados em uma análise. Por exemplo, porções podem ser filtradas ou ponderadas antes ou após fragmentos (reads) de sequências terem sido mapeados para porções de um genoma de referência. Porções podem ser filtradas ou ponderadas antes ou após uma tendência experimental para porções do genoma individual ser determinado em algumas modalidades. Em certas modalidades, porções podem ser filtradas ou ponderadas antes ou após níveis da secção genômica serem calculados.[267]Filtering or weighting of portions can be performed at one or more suitable points in an analysis. For example, portions can be filtered or weighted before or after sequence reads have been mapped to portions of a reference genome. Portions may be filtered or weighted before or after an experimental bias for individual genome portions is determined in some embodiments. In certain embodiments, portions may be filtered or weighted before or after genomic cross-section levels are calculated.

[268]Após conjuntos de dados terem sido contados, opcionalmente filtrados, normalizados, e opcionalmente ponderados, os conjuntos de dados processados podem ser manipulados por uma ou mais manipulações matemáticas e/ou estatísticas (por exemplo, funções estatísticas ou algoritmo estatístico), em algumas modalidades. Em certas modalidades, os conjuntos de dados processados podem ser adicionalmente manipulados calculando pontuações Z para uma ou mais porções selecionadas, cromossomos, ou porções de cromossomos. Em algumas modalidades, os conjuntos de dados processados podem ser adicionalmente manipulados calculando os valores de P. Uma modalidade de uma equação para calcular a pontuação Z e um valor de p é apresentada na Equação 1 (Exemplo 2). Em certas modalidades, manipulações matemáticas e/ou estatísticas incluem um ou mais hipóteses relativos à ploidia e/ou fração fetal. Em algumas modalidades, um mapa do perfil dos dados processados ainda manipulado por uma ou mais manipulações estatísticas e/ou matemáticas é gerado para facilitar a classificação e/ou fornecer um resultado. Um resultado pode ser fornecido com base em um gráfico do perfil de dados estatisticamente e/ou matematicamente manipulados. Um resultado fornecido com base no gráfico do perfil dos dados estatisticamente e/ou matematicamente manipulados frequentemente inclui um ou mais hipóteses relativos à ploidia e/ou fração fetal.[268]After datasets have been counted, optionally filtered, normalized, and optionally weighted, the processed datasets may be manipulated by one or more mathematical and/or statistical manipulations (e.g., statistical functions or statistical algorithm), in some modalities. In certain embodiments, the processed datasets can be further manipulated by calculating Z scores for one or more selected portions, chromosomes, or portions of chromosomes. In some embodiments, the processed datasets can be further manipulated by calculating P values. One embodiment of an equation for calculating a Z score and a p value is presented in Equation 1 (Example 2). In certain embodiments, mathematical and/or statistical manipulations include one or more assumptions concerning ploidy and/or fetal fraction. In some embodiments, a profile map of the processed data further manipulated by one or more statistical and/or mathematical manipulations is generated to facilitate classification and/or provide a result. A result can be provided based on a profile graph of statistically and/or mathematically manipulated data. A result provided based on the profile plot of statistically and/or mathematically manipulated data often includes one or more hypotheses concerning ploidy and/or fetal fraction.

[269]Em certas modalidades, várias manipulações são realizadas em conjuntos de dados processados para gerar um espaço N-dimensional e/ou ponto N-dimensional, após os conjuntos de dados terem sido contados, opcionalmente filtrados e normalizados. Um resultado pode ser fornecido com base em um gráfico do perfil de conjuntos de dados analisados em N-dimensões.[269]In certain embodiments, various manipulations are performed on processed datasets to generate an N-dimensional space and/or N-dimensional point, after the datasets have been counted, optionally filtered and normalized. A result can be provided based on a profile plot of analyzed datasets in N-dimensions.

[270]Em algumas modalidades, conjuntos de dados são processados usando uma ou mais análises do nível do pico, análises da largura do pico, análises do local da margem do pico, tolerâncias laterais do pico, semelhante, derivações dos mesmos, ou combinações dos anteriores, como parte de ou após conjuntos de dados terem sido processados e/ou manipulados. Em algumas modalidades, um gráfico do perfil dos dados processados usando uma ou mais análises do nível do pico, análises da largura do pico, análises do local da margem do pico, tolerâncias laterais do pico, semelhante, derivações dos mesmos, ou combinações dos anteriores é gerado para facilitar a classificação e/ou fornecer um resultado. Um resultado pode ser fornecido com base em um gráfico do perfil dos dados que foram processados usando uma ou mais análises do nível do pico, análises da largura do pico, análises do local da margem do pico, tolerâncias laterais do pico, semelhante, derivações dos mesmos, ou combinações dos anteriores.[270]In some embodiments, datasets are processed using one or more peak level analyses, peak width analyses, peak margin location analyses, peak lateral tolerances, the like, derivations thereof, or combinations thereof. earlier, as part of or after datasets have been processed and/or manipulated. In some embodiments, a profile graph of the processed data using one or more peak level analyses, peak width analyses, peak edge location analyses, peak lateral tolerances, the like, derivations thereof, or combinations of the foregoing is generated to facilitate sorting and/or provide a result. A result can be provided based on a profile plot of data that has been processed using one or more peak level analyses, peak width analyses, peak margin location analyses, peak lateral tolerances, similar, themselves, or combinations of the above.

[271]Em algumas modalidades, o uso de uma ou mais amostras de referência que são substancialmente isentas de uma variação genética em questão podem ser usados para gerarem um perfil das contagens mediana de referências contagens, o que pode resultar em um valor pré-determinado representativo da ausência da variação genética, e frequentemente, desvia de um valor pré-determinado nas áreas que correspondem ao local genômico em que a variação genética está localizada no sujeito de teste, se o sujeito do teste possuía a variação genética. Nos sujeitos de teste em risco de, ou sofrendo de uma condição médica associada com uma variação genética, o valor numérico para a porção ou seções selecionadas é esperado variar significativamente do valor pré-determinado dos locais genômicos não afetados. Em certas modalidades, o uso de uma ou mais amostras de referência conhecidas por carregar a variação genética em questão pode ser usado para gerar um perfil das contagens mediana de referência, o que pode resultar em um valor pré- determinado representativo da presença da variação genética, e frequentemente, desvia de um valor pré- determinado nas áreas correspondentes ao local genômico no qual um sujeito de teste não carrega a variação genética. Nos sujeitos de teste não em risco de, ou sofrendo de uma condição médica associada com uma variação genética, o valor em numérico para a porção ou seções selecionadas é esperado variar significativamente do valor pré-determinado dos locais genômicos afetados.[271] In some embodiments, the use of one or more reference samples that are substantially free of a genetic variation in question can be used to generate a profile of median reference count counts, which can result in a predetermined value representative of the absence of genetic variation, and often deviates from a predetermined value in areas that correspond to the genomic locus where the genetic variation is located in the test subject, if the test subject had the genetic variation. In test subjects at risk of, or suffering from, a medical condition associated with a genetic variation, the numerical value for the selected portion or sections is expected to vary significantly from the predetermined value of the unaffected genomic loci. In certain embodiments, the use of one or more reference samples known to carry the genetic variation in question can be used to generate a profile of median reference counts, which can result in a predetermined value representative of the presence of the genetic variation. , and often deviates from a predetermined value in areas corresponding to the genomic locus in which a test subject does not carry the genetic variation. In test subjects not at risk of, or suffering from, a medical condition associated with a genetic variation, the numerical value for the selected portion or sections is expected to vary significantly from the predetermined value of the affected genomic loci.

[272]Em algumas modalidades, análise e processamento de dados podem incluir o uso de uma ou mais hipóteses. Um número ou tipo adequado de hipóteses podem ser usados para analisar ou processar um conjunto de dados. Exemplos não- limitativos de hipóteses que podem ser usadas para o processamento e/ou análise de dados incluem ploidia materna, contribuição fetal, prevalência de certas sequências em uma população de referência, origem étnica, prevalência de uma condição médica selecionada em membros da família relacionados, paralelismo entre os perfis das contagens brutas de diferentes pacientes e/ou execuções após normalização de GC e mascaramento repetido (por exemplo, GCRM), compatibilidades idênticas representam artefatos de PCR (por exemplo, posição de base idêntica), hipóteses inerentes a um ensaio de quantificação fetal (por exemplo, FQA), hipóteses sobre gêmeos (por exemplo, se 2 gêmeos e apenas um é afetado a fração fetal eficaz é de apenas 50% do total da fração fetal medida (semelhante para trigêmeos, quadrigêmeos e semelhante)), DNA isento de células fetais (por exemplo, cfDNA) uniformemente cobre todo o genoma, semelhante e suas combinações.[272]In some embodiments, data analysis and processing may include the use of one or more hypotheses. An adequate number or type of hypotheses can be used to analyze or process a data set. Non-limiting examples of hypotheses that may be used for data processing and/or analysis include maternal ploidy, fetal contribution, prevalence of certain sequences in a reference population, ethnic origin, prevalence of a selected medical condition in related family members , parallelism between profiles of raw counts from different patients and/or runs after GC normalization and repeated masking (eg, GCRM), identical matches represent PCR artifacts (eg, identical baseline position), assumptions inherent in an assay of fetal quantification (e.g. FQA), twin hypotheses (e.g. if 2 twins and only one is affected the effective fetal fraction is only 50% of the total measured fetal fraction (similar for triplets, quadruplets and similar)) , fetal cell-free DNA (eg, cfDNA) uniformly covers the entire genome, peers and combinations thereof.

[273]Nos casos em que a qualidade e/ou profundidade dos fragmentos (reads) de sequências mapeados não permitem uma predição do resultado da presença ou ausência de uma variação genética em um nível de confiança desejado (por exemplo, um nível de confiança de 95% ou maior), com base nos perfis das contagens normalizadas, um ou mais algoritmos matemáticos de manipulação e/ou algoritmos de previsão estatística adicionais, podem ser utilizados para gerar valores numéricos adicionais úteis para a análise de dados e/ou fornecimento de um resultado. O termo "perfil de contagem normalizada" como aqui usado refere-se a um perfil de gerado usando contagens normalizadas. Exemplos de métodos que podem ser usados para gerar contagens normalizadas e perfis das contagens normalizadas são aqui descritos. Como se observa, fragmentos (reads) de sequências mapeados que foram contados podem ser normalizados em relação às contagens de amostra de teste ou contagens da amostra de referência. Em algumas modalidades, um perfil de contagem normalizada pode ser apresentado como um gráfico.[273] In cases where the quality and/or depth of the mapped sequence reads do not allow a prediction of the outcome of the presence or absence of a genetic variation at a desired confidence level (e.g., a confidence level of 95% or greater), based on the profiles of the normalized counts, one or more mathematical manipulation algorithms and/or additional statistical prediction algorithms may be used to generate additional numerical values useful for data analysis and/or providing a result. The term "normalized count profile" as used herein refers to a profile generated using normalized counts. Examples of methods that can be used to generate normalized counts and profiles of the normalized counts are described here. As noted, fragments (reads) of mapped sequences that were counted can be normalized with respect to test sample counts or reference sample counts. In some embodiments, a normalized count profile can be displayed as a graph.

Perfisprofiles

[274]Em algumas modalidades, uma etapa de processamento pode compreender gerar um ou mais perfis (por exemplo, gráfico do perfil) de vários aspectos de um conjunto de dados ou derivação dos mesmos (por exemplo, o produto de uma ou mais etapas de processamento de dados matemáticos e/ou estatísticos conhecidas na técnica e/ou descritas aqui). O termo "perfil", como aqui usado, refere-se a um produto de uma manipulação matemática e/ou estatística de dados que pode facilitar a identificação de padrões e/ou correlações em grandes quantidades de dados. Um "perfil" geralmente inclui valores resultantes de uma ou mais manipulações de dados ou conjuntos de dados, com base em um ou mais critérios. Um perfil frequentemente inclui vários pontos de dados. Qualquer número adequado de pontos de dados pode ser incluído em um perfil dependendo da natureza e/ou complexidade de um conjunto de dados. Em certas modalidades, os perfis podem incluir 2 ou mais pontos de dados, 3 ou mais pontos de dados, 5 ou mais pontos de dados, 10 ou mais pontos de dados, 24 ou mais pontos de dados, 25 ou mais pontos de dados, 50 ou mais pontos de dados, 100 ou mais pontos de dados, 500 ou mais pontos de dados, 1000 ou mais pontos de dados, 5000 ou mais pontos de dados, 10.000 ou mais pontos de dados, ou 100.000 ou mais pontos de dados.[274]In some embodiments, a processing step may comprise generating one or more profiles (e.g., profile graph) of various aspects of a dataset or deriving the same (e.g., the product of one or more processing steps). mathematical and/or statistical data processing known in the art and/or described herein). The term "profile", as used herein, refers to a product of mathematical and/or statistical manipulation of data that can facilitate the identification of patterns and/or correlations in large amounts of data. A "profile" typically includes values resulting from one or more manipulations of data or datasets, based on one or more criteria. A profile often includes multiple data points. Any suitable number of data points can be included in a profile depending on the nature and/or complexity of a dataset. In certain embodiments, profiles may include 2 or more data points, 3 or more data points, 5 or more data points, 10 or more data points, 24 or more data points, 25 or more data points, 50 or more data points, 100 or more data points, 500 or more data points, 1000 or more data points, 5000 or more data points, 10,000 or more data points, or 100,000 or more data points.

[275]Em algumas modalidades, um perfil é representativo da totalidade do conjunto de dados, e em certas modalidades, um perfil é representativo de uma parte ou um subconjunto de um conjunto de dados. Isto é, um perfil, por vezes, inclui ou é gerado de pontos de dados representativos de dados que não foram filtrados para remover quaisquer dados, e, por vezes, inclui um perfil ou é gerado a partir de pontos de dados representativos de dados que foram filtrados para remover os dados indesejados. Em algumas modalidades, um ponto de dados em um perfil representa os resultados da manipulação de dados para uma porção. Em certas modalidades, um ponto de dados em um perfil inclui resultados da manipulação de dados para grupos de porções. Em algumas modalidades, grupos de porções podem ser adjacentes um ao outro, e em certas modalidades, grupos de porções podem ser de diferentes partes de um cromossomo ou genoma.[275] In some embodiments, a profile is representative of the entire dataset, and in certain embodiments, a profile is representative of a portion or a subset of a dataset. That is, a profile sometimes includes or is generated from data points representative of data that have not been filtered to remove any data, and a profile sometimes includes or is generated from data points representative of data that have been filtered to remove unwanted data. In some embodiments, a data point on a profile represents the results of data manipulation for a portion. In certain embodiments, a data point in a profile includes data manipulation results for groups of portions. In some embodiments, groups of portions can be adjacent to each other, and in certain embodiments, groups of portions can be from different parts of a chromosome or genome.

[276]Pontos de dados em um perfil derivado de um conjunto de dados podem ser representativos de qualquer categorização de dados adequada. Exemplos não-limitativos de categorias em que os dados podem ser agrupados para gerar pontos de dados do perfil incluem: porções com base no tamanho, porções com base em características da sequência (por exemplo, teor de GC, teor de AT, posição em um cromossomo (por exemplo, braço curto, braço longo, centrômero, telômeros), e semelhante), níveis de expressão, cromossomo, semelhante ou combinações dos mesmos. Em algumas modalidades, um perfil pode ser gerado a partir de pontos de dados obtidos de outro perfil (por exemplo, perfil de dados normalizados renormalizados para um valor diferente de normalização para gerar um perfil de dados renormalizados). Em certas modalidades, um perfil gerado a partir de pontos de dados obtidos de um outro perfil reduz o número de pontos de dados e/ou complexidade do conjunto de dados. A redução do número de pontos de dados e/ou complexidade do conjunto de dados frequentemente facilita a interpretação de dados e/ou facilita o fornecimento de um resultado.[276]Data points in a profile derived from a dataset can be representative of any suitable data categorization. Non-limiting examples of categories where data can be grouped to generate profile data points include: portions based on size, portions based on sequence characteristics (e.g., GC content, AT content, position in a chromosome (eg, short arm, long arm, centromere, telomeres), and similar), expression levels, chromosome, similar, or combinations thereof. In some embodiments, a profile may be generated from data points obtained from another profile (eg, profiling normalized data renormalized to a different normalization value to generate a profile of renormalized data). In certain embodiments, a profile generated from data points obtained from another profile reduces the number of data points and/or complexity of the data set. Reducing the number of data points and/or complexity of the dataset often makes it easier to interpret data and/or makes it easier to provide a result.

[277]Um perfil (por exemplo, um perfil genômico, um perfil de cromossomo, um perfil de um segmento de um cromossomo) frequentemente é uma coleção de contagens normalizadas ou não normalizada para duas ou mais porções. Um perfil geralmente inclui pelo menos um nível (por exemplo, um nível de seção genômica), e, frequentemente compreende dois ou mais níveis (por exemplo, um perfil tem frequentemente vários níveis). Um nível geralmente é para um conjunto de porções tendo cerca das mesmas contagens ou contagens normalizadas. Níveis são descritos em maior detalhe aqui. Em certas modalidades, um perfil compreende uma ou mais porções, cujas porções podem ser ponderadas, removidas, filtradas, normalizadas, ajustadas, tiradas a média, derivadas como uma média, adicionadas, subtraídas, processadas ou transformadas por qualquer combinação das mesmas. Um perfil frequentemente compreende contagens normalizadas mapeadas para porções que definem dois ou mais níveis, onde as contagens são ainda normalizadas de acordo com um dos níveis por um método adequado. Frequentemente contagens de um perfil (por exemplo, um perfil de nível) estão associadas com um valor de incerteza.[277]A profile (eg, a genomic profile, a chromosome profile, a profile of a segment of a chromosome) is often a collection of normalized or non-normalized counts for two or more portions. A profile usually includes at least one level (eg, a genomic section level), and often comprises two or more levels (eg, a profile often has multiple levels). A tier is usually for a set of portions having about the same counts or normalized counts. Levels are described in greater detail here. In certain embodiments, a profile comprises one or more portions, which portions may be weighted, removed, filtered, normalized, adjusted, averaged, averaged, added, subtracted, processed, or transformed by any combination thereof. A profile often comprises normalized counts mapped to portions defining two or more levels, where the counts are further normalized to one of the levels by a suitable method. Often counts of a profile (eg a level profile) are associated with an uncertainty value.

[278]Um perfil que compreende um ou mais níveis, por vezes, é preenchido (por exemplo, espaço de preenchimento). Preenchimento (por exemplo, espaço de preenchimento) refere-se a um processo de identificação e ajuste dos níveis de um perfil que são devidos a micro-deleções maternas ou duplicações maternas (por exemplo, variações no número de cópia). Em algumas modalidades níveis são preenchidos que são devidos a micro-duplicações fetais ou micro-deleções fetais. Micro-duplicações ou micro-deleções em um perfil podem, em algumas modalidades, aumentar artificialmente ou diminuir o nível geral de um perfil (por exemplo, um perfil de um cromossomo) levando a determinações de falsos positivos ou falsos negativos de uma aneuploidia de cromossomo (por exemplo, uma trissomia). Em algumas modalidades níveis em um perfil que são devidos a micro-duplicações e/ou deleções são identificados e ajustados (por exemplo, preenchidos e/ou removidos) por um processo por vezes referido como o preenchimento ou espaço de preenchimento. Em certas modalidades um perfil compreende um ou mais primeiros níveis que são significativamente diferentes de um segundo nível de dentro do perfil, cada dos um ou mais primeiros níveis compreende uma variação do número materno, variação do número de cópia fetal, ou uma variação do número de cópia materna e variação do número de cópia fetal e um ou mais dos primeiros níveis são ajustados.[278]A profile comprising one or more levels is sometimes padded (eg padding space). Filling (eg, padding) refers to a process of identifying and adjusting the levels of a profile that are due to maternal micro-deletions or maternal duplications (eg, copy number variations). In some embodiments levels are filled in that are due to fetal micro-duplications or fetal micro-deletions. Micro-duplications or micro-deletions in a profile can, in some embodiments, artificially increase or decrease the overall level of a profile (e.g., a profile of a chromosome) leading to false positive or false negative determinations of a chromosome aneuploidy (for example, a trisomy). In some embodiments levels in a profile that are due to micro-duplications and/or deletions are identified and adjusted (eg filled in and/or removed) by a process sometimes referred to as padding or padding. In certain embodiments a profile comprises one or more first levels that are significantly different from a second level within the profile, each of the one or more first levels comprising a maternal number variation, fetal copy number variation, or a fetal copy number variation. maternal copy number and fetal copy number variation and one or more of the first levels are adjusted.

[279]Um perfil que compreende um ou mais níveis pode incluir um primeiro nível e um segundo nível. Em algumas modalidades um primeiro nível é diferente (por exemplo, significativamente diferente) de um segundo nível. Em algumas modalidades um primeiro nível compreende um primeiro conjunto de porções, um segundo nível compreende um segundo conjunto de porções e o primeiro conjunto de porções não é um subconjunto do segundo conjunto de porções. Em certas modalidades, um primeiro conjunto de porções é diferente de um segundo conjunto de porções a partir do qual um primeiro e um segundo níveis são determinados. Em algumas modalidades um perfil pode ter vários primeiros níveis que são diferentes (por exemplo, significativamente diferentes, por exemplo, têm um valor significativamente diferente) de um segundo nível dentro do perfil. Em algumas modalidades um perfil compreende um ou mais primeiros níveis que são significativamente diferentes de um segundo nível dentro do perfil e um ou mais dos primeiros níveis são ajustados. Em algumas modalidades um perfil compreende um ou mais primeiros níveis que são significativamente diferentes de um segundo nível dentro do perfil, cada dos um ou mais primeiros níveis compreende uma variação do número de cópia maternal, variação do número de cópia fetal, ou variação do número de cópia materna e uma variação do número de cópia fetal, e um ou mais dos primeiros níveis são ajustados. Em algumas modalidades um primeiro nível dentro de um perfil é removido do perfil ou ajustado (por exemplo, preenchido). Um perfil pode compreender múltiplos níveis que incluem um ou mais primeiros níveis significativamente diferentes de um ou mais segundos níveis e, frequentemente, a maior parte dos níveis em um perfil são segundos níveis, em que segundo níveis são aproximadamente iguais um ao outro. Em algumas modalidades mais do que 50%, mais do que 60%, mais do que 70%, mais do que 80%, mais do que 90% ou mais do que 95% dos níveis em um perfil são segundo níveis.[279]A profile comprising one or more levels may include a first level and a second level. In some embodiments a first level is different (eg, significantly different) from a second level. In some embodiments, a first tier comprises a first set of portions, a second tier comprises a second set of portions, and the first set of portions is not a subset of the second set of portions. In certain embodiments, a first set of portions is different from a second set of portions from which a first and a second level are determined. In some embodiments a profile may have multiple first levels that are different (e.g., significantly different, e.g. have a significantly different value) from a second level within the profile. In some embodiments a profile comprises one or more first levels that are significantly different from a second level within the profile and one or more of the first levels are adjusted. In some embodiments a profile comprises one or more first levels that are significantly different from a second level within the profile, each of the one or more first levels comprising a maternal copy number variation, fetal copy number variation, or fetal copy number variation. of maternal copy number and a variation of fetal copy number, and one or more of the first levels are adjusted. In some embodiments a first level within a profile is removed from the profile or adjusted (eg filled in). A profile may comprise multiple levels that include one or more first levels that are significantly different from one or more second levels, and often most of the levels in a profile are second levels, where second levels are approximately equal to each other. In some modalities more than 50%, more than 60%, more than 70%, more than 80%, more than 90% or more than 95% of the levels in a profile are second levels.

[280]Um perfil às vezes é apresentado como um gráfico. Por exemplo, um ou mais níveis representando contagens (por exemplo, contagens normalizadas) de porções podem ser plotados e visualizados. Exemplos não-limitantes de gráficos de perfil que podem ser gerados incluem contagem bruta (por exemplo, o perfil de contagem bruta ou perfil bruto), contagem normalizada, porção ponderada, pontuação z, valor de p, proporção da área versus ploidia ajustada, nível médio versus proporção entre a fração ajustada e medida, componentes principais, semelhante, ou suas combinações. Gráficos do perfil permitem a visualização dos dados manipulados, em algumas modalidades. Em certas modalidades, um gráfico do perfil pode ser usado para fornecer um resultado (por exemplo, proporção da área versus ploidia ajustada, nível médio versus proporção entre a fração fetal ajustada e medida, componentes principais). Os termos "gráfico do perfil de contagem bruta" ou "gráfico do perfil bruto", como aqui usado, referem-se a um gráfico das contagens em cada porção de uma região normalizada para contagens totais em uma região (por exemplo, genoma, porção, cromossomo, porções do cromossomo de um genoma de referência ou um segmento de um cromossomo). Em algumas modalidades, um perfil pode ser gerado usando um processo de janela estática, e, em certas modalidades, um perfil pode ser gerado usando um processo de janela deslizante.[280]A profile is sometimes presented as a graph. For example, one or more levels representing counts (eg normalized counts) of servings can be plotted and visualized. Non-limiting examples of profile graphs that can be generated include raw count (e.g., raw count profile or raw profile), normalized count, weighted portion, z score, p value, ratio of area versus adjusted ploidy, level mean versus ratio between adjusted and measured fraction, principal components, like, or combinations thereof. Profile graphs allow the visualization of manipulated data, in some modalities. In certain embodiments, a profile plot may be used to provide a result (eg, area ratio versus adjusted ploidy, mean level versus ratio between adjusted and measured fetal fraction, principal components). The terms "raw count profile graph" or "raw profile graph", as used herein, refer to a graph of the counts in each portion of a region normalized to total counts in a region (e.g., genome, portion , chromosome, chromosome portions of a reference genome, or a segment of a chromosome). In some embodiments, a profile can be generated using a static window process, and in certain embodiments, a profile can be generated using a sliding window process.

[281]Um perfil gerado por um sujeito de teste, por vezes, é comparado com um perfil gerado para um ou mais sujeitos de referência, a fim de facilitar a interpretação de manipulações matemáticas e/ou estatísticas de um conjunto de dados e/ou para fornecer um resultado. Em algumas modalidades, um perfil é gerado com base em uma ou mais hipóteses de partida (por exemplo, contribuição materna de ácido nucleico (por exemplo, fração materna), contribuição fetal de ácido nucleico (por exemplo, fração fetal), ploidia de amostra de referência, o semelhante ou suas combinações). Em certas modalidades, um perfil de teste frequentemente gira em torno de um valor pré- determinado representativo da ausência de uma variação genética, e frequentemente, desvia de um valor pré- determinado em áreas que correspondem à localização genômica em que a variação genética está localizada no sujeito de teste, se o sujeito de teste possuía a variação genética. Nos sujeitos de teste em risco de, ou sofrendo de uma condição médica associada com uma variação genética, o valor numérico de uma porção selecionada é esperado variar significativamente do valor pré-determinado para locais genômicos não-afetados. Dependendo das hipóteses iniciais (por exemplo, ploidia fixa ou ploidia otimizada, fração fetal fixa ou fração fetal otimizada ou combinações das mesmas) o limite pré-determinado ou valor de corte ou faixa limite de valores indicadores da presença ou ausência de uma variação genética pode variar enquanto ainda fornece um resultado útil para determinar a presença ou ausência de uma variação genética. Em algumas modalidades, um perfil é indicativo de e/ou representativo de um fenótipo.[281]A profile generated by a test subject is sometimes compared with a profile generated for one or more reference subjects, in order to facilitate the interpretation of mathematical and/or statistical manipulations of a dataset and/or to provide a result. In some embodiments, a profile is generated based on one or more starting hypotheses (e.g., maternal nucleic acid contribution (e.g., maternal fraction), fetal nucleic acid contribution (e.g., fetal fraction), sample ploidy of reference, the similar or their combinations). In certain embodiments, a test profile often revolves around a predetermined value representative of the absence of a genetic variation, and often deviates from a predetermined value in areas that correspond to the genomic location in which the genetic variation is located. in the test subject, whether the test subject had the genetic variation. In test subjects at risk of, or suffering from, a medical condition associated with a genetic variation, the numerical value of a selected portion is expected to vary significantly from the predetermined value for unaffected genomic loci. Depending on the initial hypotheses (for example, fixed ploidy or optimized ploidy, fixed fetal fraction or optimized fetal fraction or combinations thereof) the predetermined limit or cut-off value or limit range of values indicating the presence or absence of a genetic variation may vary while still providing a useful result for determining the presence or absence of a genetic variation. In some embodiments, a profile is indicative of and/or representative of a phenotype.

[282]Por meio de exemplo não limitativo, os perfis de contagens de amostra e/ou de referência normalizados podem ser obtidos a partir dos dados legíveis das sequências bruta pelo (a) cálculo das contagens medianas de referência de cromossomos selecionados, porções ou seus segmentos a partir de um conjunto de referências conhecidas que não carregam uma variação genética, (b) remoção de porções não informativas a partir das contagens brutas da amostra de referência (por exemplo, filtragem); (c) normalizar as contagens de referência para todas as porções restantes de um genoma de referência para o número residual total de contagens (por exemplo, soma das contagens após remoção de porções não-informativas de um genoma de referência) para o cromossomo selecionado da amostra de referência ou localização genômica selecionada, gerando desse modo um perfil do sujeito de referência normalizada; (d) a remoção das porções correspondentes da amostra do sujeito de teste; e (e), normalizar as contagens do sujeito de teste restante para um ou mais locais genômicos selecionados para a soma das contagens medianas de referência residuais para o cromossomo ou cromossomos que contêm os locais genômicos selecionados, gerando desse modo um perfil do sujeito de teste normalizado. Em certas modalidades, uma etapa de normalização adicional com respeito a todo o genoma, reduzida pelas porções filtradas em (b), pode ser incluída entre (c) e (d).[282]By way of non-limiting example, normalized sample and/or reference count profiles may be obtained from readable raw sequence data by (a) calculating the median reference counts of selected chromosomes, portions or their segments from a set of known references that do not carry genetic variation, (b) removing non-informative portions from the raw counts of the reference sample (eg, filtering); (c) normalize the reference counts for all remaining portions of a reference genome to the total residual number of counts (e.g., sum of counts after removing uninformative portions of a reference genome) for the selected chromosome from the selected reference sample or genomic location, thereby generating a normalized reference subject profile; (d) removing corresponding portions of the sample from the test subject; and (e), normalizing the remaining test subject counts for one or more selected genomic loci to the sum of the median residual reference counts for the chromosome or chromosomes containing the selected genomic loci, thereby generating a profile of the test subject normalized. In certain embodiments, an additional normalization step with respect to the entire genome, reduced by the filtered portions in (b), may be included between (c) and (d).

[283]Um perfil do conjunto de dados pode ser gerado por uma ou mais manipulações de dados legíveis das sequências mapeadas contadas. Algumas modalidades incluem o seguinte. Fragmentos (reads) de sequências são mapeados e o número de contagens (isto é, marcações de sequências) para o mapeamento genômico de cada uma das porções são determinadas (por exemplo, contadas). Um perfil de contagem bruta é gerado a partir das fragmentos (reads) de sequências mapeados que são contados. Um resultado é fornecido comparando um perfil de contagem bruta de um sujeito de teste a um perfil de contagem mediana de referência para cromossomos, segmentos ou porções ou seus segmentos de um conjunto de sujeitos de referência conhecidos não possuem uma variação genética, em certas modalidades.[283]A dataset profile may be generated by one or more readable data manipulations of counted mapped sequences. Some modalities include the following. Fragments (reads) of sequences are mapped and the number of counts (ie, sequence tags) for the genomic mapping of each of the portions are determined (eg, counted). A raw count profile is generated from the mapped sequence reads that are counted. A result is provided by comparing a test subject's raw count profile to a reference median count profile for chromosomes, segments, or portions or segments thereof from a set of reference subjects known not to have a genetic variation, in certain embodiments.

[284]Em algumas modalidades, os dados legíveis de sequência são opcionalmente filtrados para remover os dados ruidosos ou porções não-informativas. Após filtragem, as contagens restantes são somadas tipicamente para gerar um conjunto de dados filtrados. Um perfil de contagens filtrada é gerado a partir de um conjunto de dados filtrado, em certas modalidades.[284]In some embodiments, the stream readable data is optionally filtered to remove noisy data or uninformative portions. After filtering, the remaining counts are typically summed to generate a filtered dataset. A filtered counts profile is generated from a filtered dataset, in certain embodiments.

[285]Após os dados legíveis de sequência terem sido contados e opcionalmente filtrados, conjuntos de dados podem ser normalizados para gerar níveis ou perfis. Um conjunto de dados pode ser normalizado através da normalização de uma ou mais porções selecionadas para um valor de referência de normalização adequada. Em algumas modalidades, um valor de referência de normalização é representativo das contagens totais para o cromossomo ou cromossomos a partir dos quais porções são selecionadas. Em certas modalidades, um valor de referência de normalização é representativo de uma ou mais porções correspondentes, porções de cromossomo ou cromossomos de um conjunto de dados de referência preparados a partir de um conjunto de sujeitos de referência conhecidos não possui uma variação genética. Em algumas modalidades, um valor de referência de normalização é representativo de uma ou mais porções correspondentes, porções de cromossomo ou cromossomos de um conjunto de dados do sujeito de teste preparado a partir de um sujeito de teste sendo analisado pela presença ou ausência de uma variação genética. Em certas modalidades, o processo de normalização é realizado usando uma abordagem de janela estática, e em algumas modalidades o processo de normalização é realizado usando uma abordagem de janela em movimento ou deslizante. Em certas modalidades, um perfil compreendendo contagens normalizadas é gerado para facilitar a classificação e/ou fornecer um resultado. Um resultado pode ser fornecido com base em um gráfico de um perfil que compreende contagens normalizadas (por exemplo, usando um gráfico de tal um perfil).[285]After the readable sequence data has been counted and optionally filtered, datasets can be normalized to generate levels or profiles. A data set can be normalized by normalizing one or more selected portions to an appropriate normalization reference value. In some embodiments, a normalization reference value is representative of the total counts for the chromosome or chromosomes from which portions are selected. In certain embodiments, a normalization reference value is representative of one or more corresponding portions, chromosome portions or chromosomes of a reference data set prepared from a reference subject set known not to have a genetic variation. In some embodiments, a normalization reference value is representative of one or more corresponding portions, chromosome portions, or chromosomes of a test subject dataset prepared from a test subject being analyzed for the presence or absence of a variation. genetics. In certain embodiments, the normalization process is performed using a static window approach, and in some embodiments the normalization process is performed using a moving or sliding window approach. In certain embodiments, a profile comprising normalized counts is generated to facilitate classification and/or provide a result. A result may be provided based on a profile graph comprising normalized counts (eg using such a profile graph).

NíveisLevels

[286]Em algumas modalidades, um valor (por exemplo, um número, um valor quantitativo) é atribuído a um nível. Um nível pode ser determinado por um método adequado, o processo operacional ou matemático (por exemplo, um nível processado). Um nível, frequentemente é, ou é derivado de, contagens (por exemplo, contagens normalizadas) para um conjunto de porções. Em algumas modalidades um nível de uma porção é substancialmente igual ao número total de contagens mapeadas para uma porção (por exemplo, contagens, contagens normalizadas). Frequentemente, um nível é determinado de contagens que são processadas, transformadas ou manipuladas por um método adequado, processo operacional ou matemático conhecido na técnica. Em algumas modalidades um nível é derivado de contagens que são processadas e exemplos não-limitativos de contagens processadas incluem contagens ponderadas, removidas, filtradas, normalizadas, ajustadas, tirada a média, derivadas como uma média (por exemplo, nível médio), adicionadas, subtraídas, ou transformadas ou combinação das mesmas. Em algumas modalidades um nível compreende contagens que são normalizadas (por exemplo, contagens normalizadas de porções). Um nível pode separar contagens normalizadas por um processo adequado, exemplos não-limitativos dos quais incluem normalização em porções, normalização pelo teor de GC, regressão dos mínimos quadrados linear ou não-linear, GC LOESS, LOWESS, PERUN, RM, GCRM, cQn, o semelhante e/ou suas combinações. Um nível pode compreender contagens normalizadas ou quantidades relativas de contagens. Em algumas modalidades um nível é para contagens ou contagens normalizadas de duas ou mais porções que são calculadas e o nível é referido como um nível médio. Em algumas modalidades um nível é para um conjunto de porções com uma contagem média ou média de contagens normalizadas que é referida como um nível médio. Em algumas modalidades um nível é derivado de porções que compreendem contagens brutas e/ou filtradas. Em algumas modalidades, um nível baseia-se em contagens que são brutas. Em algumas modalidades um nível está associado com um valor de incerteza (por exemplo, um desvio padrão, um MAD). Em algumas modalidades um nível é representado por uma pontuação Z ou valor de p.[286]In some embodiments, a value (eg, a number, a quantitative value) is assigned to a level. A level can be determined by a suitable method, operational or mathematical process (eg a processed level). A level often is, or is derived from, counts (eg, normalized counts) for a set of portions. In some embodiments a level of a portion is substantially equal to the total number of counts mapped to a portion (e.g., counts, normalized counts). Often, a level is determined from counts which are processed, transformed or manipulated by a suitable method, operational or mathematical process known in the art. In some embodiments a level is derived from counts that are processed, and non-limiting examples of processed counts include weighted, removed, filtered, normalized, adjusted, averaged, derived as an average (e.g., mean level), added, subtracted, or transformed, or a combination thereof. In some embodiments a tier comprises counts that are normalized (eg, normalized portion counts). A level may separate counts normalized by a suitable process, non-limiting examples of which include normalization by portions, normalization by GC content, linear or non-linear least squares regression, GC LOESS, LOWESS, PERUN, RM, GCRM, cQn , the similar and/or their combinations. A level can comprise normalized counts or relative amounts of counts. In some embodiments a level is for counts or normalized counts of two or more portions that are calculated and the level is referred to as an average level. In some embodiments a tier is for a set of servings having an average count or average of normalized counts which is referred to as an average tier. In some embodiments a level is derived from portions comprising raw and/or filtered counts. In some embodiments, a level is based on scores that are raw. In some embodiments a level is associated with an uncertainty value (eg a standard deviation, a MAD). In some embodiments a level is represented by a Z-score or p-value.

[287]Um nível para uma ou mais porções é sinônimo de um "nível de seção genômica" aqui. O termo "nível", tal como aqui usado, por vezes, é sinônimo do termo "elevação". A determinação do significado do termo "nível" pode ser determinada a partir do contexto em que é usado. Por exemplo, o termo "nível", quando usado no contexto de seções genômicas, perfis, fragmentos (reads) e/ou contagens, frequentemente, significa uma elevação. O termo "nível", quando usado no contexto de uma substância ou composição (por exemplo, nível de ARN, nível de plexo) frequentemente refere-se a uma quantidade. O termo "nível", quando usado no contexto de incerteza (por exemplo, nível de erro, nível de confiança, nível de desvio, nível de incerteza) frequentemente refere-se a uma quantidade.[287]A level for one or more portions is synonymous with a "genomic section level" here. The term "level" as used herein is sometimes synonymous with the term "elevation". Determining the meaning of the term "level" can be determined from the context in which it is used. For example, the term "level", when used in the context of genomic sections, profiles, reads and/or counts, often means an elevation. The term "level", when used in the context of a substance or composition (eg, RNA level, plexus level) often refers to an amount. The term "level", when used in the context of uncertainty (eg, error level, confidence level, deviation level, uncertainty level) often refers to a quantity.

[288]Contagens normalizadas ou não normalizadas para dois ou mais níveis (por exemplo, dois ou mais níveis de um perfil) podem por vezes ser matematicamente manipuladas (por exemplo, adicionadas, multiplicadas, tiradas a média, normalizadas, o semelhante ou sua combinação) de acordo com os níveis. Por exemplo, as contagens normalizadas ou não normalizadas para dois ou mais níveis podem ser normalizadas de acordo com um, alguns ou todos os níveis de um perfil. Em algumas modalidades contagens normalizadas ou não normalizadas de todos os níveis são de um perfil normalizado de acordo com um nível no perfil. Em algumas modalidades contagens normalizadas ou não normalizadas de um primeiro nível em um perfil são normalizadas de acordo com as contagens normalizadas ou não normalizadas de um segundo nível no perfil.[288]Normalized or non-normalized counts for two or more levels (e.g. two or more levels of a profile) can sometimes be mathematically manipulated (e.g. added, multiplied, averaged, normalized, like or combination thereof ) according to levels. For example, normalized or non-normalized counts for two or more levels can be normalized according to one, some or all levels of a profile. In some embodiments normalized or non-normalized counts of all levels are from a profile normalized according to a level in the profile. In some embodiments normalized or non-normalized counts of a first level in a profile are normalized according to normalized or non-normalized counts of a second level in the profile.

[289]Exemplos não-limitativos de um nível (por exemplo, um primeiro nível, um segundo nível) são um nível para um conjunto de porções compreendendo contagens processadas, um nível para um conjunto de porções compreendendo uma média, mediana ou média aritmética de contagens, um nível para um conjunto de porções compreendendo contagens normalizadas, o semelhante ou qualquer combinação destes. Em algumas modalidades, um primeiro nível e um segundo nível em um perfil são derivados de contagens de porções mapeadas para o mesmo cromossomo. Em algumas modalidades, um primeiro nível e um segundo nível em um perfil são derivados de contagens de porções mapeadas para diferentes cromossomos.[289]Non-limiting examples of a tier (e.g., a 1st tier, a 2nd tier) are a tier for a set of portions comprising processed counts, a tier for a set of portions comprising a mean, median, or arithmetic mean of counts, a level for a set of portions comprising normalized counts, the like, or any combination thereof. In some embodiments, a first level and a second level in a profile are derived from counts of portions mapped to the same chromosome. In some embodiments, a first level and a second level in a profile are derived from counts of portions mapped to different chromosomes.

[290]Em algumas modalidades um nível é determinado a partir das contagens normalizadas ou não normalizadas mapeadas para uma ou mais porções. Em algumas modalidades, o nível é determinado a partir das contagens normalizadas ou não normalizadas para duas ou mais porções, onde as contagens normalizadas para cada porção são, frequentemente, as mesmas. Pode haver variação nas contagens (por exemplo, contagens normalizadas) em um conjunto de porções para um nível. Em um conjunto de porções para um nível pode haver uma ou mais porções tendo contagens que são significativamente diferentes do que em outras porções do conjunto (por exemplo, picos e/ou depressões). Qualquer número adequado de contagens normalizadas ou não normalizadas associado com qualquer número adequado de porções pode definir um nível.[290]In some embodiments a level is determined from the normalized or non-normalized counts mapped to one or more portions. In some embodiments, the level is determined from the normalized or non-normalized counts for two or more portions, where the normalized counts for each portion are often the same. There can be variation in counts (eg normalized counts) within a set of servings for a level. In a set of slices for a level there may be one or more slices having counts that are significantly different than other slices in the set (eg peaks and/or troughs). Any suitable number of normalized or non-normalized counts associated with any suitable number of servings can define a level.

[291]Em algumas modalidades um ou mais níveis podem ser determinados a partir das contagens normalizadas ou não normalizadas de todas ou algumas das porções de um genoma. Frequentemente, um nível pode ser determinado a partir de todas ou algumas das contagens normalizadas ou não normalizadas de um cromossomo, ou seu segmento. Em algumas modalidades, duas ou mais contagens derivadas de duas ou mais porções (por exemplo, um conjunto de porções) determinam um nível. Em algumas modalidades duas ou mais contagens (por exemplo, contagens de duas ou mais porções) determinam um nível. Em algumas modalidades, as contagens de 2 a cerca de 100.000 porções determinam um nível. Em algumas modalidades, contagens de 2 a cerca de 50000, 2 a cerca de 40000, 2 a cerca de 30000, 2 a cerca de 20000, 2 a cerca de 10000, 2 a cerca de 5000, cerca de 2 a 2500, 2 a cerca 1250, 2 a cerca de 1000, 2 a cerca de 500, 2 a cerca de 250, 2 a cerca de 100 ou 2 a cerca de 60 porções determinam um nível. Em algumas modalidades contagens de cerca de 10 a cerca de 50 porções determinam um nível. Em algumas modalidades contagens de cerca de 20 a cerca de 40 ou mais porções determinam um nível. Em algumas modalidades, um nível compreende contagens de cerca de 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26,27, 28, 29, 30, 31, 32, 33,34,35, 36, 37, 38, 39, 40, 45, 50, 55, 60 ou mais porções. Em algumas modalidades, um nível corresponde a um conjunto de porções (por exemplo, um conjunto de porções de um genoma de referência, um conjunto de porções de um cromossomo ou um conjunto de porções de um segmento de um cromossomo).[291] In some embodiments one or more levels can be determined from the normalized or non-normalized counts of all or some of the portions of a genome. Often, a level can be determined from all or some of the normalized or non-normalized counts of a chromosome, or its segment. In some embodiments, two or more scores derived from two or more servings (eg, a set of servings) determine a level. In some arrangements two or more counts (for example, counts of two or more parts) determine a level. In some embodiments, counts from 2 to about 100,000 servings determine a level. In some embodiments, counts of 2 to about 50,000, 2 to about 40,000, 2 to about 30,000, 2 to about 20,000, 2 to about 10,000, 2 to about 5000, 2 to about 2500, 2 to 1250, 2 to about 1000, 2 to about 500, 2 to about 250, 2 to about 100, or 2 to about 60 servings determine a level. In some embodiments counts from about 10 to about 50 servings determine a level. In some embodiments counts from about 20 to about 40 or more servings determine a level. In some embodiments, a level comprises counts of about 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 25, 26,27, 28, 29, 30, 31, 32, 33,34,35, 36, 37, 38, 39, 40, 45, 50, 55, 60 or more servings. In some embodiments, a level corresponds to a set of portions (eg, a set of portions of a reference genome, a set of portions of a chromosome, or a set of portions of a segment of a chromosome).

[292]Em algumas modalidades, um nível é determinado para contagens normalizadas ou não normalizadas de porções que são contíguas. Em algumas modalidades porções (por exemplo, um conjunto de porções), que são contíguas representam segmentos vizinhos de um genoma ou segmentos vizinhos de um cromossomo ou gene. Por exemplo, duas ou mais porções contíguas, quando alinhadas fundindo as porções de extremidade a extremidade, podem representar um conjunto de sequência de uma sequência de DNA maior do que cada uma das porções. Por exemplo, duas ou mais porções contíguas podem representar um genoma intacto, cromossomo, gene, íntron, éxon ou seu segmento. Em algumas modalidades um nível é determinado a partir de uma coleção (por exemplo, um conjunto) de porções contíguas e/ou porções não-contíguos.[292]In some embodiments, a level is determined for normalized or non-normalized counts of portions that are contiguous. In some embodiments, portions (eg, a set of portions) that are contiguous represent neighboring segments of a genome or neighboring segments of a chromosome or gene. For example, two or more contiguous portions, when aligned by merging the portions end to end, can represent a sequence set of DNA sequence greater than each of the portions. For example, two or more contiguous portions may represent an intact genome, chromosome, gene, intron, exon, or segment thereof. In some embodiments a tier is determined from a collection (eg, a set) of contiguous portions and/or non-contiguous portions.

Diferentes níveisdifferent levels

[293]Em algumas modalidades, um perfil de contagens normalizadas compreende um nível (por exemplo, um primeiro nível) significativamente diferente do outro nível (por exemplo, um segundo nível) dentro do perfil. Um primeiro nível pode ser maior ou menor do que um segundo nível. Em algumas modalidades, um primeiro nível é para um conjunto de partes compreendendo uma ou mais fragmentos (reads) compreendendo uma variação do número de cópia (por exemplo, uma variação do número de cópia materna , variação do número de cópia fetal, ou uma variação do número de cópia materna e uma variação do número de cópia fetal) e o segundo nível é para um conjunto de porções compreendendo fragmentos (reads) tendo substancialmente nenhuma variação do número de cópia. Em algumas modalidades, significativamente diferente refere-se a uma diferença observável. Em algumas modalidades significativamente diferente refere-se a estatisticamente diferente ou uma diferença estatisticamente significativa. Uma diferença estatisticamente significativa é, por vezes, uma avaliação estatística de uma diferença observada. Uma diferença estatisticamente significativa pode ser avaliada através de um método adequado na técnica. Qualquer limite ou faixa adequada pode ser utilizado para determinar que dois níveis sejam significativamente diferentes. Em certas modalidades, dois níveis (por exemplo, níveis médios) que diferem em cerca de 0,01 por cento ou mais (por exemplo, 0,01 por cento de um ou ambos dos valores do nível) são significativamente diferentes. Em algumas modalidades, dois níveis (por exemplo, níveis médios) que diferem em cerca de 0,1 por cento ou mais são significativamente diferentes. Em certas modalidades, dois níveis (por exemplo, níveis médios) que diferem em cerca de 0,5 por cento ou mais são significativamente diferentes. Em algumas modalidades, dois níveis (por exemplo, níveis médios) que diferem em cerca de 0,5, 0,75, 1, 1,5, 2, 2,5, 3, 3,5, 4, 4,5, 5, 5,5, 6, 6,5, 7, 7,5, 8, 8,5, 9, 9,5 ou mais do que cerca de 10% são significativamente diferentes. Em algumas modalidades, dois níveis (por exemplo, níveis médios) são significativamente diferentes e não existe sobreposição em qualquer nível e/ou nenhuma sobreposição de uma faixa definida por um valor de incerteza calculado para um ou ambos níveis. Em certas modalidades, o valor de incerteza é um desvio padrão expresso como sigma. Em algumas modalidades, dois níveis (por exemplo, níveis médios) são significativamente diferentes e eles diferem em cerca de 1 ou mais vezes o valor de incerteza (por exemplo, 1 sigma). Em algumas modalidades, dois níveis (por exemplo, níveis médios) são significativamente diferentes e eles diferente em cerca de 2 ou mais vezes o valor de incerteza (por exemplo 2 sigmas), cerca de 3 ou mais, cerca de 4 ou mais, cerca de 5 ou mais, cerca de 6 ou mais, cerca de 7 ou mais, cerca de 8 ou mais, cerca de 9 ou mais, ou cerca de 10 ou mais vezes o valor de incerteza. Em algumas modalidades, dois níveis (por exemplo, níveis médios) são significativamente diferentes quando eles diferem em cerca de 1,1, 1,2, 1,3, 1,4, 1,5, 1,6, 1,7, 1,8, 1,9, 2,0, 2,1, 2,2, 2,3, 2,4, 2,5, 2,6, 2,7, 2,8, 2,9, 3,0, 3,1, 3,2, 3,3, 3,4, 3,5, 3,6, 3,7, 3,8, 3,9, ou 4,0 vezes o valor de incerteza ou mais. Em algumas modalidades, o nível de confiança aumenta conforme a diferença entre os dois níveis aumenta. Em certas modalidades o nível de confiança diminui conforme a diferença entre os dois níveis diminui e/ou conforme o valor de incerteza aumenta. Por exemplo, algumas vezes o nível de confiança aumenta com a proporção da diferença entre níveis e o desvio padrão (por exemplo, MADs)[293] In some embodiments, a profile of normalized counts comprises a level (eg, a first tier) significantly different from another tier (eg, a second tier) within the profile. A first level can be higher or lower than a second level. In some embodiments, a first tier is for a set of parts comprising one or more fragments (reads) comprising a copy number variation (e.g., a maternal copy number variation, fetal copy number variation, or a copy number variation). of maternal copy number and one fetal copy number variation) and the second tier is for a set of portions comprising fragments (reads) having substantially no copy number variation. In some embodiments, significantly different refers to an observable difference. In some embodiments significantly different refers to statistically different or a statistically significant difference. A statistically significant difference is sometimes a statistical evaluation of an observed difference. A statistically significant difference can be assessed using a suitable method in the art. Any suitable threshold or range can be used to determine that two levels are significantly different. In certain embodiments, two levels (for example, mean levels) that differ by about 0.01 percent or more (for example, 0.01 percent of one or both of the values for the level) are significantly different. In some embodiments, two levels (eg mean levels) that differ by about 0.1 percent or more are significantly different. In certain embodiments, two levels (eg mean levels) that differ by about 0.5 percent or more are significantly different. In some embodiments, two levels (e.g., average levels) that differ by about 0.5, 0.75, 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 5.5, 6, 6.5, 7, 7.5, 8, 8.5, 9, 9.5 or more than about 10% are significantly different. In some embodiments, two levels (eg mean levels) are significantly different and there is no overlap at any level and/or no overlap within a range defined by a calculated uncertainty value for one or both levels. In certain embodiments, the uncertainty value is a standard deviation expressed as sigma. In some embodiments, two levels (eg mean levels) are significantly different and they differ by about 1 or more times the uncertainty value (eg 1 sigma). In some embodiments, two levels (e.g. mean levels) are significantly different and they differ by about 2 or more times the uncertainty value (e.g. 2 sigmas), about 3 or more, about 4 or more, about of 5 or more, about 6 or more, about 7 or more, about 8 or more, about 9 or more, or about 10 or more times the uncertainty value. In some embodiments, two levels (e.g., average levels) are significantly different when they differ by about 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3, 0, 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.7, 3.8, 3.9, or 4.0 times the uncertainty value or more. In some modalities, the confidence level increases as the difference between the two levels increases. In certain modalities the confidence level decreases as the difference between the two levels decreases and/or as the uncertainty value increases. For example, sometimes the confidence level increases with the proportion of the difference between levels and the standard deviation (e.g. MADs)

[294]Um ou mais algoritmos de previsão podem ser usados para determinar a significância ou dar sentido a dados de detecção coletados em condições variáveis que podem ser ponderados independentemente de ou dependentemente um do outro. O termo "variável" tal como aqui usado refere-se a um fator, a quantidade, ou a função de um algoritmo que tem um valor ou um conjunto de valores.[294]One or more prediction algorithms can be used to determine the significance or make sense of detection data collected under varying conditions that can be weighted independently of or dependent on one another. The term "variable" as used herein refers to a factor, quantity, or function of an algorithm that has a value or set of values.

[295]Em algumas modalidades, um primeiro conjunto de porções, frequentemente, inclui porções que são diferentes (por exemplo, não-sobrepostas com) de um segundo conjunto de porções. Por exemplo, por vezes, um primeiro nível de contagens normalizadas é significativamente diferente de um segundo nível de contagens normalizadas em um perfil, e o primeiro nível é para um primeiro conjunto de porções, o segundo nível é para um segundo conjunto de porções e as porções não se sobrepõem ao primeiro conjunto e segundo de porções. Em certas modalidades, um primeiro conjunto de porções não é um subconjunto de um segundo conjunto de porções a partir do qual um primeiro nível e segundo nível são determinados, respectivamente. Em algumas modalidades um primeiro conjunto de porções é diferente e/ou distinto de um segundo conjunto de porções a partir do qual um primeiro nível e segundo nível são determinados, respectivamente.[295] In some embodiments, a first set of portions often includes portions that are different from (eg, non-overlapping with) a second set of portions. For example, sometimes a first level of normalized counts is significantly different from a second level of normalized counts in a profile, and the first level is for a first set of portions, the second level is for a second set of portions, and the portions do not overlap with the first and second set of portions. In certain embodiments, a first set of portions is not a subset of a second set of portions from which a first tier and second tier are determined, respectively. In some embodiments a first set of portions is different and/or distinct from a second set of portions from which a first tier and second tier are determined, respectively.

[296]Em algumas modalidades um primeiro conjunto de porções é um subconjunto de um segundo conjunto de porções em um perfil. Por exemplo, por vezes, um segundo nível de contagens normalizadas para um segundo conjunto de porções em um perfil compreende contagens normalizadas de um primeiro conjunto de porções para um primeiro nível no perfil e o primeiro conjunto de porções é um subconjunto do segundo conjunto de porções no perfil. Em algumas modalidades, um nível médio, mediano ou média aritmética é derivado de um segundo nível onde o segundo nível compreende um primeiro nível. Em algumas modalidades, um segundo nível compreende um segundo conjunto de porções representando um cromossomo inteiro e um primeiro nível compreende um primeiro conjunto de porções em que o primeiro conjunto é um subconjunto do segundo conjunto de porções e o primeiro nível representa uma variação do número de cópia materna, variação do número de cópia fetal, ou uma variação do número de cópia materna e uma variação do número de cópia fetal que est á presente no cromossomo.[296]In some embodiments a first set of portions is a subset of a second set of portions in a profile. For example, sometimes a second level of normalized counts for a second set of portions in a profile comprises counts normalized from a first set of portions to a first level in the profile, and the first set of portions is a subset of the second set of portions in the profile. In some embodiments, a level mean, median or arithmetic mean is derived from a second level where the second level comprises a first level. In some embodiments, a second tier comprises a second set of portions representing an entire chromosome and a first tier comprises a first set of portions wherein the first set is a subset of the second set of portions and the first tier represents a variation in the number of maternal copy, fetal copy number variation, or a maternal copy number variation and a fetal copy number variation that is present on the chromosome.

[297]Em algumas modalidades, um valor de um segundo nível está mais próximo do valor da média, média aritmética ou mediana de um perfil de contagem de um cromossomo, ou seu segmento, do que o primeiro nível. Em algumas modalidades, um segundo nível é um nível médio de um cromossomo, uma porção de um cromossomo ou seu segmento. Em algumas modalidades, um primeiro nível é significativamente diferente de um nível predominante (por exemplo, um segundo nível), representando um cromossomo, ou seu segmento. Um perfil pode incluir vários primeiros níveis que diferem significativamente de um segundo nível, e cada primeiro nível independentemente pode ser maior ou menor do que o segundo nível. Em algumas modalidades, um primeiro nível e um segundo nível são derivados do mesmo cromossomo e o primeiro nível é maior ou menor do que o segundo nível, e o segundo nível é o nível predominante do cromossomo. Em algumas modalidades, um primeiro nível e um segundo nível são derivados do mesmo cromossomo, um primeiro nível é indicativo de uma variação do número de cópia (por exemplo, uma variação do número de cópia materna e/ou fetal, deleção, inserção, duplicação) e um segundo nível é um nível significativo ou nível predominante de porções de um cromossomo, ou seu segmento.[297]In some embodiments, a second-level value is closer to the mean, arithmetic mean, or median value of a profile count of a chromosome, or its segment, than the first level. In some embodiments, a second level is a middle level of a chromosome, a portion of a chromosome or its segment. In some embodiments, a first level is significantly different from a predominant level (eg, a second level), representing a chromosome, or segment thereof. A profile can include multiple first levels that differ significantly from a second level, and each first level can independently be higher or lower than the second level. In some embodiments, a first level and a second level are derived from the same chromosome, and the first level is higher or lower than the second level, and the second level is the predominant level of the chromosome. In some embodiments, a first level and a second level are derived from the same chromosome, a first level is indicative of a copy number variation (e.g., a maternal and/or fetal copy number variation, deletion, insertion, duplication ) and a second level is a significant level or predominant level of portions of a chromosome, or its segment.

[298]Em certas modalidades, um fragmento (read) em um segundo conjunto de porções para um segundo nível substancialmente não inclui uma variação genética (por exemplo, uma variação do número de cópia, uma variação do número de cópia materna e/ou fetal). Frequentemente, um segundo conjunto de porções para um segundo nível inclui alguma variabilidade (por exemplo, variabilidade em nível, variabilidade nas contagens para porções). Em algumas modalidades, uma ou mais porções de um conjunto de porções para um nível associado com substancialmente nenhuma variação do número de cópia inclui um ou mais fragmentos (reads) tendo uma variação do número de cópia presente em um genoma materno e/ou fetal. Por exemplo, por vezes, um conjunto de porções inclui uma variação do número de cópia que está presente em um pequeno segmento de um cromossomo (por exemplo, menos do que 10 porções) e o conjunto de porções é para um nível associado com substancialmente nenhuma variação do número de cópia. Desse modo, um conjunto de porções que inclui substancialmente nenhuma variação do número de cópia pode ainda incluir uma variação do número de cópia que está presente em menos do que cerca de 10, 9, 8, 7, 6, 5, 4, 3, 2 ou 1 porções de um nível.[298]In certain embodiments, a fragment (read) in a second set of portions for a second level substantially does not include a genetic variation (e.g., a copy number variation, a maternal and/or fetal copy number variation ). Often, a second set of servings for a second tier includes some variability (eg variability in tier, variability in counts for servings). In some embodiments, one or more portions of a set of portions for a level associated with substantially no copy number variation includes one or more fragments (reads) having a copy number variation present in a maternal and/or fetal genome. For example, sometimes a portion set includes a copy number variation that is present in a small segment of a chromosome (e.g., less than 10 portions) and the portion set is to a level associated with substantially no copy number variation. Thus, a set of portions that include substantially no copy number variation can still include a copy number variation that is present at less than about 10, 9, 8, 7, 6, 5, 4, 3, 2 or 1 servings of a level.

[299]Em algumas modalidades um primeiro nível é para um primeiro conjunto de porções e um segundo nível é para um segundo conjunto de porções e o primeiro conjunto de porções e segundo conjunto de porções são contíguos (por exemplo, adjacentes em relação à sequência de ácido nucleico de um cromossomo ou seu segmento). Em algumas modalidades o primeiro conjunto de porções e segundo conjunto de porções não são contíguos.[299] In some embodiments a first tier is for a first set of portions and a second tier is for a second set of portions and the first set of portions and second set of portions are contiguous (e.g., adjacent with respect to the sequence of portions). nucleic acid of a chromosome or its segment). In some embodiments the first set of portions and second set of portions are not contiguous.

[300]Fragmentos (reads) de sequências relativamente curtos de uma mistura de ácido nucleico materno e fetal podem ser utilizados para fornecerem contagens que podem ser transformadas em um nível e/ou um perfil. Contagens, níveis e perfis podem ser representados na forma eletrônica ou tangível e podem ser visualizados. Contagens mapeadas para porções (por exemplo, representadas como níveis e/ou perfis) podem fornecer uma representação visual de um genoma, cromossomo, ou uma porção ou um segmento de um cromossomo materno e/ou fetal que está presente no feto e/ou mulher grávida.[300]Relatively short sequence reads from a mixture of maternal and fetal nucleic acid can be used to provide counts that can be turned into a level and/or a profile. Counts, levels and profiles can be represented in electronic or tangible form and can be visualized. Counts mapped to chunks (e.g. represented as levels and/or profiles) can provide a visual representation of a genome, chromosome, or a portion or a segment of a maternal and/or fetal chromosome that is present in the fetus and/or woman pregnant.

Nível de Referência e Valor de Referência NormalizadoReference Level and Normalized Reference Value

[301]Em algumas modalidades um perfil compreende um nível de referência (por exemplo, um nível usado como uma referência). Frequentemente, um perfil de contagens normalizadas fornece um nível de referência a partir do qual níveis esperados e faixas esperadas são determinadas (ver discussão abaixo sobre níveis e faixas esperadas). Um nível de referência frequentemente é para contagens normalizadas de porções compreendendo fragmentos (reads) mapeados de ambos uma mãe e um feto. Um nível de referência é frequentemente a soma das contagens normalizadas de fragmentos (reads) mapeados de um feto e uma mãe (por exemplo, uma mulher grávida). Em algumas modalidades um nível de referência é para porções que compreendem fragmentos (reads) mapeados de uma mãe euplóide e/ou um feto euplóide. Em algumas modalidades um nível de referência é para porções compreendendo fragmentos (reads) mapeados tendo uma variação genética materna e/ou fetal (por exemplo, uma aneuploidia (por exemplo, uma trissomia), uma variação do número de cópia, uma micro-duplicação, uma micro-deleção, uma inserção). Em algumas modalidades um nível de referência é para porções que incluem substancialmente nenhuma variação genética materna e/ou fetal (por exemplo, uma aneuploidia (por exemplo, uma trissomia), uma variação do número de cópia, uma micro- duplicação, uma micro-deleção, uma inserção). Em algumas modalidades um segundo nível é usado como um nível de referência. Em certas modalidades um perfil compreende um primeiro nível de contagens normalizadas e um segundo nível de contagens normalizadas, o primeiro nível é significativamente diferente do segundo nível e o segundo nível é o nível de referência. Em certas modalidades um perfil compreende um primeiro nível de contagens normalizadas para um primeiro conjunto de porções, um segundo nível de contagens normalizadas para um segundo conjunto de porções, o primeiro conjunto de porções inclui fragmentos (reads) mapeados tendo uma variação do número de cópia materna e/ou fetal, o segundo conjunto de porções compreende fragmentos (reads) mapeados tendo substancialmente nenhuma variação do número de cópia materna e/ou variação do número de cópia fetal, e o segundo nível é um nível de referência.[301]In some embodiments a profile comprises a reference level (eg, a level used as a reference). Often, a profile of normalized counts provides a reference level from which expected levels and expected ranges are determined (see discussion below on expected levels and ranges). A reference level is often for normalized counts of portions comprising mapped reads from both a mother and a fetus. A reference level is often the sum of normalized counts of mapped fragments (reads) from a fetus and a mother (eg, a pregnant woman). In some embodiments a reference level is for portions comprising mapped fragments (reads) of an euploid mother and/or an euploid fetus. In some embodiments a reference level is for portions comprising mapped fragments (reads) having a maternal and/or fetal genetic variation (e.g. an aneuploidy (e.g. a trisomy), a copy number variation, a micro-duplication , a micro-deletion, an insertion). In some embodiments a reference level is for portions that include substantially no maternal and/or fetal genetic variation (e.g., an aneuploidy (e.g., a trisomy), a copy number variation, a micro-duplication, a micro- deletion, an insertion). In some embodiments a second level is used as a reference level. In certain embodiments a profile comprises a first level of normalized counts and a second level of normalized counts, the first level is significantly different from the second level and the second level is the reference level. In certain embodiments a profile comprises a first level of counts normalized to a first set of chunks, a second level of counts normalized to a second set of chunks, the first set of chunks including mapped reads having a copy number variation maternal and/or fetal, the second set of portions comprises mapped reads having substantially no maternal copy number variation and/or fetal copy number variation, and the second level is a reference level.

[302]Em algumas modalidades contagens mapeadas para porções de um ou mais níveis de um perfil são normalizadas de acordo com as contagens de um nível de referência. Em algumas modalidades, normalizar contagens de um nível de acordo com as contagens de um nível de referência compreende dividir as contagens de um nível pelas contagens de um nível de referência ou um múltiplo ou sua fração. As contagens normalizadas de acordo com contagens de um nível de referência, frequentemente, foram normalizadas de acordo com um outro processo (por exemplo, PERUN) e as contagens de um nível de referência, frequentemente, também foram normalizadas (por exemplo, por PERUN). Em algumas modalidades as contagens de um nível são normalizadas de acordo com as contagens de um nível de referência e as contagens do nível de referência podem se adaptar a um valor adequado ou antes ou após normalizar. O processo de ajustar as contagens de um nível de referência pode compreender qualquer constante adequada (isto é, número) e qualquer manipulação matemática adequada pode ser usada para as contagens de um nível de referência.[302] In some embodiments counts mapped to portions of one or more levels of a profile are normalized according to counts of a reference level. In some embodiments, normalizing one-level counts to one-level counts comprises dividing one-level counts by one-level counts or a multiple or fraction thereof. Counts normalized according to counts from a reference level have often been normalized according to another process (e.g. PERUN) and counts from a reference level have often also been normalized (e.g. by PERUN) . In some embodiments the counts of a level are normalized according to the counts of a reference level and the counts of the reference level can adapt to a suitable value either before or after normalizing. The process of adjusting the counts of a reference level can comprise any suitable constant (ie number) and any suitable mathematical manipulation can be used for the counts of a reference level.

[303]O valor de referência normalizado (NRV) é frequentemente determinado de acordo com as contagens normalizadas de um nível de referência. Determinar um NRV pode compreender qualquer processo de normalização adequada (por exemplo, manipulação matemática) aplicado às contagens de um nível de referência, quando o mesmo processo de normalização é usado para normalizar as contagens de outros níveis dentro do mesmo perfil. Determinar um NRV compreende frequentemente dividir um nível de referência por eles mesmo. Determinar um NRV compreende frequentemente dividir um nível de referência por um múltiplo de si. Determinar um NRV compreende frequentemente dividir um nível de referência pela soma ou diferença do nível de referência e uma constante (por exemplo, um número qualquer).[303]The normalized reference value (NRV) is often determined according to the normalized counts of a reference level. Determining an NRV can comprise any suitable normalization process (eg mathematical manipulation) applied to counts from a reference level, when the same normalization process is used to normalize counts from other levels within the same profile. Determining an NRV often involves dividing a reference level by itself. Determining an NRV often involves dividing a reference level by a multiple of si. Determining an NRV often involves dividing a reference level by the sum or difference of the reference level and a constant (eg any number).

[304]Um NRV é por vezes referido como um valor nulo. Um NRV pode ser qualquer valor adequado. Em algumas modalidades, um NRV é qualquer valor diferente de zero. Em algumas modalidades um NRV é um número inteiro. Em algumas modalidades um NRV é um número inteiro positivo. Em algumas modalidades, um NRV é igual a 1, 10, 100 ou 1000. Frequentemente, um NRV é igual a 1. Em algumas modalidades um NRV é igual a zero. As contagens de um nível de referência podem ser normalizadas para qualquer NRV adequado. Em algumas modalidades, as contagens de um nível de referência são normalizadas para um NRV de zero. Frequentemente, as contagens de um nível de referência são normalizadas para um NRV de 1.[304]An NRV is sometimes referred to as a null value. An NRV can be any suitable value. In some embodiments, an NRV is any value other than zero. In some embodiments an NRV is an integer. In some embodiments an NRV is a positive integer. In some embodiments, an NRV equals 1, 10, 100, or 1000. Often, an NRV equals 1. In some embodiments, an NRV equals zero. Counts from a reference level can be normalized to any suitable NRV. In some embodiments, counts from a reference level are normalized to an NRV of zero. Often, counts from a reference level are normalized to an NRV of 1.

Níveis esperadosexpected levels

[305]Um nível esperado é, por vezes, um nível pré- definido (por exemplo, um nível teórico, nível previsto). Um "nível esperado" é por vezes aqui referido como um "valor de nível pré-determinado". Em algumas modalidades, um nível esperado é um valor previsto para um nível de contagens normalizadas para um conjunto de porções que incluem a variação do número de cópia. Em certas modalidades, um nível esperado é determinado por um conjunto de porções que inclui praticamente nenhuma variação do número de cópia. Um nível esperado pode ser determinado em relação à ploidia do cromossomo (por exemplo, 0, 1, 2 (isto é, diplóide), 3 ou 4 cromossomos) ou um microploidia (deleção homozigótica ou heterozigótica, duplicação, inserção ou ausência da mesma). Frequentemente, um nível esperado é determinado para uma microploidia materna (por exemplo, uma variação do número de cópia materna e/ou fetal).[305]An expected level is sometimes a predefined level (eg theoretical level, predicted level). An "expected level" is sometimes referred to herein as a "predetermined level value". In some embodiments, an expected level is a predicted value for a level of normalized counts for a set of portions that include the copy number variation. In certain embodiments, an expected level is determined by a set of portions that include virtually no copy number variation. An expected level can be determined in terms of chromosome ploidy (e.g. 0, 1, 2 (i.e. diploid), 3 or 4 chromosomes) or a microploidy (homozygous or heterozygous deletion, duplication, insertion or absence thereof) . Often, an expected level is determined for maternal microploidy (eg, a maternal and/or fetal copy number variation).

[306]Um nível esperado para uma variação genética ou uma variação do número de cópia pode ser determinado por qualquer modo adequado. Frequentemente, um nível esperado é determinado por uma manipulação matemática adequada de um nível (por exemplo, contagens mapeadas para um conjunto de porções para um nível). Em algumas modalidades um nível esperado é determinado através do uso de uma constante por vezes referida como uma constante do nível esperado. Um nível esperado para a variação do número de cópia é por vezes calculado multiplicando um nível de referência, contagens normalizadas de um nível de referência ou um NRV por uma constante do nível esperado, adicionando uma constante do nível esperado, subtraindo uma constante do nível esperado, dividindo por uma constante do nível esperado, ou por uma combinação dos mesmos. Frequentemente, um nível esperado (por exemplo, um nível esperado de uma variação do número de cópia materna e/ou fetal) determinado para o mesmo sujeito, amostra ou grupo de teste é determinado de acordo com o mesmo nível de referência ou NRV.[306]An expected level for a genetic variation or a copy number variation may be determined in any suitable way. Often, an expected level is determined by a proper mathematical manipulation of a level (for example, counts mapped to a set of servings for a level). In some embodiments an expected level is determined through the use of a constant sometimes referred to as an expected level constant. An expected level for copy number variation is sometimes calculated by multiplying a reference level, normalized counts of a reference level, or an NRV by an expected level constant, adding an expected level constant, subtracting an expected level constant , dividing by a constant of the expected level, or by a combination thereof. Often, an expected level (eg, an expected level of a maternal and/or fetal copy number variation) determined for the same subject, sample, or test group is determined according to the same reference level or NRV.

[307]Frequentemente, um nível esperado é determinado multiplicando um nível de referência, contagens normalizadas de um nível de referência ou um NRV por uma constante do nível esperado onde o nível de referência, contagens normalizadas de um nível de referência ou NRV não é igual a zero. Em algumas modalidades um nível esperado é determinado pela adição de uma constante do nível esperado ao nível de referência, contagens normalizadas de um nível de referência ou um NRV que é igual a zero. Em algumas modalidades, o nível esperado, contagens normalizadas de um nível de referência, NRV e constante do nível esperado são ajustáveis. O processo de ajuste pode compreender qualquer constante adequada (isto é, número) e qualquer manipulação matemática adequada, onde o mesmo processo de ajuste é aplicado a todos os valores sob consideração.[307]Often, an expected level is determined by multiplying a reference level, normalized counts of a reference level, or an NRV by an expected level constant where the reference level, normalized counts of a reference level, or NRV is not equal to zero. In some embodiments an expected level is determined by adding an expected level constant to the reference level, normalized counts from a reference level, or an NRV that equals zero. In some embodiments, the expected level, normalized counts of a reference level, NRV, and expected level constant are adjustable. The fitting process can comprise any suitable constant (ie number) and any suitable mathematical manipulation, where the same fitting process is applied to all values under consideration.

Constante do nível esperadoExpected level constant

[308]Uma constante do nível esperado pode ser determinada por um método adequado. Em algumas modalidades uma constante do nível esperado é determinada arbitrariamente. Frequentemente, uma constante do nível esperado é determinada empiricamente. Em algumas modalidades uma constante do nível esperado é determinada de acordo com uma manipulação matemática. Em algumas modalidades uma constante do nível esperado é determinada de acordo com uma referência (por exemplo, um genoma de referência, uma amostra de referência, dados do teste de referência). Em algumas modalidades, uma constante do nível esperado é pré-determinada para um nível representativo da presença ou ausência de uma variação genética ou variação do número de cópia (por exemplo, uma duplicação, inserção ou deleção). Em algumas modalidades, uma constante do nível esperado é pré-determinada para um nível representativo da presença ou ausência de uma variação do número de cópia materna, variação do número de cópia fetal ou uma variação do número de cópia materna e uma variação do número de cópia fetal. Uma constante do nível esperado para a variação do número de cópia pode ser qualquer constante ou um conjunto de constantes adequado.[308]A constant of the expected level can be determined by a suitable method. In some embodiments a constant of the expected level is determined arbitrarily. Often, a constant of the expected level is determined empirically. In some embodiments a constant of the expected level is determined according to a mathematical manipulation. In some embodiments an expected level constant is determined against a reference (e.g., a reference genome, a reference sample, reference test data). In some embodiments, an expected level constant is predetermined to a level representative of the presence or absence of a genetic variation or copy number variation (e.g., a duplication, insertion, or deletion). In some embodiments, an expected level constant is predetermined for a level representative of the presence or absence of a maternal copy number change, fetal copy number change, or a maternal copy number change and a fetal copy number change. fetal copy. An expected level constant for copy number variance can be any constant or a suitable set of constants.

[309]Em algumas modalidades, a constante do nível esperado para uma duplicação homozigótica (por exemplo, uma duplicação homozigótica) pode ser de cerca de 1,6 a cerca de 2,4, de cerca de 1,7 a cerca de 2,3, de cerca de 1,8 a cerca de 2,2, ou de cerca de 1,9 a cerca de 2,1. Em algumas modalidades a constante do nível esperado para uma duplicação homozigótica é de cerca de 1,6, 1,7, 1,8, 1,9, 2,0, 2,1, 2,2, 2,3 ou cerca de 2,4. Frequentemente, a constante do nível esperado para uma duplicação homozigótica é de cerca de 1,90, 1,92, 1,94, 1,96, 1,98, 2,0, 2,02, 2,04, 2,06, 2,08 ou cerca de 2,10. Frequentemente, a constante do nível esperado para uma duplicação homozigótica é cerca de 2.[309] In some embodiments, the expected level constant for a homozygous duplication (e.g., a homozygous duplication) may be from about 1.6 to about 2.4, from about 1.7 to about 2, 3, from about 1.8 to about 2.2, or from about 1.9 to about 2.1. In some embodiments the expected level constant for a homozygous duplication is about 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3 or about 2,4. Often, the expected level constant for a homozygous duplication is about 1.90, 1.92, 1.94, 1.96, 1.98, 2.0, 2.02, 2.04, 2.06 , 2.08 or about 2.10. Often, the expected level constant for a homozygous duplication is around 2.

[310]Em algumas modalidades, a constante do nível esperado para uma duplicação heterozigótica (por exemplo, uma duplicação homozigótica) é de cerca de 1,2 a cerca de 1,8, de cerca de 1,3 a cerca de 1,7, ou de cerca de 1,4 a cerca de 1,6. Em algumas modalidades a constante do nível esperado para uma duplicação heterozigótica é de cerca de 1,2, 1,3, 1,4, 1,5, 1,6, 1,7 ou cerca de 1,8. Frequentemente, a constante do nível esperado para uma duplicação heterozigótica é de cerca de 1,40, 1,42, 1,44, 1,46, 1,48, 1,5, 1,52, 1,54, 1,56, 1,58 ou cerca de 1,60. Em algumas modalidades, a constante do nível esperado para uma duplicação heterozigótica é cerca de 1,5.[310] In some embodiments, the expected level constant for a heterozygous duplication (e.g., a homozygous duplication) is from about 1.2 to about 1.8, from about 1.3 to about 1.7 , or from about 1.4 to about 1.6. In some embodiments the expected level constant for a heterozygous duplication is about 1.2, 1.3, 1.4, 1.5, 1.6, 1.7 or about 1.8. Often, the expected level constant for a heterozygous duplication is about 1.40, 1.42, 1.44, 1.46, 1.48, 1.5, 1.52, 1.54, 1.56 , 1.58 or about 1.60. In some embodiments, the expected level constant for a heterozygous duplication is about 1.5.

[311]Em algumas modalidades, a constante do nível esperado para a ausência de uma variação do número de cópia (por exemplo, a ausência de uma variação do número de cópia materna e/ou variação do número de cópia fetal) é de cerca de 1,3 a cerca de 0,7, de cerca de 1,2 a cerca de 0,8, ou de cerca de 1,1 a cerca de 0,9. Em algumas modalidades a constante do nível esperado para a ausência de uma variação do número de cópia é de cerca de 1,3, 1,2, 1,1, 1,0, 0,9, 0,8 ou cerca de 0,7. Frequentemente a constante do nível esperado para a ausência de uma variação do número de cópia é de cerca de 1,09, 1,08, 1,06, 1,04, 1,02, 1,0, 0,98, 0,96, 0,94, ou cerca de 0,92. Em algumas modalidades, a constante do nível esperado para a ausência de uma variação do número de cópia é cerca de 1.[311]In some embodiments, the expected level constant for the absence of a copy number change (e.g., the absence of a maternal copy number change and/or fetal copy number change) is about 1.3 to about 0.7, from about 1.2 to about 0.8, or from about 1.1 to about 0.9. In some embodiments the expected level constant for the absence of a copy number change is about 1.3, 1.2, 1.1, 1.0, 0.9, 0.8 or about 0. 7. Often the expected level constant for the absence of a copy number change is about 1.09, 1.08, 1.06, 1.04, 1.02, 1.0, 0.98, 0, 96, 0.94, or about 0.92. In some embodiments, the expected level constant for the absence of a copy number change is about 1.

[312]Em algumas modalidades, a constante do nível esperado para uma deleção heterozigótica (por exemplo, uma deleção heterozigótica materna, fetal ou materna e fetal) é de cerca de 0,2 a cerca de 0,8, de cerca de 0,3 a cerca de 0,7, ou de cerca de 0,4 a cerca de 0,6. Em algumas modalidades a constante do nível esperado para uma deleção heterozigótica é de cerca de 0,2, 0,3, 0,4, 0,5, 0,6, 0,7 ou cerca de 0,8. Frequentemente a constante do nível esperado para uma deleção heterozigótica é de cerca de 0,40, 0,42, 0,44, 0,46, 0,48, 0,5, 0,52, 0,54, 0,56, 0,58 ou cerca de 0,60. Em algumas modalidades, a constante do nível esperado para uma deleção heterozigótica é cerca de 0,5.[312]In some embodiments, the expected level constant for a heterozygous deletion (eg, a maternal, fetal, or maternal and fetal heterozygous deletion) is from about 0.2 to about 0.8, from about 0, 3 to about 0.7, or from about 0.4 to about 0.6. In some embodiments the expected level constant for a heterozygous deletion is about 0.2, 0.3, 0.4, 0.5, 0.6, 0.7 or about 0.8. Often the expected level constant for a heterozygous deletion is about 0.40, 0.42, 0.44, 0.46, 0.48, 0.5, 0.52, 0.54, 0.56, 0.58 or about 0.60. In some embodiments, the expected level constant for a heterozygous deletion is about 0.5.

[313]Em algumas modalidades, a constante do nível esperado para uma deleção homozigótica (por exemplo, uma deleção homozigótica) pode ser de cerca de -0,4 a cerca de 0,4, de cerca de -0,3 a cerca de 0,3, de cerca de -0,2 a cerca de 0,2, ou de cerca de -0,1 a cerca de 0,1. Em algumas modalidades a constante do nível esperado para uma deleção homozigótica é de cerca de -0,4, -0,3, -0,2, -0,1, 0,0, 0,1, 0,2, 0,3 ou cerca de 0,4. Frequentemente, a constante do nível esperado para uma deleção homozigótica é de cerca de -0,1, -0,08, -0,06, -0,04, -0,02, 0,0, 0,02, 0,04, 0,06, 0,08 ou cerca de 0,10. Frequentemente, a constante do nível esperado para uma deleção homozigótica é cerca de 0.[313]In some embodiments, the expected level constant for a homozygous deletion (e.g., a homozygous deletion) may be from about -0.4 to about 0.4, from about -0.3 to about 0.3, from about -0.2 to about 0.2, or from about -0.1 to about 0.1. In some embodiments the expected level constant for a homozygous deletion is about -0.4, -0.3, -0.2, -0.1, 0.0, 0.1, 0.2, 0, 3 or about 0.4. Often, the expected level constant for a homozygous deletion is around -0.1, -0.08, -0.06, -0.04, -0.02, 0.0, 0.02, 0, 04, 0.06, 0.08 or about 0.10. Often, the expected level constant for a homozygous deletion is around 0.

Faixa do nível esperadoExpected level range

[314]Em algumas modalidades, a presença ou ausência de uma variação genética ou variação do número de cópia (por exemplo, uma variação do número de cópia materna, variação do número de cópia fetal, ou uma variação do número de cópia materno e uma variação do número de cópia fetal) é determinada por um nível que se situa dentro ou fora de uma faixa do nível esperado. Uma faixa do nível esperado é frequentemente determinada de acordo com um nível esperado. Em algumas modalidades uma faixa do nível esperado é determinada para um nível que compreende substancialmente qualquer variação genética ou substancialmente nenhuma variação do número de cópia. Um método adequado pode ser usado para determinar uma faixa do nível esperado.[314]In some embodiments, the presence or absence of a genetic variation or copy number variation (e.g., a maternal copy number variation, fetal copy number variation, or a maternal copy number variation and a fetal copy number variation) is determined by a level that falls within or outside a range of the expected level. An expected level range is often determined according to an expected level. In some embodiments a range of the expected level is determined to be a level comprising substantially no genetic variation or substantially no copy number variation. A suitable method can be used to determine a range of the expected level.

[315]Em algumas modalidades, uma faixa do nível esperado é definida de acordo com um valor de incerteza adequado calculado para um nível. Exemplos não-limitativos de um valor de incerteza são um desvio padrão, erro padrão, variância calculada, valor de p, e desvio médio absoluto (MAD). Em algumas modalidades, uma faixa do nível esperado para uma variação genética ou uma variação do número de cópia é determinada, em parte, através do cálculo do valor de incerteza para um nível (por exemplo, um primeiro nível, um segundo nível, um primeiro nível e um segundo nível). Em algumas modalidades uma faixa de nível esperado é definida de acordo com um valor de incerteza calculado para um perfil (por exemplo, um perfil de contagens normalizadas para um cromossomo ou seu segmento). Em algumas modalidades, um valor de incerteza é calculado para um nível que compreende substancialmente nenhuma variação genética ou substancialmente nenhuma variação do número de cópia. Em algumas modalidades, um valor incerteza é calculada para um primeiro nível, um segundo nível ou um primeiro nível e um segundo nível. Em algumas modalidades um valor de incerteza é determinado por um primeiro nível, um segundo nível ou um segundo nível compreende um primeiro nível.[315]In some embodiments, a range of the expected level is defined according to a suitable uncertainty value calculated for a level. Non-limiting examples of an uncertainty value are a standard deviation, standard error, calculated variance, p-value, and mean absolute deviation (MAD). In some embodiments, a range of the expected level for a genetic variation or a copy number variation is determined, in part, by calculating the uncertainty value for a level (e.g., a first level, a second level, a first level). level and a second level). In some embodiments an expected level range is defined according to an uncertainty value calculated for a profile (eg a profile of normalized counts for a chromosome or its segment). In some embodiments, an uncertainty value is calculated for a level comprising substantially no genetic variation or substantially no copy number variation. In some embodiments, an uncertainty value is calculated for a first level, a second level, or a first level and a second level. In some embodiments an uncertainty value is determined by a first level, a second level or a second level comprises a first level.

[316]Uma faixa do nível esperado é por vezes calculada, em parte, pela multiplicação, adição, subtração, ou divisão de um valor de incerteza por uma constante (por exemplo, uma constante pré-determinada) n. Um procedimento matemático adequado ou combinação de processos pode ser usado. A constante n (por exemplo, constante pré- determinada n) é por vezes referida como um intervalo de confiança. Um intervalo de confiança selecionado é determinado de acordo com a constante n que é selecionada. A constante n (por exemplo, a constante n pré-determinada, o intervalo de confiança) pode ser determinada por uma maneira adequada. A constante n pode ser um número ou a fração de um número maior do que zero. A constante n pode ser um número inteiro. Frequentemente a constante n é um número menor do que 10. Em algumas modalidades a constante n é um número menor do que cerca de 10, menor do que cerca de 9, menor do que cerca de 8, menor do que cerca de 7, menor do que cerca de 6, a menor do que cerca de 5, menor do que cerca de 4, menor do que cerca de 3, ou menor do que cerca de 2. Em algumas modalidades a constante n é cerca de 10, 9,5, 9, 8,5, 8, 7,5, 7, 6,5, 6, 5,5, 5, 4,5, 4, 3,5, 3, 2,5, 2 ou 1. A constante n pode ser determinada empiricamente a partir dos dados derivados dos sujeitos (uma mulher grávida e/ou um feto) com uma disposição genética conhecida.[316]A range of the expected level is sometimes calculated, in part, by multiplying, adding, subtracting, or dividing an uncertainty value by a constant (eg, a predetermined constant) n. A suitable mathematical procedure or combination of processes can be used. The constant n (eg predetermined constant n) is sometimes referred to as a confidence interval. A selected confidence interval is determined according to the constant n that is selected. The constant n (eg the predetermined constant n, the confidence interval) can be determined in a suitable way. The constant n can be a number or the fraction of a number greater than zero. The constant n can be an integer. Often the constant n is a number less than 10. In some embodiments the constant n is a number less than about 10, less than about 9, less than about 8, less than about 7, less than about 6, less than about 5, less than about 4, less than about 3, or less than about 2. In some embodiments the constant n is about 10, 9.5 , 9, 8.5, 8, 7.5, 7, 6.5, 6, 5.5, 5, 4.5, 4, 3.5, 3, 2.5, 2 or 1. The constant n can be empirically determined from data derived from subjects (a pregnant woman and/or a fetus) with a known genetic disposition.

[317]Frequentemente, um valor de incerteza e constante n definem uma faixa (por exemplo, um corte de incerteza). Por exemplo, por vezes um valor de incerteza é um desvio padrão (por exemplo, +/- 5) e é multiplicado por uma constante n (por exemplo, um intervalo de confiança), definindo desse modo uma faixa de corte ou incerteza (por exemplo, 5n a -5n).[317]Often, an uncertainty value and constant n define a range (for example, an uncertainty cutoff). For example, sometimes an uncertainty value is a standard deviation (e.g. +/- 5) and is multiplied by a constant n (e.g. a confidence interval), thereby defining a cut-off or uncertainty range (e.g. example, 5n to -5n).

[318]Em algumas modalidades, uma faixa do nível esperado de variação genética (por exemplo, uma variação do número de cópia materna, variação do número de cópia fetal, ou uma variação do número de cópia materna e uma variação do número de cópia fetal) é a soma de um nível esperado mais uma constante n vezes a incerteza (por exemplo, n x Sigma (por exemplo, 6 Sigma)). Em algumas modalidades a faixa do nível esperado para uma variação genética ou variação do número de cópia designada por k pode ser definida pela seguinte fórmula: Fórmula R: (Faixa de nível esperado}k = (nível esperado}k + no onde o é um valor de incerteza, n é uma constante (por exemplo, uma constante pré-determinada) e a faixa do nível esperado e nível esperado são para a variação genética k (por exemplo, k = uma deleção heterozigótica, por exemplo, k = a ausência de uma genética variação). Por exemplo, para um nível esperado igual a 1 (por exemplo, ausência de uma variação do número cópia), um valor de incerteza (por exemplo, o) igual a +/-0,05, e n = 3, a faixa do nível esperado é definida como 1,15 a 0,85. Em algumas modalidades, a faixa do nível esperado para uma duplicação heterozigótica é determinada como 1,35 a 1,65 quando o nível esperado para uma duplicação heterozigótica é 1,5, n = 3, e o valor de incerteza o é +/- 0,05. Em algumas modalidades a faixa do nível esperado para uma deleção heterozigótica é determinada como 0,65 a 0,35, quando o nível esperado para uma duplicação heterozigótica é 0,5, n = 3, e o valor de incerteza o é -/+ 0,05. Em algumas modalidades a faixa do nível esperado para uma duplicação homozigótica é determinada como 2,15 a 1,85 quando o nível esperado para uma duplicação heterozigótica é de 2,0, n = 3 e o valor de incerteza o é +/- 0,05. Em algumas modalidades a faixa do nível esperado para uma deleção homozigótica é determinada como 0,15 a -0,15 quando o nível esperado para uma duplicação heterozigótica é 0,0, n = 3 e o valor de incerteza o é +/- 0,05.[318]In some embodiments, a range of the expected level of genetic variation (for example, one maternal copy number variation, fetal copy number variation, or one maternal copy number variation and one fetal copy number variation ) is the sum of an expected level plus a constant n times the uncertainty (e.g. n x sigma (e.g. 6 sigma)). In some embodiments the expected level range for a genetic variation or copy number variation designated by k can be defined by the following formula: Formula R: (Expected level range}k = (expected level}k + no where o is a uncertainty value, n is a constant (e.g., a predetermined constant) and the expected level range and expected level are for the genetic variation k (e.g., k = a heterozygous deletion, e.g., k = the absence of a genetic variation). For example, for an expected level equal to 1 (for example, absence of a copy number variation), an uncertainty value (for example, o) equal to +/-0.05, and n = 3, the expected level range is defined as 1.15 to 0.85. In some embodiments, the expected level range for a heterozygous duplication is defined as 1.35 to 1.65 when the expected level for a heterozygous duplication is 1.5, n = 3, and the uncertainty value o is +/- 0.05. In some embodiments the expected level range for a heterozygous deletion is determined to be 0.65 to 0.35, when the expected level for a heterozygous doubling is 0.5, n = 3, and the uncertainty value o is -/+ 0.05. In some embodiments the expected level range for a homozygous duplication is determined to be 2.15 to 1.85 when the expected level for a heterozygous duplication is 2.0, n = 3 and the uncertainty value o is +/- 0 .05. In some embodiments the expected level range for a homozygous deletion is determined to be 0.15 to -0.15 when the expected level for a heterozygous duplication is 0.0, n = 3 and the uncertainty value o is +/- 0 .05.

[319]Em algumas modalidades uma faixa do nível esperado para uma variação do número de cópia homozigótica (por exemplo, uma variação do número de cópia homozigótica materna, fetal ou materno e fetal) é determinada, em parte, de acordo com uma faixa do nível esperado para variação do número de cópia heterozigótica correspondente. Por exemplo, às vezes uma faixa do nível esperado para uma duplicação homozigótica compreende todos os valores maiores do que um limite superior de uma faixa do nível esperado para uma duplicação heterozigótica. Em algumas modalidades uma faixa do nível esperado para uma duplicação homozigótica compreende todos os valores maiores do que ou iguais a um limite superior de uma faixa do nível esperado para uma duplicação heterozigótica. Em algumas modalidades uma faixa do nível esperado para uma duplicação homozigótica compreende todos os valores maiores do que um limite superior de uma faixa do nível esperado para uma duplicação heterozigótica e menos do que o limite superior definido pela fórmula R em que a é um valor de incerteza e é um valor positivo, n é uma constante e k é uma duplicação homozigótica. Em algumas modalidades uma faixa do nível esperado para uma duplicação homozigótica compreende todos os valores maiores do que ou igual a um limite superior de uma faixa do nível esperado para uma duplicação heterozigótica e menos do que ou igual ao limite superior definido pela fórmula R em que a é um valor de incerteza, a é um valor positivo, n é uma constante e k é uma duplicação homozigótica.[319]In some embodiments a range of the expected level for a homozygous copy number variation (for example, a maternal, fetal, or maternal and fetal homozygous copy number variation) is determined, in part, according to a range of the expected level of variation in the corresponding heterozygous copy number. For example, sometimes a range of the expected level for a homozygous duplication comprises all values greater than an upper bound of a range of the expected level for a heterozygous duplication. In some embodiments a range of the expected level for a homozygous duplication comprises all values greater than or equal to an upper limit of a range of the expected level for a heterozygous duplication. In some embodiments a range of the expected level for a homozygous duplication comprises all values greater than an upper limit of a range of the expected level for a heterozygous duplication and less than the upper limit defined by the formula R where a is a value of uncertainty e is a positive value, n is a constant, and k is a homozygous doubling. In some embodiments a range of the expected level for a homozygous duplication comprises all values greater than or equal to an upper limit of a range of the expected level for a heterozygous duplication and less than or equal to the upper limit defined by the formula R where a is an uncertainty value, a is a positive value, n is a constant, and k is a homozygous doubling.

[320]Em algumas modalidades, uma faixa do nível esperado para uma deleção homozigótica compreende todos os valores menores do que de um limite inferior de um faixa do nível esperado para uma deleção heterozigótica. Em algumas modalidades uma faixa do nível esperado para uma deleção homozigótica compreende todos os valores menores do que ou iguais a um limite inferior de uma faixa do nível esperado para uma deleção heterozigótica. Em algumas modalidades uma faixa do nível esperado para uma deleção homozigótica compreende todos os valores menores do que um limite inferior de uma faixa do nível esperado para uma deleção heterozigótica e maiores do que o limite inferior definido pela fórmula R em que a é um valor de incerteza, a é um valor negativo, n é uma constante e k é uma deleção homozigótica. Em algumas modalidades uma faixa do nível esperado para uma deleção homozigótica compreende todos os valores menores do que ou iguais a um limite inferior de uma faixa do nível esperado para uma deleção heterozigótica e maiores do que ou iguais ao limite inferior definido pela fórmula R em que a é um valor de incerteza valor, a é um valor negativo, n é uma constante e k é uma deleção homozigótica.[320]In some embodiments, a range of the expected level for a homozygous deletion comprises all values less than a lower bound of a range of the expected level for a heterozygous deletion. In some embodiments a range of the expected level for a homozygous deletion comprises all values less than or equal to a lower bound of a range of the expected level for a heterozygous deletion. In some embodiments, a range of the expected level for a homozygous deletion comprises all values less than a lower limit of a range of the expected level for a heterozygous deletion and greater than the lower limit defined by the formula R where a is a value of uncertainty, a is a negative value, n is a constant, and k is a homozygous deletion. In some embodiments a range of the expected level for a homozygous deletion comprises all values less than or equal to a lower limit of a range of the expected level for a heterozygous deletion and greater than or equal to the lower limit defined by the formula R where a is an uncertainty value, a is a negative value, n is a constant, and k is a homozygous deletion.

[321]Um valor de incerteza pode ser usado para determinar um valor limite. Em algumas modalidades, uma faixa (por exemplo, uma faixa limite) é obtida pelo cálculo do valor de incerteza determinado a partir de contagens brutas, filtradas e/ou normalizadas. Uma faixa pode ser determinada multiplicando o valor por um nível de incerteza (por exemplo, contagens normalizadas de um nível) por uma constante pré-determinada (por exemplo, 1, 2, 3, 4, 5, 6, etc.), que representa o múltiplo de incerteza (por exemplo, número de desvios padrão) escolhido como limite de corte (por exemplo, multiplicar por 3 para 3 desvios padrão), por meio de que é gerado uma faixa, em algumas modalidades. Uma faixa pode ser determinada através da adição e/ou subtração de um valor (por exemplo, um valor pré-determinado, um valor de incerteza, um valor de incerteza multiplicado por uma constante pré-determinada) e/ou a partir de um nível em que uma faixa é gerada, em algumas modalidades. Por exemplo, para um nível igual a 1, um desvio padrão de +/0,2, onde uma constante pré-determinada é 3, a faixa pode ser calculada como (1 + 3(0,2)) a (1 + 3(-0,2)) ou 1,6 a 0,4. Uma faixa, por vezes, pode definir uma faixa esperada ou faixa do nível esperado para a variação do número de cópia. Em certas modalidades, algumas ou a totalidade das porções que excedem um valor limite, estando fora de uma faixa ou estando dentro de uma faixa de valores, são removidas como parte de, antes de, ou após um processo de normalização. Em algumas modalidades, algumas ou a totalidade das porções que excedem um valor limite calculado, estando fora de uma faixa ou estando dentro de uma faixa, são ponderadas ou ajustadas como parte de, ou antes do processo de normalização ou classificação. Exemplos de ponderação são aqui descritos. Os termos "dados redundantes", e "fragmentos (reads) mapeados redundantes" como usados aqui se referem aos fragmentos (reads) de sequências derivados da amostra que são identificados como tendo sido já atribuídos a um local genômico (por exemplo, posição base) e/ou contadas por uma porção.[321]An uncertainty value can be used to determine a threshold value. In some embodiments, a range (eg, a limiting range) is obtained by computing the uncertainty value determined from raw, filtered, and/or normalized counts. A range can be determined by multiplying the value for a level of uncertainty (e.g., normalized one-level counts) by a predetermined constant (e.g., 1, 2, 3, 4, 5, 6, etc.), which represents the uncertainty multiple (for example, number of standard deviations) chosen as the cut-off limit (for example, multiplying by 3 for 3 standard deviations), through which a band is generated, in some modalities. A range can be determined by adding and/or subtracting a value (e.g. a predetermined value, an uncertainty value, an uncertainty value multiplied by a predetermined constant) and/or from a level in which a track is generated, in some embodiments. For example, for a level equal to 1, a standard deviation of +/0.2, where a predetermined constant is 3, the range can be calculated as (1 + 3(0.2)) to (1 + 3 (-0.2)) or 1.6 to 0.4. A range can sometimes define an expected range or expected level range for copy number variation. In certain embodiments, some or all of the portions that exceed a threshold value, being outside a range or being within a range of values, are removed as part of, before, or after a normalization process. In some embodiments, some or all of the portions that exceed a calculated threshold value, being outside a range or being within a range, are weighted or adjusted as part of, or prior to, the normalization or classification process. Weighting examples are described here. The terms "redundant data", and "redundant mapped reads" as used herein refer to sample-derived sequence reads that are identified as having already been assigned a genomic location (e.g., base position). and/or counted per portion.

[322]Em algumas modalidades um valor de incerteza é determinado de acordo com a fórmula que se segue: Onde Z representa o desvio padronizado entre dois níveis, L é o nível médio (ou mediano) e sigma é o desvio padrão (ou MAD). O índice O indica um segmento de um perfil (por exemplo, um segundo nível, um cromossomo, um NRV, um "nível euplóide", um nível de ausência de uma variação do número de cópia), e A indica um outro segmento de um perfil (por exemplo, um primeiro nível, um nível que representa uma variação do número de cópia, um nível que representa uma aneuploidia (por exemplo, uma trissomia). A variável No representa o número total de porções no segmento do perfil indicado pelo índice O. NA representa o número total de porções no segmento do perfil indicado pelo índice A.[322]In some embodiments an uncertainty value is determined according to the following formula: Where Z represents the standard deviation between two levels, L is the mean (or median) level, and sigma is the standard deviation (or MAD). The index O indicates a segment of a profile (for example, a second level, a chromosome, an NRV, an "euploid level", a level of absence of a copy number variation), and A indicates another segment of a profile (for example, a first level, a level representing a copy number variation, a level representing an aneuploidy (for example, a trisomy). The variable No represents the total number of portions in the segment of the profile indicated by the index O. NA represents the total number of servings in the profile segment indicated by the A index.

Categorizando uma variação do número de cópiaCategorizing a Copy Number Variation

[323]Um nível (por exemplo, um primeiro nível) que difere significativamente de outro nível (por exemplo, um segundo nível) pode frequentemente ser categorizado como uma variação do número de cópia (por exemplo, uma variação do número de cópia materna e/ou fetal, uma variação do número de cópia fetal, uma deleção, duplicação, inserção) de acordo com um faixa do nível esperado. Em algumas modalidades, a presença de uma variação do número de cópia é categorizada quando um primeiro nível é significativamente diferente de um segundo nível e o primeiro nível está dentro da faixa do nível esperado para uma variação do número de cópia. Por exemplo, uma variação do número de cópia (por exemplo, uma variação do número de cópias materna e/ou fetal, uma variação do número de cópia fetal) pode ser categorizada em que um primeiro nível é significativamente diferente de um segundo nível e o primeiro nível está dentro da faixa do nível esperado para uma variação do número de cópia. Em algumas modalidades uma duplicação heterozigótica (por exemplo, uma duplicação heterozigótica materna ou fetal ou materna e fetal) ou deleção heterozigótica (por exemplo, uma deleção heterozigótica materna ou fetal ou materna e fetal) é categorizada quando um primeiro nível é significativamente diferente de um segundo nível e o primeiro nível está dentro da faixa do nível esperado para uma duplicação heterozigótica ou deleção heterozigótica, respectivamente. Em algumas modalidades uma duplicação homozigótica ou deleção homozigótica é categorizada quando um primeiro nível é significativamente diferente de um segundo nível e o primeiro nível está dentro da faixa do nível esperado para uma duplicação homozigótica ou deleção homozigótica, respectivamente.[323]A level (e.g., a first level) that differs significantly from another level (e.g., a second level) can often be categorized as a copy number variation (e.g., a maternal copy number variation and /or fetal, a fetal copy number variation, a deletion, duplication, insertion) within a range of the expected level. In some embodiments, the presence of a copy number variation is categorized when a first level is significantly different from a second level and the first level is within the range of the expected level for a copy number variation. For example, a copy number variation (e.g., a maternal and/or fetal copy number variation, a fetal copy number variation) can be categorized where a first level is significantly different from a second level and the first level is within the range of the expected level for a copy number variation. In some embodiments a heterozygous duplication (e.g., a maternal or fetal or maternal and fetal heterozygous duplication) or heterozygous deletion (e.g., a maternal or fetal or maternal and fetal heterozygous deletion) is categorized when a first level is significantly different from a second level and first level are within the range of the expected level for a heterozygous duplication or heterozygous deletion, respectively. In some embodiments a homozygous duplication or homozygous deletion is categorized when a first level is significantly different from a second level and the first level is within the range of the expected level for a homozygous duplication or homozygous deletion, respectively.

Ajustes do nívelLevel adjustments

[324]Em algumas modalidades, um ou mais níveis são ajustados. Um processo para ajustar um nível frequentemente é referido como preenchimento. Em algumas modalidades, vários níveis em um perfil (por exemplo, um perfil de um genoma, um perfil de cromossomo, um perfil de uma porção ou segmento de um cromossomo) são ajustados. Em algumas modalidades, cerca de 1 a cerca de 10.000 ou mais níveis em um perfil são ajustados. Em algumas modalidades cerca de 1 a cerca de 1000, cerca de 1 a 900, 1 a cerca de 800, 1 a cerca de 700, 1 a cerca de 600, 1 a cerca de 500, 1 a cerca de 400, 1 a cerca de 300, 1 a cerca de 200, 1 a cerca de 100, 1 a cerca de 50, 1 a cerca de 25, 1 e cerca de 20, 1 e cerca de 15, 1 e cerca de 10, ou cerca de 1 a 5 em um níveis em um perfil são ajustados. Em algumas modalidades um nível é ajustado. Em algumas modalidades, um nível (por exemplo, um primeiro nível de um perfil de contagem normalizado) que difere de forma significativa de um segundo nível é ajustado. Em algumas modalidades um nível categorizado como uma variação do número de cópia é ajustado. Em algumas modalidades um nível (por exemplo, um primeiro nível de um perfil de contagem normalizado), que difere de forma significativa de um segundo nível, é categorizado como uma variação do número de cópia (por exemplo, um número de variação de cópia, por exemplo, uma variação do número de cópia materna) e é ajustado. Em algumas modalidades, um nível (por exemplo, um primeiro nível) está dentro de uma faixa do nível esperado para uma variação do número de cópia materna, variação do número de cópia fetal, ou uma variação do número de cópia materna e uma variação do número de cópia fetal e o nível é ajustado. Em algumas modalidades, um ou mais níveis (por exemplo, em níveis em um perfil) não são ajustados. Em algumas modalidades, um nível (por exemplo, um primeiro nível) está fora de uma faixa do nível esperado para uma variação do número de cópia e o nível não é ajustado. Frequentemente, um nível dentro de uma faixa do nível esperado para a ausência de uma variação do número de cópia não é ajustado. Qualquer número adequado de ajustes pode ser feito a um ou mais níveis em um perfil. Em algumas modalidades, um ou mais níveis são ajustados. Em algumas modalidades 2 ou mais, 3 ou mais, 5 ou mais, 6 ou mais, 7 ou mais, 8 ou mais, 9 ou mais vezes, e 10 ou mais níveis são ajustados.[324]In some embodiments, one or more levels are adjusted. A process for adjusting a level is often referred to as padding. In some embodiments, multiple levels in a profile (e.g., a profile of a genome, a profile of a chromosome, a profile of a portion or segment of a chromosome) are adjusted. In some embodiments, from about 1 to about 10,000 or more levels in a profile are fitted. In some embodiments about 1 to about 1000, about 1 to 900, 1 to about 800, 1 to about 700, 1 to about 600, 1 to about 500, 1 to about 400, 1 to about 300, 1 to about 200, 1 to about 100, 1 to about 50, 1 to about 25, 1 to about 20, 1 to about 15, 1 to about 10, or about 1 to 5 at a levels in a profile are adjusted. In some modes a level is set. In some embodiments, a level (e.g., a first level of a normalized count profile) that differs significantly from a second level is adjusted. In some embodiments a level categorized as a copy number variation is set. In some embodiments a level (e.g. a first level of a normalized count profile) that differs significantly from a second level is categorized as a copy number variation (e.g. a copy variation number, for example, a variation of the maternal copy number) and is adjusted. In some embodiments, a level (e.g., a first level) is within a range of the expected level for a maternal copy number change, fetal copy number change, or a maternal copy number change and a fetal copy number change. fetal copy number and the level is adjusted. In some embodiments, one or more levels (for example, in levels in a profile) are not adjusted. In some embodiments, a level (eg, a first level) is outside a range of the expected level for a copy number variation, and the level is not adjusted. Often, a level within a range of the expected level in the absence of a copy number variance is not adjusted. Any suitable number of adjustments can be made to one or more levels in a profile. In some embodiments, one or more levels are adjusted. In some modes 2 or more, 3 or more, 5 or more, 6 or more, 7 or more, 8 or more, 9 or more times, and 10 or more levels are set.

[325]Em algumas modalidades, um valor de um primeiro nível é ajustado de acordo com um valor de um segundo nível. Em algumas modalidades um primeiro nível, identificado como representativo de uma variação do número de cópia, é ajustado para o valor de um segundo nível, em que o segundo nível é frequentemente associado com nenhuma variação do número de cópia. Em certas modalidades, um valor de um primeiro nível, identificado como representativo de um número de variação de cópia, é ajustado de modo que o valor do primeiro nível é aproximadamente igual a um valor de um segundo nível.[325]In some embodiments, a value of a first level is adjusted according to a value of a second level. In some embodiments a first level, identified as representative of a copy number variation, is set to the value of a second level, wherein the second level is often associated with no copy number variation. In certain embodiments, a first level value identified as representative of a copy variation number is adjusted such that the first level value is approximately equal to a second level value.

[326]Um ajuste pode compreender uma operação matemática adequada. Em algumas modalidades um ajuste compreende uma ou mais operações matemáticas. Em algumas modalidades um nível é ajustado normalizando, filtrando, tirando a média, multiplicando, dividindo, adicionando ou subtraindo ou combinação dos mesmos. Em algumas modalidades um nível é ajustado por um valor pré-determinado ou uma constante. Em algumas modalidades um nível é ajustado modificando o valor do nível para o valor de outro nível. Por exemplo, um primeiro nível pode ser ajustado através da modificação do seu valor com o valor de um segundo nível. Um valor em tais casos pode ser um valor processado (por exemplo, valor médio, normalizado e semelhante).[326]An adjustment may comprise a suitable mathematical operation. In some embodiments a fit comprises one or more mathematical operations. In some embodiments a level is adjusted by normalizing, filtering, averaging, multiplying, dividing, adding or subtracting or combination thereof. In some embodiments a level is set by a predetermined value or a constant. In some embodiments a level is adjusted by changing the value of the level to the value of another level. For example, a first level can be adjusted by modifying its value with the value of a second level. A value in such cases can be a processed value (eg mean value, normalized and the like).

[327]Em algumas modalidades um nível é categorizado como uma variação do número de cópia (por exemplo, uma variação do número de cópia materna) e é ajustado de acordo com um valor pré-determinado aqui referido como um valor de ajuste pré-determinado (PAV). Frequentemente, um PAV é determinado por uma variação do número de cópia particular. Frequentemente, um PAV determinado por uma variação do número de cópia (por exemplo, duplicação homozigótica, deleção homozigótica, duplicação heterozigótica, deleção heterozigótica) é usado para ajustar um nível categorizado como uma variação específica do número de cópia (por exemplo, duplicação homozigótica, deleção homozigótica, duplicação heterozigótica, deleção heterozigótica). Em certas modalidades, um nível é categorizado como uma variação do número de cópia e, em seguida, é ajustado de acordo com um PAV específico para o tipo de variação do número de cópia categorizada. Em algumas modalidades um nível (por exemplo, um primeiro nível) é categorizado como uma variação do número de cópia materna, variação do número de cópia fetal, ou uma variação do número de cópia materna e uma variação do número de cópia fetal e é ajustado pela adição ou subtração de um PAV do nível. Frequentemente, um nível (por exemplo, um primeiro nível) é categorizado como uma variação do número de cópia materna e é ajustado pela adição de um PAV ao nível. Por exemplo, um nível categorizado como uma duplicação (por exemplo, uma duplicação homozigótica materna, fetal ou materno e fetal) pode ser ajustado pela adição de um PAV determinado para uma duplicação específica (por exemplo, uma duplicação homozigótica) fornecendo desse modo um nível ajustado. Frequentemente, um PAV determinado por uma duplicação do número de cópias é um valor negativo. Em algumas modalidades ao fornecer um ajuste a um nível representativo de uma duplicação através do uso de um PAV determinado para uma duplicação resulta em uma redução do valor do nível. Em algumas modalidades, um nível (por exemplo, um primeiro nível) que difere de forma significativa de um segundo nível é categorizado como uma deleção do número de cópia (por exemplo, uma deleção homozigótica, deleção heterozigótica, duplicação homozigótica, duplicação homozigótica) e o primeiro nível é ajustado pela adição de um PAV determinado para uma deleção do número de cópia. Frequentemente, um PAV determinado para uma deleção do número de cópia é um valor positivo. Em algumas modalidades ao fornecer um ajuste a um nível representativo de uma deleção usando um PAV determinado para uma deleção resulta em um aumento do valor do nível.[327]In some embodiments a level is categorized as a copy number variation (e.g., a maternal copy number variation) and is adjusted according to a predetermined value referred to herein as a predetermined adjustment value (VAP). Often, a PAV is determined by a particular copy number variation. Often, a PAV determined by a copy number variation (eg, homozygous duplication, homozygous deletion, heterozygous duplication, heterozygous deletion) is used to adjust a level categorized as a specific copy number variation (eg, homozygous duplication, homozygous deletion, heterozygous duplication, heterozygous deletion). In certain embodiments, a level is categorized as a copy number variation and then adjusted according to a specific PAV for the type of categorized copy number variation. In some embodiments a level (e.g., a first level) is categorized as a maternal copy number variation, fetal copy number variation, or a maternal copy number variation and a fetal copy number variation and is adjusted accordingly. by adding or subtracting a PAV from the level. Often, a level (for example, a first level) is categorized as a maternal copy number variation and is adjusted by adding a PAV to the level. For example, a level categorized as a duplication (e.g., a maternal, fetal, or maternal and fetal homozygous duplication) can be adjusted by adding a given PAV for a specific duplication (e.g., a homozygous duplication) thereby providing a level adjusted. Often, a PAV determined by a doubling of copy number is a negative value. In some embodiments providing an adjustment to a representative level of a duplication by using a PAV determined for a duplication results in a reduction of the level value. In some embodiments, a level (e.g., a first level) that differs significantly from a second level is categorized as a copy number deletion (e.g., a homozygous deletion, heterozygous deletion, homozygous duplication, homozygous duplication) and the first level is adjusted by adding a given PAV to a copy number deletion. Often, a given PAV for a copy number deletion is a positive value. In some embodiments, providing a fit to a representative level of a deletion using a PAV determined for a deletion results in an increase in the level value.

[328]Um PAV pode ser qualquer valor adequado. Frequentemente, um PAV é determinado de acordo com e é específico para uma variação do número de cópia (por exemplo, uma variação do número de cópia categorizada). Em certas modalidades um PAV é determinado de acordo com um nível esperado para uma variação do número de cópia (por exemplo, uma variação do número de cópia categorizada) e/ou um fator de PAV. Um PAV, por vezes, é determinado multiplicando o nível esperado por um fator de PAV. Por exemplo, um PAV para uma variação do número de cópia pode ser determinado multiplicando o nível esperado determinado para uma variação do número de cópia (por exemplo, uma deleção heterozigótica) por um fator de PAV determinado para a mesma variação do número de cópia (por exemplo, uma deleção heterozigótica). Por exemplo, o PAV pode ser determinado pela fórmula que se segue: PAVk = (nível esperado}k x (fator de PAV}k para a variação do número de cópia k (por exemplo, k = uma deleção heterozigótica)[328]A PAV can be any suitable value. Often, a PAV is determined by and is specific to a copy number variation (for example, a categorized copy number variation). In certain embodiments a PAV is determined according to an expected level for a copy number variation (eg, a categorized copy number variation) and/or a PAV factor. A PAV is sometimes determined by multiplying the expected level by a PAV factor. For example, a PAV for a copy number variation can be determined by multiplying the expected level determined for a copy number variation (for example, a heterozygous deletion) by a PAV factor determined for the same copy number variation ( for example, a heterozygous deletion). For example, VAP can be determined by the following formula: VAPk = (expected level}k x (PAV factor}k for copy number variation k (for example, k = a heterozygous deletion)

[329]Um fator de PAV pode ser de qualquer valor adequado. Em algumas modalidades um fator de PAV para uma duplicação homozigótica está entre cerca de -0,6 e cerca de -0,4. Em algumas modalidades um fator de PAV para uma duplicação homozigótica é cerca de -0,60, -0,59, -0,58, - 0,57, -0,56, -0,55, -0,54, -0,53, -0,52, -0,51, -0,50, - 0,49, -0,48, -0,47, -0,46, -0,45, -0,44, -0,43, -0,42, - 0,41 e -0,40. Frequentemente um fator de PAV para uma duplicação homozigótica é cerca de -0,5.[329]A PAV factor can be any suitable value. In some embodiments a PAV factor for a homozygous duplication is between about -0.6 and about -0.4. In some embodiments a PAV factor for a homozygous duplication is about -0.60, -0.59, -0.58, -0.57, -0.56, -0.55, -0.54, - 0.53, -0.52, -0.51, -0.50, -0.49, -0.48, -0.47, -0.46, -0.45, -0.44, - 0.43, -0.42, -0.41 and -0.40. Often a PAV factor for a homozygous duplication is about -0.5.

[330]Por exemplo, para um NRV de cerca de 1 e um nível esperado de uma duplicação homozigótica igual a cerca de 2, o PAV para a duplicação homozigótica é determinado como cerca de -1 de acordo com a fórmula acima. Nesse caso, um primeiro nível categorizado como uma duplicação homozigótica é ajustado através da adição de cerca de -1 para o valor do primeiro nível, por exemplo.[330]For example, for an NRV of about 1 and an expected level of a homozygous duplication equal to about 2, the PAV for the homozygous duplication is determined to be about -1 according to the formula above. In that case, a first level categorized as a homozygous duplication is adjusted by adding about -1 to the value of the first level, for example.

[331]Em algumas modalidades um fator de PAV para uma duplicação heterozigótica está entre cerca de -0,4 e cerca de -0,2. Em algumas modalidades um fator de PAV para uma duplicação heterozigótica é cerca de -0,40, -0,39, -0,38, - 0,37, -0,36, -0,35, -0,34, -0,33, -0,32, -0,31, -0,30, - 0,29, -0,28, -0,27, -0,26, -0,25, -0,24, -0,23, -0,22, - 0,21 e -0,20. Frequentemente, um fator de PAV para uma duplicação heterozigótica é cerca de -0,33.[331] In some embodiments a PAV factor for a heterozygous duplication is between about -0.4 and about -0.2. In some embodiments a PAV factor for a heterozygous duplication is about -0.40, -0.39, -0.38, -0.37, -0.36, -0.35, -0.34, - 0.33, -0.32, -0.31, -0.30, -0.29, -0.28, -0.27, -0.26, -0.25, -0.24, - 0.23, -0.22, -0.21 and -0.20. Often, a PAV factor for a heterozygous duplication is about -0.33.

[332]Por exemplo, para um NRV de cerca de 1 e um nível esperado de uma duplicação heterozigótica igual a cerca de 1,5, o PAV para a duplicação homozigótica é determinado como cerca de -0,495 acordo com a fórmula acima. Nesse caso, um primeiro nível categorizado como uma duplicação heterozigótica é ajustado por adição de cerca de -0,495 ao valor do primeiro nível, por exemplo.[332]For example, for an NRV of about 1 and an expected level of a heterozygous duplication equal to about 1.5, the PAV for the homozygous duplication is determined to be about -0.495 according to the above formula. In this case, a first level categorized as a heterozygous duplication is adjusted by adding about -0.495 to the first level value, for example.

[333]Em algumas modalidades um fator de PAV para uma deleção heterozigótica está entre cerca de 0,4 e cerca de 0,2. Em algumas modalidades um fator de PAV para uma deleção heterozigótica é cerca de 0,40, 0,39, 0,38, 0,37, 0,36, 0,35, 0,34, 0,33, 0,32, 0,31, 0,30, 0,29, 0,28, 0,27, 0,26, 0,25, 0,24, 0,23, 0,22, 0,21 e 0,20. Frequentemente, um fator de PAV para uma deleção heterozigótica é cerca de 0,33.[333] In some embodiments a PAV factor for a heterozygous deletion is between about 0.4 and about 0.2. In some embodiments a PAV factor for a heterozygous deletion is about 0.40, 0.39, 0.38, 0.37, 0.36, 0.35, 0.34, 0.33, 0.32, 0.31, 0.30, 0.29, 0.28, 0.27, 0.26, 0.25, 0.24, 0.23, 0.22, 0.21 and 0.20. Often, a PAV factor for a heterozygous deletion is about 0.33.

[334]Por exemplo, para um NRV de cerca de 1 e um nível esperado de uma deleção heterozigótica igual a cerca de 0,5, o PAV para a deleção heterozigótica é determinado como cerca de 0,495 de acordo com a fórmula acima. Nesse caso, um primeiro nível categorizado como uma deleção heterozigótica é ajustado pela adição de cerca de 0,495 ao valor do primeiro nível, por exemplo.[334]For example, for an NRV of about 1 and an expected level of a heterozygous deletion equal to about 0.5, the PAV for the heterozygous deletion is determined to be about 0.495 according to the above formula. In this case, a first level categorized as a heterozygous deletion is adjusted by adding about 0.495 to the first level value, for example.

[335]Em algumas modalidades de um fator de PAV para uma deleção homozigótica está entre cerca de 0,6 e cerca de 0,4. Em algumas modalidades um fator de PAV para uma deleção homozigótica é de cerca de 0,60, 0,59, 0,58, 0,57, 0,56, 0,55, 0,54, 0,53, 0,52, 0,51, 0,50, 0,49, 0,48, 0,47, 0,46, 0,45, 0,44, 0,43, 0,42, 0,41 e 0,40. Frequentemente, um fator de PAV para uma deleção homozigótica é de cerca de 0,5.[335] In some embodiments a PAV factor for a homozygous deletion is between about 0.6 and about 0.4. In some embodiments a PAV factor for a homozygous deletion is about 0.60, 0.59, 0.58, 0.57, 0.56, 0.55, 0.54, 0.53, 0.52 , 0.51, 0.50, 0.49, 0.48, 0.47, 0.46, 0.45, 0.44, 0.43, 0.42, 0.41 and 0.40. Often a PAV factor for a homozygous deletion is about 0.5.

[336]Por exemplo, para um NRV de cerca de 1 e um nível esperado de uma deleção homozigótica igual a cerca de 0, o PAV para a deleção homozigótica é determinado como cerca de 1 de acordo com a fórmula acima. Nesse caso, um primeiro nível categorizado como uma deleção homozigótica é ajustado pela adição de cerca de 1 ao valor do primeiro nível, por exemplo.[336]For example, for an NRV of about 1 and an expected level of a homozygous deletion equal to about 0, the PAV for the homozygous deletion is determined to be about 1 according to the above formula. In that case, a first level categorized as a homozygous deletion is adjusted by adding about 1 to the first level value, for example.

[337]Em certas modalidades, um PAV é cerca de igual a ou igual a um nível esperado para uma variação do número de cópia (por exemplo, o nível esperado de uma variação do número de cópia).[337]In certain embodiments, a PAV is about equal to or equal to an expected level for a copy number change (eg, the expected level of a copy number change).

[338]Em algumas modalidades, as contagens de um nível são normalizadas antes de fazer um ajuste. Em certas modalidades, as contagens de alguns ou de todos os níveis em um perfil são normalizadas antes de fazer um ajuste. Por exemplo, as contagens de um nível podem ser normalizadas de acordo com as contagens de um nível de referência ou um NRV. Em certas modalidades, as contagens de um nível (por exemplo, um segundo nível) são normalizadas de acordo com as contagens de um nível de referência ou um NRV e as contagens de todos os outros níveis (por exemplo, um primeiro nível) em um perfil são normalizadas em relação às contagens do mesmo nível de referência ou NRV antes de fazer um ajuste.[338]In some embodiments, the counts of a level are normalized before making an adjustment. In certain embodiments, the counts of some or all of the levels in a profile are normalized before making an adjustment. For example, counts from a level can be normalized to counts from a reference level or an NRV. In certain embodiments, the counts of one level (e.g., a second level) are normalized to the counts of a reference level or an NRV and the counts of all other levels (e.g., a first level) in a profile are normalized against counts from the same reference level or NRV before making an adjustment.

[339]Em algumas modalidades, um nível de um perfil resulta de um ou mais ajustes. Em certas modalidades, um nível de um perfil é determinado depois de um ou mais níveis no perfil serem ajustados. Em algumas modalidades, um nível de um perfil é recalculado depois de um ou mais ajustes serem feitos.[339]In some embodiments, a level of a profile results from one or more adjustments. In certain embodiments, a profile level is determined after one or more levels in the profile are adjusted. In some embodiments, a profile level is recalculated after one or more adjustments are made.

[340]Em algumas modalidades, uma variação do número de cópia (por exemplo, uma variação do número de cópia materna, variação do número de cópia fetal, ou uma variação do número de cópias materna e uma variação do número de cópia fetal) é determinada (por exemplo, determinada direta ou indiretamente) a partir de um ajuste. Por exemplo, um nível em um perfil que foi ajustado (por exemplo, um primeiro nível ajustado) pode ser identificado como uma variação do número de cópia materna. Em algumas modalidades, a amplitude do ajuste indica o tipo de variação do número de cópia (por exemplo, deleção heterozigótica, duplicação homozigótica, e semelhante). Em certas modalidades, um nível ajustado em um perfil pode ser identificado como um representativo de uma variação do número de cópia de acordo com o valor de um PAV para a variação do número de cópia. Por exemplo, para um dado perfil, PAV é cerca de -1 para uma duplicação homozigótica, cerca de -0,5 para uma duplicação heterozigótica, cerca de 0,5 para uma deleção heterozigótica e cerca de 1 para uma deleção homozigótica. No exemplo precedente, um nível ajustado de cerca de -1 pode ser identificado como uma duplicação homozigótica, por exemplo. Em algumas modalidades, uma ou mais variações do número de cópia podem ser determinadas a partir de um perfil ou um nível que compreende um ou mais ajustes.[340]In some embodiments, a copy number variation (e.g., a maternal copy number variation, fetal copy number variation, or a maternal copy number variation and a fetal copy number variation) is determined (for example, directly or indirectly determined) from an adjustment. For example, a level in a profile that has been adjusted (for example, an adjusted first level) may be identified as a variation of the maternal copy number. In some embodiments, the range of fit indicates the type of copy number variation (eg, heterozygous deletion, homozygous duplication, and the like). In certain embodiments, an adjusted level in a profile may be identified as representative of a copy number range in accordance with the value of a PAV for the copy number range. For example, for a given profile, PAV is about -1 for a homozygous duplication, about -0.5 for a heterozygous duplication, about 0.5 for a heterozygous deletion, and about 1 for a homozygous deletion. In the preceding example, an adjusted level of about -1 can be identified as a homozygous duplication, for example. In some embodiments, one or more copy number variations may be determined from a profile or a level comprising one or more adjustments.

[341]Em certas modalidades, os níveis ajustados em um perfil são comparados. Em algumas modalidades anomalias e erros são identificados por comparação dos níveis ajustados. Por exemplo, frequentemente um ou mais níveis ajustados em um perfil são comparados e um determinado nível pode ser identificado como uma anomalia ou erro. Em algumas modalidades uma anomalia ou erro é identificado dentro de uma ou mais porções que compõem um nível. Uma anomalia ou erro pode ser identificado com o mesmo nível (por exemplo, em um perfil) ou em um ou mais níveis que representam porções que são adjacentes, contíguas, conjugadas ou encostadas. Em algumas modalidades um ou mais níveis ajustados são os níveis de porções que são adjacentes, contíguas, conjugadas ou encostadas onde um ou mais níveis ajustados são comparados e uma anomalia ou erro é identificado. Uma anomalia ou erro pode ser um pico ou declive em um perfil ou nível onde uma causa do pico ou declive é conhecida ou desconhecida. Em certas modalidades níveis ajustados são comparados e uma anomalia ou erro é identificado em que a anomalia ou erro é devido a um erro estocástico, sistemático, aleatório ou do usuário. Em algumas modalidades níveis ajustados são comparados e uma anomalia ou erro é removido de um perfil. Em certas modalidades, os níveis ajustados são comparados e uma anomalia ou erro é ajustado.[341]In certain embodiments, levels set in a profile are compared. In some modalities anomalies and errors are identified by comparing adjusted levels. For example, often one or more adjusted levels in a profile are compared and a certain level can be identified as an anomaly or error. In some embodiments an anomaly or error is identified within one or more portions that make up a level. An anomaly or error can be identified at the same level (eg in a profile) or at one or more levels that represent portions that are adjacent, contiguous, conjugate or abutting. In some embodiments one or more fitted levels are the levels of portions that are adjacent, contiguous, conjugate or abutting where the one or more fitted levels are compared and an anomaly or error is identified. An anomaly or error can be a peak or dip in a profile or level where a cause of the spike or dip is known or unknown. In certain embodiments adjusted levels are compared and an anomaly or error is identified where the anomaly or error is due to stochastic, systematic, random or user error. In some embodiments adjusted levels are compared and an anomaly or error is removed from a profile. In certain embodiments, adjusted levels are compared and an anomaly or error is adjusted.

Determinação do teor de ácido nucleico fetalDetermination of fetal nucleic acid content

[342]A quantidade de ácido nucleico do feto (por exemplo, concentração, quantidade relativa, quantidade absoluta, número de cópia e semelhante) em ácido nucleico é determinada em algumas modalidades. Em certas modalidades, a quantidade de ácido nucleico fetal em uma amostra é referida como "fração fetal". Em algumas modalidades "fração fetal" refere-se à fração de ácido nucleico no ácido nucleico fetal isento de célula circulante em uma amostra (por exemplo, uma amostra de sangue, uma amostra de soro, uma amostra de plasma), obtido a partir de uma mulher grávida. Em algumas modalidades, um método em que uma variação genética é determinada também pode compreender determinar a fração fetal. Em algumas modalidades, a presença ou ausência de uma variação genética é determinada de acordo com uma fração fetal (por exemplo, uma fração fetal para a determinação de uma amostra). Determinação da fração fetal pode ser realizada de um modo adequado, exemplos não limitativos dos quais incluem os métodos descritos abaixo.[342]The amount of fetal nucleic acid (e.g., concentration, relative amount, absolute amount, copy number, and the like) in nucleic acid is determined in some embodiments. In certain embodiments, the amount of fetal nucleic acid in a sample is referred to as the "fetal fraction". In some embodiments "fetal fraction" refers to the fraction of nucleic acid in circulating cell-free fetal nucleic acid in a sample (e.g., a blood sample, a serum sample, a plasma sample), obtained from a pregnant woman. In some embodiments, a method in which a genetic variation is determined may also comprise determining the fetal fraction. In some embodiments, the presence or absence of a genetic variation is determined according to a fetal fraction (eg, a fetal fraction for determining a sample). Fetal fraction determination can be performed in a suitable manner, non-limiting examples of which include the methods described below.

[343]Fração fetal pode ser determinada, em algumas modalidades, usando métodos aqui descritos para a determinação do comprimento do fragmento. Os fragmentos de ácido nucleico isentos de células fetais são geralmente mais curtos do que os fragmentos de ácido nucleico maternalmente derivados (ver, por exemplo, Chan et al., (2004) Clin. Chem. 50:88-92; Lo et al., (2010) Med Sci Transl. 2:61ra91). Desse modo, fração fetal pode ser determinada, em algumas modalidades, por meio da contagem de fragmentos sob um limite do comprimento particular e comparando as contagens à quantidade de ácido nucleico total na amostra. Métodos para contar fragmentos de ácido nucleico de um comprimento particular são descritos abaixo em mais detalhe.[343]Fetal fraction can be determined, in some embodiments, using methods described herein for determining fragment length. Fetal cell-free nucleic acid fragments are generally shorter than maternally derived nucleic acid fragments (see, for example, Chan et al., (2004) Clin. Chem. 50:88-92; Lo et al. , (2010) Med Sci Transl. 2:61ra91). Thus, fetal fraction can be determined, in some embodiments, by counting fragments under a particular length threshold and comparing the counts to the amount of total nucleic acid in the sample. Methods for counting nucleic acid fragments of a particular length are described in more detail below.

[344]Em certas modalidades, a quantidade de ácido nucleico fetal é determinada de acordo com marcadores específicos para um feto homem (por exemplo, marcadores de STR de cromossomo Y (por exemplo, marcadores DYS 19, DYS 385, DYS 392); marcador de RhD em mulheres negativas em RhD), as proporções alélicas de sequências polimórficas de acordo com um ou mais marcadores específicos para ácido nucleico fetal e ácido nucleico não materno (por exemplo, biomarcadores epigenéticos diferenciais (por exemplo, metilação; descrito em maior detalhe abaixo) entre mãe e o feto, ou marcadores de RNA fetal no plasma do sangue materno (ver por exemplo, Lo, 2005, Journal of Histochemistry and Cytochemistry 53 (3): 293-296)).[344]In certain embodiments, the amount of fetal nucleic acid is determined according to markers specific to a male fetus (e.g., Y-chromosome STR markers (e.g., DYS 19, DYS 385, DYS 392 markers); marker of RhD in RhD-negative women), the allelic proportions of polymorphic sequences according to one or more specific markers for fetal nucleic acid and non-maternal nucleic acid (e.g., differential epigenetic biomarkers (e.g., methylation; described in more detail below) ) between mother and fetus, or markers of fetal RNA in maternal blood plasma (see e.g. Lo, 2005, Journal of Histochemistry and Cytochemistry 53(3): 293-296)).

[345]Determinação do teor de ácido nucleico fetal (por exemplo, fração fetal), por vezes, é realizada usando um ensaio quantificador fetal (FQA), tal como descrito, por exemplo, na publicação de pedido de patente US n. 2010/0105049, que é aqui incorporado por referência. Esse tipo de ensaio permite a detecção e quantificação de ácido nucleico fetal em uma amostra materna com base no padrão de metilação do ácido nucleico na amostra. Em certas modalidades, a quantidade de ácido nucleico fetal de uma amostra materna pode ser determinada em relação à quantidade total de ácido nucleico presente, fornecendo, desse modo, a percentagem de ácido nucleico na amostra fetal. Em certas modalidades, o número de cópia de ácido nucleico fetal pode ser determinado em uma amostra materna. Em certas modalidades, a quantidade de ácido nucleico fetal pode ser determinada em uma maneira específica da sequência (ou específica da porção) e às vezes com sensibilidade suficiente para permitir a análise da dosagem cromossômica precisa (por exemplo, para detectar a presença ou ausência de uma aneuploidia fetal).[345]Determination of fetal nucleic acid content (eg, fetal fraction) is sometimes performed using a fetal quantifier assay (FQA), as described, for example, in US patent application publication no. 2010/0105049, which is incorporated herein by reference. This type of assay allows the detection and quantification of fetal nucleic acid in a maternal sample based on the methylation pattern of the nucleic acid in the sample. In certain embodiments, the amount of fetal nucleic acid in a maternal sample can be determined relative to the total amount of nucleic acid present, thereby providing the percentage of nucleic acid in the fetal sample. In certain embodiments, the fetal nucleic acid copy number can be determined in a maternal sample. In certain embodiments, the amount of fetal nucleic acid can be determined in a sequence-specific (or moiety-specific) manner and sometimes with sufficient sensitivity to allow accurate chromosomal dosage analysis (e.g., to detect the presence or absence of a fetal aneuploidy).

[346]Um ensaio quantificador fetal (FQA) pode ser realizado em conjunto com qualquer um dos métodos descritos aqui. Tal um ensaio pode ser realizado por qualquer método conhecido na técnica e/ou descrito na publicação do pedido de patente US n. 2010/0105049, tal como, por exemplo, por um método que possa distinguir entre DNA materno e fetal com base no estado de metilação diferencial, e quantificar (isto é, determinar a quantidade de) o DNA fetal. Os métodos para a diferenciação de ácido nucleico com base no estado de metilação incluem, mas não estão limitados a, captura sensível à metilação, por exemplo, usando um fragmento de MBD2-Fc em que o domínio de ligação de metila de MBD2 é fundido com o fragmento Fc de um anticorpo (MBD- FC) (Gebhard et al., (2006) Câncer Res 66 (12): 6118-28.); anticorpos específicos de metilação; métodos de conversão de bissulfito, por exemplo, MSP (PCR sensível à metilação), COBRA, extensão do iniciador de um nucleotídeo sensível à metilação ou tecnologia Sequenom MassCLEAVE™ (Ms-SnuPE); e o uso de enzimas de restrição sensíveis à metilação (por exemplo, a digestão de DNA materno em uma amostra materna usando uma ou mais enzimas de restrição sensíveis à metilação desse modo enriquecendo o DNA fetal). Enzimas sensíveis ao metil também podem ser usadas para diferenciar ácido nucleico com base no estado de metilação, o que, por exemplo, pode, preferivelmente ou substancialmente clivar ou digerir a sua sequência de reconhecimento de DNA, se esse último é não metilado. Desse modo, uma amostra de DNA não metilada será cortada em fragmentos menores do que uma amostra de DNA metilado e uma amostra de DNA hipermetilada não irá ser clivada. Exceto onde explicitamente estabelecido, qualquer método para a diferenciação de ácido nucleico com base no estado de metilação pode ser usado com as composições e os métodos da tecnologia aqui. A quantidade de DNA fetal pode ser determinada, por exemplo, através da introdução de um ou mais competidores em concentrações conhecidas durante uma reação de amplificação. Determinação da quantidade de DNA fetal também pode ser feita, por exemplo, por RT-PCR, extensão do iniciador, sequenciamento e/ou contagem. Em certos casos, a quantidade de ácido nucleico pode ser determinada usando tecnologia de BEAMing conforme descrito na Publicação do Pedido de Patente US n. 2007/0065823. Em certas modalidades, a eficiência de restrição pode ser determinada e a taxa de eficiência é usada para determinar ainda a quantidade de DNA fetal.[346]A fetal quantifier assay (FQA) can be performed in conjunction with any of the methods described here. Such an assay can be performed by any method known in the art and/or described in US patent application publication no. 2010/0105049, such as, for example, by a method that can distinguish between maternal and fetal DNA based on differential methylation status, and quantify (i.e., determine the amount of) fetal DNA. Methods for differentiating nucleic acid based on methylation state include, but are not limited to, methylation-sensitive capture, for example, using an MBD2-Fc fragment in which the methyl binding domain of MBD2 is fused to the Fc fragment of an antibody (MBD-FC) ( Gebhard et al., (2006) Cancer Res 66(12): 6118-28 .); methylation-specific antibodies; bisulfite conversion methods, eg MSP (methylation sensitive PCR), COBRA, methylation sensitive nucleotide primer extension, or Sequenom MassCLEAVE™ technology (Ms-SnuPE); and the use of methylation-sensitive restriction enzymes (eg, digestion of maternal DNA in a maternal sample using one or more methylation-sensitive restriction enzymes thereby enriching the fetal DNA). Methyl-sensitive enzymes can also be used to differentiate nucleic acid on the basis of methylation status, which, for example, can preferentially or substantially cleave or digest its DNA recognition sequence, if the latter is unmethylated. Thus, an unmethylated DNA sample will be cut into smaller fragments than a methylated DNA sample, and a hypermethylated DNA sample will not be cleaved. Except where explicitly stated, any method for differentiating nucleic acid based on methylation state can be used with the compositions and methods of the technology herein. The amount of fetal DNA can be determined, for example, by introducing one or more competitors at known concentrations during an amplification reaction. Determination of the amount of fetal DNA can also be done, for example, by RT-PCR, primer extension, sequencing and/or counting. In certain cases, the amount of nucleic acid can be determined using BEAMing technology as described in US Patent Application Publication No. 2007/0065823. In certain embodiments, the restriction efficiency can be determined and the efficiency rate is used to further determine the amount of fetal DNA.

[347]Em certas modalidades, um ensaio quantificador fetal (FQA) pode ser usado para determinar a concentração de DNA fetal em uma amostra materna, por exemplo, pelo seguinte método: a) determinar a quantidade total de DNA presente em uma amostra materna; b) digerir seletivamente o DNA materno em uma amostra materna usando uma ou mais enzimas de restrição sensíveis à metilação desse modo enriquecendo o DNA fetal; c) determinar a quantidade de DNA fetal da etapa b); e d) comparar a quantidade de DNA fetal da etapa c) com a quantidade total de DNA da etapa a), determinando desse modo a concentração de DNA fetal na amostra materna. Em certas modalidades, o número de cópia absoluta de ácido nucleico fetal em uma amostra materna pode ser determinado, por exemplo, usando espectrometria de massa e/ou um sistema que utiliza uma abordagem de PCR competitiva para as medições do número de cópia absoluta. Veja, por exemplo, Ding e Cantor (2003) PNAS EUA 100: 30593064, e publicação do pedido de patente US No. 2004/0081993, ambos os quais são aqui incorporados por referência.[347]In certain embodiments, a fetal quantifier assay (FQA) can be used to determine the concentration of fetal DNA in a maternal sample, for example, by the following method: a) determining the total amount of DNA present in a maternal sample; b) selectively digesting maternal DNA in a maternal sample using one or more methylation-sensitive restriction enzymes thereby enriching the fetal DNA; c) determine the amount of fetal DNA from step b); and d) comparing the amount of fetal DNA from step c) with the total amount of DNA from step a), thereby determining the concentration of fetal DNA in the maternal sample. In certain embodiments, the absolute copy number of fetal nucleic acid in a maternal sample can be determined, for example, using mass spectrometry and/or a system that uses a competitive PCR approach for absolute copy number measurements. See, for example, Ding and Cantor (2003) US PNAS 100: 30593064, and US Patent Application Publication No. 2004/0081993, both of which are incorporated herein by reference.

[348]Em certas modalidades, fração fetal pode ser determinada com base nas proporções alélicas de sequências polimórficas (por exemplo, polimorfismos de um nucleotídeo (SNP)), tal como, por exemplo, usando um método descrito na publicação do pedido de patente US No. 2011/0224087, que é aqui incorporado por referência. Em tal método, os fragmentos (reads) de sequências de nucleotídeo são obtidos para uma amostra materna e fração fetal são determinados por comparação do número total de fragmentos (reads) de sequências de nucleotídeo que mapeiam um primeiro alelo e o número total de fragmentos (reads) de sequências de nucleotídeos que mapeiam um segundo alelo em um sítio polimórfico informativo (por exemplo, o SNP) em um genoma de referência. Em certas modalidades, alelos fetais são identificados, por exemplo, pela sua contribuição menor relativa à mistura de ácido nucleico fetal e materno na amostra quando comparados com a maior contribuição à mistura pelos ácidos nucleicos maternos. Desse modo, a abundância relativa de ácido nucleico fetal em uma amostra materna pode ser determinada como um parâmetro do número total de fragmentos (reads) de uma sequência mapeados para uma sequência de ácido nucleico alvo em um genoma de referência para cada um dos dois alelos de um sítio polimórfico.[348] In certain embodiments, fetal fraction can be determined based on the allelic ratios of polymorphic sequences (e.g., single nucleotide polymorphisms (SNP)), such as, for example, using a method described in the publication of the US patent application At the. 2011/0224087, which is incorporated herein by reference. In such a method, the fragments (reads) of nucleotide sequences are obtained for a maternal sample and fetal fraction are determined by comparing the total number of fragments (reads) of nucleotide sequences that map to a first allele and the total number of fragments ( reads) of nucleotide sequences that map a second allele to an informative polymorphic site (e.g., the SNP) in a reference genome. In certain embodiments, fetal alleles are identified, for example, by their relative minor contribution to the mixture of fetal and maternal nucleic acid in the sample as compared to the greater contribution to the mixture by maternal nucleic acids. Thus, the relative abundance of fetal nucleic acid in a maternal sample can be determined as a parameter of the total number of fragments (reads) of a sequence mapped to a target nucleic acid sequence in a reference genome for each of the two alleles. of a polymorphic site.

[349]A quantidade de ácido nucleico fetal em ácido nucleico extracelular pode ser quantificada e usada em conjunto com um método aqui fornecido. Desse modo, em certas modalidades, os métodos da tecnologia aqui descrita compreendem uma etapa adicional de determinar a quantidade de ácido nucleico fetal. A quantidade de ácido nucleico fetal pode ser determinada em uma amostra de ácido nucleico de um sujeito, antes ou após o processamento para preparar o ácido nucleico da amostra. Em certas modalidades, a quantidade de ácido nucleico fetal é determinada em uma amostra após a amostra de ácido nucleico ser processada e preparada, em que a quantidade é utilizada para uma avaliação adicional. Em algumas modalidades, um resultado compreende ajustar a fração de ácido nucleico fetal no ácido nucleico da amostra (por exemplo, ajustando as contagens, removendo amostras, fazendo uma ligação ou não fazendo uma ligação).[349] The amount of fetal nucleic acid in extracellular nucleic acid can be quantified and used in conjunction with a method provided herein. Thus, in certain embodiments, the methods of technology described herein comprise an additional step of determining the amount of fetal nucleic acid. The amount of fetal nucleic acid can be determined in a nucleic acid sample from a subject, either before or after processing to prepare the nucleic acid from the sample. In certain embodiments, the amount of fetal nucleic acid is determined in a sample after the nucleic acid sample is processed and prepared, where the amount is used for further evaluation. In some embodiments, a result comprises adjusting the fraction of fetal nucleic acid in the sample nucleic acid (e.g., adjusting counts, removing samples, binding or not binding).

[350]A etapa de determinação pode ser realizada antes, durante, em qualquer ponto em um método descrito aqui, ou após certos métodos (por exemplo, detecção de aneuploidia, determinação do gênero fetal) aqui descritos. Por exemplo, para alcançar um método de determinação do gênero fetal ou de aneuploidia com uma dada sensibilidade ou especificidade, um método de quantificação de ácido nucleico fetal pode ser realizado antes, durante ou depois do método de determinação do gênero o fetal ou de aneuploidia para identificar as amostras com mais do que cerca de 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15%, 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25% ou mais de ácido nucleico fetal. Em algumas modalidades, as amostras determinadas como tendo certa quantidade limite de ácido nucleico fetal (por exemplo, cerca de 15% ou mais de ácido nucleico fetal; cerca de 4% ou mais de ácido nucleico fetal) são ainda analisadas pela determinação do gênero fetal ou de aneuploidia, ou a presença ou ausência de aneuploidia ou variação genética, por exemplo. Em certas modalidades, as determinações de, por exemplo, gênero fetal ou a presença ou ausência de aneuploidia são selecionadas (por exemplo, selecionada e comunicada a um paciente) apenas para as amostras que têm certa quantidade limite de ácido nucleico fetal (por exemplo, cerca de 15% ou mais de ácido nucleico fetal; cerca de 4% ou mais de ácido nucleico fetal).[350]The determination step may be performed before, during, at any point in a method described here, or after certain methods (eg, aneuploidy detection, fetal gender determination) described herein. For example, to achieve a fetal or aneuploidy gender determination method with a given sensitivity or specificity, a fetal nucleic acid quantification method can be performed before, during, or after the fetal or aneuploidy gender determination method to identify samples greater than about 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 11%, 12%, 13%, 14%, 15% , 16%, 17%, 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25% or more fetal nucleic acid. In some embodiments, samples determined to have a certain threshold amount of fetal nucleic acid (e.g., about 15% or more fetal nucleic acid; about 4% or more fetal nucleic acid) are further analyzed by determining fetal gender. or aneuploidy, or the presence or absence of aneuploidy or genetic variation, for example. In certain embodiments, determinations of, for example, fetal gender or the presence or absence of aneuploidy are screened (e.g., screened and reported to a patient) only for those samples that have a certain threshold amount of fetal nucleic acid (e.g., about 15% or more fetal nucleic acid; about 4% or more fetal nucleic acid).

[351]Em algumas modalidades, a determinação da fração fetal ou determinação da quantidade de ácido nucleico ácido não é requerida ou necessária para identificar a presença ou ausência de um cromossomo com aneuploidia. Em algumas modalidades, a identificação da presença ou ausência de um cromossomo com aneuploidia não exige a diferenciação da sequência de DNA fetal versus materna. Em certas modalidades isso é porque a contribuição resumida de ambas sequências materna e fetal em um cromossomo particular, a porção do cromossomo ou seu segmento é analisado. Em algumas modalidades, a identificação da presença ou ausência de um cromossomo com aneuploidia não se baseia em uma informação da sequência priori que permitiria distinguir DNA fetal do DNA materno.[351] In some embodiments, determination of the fetal fraction or determination of the amount of acidic nucleic acid is not required or necessary to identify the presence or absence of an aneuploidy chromosome. In some embodiments, identifying the presence or absence of an aneuploidy chromosome does not require differentiation of fetal versus maternal DNA sequence. In certain embodiments this is because the summary contribution of both maternal and fetal sequences on a particular chromosome, chromosome portion or segment thereof is analyzed. In some embodiments, the identification of the presence or absence of an aneuploidy chromosome is not based on a priori sequence information that would allow distinguishing fetal DNA from maternal DNA.

Determinação da fração fetal com base no nívelDetermination of the fetal fraction based on the level

[352]Em algumas modalidades, uma fração fetal é determinada de acordo com um nível categorizado como representativo de uma variação do número de cópia materna e/ou fetal. Por exemplo, determinar a fração fetal frequentemente compreende avaliar um nível esperado para uma variação do número de cópia materna e/ou fetal usada para a determinação da fração fetal. Em algumas modalidades uma fração fetal é determinada por um nível (por exemplo, um primeiro nível) categorizado como representativo de uma variação do número de cópia de acordo com um faixa do nível esperado determinado para o mesmo tipo de variação do número de cópia. Frequentemente, uma fração fetal é determinada de acordo com um nível observado que está dentro de uma faixa nível esperado e é, desse modo, categorizada como uma variação do número de cópia materna e/ou fetal. Em algumas modalidades uma fração fetal é determinada quando um nível observado (por exemplo, um primeiro nível) categorizado como uma variação do número de cópia materna e/ou fetal é diferente do nível esperado determinado para a mesma variação do número de cópia materna e/ou fetal.[352]In some embodiments, a fetal fraction is determined according to a level categorized as representative of a range of maternal and/or fetal copy number. For example, determining fetal fraction often involves assessing an expected level for a maternal and/or fetal copy number variation used for fetal fraction determination. In some embodiments a fetal fraction is determined by a level (e.g., a first level) categorized as representative of a copy number variation within a range of expected level determined for the same type of copy number variation. Often, a fetal fraction is determined according to an observed level that is within a range of the expected level and is therefore categorized as a maternal and/or fetal copy number variation. In some embodiments a fetal fraction is determined when an observed level (e.g., a first level) categorized as a maternal and/or fetal copy number change is different from the expected level determined for the same maternal and/or fetal copy number change. or fetal.

[353]Em algumas modalidades um nível (por exemplo, um primeiro nível, um nível observado), é significativamente diferente de um segundo nível, o primeiro nível é categorizado como uma variação do número de cópia materna e/ou fetal, e uma fração fetal é determinada de acordo com o primeiro nível. Em algumas modalidades um primeiro nível é um nível observado e/ou obtido experimentalmente que é significativamente diferente de um segundo nível em um perfil e uma fração fetal é determinada de acordo com o primeiro nível. Em algumas modalidades o primeiro nível é uma média aritmética, média ou nível somados e uma fração fetal é determinada de acordo com o primeiro nível. Em certas modalidades um primeiro nível e um segundo nível são observados e/ou níveis experimentalmente obtidos e uma fração fetal é determinada de acordo com o primeiro nível. Em alguns casos, um primeiro nível compreende as contagens normalizadas para um primeiro conjunto de porções e um segundo nível compreende contagens normalizadas para um segundo conjunto de porções e uma fração fetal é determinada de acordo com o primeiro nível. Em algumas modalidades um primeiro conjunto de porções de um primeiro nível inclui uma variação do número de cópia (por exemplo, o primeiro nível é representativo de uma variação do número de cópia), e uma fração fetal é determinada de acordo com o primeiro nível. Em algumas modalidades o primeiro conjunto de porções de um primeiro nível inclui uma variação do número de cópia materna homozigótica ou heterozigótica e uma fração fetal é determinada de acordo com o primeiro nível. Em algumas modalidades um perfil compreende um primeiro nível para um primeiro conjunto de porções e um segundo nível para um segundo conjunto de porções, o segundo conjunto de porções inclui substancialmente qualquer variação do número de cópia (por exemplo, uma variação do número de cópia materna, variação do número de cópia fetal, ou uma variação do número de cópia materna e uma variação do número de cópia fetal) e uma fração fetal é determinada de acordo com o primeiro nível.[353]In some embodiments a level (e.g., a first level, an observed level), is significantly different from a second level, the first level is categorized as a maternal and/or fetal copy number variation, and a fraction fetus is determined according to the first level. In some embodiments a first level is an observed and/or experimentally obtained level that is significantly different from a second level in a profile and a fetal fraction is determined according to the first level. In some modalities the first level is an arithmetic mean, mean or summed level and a fetal fraction is determined according to the first level. In certain embodiments a first level and a second level are observed and/or experimentally obtained levels and a fetal fraction is determined according to the first level. In some cases, a first level comprises normalized counts for a first set of portions and a second level comprises normalized counts for a second set of portions and a fetal fraction is determined in accordance with the first level. In some embodiments a first set of portions of a first tier includes a copy number range (e.g., the first tier is representative of a copy number range), and a fetal fraction is determined in accordance with the first tier. In some embodiments the first set of portions of a first level includes a homozygous or heterozygous maternal copy number variation and a fetal fraction is determined according to the first level. In some embodiments a profile comprises a first tier for a first set of portions and a second tier for a second set of portions, the second set of portions including substantially any copy number variation (e.g., a maternal copy number variation , fetal copy number range, or a maternal copy number range and a fetal copy number range) and a fetal fraction is determined according to the first level.

[354]Em algumas modalidades um nível (por exemplo, um primeiro nível, um nível observado), é significativamente diferente de um segundo nível, o primeiro nível é categorizado como de uma variação do número de cópia materna e/ou fetal, e uma fração fetal é determinada de acordo com o primeiro nível e/ou um nível esperado da variação do número de cópia. Em algumas modalidades um primeiro nível é categorizado como para uma variação do número de cópia de acordo com um nível esperado para uma variação do número de cópia e uma fração fetal é determinada de acordo com uma diferença entre o primeiro nível e o nível esperado. Em certas modalidades um nível (por exemplo, um primeiro nível, um nível observado) é categorizado como uma variação do número de cópia materna e/ou fetal, e uma fração fetal é determinada como dobro da diferença entre o primeiro nível e nível esperado da variação do número de cópia. Em algumas modalidades um nível (por exemplo, um primeiro nível, um nível observado) é categorizado como uma variação do número de cópia materna e/ou fetal, o primeiro nível é subtraído do nível esperado fornecendo desse modo uma diferença, e uma fração fetal é determinada como o dobro da diferença. Em algumas modalidades um nível (por exemplo, um primeiro nível, um nível observado) é categorizado como uma variação do número de cópia materna e/ou fetal, o nível esperado é subtraído de um primeiro nível que forneça desse modo uma diferença, e a fração fetal é determinada como dobro da diferença.[354]In some embodiments, a level (e.g., a first level, an observed level), is significantly different from a second level, the first level is categorized as a maternal and/or fetal copy number variation, and a Fetal fraction is determined according to the first level and/or an expected level of copy number variation. In some embodiments a first level is categorized as for a copy number variation according to an expected level for a copy number variation and a fetal fraction is determined according to a difference between the first level and the expected level. In certain embodiments a level (e.g., a first level, an observed level) is categorized as a maternal and/or fetal copy number variation, and a fetal fraction is determined as twice the difference between the first level and expected level of the copy number variation. In some embodiments a level (e.g. a first level, an observed level) is categorized as a maternal and/or fetal copy number variation, the first level is subtracted from the expected level thereby providing a difference, and a fetal fraction is determined as twice the difference. In some embodiments a level (e.g. a first level, an observed level) is categorized as a maternal and/or fetal copy number variation, the expected level is subtracted from a first level thereby providing a difference, and the fetal fraction is determined as twice the difference.

[355]Frequentemente, uma fração fetal é fornecida como uma percentagem. Por exemplo, uma fração fetal pode ser dividida por 100 fornecendo desse modo um valor de percentagem. Por exemplo, para um primeiro nível representativo de uma duplicação homozigótica materna e tendo um nível de 155 e um nível esperado para uma duplicação homozigótica materna tendo um nível de 150, uma fração fetal pode ser determinada como 10% (por exemplo, (fração fetal = 2 X (155 - 150)).[355]Often, a fetal fraction is given as a percentage. For example, a fetal fraction can be divided by 100 thereby providing a percentage value. For example, for a first level representative of a homozygous maternal duplication and having a level of 155 and an expected level for a homozygous maternal duplication having a level of 150, a fetal fraction can be determined as 10% (e.g., (fetal fraction = 2X(155 - 150)).

[356]Em algumas modalidades uma fração fetal é determinada a partir de dois ou mais níveis dentro de um perfil que são categorizados como variações do número de cópia. Por exemplo, por vezes, dois ou mais níveis (por exemplo, dois ou mais primeiros níveis) em um perfil são identificados como significativamente diferentes de um nível de referência (por exemplo, um segundo nível, um nível que não inclui substancialmente variação do número de cópia), os dois ou mais níveis são categorizados como representativos de uma variação do número de cópia materna e/ou fetal e uma fração fetal é determinada de cada dos dois ou mais níveis. Em algumas modalidades uma fração fetal é determinada de cerca de 3 ou mais, cerca de 4 ou mais, cerca de 5 ou mais, cerca de 6 ou mais, cerca de 7 ou mais, cerca de 8 ou mais, ou cerca de 9 ou mais determinações da fração fetal dentro de um perfil. Em algumas modalidades uma fração fetal é determinada a partir de cerca de 10 ou mais, cerca de 20 ou mais, cerca de 30 ou mais, cerca de 40 ou mais, cerca de 50 ou mais, cerca de 60 ou mais, cerca de 70 ou mais, cerca de 80 ou mais, ou cerca de 90 ou mais determinações da fração fetal dentro de um perfil. Em algumas modalidades uma fração fetal é determinada a partir de cerca de 100 ou mais, cerca de 200 ou mais, cerca de 300 ou mais, cerca de 400 ou mais, cerca de 500 ou mais, cerca de 600 ou mais, cerca de 700 ou mais, cerca de 800 ou mais, cerca de 900 ou mais, ou cerca de 1000 ou mais determinações da fração fetal dentro de um perfil. Em algumas modalidades uma fração fetal é determinada a partir de cerca de 10 a cerca de 1000, cerca de 20 a cerca de 900, cerca de 30 a cerca de 700, cerca de 40 a cerca de 600, cerca de 50 a cerca de 500, cerca de 50 a cerca de 400, cerca de 50 a cerca de 300, cerca de 50 a cerca de 200, ou cerca de 50 a cerca de 100 determinações da fração fetal dentro de um perfil.[356]In some embodiments a fetal fraction is determined from two or more levels within a profile that are categorized as copy number variations. For example, sometimes two or more levels (e.g., two or more first levels) in a profile are identified as significantly different from a reference level (e.g., a second level, a level that does not substantially include number variation). of copy number), the two or more levels are categorized as representative of a range of maternal and/or fetal copy number, and a fetal fraction is determined from each of the two or more levels. In some embodiments a fetal fraction is determined to be about 3 or more, about 4 or more, about 5 or more, about 6 or more, about 7 or more, about 8 or more, or about 9 or more. more fetal fraction determinations within a profile. In some embodiments a fetal fraction is determined from about 10 or more, about 20 or more, about 30 or more, about 40 or more, about 50 or more, about 60 or more, about 70 or more, about 80 or more, or about 90 or more fetal fraction determinations within a profile. In some embodiments a fetal fraction is determined from about 100 or more, about 200 or more, about 300 or more, about 400 or more, about 500 or more, about 600 or more, about 700 or more, about 800 or more, about 900 or more, or about 1000 or more fetal fraction determinations within a profile. In some embodiments a fetal fraction is determined from about 10 to about 1000, about 20 to about 900, about 30 to about 700, about 40 to about 600, about 50 to about 500 , about 50 to about 400, about 50 to about 300, about 50 to about 200, or about 50 to about 100 fetal fraction determinations within one profile.

[357]Em algumas modalidades uma fração fetal é determinada como a média aritmética ou média de determinações de múltiplas frações fetais dentro de um perfil. Em certas modalidades, uma fração fetal determinada a partir de determinações de múltiplas frações fetais é uma média (por exemplo, uma média aritmética, uma média, uma média padrão, mediana, ou o semelhante) de determinações de múltiplas frações fetais. Frequentemente, uma fração fetal determinada a partir de determinações de múltiplas frações fetais é um valor médio determinado por um método adequado conhecido na técnica ou aqui descrito. Em algumas modalidades um valor médio de uma determinação da fração fetal é uma média ponderada. Em algumas modalidades um valor médio de uma determinação da fração fetal é uma média não-ponderada. Uma determinação da fração fetal média, mediana ou média aritmética (isto é, um valor da determinação da fração fetal média, mediana ou média aritmética) gerada a partir de determinações de múltiplas frações fetais está por vezes associada a um valor de incerteza (por exemplo, um desvio, desvio padrão, MAD, ou o semelhante). Antes de determinar um valor da fração fetal média, mediana ou média aritmética a partir de determinações múltiplas, uma ou mais determinações desviantes são removidos em algumas modalidades (descritas em mais detalhe aqui).[357]In some modalities a fetal fraction is determined as the arithmetic mean or average of determinations of multiple fetal fractions within a profile. In certain embodiments, a fetal fraction determined from multiple fetal fraction determinations is an average (e.g., an arithmetic mean, mean, standard mean, median, or the like) of multiple fetal fraction determinations. Often, a fetal fraction determined from multiple fetal fraction determinations is an average value determined by a suitable method known in the art or described herein. In some embodiments an average value of a fetal fraction determination is a weighted average. In some embodiments an average value of a fetal fraction determination is an unweighted average. A mean, median, or arithmetic mean fetal fraction determination (i.e., a mean, median, or arithmetic mean fetal fraction determination value) generated from multiple fetal fraction determinations is sometimes associated with an uncertainty value (for example, , a deviation, standard deviation, MAD, or the like). Before determining a mean, median, or arithmetic mean fetal fraction value from multiple determinations, one or more deviant determinations are removed in some embodiments (described in more detail here).

[358]Algumas determinações da fração fetal dentro de um perfil, por vezes, não são incluídas na determinação total de uma fração fetal (por exemplo, determinação da fração fetal média ou média aritmética). Em algumas modalidades uma determinação da fração fetal é derivada a partir de um primeiro nível (por exemplo, um primeiro nível que é significativamente diferente de um segundo nível) em um perfil e o primeiro nível não é indicativo de uma variação genética. Por exemplo, alguns primeiros níveis (por exemplo, picos ou depressões) em um perfil são gerados a partir de anomalias ou causas desconhecidas. Tais valores frequentemente geram determinações da fração fetal que diferem significativamente de outras determinações da fração fetal obtidas a partir de verdadeiros variações do número de cópia. Em algumas modalidades determinações da fração fetal que diferem significativamente das outras determinações da fração fetal em um perfil são identificadas e removidas de uma determinação da fração fetal. Por exemplo, algumas determinações da fração fetal obtidas a partir de picos e depressões anômalas são identificadas por comparação com outras determinações da fração fetal dentro de um perfil e são excluídas da determinação total da fração fetal.[358]Some fetal fraction determinations within a profile are sometimes not included in the total determination of a fetal fraction (eg, determination of mean fetal fraction or arithmetic mean). In some embodiments a fetal fraction determination is derived from a first level (eg, a first level that is significantly different from a second level) in a profile and the first level is not indicative of a genetic variation. For example, some early levels (eg peaks or troughs) in a profile are generated from anomalies or unknown causes. Such values often generate fetal fraction determinations that differ significantly from other fetal fraction determinations obtained from true copy number variations. In some embodiments, fetal fraction determinations that differ significantly from other fetal fraction determinations in a profile are identified and removed from a fetal fraction determination. For example, some fetal fraction determinations obtained from anomalous peaks and troughs are identified by comparison to other fetal fraction determinations within a profile and are excluded from the total fetal fraction determination.

[359]Em algumas modalidades, uma determinação da fração fetal independente que difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética é uma diferença identificada, reconhecida e/ou observável. Em certas modalidades, o termo "difere significativamente" pode significar estatisticamente diferente e/ou uma diferença estatisticamente significativa. Uma determinação da fração fetal "independente" pode ser uma fração fetal determinada (por exemplo, em algumas modalidades uma única determinação) de um nível específico categorizado como uma variação do número de cópia. Qualquer limite ou faixa adequada pode ser utilizado para determinar que uma determinação da fração fetal difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética. Em certas modalidades uma determinação da fração fetal difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética e a determinação pode ser expressa como um desvio em percentagem do valor da média ou média aritmética. Em certas modalidades uma determinação da fração fetal que difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética difere em cerca de 10 por cento ou mais. Em algumas modalidades uma determinação da fração fetal que difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética difere em cerca de 15 por cento ou mais. Em algumas modalidades uma determinação da fração fetal que difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética difere em cerca de 15% a cerca de 100% ou mais.[359]In some embodiments, an independent fetal fraction determination that differs significantly from a mean, median, or arithmetic mean fetal fraction determination is an identified, recognized, and/or observable difference. In certain embodiments, the term "significantly differs" can mean statistically different and/or a statistically significant difference. An "independent" fetal fraction determination may be a determined fetal fraction (eg, in some embodiments a single determination) of a specific level categorized as a copy number variation. Any suitable threshold or range may be used to determine that a fetal fraction determination differs significantly from a mean, median, or arithmetic mean fetal fraction determination. In certain embodiments, a fetal fraction determination differs significantly from a mean, median, or arithmetic mean fetal fraction determination, and the determination may be expressed as a percent deviation from the mean or arithmetic mean value. In certain embodiments, a fetal fraction determination that differs significantly from a mean, median, or arithmetic mean fetal fraction determination differs by about 10 percent or more. In some embodiments, a fetal fraction determination that differs significantly from a mean, median, or arithmetic mean fetal fraction determination differs by about 15 percent or more. In some embodiments, a fetal fraction determination that differs significantly from a mean, median, or arithmetic mean fetal fraction determination differs by about 15% to about 100% or more.

[360]Em certas modalidades uma determinação da fração fetal difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética de acordo com um múltiplo de um valor de incerteza associado com a determinação da fração fetal média ou média aritmética. Frequentemente um valor de incerteza e constante n (por exemplo, um intervalo de confiança) define uma faixa (por exemplo, um corte de incerteza). Por exemplo, às vezes, um valor de incerteza é um desvio padrão para determinações da fração fetal (por exemplo, +/- 5) e é multiplicado por uma constante n (por exemplo, um intervalo de confiança), definindo desse modo uma faixa ou corte de incerteza (por exemplo, 5n a -5n, por vezes referidos como 5 Sigma). Em algumas modalidades uma determinação da fração fetal independente está fora de uma faixa definida por um corte de incerteza e é considerada significativamente diferente da determinação da fração fetal média, mediana ou média aritmética. Por exemplo, para um valor médio de 10 e um corte de incerteza de 3, uma fração fetal independente maior do que 13 ou menor do que 7 é significativamente diferente. Em algumas modalidades uma determinação da fração fetal que difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética difere por mais de n vezes o valor de incerteza (por exemplo, n x sigma) em que n é aproximadamente igual ou maior do que 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10. Em algumas modalidades uma determinação da fração fetal que difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética difere por mais de n vezes o valor de incerteza (por exemplo, sigma n x) em que n é aproximadamente igual ou maior que 1,1, 1,2, 1,3, 1,4, 1,5, 1,6, 1,7, 1,8, 1,9, 2,0, 2,1, 2,2, 2,3, 2,4, 2,5, 2,6, 2,7, 2,8, 2,9, 3,0, 3,1' 3,2, 3,3, 3,4, 3,5, 3,6, 3,7, 3,8, 3,9, ou 4,0.[360]In certain embodiments a determination of fetal fraction differs significantly from a determination of mean, median, or arithmetic mean fetal fraction according to a multiple of an uncertainty value associated with the determination of mean fetal fraction or arithmetic mean. Often an uncertainty value and constant n (eg a confidence interval) defines a range (eg an uncertainty cutoff). For example, sometimes an uncertainty value is one standard deviation for fetal fraction determinations (e.g. +/- 5) and is multiplied by a constant n (e.g. a confidence interval), thereby defining a range or uncertainty cutoff (eg, 5n to -5n, sometimes referred to as 5 sigma). In some embodiments, an independent fetal fraction determination is outside a range defined by an uncertainty cutoff and is considered significantly different from a mean, median, or arithmetic mean fetal fraction determination. For example, for a mean value of 10 and an uncertainty cutoff of 3, an independent fetal fraction greater than 13 or less than 7 is significantly different. In some embodiments, a fetal fraction determination that differs significantly from a mean, median, or arithmetic mean fetal fraction determination differs by more than n times the uncertainty value (e.g., n x sigma) where n is approximately equal to or greater than 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10. In some embodiments, a fetal fraction determination that differs significantly from a fetal mean, median, or arithmetic mean determination differs by more than n times the uncertainty value (e.g. sigma n x) where n is approximately equal to or greater than 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8 , 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3.0, 3 ,1' 3.2, 3.3, 3.4, 3.5, 3.6, 3.7, 3.8, 3.9, or 4.0.

[361]Em algumas modalidades, um nível é representativo de um microploidia fetal e/ou materna. Em algumas modalidades um nível (por exemplo, um primeiro nível, um nível observado), é significativamente diferente de um segundo nível, o primeiro nível é categorizado como uma variação do número de cópia materna e/ou fetal, e o primeiro nível e/ou no segundo nível é representativo de uma microploidia fetal e/ou uma microploidia materna. Em certas modalidades um primeiro nível é representativo de uma microploidia fetal, em algumas modalidades um primeiro nível é representativo de uma microploidia materna. Frequentemente um primeiro nível é representativo de uma microploidia fetal e uma microploidia materna. Em algumas modalidades um nível (por exemplo, um primeiro nível, um nível observado) é significativamente diferente de um segundo nível, o primeiro nível é categorizado como uma variação do número de cópia materna e/ou fetal, o primeiro nível é representativo de uma microploidia materna e/ou e uma fração fetal é uma fração determinada de acordo com a microploidia fetal e/ou materna. Em alguns casos, um primeiro nível é categorizado como uma variação do número de cópia materna e/ou fetal, o primeiro nível é representativo de uma microploidia fetal e uma fração fetal é determinada de acordo com a microploidia fetal. Em algumas modalidades um primeiro nível é categorizado como uma variação do número de cópia materna e/ou fetal, o primeiro nível é representativo de uma microploidia materna e uma fração fetal é determinada de acordo com a microploidia materna. Em algumas modalidades um primeiro nível é categorizado como uma variação do número de cópia materna e/ou fetal, o primeiro nível é representativo de uma microploidia materna e fetal e uma fração fetal é determinada de acordo com a microploidia materna e fetal.[361] In some embodiments, a level is representative of a fetal and/or maternal microploidy. In some embodiments a level (e.g., a first level, an observed level), is significantly different from a second level, the first level is categorized as a maternal and/or fetal copy number variation, and the first level and/or or at the second level is representative of fetal microploidy and/or maternal microploidy. In certain embodiments a first level is representative of a fetal microploidy, in some embodiments a first level is representative of a maternal microploidy. Often a first level is representative of a fetal microploidy and a maternal microploidy. In some embodiments a level (e.g., a first level, an observed level) is significantly different from a second level, the first level is categorized as a maternal and/or fetal copy number variation, the first level is representative of a maternal and/or microploidy and a fetal fraction is a fraction determined according to fetal and/or maternal microploidy. In some cases, a first level is categorized as a maternal and/or fetal copy number variation, the first level is representative of a fetal microploidy, and a fetal fraction is determined according to the fetal microploidy. In some embodiments a first level is categorized as a maternal and/or fetal copy number variation, the first level is representative of a maternal microploidy, and a fetal fraction is determined according to the maternal microploidy. In some embodiments a first level is categorized as a maternal and/or fetal copy number variation, the first level is representative of a maternal and fetal microploidy, and a fetal fraction is determined according to maternal and fetal microploidy.

[362]Em algumas modalidades, a determinação de uma fração fetal compreende determinar uma microploidia fetal e/ou materna. Em algumas modalidades um nível (por exemplo, um primeiro nível, um nível observado) é significativamente diferente de um segundo nível, o primeiro nível é categorizado como uma variação do número de cópia materna e/ou fetal, uma microploidia materna e/ou fetal é determinada de acordo com o primeiro nível e/ou segundo nível e uma fração fetal é determinada. Em algumas modalidades um primeiro nível é categorizado como uma variação do número de cópia materna e/ou fetal, uma microploidia fetal é determinada de acordo com o primeiro nível e/ou segundo nível e uma fração fetal é determinada de acordo com a microploidia fetal. Em certas modalidades um primeiro nível é categorizado como uma variação do número de cópia materna e/ou fetal, uma microploidia materna é determinada de acordo com o primeiro nível e/ou segundo nível e uma fração fetal é determinada de acordo com a microploidia materna. Em algumas modalidades um primeiro nível é categorizado como uma variação do número de cópia materna e/ou fetal, uma microploidia materna fetal é determinada de acordo com o primeiro nível e/ou segundo nível e uma fração fetal é determinada de acordo com a microploidia materna e fetal.[362]In some embodiments, determining a fetal fraction comprises determining a fetal and/or maternal microploidy. In some embodiments a level (e.g. a first level, an observed level) is significantly different from a second level, the first level is categorized as a maternal and/or fetal copy number variation, a maternal and/or fetal microploidy is determined according to the first level and/or second level and a fetal fraction is determined. In some embodiments a first level is categorized as a maternal and/or fetal copy number variation, a fetal microploidy is determined according to the first level and/or second level, and a fetal fraction is determined according to the fetal microploidy. In certain embodiments a first level is categorized as a maternal and/or fetal copy number variation, a maternal microploidy is determined according to the first level and/or second level, and a fetal fraction is determined according to the maternal microploidy. In some embodiments a first level is categorized as a maternal and/or fetal copy number variation, a maternal fetal microploidy is determined according to the first level and/or second level, and a fetal fraction is determined according to the maternal microploidy and fetal.

[363]Uma fração fetal frequentemente é determinada quando a microploidia da mãe é diferente (por exemplo, não a mesma como) da microploidia do feto para um dado nível ou para um nível categorizado como uma variação do número de cópias. Em algumas modalidades uma fração fetal é determinada quando a mãe é homozigota para uma duplicação (por exemplo, uma microploidia de 2) e o feto é heterozigoto para a mesma duplicação (por exemplo, uma microploidia de 1,5). Em algumas modalidades uma fração fetal é determinada quando a mãe é heterozigota para uma duplicação (por exemplo, uma microploidia de 1,5) e para o feto é homozigoto para a mesma duplicação (por exemplo, uma microploidia de 2) ou a duplicação está ausente no feto (por exemplo, uma microploidia de 1). Em algumas modalidades uma fração fetal é determinada quando a mãe é homozigota para uma deleção (por exemplo, uma microploidia de 0) e o feto é heterozigoto para a mesma deleção (por exemplo, uma microploidia de 0,5). Em algumas modalidades uma fração fetal é determinada quando a mãe é heterozigota para uma deleção (por exemplo, uma microploidia de 0,5) e o feto é homozigoto para a mesma deleção (por exemplo, uma microploidia de 0), ou a deleção está ausente no feto (por exemplo, uma microploidia de 1).[363] A fetal fraction is often determined when the microploidy of the mother is different from (eg, not the same as) the microploidy of the fetus for a given level or for a level categorized as a copy number variation. In some embodiments a fetal fraction is determined when the mother is homozygous for one duplication (eg, a microploidy of 2) and the fetus is heterozygous for the same duplication (eg, a microploidy of 1.5). In some embodiments a fetal fraction is determined when the mother is heterozygous for a duplication (eg, a microploidy of 1.5) and the fetus is homozygous for the same duplication (eg, a microploidy of 2) or the duplication is absent in the fetus (eg, a microploidy of 1). In some embodiments a fetal fraction is determined when the mother is homozygous for a deletion (eg, a microploidy of 0) and the fetus is heterozygous for the same deletion (eg, a microploidy of 0.5). In some embodiments a fetal fraction is determined when the mother is heterozygous for a deletion (e.g., a microploidy of 0.5) and the fetus is homozygous for the same deletion (e.g., a microploidy of 0), or the deletion is absent in the fetus (eg, a microploidy of 1).

[364]Em certas modalidades, uma fração fetal não pode ser determinada, quando a microploidia da mãe é a mesma (por exemplo, identificada como a mesma) tal como a microploidia do feto para um dado nível identificado como uma variação do número de cópia. Por exemplo, para um dado nível em que ambos a mãe e o feto carregam o mesmo número de cópias de uma variação do número de cópia, uma fração fetal não é determinada, em algumas modalidades. Por exemplo, uma fração fetal não pode ser determinada para um nível categorizado como uma variação do número de cópia quando ambos a mãe e o feto são homozigotos para a mesma deleção ou homozigotos para a mesma duplicação. Em certas modalidades, uma fração fetal não pode ser determinada para um nível categorizado como uma variação do número de cópia quando ambas a mãe e o feto são heterozigotos para a mesma deleção ou heterozigotos para a mesma duplicação. Em modalidades onde várias determinações da fração fetal são feitas para uma amostra, determinações que se desviam significativamente de um valor médio, mediano ou média aritmética podem resultar de uma variação do número de cópia para os quais ploidia materna é igual a ploidia fetal, e tais determinações podem ser removidas da consideração.[364] In certain embodiments, a fetal fraction cannot be determined, when the microploidy of the mother is the same (eg, identified as the same) as the microploidy of the fetus for a given level identified as a copy number variation . For example, for a given level where both the mother and fetus carry the same number of copies of a copy number variation, a fetal fraction is not determined, in some embodiments. For example, a fetal fraction cannot be determined for a level categorized as a copy number variation when both the mother and the fetus are homozygous for the same deletion or homozygous for the same duplication. In certain embodiments, a fetal fraction cannot be determined for a level categorized as a copy number variation when both the mother and the fetus are heterozygous for the same deletion or heterozygous for the same duplication. In arrangements where multiple fetal fraction determinations are made for a sample, determinations that deviate significantly from a mean, median, or arithmetic mean value may result from copy number variation for which maternal ploidy equals fetal ploidy, and such determinations may be removed from consideration.

[365]Em algumas modalidades a microploidia de uma variação do número de cópia materna e variação do número de cópia fetal é desconhecida. Em algumas modalidades, nos casos em que não há nenhuma determinação de microploidia materna e/ou fetal para uma variação do número de cópia, uma fração fetal é gerada e comparada com uma determinação da fração fetal média, mediana ou média aritmética. A determinação da fração fetal para uma variação do número de cópia que difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética é, por vezes, porque o microploidia da mãe e do feto são as mesmas para a variação do número de cópia. A determinação da fração fetal que difere significativamente de uma determinação da fração fetal média, mediana ou média aritmética é frequentemente excluída de uma determinação total da fração fetal independentemente da fonte ou causa da diferença. Em algumas modalidades, a microploidia da mãe e/ou do feto é determinada e/ou verificada por meio de um método conhecido na técnica (por exemplo, por meio de métodos de sequenciamento alvo).[365] In some embodiments the microploidy of a maternal copy number variation and fetal copy number variation is unknown. In some embodiments, in cases where there is no maternal and/or fetal microploidy determination for a copy number variation, a fetal fraction is generated and compared to a mean, median, or arithmetic mean fetal fraction determination. A fetal fraction determination for a copy number variation that differs significantly from a mean, median, or arithmetic mean fetal fraction determination is sometimes because the microploidy of the mother and fetus are the same for the copy number variation. . A fetal fraction determination that differs significantly from a mean, median, or arithmetic mean fetal fraction determination is often excluded from a total fetal fraction determination regardless of the source or cause of the difference. In some embodiments, the microploidy of the mother and/or the fetus is determined and/or verified by a method known in the art (e.g., by target sequencing methods).

Métodos adicionais de determinação da fração fetalAdditional methods of determining the fetal fraction

[366]Fração fetal (por exemplo, para uma amostra) pode ser determinada, em algumas modalidades, de acordo com estimativas da fração de específico da porção. Sem ser limitado por teoria, foi determinado aqui que a quantidade de fragmentos (reads) de fragmentos de CCF fetal (por exemplo, fragmentos de um comprimento particular, ou faixa de comprimentos) mapas com frequências que variam para porções (por exemplo, dentro de uma mesma amostra, por exemplo, dentro da mesma execução de sequenciamento). Além disso, sem ser limitado pela teoria, foi aqui determinado que certas porções, quando comparadas entre várias amostras, tendem a ter uma representação semelhante de fragmentos (reads) a partir de fragmentos de CCF fetal (por exemplo, fragmentos com um comprimento particular, ou faixa de comprimentos), e que a representação se correlaciona com fração fetais de específico da porção (por exemplo, a quantidade relativa, percentagem ou a proporção de fragmentos de CCF originários de um feto).[366]Fetal fraction (eg, for a sample) may be determined, in some embodiments, according to portion-specific fraction estimates. Without being limited by theory, it was determined here that the amount of fragments (reads) of fetal CCF fragments (e.g., fragments of a particular length, or range of lengths) maps with frequencies that vary for portions (e.g., within same sample, for example, within the same sequencing run). Furthermore, without being bound by theory, it was determined here that certain portions, when compared across multiple samples, tend to have a similar representation of fragments (reads) from fetal CCF fragments (e.g., fragments with a particular length, or range of lengths), and that the representation correlates with portion-specific fetal fraction (eg, the relative amount, percentage, or proportion of CCF fragments originating from a fetus).

[367]Em algumas modalidades estimativas da fração fetal de porção específica são determinadas com base, em parte, nos parâmetros de porção específica e sua relação com a fração fetal. Parâmetros de porção específica podem ser qualquer parâmetro adequado que é o reflexo da (por exemplo, se correlaciona com) quantidade ou proporção de fragmentos (reads) de comprimentos de fragmento de CCF de um tamanho particular (por exemplo, faixa de tamanho) em uma porção. Um parâmetro de porção específica pode ser uma média, média aritmética ou mediana de parâmetros de porção específica determinados para várias amostras. Qualquer parâmetro de porção específica adequada pode ser usado. Exemplos não-limitativos de parâmetros de porção específica incluem FLR (por exemplo, FRS), uma quantidade de fragmentos (reads) tendo um comprimento menor do que um comprimento do fragmento selecionado, cobertura genômica (ou seja, cobertura), mapeabilidade, contagens (por exemplo, contagens de fragmentos (reads) de sequências mapeados para a porção, por exemplo, contagens normalizadas, contagens normalizadas PERUN), Sensibilidade à DNasel, estado de metilação, acetilação, distribuição de histona, teor de guanina-citosina (GC), estrutura da cromatina, o semelhante ou combinações dos mesmos. Um parâmetro de porção específica pode ser qualquer parâmetro adequado que se correlaciona com FLR e/ou FRS em uma maneira de porção específica. Em algumas modalidades, alguns ou todos os parâmetros de porção específica são uma representação direta ou indireta de um FLR para uma porção. Em algumas modalidades parâmetro de porção específica não é teor de guanina-citosina (GC).[367] In some modalities estimates of the fetal portion-specific fraction are determined based, in part, on the portion-specific parameters and their relationship to the fetal fraction. Portion-specific parameters can be any suitable parameter that is reflective of (e.g., correlates to) the amount or proportion of fragments (reads) of CCF fragment lengths of a particular size (e.g., size range) in a portion. A specific portion parameter can be an average, arithmetic mean, or median of specific portion parameters determined for multiple samples. Any suitable portion specific parameter can be used. Non-limiting examples of specific portion parameters include FLR (e.g., FRS), a number of fragments (reads) having a length less than a selected fragment length, genomic coverage (i.e. coverage), mappability, counts ( (e.g., fragment counts (reads) of sequences mapped to the portion, e.g., normalized counts, normalized PERUN counts), DNasel sensitivity, methylation status, acetylation, histone distribution, guanine-cytosine (GC) content, chromatin structure, the similar or combinations thereof. A portion specific parameter can be any suitable parameter that correlates to FLR and/or FRS in a portion specific manner. In some embodiments, some or all of the specific portion parameters are a direct or indirect representation of a FLR for a portion. In some embodiments specific serving parameter is not guanine-cytosine (GC) content.

[368]Em algumas modalidades um parâmetro de porção específica é qualquer valor adequado representando, correlacionado com ou proporcional a uma quantidade de fragmentos (reads) de fragmentos de CCF, onde os fragmentos (reads) mapeados para uma porção têm um comprimento menor do que um comprimento do fragmento selecionado. Em certas modalidades, um parâmetro de porção específica é uma representação da quantidade de fragmentos (reads) derivados de fragmentos relativamente curtos de CCF (por exemplo, cerca de 200 pares de bases ou menos) que mapeiam uma porção. Fragmentos de CCF tendo um comprimento menor do que um comprimento do fragmento selecionado frequentemente são fragmentos de CCF relativamente curtos, e por vezes um comprimento do fragmento selecionado é cerca de 200 pares de bases ou menos (por exemplo, fragmentos de CCF que são cerca de 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, ou 80 bases em comprimento). O comprimento de um fragmento de CCF ou um fragmento (read) derivado de um fragmento de CCF pode ser determinado (por exemplo, deduzido ou inferido) por qualquer método adequado (por exemplo, um método de sequenciamento, um método de hibridização). Em algumas modalidades o comprimento de um fragmento de CCF é determinado (por exemplo, deduzido ou inferido) por um fragmento (read) obtido de um método de sequenciamento de extremidade pareada. Em certas modalidades, o comprimento de um molde de fragmento de CCF é determinado diretamente do comprimento de um fragmento (read) derivado do fragmento de CCF (por exemplo, fragmento (read) de uma extremidade).[368]In some embodiments a specific chunk parameter is any suitable value representing, correlated with or proportional to a number of fragments (reads) of CCF fragments, where the fragments (reads) mapped to a chunk have a length less than a length of the selected fragment. In certain embodiments, a specific portion parameter is a representation of the amount of fragments (reads) derived from relatively short fragments of CCF (e.g., about 200 base pairs or less) that map a portion. CCF fragments having a length less than a selected fragment length are often relatively short CCF fragments, and sometimes a selected fragment length is about 200 base pairs or less (e.g., CCF fragments that are about 190, 180, 170, 160, 150, 140, 130, 120, 110, 100, 90, or 80 bases in length). The length of a CCF fragment or a fragment (read) derived from a CCF fragment can be determined (e.g., deduced or inferred) by any suitable method (e.g., a sequencing method, a hybridization method). In some embodiments the length of a CCF fragment is determined (e.g., deduced or inferred) by a fragment (read) obtained from a paired-end sequencing method. In certain embodiments, the length of a CCF fragment template is determined directly from the length of a fragment (read) derived from the CCF fragment (e.g., one-end read).

[369]Os parâmetros de porção específica podem ser ponderados ou ajustados por um ou mais fatores de ponderação. Em algumas modalidades parâmetros de porção específica ponderados ou ajustados podem fornecer estimativas de fração fetal de porção específica para uma amostra (por exemplo, uma amostra de teste). Em algumas modalidades, ponderação ou ajuste geralmente converte as contagens de uma porção (por exemplo, fragmentos (reads) mapeados para uma porção) ou outro parâmetro de porção específica em uma estimativa da fração fetal de porção específica, e uma tal conversão, por vezes, é considerada uma transformação.[369]Specific portion parameters may be weighted or adjusted by one or more weighting factors. In some embodiments weighted or adjusted portion-specific parameters may provide estimates of portion-specific fetal fraction for a sample (eg, a test sample). In some embodiments, weighting or fitting generally converts a portion counts (e.g., reads mapped to a portion) or other portion-specific parameter into an estimate of the portion-specific fetal fraction, and such a conversion sometimes , is considered a transformation.

[370]Em algumas modalidades um fator de ponderação é um coeficiente ou constante que, em parte, descreve e/ou define uma relação entre uma fração fetal (por exemplo, uma fração fetal determinada a partir várias amostras) e um parâmetro de porção específica para várias amostras (por exemplo, um conjunto de treinamento). Em algumas modalidades um fator de ponderação é determinado de acordo com uma relação para várias determinações da fração fetal e vários parâmetros de porção específica. Uma relação pode ser definida por um ou mais fatores de ponderação e um ou mais fatores de ponderação podem ser determinados a partir de uma relação. Em algumas modalidades de um fator de ponderação (por exemplo, um ou mais fatores de ponderação) é determinado a partir de uma relação ajustada para uma porção de acordo com (i) uma fração de ácido nucleico fetal determinada para cada uma das várias amostras, e (ii) um parâmetro de porção específica para várias amostras.[370]In some embodiments a weighting factor is a coefficient or constant that, in part, describes and/or defines a relationship between a fetal fraction (eg, a fetal fraction determined from multiple samples) and a specific portion parameter for multiple samples (e.g. a training set). In some embodiments a weighting factor is determined according to a ratio for various fetal fraction determinations and various portion-specific parameters. A relationship can be defined by one or more weighting factors, and one or more weighting factors can be determined from a relationship. In some embodiments a weighting factor (e.g., one or more weighting factors) is determined from an adjusted ratio for a portion according to (i) a determined fetal nucleic acid fraction for each of several samples, and (ii) a specific portion parameter for multiple samples.

[371]Um fator de ponderação pode ser qualquer coeficiente, coeficiente estimado ou constante adequada derivada a partir de uma relação adequada (por exemplo, uma relação matemática, uma relação algébrica, uma relação ajustada, uma regressão, uma análise de regressão, um modelo de regressão adequados). Um fator de ponderação pode ser determinado de acordo com, derivado de, ou estimado a partir de uma relação adequada. Em algumas modalidades fatores de ponderação são coeficientes estimados de uma relação ajustada. Ajuste da uma relação para várias amostras é por vezes aqui referido como treinando um modelo. Qualquer modelo e/ou método de ajuste adequado de um relacionamento (por exemplo, treinamento de um modelo para um conjunto de treinamento) pode ser usado. Exemplos não-limitativos de um modelo adequado que podem ser usados incluem um modelo de regressão, modelo de regressão linear, modelo de regressão simples, modelo de regressão dos mínimos quadrados ordinários, modelo de regressão múltipla, modelo de regressão múltipla geral, modelo de regressão polinomial, modelo linear geral, modelo linear generalizado, modelo de regressão de escolha discreta, modelo de regressão logística, modelo de logit multinomial, modelo de logit misto, modelo de probit, modelo de probit multinomial, modelo de logit ordenado, modelo de probit ordenado, modelo de Poisson, modelo de regressão de resposta multivariada, modelo multinível, modelo de efeitos fixos, modelo de efeitos aleatórios, modelo misto, modelo de regressão não-linear, modelo não paramétrico, modelo semiparamétrico, modelo robusto, modelo quantis, modelo isotônico, modelo de componentes principais, modelo de ângulo mínimo, modelo local, modelo segmentado, e modelo de erros-em-variáveis. Em algumas modalidades uma relação ajustada não é um modelo de regressão. Em algumas modalidades relações ajustadas é escolhida a partir de um modelo de árvore de decisão, modelo de máquina de vetor- suporte e modelo de rede neural. O resultado de treinamento de um modelo (por exemplo, um modelo de regressão, uma relação) é frequentemente uma relação que pode ser descrita matematicamente, onde a relação compreende um ou mais coeficientes (por exemplo, fatores de ponderação). Por exemplo, para um modelo de mínimos quadrados linear, um modelo de regressão múltipla geral pode ser treinado usando valores da fração fetal e um parâmetro de porção específica (por exemplo, uma cobertura, por exemplo, ver Exemplo 7) resultando em uma relação descrita pela equação (30), onde o fator de ponderação 13 é ainda definido nas equações (31), (32) e (33). Modelos multivariados mais complexos podem determinar um, dois, três ou mais fatores de ponderação. Em algumas modalidades um modelo é treinado de acordo com a fração fetal e dois ou mais parâmetros de porção específica (por exemplo, coeficientes) obtido a partir de várias amostras (por exemplo, relacionamentos ajustados para várias amostras, por exemplo, por uma matriz).[371]A weighting factor can be any coefficient, estimated coefficient, or suitable constant derived from a suitable relationship (for example, a mathematical relationship, an algebraic relationship, a fitted relationship, a regression, a regression analysis, a model suitable regression tests). A weighting factor can be determined according to, derived from, or estimated from a suitable ratio. In some embodiments weighting factors are estimated coefficients of an adjusted relationship. Fitting a relation to multiple samples is sometimes referred to here as training a model. Any suitable model and/or method of fitting a relationship (eg training a model to a training set) can be used. Non-limiting examples of a suitable model that may be used include a regression model, linear regression model, simple regression model, ordinary least squares regression model, multiple regression model, general multiple regression model, regression model polynomial, general linear model, generalized linear model, discrete choice regression model, logistic regression model, multinomial logit model, mixed logit model, probit model, multinomial probit model, ordered logit model, ordered probit model , Poisson model, multivariate response regression model, multilevel model, fixed effects model, random effects model, mixed model, nonlinear regression model, nonparametric model, semiparametric model, robust model, quantile model, isotonic model , principal components model, minimum angle model, local model, segmented model, and errors-in-variables model. In some embodiments a fitted relationship is not a regression model. In some embodiments fitted relations are chosen from a decision tree model, support vector machine model and neural network model. The training result of a model (eg a regression model, a relation) is often a relation that can be described mathematically, where the relation comprises one or more coefficients (eg weighting factors). For example, for a linear least squares model, a general multiple regression model can be trained using fetal fraction values and a specific portion parameter (e.g. a coverage, for example, see Example 7) resulting in a relationship described by equation (30), where the weighting factor 13 is further defined in equations (31), (32) and (33). More complex multivariate models can determine one, two, three or more weighting factors. In some embodiments a model is trained on fetal fraction and two or more portion-specific parameters (e.g. coefficients) obtained from multiple samples (e.g. relationships fitted to multiple samples, e.g. by a matrix) .

[372]Um fator de ponderação pode ser derivado a partir de uma relação adequada (por exemplo, uma relação matemática adequada, uma relação algébrica, uma relação ajustada, uma regressão, uma análise da regressão, um modelo de regressão) por um método adequado. Em algumas modalidades relações ajustadas são ajustadas por uma estimativa, exemplos não-limitativos dos quais incluem mínimos quadrados, mínimos quadrados ordinários, linear, parcial, total, generalizado, ponderado, não-linear, interativamente reponderado, regressão Ridge, desvios absolutos mínimos, Bayesian, Bayesian multivariado, de posto reduzido, LASSO, Critérios de Seleção de ponto ponderado (WRSC), Critérios de seleção de ponto (RSC), um avaliador de rede elástica (por exemplo, uma regressão de rede elástica) e suas combinações.[372]A weighting factor may be derived from a suitable relationship (e.g., a suitable mathematical relationship, an algebraic relationship, a fitted relationship, a regression, a regression analysis, a regression model) by a suitable method . In some embodiments fitted relationships are fitted by an estimate, non-limiting examples of which include least squares, ordinary least squares, linear, partial, total, generalized, weighted, nonlinear, interactively reweighted, Ridge regression, minimum absolute deviations, Bayesian , multivariate, low-rank Bayesian, LASSO, Weighted Point Selection Criteria (WRSC), Point Selection Criteria (RSC), an elastic network estimator (eg, an elastic network regression), and combinations thereof.

[373]Um fator de ponderação pode ter qualquer valor adequado. Em algumas modalidades de um fator de ponderação está entre cerca de -1 x 10-2 e cerca de 1 x 10-2, entre cerca de -1 x 10-3 e cerca de 1 x 10-3, entre cerca de -5 x 10-4 e cerca de 5 x 10-4, ou entre cerca de -1 x 10-4 e cerca de 1 x 10-4. Em algumas modalidades, a distribuição de fatores de ponderação para várias amostras é substancialmente simétrica. Uma distribuição de fatores de ponderação para várias amostras, por vezes, é uma distribuição normal. Uma distribuição de fatores de ponderação para várias amostras, por vezes, não é uma distribuição normal. Em algumas modalidades a largura de uma distribuição dos fatores de ponderação é dependente da quantidade de fragmentos (reads) de fragmentos de ácido nucleico fetal de CCF. Em algumas modalidades porções compreendendo maior teor de ácido nucleico fetal geram coeficientes maiores (por exemplo, positivos ou negativos, por exemplo, ver a Figura 31). Um fator de ponderação pode ser zero ou um fator de ponderação pode ser maior do que zero. Em algumas modalidades cerca de 70% ou mais, cerca de 75% ou mais, cerca de 80% ou mais, cerca de 85% ou mais, cerca de 90% ou mais, cerca de 95% ou mais, ou cerca de 98% ou mais dos fatores de ponderação para uma porção são maiores do que zero.[373]A weighting factor can be any suitable value. In some embodiments a weighting factor is between about -1 x 10-2 and about 1 x 10-2, between about -1 x 10-3 and about 1 x 10-3, between about -5 x 10-4 and about 5 x 10-4, or between about -1 x 10-4 and about 1 x 10-4. In some embodiments, the distribution of weighting factors for various samples is substantially symmetric. A distribution of weighting factors for multiple samples is sometimes a normal distribution. A distribution of weighting factors for multiple samples is sometimes not a normal distribution. In some embodiments the width of a distribution of weighting factors is dependent on the amount of fragments (reads) of fetal CCF nucleic acid fragments. In some embodiments portions comprising greater fetal nucleic acid content generate greater coefficients (e.g. positive or negative e.g. see Figure 31). A weighting factor can be zero or a weighting factor can be greater than zero. In some embodiments about 70% or more, about 75% or more, about 80% or more, about 85% or more, about 90% or more, about 95% or more, or about 98% or more of the weighting factors for a serving are greater than zero.

[374]Um fator de ponderação pode ser determinado por ou associado a qualquer porção adequada de um genoma. Um fator de ponderação pode ser determinado por ou associado a qualquer porção adequada de qualquer cromossomo adequado. Em algumas modalidades um fator de ponderação é determinado por ou associado com algumas ou todas as porções em um genoma. Em algumas modalidades um fator de ponderação é determinado por ou associado com as porções de alguns ou todos os cromossomos de um genoma. Um fator de ponderação é por vezes, determinado por ou associado com porções de cromossomos selecionados. Um fator de ponderação pode ser determinado por ou associado com as porções de um ou mais autossomos. Um fator de ponderação pode ser determinado por ou associado com as porções de uma pluralidade de porções que incluem porções de autossomos ou seu subconjunto. Em algumas modalidades de um fator de ponderação é determinado por ou associado com as porções de um cromossomo do sexo (por exemplo, ChrX e/ou ChrY). Um fator de ponderação pode ser determinado por ou associado com as porções de um ou mais autossomos e um ou mais cromossomos sexuais. Em certas modalidades um fator de ponderação é determinado por ou associado com as porções de uma pluralidade de porções em todos os autossomos e cromossomos X e Y. Um fator de ponderação pode ser determinado por ou associado com as porções de uma pluralidade de porções que não incluem porções em um cromossomo X e/ou Y. Em certas modalidades um fator de ponderação é determinado por ou associado com porções de um cromossomo em que o cromossomo compreende uma aneuploidia (por exemplo, uma aneuploidia de cromossomo inteiro). Em certas modalidades um fator de ponderação é determinado por ou associado apenas com porções de um cromossomo em que o cromossomo não é aneuploidia (por exemplo, um cromossomo euplóide). Um fator de ponderação pode ser determinado por ou associado com porções em uma pluralidade de porções que não inclui porções em cromossomos 13, 18 e/ou 21.[374]A weighting factor may be determined by or associated with any suitable portion of a genome. A weighting factor can be determined by or associated with any suitable portion of any suitable chromosome. In some embodiments a weighting factor is determined by or associated with some or all portions in a genome. In some embodiments a weighting factor is determined by or associated with portions of some or all chromosomes of a genome. A weighting factor is sometimes determined by or associated with portions of selected chromosomes. A weighting factor can be determined by or associated with portions of one or more autosomes. A weighting factor can be determined by or associated with the portions of a plurality of portions that include portions of autosomes or a subset thereof. In some embodiments a weighting factor is determined by or associated with portions of a sex chromosome (eg, ChrX and/or ChrY). A weighting factor can be determined by or associated with portions of one or more autosomes and one or more sex chromosomes. In certain embodiments a weighting factor is determined by or associated with the portions of a plurality of portions on all autosomes and X and Y chromosomes. A weighting factor may be determined by or associated with the portions of a plurality of portions that do not include portions on an X and/or Y chromosome. In certain embodiments a weighting factor is determined by or associated with portions of a chromosome where the chromosome comprises an aneuploidy (eg, a whole chromosome aneuploidy). In certain embodiments a weighting factor is determined by or associated only with portions of a chromosome in which the chromosome is not aneuploidy (eg, an euploid chromosome). A weighting factor can be determined by or associated with portions on a plurality of portions that do not include portions on chromosomes 13, 18 and/or 21.

[375]Em algumas modalidades um fator de ponderação é determinado por uma porção de acordo com uma ou mais amostras (por exemplo, um conjunto de treinamento de amostras). Os fatores de ponderação são frequentemente específico para a porção. Em algumas modalidades um ou mais fatores de ponde ração são atribuídos independentemente a uma porção. Em algumas modalidades um fator de ponderação é determinado de acordo com uma relação de uma determinação da fração fetal (por exemplo, uma determinação da fração fetal específica da amostra) para várias amostras e um parâmetro de porção específica determinado de acordo com várias amostras. Os fatores de ponderação são frequentemente determinados a partir de várias amostras, por exemplo, de cerca de 20 a cerca de 100.000 ou mais, de cerca de 100 a cerca de 100.000 ou mais, de cerca de 500 a cerca de 100.000 ou mais, de cerca de 1000 a cerca de 100.000 ou mais, ou de cerca de 10.000 a cerca de 100.000 ou mais amostras. Os fatores de ponderação podem ser determinados a partir de amostras que são euplóides (por exemplo, amostras de sujeitos que compreendem um feto euplóide, por exemplo, as amostras onde nenhum cromossomo aneuplóide está presente). Em algumas modalidades fatores de ponderação são obtidos a partir de amostras compreendendo um cromossomo aneuplóide (por exemplo, amostras de sujeitos que compreendem um feto euplóide). Em algumas modalidades fatores de ponderação são determinados de várias amostras de sujeitos que têm um feto euplóide e dos sujeitos com um feto com trissomia. Os fatores de ponderação podem ser derivados de várias amostras em que as amostras são de sujeitos com um feto masculino e/ou um feto feminino.[375]In some embodiments a weighting factor is determined by a portion according to one or more samples (eg, a training set of samples). The weighting factors are often portion-specific. In some embodiments one or more weighting factors are independently assigned to a portion. In some embodiments a weighting factor is determined according to a ratio of a fetal fraction determination (e.g., a sample-specific fetal fraction determination) for multiple samples and a specific portion parameter determined across multiple samples. Weighting factors are often determined from multiple samples, for example, from about 20 to about 100,000 or more, from about 100 to about 100,000 or more, from about 500 to about 100,000 or more, from from about 1000 to about 100,000 or more, or from about 10,000 to about 100,000 or more samples. Weighting factors can be determined from samples that are euploid (eg samples from subjects comprising an euploid fetus, eg samples where no aneuploid chromosome is present). In some embodiments weighting factors are obtained from samples comprising an aneuploid chromosome (eg, samples from subjects comprising an euploid fetus). In some embodiments weighting factors are determined from multiple samples of subjects having a euploid fetus and subjects having a fetus with trisomy. Weighting factors can be derived from multiple samples where the samples are from subjects with a male fetus and/or a female fetus.

[376]Uma fração fetal é frequentemente determinada por uma ou mais amostras de um conjunto de treinamento a partir do qual um fator de ponderação é derivado. Uma fração fetal a partir do qual um fator de ponderação é determinado, por vezes, uma determinação da fração fetal específica da amostra. Uma fração fetal a partir do qual um fator de ponderação é determinado pode ser determinada por qualquer método adequado aqui descrito ou conhecido na técnica. Em algumas modalidades uma determinação do teor de ácido nucleico do feto (por exemplo, fração fetal) é realizada usando um ensaio quantificador fetal adequado (FQA) aqui descrito ou conhecido na técnica, exemplos não-limitativos dos quais incluem determinações da fração fetal de acordo com marcadores específicos para um feto masculino, com base em proporções alélicas de sequências polimórficas, de acordo com um ou mais marcadores específicos para ácido nucleico fetal e ácido nucleico não materno, pelo uso de discriminação de DNA à base de metilação (por exemplo, A. Nygren, et al., (2010) Clinical Chemistry 56 (10):1627- 1635), por um método de espectrometria de massa e/ou um sistema que utiliza uma abordagem de PCR competitiva, por um método descrito na publicação do pedido de patente US No. 2010/0105049, que é aqui incorporado por referência, o semelhante ou combinações dos mesmos. Frequentemente, uma fração fetal é determinada, em parte, de acordo com um nível (por exemplo, um ou mais níveis de seção genômica, um nível de um perfil) de um cromossomo Y. Em algumas modalidades uma fração fetal é determinada de acordo com um ensaio adequado de um cromossomo Y (por exemplo, através da comparação da quantidade de locus específico do feto (tal como o locus SRY no cromossomo Y em gravidez de homem) com aquele de um locus em qualquer autos soma que é comum a ambos a mãe e o feto através do uso do PCR quantitativo em tempo real (por exemplo, Lo YM, et al., (1998) Am J Hum Genet 62: 768-775)).[376]A fetal fraction is often determined by one or more samples from a training set from which a weighting factor is derived. A fetal fraction from which a weighting factor is determined, sometimes a sample-specific fetal fraction determination. A fetal fraction from which a weighting factor is determined can be determined by any suitable method described herein or known in the art. In some embodiments a determination of fetal nucleic acid content (e.g., fetal fraction) is performed using a suitable fetal quantifier assay (FQA) described herein or known in the art, non-limiting examples of which include determinations of fetal fraction according to with markers specific for a male fetus, based on allelic ratios of polymorphic sequences, according to one or more markers specific for fetal nucleic acid and non-maternal nucleic acid, by use of methylation-based DNA discrimination (e.g., A Nygren, et al., (2010) Clinical Chemistry 56(10):1627-1635), by a mass spectrometry method and/or a system utilizing a competitive PCR approach, by a method described in the application publication of US patent No. 2010/0105049, which is incorporated herein by reference, the like or combinations thereof. Often, a fetal fraction is determined, in part, according to a level (eg, one or more levels of a genomic section, a level of a profile) of a Y chromosome. In some embodiments, a fetal fraction is determined according to a suitable test of a Y chromosome (for example, by comparing the amount of a fetus-specific locus (such as the SRY locus on the Y chromosome in a male pregnancy) with that of a locus on any autosome that is common to both mother and fetus through the use of quantitative real-time PCR (eg, Lo YM, et al., (1998) Am J Hum Genet 62: 768-775)).

[377]Os parâmetros específicos da porção (por exemplo, para uma amostra de teste) podem ser ponderados ou ajustados por um ou mais fatores de ponderação (por exemplo, fatores de ponderação derivados a partir de um conjunto de treinamento). Por exemplo, um fator de ponderação pode ser derivado para uma porção de acordo com uma relação de um parâmetro de porção específica e determinação da fração fetal para um conjunto de treinamento de várias amostras. Um parâmetro de porção específica de uma amostra de teste pode ser ajustado e/ou ponderado de acordo com o fator de ponderação derivado do conjunto de treinamento. Em algumas modalidades um parâmetro de porção específica a partir do qual um fator de ponderação é derivado, é o mesmo que o parâmetro de porção específica (por exemplo, de uma amostra de teste) que é ajustado ou ponderado (por exemplo, ambos os parâmetros são um FLR). Em certa modalidade, um parâmetro de porção específica, a partir do qual um fator de ponderação é derivado, é diferente do parâmetro de porção específica (por exemplo, de uma amostra de teste) que é ajustada ou ponderada. Por exemplo, um fator de ponderação pode ser determinado a partir de uma relação entre a cobertura (isto é, um parâmetro de porção específica) e fração fetal para um conjunto de treinamento de amostras, e um FLR (isto é, outro parâmetro de porção específica) para uma porção de uma amostra de teste pode ser ajustado de acordo com o fator de ponderação derivado da cobertura. Sem ser limitado pela teoria, um parâmetro de porção específica (por exemplo, para uma amostra de teste), por vezes, pode ser ajustado e/ou ponderado por um fator de ponderação derivado de um parâmetro de porção específica diferente (por exemplo, de um conjunto de treinamento), devido a uma relação e/ou correlação entre cada parâmetro específico da porção e um FLR específico da porção.[377]Portion-specific parameters (eg, for a test sample) may be weighted or adjusted by one or more weighting factors (eg, weighting factors derived from a training set). For example, a weighting factor can be derived for a portion according to a relationship of a specific portion parameter and fetal fraction determination for a multi-sample training set. A specific portion parameter of a test sample can be adjusted and/or weighted according to the weighting factor derived from the training set. In some embodiments, a portion-specific parameter from which a weighting factor is derived is the same as the portion-specific parameter (e.g., of a test sample) that is adjusted or weighted (e.g., both parameters are a FLR). In one embodiment, a specific portion parameter, from which a weighting factor is derived, is different from the specific portion parameter (e.g., of a test sample) that is adjusted or weighted. For example, a weighting factor can be determined from a relationship between coverage (i.e., a specific portion parameter) and fetal fraction for a training set of samples, and a FLR (i.e., another portion parameter). specific) for a portion of a test sample can be adjusted according to the coverage-derived weighting factor. Without being bound by theory, a specific portion parameter (e.g. for a test sample) may sometimes be adjusted and/or weighted by a weighting factor derived from a different portion specific parameter (e.g. a training set), due to a relationship and/or correlation between each portion-specific parameter and a portion-specific FLR.

[378]Uma estimativa da fração fetal específica da porção pode ser determinada para uma amostra (por exemplo, uma amostra de teste) ponderando um parâmetro específico da porção por um determinado fator de ponderação para essa porção. Ponderação pode compreender o ajuste, a conversão e/ou a transformação de um parâmetro específico da porção de acordo com um fator de ponderação através da aplicação de qualquer manipulação matemática adequada, exemplos não - limitativos dos quais incluem multiplicação, divisão, adição, subtração, integração, computação simbólica, computação algébrica, algoritmo, função trigonométrica ou geométrica, transformação (por exemplo, uma transformada de Fourier), o semelhante ou suas combinações. Ponderação pode compreender o ajuste, a conversão e/ou a transformação de um parâmetro específico da porção de acordo com um fator de ponderação de um modelo matemático adequado (por exemplo, o modelo apresentado no Exemplo 7).[378]An estimate of the portion-specific fetal fraction can be determined for a sample (eg, a test sample) by weighting a portion-specific parameter by a given weighting factor for that portion. Weighting may comprise adjusting, converting and/or transforming a portion-specific parameter according to a weighting factor through the application of any suitable mathematical manipulation, non-limiting examples of which include multiplication, division, addition, subtraction, integration, symbolic computation, algebraic computation, algorithm, trigonometric or geometric function, transformation (for example, a Fourier transform), the like, or combinations thereof. Weighting may comprise adjusting, converting and/or transforming a portion-specific parameter according to a weighting factor of a suitable mathematical model (eg, the model presented in Example 7).

[379]Em algumas modalidades uma fração fetal é determinada para uma amostra de acordo com uma ou mais estimativas de fração fetal específica da porção. Em algumas modalidades uma fração fetal é determinada (por exemplo, estimada) de uma amostra (por exemplo, uma amostra de teste) de acordo com a ponderação ou ajuste de um parâmetro específico da porção para uma ou mais porções. Em certas modalidades uma fração do ácido nucleico fetal de uma amostra de teste é estimada com base nas contagens ajustadas ou um subconjunto ajustado de contagens. Em certas modalidades uma fração de ácido nucleico fetal de uma amostra de teste é estimada com base em um FLR ajustado, um FRS ajustado, cobertura ajustada, e/ou mapeabilidade ajustada para uma porção. Em algumas modalidades cerca de 1 a cerca de 500.000, cerca de 100 a cerca de 300.000, cerca de 500 a cerca de 200.000, cerca de 1000 a cerca de 200.000, cerca de 1500 a cerca de 200.000, ou cerca de 1500 a cerca de 50.000 parâmetros específicos da porção são ponderados ou ajustados.[379] In some embodiments a fetal fraction is determined for a sample according to one or more portion-specific fetal fraction estimates. In some embodiments, a fetal fraction is determined (eg, estimated) from a sample (eg, a test sample) by weighting or adjusting a portion-specific parameter for one or more portions. In certain embodiments a fraction of the fetal nucleic acid of a test sample is estimated based on adjusted counts or an adjusted subset of counts. In certain embodiments a fetal nucleic acid fraction of a test sample is estimated based on an adjusted FLR, an adjusted FRS, adjusted coverage, and/or adjusted mappability for a portion. In some embodiments, about 1 to about 500,000, about 100 to about 300,000, about 500 to about 200,000, about 1000 to about 200,000, about 1500 to about 200,000, or about 1500 to about 200,000 50,000 portion-specific parameters are weighted or adjusted.

[380]Uma fração fetal (por exemplo, para uma amostra de teste) pode ser determinada de acordo com várias estimativas da fração fetal específica da porção (por exemplo, para a mesma amostra de teste) por qualquer método adequado. Em algumas modalidades um método para aumentar a precisão da estimativa de uma fração de ácido nucleico fetal em uma amostra de teste de uma mulher grávida compreende a determinação de uma ou mais estimativas da fração fetal específica da porção onde a estimativa da fração fetal para a amostra é determinada de acordo com uma ou mais estimativas de fração fetal específica da porção. Em algumas modalidades estimar ou determinar uma fração de ácido nucleico fetal de uma amostra (por exemplo, uma amostra de teste) compreende somar uma ou mais estimativas da fração fetal específica da porção. Soma pode compreender determinar uma média aritmética, média, mediana, AUC, ou o valor integral de acordo com as estimativas da fração fetal específica da porção.[380]A fetal fraction (eg, for a test sample) may be determined according to various estimates of the portion-specific fetal fraction (eg, for the same test sample) by any suitable method. In some embodiments, a method for increasing the accuracy of estimating a fetal nucleic acid fraction in a test sample from a pregnant woman comprises determining one or more portion-specific fetal fraction estimates where the fetal fraction estimate for the sample is determined according to one or more portion-specific fetal fraction estimates. In some embodiments estimating or determining a fetal nucleic acid fraction of a sample (e.g., a test sample) comprises summing one or more estimates of the portion-specific fetal fraction. Sum may comprise determining an arithmetic mean, mean, median, AUC, or integral value according to portion-specific fetal fraction estimates.

[381]Em algumas modalidades um método para aumentar a precisão da estimativa de uma fração de ácido nucleico fetal em uma amostra de teste de uma mulher grávida, compreende a obtenção de contagens de fragmentos (reads) de sequências mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico inseto de célula circulante de uma amostra de teste de uma mulher grávida, onde, pelo menos, um subconjunto das contagens obtidas são derivadas de uma região do genoma que contribui com um maior número de contagens derivadas de ácido nucleico fetal em relação às contagens totais da região do que contagens de ácido nucleico fetal em relação ao número total de contagens de outra região do genoma. Em algumas modalidades uma estimativa da fração de ácido nucleico fetal é determinada de acordo com um subconjunto das porções, onde o subconjunto das porções é selecionado de acordo com as porções que são mapeadas para um maior número de contagens derivadas de ácido nucleico fetal do que contagens de ácido nucleico fetal de outra porção. Em algumas modalidades o subconjunto das porções é selecionado de acordo com as porções para as quais são mapeadas um maior número de contagens derivadas de ácido nucleico fetal, em relação ao ácido nucleico não fetal, do que as contagens de ácido nucleico fetal, em relação ao ácido nucleico não-fetal, de outra porção. As contagens mapeadas para todas ou um subconjunto das porções podem ser ponderadas fornecendo, desse modo, as contagens ponderadas. As contagens ponderadas podem ser usadas para estimar a fração de ácido nucleico fetal, e as contagens podem ser ponderadas de acordo com as porções para quais são mapeadas um maior número de contagens derivadas de ácido nucleico fetal do que contagens de ácido nucleico fetal de outra porção. Em algumas modalidades as contagens são ponderadas de acordo com as porções para as quais são mapeadas um maior número de contagens derivadas de ácido nucleico fetal, em relação ao ácido nucleico não-fetal, do que as contagens de ácido nucleico fetal, em relação ao ácido nucleico não-fetal, de outra porção.[381] In some embodiments, a method for increasing the accuracy of estimating a fetal nucleic acid fraction in a test sample from a pregnant woman, comprises obtaining counts of fragments (reads) of sequences mapped to portions of a genome of reference, whose sequence reads are circulating insect cell nucleic acid fragments (reads) of a test sample from a pregnant woman, where at least a subset of the counts obtained are derived from a region of the genome that contributes with a greater number of counts derived from fetal nucleic acid relative to total counts from the region than fetal nucleic acid counts relative to the total number of counts from another region of the genome. In some embodiments an estimate of the fetal nucleic acid fraction is determined according to a subset of the portions, where the subset of the portions is selected according to the portions that map to a greater number of fetal nucleic acid-derived counts than counts of fetal nucleic acid from another moiety. In some embodiments the subset of moieties is selected according to moieties to which a greater number of counts derived from fetal nucleic acid, relative to non-fetal nucleic acid, than fetal nucleic acid counts, relative to non-fetal nucleic acid, from another portion. The counts mapped to all or a subset of the servings can be weighted, thereby providing the weighted counts. The weighted counts can be used to estimate the fetal nucleic acid fraction, and the counts can be weighted according to the portions to which a greater number of counts derived from fetal nucleic acid than fetal nucleic acid counts from another portion are mapped . In some embodiments the counts are weighted according to the portions to which a greater number of counts derived from fetal nucleic acid, relative to non-fetal nucleic acid, than counts of fetal nucleic acid, relative to acid, are mapped. non-fetal nucleic acid, from another portion.

[382]Uma fração fetal pode ser determinada para uma amostra (por exemplo, uma amostra de teste) de acordo com várias estimativas da fração fetal específica da porção para a amostra, onde as estimativas específicas da porção são de porções de qualquer região adequada ou segmento de um genoma. As estimativas da fração fetal específica da porção podem ser determinadas por uma ou mais porções de um cromossomo adequado (por exemplo, um ou mais cromossomos selecionados, um ou mais autossomos, um cromossomo sexual (por exemplo, ChrX e/ou ChrY), um cromossomo aneuplóide, um cromossomo euplóide, o semelhante ou suas combinações).[382]A fetal fraction may be determined for a sample (e.g., a test sample) according to various estimates of the portion-specific fetal fraction for the sample, where the portion-specific estimates are from portions of any suitable region or segment of a genome. Estimates of the portion-specific fetal fraction can be determined from one or more portions of a suitable chromosome (e.g., one or more selected chromosomes, one or more autosomes, a sex chromosome (e.g., ChrX and/or ChrY), a aneuploid chromosome, an euploid chromosome, the peer or combinations thereof).

[383]Os parâmetros específicos de porção, fatores de ponderação, estimativas da fração fetal específica da porção (por exemplo, ponderação), e/ou determinações da fração fetal podem ser determinados por um sistema, máquina, aparelho, meio de armazenamento legível por computador não-transitório (por exemplo, com um programa executável armazenado nele), o semelhante ou sua combinação. Em certas modalidades parâmetros específicos da porção, fatores de ponderação, estimativas da fração fetal específica da porção (por exemplo, ponderação), e/ou determinações da fração fetal são determinados (por exemplo, em parte) por um sistema ou uma máquina que compreende um ou mais microprocessadores e memória. Em algumas modalidades parâmetros específicos da porção, fatores de ponderação, estimativas da fração fetal específica da porção (por exemplo, ponderação), e/ou determinações da fração fetal são determinados (por exemplo, em parte) por um meio de armazenamento legível por computador não transitório com um programa executável armazenado no mesmo, onde o programa instrui um microprocessador para executar a determinação.[383] Portion-specific parameters, weighting factors, portion-specific fetal fraction estimates (e.g., weighting), and/or fetal fraction determinations may be determined by a system, machine, apparatus, human-readable storage medium non-transient computer (for example, with an executable program stored on it), the like or their combination. In certain embodiments, portion-specific parameters, weighting factors, portion-specific fetal fraction estimates (e.g., weighting), and/or fetal fraction determinations are determined (e.g., in part) by a system or machine comprising one or more microprocessors and memory. In some embodiments, portion-specific parameters, weighting factors, portion-specific fetal fraction estimates (e.g., weighting), and/or fetal fraction determinations are determined (e.g., in part) by a computer-readable storage medium. non-transient with an executable program stored therein, where the program instructs a microprocessor to perform the determination.

Ploidia fetalfetal ploidy

[384]A determinação da ploidia fetal, em algumas modalidades, é usada, em parte, para realizar uma determinação da presença ou ausência de uma variação genética (por exemplo, uma aneuploidia no cromossomo, uma trissomia). Um ploidia fetal pode ser determinado, em parte, a partir de uma medida da fração fetal determinada através de um método adequado de determinação fração fetal, incluindo os métodos aqui descritos. Um ploidia fetal e/ou a presença de uma variação genética (por exemplo, uma aneuploidia) pode ser determinada de acordo com uma fração fetal. Em algumas modalidades a ploidia fetal é determinada de acordo com uma determinação da fração fetal e a equação (8), (20), (21) ou uma variação ou derivação das mesmas (Exemplo 2). Em algumas modalidades, ploidia fetal é determinada através de um método descrito abaixo. Em algumas modalidades cada método descrito a seguir requer uma contagem de referência calculada Fi (por vezes representada como fi) determinada por uma porção (ou seja, uma porção, i) de um genoma de várias amostras em que a ploidia do feto para a porção i do genoma é euplóide. Em algumas modalidades um valor de incerteza (por exemplo, um desvio padrão, o) é determinado para a contagem de referência fi. Em algumas modalidades uma contagem de referência fi, um valor de incerteza, uma contagem da amostra de teste e/ou uma fração fetal medida (F) são usados para determinar ploidia fetal de acordo com um método descrito abaixo. Em algumas modalidades uma contagem de referência (por exemplo, uma contagem de referência média, mediana ou média aritmética) é normalizada por um método descrito aqui (por exemplo, normalização em porções, normalização pelo teor de GC, regressão por mínimos quadrados linear e não-linear, LOESS, GC LOESS, LOWESS, PERUN, RM, GCRM e/ou suas combinações). Em algumas modalidades uma contagem de referência de um segmento de um genoma que é euplóide é igual a 1 quando a contagem de referência é normalizada por PERUN. Em algumas modalidades, ambas a contagem de referência (por exemplo, para um feto conhecido por ser euplóide) e contagens de uma amostra de teste de uma porção ou segmento de um genoma são normalizadas por PERUN e a contagem de referência é igual a 1. Do mesmo modo, em algumas modalidades, uma contagem de referência de uma porção ou segmento de um genoma que é euplóide é igual a 1 quando as contagens são normalizadas (isto é, divididas por) uma mediana da contagem de referência. Por exemplo, em algumas modalidades ambas a contagem de referência (por exemplo, para um feto que é euplóide) e as contagens de uma amostra de teste para uma porção ou segmento de um genoma são normalizadas por uma contagem de referência mediana, a contagem de referência normalizada é igual a 1 e a contagem da amostra de teste é normalizada (por exemplo, dividida por) pela contagem de referência mediana. Em algumas modalidades, ambas a contagem de referência (por exemplo, para um feto que é euplóide) e as contagens de uma amostra de teste para uma porção ou segmento de um genoma são normalizadas por GCRM, GC, RM ou um método adequado. Em algumas modalidades uma contagem de referência é uma contagem de referência média, mediana ou média aritmética. Uma contagem de referência é geralmente uma contagem normalizada para uma porção (por exemplo, um nível da seção genômica normalizado). Em algumas modalidades uma contagem de referência e as contagens para uma amostra de teste são as contagens brutas. Uma contagem de referência, em algumas modalidades, é determinada de um perfil de contagem média, mediana ou média aritmética. Em algumas modalidades, a contagem de referência é um nível de seção genômica calculado. Em algumas modalidades uma contagem de referência de uma amostra de referência e uma contagem de uma amostra de teste (por exemplo, uma amostra do paciente, por exemplo, Yi) são normalizadas pelo mesmo método ou processo.[384]Determining fetal ploidy, in some embodiments, is used, in part, to make a determination of the presence or absence of a genetic variation (eg, a chromosomal aneuploidy, a trisomy). A fetal ploidy can be determined, in part, from a measurement of the fetal fraction determined using a suitable fetal fraction determination method, including the methods described herein. A fetal ploidy and/or the presence of a genetic variation (eg an aneuploidy) can be determined according to a fetal fraction. In some embodiments fetal ploidy is determined according to a fetal fraction determination and equation (8), (20), (21) or a variation or derivation thereof (Example 2). In some embodiments, fetal ploidy is determined using a method described below. In some embodiments, each method described below requires a calculated reference count Fi (sometimes represented as fi) determined by a portion (i.e., a portion, i) of a multi-sample genome where the ploidy of the fetus for the portion i of the genome is euploid. In some embodiments an uncertainty value (eg, a standard deviation, o) is determined for the phi reference count. In some embodiments a reference phi count, an uncertainty value, a test sample count and/or a measured fetal fraction (F) are used to determine fetal ploidy according to a method described below. In some embodiments, a reference count (e.g., a mean, median, or arithmetic mean reference count) is normalized by a method described herein (e.g., portion normalization, GC content normalization, linear and non-linear least squares regression). -linear, LOESS, GC LOESS, LOWESS, PERUN, RM, GCRM and/or combinations thereof). In some embodiments a reference count of a segment of a genome that is euploid is equal to 1 when the reference count is normalized by PERUN. In some embodiments, both the reference count (e.g., for a fetus known to be euploid) and counts of a test sample of a portion or segment of a genome are normalized by PERUN and the reference count is equal to 1. Likewise, in some embodiments, a reference count of a portion or segment of a genome that is euploid is equal to 1 when the counts are normalized (i.e., divided by) a median of the reference count. For example, in some embodiments both the reference count (e.g., for a fetus that is euploid) and the counts of a test sample for a portion or segment of a genome are normalized by a median reference count, the count of normalized reference equals 1, and the test sample count is normalized (eg, divided by) by the median reference count. In some embodiments, both the baseline count (e.g., for a fetus that is euploid) and the test sample counts for a portion or segment of a genome are normalized by GCRM, GC, MR, or a suitable method. In some embodiments a reference count is a mean, median, or arithmetic mean reference count. A reference count is usually a normalized count for a portion (for example, a normalized genomic section level). In some embodiments a reference count and the counts for a test sample are the raw counts. A baseline count, in some embodiments, is determined from a mean, median, or arithmetic mean count profile. In some embodiments, the reference count is a calculated genomic section level. In some embodiments, a reference count of a reference sample and a count of a test sample (eg, a patient sample, eg, Yi) are normalized by the same method or process.

[385]Em algumas modalidades uma medição da fração fetal (F) é determinada. Esse valor da fração fetal pode então ser usado para determinar a ploidia fetal de acordo com a equação (8), uma derivação ou uma variação da mesma. Em algumas modalidades, um valor negativo é retornado se o feto é euplóide e um valor positivo é retornado se o feto não é euplóide. Em algumas modalidades um valor negativo indica que o feto é euplóide para o segmento do genoma considerado. Em certas modalidades, um valor que não seja negativo indica que o feto compreende uma aneuploidia (por exemplo, uma duplicação). Em certas modalidades, um valor que não seja negativo indica que o feto compreende uma trissomia. Em certas modalidades, qualquer valor positivo indica que o feto compreende uma aneuploidia (por exemplo, uma trissomia, uma duplicação).[385]In some embodiments a measurement of the fetal fraction (F) is determined. This fetal fraction value can then be used to determine fetal ploidy according to equation (8), a derivation or a variation thereof. In some embodiments, a negative value is returned if the fetus is euploid and a positive value is returned if the fetus is not euploid. In some embodiments a negative value indicates that the fetus is euploid for the genome segment considered. In certain embodiments, a value that is not negative indicates that the fetus comprises an aneuploidy (eg, a duplication). In certain embodiments, a value that is not negative indicates that the fetus comprises a trisomy. In certain embodiments, any positive value indicates that the fetus comprises an aneuploidy (eg, a trisomy, a duplication).

[386]Em algumas modalidades uma soma dos resíduos quadrados é determinada. Por exemplo, uma equação representa a soma dos residuais quadrados derivados da equação (8) é ilustrada na equação (18). Em algumas modalidades uma soma de quadrados residuais é determinada da equação (8) para um valor de ploidia X definido para um valor de 1 (ver a equação (9)) e para um valor de ploidia definido para um valor de 3/2 (ver a equação (13)). Em algumas modalidades a soma dos resíduos quadrados (equações (9) e (13)) são determinados por um segmento de um cromossomo ou genoma (por exemplo, para todas as porções de um genoma de referência i em um segmento do genoma). Por exemplo, a soma dos residuais quadrados (por exemplo, equações (9) e (13)) pode ser determinada para os cromossomos 21, 13, 18 ou uma porção dos mesmos. Em algumas modalidades, para determinar um estado de ploidia de um feto, o resultado da equação (13) é subtraído da equação (9) para se chegar a um valor, phi (por exemplo, ver a equação (14)). Em certas modalidades, o sinal (isto é, positivo ou negativo) do valor phi determina a presença ou ausência de uma aneuploidia fetal. Em certas modalidades, um valor de phi (por exemplo, da equação (14)) que é negativo indica a ausência de uma aneuploidia (por exemplo, o feto é euplóide para porções de um genoma de referência i) e um valor de phi que não é negativo indica a presença de uma aneuploidia (por exemplo, uma trissomia).[386]In some embodiments a sum of squared residuals is determined. For example, an equation representing the sum of squared residuals derived from equation (8) is illustrated in equation (18). In some embodiments a residual sum of squares is determined from equation (8) for a ploidy value X set to a value of 1 (see equation (9)) and for a ploidy value set to a value of 3/2 ( see equation (13)). In some embodiments the sum of squared residues (equations (9) and (13)) are determined for a segment of a chromosome or genome (eg, for all portions of a reference genome i in a genome segment). For example, the sum of squared residuals (eg equations (9) and (13)) can be determined for chromosomes 21, 13, 18 or a portion thereof. In some embodiments, to determine a ploidy status of a fetus, the result of equation (13) is subtracted from equation (9) to arrive at a value, phi (for example, see equation (14)). In certain embodiments, the sign (ie, positive or negative) of the phi value determines the presence or absence of a fetal aneuploidy. In certain embodiments, a phi value (e.g., from equation (14)) that is negative indicates the absence of an aneuploidy (e.g., the fetus is euploid for portions of a reference genome i) and a phi value that is not negative indicates the presence of an aneuploidy (for example, a trisomy).

[387]Em algumas modalidades a contagem de referência fi, o valor de incerteza para contagem de referência a e/ou a fração fetal medida (F) são usados nas equações (9) e (13) para determinar a soma dos residuais quadrados para a soma de todas as porções de um genoma de referência i. Em algumas modalidades a contagem de referência, o valor de incerteza para contagem de referência a e/ou a fração fetal medida (F) são usados nas equações (9) e (13) para determinar ploidia fetal. Em algumas modalidades as contagens (por exemplo, contagens normalizadas, por exemplo, nível de seção genômica calculado) representadas por yi para a porção i, para uma amostra de teste são usadas para determinar o estado de ploidia um feto para porção i. Por exemplo, em certas modalidades, o estado de ploidia para um segmento de um genoma é determinado de acordo com uma contagem de referência fi, um valor de incerteza (por exemplo, da contagem de referência), uma fração fetal (F) determinada para uma amostra de teste e as contagens yi determinadas para a amostra de teste em que o estado de ploidia é determinado de acordo com a equação (14) ou uma derivação ou variação destas. Em algumas modalidades as contagens yi e/ou contagens de referência são normalizadas por um método aqui descrito (por exemplo, normalização em porções, normalização pelo teor de GC, regressão dos mínimos quadrados linear e não-linear, LOESS, GC LOESS, LOWESS, PERUN, RM, GCRM e suas combinações). Em algumas modalidades um estado de ploidia fetal (por exemplo, euplóide, aneuplóide, trissomia) para uma porção ou segmento de um genoma ou cromossomo é determinado pelo exemplo não-limitativo descrito acima e na secção de Exemplos.[387]In some embodiments the reference count fi, the uncertainty value for the reference count a and/or the measured fetal fraction (F) are used in equations (9) and (13) to determine the sum of squared residuals for the sum of all portions of a reference genome i. In some embodiments the reference count, the uncertainty value for reference count a and/or the measured fetal fraction (F) are used in equations (9) and (13) to determine fetal ploidy. In some embodiments the counts (e.g., normalized counts, e.g., calculated genomic section level) represented by yi for portion i, for a test sample are used to determine the ploidy status of a fetus for portion i. For example, in certain embodiments, the ploidy status for a segment of a genome is determined according to a reference count phi, an uncertainty value (e.g., from the reference count), a fetal fraction (F) determined for a test sample and yi scores determined for the test sample in which ploidy status is determined according to equation (14) or a derivation or variation thereof. In some embodiments, yi counts and/or reference counts are normalized by a method described herein (e.g., portion normalization, normalization by GC content, linear and nonlinear least squares regression, LOESS, GC LOESS, LOWESS, PERUN, RM, GCRM and their combinations). In some embodiments a fetal ploidy status (e.g., euploid, aneuploid, trisomy) for a portion or segment of a genome or chromosome is determined by the non-limiting example described above and in the Examples section.

[388]Em algumas modalidades uma fração fetal é determinada de uma amostra de teste, contagens y são determinadas para uma amostra de teste e ambas são usadas para determinar uma ploidia de um feto a partir de uma amostra de teste. Em certas modalidades do método aqui descrito, o valor da ploidia fetal representado por X não é fixo ou assumido. Em certas modalidades do método descrito aqui, fração fetal F é fixa. Em algumas modalidades, uma ploidia (por exemplo, um valor de ploidia) é determinada por uma porção ou segmento de um genoma de acordo com a equação (20) ou (21) (Exemplo 2). Em algumas modalidades desse método, um valor de ploidia é determinado, em que o valor é próximo de 1, 3/2, 5/4 ou. Em algumas modalidades um valor de ploidia de cerca de 1 indica um feto euplóide, um valor de cerca de 3/2 indica uma trissomia fetal e, no caso dos gêmeos, um valor de cerca de 5/4 indica que um feto compreende uma trissomia e o outro é euplóide para a porção ou segmento do genoma considerado. Informações adicionais relativas à determinação da presença ou ausência de uma aneuploidia fetal de uma determinação de ploidia fetal são discutidas em outra seção abaixo.[388]In some embodiments a fetal fraction is determined from a test sample, y counts are determined for a test sample, and both are used to determine a ploidy of a fetus from a test sample. In certain embodiments of the method described herein, the value of fetal ploidy represented by X is not fixed or assumed. In certain embodiments of the method described herein, fetal fraction F is fixed. In some embodiments, a ploidy (e.g., a ploidy value) is determined for a portion or segment of a genome according to equation (20) or (21) (Example 2). In some embodiments of this method, a ploidy value is determined, where the value is close to 1, 3/2, 5/4 or . In some embodiments a ploidy value of about 1 indicates a euploid fetus, a value of about 3/2 indicates a fetal trisomy, and in the case of twins, a value of about 5/4 indicates a fetus comprising a trisomy and the other is euploid for the portion or segment of the genome considered. Additional information regarding the determination of the presence or absence of a fetal aneuploidy from a fetal ploidy determination is discussed in another section below.

[389]Em algumas modalidades, fração fetal é determinada, fixada como seu valor determinado e ploidia fetal é determinada de uma regressão. Qualquer regressão adequada pode ser utilizada, exemplos não-limitativos dos quais incluem uma regressão linear, regressão não-linear (por exemplo, uma regressão polinomial), e semelhante. Em algumas modalidades, uma regressão linear é utilizada de acordo com a equação (8), (20), (21) e/ou uma derivação ou variação das mesmas. Em algumas modalidades, a regressão linear é utilizada de acordo com uma soma dos resíduos quadrados derivados da equação (8), (20), (21) e/ou uma derivação ou variação da mesma. Em algumas modalidades, ploidia fetal é determinada de acordo com a equação (8), (20), (21) e/ou uma derivação ou variação da mesma e uma regressão não é usada. Em algumas modalidades, ploidia fetal é determinada de acordo com uma soma de quadrados resíduos derivados da equação (8), (20), (21) e/ou uma derivação ou variação da mesma para várias porções de um genoma de referência i e uma regressão não é usada. Uma derivação de uma equação é qualquer variação da equação obtida a partir de uma prova matemática de uma equação.[389] In some embodiments, fetal fraction is determined, fixed as its determined value, and fetal ploidy is determined from a regression. Any suitable regression can be used, non-limiting examples of which include a linear regression, non-linear regression (e.g., a polynomial regression), and the like. In some embodiments, a linear regression is used according to equation (8), (20), (21) and/or a derivation or variation thereof. In some embodiments, linear regression is used according to a sum of squared residuals derived from equation (8), (20), (21) and/or a derivation or variation thereof. In some embodiments, fetal ploidy is determined according to equation (8), (20), (21) and/or a derivation or variation thereof and a regression is not used. In some embodiments, fetal ploidy is determined according to a sum of squared residues derived from equation (8), (20), (21) and/or a derivation or variation thereof for various portions of a reference genome i and a regression it is not used. A derivation of an equation is any variation of the equation obtained from a mathematical proof of an equation.

[390]Em algumas modalidades uma contagem de referência fi (descrita anteriormente aqui), um valor de incerteza a e/ou uma fração fetal medida (F) são usados nas equações (20) e (21) para determinar uma ploidia fetal. Em algumas modalidades uma contagem de referência fi, um valor de incerteza a e/ou uma fração fetal medida (F) são usados nas equações (20) ou (21) para determinar uma ploidia fetal X para porção i ou para uma soma de várias porções de um genoma de referência i (por exemplo, para a soma de todas as porções de um genoma de referência i para um cromossomo ou seu segmento). Em algumas modalidades as contagens (por exemplo, contagens normalizadas, nível da seção genômica calculado), representada por yi para a porção i, para uma amostra de teste são usadas para determinar a ploidia de um feto para um segmento de um genoma representado por várias porções de um genoma de referência i. Por exemplo, em certas modalidades, a ploidia X para um segmento de um genoma é determinada de acordo com uma contagem de referência fi, um valor de incerteza, uma fração fetal (F) determinada para uma amostra de teste e as contagens yi determinadas para a amostra de teste em que a ploidia é determinada de acordo com a equação (20), (21) ou uma derivação ou a variação da mesma. Em algumas modalidades as contagens yi e/ou contagens de referência são normalizadas por um método aqui descrito (por exemplo, normalização em porções, normalização pelo teor de GC, regressão dos mínimos quadrados lineares e não-lineares, LOESS, GC LOESS, LOWESS, PERUN, RM, GCRM e suas combinações). Em algumas modalidades as contagens yi e/ou contagens de referência são normalizadas e/ou processadas pelo mesmo método (por exemplo, normalização em porções, normalização pelo teor de GC, regressão dos mínimos quadrados lineares e não- lineares, LOESS, GC LOESS, LOWESS, PERUN, RM, GCRM, um método aqui descrito, ou combinações dos mesmos). Em algumas modalidades contagens yi e fi são contagens mapeadas para a mesma porção ou segmento de um cromossomo ou genoma.[390] In some embodiments a reference count phi (described earlier here), an uncertainty value a, and/or a measured fetal fraction (F) are used in equations (20) and (21) to determine a fetal ploidy. In some embodiments a reference count fi, an uncertainty value a and/or a measured fetal fraction (F) are used in equations (20) or (21) to determine a fetal ploidy X for portion i or for a sum of several portions of a reference genome i (for example, for the sum of all portions of a reference genome i for a chromosome or its segment). In some embodiments the counts (e.g., normalized counts, calculated genomic section level), represented by yi for portion i, for a test sample are used to determine the ploidy of a fetus for a segment of a genome represented by several portions of a reference genome i. For example, in certain embodiments, the X ploidy for a segment of a genome is determined according to a fi reference count, an uncertainty value, a determined fetal fraction (F) for a test sample, and the determined yi counts for the test sample in which ploidy is determined according to equation (20), (21) or a derivation or variation thereof. In some embodiments, yi counts and/or reference counts are normalized by a method described herein (e.g., portion normalization, GC content normalization, linear and nonlinear least squares regression, LOESS, GC LOESS, LOWESS, PERUN, RM, GCRM and their combinations). In some embodiments the yi counts and/or reference counts are normalized and/or processed by the same method (e.g., portion normalization, GC content normalization, linear and nonlinear least squares regression, LOESS, GC LOESS, LOWESS, PERUN, RM, GCRM, a method described herein, or combinations thereof). In some embodiments yi and fi counts are counts mapped to the same portion or segment of a chromosome or genome.

[391]O valor de incerteza u pode ser uma medida adequada de erro, exemplos não-limitativos dos quais incluem o desvio padrão, o erro padrão, variância calculada, valor de p, e/ou desvio médio absoluto (MAD). O valor de incerteza pode ser determinado para qualquer medição adequada, exemplos não-limitativos dos quais incluem pontuações de Z, valores de Z, valores de t, valores de p, erro de validação cruzada, nível de seção genômica, níveis de seção genômica calculados, níveis, contagens, semelhante, ou suas combinações. Em algumas modalidades u é definido como um valor de 1. Em algumas modalidades u não é definido para um valor de 1. Em algumas modalidades o valor de u é estimado e, por vezes, é medido e/ou calculado.[391]The u uncertainty value can be a suitable measure of error, non-limiting examples of which include standard deviation, standard error, calculated variance, p-value, and/or mean absolute deviation (MAD). The uncertainty value can be determined for any suitable measurement, non-limiting examples of which include Z scores, Z values, t values, p values, cross validation error, genomic section level, calculated genomic section levels , levels, scores, similar, or combinations thereof. In some embodiments u is set to a value of 1. In some embodiments u is not set to a value of 1. In some embodiments the value of u is estimated and sometimes measured and/or calculated.

[392]Em algumas modalidades Mi é a ploidia da mãe (isto é, ploidia materna) para uma porção do genoma i. Em algumas modalidades Mi é determinado para o mesmo paciente (por exemplo, a mesma amostra de teste) a partir do qual Yi é determinado. Em algumas modalidades a ploidia materna Mi é conhecida ou determinada de acordo com um método aqui descrito. Em algumas modalidades a ploidia materna é determinada antes ou depois de preenchimento (por exemplo, depois de fazer os ajustes do nível). Em certas modalidades Mi é estimado ou determinado a partir de um perfil de visualização. Em algumas modalidades a ploidia materna Mi é não conhecida. Em algumas modalidades a ploidia materna Mi é assumida. Por exemplo, em algumas modalidades, assume-se ou sabe-se que a mãe não tem deleções e/ou duplicações no segmento do genoma a ser avaliado. Em algumas modalidades, assume-se ou sabe-se que ploidia materna é 1. Em algumas modalidades a ploidia materno é definida para um valor de 1 após preenchimento (por exemplo, depois de fazer ajustes do nível). Em algumas modalidades a ploidia materna é ignorado e é definida para um valor de 1. Em algumas modalidades equação (21) é derivada da equação (20) com o pressuposto de que a mãe não tem deleções e/ou duplicações no segmento do genoma sendo avaliado.[392] In some embodiments Mi is the maternal ploidy (ie, maternal ploidy) for a portion of the i genome. In some embodiments Mi is determined for the same patient (eg the same test sample) from which Yi is determined. In some embodiments maternal Mi ploidy is known or determined according to a method described herein. In some modalities maternal ploidy is determined before or after filling in (for example, after making level adjustments). In certain modalities Mi is estimated or determined from a visualization profile. In some embodiments maternal Mi ploidy is not known. In some embodiments maternal Mi ploidy is assumed. For example, in some embodiments, it is assumed or known that the mother has no deletions and/or duplications in the segment of the genome being evaluated. In some embodiments, maternal ploidy is assumed or known to be 1. In some embodiments, maternal ploidy is set to a value of 1 after padding (eg, after making level adjustments). In some embodiments maternal ploidy is ignored and is set to a value of 1. In some embodiments equation (21) is derived from equation (20) with the assumption that the mother has no deletions and/or duplications in the genome segment being rated.

[393]Em algumas modalidades um método para a determinação da ploidia fetal está de acordo com os fragmentos (reads) da sequência de ácido nucleico para uma amostra de teste obtida de uma mulher grávida. Em algumas modalidades os fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra (por exemplo, uma amostra de teste). Em algumas modalidades, um método para a determinação da ploidia fetal compreende a obtenção de contagens de fragmentos (reads) de sequências mapeados para porções de um genoma de referência. Em algumas modalidades os fragmentos (reads) de sequências são mapeados para um subconjunto de porções do genoma de referência. Em certas modalidades determinar a ploidia fetal compreende a determinação de uma fração fetal. Em algumas modalidades determinar a podia fetal compreende calcular ou determinar níveis de seção genômica. Em certas modalidades determinar a ploidia fetal compreende a determinação de uma fração fetal e calcular ou determinar níveis de seção genômica. Uma fração fetal e os níveis de seção genômica calculados podem ser determinados a partir da mesma amostra de teste (por exemplo, a mesma parte da amostra de teste). Em algumas modalidades a fração fetal e os níveis de seção genômica calculados são determinados a partir dos mesmos fragmentos (reads) obtidos da mesma amostra de teste (por exemplo, a mesma parte da amostra de teste). Em certas modalidades, a fração fetal e os níveis de seção genômica calculados são determinados dos mesmos fragmentos (reads) obtidos a partir da mesma execução de sequenciamento e/ou a partir da mesma célula de fluxo. Em algumas modalidades a fração fetal e os níveis de seção genômica calculados são determinados a partir do mesmo equipamento e/ou máquina (por exemplo, um aparelho de sequenciamento, célula de fluxo, ou semelhante).[393] In some embodiments a method for determining fetal ploidy is according to nucleic acid sequence reads for a test sample obtained from a pregnant woman. In some embodiments, the sequence reads are circulating cell-free nucleic acid reads from a sample (e.g., a test sample). In some embodiments, a method for determining fetal ploidy comprises obtaining counts of fragments (reads) of sequences mapped to portions of a reference genome. In some embodiments, sequence reads are mapped to a subset of portions of the reference genome. In certain embodiments determining fetal ploidy comprises determining a fetal fraction. In some embodiments determining fetal pod comprises calculating or determining genomic section levels. In certain embodiments determining fetal ploidy comprises determining a fetal fraction and calculating or determining genomic section levels. A fetal fraction and calculated genomic section levels can be determined from the same test sample (eg, the same part of the test sample). In some embodiments the fetal fraction and calculated genomic section levels are determined from the same fragments (reads) obtained from the same test sample (eg, the same part of the test sample). In certain embodiments, the fetal fraction and calculated genomic section levels are determined from the same fragments (reads) obtained from the same sequencing run and/or from the same flow cell. In some embodiments, the fetal fraction and calculated genomic section levels are determined from the same equipment and/or machine (eg, a sequencing apparatus, flow cell, or the like).

[394]Em algumas modalidades um método para a determinação da ploidia fetal é determinado de acordo com a determinação da fração fetal e contagens normalizadas (por exemplo, níveis de seção genômica calculados), onde a determinação da fração fetal e as contagens normalizadas (por exemplo, níveis de seção genômica calculados) são determinadas a partir de diferentes partes de uma amostra de teste (por exemplo, alíquotas diferentes, ou, por exemplo, diferentes amostras de teste retiradas em cerca do mesmo tempo do mesmo sujeito ou paciente). Por exemplo, por vezes, uma fração fetal é determinada a partir de uma primeira parte de uma amostra de teste e as contagens normalizadas e/ou níveis de seção genômica são determinados a partir de uma segunda parte da amostra de teste. Em algumas modalidades a fração fetal e os níveis de seção genômica calculados são determinados a partir de amostras de teste diferentes (por exemplo, diferentes partes de uma amostra de teste) colhidas do mesmo sujeito (por exemplo, paciente). Em algumas modalidades a fração fetal e os níveis de seção genômica calculados são determinados a partir de fragmentos (reads) obtidos em diferentes momentos. Em algumas modalidades, a determinação da fração fetal e as contagens normalizadas (por exemplo, níveis de seção genômica calculados) são determinadas a partir de um equipamento diferente e/ou de diferentes máquinas (por exemplo, um aparelho de sequenciamento, célula de fluxo, ou semelhante).[394] In some embodiments a method for determining fetal ploidy is determined according to fetal fraction determination and normalized counts (e.g., calculated genomic section levels), where fetal fraction determination and normalized counts (for example, (e.g., calculated genomic section levels) are determined from different parts of a test sample (e.g., different aliquots, or, for example, different test samples taken at about the same time from the same subject or patient). For example, sometimes a fetal fraction is determined from a first part of a test sample and normalized counts and/or genomic section levels are determined from a second part of the test sample. In some embodiments, fetal fraction and calculated genomic section levels are determined from different test samples (eg, different parts of a test sample) taken from the same subject (eg, patient). In some modalities the fetal fraction and calculated genomic section levels are determined from fragments (reads) obtained at different times. In some embodiments, fetal fraction determination and normalized counts (e.g., calculated genomic section levels) are determined from different equipment and/or different machines (e.g., sequencing apparatus, flow cell, or similar).

ResultadoResult

[395]Métodos aqui descritos podem fornecer uma determinação da presença ou ausência de uma variação genética (por exemplo, aneuploidia fetal) para uma amostra fornecendo, desse modo, um resultado (por exemplo, desse modo fornecendo um resultado determinante da presença ou ausência de uma variação genética (por exemplo, aneuploidia fetal)). Uma variação genética, frequentemente, inclui um ganho, uma perda e/ou alteração (por exemplo, duplicação, deleção, fusão, inserção, mutação, reorganização, substituição ou metilação aberrante) de informação genética (por exemplo, cromossomos, segmentos de cromossomos, regiões polimórficas, regiões translocadas, sequência de nucleotídeo alterada, o semelhante ou combinações das mesmas) que resulta em uma mudança detectável no genoma ou informação genética de um sujeito de teste em relação a uma referência. Presença ou ausência de uma variação genética pode ser determinada através da transformação, análise e/ou a manipulação de fragmentos (reads) de sequências que tenham sido mapeados para porções (por exemplo, contagens, contagens de porções genômicas de um genoma de referência). Determinar um resultado, em algumas modalidades, compreende a análise do ácido nucleico de uma mulher grávida. Em certas modalidades, um resultado é determinado de acordo com as contagens (por exemplo, contagens normalizadas) obtidas de uma mulher grávida, onde as contagens são de ácido nucleico obtido da mulher grávida.[395]Methods described herein can provide a determination of the presence or absence of a genetic variation (eg, fetal aneuploidy) for a sample, thereby providing a result (eg, thereby providing a result determining the presence or absence of a genetic variation (e.g., fetal aneuploidy)). A genetic variation often includes a gain, loss, and/or alteration (e.g., duplication, deletion, fusion, insertion, mutation, rearrangement, substitution, or aberrant methylation) of genetic information (e.g., chromosomes, chromosome segments, polymorphic regions, translocated regions, altered nucleotide sequence, the like or combinations thereof) that results in a detectable change in the genome or genetic information of a test subject relative to a reference. Presence or absence of a genetic variation can be determined by transforming, analyzing and/or manipulating fragments (reads) of sequences that have been mapped to portions (eg, counts, counts of genomic portions of a reference genome). Determining an outcome, in some embodiments, comprises analyzing nucleic acid from a pregnant woman. In certain embodiments, a result is determined according to counts (e.g., normalized counts) obtained from a pregnant woman, where the counts are from nucleic acid obtained from the pregnant woman.

[396]Métodos descritos aqui, por vezes, determinam a presença ou ausência de uma aneuploidia fetal (por exemplo, aneuploidia total do cromossomo, aneuploidia parcial do cromossomo ou aberração cromossômica segmental (por exemplo, mosaicismo, deleção e/ou inserção)) para uma amostra de teste de uma mulher grávida tendo um feto. Em certas modalidades métodos aqui descritos detectam euplodia ou a falta de euploidia (não-euploidia) para uma amostra de uma mulher grávida tendo um feto. Métodos descritos aqui, por vezes, detectam trissomia para um ou mais cromossomos (por exemplo, cromossomo 13, cromossomo 18, cromossomo 21 ou combinação de ambos) ou segmento dos mesmos.[396]Methods described here sometimes determine the presence or absence of a fetal aneuploidy (eg, total chromosome aneuploidy, partial chromosome aneuploidy, or segmental chromosomal aberration (eg, mosaicism, deletion and/or insertion)) for a test sample from a pregnant woman carrying a fetus. In certain embodiments methods described herein detect euploidy or the lack of euploidy (non-euploidy) for a sample from a pregnant woman carrying a fetus. Methods described here sometimes detect trisomy for one or more chromosomes (eg, chromosome 13, chromosome 18, chromosome 21, or combination of both) or segments thereof.

[397]Em algumas modalidades, a presença ou ausência de uma variação genética (por exemplo, uma aneuploidia fetal) é determinada por um método aqui descrito, por um método conhecido na técnica ou por uma combinação dos mesmos. Presença ou ausência de uma variação genética geralmente é determinada das contagens de fragmentos (reads) de sequências mapeados para porções de um genoma de referência. Contagens de fragmentos (reads)de sequências usadas para determinar a presença ou ausência de uma variação genética, por vezes, são contagens brutas e/ou contagens filtradas, e frequentemente, são contagens normalizadas. Um processo ou processos de normalização adequados podem ser usados para gerar contagens normalizadas, exemplos não-limitativos dos quais incluem normalização em porções, a normalização pelo teor de GC, regressão dos mínimos quadrados linear e não-linear, LOESS, GC LOESS, LOWESS, PERUN, RM, GCRM e suas combinações. Contagens normalizadas, por vezes, são expressas como um ou mais níveis ou em níveis em um perfil para um conjunto ou conjuntos particulares de porções. Contagens normalizadas, por vezes, são ajustadas ou preenchidas antes de se determinar a presença ou ausência de uma variação genética.[397] In some embodiments, the presence or absence of a genetic variation (eg, a fetal aneuploidy) is determined by a method described herein, by a method known in the art, or by a combination thereof. Presence or absence of a genetic variation is usually determined from sequence read counts mapped to portions of a reference genome. Sequence read counts used to determine the presence or absence of genetic variation are sometimes raw counts and/or filtered counts, and often are normalized counts. A suitable normalization process or processes can be used to generate normalized counts, non-limiting examples of which include normalization on portions, normalization by GC content, linear and non-linear least squares regression, LOESS, GC LOESS, LOWESS, PERUN, RM, GCRM and their combinations. Normalized counts are sometimes expressed as one or more levels or in levels in a profile for a particular set or sets of servings. Normalized counts are sometimes adjusted or padded before determining the presence or absence of a genetic variation.

[398]Em algumas modalidades um resultado é determinado de acordo com um ou mais níveis. Em algumas modalidades, a determinação da presença ou ausência de uma variação genética (por exemplo, uma aneuploidia do cromossomo) é determinada de acordo com um ou mais níveis ajustados. Em algumas modalidades uma determinação da presença ou ausência de uma variação genética (por exemplo, uma aneuploidia do cromossomo) é determinada de acordo com um perfil que compreende de 1 a cerca de 10.000 níveis ajustados. Frequentemente, a determinação da presença ou ausência de uma variação genética (por exemplo, uma aneuploidia do cromossomo) é determinada de acordo com um perfil que compreende cerca de 1 a cerca de 1000, 1 a cerca de 900, 1 a cerca de 800, 1 a cerca de 700, 1 a cerca de 600, 1 a cerca de 500, 1 a cerca de 400, 1 a cerca de 300, 1 a cerca de 200, 1 a cerca de 100, 1 a cerca de 50, 1 a cerca de 25, 1 e cerca de 20, cerca de 1 a cerca de 10, ou 1 a cerca de 5 ajustes. Em algumas modalidades uma determinação da presença ou ausência de uma variação genética (por exemplo, uma aneuploidia do cromossomo) é determinada de acordo com um perfil que compreende cerca de 1 ajuste (por exemplo, um nível ajustado). Em algumas modalidades um resultado é determinado de acordo com um ou mais perfis (por exemplo, um perfil de um cromossomo ou seu segmento) que compreende um ou mais, dois ou mais, 3 ou mais, 5 ou mais, 6 ou mais, 7 ou mais, 8 ou mais, 9 ou mais vezes, ou 10 ou mais ajustes. Em algumas modalidades, a determinação da presença ou ausência de uma variação genética (por exemplo, uma aneuploidia do cromossomo) é determinada de acordo com um perfil onde alguns níveis em um perfil não são ajustados. Em algumas modalidades, a determinação da presença ou ausência de uma variação genética (por exemplo, uma aneuploidia do cromossomo) é determinada de acordo com um perfil em que os ajustes não são feitos.[398]In some embodiments an outcome is determined according to one or more levels. In some embodiments, the determination of the presence or absence of a genetic variation (eg, a chromosome aneuploidy) is determined according to one or more adjusted levels. In some embodiments a determination of the presence or absence of a genetic variation (e.g., a chromosome aneuploidy) is determined according to a profile comprising from 1 to about 10,000 adjusted levels. Often, the determination of the presence or absence of a genetic variation (for example, a chromosome aneuploidy) is determined according to a profile comprising about 1 to about 1000, 1 to about 900, 1 to about 800, 1 to about 700, 1 to about 600, 1 to about 500, 1 to about 400, 1 to about 300, 1 to about 200, 1 to about 100, 1 to about 50, 1 to about 25, 1 and about 20, about 1 to about 10, or 1 to about 5 settings. In some embodiments a determination of the presence or absence of a genetic variation (e.g., a chromosome aneuploidy) is determined according to a profile comprising about 1 fit (e.g., a fit level). In some embodiments a result is determined according to one or more profiles (e.g. a profile of a chromosome or its segment) comprising one or more, two or more, 3 or more, 5 or more, 6 or more, 7 or more, 8 or more, 9 or more times, or 10 or more adjustments. In some embodiments, determining the presence or absence of a genetic variation (eg, a chromosome aneuploidy) is determined according to a profile where some levels in a profile are not adjusted. In some embodiments, the determination of the presence or absence of a genetic variation (eg, a chromosome aneuploidy) is determined according to a profile in which adjustments are not made.

[399]Em algumas modalidades, um ajuste de um nível (por exemplo, um primeiro nível) em um perfil reduz uma falsa determinação ou falso resultado. Em algumas modalidades, um ajuste de um nível (por exemplo, um primeiro nível) em um perfil reduz a frequência e/ou a probabilidade (por exemplo, a probabilidade estatística, probabilidade) de uma falsa determinação ou falso resultado. Uma falsa determinação ou resultado pode ser uma determinação ou resultado que não é preciso. Uma falsa determinação ou resultado pode ser uma determinação ou resultado que não é um reflexo da composição genética real ou verdadeira ou a predisposição genética real ou verdadeira (por exemplo, a presença ou ausência de uma variação genética) de um sujeito (por exemplo, uma mulher grávida, um feto e/ou uma combinação dos mesmos). Em algumas modalidades uma falsa determinação ou resultado é uma determinação de falso negativo. Em algumas modalidades uma determinação negativa ou resultado negativo é a ausência de uma variação genética (por exemplo, aneuploidia, variação do número de cópias). Em algumas modalidades uma falsa determinação ou falso resultado é uma determinação de falso positivo ou falso positivo. Em algumas modalidades uma determinação positiva ou resultado positivo é a presença de uma variação genética (por exemplo, aneuploidia, variação do número de cópias). Em algumas modalidades, uma determinação ou resultado é usado em diagnóstico. Em algumas modalidades, uma determinação ou resultado é para um feto.[399]In some embodiments, an adjustment of one level (eg, a first level) in a profile reduces a false determination or false result. In some embodiments, an adjustment of a level (e.g., a first level) in a profile reduces the frequency and/or the probability (e.g., the statistical probability, probability) of a false determination or false result. A false determination or result could be a determination or result that is not accurate. A false determination or result can be a determination or result that is not a reflection of the real or true genetic makeup or the real or true genetic predisposition (e.g., the presence or absence of a genetic variation) of a subject (e.g., a pregnant woman, a fetus and/or a combination thereof). In some embodiments a false determination or result is a false negative determination. In some embodiments a negative determination or negative result is the absence of a genetic variation (eg, aneuploidy, copy number variation). In some embodiments a false determination or false result is a false positive or false positive determination. In some embodiments a positive determination or positive result is the presence of a genetic variation (eg, aneuploidy, copy number variation). In some embodiments, a determination or result is used in diagnosis. In some embodiments, a determination or result is for a fetus.

[400]Presença ou ausência de uma variação genética (por exemplo aneuploidia fetal), por vezes, é determinada comparando as contagens de um conjunto de porções para uma referência. Contagens medidas para uma amostra de teste e que estão em uma região de teste (por exemplo, um conjunto de porções de interesse) são referidas como "contagens de teste" aqui. Contagens de teste são, por vezes, contagens processadas, contagens somadas ou médias, uma representação, contagens normalizadas, ou um ou mais níveis ou níveis como aqui descritos. Em certas modalidades contagens de teste são calculadas e somadas (por exemplo, uma média aritmética, média, mediana, modo ou soma é calculada) para um conjunto de porções, e as contagens médias ou somadas são comparadas com um limite ou faixa. Contagens de teste, por vezes, são expressas como uma representação, que pode ser expressa como uma proporção ou percentagem de contagens para um primeiro conjunto de porções para contagens por um segundo conjunto de porções. Em certas modalidades um primeiro conjunto de porções é para um ou mais cromossomos de teste (por exemplo, cromossomo 13, cromossomo 18, cromossomo 21, ou combinação dos mesmos) e, por vezes, um segundo conjunto de porções é para um genoma ou uma parte de um genoma (por exemplo, autossomos, ou autossomos e cromossomos sexuais). Em algumas modalidades, um primeiro conjunto de porções é para um ou mais cromossomos sexuais (por exemplo, cromossomo X, cromossomo Y, ou combinação dos mesmos) e, por vezes, um segundo conjunto de porções é para um ou mais autossomos. Em algumas modalidades, um primeiro conjunto de porções é para uma ou mais primeiras regiões de cromossomos de teste (por exemplo, cromossomo X, cromossomo Y, ou combinação dos mesmos) e, por vezes, um segundo conjunto de porções é para um ou mais segundas regiões de um cromossomo de teste (por exemplo, cromossomo X, cromossomo Y, ou uma sua combinação), ou a totalidade do cromossomo do teste. Em certas modalidades uma representação é comparada a um limite ou faixa. Em certas modalidades contagens de teste são expressas como um ou mais níveis ou de níveis para contagens normalizadas ao longo de um conjunto de porções, e um ou mais níveis ou níveis são comparados com um limite ou faixa. Contagens de teste (por exemplo, contagens médias ou somadas, representação, contagens normalizadas, um ou mais níveis ou níveis) acima ou abaixo de um limite particular, em uma faixa particular ou fora de uma faixa particular, por vezes, são determinantes da presença de uma variação genética ou falta de euploidia (por exemplo, não- euploidia). Contagens de teste (por exemplo, contagens médias ou somadas, representação, contagens normalizadas, um ou mais níveis ou níveis) abaixo ou acima de um limite particular, em uma faixa particular ou fora de uma faixa particular, por vezes, são determinantes da ausência de uma variação genética ou euploidia.[400] Presence or absence of a genetic variation (eg fetal aneuploidy) is sometimes determined by comparing counts from a set of portions to a reference. Counts measured for a test sample and which fall within a test region (eg, a set of portions of interest) are referred to as "test counts" here. Test counts are sometimes processed counts, summed counts or averages, a representation, normalized counts, or one or more levels or levels as described herein. In certain embodiments, test scores are calculated and summed (eg, an arithmetic mean, mean, median, mode, or sum is calculated) for a set of portions, and the averaged or summed counts are compared to a threshold or range. Test counts are sometimes expressed as a representation, which can be expressed as a ratio or percentage of counts for a first set of servings to counts for a second set of servings. In certain embodiments a first set of portions is for one or more test chromosomes (e.g. chromosome 13, chromosome 18, chromosome 21, or combination thereof) and sometimes a second set of portions is for a genome or a part of a genome (for example, autosomes, or autosomes and sex chromosomes). In some embodiments, a first set of portions is for one or more sex chromosomes (eg, X chromosome, Y chromosome, or combination thereof), and sometimes a second set of portions is for one or more autosomes. In some embodiments, a first set of portions is for one or more first regions of test chromosomes (e.g., X chromosome, Y chromosome, or combination thereof), and sometimes a second set of portions is for one or more second regions of a test chromosome (eg, X chromosome, Y chromosome, or a combination thereof), or the entire test chromosome. In certain embodiments a representation is compared to a threshold or range. In certain embodiments test scores are expressed as one or more levels or from levels to normalized counts over a set of portions, and the one or more levels or levels are compared to a threshold or range. Test counts (e.g. averaged or summed counts, representation, normalized counts, one or more levels or levels) above or below a particular threshold, in a particular range or outside a particular range are sometimes determinants of presence a genetic variation or lack of euploidy (eg, non-euploidy). Test counts (e.g. averaged or summed counts, representation, normalized counts, one or more levels or levels) below or above a particular threshold, within a particular range, or outside a particular range are sometimes determinants of absence of a genetic variation or euploidy.

[401]Presença ou ausência de uma variação genética (por exemplo aneuploidia fetal), por vezes, é determinada por comparação das contagens, exemplos não-limitativos dos quais incluem contagens de teste, contagens de referência, contagens brutas, contagens filtradas, ou contagens médias ou somadas, as representações (por exemplo, representações do cromossomo), contagens normalizadas, um ou mais níveis ou níveis (por exemplo, para um conjunto de porções, por exemplo, perfis, níveis de seção genômica), pontuações de Z, o semelhante ou suas combinações. Em algumas modalidades contagens de teste são comparadas com uma referência (por exemplo, contagens de referência). Uma referência (por exemplo, uma contagem de referência) pode ser uma determinação adequada das contagens, exemplos não- limitativos dos quais incluem contagens brutas, contagens filtradas, contagens médias ou somadas, representações (por exemplo, representações do cromossomo), contagens normalizadas, um ou mais níveis ou níveis (por exemplo, para um conjunto de porções, por exemplo, perfis, níveis de seção genômica), pontuações de Z, o semelhante ou suas combinações. Contagens de referência frequentemente são contagens para uma região de teste euplóide ou de um segmento de um genoma ou cromossomo que é euplóide. Em algumas modalidades contagens de referência e contagens de teste são obtidas da mesma amostra e/ou o mesmo sujeito. Em algumas modalidades contagens de referência são de diferentes amostras e/ou de sujeitos diferentes. Em algumas modalidades contagens de referência são determinadas de e/ou comparadas com um segmento correspondente do genoma a partir do qual as contagens de teste são derivadas e/ou determinadas. Um segmento correspondente refere-se a um segmento, porção ou conjunto de porções que mapeiam para o mesmo local de um genoma de referência. Em algumas modalidades contagens de referência são determinadas de e/ou comparadas a um segmento diferente do genoma a partir do qual as contagens de teste são derivadas e/ou determinadas.[401] Presence or absence of a genetic variation (eg fetal aneuploidy) is sometimes determined by comparing counts, non-limiting examples of which include test counts, reference counts, raw counts, filtered counts, or counts averages or sums, representations (e.g., chromosome representations), normalized counts, one or more levels or levels (e.g., for a set of portions, e.g., profiles, genomic section levels), Z scores, the similar or their combinations. In some embodiments test counts are compared to a reference (eg, reference counts). A reference (e.g., a reference count) can be a suitable determination of counts, non-limiting examples of which include raw counts, filtered counts, averaged or summed counts, representations (e.g., chromosome representations), normalized counts, one or more levels or tiers (e.g., for a set of portions, e.g., profiles, genomic section levels), Z-scores, the like, or combinations thereof. Reference counts are often counts for an euploid test region or for a segment of a genome or chromosome that is euploid. In some embodiments, reference counts and test counts are obtained from the same sample and/or the same subject. In some embodiments reference counts are from different samples and/or from different subjects. In some embodiments, reference counts are determined from and/or compared to a corresponding segment of the genome from which test counts are derived and/or determined. A matched segment refers to a segment, portion, or set of portions that map to the same location in a reference genome. In some embodiments, reference counts are determined from and/or compared to a different segment of the genome from which test counts are derived and/or determined.

[402]Em certas modalidades, as contagens de teste são, por vezes, para um primeiro conjunto de porções e uma referência inclui contagens para um segundo conjunto de porções diferentes do que o primeiro conjunto de porções. Contagens de referência são, por vezes, para uma amostra de ácido nucleico da mesma mulher grávida a partir do qual a amostra de teste é obtida. Em certas modalidades contagens de referência são para uma amostra de ácido nucleico de uma ou mais mulheres grávidas diferentes do que a mulher a partir do qual a amostra de teste foi obtida. Em algumas modalidades, um primeiro conjunto de porções é no cromossomo 13, cromossomo 18, cromossomo 21, um segmento do mesmo ou combinação dos anteriores, e o segundo conjunto de porções é em outro cromossomo ou cromossomos ou seu segmento. Em um exemplo não-limitativo, onde um primeiro conjunto de porções é no cromossomo 21 ou segmento do mesmo, um segundo conjunto de porções, frequentemente é, em outro cromossomo (por exemplo, cromossomo 1, cromossomo 13, cromossomo 14, cromossomo 18, cromossomo 19, segmento dos mesmos ou combinação dos anteriores). Uma referência frequentemente está localizada em um cromossomo ou segmento do mesmo que é tipicamente euplóide. Por exemplo, cromossomo 1 e cromossomo 19 são frequentemente euplóides em fetos devido a uma elevada taxa de mortalidade fetal precoce associada com aneuploidias dos cromossomo 1 e cromossomo 19. A medida do desvio entre as contagens de teste e as contagens de referência podem ser geradas.[402] In certain embodiments, test counts are sometimes for a first set of portions and a reference includes counts for a second set of portions different than the first set of portions. Reference counts are sometimes for a nucleic acid sample from the same pregnant woman from which the test sample is obtained. In certain embodiments, reference counts are for a nucleic acid sample from one or more different pregnant women than the woman from which the test sample was obtained. In some embodiments, a first set of portions is on chromosome 13, chromosome 18, chromosome 21, a segment thereof or combination thereof, and the second set of portions is on another chromosome or chromosomes or segment thereof. In a non-limiting example, where a first set of portions is on chromosome 21 or a segment thereof, a second set of portions often is on another chromosome (e.g., chromosome 1, chromosome 13, chromosome 14, chromosome 18, chromosome 19, segment of the same or combination of the previous ones). A reference is often located on a chromosome or segment thereof which is typically euploid. For example, chromosome 1 and chromosome 19 are often euploid in fetuses due to a high rate of early fetal mortality associated with chromosome 1 and chromosome 19 aneuploidies. A measure of the deviation between test counts and reference counts can be generated.

[403]Em certas modalidades uma referência compreende contagens para o mesmo conjunto de porções como para as contagens de teste, onde as contagens para a referência são de uma ou mais amostras de referência (por exemplo, frequentemente várias amostras de referência de vários sujeitos de referência). Uma amostra de referência, frequentemente, é de uma ou mais mulheres grávidas diferentes do que a mulher a partir do qual uma amostra de teste é obtida. Uma medida de desvio (por exemplo, uma medida de incerteza, um valor de incerteza) entre as contagens de teste e as contagens de referência pode ser gerada. Em algumas modalidades uma medida do desvio é determinada das contagens de teste. Em algumas modalidades uma medida do desvio é determinada das contagens de referência. Em algumas modalidades uma medida do desvio é determinada de um perfil inteiro ou um subconjunto de porções dentro de um perfil.[403]In certain embodiments a reference comprises counts for the same set of portions as for test counts, where the counts for the reference are from one or more reference samples (e.g., often multiple reference samples from multiple subjects from reference). A reference sample is often from one or more different pregnant women than the woman from whom a test sample is obtained. A measure of deviation (eg an uncertainty measure, an uncertainty value) between the test counts and the reference counts can be generated. In some embodiments a measure of deviation is determined from test scores. In some embodiments a measure of deviation is determined from the reference counts. In some embodiments a measure of deviation is determined from an entire profile or a subset of portions within a profile.

[404]Uma medida adequada do desvio pode ser selecionada, exemplos não-limitativos dos quais incluem o desvio padrão, o desvio absoluto médio, o desvio absoluto mediano, desvio máximo absoluto, pontuação padrão (por exemplo, o valor de z, pontuação de z, pontuação normal, variável padronizada) e semelhante. Em algumas modalidades, as amostras de referência são euplóides para uma região de teste e o desvio entre as contagens de teste e as contagens de referência são avaliados. Em algumas modalidades uma determinação da presença ou ausência de uma variação genética está de acordo com o número de desvios (por exemplo, as medidas de desvios, MAD) entre as contagens de teste e as contagens de referência para um segmento ou porção de um genoma ou cromossomo. Em algumas modalidades a presença de uma variação genética é determinada quando o número de desvios entre as contagens de teste e as contagens de referência é maior do que cerca de 1, maior do que cerca de 1,5, maior do que cerca de 2, maior do que cerca de 2,5, maior do que cerca de 2,6, maior do que cerca de 2,7, maior do que cerca de 2,8, maior do que cerca de 2,9, maior do que cerca de 3, maior do que cerca de 3,1, maior do que cerca de 3,2, maior do que cerca de 3,3, maior do que cerca de 3,4, maior do que cerca de 3,5, maior do que cerca de 4, maior do que cerca de 5, ou maior do que a cerca de 6. Por exemplo, por vezes, uma contagem de teste difere da contagem de referência por mais de 3 medidas de desvio (por exemplo, 3 Sigma, 3 MAD) e a presença de uma variação genética é determinada. Em algumas modalidades uma contagem de teste obtida de uma mulher grávida é maior do que uma contagem de referência por mais de 3 medidas de desvio (por exemplo, 3 Sigma, 3 MAD) e a presença de uma aneuploidia do cromossomo fetal (por exemplo, uma trissomia fetal) é determinada. Um desvio de mais do que três entre contagens de teste e contagens de referência, frequentemente é indicativo de uma região de teste não- euplóide (por exemplo, a presença de uma variação genética). Contagens de teste significativamente acima das contagens de referência cujas contagens de referência são indicativas de euploidia, às vezes, são determinantes de uma trissomia. Em algumas modalidades uma contagem de teste obtida de uma mulher grávida é menor do que uma contagem de referência por mais de 3 medidas de desvio (por exemplo, 3 Sigma, 3 MAD) e a presença de uma aneuploidia do cromossomo fetal (por exemplo, uma monossomia fetal) é determinada. Contagens de teste significativamente abaixo das contagens de referência, cujas contagens de referência são indicativas de euploidia, às vezes, são determinantes de um monossomia.[404]A suitable measure of deviation can be selected, non-limiting examples of which include standard deviation, mean absolute deviation, median absolute deviation, maximum absolute deviation, standard score (e.g. z value, z, normal score, standardized variable) and similar. In some embodiments, the reference samples are euploid for a test region and the deviation between the test counts and the reference counts is evaluated. In some embodiments, a determination of the presence or absence of a genetic variation is based on the number of deviations (e.g., measures of deviations, MAD) between test counts and reference counts for a segment or portion of a genome. or chromosome. In some embodiments the presence of a genetic variation is determined when the number of deviations between test counts and reference counts is greater than about 1, greater than about 1.5, greater than about 2, greater than about 2.5, greater than about 2.6, greater than about 2.7, greater than about 2.8, greater than about 2.9, greater than about 3, greater than about 3.1, greater than about 3.2, greater than about 3.3, greater than about 3.4, greater than about 3.5, greater than greater than about 4, greater than about 5, or greater than about 6. For example, sometimes a test count differs from the reference count by more than 3 measures of deviation (eg, 3 Sigma, 3 MAD) and the presence of a genetic variation is determined. In some embodiments a test count obtained from a pregnant woman is greater than a reference count by more than 3 measures of deviation (e.g. 3 Sigma, 3 MAD) and the presence of a fetal chromosome aneuploidy (e.g. a fetal trisomy) is determined. A deviation of more than three between test counts and reference counts is often indicative of a non-euploid test region (eg, the presence of a genetic variation). Test counts significantly above reference counts whose reference counts are indicative of euploidy are sometimes determinants of a trisomy. In some embodiments a test count obtained from a pregnant woman is lower than a reference count by more than 3 deviation measures (e.g. 3 Sigma, 3 MAD) and the presence of a fetal chromosome aneuploidy (e.g. a fetal monosomy) is determined. Test counts significantly below reference counts, which reference counts are indicative of euploidy, are sometimes determinants of a monosomy.

[405]Em algumas modalidades a ausência de uma variação genética é determinada quando o número de desvios entre as contagens de teste e as contagens de referência é menor do que cerca de 3,5, menor do que cerca de 3,4, menor do que cerca de 3,3, menor do que cerca de 3,2, menor do que cerca de 3,1, menor do que cerca de 3,0, menor do que cerca de 2,9, menor do que cerca de 2,8, menor do que cerca de 2,7, menor do que cerca de 2,6, menor do que cerca de 2,5, menor do que cerca de 2,0, menor do que cerca de 1,5, ou menor do que cerca de 1,0. Por exemplo, às vezes, contagem de teste diferem de uma contagem de referência pelo menos de 3 medidas de desvio (por exemplo, 3 Sigma, 3 MAD) e a ausência de uma variação genética é determinada. Em algumas modalidades de uma contagem de teste obtida de uma mulher grávida que difere de uma contagem de referência em pelo menos de 3 medidas de desvio (por exemplo, 3 Sigma, 3 MAD) e a ausência de uma aneuploidia do cromossomo fetal (por exemplo, um euplóide fetal) é determinada. Em algumas modalidades (por exemplo, desvio de menos do que três entre contagens de teste e contagens de referência (por exemplo, 3-sigma para o desvio padrão), frequentemente, é indicativo de uma região de teste euplóide (por exemplo, ausência de uma variação genética). A medida do desvio entre as contagens de teste para uma amostra de teste e contagens de referência para um ou mais sujeitos de referência podem ser plotadas e visualizadas (por exemplo, gráfico de pontuação de z).[405]In some embodiments the absence of a genetic variation is determined when the number of deviations between the test counts and the reference counts is less than about 3.5, less than about 3.4, less than than about 3.3, less than about 3.2, less than about 3.1, less than about 3.0, less than about 2.9, less than about 2, 8, less than about 2.7, less than about 2.6, less than about 2.5, less than about 2.0, less than about 1.5, or less than that about 1.0. For example, test counts sometimes differ from a reference count by at least 3 deviation measures (eg 3 Sigma, 3 MAD) and the absence of a genetic variation is determined. In some embodiments of a test score obtained from a pregnant woman that differs from a reference count by at least 3 measures of deviation (e.g. 3 Sigma, 3 MAD) and the absence of a fetal chromosome aneuploidy (e.g. , a fetal euploid) is determined. In some embodiments (e.g., deviation of less than three between test counts and reference counts (e.g., 3-sigma for standard deviation), it is often indicative of a euploid test region (e.g., absence of a genetic variation.) The measure of the deviation between test counts for a test sample and reference counts for one or more reference subjects can be plotted and visualized (eg z-score plot).

[406]Qualquer outra referência adequada pode ser tomada com contagens de teste para determinar a presença ou ausência de uma variação genética (ou determinação de euploidia ou não-euploidia) para uma região de teste de uma amostra de teste. Por exemplo, uma determinação da fração fetal pode ser tomada em contagens de teste para determinar a presença ou ausência de uma variação genética. Um processo adequado para a quantificação da fração fetal pode ser utilizado, exemplos não-limitativos dos quais incluem um processo de espectrometria de massa, processo de sequenciamento ou combinação dos mesmos.[406]Any other suitable reference can be taken with test counts to determine the presence or absence of a genetic variation (or determination of euploidy or non-euploidy) for a test region of a test sample. For example, a fetal fraction determination can be taken on test counts to determine the presence or absence of a genetic variation. A suitable process for the quantification of the fetal fraction can be used, non-limiting examples of which include a mass spectrometry process, sequencing process or combination thereof.

[407]Em algumas modalidades, a presença ou ausência de uma aneuploidia do cromossomo fetal (por exemplo, uma trissomia) é determinada, em parte, a partir de uma determinação da ploidia fetal. Em algumas modalidades uma ploidia fetal é determinada por um método adequado aqui descrito. Em algumas modalidades uma determinação de ploidia fetal de cerca de 1,20 ou maior, 1,25 ou maior, 1,30 ou maior, cerca de 1,35 ou maior, de cerca de 1,4 ou maior, ou cerca de 1,45 ou maior indica a presença de uma aneuploidia do cromossomo fetal (por exemplo, a presença de uma trissomia fetal). Em algumas modalidades uma determinação da ploidia fetal de cerca de 1,20 a cerca de 2,0, cerca de 1,20 a cerca de 1,9, cerca de 1,20 a cerca de 1,85, cerca de 1,20 a cerca de 1,8, cerca de 1,25 a cerca de 2,0, cerca de 1,25 a cerca de 1,9, cerca de 1,25 a cerca de 1,85, cerca de 1,25 a cerca de 1,8, cerca de 1,3 a cerca de 2,0, cerca de 1,3 a cerca de 1,9, cerca de 1,3 a cerca de 1,85, cerca de 1,3 a cerca de 1,8, cerca de 1,35 a cerca de 2,0, cerca de 1,35 a cerca de 1,9, cerca de 1,35 a cerca de 1,8, cerca de 1,4 a cerca de 2,0, cerca de 1,4 a cerca de 1,85 ou cerca de 1,4 a cerca de 1,8 indica a presença de uma aneuploidia do cromossomo fetal (por exemplo, a presença de uma trissomia fetal). Em algumas modalidades da aneuploidia fetal é uma trissomia. Em algumas modalidades da aneuploidia fetal é uma trissomia do cromossomo 13, 18 e/ou 21.[407] In some embodiments, the presence or absence of a fetal chromosome aneuploidy (eg, a trisomy) is determined, in part, from a determination of fetal ploidy. In some embodiments a fetal ploidy is determined by a suitable method described herein. In some embodiments a fetal ploidy determination of about 1.20 or greater, 1.25 or greater, 1.30 or greater, about 1.35 or greater, of about 1.4 or greater, or about 1 .45 or greater indicates the presence of a fetal chromosome aneuploidy (eg, the presence of a fetal trisomy). In some embodiments a fetal ploidy determination of about 1.20 to about 2.0, about 1.20 to about 1.9, about 1.20 to about 1.85, about 1.20 about 1.8, about 1.25 to about 2.0, about 1.25 to about 1.9, about 1.25 to about 1.85, about 1.25 to about from 1.8, about 1.3 to about 2.0, about 1.3 to about 1.9, about 1.3 to about 1.85, about 1.3 to about 1 .8, about 1.35 to about 2.0, about 1.35 to about 1.9, about 1.35 to about 1.8, about 1.4 to about 2.0 , about 1.4 to about 1.85 or about 1.4 to about 1.8 indicates the presence of a fetal chromosome aneuploidy (eg, the presence of a fetal trisomy). In some embodiments fetal aneuploidy is a trisomy. In some forms of fetal aneuploidy it is a trisomy of chromosome 13, 18 and/or 21.

[408]Em algumas modalidades uma ploidia fetal de menos do que cerca de 1,35, menos do que cerca de 1,30, menos do que cerca 1,25, menos do que cerca de 1,20 ou menos de cerca de 1,15 indica a ausência de uma aneuploidia fetal (por exemplo, a ausência de uma trissomia fetal, por exemplo, euplóide). Em algumas modalidades uma determinação de ploidia fetal de cerca de 0,7 a cerca de 1,35, cerca de 0,7 a cerca de 1,30, cerca de 0,7 a cerca de 1,25, cerca de 0,7 a cerca de 1,20, cerca de 0,7 a cerca de 1,15, cerca de 0,75 a cerca de 1,35, cerca de 0,75 a cerca de 1,30, cerca de 0,75 a cerca de 1,25, cerca de 0,75 a cerca de 1,20, cerca de 0,75 a cerca de 1,15, cerca de 0,8 a cerca de 1,35, cerca de 0,8 a cerca de 1,30, cerca de 0,8 a cerca de 1,25, cerca de 0,8 a cerca de 1,20, ou cerca de 0,8 a cerca de 1,15 indica a ausência de uma aneuploidia do cromossomo fetal (por exemplo, a ausência de uma trissomia fetal, por exemplo, euplóide).[408] In some embodiments a fetal ploidy of less than about 1.35, less than about 1.30, less than about 1.25, less than about 1.20, or less than about 1 .15 indicates the absence of a fetal aneuploidy (for example, the absence of a fetal trisomy, for example, euploid). In some embodiments a fetal ploidy determination of about 0.7 to about 1.35, about 0.7 to about 1.30, about 0.7 to about 1.25, about 0.7 about 1.20, about 0.7 to about 1.15, about 0.75 to about 1.35, about 0.75 to about 1.30, about 0.75 to about from 1.25, about 0.75 to about 1.20, about 0.75 to about 1.15, about 0.8 to about 1.35, about 0.8 to about 1 .30, about 0.8 to about 1.25, about 0.8 to about 1.20, or about 0.8 to about 1.15 indicates the absence of a fetal chromosome aneuploidy (for (e.g., the absence of a fetal trisomy, e.g., euploid).

[409]Em algumas modalidades uma ploidia fetal de menos do que cerca de 0,8, menos do que cerca de 0,75, menos do que cerca 0,70 ou menos do que cerca de 0,6 indica a presença de uma aneuploidia fetal (por exemplo, a presença de uma deleção do cromossomo). Em algumas modalidades uma determinação de ploidia fetal de cerca de 0 a cerca de 0,8, cerca de 0 a cerca de 0,75, cerca de 0 a cerca de 0,70, cerca de 0 a cerca de 0,65, cerca de 0 a cerca de 0,60, cerca de 0,1 a cerca de 0,8, cerca de 0,1 a cerca de 0,75, cerca de 0,1 a cerca de 0,70, cerca de 0,1 a cerca de 0,65, cerca de 0,1 a cerca de 0,60, cerca de 0,2 a cerca de 0,8, cerca de 0,2 a cerca de 0,75, cerca de 0,2 a cerca de 0,70, cerca de 0,2 a cerca de 0,65, cerca de 0,2 a cerca de 0,60, cerca de 0,25 a cerca de 0,8, cerca de 0,25 a cerca de 0,75, cerca de 0,25 a cerca de 0,70, cerca de 0,25 a cerca de 0,65, cerca de 0,25 a cerca de 0,60, cerca de 0,3 a cerca de 0,8, cerca de 0,3 a cerca de 0,75, cerca de 0,3 a cerca de 0,70, cerca de 0,3 a cerca de 0,65, cerca de 0,3 a cerca de 0,60 indica a presença de uma aneuploidia do cromossomo fetal (por exemplo, a presença de uma deleção do cromossomo). Em algumas modalidades aneuploidia fetal determinada é uma deleção do cromossomo inteiro.[409] In some embodiments a fetal ploidy of less than about 0.8, less than about 0.75, less than about 0.70, or less than about 0.6 indicates the presence of an aneuploidy fetus (for example, the presence of a chromosome deletion). In some embodiments, a fetal ploidy determination of about 0 to about 0.8, about 0 to about 0.75, about 0 to about 0.70, about 0 to about 0.65, about from 0 to about 0.60, about 0.1 to about 0.8, about 0.1 to about 0.75, about 0.1 to about 0.70, about 0.1 about 0.65, about 0.1 to about 0.60, about 0.2 to about 0.8, about 0.2 to about 0.75, about 0.2 to about from 0.70, about 0.2 to about 0.65, about 0.2 to about 0.60, about 0.25 to about 0.8, about 0.25 to about 0 .75, about 0.25 to about 0.70, about 0.25 to about 0.65, about 0.25 to about 0.60, about 0.3 to about 0.8 , about 0.3 to about 0.75, about 0.3 to about 0.70, about 0.3 to about 0.65, about 0.3 to about 0.60 indicates the presence of a fetal chromosome aneuploidy (eg, the presence of a chromosome deletion). In some arrangements determined fetal aneuploidy is a deletion of the entire chromosome.

[410]Em algumas modalidades uma determinação da presença ou ausência de uma aneuploidia fetal (por exemplo, de acordo com uma ou mais das faixas de uma determinação de ploidia cima) é determinada de acordo com a zona de ligação. Em certas modalidades uma ligação é feito (por exemplo, uma ligação determinando a presença ou ausência de uma variação genética, por exemplo, um resultado) quando um valor (por exemplo, um valor de ploidia, um valor da fração fetal, um grau de incerteza) ou coleção de valores está dentro de uma faixa pré-definida (por exemplo, uma zona, uma zona de ligação). Em algumas modalidades uma zona de ligação é definida de acordo com uma coleção de valores que são obtidos a partir da mesma amostra do paciente. Em certas modalidades uma zona de ligação é definida de acordo com uma coleção de valores que são derivados do mesmo cromossomo ou seu segmento. Em algumas modalidades uma zona de ligação com base na determinação de ploidia é definida de acordo com um nível de confiança (por exemplo, alto nível de confiança, por exemplo, baixo nível de incerteza) e/ou uma fração fetal. Em algumas modalidades uma zona de ligação é definida de acordo com uma determinação de ploidia e uma fração fetal de cerca de 2,0% ou mais, cerca de 2,5% ou mais, cerca de 3% ou mais, cerca de 3,25% ou mais, cerca de 3,5% ou mais, cerca de 3,75% ou mais, ou cerca de 4,0% ou mais. Por exemplo, em algumas modalidades uma ligação é feito em que um feto compreende uma trissomia 21, com base na determinação de ploidia de mais que 1,25 com uma determinação da fração fetal de 2% ou mais ou 4% ou mais para uma amostra obtida de uma mulher grávida tendo um feto. Em certas modalidades, por exemplo, uma ligação é feito em que um feto é euplóide com base na determinação de ploidia de menos de 1,25 com uma determinação da fração fetal de 2% ou mais ou 4% ou mais de uma amostra obtida de uma mulher grávida tendo um feto. Em algumas modalidades uma zona de ligação é definida por um nível de confiança de cerca de 99% ou mais, cerca de 99,1% ou mais, cerca de 99,2% ou mais, cerca de 99,3% ou mais, cerca de 99,4% ou mais, cerca de 99,5% ou superior, sobre 99,6% ou mais, cerca de 99,7% ou mais, cerca de 99,8% ou mais, ou cerca de 99,9% ou mais. Em algumas modalidades uma ligação é feito sem o uso de uma zona de ligação. Em algumas modalidades uma ligação é feita usando uma zona de ligação e dados adicionais ou informações. Em algumas modalidades uma ligação é feita com base em um valor de ploidia sem o uso de uma zona de ligação. Em algumas modalidades uma ligação é feita sem calcular um valor de ploidia. Em algumas modalidades uma ligação é feita com base na inspeção visual de um perfil (por exemplo, inspeção visual de níveis de seção genômica). Uma ligação pode ser feita por qualquer método adequado, baseado na sua totalidade, ou em parte, as determinações, valores e/ou dados obtidos pelos métodos aqui descritos, exemplos não- limitativos dos quais incluem uma determinação de ploidia fetal, uma determinação da fração fetal, ploidia materna, determinações de incerteza e/ou de confiança, níveis de porção, níveis, perfis, pontuações de Z, representações cromossômicas esperados, representações cromossômicas medidas, contagens (por exemplo, contagens normalizadas, contagens cruas), variações do número de cópia maternas ou fetais (por exemplo, variações do número de cópia categorizadas), níveis significativamente diferentes, níveis ajustadas (por exemplo, preenchimento), o semelhante ou suas combinações.[410]In some embodiments a determination of the presence or absence of a fetal aneuploidy (for example, according to one or more of the ranges of a ploidy determination above) is determined according to the zone of attachment. In certain embodiments a link is made (for example, a link determining the presence or absence of a genetic variation, for example, a result) when a value (for example, a ploidy value, a fetal fraction value, a degree of uncertainty) or collection of values is within a predefined range (e.g. a zone, a binding zone). In some embodiments a binding zone is defined according to a collection of values that are obtained from the same patient sample. In certain embodiments a linkage zone is defined according to a collection of values that are derived from the same chromosome or its segment. In some embodiments a linkage zone based on ploidy determination is defined according to a confidence level (eg high confidence level, eg low uncertainty level) and/or a fetal fraction. In some embodiments a binding zone is defined according to a ploidy determination and a fetal fraction of about 2.0% or greater, about 2.5% or greater, about 3% or greater, about 3, 25% or more, about 3.5% or more, about 3.75% or more, or about 4.0% or more. For example, in some embodiments a link is made where a fetus comprises a trisomy 21, based on a ploidy determination of greater than 1.25 with a fetal fraction determination of 2% or greater or 4% or greater for a sample. obtained from a pregnant woman carrying a fetus. In certain embodiments, for example, a link is made that a fetus is euploid based on a ploidy determination of less than 1.25 with a fetal fraction determination of 2% or more or 4% or more of a sample obtained from a pregnant woman bearing a fetus. In some embodiments a binding zone is defined by a confidence level of about 99% or greater, about 99.1% or greater, about 99.2% or greater, about 99.3% or greater, about of 99.4% or more, about 99.5% or greater, about 99.6% or greater, about 99.7% or greater, about 99.8% or greater, or about 99.9% or more. In some embodiments a connection is made without the use of a connection zone. In some embodiments a link is made using a link zone and additional data or information. In some embodiments a link is made based on a ploidy value without the use of a link zone. In some embodiments a link is made without calculating a ploidy value. In some embodiments a link is made based on visual inspection of a profile (eg, visual inspection of genomic section levels). A link can be made by any suitable method, based in whole or in part on the determinations, values and/or data obtained by the methods described herein, non-limiting examples of which include a determination of fetal ploidy, a determination of the fraction fetal, maternal ploidy, uncertainty and/or confidence determinations, portion levels, levels, profiles, Z scores, expected chromosome representations, measured chromosome representations, counts (e.g., normalized counts, raw counts), maternal or fetal copy (eg, categorized copy number variations), significantly different levels, adjusted levels (eg, padding), the similar, or combinations thereof.

[411]Em algumas modalidades uma zona de ligação é onde uma ligação não é feita. Em algumas modalidades uma zona de ligação é definida por um valor ou um conjunto de valores que indicam baixa precisão, risco elevado, alto erro, baixo nível de confiança, elevado nível de incerteza, o semelhante ou sua combinação. Em algumas modalidades uma zona de ligação é definida, em parte, por uma fração fetal de cerca de 5% ou menos, cerca de 4% ou menos, cerca de 3% ou menos, cerca de 2,5% ou menos, cerca de 2,0% ou menos, sobre 1,5% ou menos, ou cerca de 1,0% ou menos.[411]In some embodiments a binding zone is where a binding is not made. In some embodiments a binding zone is defined by a value or a set of values that indicate low accuracy, high risk, high error, low confidence, high uncertainty, the like, or a combination thereof. In some embodiments a binding zone is defined, in part, by a fetal fraction of about 5% or less, about 4% or less, about 3% or less, about 2.5% or less, about 2.0% or less, about 1.5% or less, or about 1.0% or less.

[412]Em algumas modalidades, um método para determinar a presença ou ausência de uma variação genética (por exemplo, aneuploidia fetal) é realizado com uma precisão de, pelo menos, cerca de 90% a cerca de 100%. Por exemplo, a presença ou ausência de uma variação genética pode ser determinada com uma precisão de, pelo menos cerca de 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99,1%, 99,2%, 99,3%, 99,4%, 99,5%, 99,6%, 99,7%, 99,8% ou 99,9%. Em algumas modalidades, a presença ou ausência de uma variação genética é determinada com uma precisão que é cerca da mesma ou maior do que a precisão usando outros métodos de determinação da variação genética (por exemplo, a análise de cariótipo). Em algumas modalidades, a presença ou ausência de uma variação genética é determinada com uma precisão tendo intervalo de confiança (CI) de cerca de 80% a cerca de 100%. Por exemplo, o intervalo de confiança (CI) pode ser de cerca de 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99%.[412] In some embodiments, a method of determining the presence or absence of a genetic variation (eg, fetal aneuploidy) is performed with an accuracy of at least about 90% to about 100%. For example, the presence or absence of a genetic variation can be determined with an accuracy of at least about 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.1%, 99.2%, 99.3%, 99.4%, 99.5%, 99.6%, 99.7%, 99.8% or 99.9%. In some embodiments, the presence or absence of a genetic variation is determined with an accuracy that is about the same or greater than the accuracy using other methods of determining genetic variation (e.g., karyotype analysis). In some embodiments, the presence or absence of a genetic variation is determined with an accuracy having a confidence interval (CI) of about 80% to about 100%. For example, the confidence interval (CI) might be around 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92% , 93%, 94%, 95%, 96%, 97%, 98%, or 99%.

[413]Resultado às vezes pode ser determinado em termos de densidade de marcação da sequência. "Densidade de marcador da sequência" refere-se ao valor normalizado de marcadores de fragmentos (reads) ou marcações de sequência para uma seção genômica definida, onde a densidade de marcador da sequência é usada para comparar diferentes amostras e para posterior análise. O valor da densidade de marcador de sequência é frequentemente normalizado dentro de uma amostra. Em algumas modalidades, a normalização pode ser realizada por contagem do número de marcadores que estão dentro de cada seção genômica; a obtenção de um valor médio da contagem do marcador de sequência para cada cromossomo; obtenção de um valor médio de todos os valores autossômicos; e utilização desde valor como uma constante de normalização para contabilizar as diferenças no número total de marcadores de sequência obtidos para as diferentes amostras. A densidade do marcador de sequência às vezes é de cerca de 1 por um cromossomo dissômico. Densidades do marcador de sequência podem variar de acordo com artefatos de sequenciamento, mais notadamente a tendência G/C, que podem ser corrigidas através do uso de um padrão externo ou interno de referência (por exemplo, derivado de substancialmente todos os marcadores de sequência (sequências genômicas), que pode ser, por exemplo, um único cromossomo ou um valor calculado de todos os autossomos, em algumas modalidades). Desse modo, o desequilíbrio de dosagem de um cromossomo ou regiões cromossômicas pode ser inferido a partir da representação percentual do locus entre outros marcadores mapeáveis da espécie. Desequilíbrio de dosagem de um cromossomo ou regiões cromossômicas particulares, por conseguinte, pode ser determinado quantitativamente e ser normalizado. Os métodos para a normalização e quantificação da densidade de marcador de sequência são discutidos em maior detalhe abaixo.[413]Outcome can sometimes be determined in terms of sequence labeling density. "Sequence marker density" refers to the normalized value of fragment markers (reads) or sequence tags for a defined genomic section, where the sequence marker density is used to compare different samples and for further analysis. The sequence marker density value is often normalized within a sample. In some embodiments, normalization can be performed by counting the number of markers that are within each genomic section; obtaining an average sequence marker count value for each chromosome; obtaining an average value of all autosomal values; and using this value as a normalization constant to account for differences in the total number of sequence markers obtained for the different samples. Sequence marker density is sometimes about 1 per one disomic chromosome. Sequence marker densities can vary according to sequencing artifacts, most notably G/C bias, which can be corrected for by using an external or internal reference standard (e.g., derived from substantially all sequence markers ( genomic sequences), which can be, for example, a single chromosome or a calculated value of all autosomes, in some embodiments). Thus, the dosage imbalance of a chromosome or chromosomal regions can be inferred from the percentage representation of the locus among other mappable markers of the species. Dosage imbalance of a particular chromosome or chromosomal regions can therefore be quantitatively determined and normalized. Methods for normalizing and quantifying sequence marker density are discussed in more detail below.

[414]Em algumas modalidades, uma proporção de toda os fragmentos (reads) de sequências é a partir de um cromossomo sexual (por exemplo, cromossomo X, cromossomo Y) ou um cromossomo envolvido em uma aneuploidia (por exemplo, cromossomo 13, cromossomo 18, cromossomo 21), e outros fragmentos (reads) de sequências são de outros cromossomos. Ao levar em conta o tamanho relativo do cromossomo sexual ou cromossomo envolvido na aneuploidia (por exemplo, "cromossomo alvo": cromossomo 21) em comparação com outros cromossomos, pode-se obter uma frequência normalizada, dentro de uma faixa de referência, sequências específicas de cromossomo alvo, em algumas modalidades. Se o feto tem uma aneuploidia, por exemplo, em um cromossomo alvo, então a frequência normalizada das sequências derivadas de cromossomo alvo é estatisticamente maior do que a frequência normalizada de sequências derivadas de cromossomo não-alvo, permitindo desse modo a detecção da aneuploidia. O grau de alteração da frequência normalizada será dependente da concentração fracionada de ácidos nucleicos fetal na amostra analisada, em algumas modalidades.[414] In some embodiments, a proportion of all sequence reads are from a sex chromosome (eg, X chromosome, Y chromosome) or a chromosome involved in aneuploidy (eg, chromosome 13, chromosome 18, chromosome 21), and other sequence reads are from other chromosomes. By taking into account the relative size of the sex chromosome or chromosome involved in aneuploidy (eg "target chromosome": chromosome 21) compared to other chromosomes, a normalized frequency, within a reference range, of specific sequences can be obtained target chromosome, in some embodiments. If the fetus has an aneuploidy, for example, on a target chromosome, then the normalized frequency of sequences derived from the target chromosome is statistically higher than the normalized frequency of sequences derived from the non-target chromosome, thereby allowing detection of the aneuploidy. The degree of alteration of the normalized frequency will be dependent on the fractional concentration of fetal nucleic acids in the analyzed sample, in some embodiments.

[415]Uma variação genética, por vezes, está associada com a condição médica. Um resultado determinante de uma variação genética é, por vezes, um resultado determinante da presença ou ausência de uma condição (por exemplo, uma condição médica), doença, síndrome, ou anomalia, ou inclui a detecção de uma condição, doença, síndrome ou anormalidade (por exemplo, exemplos não-limitativos listados na Tabela 1). Em certas modalidades um diagnóstico compreende a avaliação de um resultado. Um resultado determinante da presença ou ausência de uma condição (por exemplo, uma condição médica), doença, síndrome ou anormalidade por métodos aqui descritos podem, por vezes, ser verificado independentemente por outros testes (por exemplo, por cariotipagem e/ou amniocentese). Análise e processamento dados podem fornecer um ou mais resultados. O termo "resultado", tal como aqui usado, pode se referir a um resultado de processamento de dados que facilita a determinação da presença ou ausência de uma variação genética (por exemplo, uma aneuploidia, uma variação do número de cópia). Em certas modalidades, o termo "resultado", tal como aqui usado, refere-se a uma conclusão que prevê e/ou determina a presença ou ausência de uma variação genética (por exemplo, uma aneuploidia, uma variação do número de cópia). Em certas modalidades, o termo "resultado", tal como aqui usado, refere-se a uma conclusão que prevê e/ou determina um risco ou a probabilidade da presença ou ausência de uma variação genética (por exemplo, uma aneuploidia, uma variação do número de cópia) em um sujeito (por exemplo, um feto). Um diagnóstico compreende, por vezes, o uso de um resultado. Por exemplo, um profissional de saúde pode analisar um resultado e fornecer uma base de diagnóstico em, ou com base em parte no resultado. Em algumas modalidades, a determinação, detecção ou diagnóstico de uma condição, síndrome ou anormalidade (por exemplo, listados na Tabela 1) compreendem o uso de um resultado determinante da presença ou ausência de uma variação genética. Em algumas modalidades, um resultado com base nos fragmentos (reads) de sequências mapeados contados ou transformações daos mesmos é determinante da presença ou ausência de uma variação genética. Em certas modalidades, um resultado gerado usando um ou mais métodos (por exemplo, métodos de processamento de dados aqui descritos) é determinante da presença ou ausência de uma ou mais condições, síndromes ou anormalidades relacionadas na Tabela 1. Em certas modalidades um diagnóstico compreende uma determinação da presença ou ausência de uma condição, síndrome ou anormalidade. Frequentemente, o diagnóstico compreende a determinação de uma variação genética como a natureza e/ou causa de uma doença, síndrome ou anormalidade. Em certas modalidades um resultado não é um diagnóstico. Um resultado frequentemente compreende um ou mais valores numéricos gerados usando um método de processamento descrito aqui no contexto de uma ou mais considerações de probabilidade. Uma consideração de risco ou probabilidade pode incluir, mas não está limitado a: um valor de incerteza, uma medida da variabilidade, nível de confiança, sensibilidade, especificidade, desvio padrão, coeficiente de variação (CV) e/ou nível de confiança, pontuações de Z, valores de Chi, valores de Phi, valores de ploidia, fração fetal ajustada, proporções de área, nível médio, o semelhantes ou suas combinações. Uma consideração de probabilidade pode facilitar a determinação se um sujeito está em risco de ter, ou tem uma variação genética, e um resultado determinante de uma presença ou ausência de uma doença genética, frequentemente, inclui tal uma consideração.[415] A genetic variation is sometimes associated with the medical condition. A determinant result of a genetic variation is sometimes a determinant result of the presence or absence of a condition (e.g., a medical condition), disease, syndrome, or abnormality, or includes the detection of a condition, disease, syndrome, or abnormality (eg, non-limiting examples listed in Table 1). In certain embodiments a diagnosis comprises the evaluation of an outcome. A result determining the presence or absence of a condition (e.g., a medical condition), disease, syndrome, or abnormality by methods described herein can sometimes be independently verified by other tests (e.g., by karyotyping and/or amniocentesis) . Analyzing and processing data can provide one or more results. The term "result", as used herein, can refer to a data processing result that facilitates the determination of the presence or absence of a genetic variation (eg, an aneuploidy, a copy number variation). In certain embodiments, the term "result", as used herein, refers to a finding that predicts and/or determines the presence or absence of a genetic variation (e.g., an aneuploidy, a copy number variation). In certain embodiments, the term "result", as used herein, refers to a finding that predicts and/or determines a risk or likelihood of the presence or absence of a genetic variation (e.g., an aneuploidy, a gene variation, copy number) on a subject (for example, a fetus). A diagnosis sometimes includes the use of a result. For example, a healthcare professional can review a result and provide a diagnosis based on, or based in part on, the result. In some embodiments, determining, detecting, or diagnosing a condition, syndrome, or abnormality (eg, listed in Table 1) comprises using a result to determine the presence or absence of a genetic variation. In some embodiments, a result based on counted mapped sequence reads or transformations thereof is determinant of the presence or absence of a genetic variation. In certain modalities, a result generated using one or more methods (eg, data processing methods described herein) is determinative of the presence or absence of one or more conditions, syndromes, or abnormalities listed in Table 1. In certain modalities a diagnosis comprises a determination of the presence or absence of a condition, syndrome, or abnormality. Diagnosis often involves determining a genetic variation as the nature and/or cause of a disease, syndrome, or abnormality. In certain modalities a result is not a diagnosis. A result often comprises one or more numeric values generated using a processing method described here in the context of one or more probability considerations. A risk or probability consideration may include, but is not limited to: an uncertainty value, a measure of variability, confidence level, sensitivity, specificity, standard deviation, coefficient of variation (CV) and/or confidence level, scores Z values, Chi values, Phi values, ploidy values, adjusted fetal fraction, area proportions, mean level, the like, or combinations thereof. A probability consideration can facilitate the determination of whether a subject is at risk of having, or has, a genetic variation, and a finding determining a presence or absence of a genetic disease often includes such a consideration.

[416]Um resultado às vezes é um fenótipo. Um resultado, por vezes, é um fenótipo associado com um nível de confiança (por exemplo, um valor de incerteza, por exemplo, um feto é positivo para trissomia 21, com um nível de confiança de 99%; uma mulher grávida está carregando um feto masculino com um nível de confiança de 95%; um sujeito de teste é negativo para um câncer associado com uma variação genética em um nível de confiança de 95%). Diferentes métodos de geração de valores de resultado por vezes podem produzir diferentes tipos de resultados. Em geral, existem quatro tipos de pontuações ou ligações possíveis que podem ser feitas com base em valores de resultado gerados usando métodos descritos aqui: verdadeiro positivo, falso positivo, verdadeiro negativo e falso negativo. Os termos "pontuação", "pontuações", "ligação" e "ligações" como aqui usados referem-se ao cálculo da probabilidade de que uma variação genética particular está presente ou ausente em um sujeito/amostra. O valor de uma pontuação pode ser usado para determinar, por exemplo, uma variação, diferença, ou a proporção dos fragmentos (reads) de sequências mapeados que pode corresponde a uma variação genética. Por exemplo, calculando uma pontuação positiva para uma variação genética selecionada ou porção de um conjunto de dados, com respeito a um genoma de referência pode levar a uma identificação da presença ou ausência de uma variação genética, a variação genética que, por vezes está associada com uma condição médica (por exemplo, câncer, pré-eclâmpsia, trissomia, monossomia, e semelhante). Em algumas modalidades, um resultado compreende um nível, um perfil e/ou uma gráfico (por exemplo, um gráfico do perfil). Nestas modalidades em que um resultado compreende um perfil, um perfil adequado ou combinação de perfis pode ser usado para um resultado. Exemplos não-limitativos de perfis que podem ser usados para um resultado incluem perfis de pontuação de Z, perfis de valor de p, perfis de valor de chi, perfis de valor de phi, semelhante, e suas combinações.[416]An outcome is sometimes a phenotype. An outcome is sometimes a phenotype associated with a confidence level (e.g., an uncertainty value, e.g., a fetus is positive for trisomy 21 at a 99% confidence level; a pregnant woman is carrying a male fetus at a 95% confidence level; a test subject is negative for a cancer associated with a genetic variation at a 95% confidence level. Different methods of generating result values can sometimes produce different types of results. In general, there are four types of possible scores or links that can be made based on result values generated using methods described here: true positive, false positive, true negative, and false negative. The terms "score", "scores", "linkage" and "linkages" as used herein refer to calculating the probability that a particular genetic variation is present or absent in a subject/sample. The value of a score can be used to determine, for example, a variation, difference, or the proportion of fragments (reads) of mapped sequences that can correspond to a genetic variation. For example, calculating a positive score for a selected genetic variation or portion of a dataset, with respect to a reference genome can lead to an identification of the presence or absence of a genetic variation, the genetic variation that is sometimes associated with a medical condition (eg, cancer, pre-eclampsia, trisomy, monosomy, and the like). In some embodiments, a result comprises a level, a profile, and/or a graph (e.g., a profile graph). In those embodiments where a result comprises a profile, a suitable profile or combination of profiles can be used for a result. Non-limiting examples of profiles that can be used for a result include Z-score profiles, p-value profiles, chi-value profiles, phi-value profiles, peer, and combinations thereof.

[417]Um resultado gerado para determinar a presença ou ausência de uma variação genética, por vezes, inclui um resultado nulo (por exemplo, um ponto de dados entre dois conjuntos, um valor numérico com um desvio padrão, que engloba os valores tanto para a presença e a ausência de uma variação genética, um conjunto de dados com um gráfico de perfil que não é semelhante aos gráficos de perfil para sujeitos tendo ou livres da variação genética sendo investigada). Em algumas modalidades, um resultado indicativo de um resultado nulo é ainda um resultado determinante, e a determinação pode incluir a necessidade de informação adicional e/ou uma repetição da geração de e/ou análise de dados para determinar a presença ou ausência de uma variação genética.[417]A result generated to determine the presence or absence of genetic variation sometimes includes a null result (for example, a data point between two sets, a numerical value with a standard deviation, encompassing the values for both the presence and absence of a genetic variation, a dataset with a profile plot that is not similar to the profile plots for subjects having or free of the genetic variation being investigated). In some embodiments, a result indicative of a null result is still a determinant result, and the determination may include the need for additional information and/or a repeat generation of and/or data analysis to determine the presence or absence of a variation. genetics.

[418]Um resultado pode ser gerado após a realização de uma ou mais etapas de processamento aqui descritas, em algumas modalidades. Em certas modalidades, um resultado é gerado como um resultado de uma das etapas de processamento aqui descritas, e em algumas modalidades, um resultado pode ser gerado após cada manipulação estatística e/ou matemática de um conjunto de dados ser executada. Um resultado referente à determinação da presença ou ausência de uma variação genética pode ser expresso de uma forma adequada, cuja forma compreende, sem limitação, uma probabilidade (por exemplo, proporção de probabilidades, valor de p), provavelmente, valor em ou para fora de um conjunto, valor acima ou abaixo de um valor limite, valor dentro de uma faixa (por exemplo, uma faixa limite), o valor de uma medida da variância ou confiança, ou fator de risco, associada com a presença ou ausência de uma variação genética para um sujeito ou amostra. Em certas modalidades, a comparação entre amostras permite confirmação da identidade da amostra (por exemplo, permite a identificação de amostras e/ou amostras repetidas que foram misturadas (por exemplo, marcadas de forma errada, combinadas, e semelhante)).[418] A result may be generated after performing one or more of the processing steps described herein, in some embodiments. In certain embodiments, a result is generated as a result of one of the processing steps described herein, and in some embodiments, a result may be generated after each statistical and/or mathematical manipulation of a data set is performed. A result relating to the determination of the presence or absence of a genetic variation may be expressed in an appropriate form, which form comprises, without limitation, a probability (e.g., odds ratio, p-value), likely, in or out value of a set, value above or below a threshold value, value within a range (for example, a threshold range), the value of a measure of variance or confidence, or risk factor, associated with the presence or absence of a genetic variation for a subject or sample. In certain embodiments, comparison between samples allows confirmation of sample identity (e.g., allows identification of samples and/or repeat samples that have been mixed (e.g., mislabeled, pooled, and the like)).

[419]Em algumas modalidades, um resultado compreende um valor acima ou abaixo de um valor limite ou de corte pré- determinado (por exemplo, maior do que 1, menor do que 1), e um nível de confiança ou incerteza associado com o valor. Em certas modalidades um valor limite ou de corte pré- determinado é um nível esperado ou um faixa do nível esperado. Um resultado também pode descrever uma presunção usada no processamento de dados. Em certas modalidades, um resultado compreende um valor que está dentro ou fora de uma faixa pré-determinada de valores (por exemplo, uma faixa limite) e a incerteza associada ou nível de confiança para aquele valor estando dentro ou fora da faixa. Em algumas modalidades, um resultado compreende um valor que é igual a um valor pré-determinado (por exemplo, igual a 1, igual a zero), ou é igual a um valor dentro de uma faixa de valor pré-determinada, e sua incerteza associada ou nível de confiança para esse valor sendo igual ou dentro ou fora de uma faixa. Um resultado às vezes é representado graficamente como um gráfico (por exemplo, o gráfico do perfil).[419]In some embodiments, a result comprises a value above or below a predetermined threshold or cutoff value (e.g., greater than 1, less than 1), and a level of confidence or uncertainty associated with the value. In certain embodiments a predetermined threshold or cutoff value is an expected level or range of the expected level. A result can also describe an assumption used in data processing. In certain embodiments, a result comprises a value that is within or outside a predetermined range of values (e.g., a threshold range) and the associated uncertainty or confidence level for that value being within or outside the range. In some embodiments, a result comprises a value that is equal to a predetermined value (e.g., equal to 1, equal to zero), or is equal to a value within a predetermined value range, and its uncertainty. associated or confidence level for that value being equal to or within or outside a range. A result is sometimes graphically represented as a graph (for example, the profile graph).

[420]Como observado acima, um resultado pode ser caracterizado como verdadeiro positivo, verdadeiro negativo, falso positivo ou falso negativo. O termo "verdadeiro positivo", como aqui usado, refere-se a um sujeito corretamente diagnosticado como tendo uma variação genética. O termo "falso positivo" como aqui usado refere- se a um sujeito erroneamente identificado como tendo uma variação genética. O termo "verdadeiro negativo" como aqui usado refere-se a um sujeito corretamente identificado como não tendo uma variação genética. O termo "falso negativo" como aqui usado refere-se a um sujeito erroneamente identificado como não tendo uma variação genética. Duas medidas de desempenho para qualquer método indicado podem ser calculadas com base nas proporções destas ocorrências: (i) um valor de sensibilidade, que geralmente é a fração de positivos preditos que são corretamente identificados como sendo positivos; e (ii) um valor de especificidade, que geralmente é a fração de negativos preditos corretamente identificados como sendo negativo.[420]As noted above, a result can be characterized as a true positive, true negative, false positive, or false negative. The term "true positive", as used herein, refers to a subject correctly diagnosed as having a genetic variation. The term "false positive" as used herein refers to a subject misidentified as having a genetic variation. The term "true negative" as used herein refers to a subject correctly identified as not having a genetic variation. The term "false negative" as used herein refers to a subject misidentified as not having a genetic variation. Two measures of performance for any given method can be calculated based on the proportions of these occurrences: (i) a sensitivity value, which is generally the fraction of predicted positives that are correctly identified as being positive; and (ii) a specificity value, which is usually the fraction of predicted negatives correctly identified as being negative.

[421]Em certas modalidades, uma ou mais de sensibilidade, especificidade e/ou nível de confiança são expressos como uma percentagem. Em algumas modalidades, a percentagem, independentemente para cada variável, é maior do que cerca de 90% (por exemplo, cerca de 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99%, ou maior do que 99% (por exemplo, cerca de 99,5%, ou maior, cerca de 99,9% ou maior, cerca de 99,95% ou maior, cerca de 99,99% ou maior)). Coeficiente de variação (CV) em algumas modalidades é expresso como uma percentagem, e, por vezes, a percentagem é cerca de 10% ou menos (por exemplo, cerca de 10, 9, 8, 7, 6, 5, 4, 3, 2 ou 1%, ou menos de 1% (por exemplo, cerca de 0,5% ou menos, cerca de 0,1% ou menos, cerca de 0,05% ou menos, cerca de 0,01% ou menos)). Uma probabilidade (por exemplo, que um resultado particular não é devido ao acaso) em certas modalidades é expressa como uma pontuação de Z, um valor de p, ou os resultados do teste t. Em algumas modalidades, uma variância medida, intervalo de confiança, sensibilidade, especificidade e semelhante (por exemplo, referidos coletivamente como parâmetros de confiança) para um resultado podem ser gerados usando uma ou mais manipulações de processamento de dados aqui descritas. Exemplos específicos para gerar resultados e níveis de confiança associados são descritos na seção de Exemplos e no pedido de patente internacional n. PCT/US12/59123 (W02013/052913) todo o conteúdo do qual está incorporado aqui por referência, incluindo todos os textos, tabelas, equações e desenhos.[421]In certain embodiments, one or more of sensitivity, specificity, and/or confidence level are expressed as a percentage. In some embodiments, the percentage, regardless of each variable, is greater than about 90% (for example, about 90, 91, 92, 93, 94, 95, 96, 97, 98, or 99%, or greater than than 99% (e.g., about 99.5% or greater, about 99.9% or greater, about 99.95% or greater, about 99.99% or greater)). Coefficient of variation (CV) in some arrangements is expressed as a percentage, and sometimes the percentage is around 10% or less (e.g. around 10, 9, 8, 7, 6, 5, 4, 3 , 2, or 1%, or less than 1% (e.g., about 0.5% or less, about 0.1% or less, about 0.05% or less, about 0.01% or less )). A probability (eg, that a particular result is not due to chance) in certain embodiments is expressed as a Z score, a p-value, or t-test results. In some embodiments, a measured variance, confidence interval, sensitivity, specificity, and the like (e.g., collectively referred to as confidence parameters) for a result can be generated using one or more data processing manipulations described herein. Specific examples for generating results and associated confidence levels are described in the Examples section and in international patent application no. PCT/US12/59123 (W02013/052913) all content of which is incorporated herein by reference, including all text, tables, equations and drawings.

[422]O termo "sensibilidade" como aqui usado refere-se ao número de verdadeiros positivos dividido pelo número de verdadeiros positivos, mais o número de falsos negativos, em que a sensibilidade (sens) pode estar dentro da faixa de 0 < sens < 1. O termo "especificidade" como aqui usado refere-se ao número de verdadeiros negativos dividido pelo número de verdadeiros negativos mais o número de falsos positivos, em que a sensibilidade (spec) pode estar dentro da faixa de 0 < spec < 1. Em algumas modalidades um método que tem sensibilidade e especificidade igual a um, ou 100%, ou próximo de um (por exemplo, entre cerca de 90% a cerca de 99%), por vezes, é selecionado . Em algumas modalidades, um método que tem uma sensibilidade igual a 1, ou 100% é selecionado, e em certas modalidades, um método que tem uma sensibilidade de cerca de 1 é selecionado (por exemplo, uma sensibilidade de cerca de 90%, uma sensibilidade de cerca de 91%, uma sensibilidade de cerca de 92%, uma sensibilidade de cerca de 93%, uma sensibilidade de cerca de 94%, uma sensibilidade de cerca de 95%, uma sensibilidade de cerca de 96%, uma sensibilidade de cerca de 97%, uma sensibilidade de cerca de 98%, ou uma sensibilidade de cerca de 99%). Em algumas modalidades, um método que tem uma especificidade igual a 1, ou 100% é selecionado, e em certas modalidades, um método que tem uma especificidade próximo de 1 é selecionado (por exemplo, uma especificidade de cerca de 90%, uma especificidade de cerca de 91%, uma especificidade de cerca de 92%, uma especificidade de cerca de 93%, uma especificidade de cerca de 94%, uma especificidade de cerca de 95%, uma especificidade de cerca de 96%, uma especificidade de cerca de 97%, uma especificidade de cerca de 98%, ou uma especificidade de cerca de 99%).[422]The term "sensitivity" as used herein refers to the number of true positives divided by the number of true positives, plus the number of false negatives, where sensitivity (sens) can be within the range of 0 < sens < 1. The term "specificity" as used herein refers to the number of true negatives divided by the number of true negatives plus the number of false positives, where the sensitivity (spec) can be within the range of 0 < spec < 1. In some embodiments, a method that has sensitivity and specificity equal to one, or 100%, or close to one (e.g., between about 90% to about 99%), is sometimes selected. In some embodiments, a method that has a sensitivity of about 1, or 100% is selected, and in certain embodiments, a method that has a sensitivity of about 1 is selected (e.g., a sensitivity of about 90%, a sensitivity of about 91%, a sensitivity of about 92%, a sensitivity of about 93%, a sensitivity of about 94%, a sensitivity of about 95%, a sensitivity of about 96%, a sensitivity of about 97%, a sensitivity of about 98%, or a sensitivity of about 99%). In some embodiments, a method that has a specificity equal to 1, or 100% is selected, and in certain embodiments, a method that has a specificity close to 1 is selected (e.g., a specificity of about 90%, a specificity about 91%, a specificity of about 92%, a specificity of about 93%, a specificity of about 94%, a specificity of about 95%, a specificity of about 96%, a specificity of about about 97%, a specificity of about 98%, or a specificity of about 99%).

[423]Idealmente, o número de falsos negativos igual a zero ou próximo de zero, de modo que nenhum sujeito é erroneamente identificado como não tendo pelo menos uma variação genética quando, de fato, eles tem pelo menos uma variação genética. Por outro lado, uma avaliação é feita frequentemente da capacidade de um algoritmo de predição para classificar negativos corretamente, uma medição complementar à sensibilidade. Idealmente, o número de falsos positivos iguais a zero ou próximo de zero, de modo que nenhum sujeito é erroneamente identificado como tendo pelo menos uma variação genética quando eles não têm a variação genética a ser avaliada.[423]Ideally, the number of false negatives equals zero or close to zero, so that no subject is mistakenly identified as not having at least one genetic variation when, in fact, they do have at least one genetic variation. On the other hand, an assessment is often made of the ability of a prediction algorithm to classify negatives correctly, a complementary measurement to sensitivity. Ideally, the number of false positives equals zero or close to zero, so that no subject is mistakenly identified as having at least one genetic variation when they do not have the genetic variation to be evaluated.

[424]Em algumas modalidades, a presença ou ausência de uma variação genética (por exemplo, aneuploidia do cromossomo) é determinada para um feto. Em tais modalidades, a presença ou ausência de uma variação genética do feto (por exemplo, aneuploidia do cromossomo fetal) é determinada.[424]In some embodiments, the presence or absence of a genetic variation (eg, chromosome aneuploidy) is determined for a fetus. In such modalities, the presence or absence of a fetal genetic variation (eg, fetal chromosome aneuploidy) is determined.

[425]Em certas modalidades, a presença ou ausência de uma variação genética (por exemplo, aneuploidia do cromossomo) é determinada para uma amostra. Em tais modalidades, a presença ou ausência de uma variação genética no ácido nucleico da amostra (por exemplo, aneuploidia do cromossomo) é determinada. Em algumas modalidades, uma variação detectada ou resíduos não detectados no ácido nucleico da amostra a partir de uma fonte, mas não na amostra de ácido nucleico de uma outra fonte. Exemplos não-limitativos de fontes incluem ácido nucleico placentário, ácido nucleico fetal, ácido nucleico materno, ácido nucleico de células de câncer, ácido nucleico de células não cancerosas, o semelhante e suas combinações. Nos exemplos não-limitativos, uma variação genética particular detectada ou não detectada (i) reside no ácido nucleico da placenta, mas não no ácido nucleico fetal e não no ácido nucleico materno; (ii) reside no ácido nucleico fetal mas não no ácido nucleico materno; ou (iii) reside no ácido nucleico materno, mas não no ácido nucleico fetal.[425]In certain embodiments, the presence or absence of a genetic variation (eg, chromosome aneuploidy) is determined for a sample. In such embodiments, the presence or absence of a genetic variation in the sample's nucleic acid (eg, chromosome aneuploidy) is determined. In some embodiments, a detected variation or undetected residues in the nucleic acid sample from one source, but not in the nucleic acid sample from another source. Non-limiting examples of sources include placental nucleic acid, fetal nucleic acid, maternal nucleic acid, cancer cell nucleic acid, non-cancerous cell nucleic acid, the like, and combinations thereof. In non-limiting examples, a particular detected or undetected genetic variation (i) resides in placental nucleic acid, but not in fetal nucleic acid and not in maternal nucleic acid; (ii) resides in fetal nucleic acid but not maternal nucleic acid; or (iii) resides in maternal nucleic acid but not fetal nucleic acid.

[426]Depois de um ou mais resultados terem sido gerados, um resultado frequentemente é usado para fornecer uma determinação da presença ou ausência de uma variação genética e/ou condição médica associada. Um resultado tipicamente é fornecido para um profissional de saúde (por exemplo, técnico ou gerente de laboratório; médico ou assistente). Frequentemente, um resultado é fornecido por um módulo de resultado. Em certas modalidades um resultado é fornecido por um módulo de gráfico. Em certas modalidades um resultado é fornecido em um periférico ou componente de uma máquina ou máquina. Por exemplo, às vezes, um resultado é fornecido por uma impressora ou monitor. Em algumas modalidades, um resultado determinante da presença ou ausência de uma variação genética é fornecida a um profissional da saúde sob a forma de um relatório, e em certas modalidades compreende um relatório uma apresentação de um valor do resultado e um parâmetro de confiança associado. Geralmente, um resultado pode ser exibido em um formato adequado que facilita a determinação da presença ou ausência de uma variação genética e/ou condição médica. Exemplos não-limitativos de formatos adequados para o uso para comunicação e/ou exibição de conjuntos de dados ou comunicação de um resultado incluem dados digitais, um gráfico, um gráfico 2D, um gráfico 3D, e gráfico 4D, uma imagem, uma imagem gráfica, um gráfico, um gráfico de barras, um gráfico de pizza, um diagrama, um fluxograma, um gráfico de dispersão, um mapa, um histograma, um gráfico de densidade, um gráfico da função, um diagrama do circuito, um diagrama de blocos, um mapa de bolha, um diagrama de constelação, um diagrama de contorno, um cartograma, gráfico de aranha, diagrama de Venn, nomograma, e semelhante, e uma combinação dos anteriores. Vários exemplos de representações de resultado são mostrados nos desenhos e são descritos nos Exemplos.[426]Once one or more results have been generated, a result is often used to provide a determination of the presence or absence of a genetic variation and/or associated medical condition. A result is typically provided to a healthcare professional (eg, laboratory technician or manager; physician or assistant). Often, a result is provided by a result module. In certain embodiments a result is provided by a graph module. In certain embodiments a result is provided on a peripheral or component of a machine or machine. For example, sometimes a result is provided by a printer or monitor. In some embodiments, a result determining the presence or absence of a genetic variation is provided to a healthcare professional in the form of a report, and in certain embodiments a report comprises a presentation of a result value and an associated confidence parameter. Generally, a result can be displayed in a suitable format that facilitates the determination of the presence or absence of a genetic variation and/or medical condition. Non-limiting examples of formats suitable for use for communicating and/or displaying sets of data or communicating a result include digital data, a graph, a 2D graph, a 3D graph, and 4D graph, an image, a graphic image , a graph, a bar graph, a pie graph, a diagram, a flowchart, a scatter plot, a map, a histogram, a density graph, a function graph, a circuit diagram, a block diagram , a bubble map, a constellation diagram, a contour diagram, a cartogram, spider chart, Venn diagram, nomogram, and the like, and a combination of the foregoing. Various examples of result representations are shown in the drawings and are described in the Examples.

[427]Geração de um resultado pode ser visto como uma transformação de fragmentos (reads) de sequências de ácido nucleico em uma representação de ácido nucleico celular de um sujeito, em certas modalidades. Uma representação de ácido nucleico celular de um sujeito frequentemente reflete uma dosagem ou número de cópia de um cromossomo particular ou porção da mesma, e, desse modo, frequentemente, a representação é uma propriedade de ácido nucleico do sujeito. A conversão de uma multiplicidade de fragmentos (reads) de sequências relativamente pequenos para uma representação de um cromossomo relativamente grande, por exemplo, pode ser vista como uma transformação. Como ilustração, em um processo para a geração de uma representação do cromossomo 21, que é de cerca de 47 milhões de bases de comprimento, usando fragmentos (reads) de aproximadamente 36 pares de bases de comprimento, muitos milhares de fragmentos (reads) que são, pelo menos, 100.000 vezes menores do que o cromossomo são transformadas em uma representação de cromossomo significativamente maior. Geração de uma tal representação de um cromossomo tipicamente envolve várias manipulações de fragmentos (reads) (por exemplo, mapeamento, filtração e/ou normalização) para se chegar a uma representação do cromossomo relativamente grande, como aqui descrito. Várias manipulações são usadas, frequentemente, o que pode exigir o uso de um ou mais computadores, frequentemente vários computadores coordenados em paralelo.[427]Generation of a result can be viewed as transforming fragments (reads) of nucleic acid sequences into a cellular nucleic acid representation of a subject, in certain embodiments. A cellular nucleic acid representation of a subject often reflects a dosage or copy number of a particular chromosome or portion thereof, and thus often the representation is a property of the subject's nucleic acid. The conversion of a multitude of relatively small sequence reads to a representation of a relatively large chromosome, for example, can be seen as a transformation. As an illustration, in a process for generating a representation of chromosome 21 that is about 47 million bases long, using fragments (reads) of approximately 36 base pairs in length, many thousands of fragments (reads) that are at least 100,000 times smaller than the chromosome are transformed into a significantly larger chromosome representation. Generating such a representation of a chromosome typically involves several manipulations of fragments (reads) (eg, mapping, filtering and/or normalization) to arrive at a relatively large representation of the chromosome, as described herein. Several manipulations are often used, which may require the use of one or more computers, often several computers coordinated in parallel.

[428]Quando fornece uma representação de um cromossomo para um cromossomo fetal usando uma amostra de uma mulher grávida, tal uma transformação é ainda mais aparente, uma vez que a maioria dos fragmentos (reads) são frequentemente de ácido nucleico materno e uma minoria de fragmentos (reads) são frequentementes de ácido nucleico fetal. Fragmentos (reads) de ácido nucleico materno frequentemente dominam fragmentos (reads) de ácido nucleico fetal, e a maioria dos fragmentos (reads) do ácido nucleico materno frequentemente mascara uma representação de um cromossomo fetal. Uma base tipicamente grande de fragmentos (reads) maternos pode obscurecer diferenças entre o ácido nucleico do cromossomo materno e fetal e a obtenção de uma representação de um cromossomo fetal contra uma base que envolve um processo que deconvolui a contribuição de fragmentos (reads) maternos, como aqui descrito.[428] When providing a chromosome representation for a fetal chromosome using a sample from a pregnant woman, such a transformation is even more apparent, since the majority of reads are often maternal nucleic acid and a minority of fragments (reads) are often of fetal nucleic acid. Maternal nucleic acid reads often dominate fetal nucleic acid reads, and most maternal nucleic acid reads often mask a representation of a fetal chromosome. A typically large base of maternal reads can obscure differences between maternal and fetal chromosome nucleic acid, and obtaining a representation of a fetal chromosome against a base involves a process that deconvolves the contribution of maternal reads, as described here.

[429]Em algumas modalidades, um resultado resulta de uma transformação de fragmentos (reads) de sequências de um sujeito (por exemplo, uma mulher grávida), em uma representação de uma estrutura existente (por exemplo, um genoma, um cromossomo ou seu segmento) presente em um sujeito (por exemplo, uma mãe e/ou feto). Em algumas modalidades, um resultado compreende uma transformação de fragmentos (reads) de sequências de um primeiro sujeito (por exemplo, uma mulher grávida), em uma representação compósito de estruturas (por exemplo, um genoma, um cromossomo ou seu segmento), e uma segunda transformação de representação compósita que produz uma representação de uma estrutura presente em um primeiro sujeito (por exemplo, uma mulher grávida) e/ou um segundo sujeito (por exemplo, um feto). Em algumas modalidades, um resultado compreende uma transformação de fragmentos (reads) de sequências de um primeiro sujeito (por exemplo, um sujeito feminino, uma mulher grávida), em uma representação das estruturas (por exemplo, um genoma, um cromossomo ou seu segmento) presentes em um segundo sujeito (por exemplo, um feto).[429] In some embodiments, a result results from a transformation of fragments (reads) of sequences from a subject (for example, a pregnant woman), into a representation of an existing structure (for example, a genome, a chromosome or its segment) present in a subject (e.g., a mother and/or fetus). In some embodiments, an outcome comprises a transformation of sequence reads from a first subject (e.g., a pregnant woman), into a composite representation of structures (e.g., a genome, a chromosome, or a segment thereof), and a second composite representation transformation that produces a representation of a structure present in a first subject (eg, a pregnant woman) and/or a second subject (eg, a fetus). In some embodiments, a result comprises a transformation of fragments (reads) of sequences from a first subject (for example, a female subject, a pregnant woman), into a representation of structures (for example, a genome, a chromosome or its segment ) present in a second subject (e.g., a fetus).

[430]Um método de transformação aqui, por vezes, compreende a determinação da presença ou ausência de um cromossomo trissômico (isto é, trissomia de cromossomo) em um feto (por exemplo, T21, T18 e/ou T13) de fragmentos (reads) de ácido nucleico em uma amostra obtida de um sujeito mulher grávida carregando o feto. Em algumas modalidades, um método de transformação aqui pode compreender a preparação de (por exemplo, a determinação, visualização, exibição, fornecimento) uma representação de um cromossomo (por exemplo, número de cópia do cromossomo, dosagem do cromossomo) para um feto de fragmentos (reads) de ácido nucleico em uma amostra obtida de um sujeito mulher grávida carregando o feto. Nas últimas modalidades, uma representação de um cromossomo de um feto é frequentemente para o cromossomo 13, cromossomo 18 e/ou cromossomo 21.[430] A transformation method here sometimes comprises determining the presence or absence of a trisomic chromosome (i.e., chromosome trisomy) in a fetus (e.g., T21, T18, and/or T13) from fragments (reads ) of nucleic acid in a sample obtained from a pregnant female subject carrying the fetus. In some embodiments, a transformation method here may comprise preparing (e.g., determining, visualizing, displaying, providing) a representation of a chromosome (e.g., chromosome copy number, chromosome dosage) for a fetus of fragments (reads) of nucleic acid in a sample obtained from a subject pregnant woman carrying the fetus. In the latter embodiments, a representation of a chromosome from a fetus is often for chromosome 13, chromosome 18 and/or chromosome 21.

Uso dos resultadosUse of results

[431]Um profissional da saúde, ou outro sujeito qualificado, que recebe um relatório compreendendo um ou mais resultados determinantes da presença ou ausência de uma variação genética pode usar os dados exibidos no relatório para fazer uma ligação sobre o estado do sujeito do teste ou paciente. O profissional de saúde pode fazer uma recomendação com base no resultado fornecido, em algumas modalidades. Um profissional da saúde ou sujeito qualificado pode fornecer um sujeito de teste ou paciente com uma ligação ou pontuação da presença ou ausência da variação genética com base no valor ou valores de resultado e parâmetros de confiança associados fornecidos em um relatório, em algumas modalidades. Em certas modalidades, uma pontuação ou ligação é feita manualmente por um profissional da saúde ou sujeito qualificado, por meio da observação visual do relatório fornecido. Em certas modalidades, uma pontuação ou ligação é feita por uma rotina automatizada, por vezes, incorporada em software, e revisada por um profissional da saúde ou sujeito qualificado para a exatidão antes de fornecer informações para um sujeito de teste ou paciente. O termo "receber um relatório" como aqui usado refere-se à obtenção, através de meios de comunicação, uma representação por escrito e/ou gráfica compreendendo um resultado, que após a revisão permite que um profissional da saúde ou sujeito qualificado faça uma determinação quanto à presença ou ausência de uma variação genética em um sujeito de teste ou paciente. O relatório pode ser gerado por um computador ou por entrada de dados humanos, e pode ser comunicado usando os meios eletrônicos (por exemplo, através da internet, de um computador, de fax, de um local de rede para outro local nos mesmos sítios físicos ou diferentes), ou por um outro método de enviar ou receber dados (por exemplo, serviços de correio eletrônico, serviço de correio e semelhante). Em algumas modalidades o resultado é transmitido para um profissional da saúde em um meio adequado, incluindo, sem limitação, verbal, documento ou forma de arquivo. O arquivo pode ser, por exemplo, mas não limitado a um arquivo auditivo, um arquivo legível por computador, um arquivo de papel, um arquivo de laboratório ou um arquivo de registro médico.[431]A healthcare professional, or other qualified subject, who receives a report comprising one or more results determining the presence or absence of a genetic variation may use the data displayed in the report to make a call about the test subject's status or patient. The healthcare professional can make a recommendation based on the result provided, in some modalities. A healthcare professional or qualified subject can provide a test subject or patient with a link or score of the presence or absence of genetic variation based on the result value or values and associated confidence parameters provided in a report, in some embodiments. In certain embodiments, a score or link is made manually by a healthcare professional or qualified subject through visual observation of the report provided. In certain embodiments, a score or link is made by an automated routine, sometimes built into software, and reviewed by a healthcare professional or qualified subject for accuracy before providing information to a test subject or patient. The term "receiving a report" as used herein refers to obtaining, by means of communication, a written and/or graphical representation comprising a result, which upon review allows a healthcare professional or qualified subject to make a determination as to the presence or absence of a genetic variation in a test subject or patient. The report may be generated by a computer or human input, and may be communicated using electronic means (e.g., via the internet, a computer, fax, from one network location to another location at the same physical sites or different), or by another method of sending or receiving data (e.g. electronic mail services, courier service and the like). In some embodiments, the result is transmitted to a healthcare professional in an appropriate medium, including, without limitation, verbal, document, or archival form. The file may be, for example, but not limited to an audio file, a computer readable file, a paper file, a laboratory file or a medical record file.

[432]O termo "fornecer um resultado" e seus equivalentes gramaticais destes, como aqui usados pode também se referir a um método para a obtenção de tal informação, incluindo, sem limitação, a obtenção de informações de um laboratório (por exemplo, um arquivo de laboratório). Um arquivo de laboratório pode ser gerado por um laboratório que efetuou um ou mais ensaios ou uma ou mais etapas de processamento de dados para determinar a presença ou a ausência da condição médica. O laboratório pode ser no mesmo local ou local diferente (por exemplo, em um outro país) como os funcionários identificando a presença ou ausência da condição médica a partir do arquivo de laboratório. Por exemplo, o arquivo de laboratório pode ser gerado em um local e transmitido para outro local no qual a informação nele será transmitida ao sujeito mulher grávida. O arquivo de laboratório pode estar em forma tangível ou em formato eletrônico (por exemplo, forma legível por computador), em certas modalidades.[432]The term "providing a result" and its grammatical equivalents thereof, as used herein may also refer to a method for obtaining such information, including, without limitation, obtaining information from a laboratory (e.g., a laboratory file). A laboratory file may be generated by a laboratory that has performed one or more tests or one or more data processing steps to determine the presence or absence of the medical condition. The laboratory may be in the same location or a different location (for example, in another country) as employees identifying the presence or absence of the medical condition from the laboratory file. For example, the laboratory file can be generated in one location and transmitted to another location where the information in it will be transmitted to the pregnant woman subject. The laboratory file may be in tangible form or in electronic form (eg, computer-readable form), in certain embodiments.

[433]Em algumas modalidades, um resultado pode ser fornecido a um profissional de saúde, médico ou sujeito qualificado de um laboratório e o profissional de saúde, médico ou sujeito qualificado pode fazer um diagnóstico com base no resultado. Em algumas modalidades, um resultado pode ser fornecido a um profissional de saúde, médico ou sujeito qualificado de um laboratório e o profissional de saúde, médico ou sujeito qualificado pode fazer um diagnóstico com base, em parte, nos resultados juntamente com dados e/ou informações adicionais e outros resultados.[433]In some embodiments, a result may be provided to a healthcare professional, physician, or qualified subject of a laboratory, and the healthcare professional, physician, or qualified subject may make a diagnosis based on the result. In some embodiments, a result may be provided to a healthcare professional, physician or qualified subject of a laboratory and the healthcare professional, physician or qualified subject may make a diagnosis based, in part, on the results together with data and/or additional information and other results.

[434]O profissional da saúde ou sujeito qualificado pode fornecer uma recomendação adequada com base no resultado ou resultados fornecidos no relatório. Exemplos não-limitativos de recomendações que pode ser fornecidos com base no resultado relatório fornecido incluem cirurgia, radioterapia, quimioterapia, aconselhamento genético, soluções de tratamento após o nascimento (por exemplo, planejamento de vida, cuidados assistidos em longo prazo, medicamentos, tratamentos sintomáticos), interrupção da gravidez, transplante de órgãos, transfusão de sangue, o semelhante ou combinações dos anteriores. Em algumas modalidades, a recomendação é dependente do resultado baseado na classificação fornecida (por exemplo, síndrome de Down, síndrome de Turner, condições médicas associadas com variações genéticas em T13, condições médicas associadas com variações genéticas em T18).[434]The healthcare professional or qualified subject can provide an appropriate recommendation based on the result or results provided in the report. Non-limiting examples of recommendations that may be provided based on the report result provided include surgery, radiotherapy, chemotherapy, genetic counseling, post-birth treatment solutions (e.g., life planning, long-term assisted care, medications, symptomatic treatments ), termination of pregnancy, organ transplantation, blood transfusion, the like or combinations of the above. In some modalities, the recommendation is dependent on the result based on the classification provided (eg, Down syndrome, Turner syndrome, medical conditions associated with genetic variations at T13, medical conditions associated with genetic variations at T18).

[435]Os funcionários do laboratório (por exemplo, um gestor de laboratório) podem analisar valores (por exemplo, contagens de teste, contagens de referência, nível de desvio) subjacentes a uma determinação da presença ou ausência de uma variação genética (ou determinação de euplóide ou não-euplóide para uma região de teste). Para as ligações referentes a presença ou ausência de uma variação genética que estão próximas ou questionáveis, funcionários do laboratório podem re-solicitar o mesmo teste, e/ou solicitar um teste diferente (por exemplo, cariótipo e/ou amniocentese no caso de determinações de aneuploidia fetal), que faz uso do mesmo ácido nucleico ou diferente da amostra de um sujeito de teste.[435]Laboratory staff (e.g., a laboratory manager) may analyze values (e.g., test counts, reference counts, level of deviation) underlying a determination of the presence or absence of a genetic variation (or determination euploid or non-euploid for a test region). For links regarding the presence or absence of a genetic variation that are close or questionable, laboratory personnel may reorder the same test, and/or request a different test (e.g., karyotype and/or amniocentesis in the case of fetal aneuploidy), which makes use of the same or different nucleic acid as a test subject's sample.

Variações genéticas e condições médicasGenetic variations and medical conditions

[436]A presença ou ausência de uma variação genética pode ser determinada usando um método, aparelho ou máquina aqui descrito. Em certas modalidades, a presença ou ausência de uma ou mais variações genéticas é determinada de acordo com um resultado fornecido por métodos, máquinas e aparelhos aqui descritos. Uma variação genética é geralmente um fenótipo genético específico presente em certos indivíduos, e frequentemente uma variação genética está presente em uma subpopulação estatisticamente significativa de indivíduos. Em algumas modalidades, uma variação genética é uma anomalia do cromossomo (por exemplo, aneuploidia), anomalia do cromossomo parcial ou mosaicismo, cada uma das quais é descrita em maior detalhe aqui. Exemplos não-limitativos de variações genéticas incluem uma ou mais deleções (por exemplo, micro-deleções), duplicações (por exemplo, micro-duplicações), inserções, mutações, polimorfismos (por exemplo, polimorfismo de um nucleotídeo), fusões, repetições (por exemplo, repetições em tandem curtas), sítios de metilação distintos, padrões de metilação distintos, semelhante, e suas combinações. Uma inserção, repetição, deleção, duplicação, mutação ou polimorfismo pode ser de qualquer comprimento, e em algumas modalidades, é de cerca de 1 base ou par de bases (pb) a cerca de 250 megabases (Mb) de comprimento. Em algumas modalidades, uma inserção, repetição, deleção, duplicação, mutação ou polimorfismo é cerca de 1 base ou par de bases (pb) a cerca de 1000 quilobases (kb) de comprimento (por exemplo, cerca de 10 pb, 50 pb, 100 pb, 500 pb, 1kb, 5 kb, 1Okb, 50 kb, 100 kb, 500 kb, ou 1000 kb de comprimento).[436]The presence or absence of a genetic variation can be determined using a method, apparatus, or machine described herein. In certain embodiments, the presence or absence of one or more genetic variations is determined according to a result provided by methods, machines and apparatus described herein. A genetic variation is usually a specific genetic phenotype present in certain individuals, and often a genetic variation is present in a statistically significant subpopulation of individuals. In some embodiments, a genetic variation is a chromosome abnormality (eg, aneuploidy), partial chromosome abnormality, or mosaicism, each of which is described in greater detail here. Non-limiting examples of genetic variations include one or more deletions (e.g., microdeletions), duplications (e.g., micro-duplications), insertions, mutations, polymorphisms (e.g., one nucleotide polymorphism), fusions, repeats ( eg, short tandem repeats), distinct methylation sites, distinct methylation patterns, similar, and combinations thereof. An insertion, repeat, deletion, duplication, mutation or polymorphism can be of any length, and in some embodiments, is from about 1 base or base pair (bp) to about 250 megabases (Mb) in length. In some embodiments, an insertion, repeat, deletion, duplication, mutation, or polymorphism is from about 1 base or base pair (bp) to about 1000 kilobases (kb) in length (e.g., about 10 bp, 50 bp, 100bp, 500bp, 1kb, 5kb, 1Okb, 50kb, 100kb, 500kb, or 1000kb in length).

[437]A variação genética é por vezes uma deleção. Em certas modalidades uma deleção é uma mutação (por exemplo, uma aberração genética) em que uma parte de um cromossomo ou de uma sequência de DNA que está faltando. Uma deleção é frequentemente a perda de material genético. Qualquer número de nucleotídeos pode ser deletado. Uma deleção pode compreender a deleção de um ou mais cromossomos inteiros, um segmento de um cromossomo, um alelo, um gene, um íntron, um éxon, qualquer região não codificante, qualquer região codificante, seu segmento ou uma combinação destes. A deleção pode compreender uma micro-deleção. Uma deleção pode compreender a deleção de uma única base.[437]Genetic variation is sometimes a deletion. In certain embodiments a deletion is a mutation (eg, a genetic aberration) in which a part of a chromosome or DNA sequence is missing. A deletion is often the loss of genetic material. Any number of nucleotides can be deleted. A deletion may comprise the deletion of one or more entire chromosomes, a segment of a chromosome, an allele, a gene, an intron, an exon, any non-coding region, any coding region, its segment or a combination thereof. The deletion may comprise a microdeletion. A deletion may comprise the deletion of a single base.

[438]A variação genética é por vezes uma duplicação genética. Em certas modalidades uma duplicação é uma mutação (por exemplo, uma aberração genética) em que uma parte de um cromossomo ou de uma sequência de DNA é copiada e inserida de volta ao genoma. Em certas modalidades uma duplicação genética (isto é, duplicação) é a duplicação de uma região do DNA. Em algumas modalidades uma duplicação é uma sequência de ácido nucleico que é repetida, frequentemente em conjunto, dentro de um genoma ou cromossomo. Em algumas modalidades uma duplicação pode compreender uma cópia de um ou mais cromossomos inteiros, um segmento de um cromossomo, um alelo, um gene, um íntron, um éxon, qualquer região não-codificante, qualquer região codificante, seu segmento ou uma combinação destes. Uma duplicação pode compreender um micro-duplicação. Uma duplicação, por vezes, compreende uma ou mais cópias de um ácido nucleico duplicado. Uma duplicação, por vezes, é caracterizada como uma região genética repetida uma ou mais vezes (por exemplo, 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 vezes repetidas). Duplicações podem variar de pequenas regiões (milhares de pares de bases) aos cromossomos inteiros, em alguns casos. Duplicações ocorrem frequentemente como resultado de um erro no processo de recombinação homóloga, ou devido a um evento de retrotransposons. Duplicações têm sido associadas com certos tipos de doenças proliferativas. Duplicações podem ser caracterizadas usando microarranjos de DNA genômico ou hibridização genética comparativa (CGH).[438]Genetic variation is sometimes genetic duplication. In certain embodiments a duplication is a mutation (eg, a genetic aberration) in which a part of a chromosome or DNA sequence is copied and inserted back into the genome. In certain embodiments a genetic duplication (i.e., duplication) is the duplication of a region of DNA. In some embodiments a duplication is a nucleic acid sequence that is repeated, often together, within a genome or chromosome. In some embodiments a duplication may comprise a copy of one or more entire chromosomes, a segment of a chromosome, an allele, a gene, an intron, an exon, any non-coding region, any coding region, its segment or a combination thereof. . A duplication may comprise a micro-duplication. A duplication sometimes comprises one or more copies of a duplicated nucleic acid. A duplication is sometimes characterized as a genetic region repeated one or more times (for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 times). Duplications can range from small regions (thousands of base pairs) to entire chromosomes in some cases. Duplications often occur as a result of an error in the homologous recombination process, or due to a retrotransposon event. Duplications have been associated with certain types of proliferative diseases. Duplications can be characterized using genomic DNA microarrays or comparative genetic hybridization (CGH).

[439]A variação genética é, por vezes, uma inserção. Uma inserção é, por vezes, a adição de um ou mais pares de bases de nucleotídeos em uma sequência de ácido nucleico. Uma inserção é às vezes uma micro-inserção. Em certas modalidades uma inserção compreende a adição de um segmento de um cromossomo em um genoma, o cromossomo, ou seu segmento. Em certas modalidades uma inserção compreende a adição de um alelo, um gene, um íntron, um éxon, qualquer região não-codificante, qualquer região codificante, seu segmento ou uma combinação destes em um genoma ou seu segmento. Em certas modalidades uma inserção compreende a adição (isto é, inserção) de ácido nucleico de origem desconhecida em um genoma, cromossomo, ou seu segmento. Em certas modalidades uma inserção compreende a adição (isto é, inserção) de uma única base.[439]Genetic variation is sometimes an insertion. An insertion is sometimes the addition of one or more base pairs of nucleotides into a nucleic acid sequence. An insert is sometimes a micro-insert. In certain embodiments an insertion comprises adding a segment of a chromosome into a genome, the chromosome, or its segment. In certain embodiments an insertion comprises the addition of an allele, a gene, an intron, an exon, any non-coding region, any coding region, segment thereof or a combination thereof into a genome or segment thereof. In certain embodiments an insertion comprises adding (i.e., inserting) nucleic acid of unknown origin into a genome, chromosome, or segment thereof. In certain embodiments an insertion comprises the addition (i.e., insertion) of a single base.

[440]Como usada aqui uma "variação do número de cópia" geralmente é uma classe ou tipo de variação genética ou aberração cromossômica. Uma variação do número de cópia pode ser uma deleção (por exemplo, micro-deleção), duplicação (por exemplo, um micro-duplicação) ou inserção (por exemplo, uma micro-inserção). Frequentemente, o prefixo "micro" como aqui usado, por vezes, é um segmento de ácido nucleico com menos que 5 Mb de comprimento. Uma variação do número de cópia pode incluir uma ou mais deleções (por exemplo, micro-deleção), duplicações e/ou inserções (por exemplo, um micro-duplicação, micro- inserção) de um segmento de um cromossomo. Em certas modalidades a duplicação compreende uma inserção. Em certas modalidades uma inserção é uma duplicação. Em certas modalidades uma inserção não é uma duplicação. Por exemplo, frequentemente uma duplicação de uma sequência em uma porção aumenta as contagens para uma porção na qual se encontra a duplicação. Frequentemente, uma duplicação de uma sequência em uma porção aumenta o nível. Em certas modalidades, uma duplicação presente em porções constituindo um primeiro nível aumenta o nível em relação a um segundo nível onde uma duplicação está ausente. Em certas modalidades uma inserção aumenta as contagens de uma porção e uma sequência representando a inserção está presente (isto é, duplicado) em outro local dentro da mesma porção. Em certas modalidades uma inserção não aumenta significativamente as contagens de uma porção ou o nível e a sequência que é inserida não é uma duplicação de uma sequência dentro da mesma porção. Em certas modalidades uma inserção não é detectada ou representada como uma duplicação e uma sequência duplicada representando a inserção não está presente na mesma porção.[440]As used herein a "copy number variation" is generally a class or type of genetic variation or chromosomal aberration. A copy number variation can be a deletion (eg, micro-deletion), duplication (eg, a micro-duplication), or insertion (eg, a micro-insert). Often, the prefix "micro" as used herein is sometimes a nucleic acid segment less than 5 Mb in length. A copy number variation can include one or more deletions (eg, micro-deletion), duplications, and/or insertions (eg, a micro-duplication, micro-insertion) of a segment of a chromosome. In certain embodiments the duplication comprises an insertion. In certain embodiments an insertion is a duplication. In certain embodiments an insertion is not a duplication. For example, a duplication of a sequence in a chunk often increases the counts for a chunk in which the duplication is found. Often a doubling of a sequence in a portion raises the level. In certain embodiments, a duplication present in portions constituting a first tier increases the tier relative to a second tier where a duplication is absent. In certain embodiments an insert increases the scores of a slice and a sequence representing the insert is present (i.e., duplicated) elsewhere within the same slice. In certain embodiments an insertion does not significantly increase a chunk's scores or level and the sequence that is inserted is not a duplication of a sequence within the same chunk. In certain embodiments an insertion is not detected or represented as a duplication and a duplicated sequence representing the insertion is not present in the same portion.

[441]Em algumas modalidades uma variação do número de cópia é uma variação do número de cópia fetal. Frequentemente, uma variação do número de cópia fetal é uma variação do número de cópia no genoma de um feto. Em algumas modalidades uma variação do número de cópia é uma variação do número de cópia materna e/ou fetal. Em certas modalidades uma variação do número de cópia materna e/ou fetal é uma variação do número de cópia dentro do genoma de uma mulher grávida (por exemplo, um sujeito feminino tendo um feto), um sujeito feminino que deu à luz ou uma mulher capaz de ter um feto. Uma variação do número de cópia pode ser uma variação do número de cópia heterozigota em que a variação (por exemplo, uma duplicação ou deleção) está presente em um alelo de um genoma. Uma variação do número de cópia pode ser uma variação do número de cópia homozigota em que a variação está presente em ambos os alelos de um genoma. Em algumas modalidades uma variação do número de cópia é uma variação do número de cópia fetal heterozigota ou homozigota. Em algumas modalidades a variação do número de cópia é uma variação do número de cópia materna e/ou fetal heterozigota ou homozigota. Uma variação do número de cópia por vezes está presente em um genoma materno e um genoma fetal, um genoma materno e não um genoma fetal, ou um genoma fetal e não um genoma materno.[441]In some embodiments a copy number variation is a fetal copy number variation. Often, a fetal copy number variation is a copy number variation in the genome of a fetus. In some embodiments a copy number variation is a maternal and/or fetal copy number variation. In certain embodiments a maternal and/or fetal copy number variation is a copy number variation within the genome of a pregnant woman (e.g., a female subject bearing a fetus), a female subject who has given birth, or a woman able to have a fetus. A copy number variation can be a heterozygous copy number variation in which the variation (e.g., a duplication or deletion) is present in an allele of a genome. A copy number variation may be a homozygous copy number variation where the variation is present in both alleles of a genome. In some embodiments a copy number variation is a heterozygous or homozygous fetal copy number variation. In some embodiments the copy number variation is a heterozygous or homozygous maternal and/or fetal copy number variation. A copy number variation is sometimes present in a maternal genome and a fetal genome, a maternal genome and not a fetal genome, or a fetal genome and not a maternal genome.

[442]"Ploidia" é uma referência para o número de cromossomos presentes em um feto ou mãe. Em certas modalidades "ploidia" é o mesmo que "ploidia do cromossomo". Nos seres humanos, por exemplo, cromossomos autossômicos estão frequentemente presentes em pares. Por exemplo, na ausência de uma variação genética, maioria dos seres humanos têm dois de cada cromossomo autossômico (por exemplo, cromossomos 1-22). A presença do complemento normal de 2 cromossomos autossômicos em um humano é frequentemente referida como euplóide. "Microploidia" é semelhante em significado para ploidia. "Microploidia" refere-se frequentemente a ploidia de um segmento de um cromossomo. O termo "microploidia", por vezes, é uma referência à presença ou ausência de uma variação do número de cópia (por exemplo, uma deleção, duplicação e/ou uma inserção) dentro de um cromossomo (por exemplo, uma exclusão, uma duplicação ou uma inserção homozigota ou heterozigota, o semelhante ou ausência destes). "Ploidia" e "microploidia", às vezes, são determinadas após a normalização de contagens de um nível em um perfil. Desse modo, um nível que representa um par de cromossomos autossômicos (por exemplo, um euplóide) é frequentemente normalizado para uma ploidia igual a 1. Semelhantemente, um nível dentro de um segmento de um cromossomo que representa a ausência de uma duplicação, deleção ou inserção, frequentemente é normalizado para um microploidia de 1. Ploidia e microploidia são frequentemente específicas da porção (por exemplo, específico da porção) e específicas da amostra. Ploidia é frequentemente definida como múltiplos inteiros de 1/2, com os valores de 1, 1/2, 0, 3/2, e 2 representando euplóide (por exemplo, 2 cromossomos), 1 cromossomo presente (por exemplo, uma deleção de cromossomo), nenhum cromossomo presente, 3 cromossomos (por exemplo, uma trissomia) e 4 cromossomos, respectivamente. Da mesma forma, microploidia é geralmente definida como múltiplos inteiros de 1/2, com os valores de 1, ^, 0, 3/2, e 2 representando euplóide (por exemplo, nenhuma variação do número de cópia), uma deleção heterozigota, deleção homozigota, duplicação heterozigota e duplicação homozigota, respectivamente. Alguns exemplos de valores de ploidia para um feto são fornecidos na Tabela 2.[442] "Ploidy" is a reference to the number of chromosomes present in a fetus or mother. In certain embodiments "ploidy" is the same as "chromosome ploidy". In humans, for example, autosomal chromosomes are often present in pairs. For example, in the absence of genetic variation, most humans have two of each autosomal chromosome (eg, chromosomes 1-22). The presence of the normal complement of 2 autosomal chromosomes in a human is often referred to as euploid. "Microploidy" is similar in meaning to ploidy. "Microploidy" often refers to the ploidy of a segment of a chromosome. The term "microploidy" is sometimes a reference to the presence or absence of a copy number variation (e.g., a deletion, duplication, and/or an insertion) within a chromosome (e.g., a deletion, a duplication or a homozygous or heterozygous insertion, the like or absence thereof). "Ploidy" and "microploidy" are sometimes determined after normalizing one-level counts in a profile. Thus, a level that represents an autosomal pair of chromosomes (eg, an euploid) is often normalized to a ploidy of 1. Similarly, a level within a segment of a chromosome that represents the absence of a duplication, deletion, or insertion, is often normalized to a microploidy of 1. Ploidy and microploidy are often portion-specific (eg, portion-specific) and sample-specific. Ploidy is often defined as integer multiples of 1/2, with the values 1, 1/2, 0, 3/2, and 2 representing euploid (e.g., 2 chromosomes), 1 chromosome present (e.g., a deletion of chromosome), no chromosome present, 3 chromosomes (e.g. a trisomy) and 4 chromosomes respectively. Likewise, microploidy is generally defined as integer multiples of 1/2, with the values 1, ^, 0, 3/2, and 2 representing euploid (i.e., no copy number variation), a heterozygous deletion, homozygous deletion, heterozygous duplication and homozygous duplication, respectively. Some examples of ploidy values for a fetus are provided in Table 2.

[443]Em certas modalidades, a microploidia de um feto corresponde a microploidia da mãe do feto (ou seja, sujeito feminino grávida). Em certas modalidades a microploidia de um feto corresponde a microploidia da mãe do feto e ambos mãe e feto transportam a mesma variação do número de cópia heterozigota, variação do número de cópia homozigota ou ambos são euplóides. Em certas modalidades a microploidia de um feto é diferente da microploidia da mãe do feto. Por exemplo, às vezes a microploidia de um feto é heterozigota para uma variação do número de cópia, a mãe é homozigota para a variação do número de cópia e a microploidia do feto não corresponde (por exemplo, não é igual) a microploidia da mãe para a variação do número de cópia especificada.[443]In certain embodiments, the microploidy of a fetus corresponds to the microploidy of the fetus's mother (ie, pregnant female subject). In certain embodiments the microploidy of a fetus matches the microploidy of the mother of the fetus and both mother and fetus carry the same heterozygous copy number variation, homozygous copy number variation, or both are euploid. In certain embodiments the microploidy of a fetus is different from the microploidy of the mother of the fetus. For example, sometimes the microploidy of a fetus is heterozygous for a copy number variation, the mother is homozygous for the copy number variation, and the microploidy of the fetus does not match (ie, is not equal to) the microploidy of the mother. for the specified copy number range.

[444]A microploidia é frequentemente associada a um nível esperado. Por exemplo, por vezes, um nível (por exemplo, um nível de um perfil, por vezes, um nível que inclui substancialmente qualquer variação do número de cópia) é normalizado para um valor de 1 (por exemplo, uma ploidia de 1, um microploidia de 1) e a microploidia de uma duplicação homozigota é 2, uma duplicação heterozigota é 1,5, uma deleção heterozigota é 0,5 e uma deleção homozigótica é zero.[444]Microploidy is often associated with an expected level. For example, sometimes a level (for example, a level of a profile, sometimes a level that includes substantially any copy number variation) is normalized to a value of 1 (for example, a ploidy of 1, a microploidy of 1) and the microploidy of a homozygous duplication is 2, a heterozygous duplication is 1.5, a heterozygous deletion is 0.5, and a homozygous deletion is zero.

[445]Uma variação genética para a qual a presença ou ausência é identificada para um sujeito está associada com uma condição médica em certas modalidades. Desse modo, a tecnologia aqui descrita pode ser usada para identificar a presença ou ausência de uma ou mais variações genéticas que são associadas com uma condição médica ou estado médico. Exemplos não-limitativos de condições médicas incluem os que estão associados com deficiência mental (por exemplo, Síndrome de Down), proliferação celular aberrante (por exemplo, câncer), a presença de um ácido nucleico no microrganismo (por exemplo, vírus, bactéria, fungo, levedura), e pré-eclâmpsia.[445]A genetic variation for which the presence or absence is identified for a subject is associated with a medical condition in certain embodiments. Thus, the technology described herein can be used to identify the presence or absence of one or more genetic variations that are associated with a medical condition or medical condition. Non-limiting examples of medical conditions include those associated with mental retardation (e.g., Down Syndrome), aberrant cell proliferation (e.g., cancer), the presence of a nucleic acid in the microorganism (e.g., virus, bacteria, fungus, yeast), and pre-eclampsia.

[446]Exemplos não-limitativos de variações genéticas, condições e estados médicos estão descritos a seguir.[446]Non-limitative examples of genetic variations, conditions, and medical conditions are described below.

Gênero fetalfetal gender

[447]Em algumas modalidades, a previsão de um gênero fetal ou desordem relacionada com o gênero (por exemplo, aneuploidia do cromossomo sexual) pode ser determinada por um método, máquina ou aparelho aqui descrito. A determinação do gênero, em geral, baseia-se em um cromossomo sexual. Nos seres humanos, existem dois cromossomos sexuais, os cromossomos X e Y. O cromossomo Y contém um gene, SRY, o que ativa o desenvolvimento embrionário como um homem. Os cromossomos Y de humanos e outros mamíferos também contêm outros genes necessários para a produção normal do esperma. Indivíduos com XX são femininos e XY são masculinos e variações não-limitativas, frequentemente, referidas como aneuploidias do cromossomo sexual, incluem XO, XYY, XXX e XXY. Em certas modalidades, os homens têm dois cromossomos X e um cromossomo Y (XXY; Síndrome de Klinefelter), ou um cromossomo X e dois cromossomos Y (Síndrome XYY; Síndrome de Jacobs), e algumas mulheres têm três cromossomos X (XXX; Síndrome de Triplo X), ou um único cromossomo X em vez de dois (XO; Síndrome de Turner). Em certas modalidades, apenas uma porção de células em um indivíduo são afetadas por uma aneuploidia do cromossomo sexual que pode ser referida como um mosaicismo (por exemplo, mosaicismo de Turner). Outros casos incluem aqueles em que SRY é danificado (levando a uma mulher XY), ou copiado para o X (levando a um homem XX).[447]In some embodiments, the prediction of a fetal gender or gender-related disorder (eg, sex chromosome aneuploidy) can be determined by a method, machine, or apparatus described herein. Gender determination is usually based on a sex chromosome. In humans, there are two sex chromosomes, the X and Y chromosomes. The Y chromosome contains a gene, SRY, which activates embryonic development as a male. The Y chromosomes of humans and other mammals also contain other genes necessary for normal sperm production. Individuals with XX are female and XY are male, and non-limiting variants, often referred to as sex chromosome aneuploidies, include XO, XYY, XXX, and XXY. In certain embodiments, males have two X chromosomes and one Y chromosome (XXY; Klinefelter syndrome), or one X chromosome and two Y chromosomes (XYY syndrome; Jacobs syndrome), and some females have three X chromosomes (XXX; Down syndrome). of Triple X), or a single X chromosome instead of two (XO; Turner Syndrome). In certain embodiments, only a portion of cells in an individual are affected by a sex chromosome aneuploidy that may be referred to as a mosaicism (eg, Turner mosaicism). Other cases include those where SRY is damaged (leading to an XY female), or copied to the X (leading to an XX male).

[448]Em algumas modalidades, um método no qual é determinado gênero fetal também pode compreender determinar fração fetal e/ou presença ou ausência de uma variação genética fetal (por exemplo, aneuploidia do cromossomo fetal). Determinação da presença ou ausência de uma variação genética fetal pode ser realizada de um modo adequado, exemplos não-limitativos dos quais incluem análise de cariótipo, amniocentese, análise do ácido nucleico isento de célula circulante, a análise do DNA fetal isento de células, análise da sequência de nucleotídeo, quantificação do fragmento (read) de sequência, abordagens alvos, abordagens baseadas em amplificação, abordagens baseadas em espectrometria de massa, abordagens baseadas em metilação diferencial, abordagens baseadas em digestão diferencial, abordagens baseadas em polimorfismos, abordagens baseadas em hibridização (por exemplo, usando sondas), e semelhante.[448]In some embodiments, a method in which fetal gender is determined may also comprise determining fetal fraction and/or the presence or absence of a fetal genetic variation (eg, fetal chromosome aneuploidy). Determining the presence or absence of a fetal genetic variation can be performed in a suitable manner, non-limiting examples of which include karyotype analysis, amniocentesis, analysis of circulating cell-free nucleic acid, analysis of fetal cell-free DNA, analysis nucleotide sequence quantification, sequence read quantification, targeting approaches, amplification-based approaches, mass spectrometry-based approaches, differential methylation-based approaches, differential digestion-based approaches, polymorphism-based approaches, hybridization-based approaches (eg using probes), and the like.

[449]Em certos casos, pode ser benéfico determinar o gênero de um feto no útero. Por exemplo, um paciente (por exemplo, a mulher grávida) com uma história familiar de uma ou mais desordens ligadas ao sexo pode desejar determinar o gênero do feto que ela está carregando para ajudar a avaliar o risco de o feto herdar tal uma desordem. Desordens ligadas ao sexo incluem, sem limitação, desordens ligadas ao X e ligadas ao Y. Desordens ligadas ao X incluem desordens dominantes ligadas ao X e recessivas ao X. Exemplos de desordens recessivas ligadas ao X incluem, sem limitação, doenças imunológicas (por exemplo, doença granulomatosa crônica (CYBB), síndrome de Wiskott-Aidrich, imunodeficiência combinada grave ligada ao X, gamaglobulinemia ligada ao X, síndrome de hiper-IgM do tipo 1, IPEX, doença linfoproliferativa ligada ao X, deficiência de properdina), doenças hematológicas (por exemplo, hemofilia A, hemofilia B, anemia sideroblástica ligada ao X), desordens endócrinas (por exemplo, síndrome da insensibilidade andrógena/doença de Kennedy, síndrome de Kallmann KAL1, hipoplasia adrenal congênita ligada ao X), doenças metabólicas (por exemplo, deficiência de ornitina transcarbamilase, síndrome oculocerebrorrenal, adrenoleucodistrofia, deficiência de glicose-6-fosfato desidrogenase, deficiência de piruvato desidrogenase, doença de Danon/doença de armazenamento de glicogênio tipo IIb, doença de Fabry, síndrome de Hunter, síndrome de Lesch-Nyhan, doença de Menkes/síndrome do corno ocipital), desordens do sistema nervoso (por exemplo, síndrome de Coffin-Lowry, síndrome de MASA, síndrome de retardo mental de alfa talassemia ligada ao cromossomo X, síndrome de retardo mental ligada ao X de sidério, cegueira da cor, albinismo ocular, doença de Norrie, coroideremia, doença de Charcot-Marie-Tooth (CMTX2-3), doença de Pelizaeus- Merzbacher, SMAX2), desordens do tecido relacionado e pele (por exemplo, disceratose congênita, displasia ectodérmica hipoidrótica (EDA), ictiose ligada ao X, distrofia corneana endotelial ligada ao X), doenças neuromusculares (por exemplo, distrofia muscular de Becker/Duchenne, miopatia centronuclear (MTM1), síndrome de Conradi-Hunermann, distrofia muscular de Emery-Dreifuss 1), desordens urológicas (por exemplo, síndrome de Alport, doença de Dent, diabetes insípida nefrogênica ligada ao X), desordens do osso/dente (por exemplo, amelogênese imperfeita AMELX), e outras desordens (por exemplo, síndrome de Barth, síndrome de Mcleod, síndrome de Smith-Fineman-Myers, síndrome de Simpson-Golabi-Behmel, síndrome de Mohr- Tranebjrerg, síndrome de Naso-digito-acústico). Exemplos de desordens dominantes ligadas ao X incluem, sem limitação, hipofosfatemia ligada ao X, hipoplasia dérmica focal, síndrome do X frágil, síndrome de Aicardi, Incontinência pigmentar, síndrome de Rett, síndrome CHILD, síndrome de Lujan-Fryns e síndrome de Orofaciodigital 1. Exemplos de desordens ligadas ao Y incluem, sem limitação, infertilidade masculina, retinite pigmentosa e azoospermia.[449]In certain cases, it may be beneficial to determine the gender of a fetus in utero. For example, a patient (eg, pregnant woman) with a family history of one or more sex-linked disorders may wish to determine the gender of the fetus she is carrying to help assess the risk of the fetus inheriting such a disorder. Sex-linked disorders include, without limitation, X-linked and Y-linked disorders. X-linked disorders include X-linked dominant and X-recessive disorders. Examples of X-linked recessive disorders include, without limitation, immunological disorders (e.g. , chronic granulomatous disease (CYBB), Wiskott-Aidrich syndrome, X-linked severe combined immunodeficiency, X-linked gammaglobulinemia, type 1 hyper-IgM syndrome, IPEX, X-linked lymphoproliferative disease, properdin deficiency), haematological disorders (e.g., hemophilia A, hemophilia B, X-linked sideroblastic anemia), endocrine disorders (e.g., androgen insensitivity syndrome/Kennedy's disease, Kallmann KAL1 syndrome, X-linked congenital adrenal hypoplasia), metabolic disorders (e.g., , ornithine transcarbamylase deficiency, oculocerebrorenal syndrome, adrenoleukodystrophy, glucose-6-phosphate dehydrogenase deficiency, pyruvate dehydrogenase deficiency, Danon disease/glycogen storage disease type IIb, Fabry disease, Hunter syndrome, Lesch-Nyhan syndrome , Menkes disease/occipital horn syndrome), nervous system disorders (eg, Coffin-Lowry syndrome, MASA syndrome, X-linked alpha thalassemia mental retardation syndrome, Siderium X-linked mental retardation syndrome , color blindness, ocular albinism, Norrie disease, choroideremia, Charcot-Marie-Tooth disease (CMTX2-3), Pelizaeus-Merzbacher disease, SMAX2), skin and tissue related disorders (e.g. dyskeratosis congenita, dysplasia hypohidrotic ectodermal dystrophy (EDA), X-linked ichthyosis, X-linked endothelial corneal dystrophy), neuromuscular disorders (e.g. Becker/Duchenne muscular dystrophy, centronuclear myopathy (MTM1), Conradi-Hunermann syndrome, Emery-Dreifuss muscular dystrophy 1), urologic disorders (eg, Alport's syndrome, Dent's disease, X-linked nephrogenic diabetes insipidus), bone/tooth disorders (eg, amelogenesis imperfecta AMELX), and other disorders (eg, Barth's syndrome, Mcleod syndrome, Smith-Fineman-Myers syndrome, Simpson-Golabi-Behmel syndrome, Mohr-Tranebjrerg syndrome, Naso-digito-acoustic syndrome). Examples of X-linked dominant disorders include, without limitation, X-linked hypophosphatemia, focal dermal hypoplasia, fragile X syndrome, Aicardi syndrome, Incontinence Pigmentosa, Rett syndrome, CHILD syndrome, Lujan-Fryns syndrome, and Orofaciodigital syndrome 1 Examples of Y-linked disorders include, without limitation, male infertility, retinitis pigmentosa, and azoospermia.

Anormalidades cromossômicaschromosomal abnormalities

[450]Em algumas modalidades, a presença ou ausência de uma anormalidade do cromossomo fetal pode ser determinada usando um método, máquina ou aparelho aqui descrito. Anomalias do cromossomo incluem, sem limitação, um ganho ou perda de um cromossomo inteiro ou uma região de um cromossomo que compreende um ou mais genes. Anormalidades do cromossomo incluem monossomias, trissomias, polissomias, perda de heterozigosidade, translocações, deleções e/ou duplicações de uma ou mais sequências de nucleotídeos (por exemplo, um ou mais genes), incluindo duplicações e deleções causadas por translocações desequilibradas. O termo "anormalidade do cromossomo", "aneuploidia" e/ou "aneuplóide", como aqui usados, refere-se a um desvio entre a estrutura do cromossomo do sujeito e um cromossomo homólogo normal. O termo "normal" refere-se ao cariótipo predominante ou padrão de bandas encontrado em indivíduos saudáveis de uma espécie em particular, por exemplo, um genoma euplóide (em seres humanos, 46,XX ou 46,XY). Como organismos diferentes têm complementos de cromossomo amplamente variados, o termo "aneuploidia" e "aneuplóide" não se refere a um número particular de cromossomos, mas sim à situação em que o teor do cromossomo dentro de uma dada célula ou células de um organismo é anormal. Em algumas modalidades, o termo "aneuploidia" e "aneuplóide" aqui refere-se a um desequilíbrio de material genético causado por uma perda ou ganho de um cromossomo inteiro, ou parte de um cromossomo. Uma "aneuploidia" pode se referir a uma ou mais deleções e/ou inserções de um segmento de um cromossomo. O termo "euplóide", em algumas modalidades, refere-se um complemento normal de cromossomos.[450]In some embodiments, the presence or absence of a fetal chromosome abnormality can be determined using a method, machine, or apparatus described herein. Chromosome abnormalities include, without limitation, a gain or loss of an entire chromosome or a region of a chromosome comprising one or more genes. Chromosome abnormalities include monosomies, trisomies, polysomies, loss of heterozygosity, translocations, deletions and/or duplications of one or more nucleotide sequences (eg, one or more genes), including duplications and deletions caused by unbalanced translocations. The term "chromosome abnormality", "aneuploidy" and/or "aneuploid", as used herein, refers to a deviation between the structure of the subject's chromosome and a normal homologous chromosome. The term "normal" refers to the predominant karyotype or banding pattern found in healthy individuals of a particular species, for example, an euploid genome (in humans, 46,XX or 46,XY). As different organisms have widely varying chromosome complements, the term "aneuploidy" and "aneuploidy" does not refer to a particular number of chromosomes, but rather to the situation where the chromosome content within a given cell or cells of an organism is not normal. In some embodiments, the term "aneuploidy" and "aneuploidy" herein refers to an imbalance of genetic material caused by a loss or gain of an entire chromosome, or part of a chromosome. An "aneuploidy" can refer to one or more deletions and/or insertions of a segment of a chromosome. The term "euploid", in some embodiments, refers to a normal complement of chromosomes.

[451]O termo "monossomia" como aqui usado refere-se a falta de um cromossomo do complemento normal. Monossomia parcial pode ocorrer em translocações ou deleções desequilibradas, em que apenas um segmento do cromossomo está presente em uma única cópia. Monossomia de cromossomos sexuais (45, X) causa a síndrome de Turner, por exemplo. O termo "dissomia" refere-se à presença de duas cópias de um cromossomo. Para os organismos, tais como os seres humanos que possuem duas cópias de cada cromossomo (aqueles que são diplóide ou "euplóide"), dissomia é a condição normal. Para os organismos que normalmente têm três ou mais cópias de cada cromossomo (aqueles que são triplóide ou acima), é um dissomia é um estado do cromossomo aneuplóide. Em dissomia uniparental, ambas as cópias do cromossomo vêm do mesmo pai (sem qualquer contribuição do outro progenitor).[451]The term "monosomy" as used herein refers to the lack of a normal complement chromosome. Partial monosomy can occur in unbalanced translocations or deletions, in which only one segment of the chromosome is present in a single copy. Monosomy of sex chromosomes (45, X) causes Turner syndrome, for example. The term "disomy" refers to the presence of two copies of a chromosome. For organisms such as humans who have two copies of each chromosome (those who are diploid or "euploid"), disomy is the normal condition. For organisms that normally have three or more copies of each chromosome (those that are triploid or above), a disomy is an aneuploid state of the chromosome. In uniparental disomy, both copies of the chromosome come from the same parent (without any input from the other parent).

[452]O termo "trissomia", como aqui usado, refere-se à presença de três cópias, em vez de duas cópias, de um cromossomo particular. A presença de um cromossomo 21 extra, que se encontra na síndrome de Down humano, é referido como "Trissomia 21." Trissomia 18 e trissomia 13 são duas outras trissomias autossômicas humanas. Trissomia de cromossomos sexuais pode ser visto nas mulheres (por exemplo, 47, XXX em síndrome de Triplo X) ou homens (por exemplo, 47, XXY na síndrome de Klinefelter, ou 47, XYY na Síndrome de Jacobs). Em algumas modalidades, uma trissomia é uma duplicação da maioria ou a totalidade de um autossomo. Em certas modalidades uma trissomia é uma aneuploidia do cromossomo inteiro resultando em três casos (por exemplo, três cópias) de um tipo particular de cromossomo (por exemplo, em vez de dois casos (isto é, um par) de um tipo particular de um cromossomo para um euplóide).[452]The term "trisomy", as used herein, refers to the presence of three copies, rather than two copies, of a particular chromosome. The presence of an extra chromosome 21, which is found in human Down syndrome, is referred to as "Trisomy 21." Trisomy 18 and Trisomy 13 are two other human autosomal trisomies. Sex chromosome trisomy can be seen in females (eg, 47, XXX in Triple X syndrome) or males (eg, 47, XXY in Klinefelter syndrome, or 47, XYY in Jacobs syndrome). In some embodiments, a trisomy is a duplication of most or all of an autosome. In certain embodiments a trisomy is an aneuploidy of the entire chromosome resulting in three instances (e.g., three copies) of a particular type of chromosome (e.g., instead of two cases (e.g., one pair) of a particular type of chromosome). chromosome for an euploid).

[453]Os termos "tetrassomia" e "pentassomia" como aqui usados referem-se a presença de quatro ou cinco cópias de um cromossomo, respectivamente. Embora raramente visto com autossomos, tetrassomia e pentassomia do cromossomo sexual foram relatados em seres humanos, incluindo XXXX, XXXY, XXYY, XYYY, XXXXX, XXXXY, XXXYY, XXYYY e XYYYY.[453]The terms "tetrasomy" and "pentasomy" as used herein refer to the presence of four or five copies of a chromosome, respectively. Although rarely seen with autosomes, sex chromosome tetrasomy and pentasomy have been reported in humans, including XXXX, XXXY, XXYY, XYYY, XXXXX, XXXXY, XXXYY, XXYYY, and XYYYY.

[454]Anormalidades do cromossomo podem ser causadas por uma variedade de mecanismos. Mecanismos incluem, mas não estão limitados a (i) não disjunção ocorrendo como o resultado de pontos de verificação mitóticos enfraquecidos, (ii) pontos de verificação mitóticos inativos causando não disjunção em vários cromossomos, (iii) ligação merotelica ocorrendo quando um cinetócoro está ligado a ambos os polos do fuso mitótico, (iv) um fuso multipolar formando quando mais do que dois polos do fuso se formam, (v) um fuso monopolar formando quando somente uma único polo de fuso se forma, e (vi) um intermediário tetraplóide ocorrendo como um resultado final do mecanismo de fuso monopolar.[454]Chromosome abnormalities can be caused by a variety of mechanisms. Mechanisms include, but are not limited to (i) nondisjunction occurring as the result of weakened mitotic checkpoints, (ii) inactive mitotic checkpoints causing nondisjunction in multiple chromosomes, (iii) merotelic linkage occurring when a kinetochore is turned on to both poles of the mitotic spindle, (iv) a multipolar spindle forming when more than two spindle poles form, (v) a monopolar spindle forming when only a single spindle pole forms, and (vi) a tetraploid intermediate occurring as an end result of the monopolar spindle mechanism.

[455]Os termos "monossomia parcial" e "trissomia parcial" como aqui usados referem-se a um desequilíbrio de material genético causado pela perda ou ganho de parte de um cromossomo. Uma monossomia parcial ou trissomia parcial pode resultar de uma translocação desequilibrada, em que um indivíduo carrega um cromossomo derivado formado através da rompimento e fusão de dois cromossomos diferentes. Nessa situação, o indivíduo teria três cópias de parte de um cromossomo (duas cópias normais e o segmento que existe no cromossomo derivado) e apenas uma cópia de parte do outro cromossomo envolvido no cromossomo derivado.[455]The terms "partial monosomy" and "partial trisomy" as used herein refer to an imbalance of genetic material caused by the loss or gain of part of a chromosome. A partial monosomy or partial trisomy can result from an unbalanced translocation, in which an individual carries a derived chromosome formed through the breakup and fusion of two different chromosomes. In this situation, the individual would have three copies of part of a chromosome (two normal copies and the segment that exists on the derived chromosome) and only one copy of part of the other chromosome involved in the derived chromosome.

[456]O termo "mosaicismo" como aqui usado refere-se a aneuploidia em algumas células, mas nem todas as células, de um organismo. Certas anormalidades cromossômicas podem existir como anormalidades do cromossomo em mosaico e não- mosaico. Por exemplo, certa trissomia 21 indivíduos têm síndrome de Down em mosaico e alguns têm síndrome de Down em não-mosaico. Diferentes mecanismos podem levar ao mosaicismo. Por exemplo, (i) um zigoto inicial pode ter três cromossomos 21, o que normalmente resultaria em trissomia 21 simples, mas durante o curso da divisão celular de uma ou mais linhagens de células perdeu um dos cromossomos 21; e (ii) um zigoto inicial pode ter dois cromossomos 21, mas durante o curso da divisão celular um dos cromossomos 21 foi duplicado. Mosaicismo somático provavelmente ocorre através de mecanismos distintos daqueles tipicamente associadas a síndromes genéticas envolvendo aneuploidia completa ou mosaico. Mosaicismo somático tem sido identificado em certos tipos de cânceres e em neurônios, por exemplo. Em certos casos, a trissomia 12 foi identificada na leucemia linfocítica crônica (CLL) e trissomia 8 foi identificada na leucemia mielóide aguda (AML). Além disso, síndromes genéticas em que um indivíduo está predisposto ao rompimento dos cromossomos (síndromes de instabilidade do cromossomo) são frequentemente associadas com risco aumentado para vários tipos de câncer, destacando desse modo o papel de aneuploidia somática na carcinogênese. Métodos e protocolos aqui descritos podem identificar a presença ou ausência de anormalidades do cromossomo em mosaico e não-mosaico.[456] The term "mosaicism" as used herein refers to aneuploidy in some cells, but not all cells, of an organism. Certain chromosomal abnormalities can exist as mosaic and non-mosaic chromosome abnormalities. For example, certain trisomy 21 individuals have mosaic Down syndrome and some have non-mosaic Down syndrome. Different mechanisms can lead to mosaicism. For example, (i) an early zygote may have three chromosomes 21, which would normally result in simple trisomy 21, but during the course of cell division one or more cell lineages has lost one of its chromosomes 21; and (ii) an early zygote may have two chromosomes 21, but during the course of cell division one of the chromosomes 21 has been duplicated. Somatic mosaicism likely occurs through mechanisms other than those typically associated with genetic syndromes involving complete aneuploidy or mosaic. Somatic mosaicism has been identified in certain types of cancers and in neurons, for example. In certain cases, trisomy 12 has been identified in chronic lymphocytic leukemia (CLL) and trisomy 8 has been identified in acute myelogenous leukemia (AML). Furthermore, genetic syndromes in which an individual is predisposed to chromosome breakage (chromosome instability syndromes) are often associated with increased risk for various types of cancer, thereby highlighting the role of somatic aneuploidy in carcinogenesis. Methods and protocols described here can identify the presence or absence of mosaic and non-mosaic chromosome abnormalities.

[457]Tabelas 1A e 1B apresentam uma lista não- limitativa de condições, síndromes e/ou anormalidades do cromossomo que podem ser identificadas potencialmente por métodos, máquinas e aparelhos aqui descritos. Tabela 1 B é da base de dados DECIPHER de 6 de outubro 2011 (por exemplo, versão 5.1, com base nas posições mapeadas para GRCh37; disponível no localizador uniforme de recurso (URL) dechipher.sanger.ac.uk). Tabela 1A Tabela 1B [457]Tables 1A and 1B present a non-limiting list of conditions, syndromes, and/or chromosome abnormalities that can potentially be identified by the methods, machines, and apparatus described herein. Table 1B is from the DECIPHER database as of 6 October 2011 (eg version 5.1, based on positions mapped to GRCh37; available at uniform resource locator (URL) dechipher.sanger.ac.uk). Table 1A Table 1B

[458]Condições de grau 1 têm, frequentemente, uma ou mais das seguintes características: anomalia patogênica; forte concordância entre os geneticistas; altamente penetrantes; ainda podem ter fenótipo variável, mas algumas características comuns; todos os casos na literatura têm um fenótipo clínico; nenhum caso de indivíduos saudáveis com a anomalia; não apresentara um relatório sobre as bases de dados DVG ou encontradas em população saudável; dados funcionais confirmando efeito de dosagem em um gene ou multi-genes; genes candidatos fortes ou confirmados; implicações na gestão clínica definida; o risco de câncer conhecido com implicação para a vigilância; múltiplas fontes de informação (OMIM, GeneReviews, Orphanet, Unique, Wikipedia); e/ou disponíveis para uso em diagnóstico (aconselhamento reprodutivo).[458]Grade 1 conditions often have one or more of the following features: pathogenic abnormality; strong agreement among geneticists; highly penetrating; may still have variable phenotype but some common features; all cases in the literature have a clinical phenotype; no cases of healthy individuals with the anomaly; failed to report on DVG databases or found in healthy population; functional data confirming dose effect on one gene or multi-genes; strong or confirmed candidate genes; implications for defined clinical management; the known cancer risk with implication for surveillance; multiple information sources (OMIM, GeneReviews, Orphanet, Unique, Wikipedia); and/or available for diagnostic use (reproductive counseling).

[459]Condições de grau 2 têm, frequentemente, uma ou mais das seguintes características; provavelmente anomalia patogênica; altamente penetrantes; fenótipo variável com nenhuma característica consistente outra que DD; pequeno número de casos/relatos na literatura; todos os casos notificados têm um fenótipo clínico; nenhum dado funcional ou genes patogênicos confirmados; várias fontes de informação (OMIM, GeneReviews, Orphanet, Unique, Wikipedia); e/ou podem ser usados para propósitos de diagnóstico e aconselhamento reprodutivo.[459]Grade 2 conditions often have one or more of the following characteristics; probably pathogenic anomaly; highly penetrating; variable phenotype with no consistent features other than DD; small number of cases/reports in the literature; all reported cases have a clinical phenotype; no functional data or confirmed pathogenic genes; various sources of information (OMIM, GeneReviews, Orphanet, Unique, Wikipedia); and/or may be used for diagnostic purposes and reproductive counseling.

[460]Condições de grau 3 têm, frequentemente, uma ou mais das seguintes características; suscetibilidade local; indivíduos saudáveis ou de pais não afetados de uma probanda descrita; presentes em populações de controle; não penetrantes; fenótipo leve e não específico; apresentam menos consistentes; não há dados funcionais ou genes patogênicos confirmados; mais fontes de dados limitadas; possibilidade de segundo diagnóstico continua a ser uma possibilidade para os casos que se afastam da maioria ou se novo achado clínico presente; e/ou cuidado ao usar para propósitos de diagnóstico e conselho guardado para o aconselhamento reprodutivo.[460]Grade 3 conditions often have one or more of the following characteristics; local susceptibility; healthy subjects or unaffected parents of a described proband; present in control populations; non-penetrating; mild and non-specific phenotype; are less consistent; there are no confirmed functional data or pathogenic genes; more limited data sources; the possibility of a second diagnosis remains a possibility for cases that deviate from the majority or if a new clinical finding is present; and/or caution when using for diagnostic purposes and advice guarded for reproductive counseling.

Pré-eclâmpsiaPre eclampsia

[461]Em algumas modalidades, a presença ou ausência de pré-eclâmpsia é determinada usando um método, máquina ou aparelho aqui descrito. A pré-eclâmpsia é uma condição na qual a hipertensão surge na gravidez (ou seja, a hipertensão induzida pela gravidez) e está associada com quantidades significativas de proteína na urina. Em certas modalidades, a pré-eclâmpsia também está associada com níveis elevados de ácido nucleico extracelular e/ou alterações nos padrões de metilação. Por exemplo, uma correlação positiva entre os níveis extracelulares de RASSF1A hipermetilado derivado de feto e a gravidade da pré-eclâmpsia tem sido observada. Em certos exemplos, a metilação do DNA aumentada é observada para o gene H19 em placentas com pré-eclâmpsia em comparação com controles normais.[461]In some embodiments, the presence or absence of preeclampsia is determined using a method, machine, or apparatus described herein. Pre-eclampsia is a condition in which hypertension arises in pregnancy (ie, pregnancy-induced hypertension) and is associated with significant amounts of protein in the urine. In certain embodiments, pre-eclampsia is also associated with elevated levels of extracellular nucleic acid and/or changes in methylation patterns. For example, a positive correlation between extracellular levels of fetal-derived hypermethylated RASSF1A and the severity of preeclampsia has been observed. In certain examples, increased DNA methylation is observed for the H19 gene in preeclamptic placentas compared to normal controls.

[462]A pré-eclâmpsia é uma das principais causas de mortalidade neonatal/materna e fetal e morbidade em todo o mundo. Ácidos nucléicos isentos de célula circulante no plasma e soro são novos biomarcadores com aplicações clínicas promissoras em diferentes áreas médicas, incluindo diagnóstico pré-natal. Mudanças quantitativas de (cff)DNA isento de células no plasma materno como um indicador para a pré-eclâmpsia iminente foram relatadas em diferentes estudos, por exemplo, usando PCR em tempo real quantitativo para o SRY específico de homem ou DYS 14 local. Em casos de aparecimento precoce de pré-eclâmpsia, níveis elevados podem ser vistos no primeiro trimestre. Os níveis aumentados de cffDNA antes do início dos sintomas podem ser devidos a hipoxia/reoxigenação dentro do espaço interviloso levando ao estresse oxidativo do tecido e apoptose placentária aumentada e necrose. Além da evidência de aumento da excreção de cffDNA na circulação materna, também há evidências de depuração renal reduzida de cffDNA na pré- eclâmpsia. À medida que a quantidade de DNA fetal é atualmente determinada por quantificação de sequências específicas do cromossomo Y, abordagens alternativas, tais como a medição de DNA isento de células totais ou o uso de marcadores epigenéticos fetais independente do gênero, tal como metilação do DNA, oferecem uma alternativa. RNA isento de células de origem placentária é um outro biomarcador alternativo que pode ser usado para o rastreio e o diagnóstico de pré-eclâmpsia na prática clínica. RNA fetal está associada com partículas placentárias subcelulares que o protegem da degradação. Os níveis de RNA fetal, por vezes, são dez vezes maiores em mulheres grávidas com pré- eclâmpsia em comparação aos controles, e, portanto, é um biomarcador alternativo que pode ser usado para o rastreio e o diagnóstico de pré-eclâmpsia na prática clínica.[462] Pre-eclampsia is a leading cause of neonatal/maternal and fetal mortality and morbidity worldwide. Circulating cell-free nucleic acids in plasma and serum are new biomarkers with promising clinical applications in different medical areas, including prenatal diagnosis. Quantitative changes of cell-free (cff)DNA in maternal plasma as an indicator for impending pre-eclampsia have been reported in different studies, eg using quantitative real-time PCR for male-specific SRY or local DYS 14 . In cases of early onset preeclampsia, elevated levels may be seen in the first trimester. Increased levels of cffDNA before the onset of symptoms may be due to hypoxia/reoxygenation within the intervillous space leading to tissue oxidative stress and increased placental apoptosis and necrosis. In addition to evidence of increased excretion of cffDNA in the maternal circulation, there is also evidence of reduced renal clearance of cffDNA in pre-eclampsia. As the amount of fetal DNA is currently determined by quantification of specific Y-chromosome sequences, alternative approaches, such as measurement of whole cell-free DNA or the use of gender-independent fetal epigenetic markers, such as DNA methylation, offer an alternative. Cell-free RNA of placental origin is another alternative biomarker that can be used for screening and diagnosing pre-eclampsia in clinical practice. Fetal RNA is associated with subcellular placental particles that protect it from degradation. Fetal RNA levels are sometimes ten times higher in pregnant women with preeclampsia compared to controls, and therefore it is an alternative biomarker that can be used for screening and diagnosing preeclampsia in clinical practice. .

Patógenospathogens

[463]Em algumas modalidades, a presença ou ausência de uma condição patogênica é determinada através de um método ou aparelho aqui descrito. Uma condição patogênica pode ser causada por uma infecção de um hospedeiro por um agente patogênico, incluindo, mas não se limitando a, uma bactéria, vírus ou fungo. Já que patógenos possuem tipicamente ácido nucleico (por exemplo, DNA genômico, RNA genômico, mRNA) que pode distinguir-se do ácido nucleico do hospedeiro, métodos, aparelhos e máquinas fornecidos aqui podem ser usados para determinar a presença ou ausência de um patógeno. Frequentemente, patógenos possuem ácido nucleico com características únicas de um patógeno em particular, tais como, por exemplo, estado epigenético e/ou uma ou mais variações na sequência, duplicações e/ou deleções. Desse modo, os métodos aqui fornecidos podem ser usados para identificar um patógeno particular ou variante de patógeno (por exemplo, cepa).[463]In some embodiments, the presence or absence of a pathogenic condition is determined using a method or apparatus described herein. A pathogenic condition can be caused by an infection of a host by a pathogenic agent, including, but not limited to, a bacterium, virus, or fungus. Since pathogens typically have nucleic acid (eg, genomic DNA, genomic RNA, mRNA) that can be distinguished from host nucleic acid, methods, apparatus, and machines provided herein can be used to determine the presence or absence of a pathogen. Often, pathogens possess nucleic acid with characteristics unique to a particular pathogen, such as, for example, epigenetic status and/or one or more sequence variations, duplications and/or deletions. As such, the methods provided here can be used to identify a particular pathogen or pathogen variant (eg, strain).

CânceresCancers

[464]Em algumas modalidades, a presença ou ausência de uma desordem de proliferação celular (por exemplo, um câncer) é determinada usando um método, máquina ou aparelho aqui descritos. Por exemplo, os níveis de ácido nucleico isento de células no soro podem ser elevados em pacientes com vários tipos de câncer em comparação com pacientes saudáveis. Os pacientes com doenças metastáticas, por exemplo, podem ter, por vezes, níveis séricos de DNA de aproximadamente duas vezes tão elevados quanto os não- metastáticos. Os pacientes com doenças metastáticas também podem ser identificados por meio de marcadores específicos de câncer e/ou certos polimorfismos de um único nucleotídeo ou repetições em tandem curtas, por exemplo. Exemplos não- limitativos de tipos de câncer que podem ser correlacionados positivamente com níveis elevados de DNA circulante incluem câncer de mama, câncer colorretal, câncer gastrointestinal, câncer hepatocelular, câncer de pulmão, melanoma, linfoma de não-Hodgkin, leucemia, mieloma múltiplo, câncer de bexiga, hepatoma, câncer do colo uterino, câncer de esôfago, câncer de pâncreas e câncer de próstata. Vários cânceres podem possuir, e, por vezes, podem liberar para a corrente sanguínea, ácidos nucleicos com as características que se distinguem entre si a partir de ácidos nucleicos de células saudáveis não cancerosas, tais como, por exemplo, estado epigenético e/ou variações, duplicações e/ou deleções de sequência. Tais características podem, por exemplo, ser específicas para um tipo particular de câncer. Desse modo, é ainda contemplado que o método aqui fornecido pode ser usado para identificar um tipo particular de câncer.[464]In some embodiments, the presence or absence of a cell proliferation disorder (eg, a cancer) is determined using a method, machine, or apparatus described herein. For example, serum cell-free nucleic acid levels may be elevated in patients with various types of cancer compared to healthy patients. Patients with metastatic disease, for example, can sometimes have serum DNA levels approximately twice as high as non-metastatic patients. Patients with metastatic disease can also be identified using cancer-specific markers and/or certain single nucleotide polymorphisms or short tandem repeats, for example. Non-limiting examples of cancer types that may be positively correlated with elevated levels of circulating DNA include breast cancer, colorectal cancer, gastrointestinal cancer, hepatocellular cancer, lung cancer, melanoma, non-Hodgkin's lymphoma, leukemia, multiple myeloma, bladder cancer, hepatoma, cervical cancer, esophageal cancer, pancreatic cancer and prostate cancer. Various cancers may possess, and sometimes may release into the bloodstream, nucleic acids with characteristics that distinguish them from the nucleic acids of healthy, non-cancerous cells, such as, for example, epigenetic status and/or variations , sequence duplications and/or deletions. Such features may, for example, be specific to a particular type of cancer. Thus, it is further contemplated that the method provided herein can be used to identify a particular type of cancer.

[465]O software pode ser usado para realizar uma ou mais etapas dos processos aqui descritos, incluindo mas não se limitando a; contar, processar dados, gerando um resultado, e/ou fornecendo uma ou mais recomendações com base em resultados gerados, como descrito em mais detalhe adiante.[465]The software may be used to perform one or more steps of the processes described herein, including but not limited to; counting, processing data, generating a result, and/or providing one or more recommendations based on generated results, as described in more detail below.

Máquinas, Software e InterfacesMachines, Software and Interfaces

[466]Certos processos e métodos aqui descritos (por exemplo, quantificação, mapeamento, normalização, definição da faixa, ajuste, categorização, contagem e/ou determinação de fragmentos (reads) de sequências, contagens, os níveis (por exemplo, níveis) e/ou perfis) frequentemente não podem ser realizados sem um computador, microprocessador, software, módulo ou outra máquina. Métodos aqui descritos são tipicamente métodos implementados por computador, e uma ou mais porções de um método, por vezes, são realizadas por um ou mais processadores (por exemplo, os microprocessadores), computadores ou máquinas de microprocessador controlado. As modalidades relacionadas com os métodos descritos nesse documento são geralmente aplicáveis aos mesmos ou processos relacionados implementados por instruções em sistemas, máquinas, e produtos de programa de computador aqui descritos. As modalidades relacionadas com os métodos descritos nesse documento podem ser geralmente aplicáveis às mesmas ou processos relacionados implementados por um meio de armazenamento legível por computador não-transitório, com um programa executável nele armazenado, onde o programa instrui um microprocessador a executar o método, ou uma parte do mesmo. Em algumas modalidades, processos e métodos aqui descritos (por exemplo, quantificação, contagem e/ou determinação de fragmentos (reads) de sequências, contagens, níveis e/ou perfis) são realizados por métodos automatizados. Em algumas modalidades uma ou mais etapas e um método aqui descrito são realizados por um microprocessador e/ou computador, e/ou realizados em conjunto com a memória. Em algumas modalidades, um método automatizado é incorporado em software, módulos, microprocessadores, periféricos e/ou uma máquina que compreende semelhante, que determina fragmentos (reads) de sequências, contagens, mapeamento, marcadores de sequência mapeadas, níveis, perfis, normalizações, comparações, definição de faixa, categorização, ajustes, plotagem, resultados, transformações e identificações. Como utilizado aqui, software refere-se a instruções de programa legível por computador, que, quando executadas por um microprocessador, realizam operações de computador, como aqui descrito.[466]Certain processes and methods described herein (e.g., quantification, mapping, normalization, sizing, tuning, categorization, counting and/or determination of sequence reads, counts, levels (e.g., levels) and/or profiles) often cannot be performed without a computer, microprocessor, software, module, or other machine. Methods described herein are typically computer-implemented methods, and one or more portions of a method are sometimes performed by one or more processors (e.g., microprocessors), computers, or microprocessor controlled machines. Embodiments relating to methods described herein are generally applicable to the same or related processes implemented by instructions in systems, machines, and computer program products described herein. Embodiments related to the methods described in this document may be generally applicable to the same or related processes implemented by a non-transient computer-readable storage medium, with an executable program stored thereon, where the program instructs a microprocessor to execute the method, or a part of it. In some embodiments, processes and methods described herein (e.g., quantitation, counting, and/or sequence reads, counts, levels, and/or profiling) are performed by automated methods. In some embodiments one or more steps and a method described herein are performed by a microprocessor and/or computer, and/or performed in conjunction with memory. In some embodiments, an automated method is incorporated into software, modules, microprocessors, peripherals, and/or a similar understanding machine that determines sequence reads, counts, mapping, mapped sequence markers, levels, profiles, normalizations, comparisons, range definition, categorization, adjustments, plotting, results, transformations and identifications. As used herein, software refers to computer-readable program instructions, which, when executed by a microprocessor, perform computer operations as described herein.

[467]Fragmentos (reads) de sequências, contagens, níveis e perfis obtidos a partir de um sujeito de teste (por exemplo, um paciente, uma mulher grávida) e/ou sujeito de referência podem ser ainda analisados e processados para determinar a presença ou ausência de uma variação genética. Fragmentos (reads) de sequências, contagens, níveis e perfis às vezes são referidos como "dados" ou "conjuntos de dados". Em algumas modalidades, os dados ou conjuntos de dados podem ser caracterizados por uma ou mais características ou variáveis (por exemplo, baseadas na sequência [por exemplo, teor de GC, sequência de nucleotídeo específica, o semelhante], função específica [por exemplo, genes expressos, genes do câncer, o semelhante], baseadas na localização [genoma específico, cromossomo específico, ou porção ou específicas da porção], o semelhante e suas combinações). Em certas modalidades, dados ou conjuntos de dados podem ser organizados em uma matriz que tem duas ou mais dimensões com base em uma ou mais características ou variáveis. Dados organizados em matrizes podem ser organizados usando quaisquer recursos ou variáveis adequadas. Um exemplo não-limitativo de dados em uma matriz que inclui dados é organizado por idade materna, ploidia materna e contribuição fetal. Em certas modalidades, os conjuntos de dados caracterizados por uma ou mais características ou variáveis por vezes são processadas após contagem.[467]Sequence reads, counts, levels, and profiles obtained from a test subject (e.g., a patient, a pregnant woman) and/or a reference subject can be further analyzed and processed to determine the presence or absence of a genetic variation. Fragments (reads) of sequences, counts, levels and profiles are sometimes referred to as "data" or "datasets". In some embodiments, the data or datasets may be characterized by one or more characteristics or variables (e.g., sequence-based [e.g., GC content, specific nucleotide sequence, the like], specific function [e.g., expressed genes, cancer genes, the like], based on location [specific genome, specific chromosome, or portion or portion-specific], the like, and combinations thereof). In certain embodiments, data or datasets can be organized into a matrix that has two or more dimensions based on one or more characteristics or variables. Data organized into matrices can be organized using any suitable resources or variables. A non-limiting example of data in a matrix that includes data is organized by maternal age, maternal ploidy, and fetal contribution. In certain embodiments, data sets characterized by one or more characteristics or variables are sometimes processed after counting.

[468]Máquinas, software e interfaces podem ser usados para realizar os métodos aqui descritos. Utilização de máquinas, software e interfaces, um usuário pode entrar, requisitar, consultar ou determinar opções para o uso de informações, programas ou processos particulares (por exemplo, mapeamento de fragmentos (reads) de sequências, processamento de dados mapeados e/ou fornecimento de um resultado), que podem envolver a execução de algoritmos estatísticos de análise, algoritmos de significância estatística, algoritmos estatísticos, etapas interativas, algoritmos de validação e representações gráficas, por exemplo. Em algumas modalidades, um conjunto de dados pode ser inserido por um usuário como informações de entrada, um usuário pode baixar um ou mais conjuntos de dados por um meio de hardware adequado (por exemplo, unidade flash), e/ou um usuário pode enviar um conjunto de dados de um sistema para outro para processamento subsequente e/ou fornecimento de um resultado (por exemplo, enviar dados legíveis de sequência de um sequenciador para um sistema de computador para mapeamento da fragmento de sequência, enviar dados de sequência mapeadas para um sistema de computador para o processamento e fornecimento de um resultado e/ou relatório).[468]Machines, software, and interfaces can be used to perform the methods described here. Using machines, software, and interfaces, a user can enter, request, query, or determine options for using particular information, programs, or processes (e.g., mapping sequence reads, processing mapped data, and/or providing of a result), which may involve the execution of statistical analysis algorithms, statistical significance algorithms, statistical algorithms, interactive steps, validation algorithms and graphical representations, for example. In some embodiments, a set of data may be entered by a user as input information, a user may download one or more sets of data via suitable hardware means (e.g., flash drive), and/or a user may submit a set of data from one system to another for subsequent processing and/or providing a result (e.g., sending readable sequence data from a sequencer to a computer system for sequence fragment mapping, sending mapped sequence data to a computer system for processing and providing a result and/or report).

[469]Um sistema compreende, tipicamente, uma ou mais máquinas. Cada máquina compreende um ou mais de memória, um ou mais microprocessadores, e instruções. No caso de um sistema inclui duas ou mais máquinas, algumas ou todas as máquinas podem estar localizadas no mesmo local, algumas ou todas as máquinas podem estar localizadas em diferentes locais, todas as máquinas podem estar localizadas em uma local e/ou todas as máquinas podem estar localizadas em locais diferentes. Onde um sistema inclui duas ou mais máquinas, algumas ou todas as máquinas podem estar localizadas no mesmo local como um usuário, algumas ou todas as máquinas podem estar localizadas em um local diferente do que um usuário, todas as máquinas podem estar localizadas no mesmo local que o usuário, e/ou a totalidade da máquina pode estar localizada em uma ou em mais localizações diferentes do que o usuário.[469]A system typically comprises one or more machines. Each machine comprises one or more memory, one or more microprocessors, and instructions. In case a system includes two or more machines, some or all the machines can be located in the same place, some or all the machines can be located in different places, all the machines can be located in one place and/or all the machines may be located in different places. Where a system includes two or more machines, some or all of the machines may be located at the same location as a user, some or all of the machines may be located at a different location than a user, all of the machines may be located at the same location that the user, and/or the entire machine may be located in one or more different locations than the user.

[470]Um sistema compreende, por vezes, uma máquina de computação e um aparelho ou máquina de sequenciamento, em que o aparelho ou máquina de sequenciamento é configurado para receber o ácido nucleico físico e gerar fragmentos (reads) de sequências, e o aparelho de computação é configurado para processar os fragmentos (reads) do aparelho ou máquina de sequenciamento. A máquina de computação, por vezes, é configurada para determinar a presença ou ausência de uma variação genética (por exemplo, variação do número de cópia; aneuploidia do cromossomo fetal) dos fragmentos (reads) de sequências.[470] A system sometimes comprises a computing machine and a sequencing apparatus or machine, wherein the sequencing apparatus or machine is configured to receive physical nucleic acid and generate sequence reads, and the apparatus Compute is configured to process the fragments (reads) from the sequencing apparatus or machine. The computing machine is sometimes configured to determine the presence or absence of genetic variation (eg, copy number variation; fetal chromosome aneuploidy) from sequence reads.

[471]Um usuário pode, por exemplo, consultar um software que, em seguida, pode adquirir um conjunto de dados via acesso à internet, e em certas modalidades, um microprocessador programável pode ser solicitado para adquirir um conjunto de dados adequado com base em parâmetros fornecidos. Um microprocessador programável também pode solicitar um usuário a selecionar uma ou mais opções de dados selecionados pelo microprocessador com base em parâmetros dados. Um microprocessador programável pode solicitar um usuário a selecionar uma ou mais opções de dados selecionados pelo microprocessador com base em informações encontradas através da internet, outra informação interna ou externa, ou o semelhante. As opções podem ser escolhidas selecionando uma ou mais seleções de característica de dados, um ou mais algoritmos estatísticos, um ou mais algoritmos de análise estatística, um ou mais algoritmos de significância estatística, etapas interativas, um ou mais algoritmos de validação, e uma ou mais representações gráficas de métodos, máquinas, aparelhos, programas de computador ou um meio de armazenamento legível por computador não-transitório com um programa executável armazenado nele.[471]A user may, for example, consult software which then may acquire a dataset via internet access, and in certain embodiments, a programmable microprocessor may be required to acquire a suitable dataset based on given parameters. A programmable microprocessor may also prompt a user to select one or more data options selected by the microprocessor based on given parameters. A programmable microprocessor may prompt a user to select one or more data options selected by the microprocessor based on information found over the internet, other internal or external information, or the like. Options can be chosen by selecting one or more data characteristic selections, one or more statistical algorithms, one or more statistical analysis algorithms, one or more statistical significance algorithms, interactive steps, one or more validation algorithms, and one or more plus graphical representations of methods, machines, apparatus, computer programs, or a non-transient computer-readable storage medium with an executable program stored thereon.

[472]Sistemas abordados aqui podem incluir componentes gerais de sistemas de computador, tais como, por exemplo, servidores de rede, sistemas de laptop, sistemas de desktop, sistemas portáteis, assistentes pessoais digitais, quiosques de computação e semelhante. Um sistema de computador pode compreender um ou mais meios de entrada, como um teclado, tela sensível ao toque, mouse, reconhecimento de voz ou outros meios para permitir que o usuário insira dados no sistema. Um sistema pode compreender ainda uma ou mais saídas, incluindo, mas não limitado a, uma tela de visualização (por exemplo, CRT ou LCD), alto-falante, máquina de fax, impressora (por exemplo, impressora a laser, jato de tinta, impacto, preto e branco ou a cores), ou outra saída útil para fornecer saída de informação visual, auditiva e/ou sob forma impressa (por exemplo, resultado e/ou relatório).[472]Systems discussed here may include general components of computer systems, such as, for example, network servers, laptop systems, desktop systems, handheld systems, personal digital assistants, computing kiosks, and the like. A computer system may comprise one or more input means, such as a keyboard, touch screen, mouse, speech recognition, or other means to allow the user to enter data into the system. A system may further comprise one or more outputs including, but not limited to, a display screen (e.g. CRT or LCD), speaker, fax machine, printer (e.g. laser printer, inkjet , impact, black and white or color), or other useful output to provide visual, auditory and/or printed information output (e.g. result and/or report).

[473]Em um sistema, meios de entrada e saída podem ser ligados a uma unidade de processamento central, que pode compreender entre outros componentes, um microprocessador para executar instruções de programa e memória para armazenar o código de programa e dados. Em algumas modalidades, os processos podem ser implementados como um sistema de um usuário localizado em um sítio geográfico. Em certas modalidades, os processos podem ser implementados como um sistema de multiusuários. No caso da implementação de um multiusuários, várias unidades de processamento central podem ser conectadas por meio de uma rede. A rede pode ser local, abrangendo um único departamento em uma porção de um edifício, um prédio inteiro, abranger vários edifícios, abranger uma região, abranger todo um país ou ser mundial. A rede pode ser privada, sendo possuída e controlada por um fornecedor, ou ela pode ser implementada como um serviço baseado na internet onde o usuário acessa uma página da web para entrar e recuperar informações. Desse modo, em certas modalidades, um sistema inclui uma ou mais máquinas, que podem ser locais ou remotas em relação a um usuário. Mais do que uma máquina em um local ou vários locais podem ser acessadas por um usuário, e os dados podem ser mapeados e/ou processados em série e/ou em paralelo. Desse modo, uma configuração e controle adequados podem ser usados para o mapeamento e/ou processamento de dados usando várias máquinas, tal como na rede local, rede remota e/ou plataformas de computação em "nuvem".[473]In a system, input and output means may be connected to a central processing unit, which may comprise, among other components, a microprocessor for executing program instructions and memory for storing program code and data. In some embodiments, the processes may be implemented as a one-user system located in a geographic location. In certain embodiments, the processes may be implemented as a multi-user system. In the case of a multiuser implementation, several central processing units can be connected through a network. The network can be local, spanning a single department in a portion of a building, an entire building, spanning multiple buildings, spanning a region, spanning an entire country, or worldwide. The network can be private, being owned and controlled by a vendor, or it can be implemented as an internet-based service where the user accesses a web page to log in and retrieve information. Thus, in certain embodiments, a system includes one or more machines, which may be local or remote from a user. More than one machine at a site or multiple sites can be accessed by a user, and data can be mapped and/or processed serially and/or in parallel. In this way, proper setup and control can be used for data mapping and/or processing using multiple machines, such as on local area network, wide area network and/or "cloud" computing platforms.

[474]Um sistema pode incluir uma interface de comunicações em algumas modalidades. Uma interface de comunicação permite a transferência de software e dados entre um sistema de computador e um ou mais dispositivos externos. Exemplos não-limitativas de interfaces de comunicações incluem um modem, uma interface de rede (tal como um cartão Ethernet), uma porta de comunicação, um cartão PCMCIA, e semelhante. Software e dados transferidos através de uma interface de comunicações estão geralmente sob a forma de sinais, que podem ser eletrônicos, eletromagnéticos, óticos e/ou outros sinais que podem ser recebidos por uma interface de comunicações. Sinais frequentemente são fornecidos a uma interface de comunicações através de um canal. Um canal de frequência transporta sinais e pode ser implementado usando o fio ou cabo, fibra ótica, uma linha telefônica, um link de telefone celular, um link de RF e/ou outros canais de comunicação. Desse modo, em um exemplo, uma interface de comunicações pode ser usada para receber a informação do sinal que pode ser detectada por um módulo de detecção de sinal.[474]A system may include a communications interface in some embodiments. A communication interface allows the transfer of software and data between a computer system and one or more external devices. Non-limiting examples of communications interfaces include a modem, a network interface (such as an Ethernet card), a communications port, a PCMCIA card, and the like. Software and data transferred over a communications interface are generally in the form of signals, which may be electronic, electromagnetic, optical and/or other signals that can be received by a communications interface. Signals are often provided to a communications interface over a channel. A frequency channel carries signals and can be implemented using wire or cable, fiber optics, a telephone line, a cell phone link, an RF link, and/or other communication channels. Thus, in one example, a communications interface can be used to receive signal information that can be detected by a signal detection module.

[475]Os dados podem ser introduzidos por um dispositivo e/ou método adequado, incluindo, mas não limitado a, dispositivos de entrada manuais ou dispositivos de entrada de dados diretos (DDEs). Exemplos não-limitativos de dispositivos manuais incluem teclados, teclados conceito, telas de toque sensível, canetas de luz, mouse, tracker balls, joysticks, tablets gráficos, scanners, câmeras digitais, digitalizadores de vídeo e dispositivos de reconhecimento de voz. Exemplos não-limitativos de DDes incluem leitores de código de barra, códigos com tira magnética, smart cards, reconhecimento de caracteres de tinta magnética, reconhecimento de caráter ótico, reconhecimento de marca ótica e documentos de reviravolta.[475]Data may be input by a suitable device and/or method, including, but not limited to, manual input devices or direct data input devices (DDEs). Non-limiting examples of handheld devices include keyboards, concept keyboards, touchscreens, light pens, mice, tracker balls, joysticks, graphics tablets, scanners, digital cameras, video digitizers and speech recognition devices. Non-limiting examples of DDes include bar code readers, magnetic stripe codes, smart cards, magnetic ink character recognition, optical character recognition, optical mark recognition, and overturn documents.

[476]Em algumas modalidades, a saída de um aparelho de sequenciamento ou máquina pode servir como dados que podem ser introduzidos através de um dispositivo de entrada. Em certas modalidades, os fragmentos (reads) de sequências mapeados poderão servir como dados que podem ser introduzidos através de um dispositivo de entrada. Em certas modalidades, o tamanho do fragmento de ácido nucleico (por exemplo, comprimento) pode servir como dados que podem ser introduzidos através de um dispositivo de entrada. Em certas modalidades, a saída de um processo de captura de ácido nucleico (por exemplo, dados de origem da região genômica) pode servir como dados que podem ser introduzidos através de um dispositivo de entrada. Em certas modalidades, uma combinação do tamanho do fragmento de ácido nucleico (por exemplo, comprimento) e saída de um processo de captura de ácido nucleico (por exemplo, dados de origem da região genômica) podem servir como dados que podem ser introduzidos através de um dispositivo de entrada. Em certas modalidades, os dados simulados são gerados por um processo em silico e os dados simulados servem como dados que podem ser introduzidos através de um dispositivo de entrada. O termo "em silico" refere-se à pesquisa e experimentos realizados usando um computador. Processos em silico incluem, mas não estão limitados a, mapeamento de fragmentos (reads) de sequências e processamento de fragmentos (reads) de sequências mapeadas de acordo com os processos aqui descritos.[476]In some embodiments, the output of a sequencing apparatus or machine can serve as data that can be input through an input device. In certain embodiments, the mapped sequence reads may serve as inputable data through an input device. In certain embodiments, the size of the nucleic acid fragment (e.g., length) can serve as data that can be input through an input device. In certain embodiments, the output of a nucleic acid capture process (e.g., genomic region source data) can serve as data that can be input through an input device. In certain embodiments, a combination of nucleic acid fragment size (e.g., length) and output from a nucleic acid capture process (e.g., genomic region origin data) can serve as data that can be introduced via an input device. In certain embodiments, the simulated data is generated by a silicon process and the simulated data serves as inputtable data through an input device. The term "in silico" refers to research and experiments performed using a computer. Silicon processes include, but are not limited to, mapping sequence reads and processing mapped sequence reads according to the processes described herein.

[477]Um sistema pode incluir software útil para a realização de um processo aqui descrito, e software pode incluir um ou mais módulos para a realização de tais processos (por exemplo, módulo de sequenciamento, módulo de processamento lógico, módulo de organização de exibição de dados). O termo "software" refere-se a instruções de programa legível por computador que, quando executadas por um computador, executam operações de computador. Instruções executáveis por um ou mais microprocessadores, por vezes, são fornecidas como código executável que, quando executado, pode fazer com que um ou mais microprocessadores implementem um método aqui descrito. Um módulo aqui descrito pode existir como software, e instruções (por exemplo, processos, rotinas, sub-rotinas) incorporadas no software podem ser implementadas ou executadas por um microprocessador. Por exemplo, um módulo (por exemplo, um módulo de software) pode ser uma parte de um programa que executa um processo ou tarefa particular. O termo "módulo" refere-se a uma unidade funcional de autocontida que pode ser usada em um sistema de software ou máquina maior. Um módulo pode compreender um conjunto de instruções para a realização de uma função do módulo. Um módulo pode transformar os dados e/ou informações. Os dados e/ou informações podem estar em uma forma adequada. Por exemplo, os dados e/ou informações podem ser digitais ou analógicas. Em certas modalidades, dados e/ou informações, por vezes, podem ser, pacotes, bytes, caracteres ou bits. Em algumas modalidades, dados e/ou informações podem ser quaisquer dados ou informações reunidas, juntadas ou usáveis. Exemplos não-limitativos de dados e/ou informações incluem um meio adequado, imagens, vídeo, som (por exemplo, frequências, audíveis ou não audíveis), números, constantes, um valor, objetos, tempo, funções, instruções, mapas, referências, sequências, fragmentos (reads), fragmentos (reads) mapeados, níveis, faixas, limites, sinais, exposições, representações ou transformações dos mesmos. Um módulo pode aceitar ou receber dados e/ou informações, transformar os dados e/ou informações em uma segunda forma, e fornecer ou transferir a segunda forma para uma máquina, periférico, componente ou outro módulo. Um módulo pode executar uma ou mais das seguintes funções não-limitantes: mapeamento de fragmentos (reads) de sequências de mapeamento, fornecendo de contagens, reunião de porções, fornecimento ou determinação de um nível, fornecimento de um perfil de contagem, normalização (por exemplo, normalização de fragmentos (reads), normalização de contagens, e semelhante), fornecimento de um perfil de contagem ou níveis de contagens normalizadas, comparação de dois ou mais níveis, fornecimento de valores de incerteza, fornecimento ou determinação dos níveis esperados e faixas esperadas (por exemplo, faixas de nível esperado, faixas de limite e os níveis de limite), fornecimento de ajustes de níveis (por exemplo, ajuste de um primeiro nível, ajuste de um segundo nível, ajuste de um perfil de um cromossomo ou seu segmento, e/ou preenchimento), fornecimento de identificação (por exemplo, identificação de uma variação do número de cópias, variação genética ou aneuploidia), categorização, plotagem, e/ou determinação de um resultado, por exemplo. Um microprocessador pode, em certas modalidades, ser realizado as instruções em um módulo. Em algumas modalidades, um ou mais microprocessadores são obrigados a cumprir as instruções em um módulo ou grupo de módulos. Um módulo pode fornecer dados e/ou informações para outro módulo, máquina ou fonte e pode receber dados e/ou informações de outro módulo, máquina ou fonte.[477] A system may include software useful for performing a process described herein, and software may include one or more modules for performing such processes (e.g., sequencing module, logic processing module, display organization module of data). The term "software" refers to computer-readable program instructions that, when executed by a computer, perform computer operations. Instructions executable by one or more microprocessors are sometimes provided as executable code that, when executed, can cause one or more microprocessors to implement a method described herein. A module described herein may exist as software, and instructions (eg, processes, routines, subroutines) embodied in the software may be implemented or executed by a microprocessor. For example, a module (for example, a software module) can be a part of a program that performs a particular process or task. The term "module" refers to a self-contained functional unit that can be used in a larger machine or software system. A module may comprise a set of instructions for performing a function of the module. A module can transform data and/or information. The data and/or information may be in a suitable form. For example, data and/or information can be digital or analogue. In certain embodiments, data and/or information can sometimes be packets, bytes, characters or bits. In some embodiments, data and/or information may be any data or information that is gathered, joined or usable. Non-limiting examples of data and/or information include a suitable medium, images, video, sound (e.g. frequencies, audible or non-audible), numbers, constants, a value, objects, time, functions, instructions, maps, references , sequences, fragments (reads), mapped fragments (reads), levels, tracks, boundaries, signs, exposures, representations or transformations thereof. A module can accept or receive data and/or information, transform the data and/or information into a second form, and provide or transfer the second form to a machine, peripheral, component, or other module. A module may perform one or more of the following non-limiting functions: mapping fragments (reads) of mapping sequences, providing counts, assembling portions, providing or determining a level, providing a count profile, normalizing (for example, normalizing reads, normalizing counts, and the like), providing a profile of counts or levels of normalized counts, comparing two or more levels, providing uncertainty values, providing or determining expected levels and ranges expected ranges (e.g., expected level ranges, threshold ranges, and threshold levels), providing level adjustments (e.g., first level adjustment, second level adjustment, adjustment of a profile of a chromosome or its segment, and/or padding), providing identification (eg, identifying a copy number variation, genetic variation, or aneuploidy), categorization, plotting, and/or determining a result, for example. A microprocessor may, in certain embodiments, carry instructions in a module. In some embodiments, one or more microprocessors are required to carry out instructions in a module or group of modules. A module can provide data and/or information to another module, machine or source and can receive data and/or information from another module, machine or source.

[478]Um produto de programa de computador, por vezes, é incorporado em um meio legível por computador tangível, e, por vezes, é tangível incorporado em um meio legível por computador não-transitório. Um módulo, por vezes, é armazenado em um meio legível por computador (por exemplo, disco, rígido) ou na memória (por exemplo, memória de acesso aleatório). Um módulo e microprocessador capazes de executar as instruções de um módulo podem ser localizados em uma máquina ou de outra máquina. Um módulo e/ou o microprocessador que é capaz de implementar uma instrução para um módulo pode estar localizado no mesmo local que um usuário (por exemplo, rede local) ou em um local diferente de um usuário (por exemplo, rede remota, sistema de nuvem). Em modalidades em que um método é realizado em conjunto com dois ou mais módulos, os módulos podem estar localizados na mesma máquina, um ou mais módulos podem estar localizados em máquina diferente no mesmo local físico, e um ou mais módulos podem estar localizados em diferentes máquinas em locais físicos diferentes.[478] A computer program product is sometimes embodied in a tangible computer-readable medium, and sometimes it is tangible embodied in a non-transient computer-readable medium. A module is sometimes stored on a computer-readable medium (eg, disk, hard) or in memory (eg, random-access memory). A module and microprocessor capable of executing a module's instructions may be located in one machine or another machine. A module and/or the microprocessor that is capable of implementing an instruction for a module may be located in the same location as a user (e.g. local area network) or in a different location than a user (e.g. remote network, computer system). cloud). In embodiments where a method is performed in conjunction with two or more modules, the modules may be located on the same machine, one or more modules may be located on a different machine at the same physical location, and one or more modules may be located on different machines in different physical locations.

[479]Uma máquina, em algumas modalidades, compreende pelo menos um microprocessador para cumprir as instruções de um módulo. Contagens de fragmentos (reads) de sequências mapeados para porções de um genoma de referência, por vezes, são acessadas por um microprocessador que executa instruções configuradas para realizar um método aqui descrito. As contagens que são acessadas por um microprocessador podem estar dentro de uma memória de sistema, e as contagens podem ser acessadas e colocadas na memória do sistema depois de terem sido obtidas. Em algumas modalidades, uma máquina inclui um microprocessador (por exemplo, um ou mais microprocessadores) em que o microprocessador pode executar e/ou implementar uma ou mais instruções (por exemplo, processos, rotinas e/ou sub- rotinas) de um módulo. Em algumas modalidades, uma máquina inclui vários microprocessadores, tais como microprocessadores coordenados e trabalhando em paralelo. Em algumas modalidades, uma máquina opera com um ou mais microprocessadores externos (por exemplo, uma rede interna ou externa, servidor, sistema de armazenagem e/ou rede de armazenamento (por exemplo, uma nuvem)). Em algumas modalidades, uma máquina compreende um módulo. Em certas modalidades uma máquina compreende um ou mais módulos. Uma máquina que compreende um módulo de frequência pode receber e transferir um ou mais dos dados e/ou informações para e de outros módulos. Em certas modalidades, uma máquina compreende periféricos e/ou componentes. Em certas modalidades de uma máquina pode compreender um ou mais periféricos ou componentes que podem transferir dados e/ou informações para e de outros módulos, periféricos e/ou componentes. Em certas modalidades uma máquina interage com um periférico e/ou componente que fornece os dados e/ou informações. Em certas modalidades periféricos e componentes ajudam uma máquina na execução de uma função ou interagem diretamente com um módulo. Exemplos não- limitativos de periféricos e/ou componentes incluem um periférico de computador adequado, I/O ou método ou dispositivo de armazenamento, incluindo, mas não limitado a scanners, impressoras, monitores (por exemplo, monitores, LED, LCT ou CRTs), câmeras, microfones, pads (por exemplo, ipads, tablets), telas sensíveis ao toque, telefones inteligentes, telefones celulares, dispositivos I/O USB, dispositivos de armazenamento em massa USB, teclados, um mouse de computador, canetas digitais, modems, discos rígidos, jump unidades, flash unidades, um microprocessador, um servidor, COS, DVDs, placas gráficas, dispositivos I/O especializados (por exemplo, sequenciadores, fotocélulas, tubos multiplicadores de foto, leitores óticos, sensores, etc.), uma ou mais células de fluxo, componentes de manipulação de fluido, controladores de interface de rede, ROM, RAM, métodos e dispositivos de transferência sem fio (Bluetooth, Wi-Fi, e semelhante,), a world wide web (www), a internet, um computador e/ou outro módulo.[479]A machine, in some embodiments, comprises at least one microprocessor for carrying out the instructions of a module. Fragment counts (reads) of sequences mapped to portions of a reference genome are sometimes accessed by a microprocessor that executes configured instructions to perform a method described here. The counts that are accessed by a microprocessor can be within system memory, and the counts can be accessed and placed in system memory after they have been obtained. In some embodiments, a machine includes a microprocessor (e.g., one or more microprocessors) wherein the microprocessor can execute and/or implement one or more instructions (e.g., processes, routines and/or subroutines) of a module. In some embodiments, a machine includes multiple microprocessors, such as microprocessors coordinated and working in parallel. In some embodiments, a machine operates with one or more external microprocessors (e.g., an internal or external network, server, storage system, and/or storage network (e.g., a cloud)). In some embodiments, a machine comprises a module. In certain embodiments a machine comprises one or more modules. A machine comprising a frequency module can receive and transfer one or more of data and/or information to and from other modules. In certain embodiments, a machine comprises peripherals and/or components. In certain embodiments a machine may comprise one or more peripherals or components that can transfer data and/or information to and from other modules, peripherals and/or components. In certain embodiments a machine interacts with a peripheral and/or component that provides the data and/or information. In certain embodiments peripherals and components assist a machine in performing a function or interact directly with a module. Non-limiting examples of peripherals and/or components include a suitable computer peripheral, I/O or storage method or device, including but not limited to scanners, printers, monitors (e.g. monitors, LED, LCT or CRTs) , cameras, microphones, pads (e.g. ipads, tablets), touch screens, smart phones, cell phones, USB I/O devices, USB mass storage devices, keyboards, a computer mouse, digital pens, modems , hard disks, jump drives, flash drives, a microprocessor, a server, COS, DVDs, graphics cards, specialized I/O devices (e.g. sequencers, photocells, photo multiplier tubes, optical readers, sensors, etc.), one or more flow cells, fluid handling components, network interface controllers, ROM, RAM, wireless transfer methods and devices (Bluetooth, Wi-Fi, and the like,), the world wide web (www), the internet, a computer and/or another module.

[480]Software frequentemente é fornecido em um produto de programa contendo instruções do programa gravado em um meio legível por computador, incluindo, mas não limitado a, meios magnéticos, incluindo disquetes, discos rígidos, e fita magnética; e mídia ótica incluindo discos CD-ROM, discos DVD, discos magneto-óticos, flash unidades, RAM, discos flexíveis, semelhante, e outros tais meios em que as instruções do programa podem ser gravadas. Em aplicação on-line, um servidor e web site mantidos por uma organização podem ser configurados para fornecer downloads de software para usuários remotos, ou os usuários remotos podem acessar um sistema remoto mantido por uma organização para acessar remotamente o software. Software pode obter ou receber informações de entrada. Software pode incluir um módulo que especificamente obtém ou recebe dados (por exemplo, um módulo de recepção de dados que recebe dados legíveis de sequência e/ou dados legíveis mapeados) e pode incluir um módulo que processa especificamente os dados (por exemplo, um módulo de processamento que processa os dados recebidos (por exemplo, filtra, normaliza, fornece um resultado e/ou relatório). Os termos "obtenção" e "recebimento" de informações de entrada refere-se ao recebimento de dados (por exemplo, fragmentos (reads) de sequências, fragmentos (reads) mapeados) pela comunicação do computador significa de um local ou sítio remoto, a entrada de dados humanos, ou qualquer outro método de recebimento de dados. A informação de entrada pode ser gerada no mesmo local em que é recebida, ou pode ser gerada em um local diferente e transmitida para o local de recebimento. Em algumas modalidades, a informação de entrada é modificada antes de ser processada (por exemplo, colocada em um formato passível de processamento (por exemplo, tabulada)). Em algumas modalidades, são fornecidos produtos de programa de computador, tais como, por exemplo, um produto de programa de computador que compreende um meio utilizável por computador tendo um código de programa legível por computador nele incorporado, o código de programa de legível por computador adaptado para ser executado para implementar um método compreendendo: (a) obtenção de fragmentos (reads) de sequências de amostra de ácido nucleico amostra de um sujeito teste; (b) mapeamento dos fragmentos (reads) de sequências obtidos em (a) para um genoma conhecido, cujo genoma conhecido foi dividido em porções; (c) contagem dos fragmentos (reads) de sequências mapeados dentro das porções; (d) geração de um perfil de contagem normalizada de amostra através da normalização das contagens para as porções obtidas em (c); e (e) determinação da presença ou ausência de uma variação genética do perfil de contagem normalizada da em (d).[480]Software is often provided in a program product containing program instructions recorded on a computer-readable medium, including, but not limited to, magnetic media, including floppy disks, hard disks, and magnetic tape; and optical media including CD-ROM disks, DVD disks, magneto-optical disks, flash drives, RAM, floppy disks, the like, and other such media on which program instructions may be recorded. In an online application, a server and web site maintained by an organization can be configured to provide software downloads to remote users, or remote users can access a remote system maintained by an organization to remotely access software. Software can get or receive input information. Software may include a module that specifically obtains or receives data (e.g., a data-receiving module that receives readable sequence data and/or readable mapped data) and may include a module that specifically processes the data (e.g., a module process that processes incoming data (e.g., filters, normalizes, provides a result, and/or report). The terms "getting" and "receiving" input information refers to receiving data (e.g., fragments ( reads) of sequences, mapped fragments (reads) by computer communication means from a local or remote site, human input, or any other method of receiving data. Input information can be generated at the same location as is received, or it may be generated at a different location and transmitted to the receiving location. In some embodiments, the input information is modified before it is processed (e.g., put into a processable format (e.g., tabulated) ). In some embodiments, computer program products are provided, such as, for example, a computer program product comprising a computer usable medium having computer readable program code incorporated therein, the computer readable program code adapted to be performed to implement a method comprising: (a) obtaining fragments (reads) of sample nucleic acid sequences from a test subject sample; (b) mapping the fragments (reads) of sequences obtained in (a) to a known genome, whose known genome was divided into portions; (c) count of fragments (reads) of sequences mapped within the portions; (d) generating a normalized sample count profile by normalizing the counts to the portions obtained in (c); and (e) determining the presence or absence of a genetic variation of the normalized count profile in (d).

[481]O software pode incluir um ou mais algoritmos em certas modalidades. Um algoritmo pode ser usado para o processamento de dados e/ou fornecimento de um resultado ou relatório de acordo com uma sequência finita de instruções. Um algoritmo frequentemente é uma lista de instruções definidas para completar uma tarefa. A partir de um estado inicial, as instruções podem descrever um cálculo que prossegue através de uma série definida de estados sucessivos, eventualmente, que termina em um estado final definitivo. A transição de um estado para o outro não é necessariamente determinista (por exemplo, alguns algoritmos incorporam a aleatoriedade). Por meio de exemplo, e sem limitação, um algoritmo pode ser um algoritmo de busca, algoritmo de ordenação, algoritmo de ordenação, algoritmo numérico, algoritmo gráfico, algoritmo em string, algoritmo de modelagem, algoritmo geométrico computacional, algoritmo combinatório, algoritmo de aprendizado de máquina, algoritmo de criptografia, algoritmo de compressão de dados, algoritmo de parser e semelhante. Um algoritmo pode incluir um algoritmo ou dois ou mais algoritmos que trabalham em combinação. Um algoritmo pode ser de qualquer adequada de complexidade adequada e/ou complexidade parametrizada. Um algoritmo pode ser usado para o cálculo e/ou processamento de dados, e em algumas modalidades, pode ser usado em uma abordagem determinista ou probabilística/preditiva. Um algoritmo pode ser implementado em um ambiente de computação por utilização de uma linguagem de programação adequada, exemplos não-limitativos dos quais são C, C++, Java, Peri, Python, Fortran e semelhante. Em algumas modalidades, um algoritmo pode ser configurado ou modificado para incluir margem de erro, a análise estatística, a significância estatística, e/ou comparação a outras informações ou conjuntos de dados (por exemplo, aplicáveis quando se utiliza um algoritmo de rede neuronal ou de clustering).[481]The software may include one or more algorithms in certain embodiments. An algorithm can be used for processing data and/or providing a result or report according to a finite sequence of instructions. An algorithm is often a list of defined instructions for completing a task. Starting from an initial state, the instructions may describe a computation that proceeds through a defined series of successive states, eventually ending in a definite final state. The transition from one state to another is not necessarily deterministic (for example, some algorithms incorporate randomness). By way of example, and without limitation, an algorithm may be a search algorithm, sorting algorithm, sorting algorithm, numerical algorithm, graphing algorithm, string algorithm, modeling algorithm, computational geometric algorithm, combinatorial algorithm, learning algorithm machine code, encryption algorithm, data compression algorithm, parser algorithm, and the like. An algorithm can include one algorithm or two or more algorithms working in combination. An algorithm can be of any suitable complexity and/or parameterized complexity. An algorithm may be used for computation and/or data processing, and in some embodiments, may be used in a deterministic or probabilistic/predictive approach. An algorithm may be implemented in a computing environment by use of a suitable programming language, non-limiting examples of which are C, C++, Java, Peri, Python, Fortran and the like. In some embodiments, an algorithm can be configured or modified to include margin of error, statistical analysis, statistical significance, and/or comparison to other information or datasets (e.g., applicable when using a neural network algorithm or of clustering).

[482]Em certas modalidades, vários algoritmos podem ser implementados para uso em software. Estes algoritmos podem ser formados com os dados brutos em algumas modalidades. Para cada nova amostra de dados brutos, os algoritmos treinados podem produzir um conjunto representativo de dados ou resultados processados. Um conjunto de dados processados, por vezes, é de complexidade reduzida em comparação com o conjunto de dados parente que foi processado. Com base em um conjunto processado, o desempenho de um algoritmo treinado pode ser avaliado com base na sensibilidade e especificidade, em algumas modalidades. Um algoritmo com a maior sensibilidade e/ou especificidade pode ser identificado e utilizado, em certas modalidades.[482]In certain embodiments, various algorithms may be implemented for use in software. These algorithms can be formed with the raw data in some embodiments. For each new sample of raw data, the trained algorithms can produce a representative set of processed data or results. A processed dataset is sometimes of reduced complexity compared to the parent dataset that was processed. Based on a processed set, the performance of a trained algorithm can be evaluated based on sensitivity and specificity, in some modalities. An algorithm with the greatest sensitivity and/or specificity can be identified and used, in certain embodiments.

[483]Em certas modalidades, dados simulados (simulação) podem auxiliar processamento de dados, por exemplo, treinando um algoritmo ou testando um algoritmo. Em algumas modalidades, os dados simulados incluem várias amostragens hipotéticas de diferentes grupamentos de fragmentos (reads) de sequências. Dados simulados podem ser com base no que poderia ser esperado de uma população real ou podem ser enviesada para testar um algoritmo e/ou para atribuir uma classificação correta. Dados simulados é também referido aqui como dados "virtuais". As simulações podem ser realizadas por um programa de computador, em certas modalidades. Uma etapa possível para usar um conjunto de dados simulado é avaliar a confiança de resultados identificados, por exemplo, o quanto uma amostragem aleatória corresponde ou melhor representa os dados originais. Uma abordagem é calcular um valor de probabilidade (valor de p), que estima a probabilidade de uma amostra aleatória tendo melhor pontuação do que as amostras selecionadas. Em algumas modalidades, um modelo empírico pode ser avaliado, em que se assume que pelo menos uma amostra corresponde a uma amostra de referência (com ou sem variações resolvidas). Em algumas modalidades, outra distribuição, tal como uma distribuição de Poisson, por exemplo, pode ser usada para definir a distribuição de probabilidade.[483]In certain embodiments, simulated data (simulation) can aid data processing, for example, training an algorithm or testing an algorithm. In some embodiments, the simulated data includes several hypothetical samplings of different groups of fragments (reads) of sequences. Simulated data may be based on what would be expected from a real population or may be biased to test an algorithm and/or to assign a correct classification. Simulated data is also referred to here as "virtual" data. Simulations can be performed by a computer program, in certain ways. One possible step for using a simulated dataset is to assess the confidence of identified results, for example, how well a random sampling matches or better represents the original data. One approach is to calculate a probability value (p value), which estimates the probability of a random sample scoring better than selected samples. In some embodiments, an empirical model may be evaluated, where at least one sample is assumed to correspond to a reference sample (with or without resolved variances). In some embodiments, another distribution, such as a Poisson distribution, for example, can be used to define the probability distribution.

[484]Um sistema pode incluir um ou mais microprocessadores em certas modalidades. Um microprocessador pode ser conectado a um barramento de comunicação. Um sistema de computador pode incluir uma memória principal, frequentemente, a memória de acesso aleatório (RAM), e também pode incluir uma memória secundária. Memória em algumas modalidades compreende um meio de armazenamento legível por computador não- transitório. Memória secundária pode incluir, por exemplo, uma unidade do disco rígido e/ou uma unidade de armazenamento removível, representação de uma unidade de disquete, unidade de fita magnética, uma unidade de disco ótico, cartão de memória e semelhante. Uma unidade de armazenamento removível frequentemente lê e/ou grava em uma unidade de armazenamento removível. Exemplos não- limitativos de unidades de armazenamento removíveis inclui um disquete, uma fita magnética, um disco ótico, e semelhante, que podem ser lidas por e gravadas por, por exemplo, uma unidade de armazenamento removível. Uma unidade de armazenamento removível pode incluir um meio de armazenamento utilizável por computador tendo armazenado nele software e/ou dados de computador.[484]A system may include one or more microprocessors in certain embodiments. A microprocessor can be connected to a communication bus. A computer system can include main memory, often random access memory (RAM), and it can also include secondary memory. Memory in some embodiments comprises a non-transient computer readable storage medium. Secondary memory may include, for example, a hard disk drive and/or a removable storage unit, representation of a floppy disk drive, magnetic tape drive, optical disk drive, memory card, and the like. A removable storage drive often reads and/or writes to a removable storage drive. Non-limiting examples of removable storage units include a floppy disk, magnetic tape, optical disk, and the like, which can be read by and written to, for example, a removable storage unit. A removable storage unit may include a computer usable storage medium having computer software and/or data stored thereon.

[485]Um microprocessador pode executar software em um sistema. Em algumas modalidades, um microprocessador pode ser programado para executar automaticamente uma tarefa aqui descrita em que um usuário pode executar. Por conseguinte, um microprocessador, ou algoritmo conduzido por tal um microprocessador, pode exigir pouca ou nenhuma supervisão ou entrada de um usuário (por exemplo, o software pode ser programado para executar uma função automaticamente). Em algumas modalidades, a complexidade de um processo é tão grande que uma única pessoa ou grupo de pessoas não pode realizar o processo em um período de tempo curto o suficiente para a determinação da presença ou ausência de uma variação genética.[485]A microprocessor can run software on a system. In some embodiments, a microprocessor can be programmed to automatically perform a task described herein that a user can perform. Accordingly, a microprocessor, or algorithm driven by such a microprocessor, may require little or no supervision or input from a user (for example, software may be programmed to perform a function automatically). In some embodiments, the complexity of a process is so great that a single person or group of people cannot perform the process in a short enough period of time for the determination of the presence or absence of a genetic variation.

[486]Em algumas modalidades, a memória secundária pode incluir outros meios semelhantes para permitir que os programas de computador ou outras instruções possam ser carregados em um sistema de computador. Por exemplo, um sistema pode incluir uma unidade de armazenamento removível e um dispositivo de interface. Exemplos não-limitativos de tais sistemas incluem um cartucho de programa e interface de cartucho (tal como aquele encontrado em dispositivos de vídeo game), um chip de memória removível (tal como EPROM ou PROM) e soquete associado, e de outras unidades de armazenamento removíveis e interfaces que permitem que o software e os dados sejam transferidos da unidade de armazenamento removível para um sistema de computador.[486]In some embodiments, secondary memory may include other similar means for allowing computer programs or other instructions to be loaded into a computer system. For example, a system might include a removable storage unit and an interface device. Non-limiting examples of such systems include a program cartridge and cartridge interface (such as those found in video game devices), a removable memory chip (such as EPROM or PROM) and associated socket, and other storage units. removable storage devices and interfaces that allow software and data to be transferred from the removable storage unit to a computer system.

[487]Uma entidade pode gerar contagens de fragmentos (reads) de sequências, mapear os fragmentos (reads) de sequências em porções, contar os fragmentos (reads) mapeados, e utilizar os fragmentos (reads) mapeados contados em um método, sistema, máquina, aparelho ou o produto de programa de computador aqui descrito, em algumas modalidades. Contagens de fragmentos (reads) de sequências mapeados em porções, por vezes, são transferidas por uma entidade para uma segunda entidade para o uso pela segunda entidade de um método, sistema, aparelho ou um produto de programa de computador descrito aqui, em certas modalidades.[487]An entity may generate counts of reads of sequences, map the reads of sequences into chunks, count the mapped fragments (reads), and use the counted mapped fragments (reads) in a method, system, machine, apparatus, or computer program product described herein, in some embodiments. Fragment counts (reads) of sequences mapped to portions are sometimes transferred by one entity to a second entity for use by the second entity of a method, system, apparatus, or a computer program product described herein, in certain embodiments .

[488]Em algumas modalidades, uma entidade gera fragmentos (reads) de sequências e uma segunda entidade mapeia aqueles fragmentos (reads) de sequências em porções em um genoma de referência em algumas modalidades. A segunda entidade, por vezes, conta os fragmentos (reads) mapeados e utiliza os fragmentos (reads) mapeados contados em um método, sistema, máquina ou produto de programa de computador aqui descrito. Em certas modalidades a segunda entidade transfere os fragmentos (reads) mapeados em uma terceira entidade, e a terceira entidade conta os fragmentos (reads) mapeados e utiliza os fragmentos (reads) mapeads em um método, sistema, equipamento ou produto de programa de computador aqui descritas. Em certas modalidades a segunda entidade conta os fragmentos (reads) mapeados e transfere os fragmentos (reads) mapeados contados para uma terceira entidade, e a terceira entidade utiliza os fragmentos (reads) mapeados contados em um método, sistema, equipamento ou produto de programa de computador aqui descrito. Em modalidades envolvendo uma terceira entidade, a terceira entidade, por vezes, é a mesma que a primeira entidade. Isto é, a primeira entidade, por vezes, transfere fragmentos (reads) de sequências para uma segunda entidade, em que a segunda entidade pode mapear os fragmentos (reads) de sequências em porções em um genoma de referência e/ou contar fragmentos (reads) mapeados, e a segunda entidade pode transferir os fragmentos (reads) mapeados e/ou contados para uma terceira entidade. Uma terceira entidade, por vezes, pode utilizar os fragmentos (reads) mapeados e/ou contados em um método, sistema, equipamento ou produto de programa de computador aqui descrito, em que a terceira entidade, por vezes, é a mesma que a primeira entidade, e, por vezes, a terceira entidade é diferente da primeira ou segunda entidade.[488]In some embodiments, one entity generates sequence reads and a second entity maps those sequence reads into chunks into a reference genome in some embodiments. The second entity sometimes counts mapped reads and uses the counted mapped reads in a method, system, machine, or computer program product described herein. In certain embodiments the second entity transfers the mapped fragments (reads) in a third entity, and the third entity counts the mapped fragments (reads) and uses the mapped fragments (reads) in a method, system, equipment or computer program product described here. In certain embodiments, the second entity counts the mapped fragments (reads) and transfers the counted mapped fragments (reads) to a third entity, and the third entity uses the counted mapped fragments (reads) in a method, system, equipment or program product computer described here. In modalities involving a third entity, the third entity is sometimes the same as the first entity. That is, the first entity sometimes transfers fragments (reads) of sequences to a second entity, where the second entity can map the fragments (reads) of sequences into portions in a reference genome and/or count fragments (reads) ) mapped, and the second entity can transfer the mapped and/or counted fragments (reads) to a third entity. A third entity, sometimes, can use the fragments (reads) mapped and/or counted in a method, system, equipment or computer program product described herein, in which the third entity, sometimes, is the same as the first entity, and sometimes the third entity is different from the first or second entity.

[489]Em algumas modalidades, uma entidade obtém o sangue de uma mulher grávida, opcionalmente isola ácido nucleico do sangue (por exemplo, a partir do plasma ou soro), e transfere o sangue ou ácido nucleico para uma segunda entidade que gera fragmentos (reads) de sequências do ácido nucleico.[489]In some embodiments, one entity obtains blood from a pregnant woman, optionally isolates nucleic acid from the blood (e.g., from plasma or serum), and transfers the blood or nucleic acid to a second entity that generates fragments ( reads) of nucleic acid sequences.

[490]Figura 24 ilustra um exemplo não-limitativo de um ambiente de computação 510 no qual vários sistemas, métodos, algoritmos e estruturas de dados aqui descritos podem ser implementados. O ambiente de computação 510 é apenas um exemplo de um ambiente de computação adequado e não se destina a sugerir qualquer limitação quanto ao escopo de utilização ou funcionalidade dos sistemas, métodos e estruturas de dados aqui descritos. Nem ambiente de computação 510 deve ser interpretado como tendo qualquer dependência ou exigência relativa a qualquer um ou a combinação dos componentes ilustrados em ambiente de computação 510. Um subconjunto de sistemas, métodos e estruturas de dados mostrado na figura 24 pode ser utilizado em certas modalidades. Sistemas, métodos e estruturas de dados aqui descritos são operacionais com numerosos outros ambientes ou configurações de sistema de computação de propósito especial ou propósito geral. Exemplos de ambientes ou configurações de sistemas computacionais conhecidos, que podem ser adequados incluem, mas não estão limitados a computadores pessoais, computadores servidores, clientes finos, clientes grossos, dispositivos manuais ou de laptop, sistemas de multiprocessador, sistemas baseados em microprocessadores, set top boxes, aparelhos eletrônicos programáveis, PCs em rede, minicomputadores, computadores mainframe, ambientes de computação distribuídos que incluem qualquer dos sistemas ou dispositivos acima, e semelhante.[490] Figure 24 illustrates a non-limiting example of a computing environment 510 in which various systems, methods, algorithms, and data structures described herein may be implemented. Computing environment 510 is only one example of a suitable computing environment and is not intended to suggest any limitation on the scope of use or functionality of the systems, methods, and data structures described herein. Neither computing environment 510 should be construed as having any dependency or requirement on any one or combination of components illustrated in computing environment 510. A subset of systems, methods, and data structures shown in FIG. 24 may be utilized in certain embodiments. . Systems, methods, and data structures described herein are operative with numerous other special-purpose or general-purpose computing system environments or configurations. Examples of known computing system environments or configurations that may be suitable include, but are not limited to, personal computers, server computers, thin clients, thick clients, laptop or handheld devices, multiprocessor systems, microprocessor-based systems, set top boxes, programmable electronics, networked PCs, minicomputers, mainframe computers, distributed computing environments that include any of the above systems or devices, and the like.

[491]O ambiente operacional 510 da figura 24 inclui um dispositivo de computação de uso geral sob a forma de um computador 520, que inclui uma unidade de processamento 521, uma memória de sistema 522, e um barramento de sistema 523 operacionalmente acopla vários componentes do sistema incluindo a memória do sistema 522 à unidade de processamento 521. Pode haver somente uma ou pode haver mais do que uma unidade de processamento 521, de tal modo que o microprocessador de computador 520 inclui uma unidade de processamento central (CPU), ou uma pluralidade de unidades de processamento, normalmente referidas como um ambiente de processamento paralelo. O computador 520 pode ser um computador convencional, um computador distribuído, ou qualquer outro tipo de computador.[491] The operating environment 510 of Figure 24 includes a general purpose computing device in the form of a computer 520, which includes a processing unit 521, a system memory 522, and a system bus 523 operationally couple various components from system memory 522 to processing unit 521. There may be only one or there may be more than one processing unit 521, such that computer microprocessor 520 includes a central processing unit (CPU), or a plurality of processing units, commonly referred to as a parallel processing environment. Computer 520 can be a conventional computer, a distributed computer, or any other type of computer.

[492]O barramento do sistema 523 pode ser qualquer um de vários tipos de estruturas de barramento incluindo um barramento de memória ou um barramento de memória, um barramento periférico, e um barramento local usando qualquer uma de uma variedade de arquiteturas de barramento. A memória do sistema pode também ser referida como simplesmente a memória, e inclui memória só legível(ROM) 524 e memória de acesso aleatório (RAM). Um sistema básico de entrada/saída (BIOS) 526, contendo as rotinas básicas que ajudam a transferência de informação entre elementos dentro do computador 520, tal como durante a inicialização, é armazenado no ROM 524. O computador 520 pode ainda incluir uma interface da unidade de disco rígido 527 para leitura e gravação em um disco rígido, não mostrado, uma unidade de disco magnético 528 para leitura ou gravação em um disco magnético removível 529, e uma unidade de disco ótico 530 para ler ou gravar em um disco ótico removível 531, tal como um CD ROM ou outro meio ótico.[492]The system bus 523 can be any of several types of bus structures including a memory bus or a memory bus, a peripheral bus, and a local bus using any of a variety of bus architectures. System memory may also be referred to simply as memory, and includes read only memory (ROM) 524 and random access memory (RAM). A basic input/output system (BIOS) 526, containing the basic routines that help transfer information between elements within computer 520, such as during boot, is stored in ROM 524. Computer 520 may further include an interface for hard disk drive 527 for reading from and writing to a hard disk, not shown, a magnetic disk drive 528 for reading from or writing to a removable magnetic disk 529, and an optical disk drive 530 for reading from or writing to a removable optical disk 531, such as a CD-ROM or other optical medium.

[493]A unidade de disco rígido 527, unidade de disco magnético 528, e unidade de disco ótico 530 estão conectados ao barramento do sistema 523 por uma interface da unidade de disco rígido 532, uma interface da unidade de disco magnético 533, e uma interface da unidade de disco ótico 534, respectivamente. As unidades e os seus meios legíveis por computador associados fornecem armazenamento não volátil de instruções legíveis por computador, estruturas de dados, módulos de programa e outros dados para o computador 520. Qualquer tipo de meios legíveis por computador que pode armazenar dados que podem ser acessados por um computador, como os cassetes magnéticos, cartões de memória flash, discos de vídeo digital, cartuchos Bernoulli, memórias de acesso aleatório (RAM), memórias somente legível(ROMs), e semelhante, podem ser usados no ambiente operacional.[493] The hard disk drive 527, magnetic disk drive 528, and optical disk drive 530 are connected to the system bus 523 by a hard disk drive interface 532, a magnetic disk drive interface 533, and a optical disk drive interface 534, respectively. The drives and their associated computer-readable media provide non-volatile storage of computer-readable instructions, data structures, program modules, and other data for computer 520. Any type of computer-readable media that can store accessable data by a computer, such as magnetic cassettes, flash memory cards, digital video discs, Bernoulli cartridges, random access memories (RAM), read-only memories (ROMs), and the like, can be used in the operating environment.

[494]Um número de módulos de programa pode ser armazenado no disco rígido, disco magnético 529, disco ótico 531, ROM 524, ou RAM, incluindo um sistema operacional 535, um ou mais programas de aplicação 536, outros módulos de programa 537, e dados do programa 538. Um usuário pode introduzir comandos e informações para o computador pessoal 520 através de dispositivos de entrada, como um teclado 540 e um dispositivo apontador 542. Outros dispositivos de entrada (não mostrados) podem incluir um microfone, joystick, game pad, antena parabólica, scanner ou o semelhante. Estes e outros dispositivos de entrada são frequentemente conectados à unidade de processamento 521 através de uma interface de porta de série 546 que é acoplada ao barramento de sistema, mas podem ser conectados por outras interfaces, tais como uma porta paralela, porta de jogos ou um barramento serial universal (USB). Um monitor 547 ou outro tipo de dispositivo de visualização está também ligado ao barramento do sistema de 523 via uma interface, tal como um adaptador de vídeo 548. Em adição ao monitor, os computadores tipicamente incluem outros dispositivos de saída periféricos (não mostrados), tais como alto-falantes e impressoras.[494] A number of program modules may be stored on the hard disk, magnetic disk 529, optical disk 531, ROM 524, or RAM, including an operating system 535, one or more application programs 536, other program modules 537, and program data 538. A user may input commands and information to personal computer 520 through input devices, such as a keyboard 540 and pointing device 542. Other input devices (not shown) may include a microphone, joystick, game pad, satellite dish, scanner or the like. These and other input devices are often connected to processing unit 521 through a serial port interface 546 which is coupled to the system bus, but may be connected through other interfaces such as a parallel port, game port, or a universal serial bus (USB). A monitor 547 or other type of display device is also connected to the system bus of 523 via an interface, such as a video adapter 548. In addition to the monitor, computers typically include other peripheral output devices (not shown), such as speakers and printers.

[495]O computador 520 pode operar em um ambiente de rede usando conexões lógicas para um ou mais computadores remotos, tal como computador remoto 549. Estas conexões lógicas podem ser obtidas por um dispositivo de comunicação acoplado a ou uma parte do computador 520, ou em outras maneiras. O computador remoto 549 pode ser um outro computador, um servidor, um roteador, um PC de rede, um cliente, um dispositivo par ou outro nó de rede comum, e tipicamente inclui muitos ou todos os elementos descritos acima em relação ao computador 520, embora apenas um dispositivo de armazenamento de memória 550 tenha sido ilustrado na figura 24. As conexões lógicas apresentadas na figura 24 incluem uma rede de área local (LAN) 551 e uma rede de área ampla (WAN) 552. Tais ambientes de rede são comuns em redes de escritório, redes de computadores em toda a empresa, intranets e Internet, que são todos os tipos de redes.[495] Computer 520 may operate in a network environment using logical connections to one or more remote computers, such as remote computer 549. These logical connections may be achieved by a communication device coupled to or a part of computer 520, or in other ways. Remote computer 549 may be another computer, server, router, network PC, client, peer device, or other common network node, and typically includes many or all of the elements described above in relation to computer 520, although only one memory storage device 550 has been illustrated in Figure 24. The logical connections shown in Figure 24 include a local area network (LAN) 551 and a wide area network (WAN) 552. Such network environments are common on office networks, enterprise-wide computer networks, intranets, and the Internet, which are all types of networks.

[496]Quando usado em um ambiente de rede LAN, o computador 520 é conectado à rede local 551 através de uma interface de rede ou adaptador 553, que é um tipo de dispositivo de comunicações. Quando usado em um ambiente de rede WAN, o computador 520 inclui frequentemente um modem 554, um tipo de dispositivo de comunicações, ou qualquer outro tipo de dispositivo de comunicação para estabelecer a comunicação através da rede de área ampla 552. O modem 554, que pode ser interno ou externo, é conectado ao barramento do sistema 523 através da interface de porta serial 546. Em um ambiente de rede, os módulos do programa apresentado em relação ao computador pessoal 520, ou porções destes, podem ser armazenados no dispositivo de armazenamento de memória remoto. É observado que as conexões de rede mostradas são exemplos não-limitativos e outros dispositivos de comunicações para estabelecer uma ligação de comunicações entre os computadores poderão ser utilizados.[496] When used in a LAN environment, the computer 520 is connected to the local network 551 through a network interface or adapter 553, which is a type of communications device. When used in a WAN network environment, computer 520 often includes a modem 554, a type of communications device, or any other type of communication device for establishing communication over wide area network 552. Modem 554, which may be internal or external, is connected to system bus 523 through serial port interface 546. In a network environment, program modules presented in connection with personal computer 520, or portions thereof, may be stored on the storage device remote memory. It is noted that the network connections shown are non-limiting examples and other communications devices to establish a communications link between computers may be used.

MódulosModules

[497]Um ou mais módulos podem ser usados em um método aqui descrito, exemplos não-limitativos dos quais incluem um módulo de processamento lógico, módulo de organização de exibição de dados, módulo de sequenciamento, módulo de mapeamento, módulo de contagem, módulo de filtragem, módulo de ponderação, módulo de normalização, módulo da tendência de GC, módulo de nível, módulo de comparação, módulo de ajuste da faixa, módulo de categorização, módulo de ajuste, módulo de plotagem, módulo de representação, módulo de relacionamento, módulo de resultado e/ou módulo de organização de exibição de dados, o semelhante ou uma combinação destes. Os módulos são, por vezes, controlados por um microprocessador. Em certas modalidades um módulo ou uma máquina que compreende um ou mais módulos, coletam, reúnem, recebem, obtém, acessam, recuperam, fornecem e/ou transferem dados e/ou informações para ou de outro módulo, máquina, componente, periférico ou operador de uma máquina. Em algumas modalidades, dados e/ou informações (por exemplo, fragmentos (reads) de sequenciamento) são fornecidos a um módulo de uma máquina que compreende um ou mais dos seguintes: uma ou mais células de fluxo, uma câmara, um detector (por exemplo, um fotodetector, uma fotocélula, um detector elétrico (por exemplo, uma detector de modulação em amplitude, um detector de modulação de fase e frequência, um detector de circuito fechado de bloqueio de fase), um contador, um sensor (por exemplo, um sensor de pressão, temperatura, volume, fluxo, peso), um dispositivo de manuseio de fluido, uma impressora, um monitor (por exemplo, um LED, LCT ou CRT), o semelhante ou combinações dos mesmos. Por exemplo, por vezes, um operador de uma máquina fornece uma constante, um valor limite, uma fórmula ou um valor pré-determinado para um módulo. Um módulo é frequentemente configurado para transferir dados e/ou informações para ou de outro módulo ou máquina. Um módulo pode receber dados e/ou informações de outro módulo, exemplos não-limitativos dos quais incluem um módulo de processamento lógico, módulo de sequenciamento, módulo de mapeamento, módulo de contagem, módulo de filtragem, módulo de ponderação, módulo de normalização, módulo da tendência de CG, módulo de nível, módulo de comparação, módulo de ajuste da faixa, módulo de categorização, módulo de plotagem, módulo de representação, módulo de relacionamento, módulo de resultado e/ou módulo de organização de exibição de dados, o semelhante ou combinação destes. Um módulo pode manipular e/ou transformar os dados e/ou informações. Os dados e/ou informações derivados de ou transformados por um módulo podem ser transferidos para uma outra máquina e/ou módulo adequado, exemplos não-limitativos dos quais incluem um módulo de processamento lógico, módulo de sequenciamento, módulo de mapeamento, módulo de contagem, módulo de filtragem, módulo de ponderação, módulo de normalização, módulo da tendência de CG, módulo de nível, módulo de comparação, módulo de ajuste da faixa, módulo de categorização, módulo de plotagem, módulo de representação, módulo de relacionamento, módulo de resultado e/ou módulo de organização de exibição de dados, o semelhante ou uma combinação destes. Uma máquina que compreende um módulo pode compreender pelo menos um microprocessador. Em algumas modalidades, dados e/ou informações são recebidos por e/ou fornecidos por uma máquina que compreende um módulo. Uma máquina que compreende um módulo pode incluir um microprocessador (por exemplo, um ou mais microprocessadores) cujo microprocessador pode executar e/ou implementar uma ou mais instruções (por exemplo, processos, rotinas e/ou sub-rotinas) de um módulo. Em algumas modalidades, um módulo opera com um ou mais microprocessadores externos (por exemplo, uma rede interna ou externa, servidor, sistema de armazenagem e/ou rede de armazenamento (por exemplo, uma nuvem)).[497]One or more modules may be used in a method described herein, non-limiting examples of which include a logic processing module, data display organization module, sequencing module, mapping module, counting module, module filtering module, weighting module, normalization module, GC trending module, level module, comparison module, range adjustment module, categorization module, adjustment module, plotting module, representation module, relationship module , result module and/or data display organization module, the like or a combination thereof. Modules are sometimes controlled by a microprocessor. In certain embodiments a module or a machine comprising one or more modules, collect, assemble, receive, obtain, access, retrieve, provide and/or transfer data and/or information to or from another module, machine, component, peripheral or operator of a machine. In some embodiments, data and/or information (e.g., sequencing reads) is provided to a module of a machine comprising one or more of the following: one or more flow cells, a chamber, a detector (e.g., e.g. a photodetector, a photocell, an electrical detector (e.g. an amplitude modulation detector, a phase and frequency modulation detector, a phase locked loop detector), a counter, a sensor (e.g. , a pressure, temperature, volume, flow, weight sensor), a fluid handling device, a printer, a monitor (eg, an LED, LCT, or CRT), the like, or combinations thereof. For example, by Sometimes a machine operator supplies a constant, limit value, formula, or predetermined value to a module. A module is often configured to transfer data and/or information to or from another module or machine. A module can receiving data and/or information from another module, non-limiting examples of which include a logic processing module, sequencing module, mapping module, counting module, filtering module, weighting module, normalization module, trending module CG module, level module, comparison module, range adjustment module, categorization module, plotting module, representation module, relationship module, result module and/or data display organization module, the like or combination of these. A module can manipulate and/or transform data and/or information. Data and/or information derived from or transformed by a module can be transferred to another machine and/or suitable module, non-limiting examples of which include a logic processing module, sequencing module, mapping module, counting module , filtering module, weighting module, normalization module, CG trending module, level module, comparison module, range adjustment module, categorization module, plotting module, representation module, relationship module, module result and/or data display organization module, the similar or a combination thereof. A machine comprising a module may comprise at least one microprocessor. In some embodiments, data and/or information is received by and/or provided by a machine comprising a module. A machine comprising a module may include a microprocessor (e.g. one or more microprocessors) which microprocessor may execute and/or implement one or more instructions (e.g. processes, routines and/or subroutines) of a module. In some embodiments, a module operates with one or more external microprocessors (e.g., an internal or external network, server, storage system, and/or storage network (e.g., a cloud)).

Módulo de processamento lógicologic processing module

[498]Em certas modalidades um módulo de processamento lógico orquestra, controla, limita, organiza, ordena, distribui, divide, transforma e/ou regula dados e/ou informações ou a transferência de dados e/ou informações para e de um ou mais outros módulos, periféricos ou dispositivos.[498] In certain embodiments a logic processing module orchestrates, controls, limits, organizes, orders, distributes, divides, transforms and/or regulates data and/or information or the transfer of data and/or information to and from one or more other modules, peripherals or devices.

Módulo de organização de exibição de dadosData display organization module

[499]Em certas modalidades um módulo de organização de exibição de dados processa e/ou transforma dados e/ou informações em um meio visual adequado e exemplos não- limitativos dos quais incluem imagens, vídeo e/ou texto (por exemplo, números, letras e símbolos). Em algumas modalidades um módulo de organização de exibição de dados processos, transforma e/ou transfere dados e/ou informações para apresentação em um monitor adequado (por exemplo, um monitor, LED, LCD, CRT, o semelhante ou combinações destes), uma impressora, um periférico ou dispositivo adequado. Em algumas modalidades um módulo de organização de exibição de dados processos, transforma e/ou transfere dados e/ou informações em uma representação visual de um genoma fetal ou materno, cromossomo ou parte dele.[499] In certain embodiments a data display organization module processes and/or transforms data and/or information into a suitable visual medium and non-limiting examples of which include images, video and/or text (e.g. numbers, letters and symbols). In some embodiments, a data display organization module processes, transforms and/or transfers data and/or information for presentation on a suitable display (e.g., a monitor, LED, LCD, CRT, the like, or combinations thereof), a printer, a peripheral, or a suitable device. In some embodiments a data display organization module processes, transforms and/or transfers data and/or information into a visual representation of a fetal or maternal genome, chromosome or part thereof.

Módulo de sequenciamentosequencing module

[500]Em algumas modalidades, um módulo de sequência obtém, gera, une, reúne, manipula, transforma, processa, transforma e/ou transfere fragmentos (reads) de sequências. Um "módulo de recebimento de sequência", como aqui usado, é o mesmo que um "módulo de sequenciamento". Uma máquina que compreende um módulo de sequenciamento pode ser qualquer máquina que determina a sequência de um ácido nucleico usando uma tecnologia de sequenciamento conhecida na técnica. Em algumas modalidades um módulo de sequenciamento pode alinhar, reunir, fragmentar, complementar, complementar de forma reversa, verificar o erro, ou corrigir os fragmentos (reads)de sequências.[500]In some embodiments, a sequence module obtains, generates, joins, assembles, manipulates, transforms, processes, transforms, and/or transfers fragments (reads) of sequences. A "sequence receiving module", as used herein, is the same as a "sequencing module". A machine comprising a sequencing module can be any machine that determines the sequence of a nucleic acid using sequencing technology known in the art. In some embodiments a sequencing module may align, assemble, fragment, complement, reverse complement, error check, or correct sequence reads.

Módulo de mapeamentomapping module

[501]Fragmentos (reads) de sequências podem ser mapeados por um módulo de mapeamento ou por uma máquina que compreende um módulo de mapeamento, cujo módulo de mapeamento mapeia geralmente fragmentos (reads) para um genoma de referência ou seu segmento. Um módulo de mapeamento pode mapear fragmentos (reads) de sequenciamento por um método adequado conhecido na técnica. Em algumas modalidades, um módulo de mapeamento ou uma máquina que compreende um módulo de mapeamento é necessário para fornecer fragmentos (reads) de sequências mapeados.[501]Fragments (reads) of sequences may be mapped by a mapping module or by a machine comprising a mapping module, which mapping module generally maps fragments (reads) to a reference genome or segment thereof. A mapping module may map sequencing reads by a suitable method known in the art. In some embodiments, a mapping module or a machine comprising a mapping module is required to provide reads of mapped sequences.

Módulo de contagemcounting module

[502]Contagens podem ser fornecidas por um módulo de contagem ou por uma máquina que compreende um módulo de contagem. Em algumas modalidades um módulo de contagem conta fragmentos (reads) de sequências mapeados para um genoma de referência. Em algumas modalidades um módulo de contagem gera, reúne, e/ou fornece contagens de acordo com um método de contagem conhecido na técnica. Em algumas modalidades, um módulo de contagem ou uma máquina que compreende um módulo de contagem é necessário para fornecer contagens.[502] Counts can be provided by a counting module or by a machine comprising a counting module. In some embodiments a counting module counts fragments (reads) of sequences mapped to a reference genome. In some embodiments a counting module generates, assembles, and/or provides counts according to a counting method known in the art. In some embodiments, a counting module or a machine comprising a counting module is required to provide counts.

Módulo de filtragemfiltering module

[503]Porções de filtragem (por exemplo, porções de um genoma de referência) podem ser fornecidas por um módulo de filtragem (por exemplo, por uma máquina que compreende um módulo de filtragem). Em algumas modalidades, um módulo de filtragem é necessário para fornecer dados da porção filtrada (por exemplo, porções filtradas) e/ou para remover porções de consideração. Em certas modalidades um módulo de filtragem remove contagens mapeadas para uma porção de consideração. Em certas modalidades um módulo de filtragem remove contagens mapeadas para uma porção de uma determinação de um nível ou um perfil. Um módulo de filtragem pode filtrar os dados (por exemplo, contagens, contagens mapeadas em porções, porções, níveis de porção, contagens normalizadas, contagens brutas, e semelhante) por um ou mais métodos de filtragem conhecidos na técnica ou aqui descritos.[503]Filtering portions (eg, portions of a reference genome) may be provided by a filtering module (eg, by a machine comprising a filtering module). In some embodiments, a filtering module is required to provide filtered portion data (e.g., filtered portions) and/or to remove portions from consideration. In certain embodiments a filtering module removes counts mapped to a consideration portion. In certain embodiments a filtering module removes counts mapped to a portion of a determination of a level or a profile. A filtering module can filter the data (e.g., counts, counts mapped to portions, portions, portion levels, normalized counts, raw counts, and the like) by one or more filtering methods known in the art or described herein.

Módulo de ponderaçãoweighting module

[504]Porções de ponderação (por exemplo, porções de um genoma de referência) podem ser fornecidas por um módulo de ponderação (por exemplo, por uma máquina que compreende um módulo de ponderação). Em algumas modalidades, um módulo de ponderação é necessário para ponderar seções genômicas e/ou fornecer os valores ponderados da porção. Um módulo de ponderação pode ponderar porções por um ou mais métodos de ponderação conhecidos na técnica ou aqui descritos.[504]Weighting portions (eg, portions of a reference genome) may be provided by a weighting module (eg, by a machine comprising a weighting module). In some embodiments, a weighting module is required to weight genomic sections and/or provide portion weighted values. A weighting module can weight portions by one or more weighting methods known in the art or described herein.

Módulo de normalizaçãonormalization module

[505]Dados normalizados (por exemplo, contagens normalizadas) podem ser fornecidos por um módulo de normalização (por exemplo, por uma máquina que compreende um módulo de normalização). Em algumas modalidades, um módulo de normalização é necessário para fornecer dados normalizados (por exemplo, contagens normalizadas) obtidos dos fragmentos (reads) de sequenciamento. Um módulo de normalização pode normalizar dados (por exemplo, contagens, contagens filtradas, contagens brutas) com um ou mais métodos de normalização aqui descritos (por exemplo, PERUN, normalização híbrida, o semelhante ou combinações dos mesmos) ou conhecidos na técnica.[505]Normalized data (eg, normalized counts) may be provided by a normalization module (eg, by a machine comprising a normalization module). In some embodiments, a normalization module is required to provide normalized data (eg, normalized counts) obtained from sequencing reads. A normalization module can normalize data (e.g., counts, filtered counts, raw counts) with one or more normalization methods described herein (e.g., PERUN, hybrid normalization, the like, or combinations thereof) or known in the art.

Módulo da tendência de GCGC Trend Module

[506]Determinação da tendência de CG (por exemplo, determinando da tendência de CG para cada das porções de um genoma de referência (por exemplo, porções, porções de um genoma de referência)) pode ser fornecida por um módulo da tendência de CG (por exemplo, por uma máquina que compreende um módulo da tendência de CG). Em algumas modalidades, um módulo da tendência de CG é necessário para fornecer uma determinação da tendência de GC. Em algumas modalidades um módulo da tendência de CG fornece uma determinação da tendência de CG de um relacionamento ajustado (por exemplo, um relacionamento linear ajustado) entre as contagens de fragmentos (reads) de sequências mapeados para cada das porções de um genoma de referência e teor de GC de cada porção. Um módulo da tendência de CG, por vezes, é parte de um módulo de normalização (por exemplo, PERUN módulo de normalização).[506]Determining the GC bias (eg, determining the GC bias for each of the portions of a reference genome (eg, portions, portions of a reference genome)) can be provided by a GC bias module (e.g. by a machine comprising a CG trending module). In some embodiments, a GC trend module is required to provide a GC trend determination. In some embodiments, a GC trend module provides a determination of the GC trend of a fitted relationship (e.g., a fitted linear relationship) between sequence read counts mapped to each of the portions of a reference genome and GC content of each serving. A CG trend module is sometimes part of a normalization module (eg PERUN normalization module).

Módulo de nívellevel module

[507]Determinação dos níveis (por exemplo, níveis) e/ou o cálculo dos níveis de seção genômica para porções de um genoma de referência pode ser fornecida por um módulo de nível (por exemplo, por uma máquina que compreende um módulo de nível). Em algumas modalidades, um módulo de nível é necessário para fornecer um nível ou um nível de seção genômica calculado (por exemplo, de acordo com a Equação A, B, L, M, N, O e/ou Q). Em algumas modalidades um módulo de nível fornece um nível de um relacionamento ajustado (por exemplo, um relacionamento linear ajustado) entre uma tendência de CG e contagens de fragmentos (reads) de sequências mapeados para cada das porções de um genoma de referência. Em algumas modalidades um módulo de nível calcula um nível de seção genômica como parte de PERUN. Em algumas modalidades, um módulo de nível fornece uma seção de nível genômico (ou seja, Li) de acordo com a equação Li = (mi - GiS)I-1 em que Gi é a tendência de CG, mi é a contagem medida mapeadas para cada porção de um genoma de referência, i é uma amostra, e I é a intercepção e S é o declive do relacionamento ajustado (por exemplo, uma relacionamento linear ajustado) entre uma tendência de GC e contagens de fragmentos (reads) de sequências mapeados para cada das porções de um genoma de referência.[507]Determining levels (e.g., levels) and/or calculating genomic section levels for portions of a reference genome may be provided by a level module (e.g., by a machine comprising a level module ). In some embodiments, a level module is required to provide a calculated level or genomic section level (eg, according to Equation A, B, L, M, N, O and/or Q). In some embodiments a level module provides a level of a fitted relationship (eg, a fitted linear relationship) between a CG trend and sequence read counts mapped to each of the portions of a reference genome. In some embodiments a level module computes a genomic section level as part of PERUN. In some embodiments, a level module provides a genomic level section (i.e., Li) according to the equation Li = (mi - GiS)I-1 where Gi is the GC trend, mi is the measured count mapped for each portion of a reference genome, i is a sample, and I is the intercept, and S is the slope of the fitted relationship (for example, a fitted linear relationship) between a GC trend and sequence read counts mapped to each of the portions of a reference genome.

Módulo de comparaçãoComparison module

[508]Um primeiro nível pode ser identificado como significativamente diferente de um segundo nível por um módulo de comparação ou uma máquina que compreende um módulo de comparação. Em algumas modalidades, um módulo de comparação ou uma máquina que compreende um módulo de comparação é obrigado a fornecer uma comparação entre dois níveis.[508]A first tier may be identified as significantly different from a second tier by a comparison module or a machine comprising a comparison module. In some embodiments, a comparison module or a machine comprising a comparison module is required to provide a comparison between two levels.

Módulo de ajuste de faixaRange adjustment module

[509]Faixas esperadas (por exemplo, faixas de nível esperadas) para várias variações do número de cópia (por exemplo, duplicações, inserções e/ou deleções) ou faixas para a ausência de uma variação do número de cópia podem ser fornecidas por um módulo de ajuste de faixa ou uma máquina que compreende um módulo de ajuste de faixa. Em certas modalidades, os níveis esperados são fornecidos por um módulo de ajuste de faixa ou por uma máquina que compreende um módulo de ajuste de faixa. Em algumas modalidades, um módulo de ajuste de faixa ou por uma máquina que compreende um módulo de ajuste de faixa é necessário para fornecer os níveis e/ou faixas esperados.[509]Expected ranges (e.g., expected level ranges) for various copy number variations (e.g., duplications, insertions, and/or deletions) or ranges for the absence of a copy number variation may be provided by a swathing module or a machine comprising a swathing module. In certain embodiments, expected levels are provided by a ranging module or by a machine comprising a ranging module. In some embodiments, a range adjustment module or by a machine comprising a range adjustment module is required to provide the expected levels and/or ranges.

Módulo de categorizaçãocategorization module

[510]Um número de variação de cópia (por exemplo, uma variação do número de cópia materna e/ou fetal, uma variação, do número de cópia, uma duplicação, inserção, deleção fetal) pode ser categorizado por um módulo de categorização ou por uma máquina que compreende um módulo de categorização. Em certas modalidades uma variação do número de cópia (por exemplo, uma variação do número de cópia materna e/ou fetal) é categorizada por um módulo de categorização. Em certas modalidades um nível (por exemplo, um primeiro nível) determinado como sendo significativamente diferente de outro nível (por exemplo, um segundo nível) é identificado como representante de uma variação do número de cópia por um módulo de categorização. Em certas modalidades, a ausência de uma variação do número de cópia é determinada por um módulo de categorização. Em algumas modalidades, uma determinação de uma variação do número de cópia pode ser determinada por uma máquina que compreende um módulo de categorização. Um módulo de categorização pode ser especializado para categorizar uma variação do número de cópia materna e/ou fetal, uma variação do número de cópia, duplicação, deleção ou inserção fetal ou a falta dela, ou combinação dos anteriores. Por exemplo, um módulo de categorização que identifica uma deleção materna pode ser diferente do que e/ou distinta de um módulo de categorização que identifica uma duplicação fetal. Em algumas modalidades, um módulo de categorização ou uma máquina que compreende um módulo de categorização é necessário para identificar uma variação do número de cópia ou um resultado determinante de uma variação do número de cópia.[510]A copy variation number (e.g., a maternal and/or fetal copy number variation, a copy number variation, a fetal duplication, insertion, deletion) may be categorized by a categorization module or by a machine comprising a categorization module. In certain embodiments a copy number variation (eg, a maternal and/or fetal copy number variation) is categorized by a categorization module. In certain embodiments a tier (eg, a first tier) determined to be significantly different from another tier (eg, a second tier) is identified as representative of copy number variation by a categorization module. In certain embodiments, the absence of a copy number variation is determined by a categorization module. In some embodiments, a determination of a copy number variation may be determined by a machine comprising a categorization module. A categorization module can be specialized to categorize a maternal and/or fetal copy number variation, a fetal copy number variation, duplication, deletion or insertion or lack thereof, or combination of the foregoing. For example, a categorization module that identifies a maternal deletion may be different than and/or distinct from a categorization module that identifies a fetal duplication. In some embodiments, a categorization module or a machine comprising a categorization module is required to identify a copy number variation or a determinant result of a copy number variation.

Módulo de ajusteadjustment module

[511]Em algumas modalidades, adaptações de um nível (por exemplo, ajustes em níveis de seção genômica, um nível de um perfil, um nível de uma variação do número de cópia, um nível de uma ou mais porções, o semelhante ou combinações dos mesmos) são feitas por um módulo de ajuste ou por uma máquina que compreende um módulo de ajuste. Em algumas modalidades, um módulo de ajuste ou uma máquina que compreende um módulo de ajuste é necessário para ajustar um nível. Um nível ajustado por métodos aqui descritos pode ser verificado independentemente e/ou ajustado por outros testes (por exemplo, por sequenciamento alvo de ácido nucleico materno ou fetal).[511]In some embodiments, one-level adaptations (e.g., adjustments to genomic section levels, one level to a profile, one level to a copy number variation, one level to one or more moieties, the like, or combinations thereof) are made by an adjustment module or by a machine comprising an adjustment module. In some embodiments, an adjustment module or a machine comprising an adjustment module is required to adjust a level. A level adjusted by methods described herein can be independently verified and/or adjusted by other tests (eg, by target sequencing of maternal or fetal nucleic acid).

Módulo de plotagemplotting module

[512]Em algumas modalidades um módulo de plotagem processa e/ou transforma dados e/ou informações em um meio visual adequado, exemplos não-limitativos dos quais incluem um gráfico, tabela, quadro, o semelhante ou combinações destes. Em algumas modalidades um módulo de plotagem processa, transforma e/ou transfere dados e/ou informações para apresentação em um monitor adequado (por exemplo, um monitor, LED, LCD, CRT, o semelhante ou combinações destes), uma impressora, um periférico ou dispositivo adequado. Em certas modalidades um módulo de plotagem fornece uma exibição visual de uma contagem, um nível, e/ou um perfil. Em algumas modalidades um módulo de organização de exibição de dados, transforma dados e/ou informações em uma representação visual de um genoma fetal ou materno, cromossomo ou parte dele. Em algumas modalidades, um módulo de plotagem ou uma máquina que compreende um módulo de plotagem é necessário para plotar uma contagem, um nível ou um perfil.[512]In some embodiments a plotting module processes and/or transforms data and/or information into a suitable visual medium, non-limiting examples of which include a graph, table, chart, the like or combinations thereof. In some embodiments a plotting module processes, transforms and/or transfers data and/or information for presentation on a suitable monitor (e.g., a monitor, LED, LCD, CRT, the like or combinations thereof), a printer, a peripheral or suitable device. In certain embodiments a plot module provides a visual display of a count, a level, and/or a profile. In some embodiments, a data display organization module transforms data and/or information into a visual representation of a fetal or maternal genome, chromosome, or part thereof. In some embodiments, a plotting module or a machine comprising a plotting module is required to plot a count, level or profile.

Módulo de RelacionamentoRelationship Module

[513]Em certas modalidades, um módulo de relacionamento processa e/ou transforma dados e/ou informações em um relacionamento. Em certas modalidades, um relacionamento é gerado por e/ou transferido de um módulo de relacionamento.[513]In certain embodiments, a relationship module processes and/or transforms data and/or information in a relationship. In certain embodiments, a relationship is generated by and/or transferred from a relationship module.

Módulo de resultadoresult module

[514]A presença ou ausência de uma variação genética (uma aneuploidia, uma aneuploidia fetal, uma variação do número de cópia) é, em algumas modalidades, identificada por um módulo de resultado ou por uma máquina que compreende um módulo de resultado. Em certas modalidades uma variação genética é identificada por um módulo de resultado. Frequentemente, a determinação da presença ou ausência de uma aneuploidia é identificada por um módulo de resultado. Em algumas modalidades, um resultado determinante de uma variação genética (uma aneuploidia, uma variação do número de cópia) pode ser identificado por um módulo de resultado ou por uma máquina que compreende um módulo de resultado. Um módulo de resultado pode ser especializado para determinar uma variação genética específica (por exemplo, uma trissomia, trissomia 21, trissomia 18). Por exemplo, um módulo de resultado que identifica uma trissomia 21 pode ser diferente do que e/ou distinto de um módulo de resultado que identifica uma trissomia 18. Em algumas modalidades, um módulo de resultado ou uma máquina que compreende um módulo de resultado é necessário para identificar uma variação genética ou um resultado determinante de uma variação genética (por exemplo, uma aneuploidia, uma variação do número de cópia). Uma variação genética ou um resultado determinativo de uma variação genética identificada por métodos aqui descritos pode ser verificado por outros testes (por exemplo, por sequenciamento alvo de ácido nucleico materno e/ou fetal).[514]The presence or absence of a genetic variation (an aneuploidy, a fetal aneuploidy, a copy number variation) is, in some embodiments, identified by a result module or by a machine comprising a result module. In certain embodiments a genetic variation is identified by an outcome module. Often, the determination of the presence or absence of an aneuploidy is identified by a result module. In some embodiments, a determinant result of a genetic variation (an aneuploidy, a copy number variation) can be identified by a result module or by a machine comprising a result module. An outcome module can be specialized to determine a specific genetic variation (eg a trisomy, trisomy 21, trisomy 18). For example, an output module that identifies a trisomy 21 may be different than and/or distinct from an output module that identifies a trisomy 18. In some embodiments, an output module or a machine comprising an output module is necessary to identify a genetic variation or a determinant result of a genetic variation (eg, an aneuploidy, a copy number variation). A genetic variation or a determinative result of a genetic variation identified by methods described herein can be verified by other tests (eg, by target sequencing of maternal and/or fetal nucleic acid).

TransformaçõesTransformations

[515]Como mencionado acima, os dados às vezes são transformados de uma forma para outra forma. Os termos "transformado", "transformação", e derivações gramaticais ou seus equivalentes, como usados aqui, referem-se a uma alteração de dados de um material de partida físico (por exemplo, sujeito de teste e/ou de ácido nucleico da amostra do sujeito de referência) em uma representação digital do material de partida físico (por exemplo, dados legíveis de sequência), e em algumas modalidades inclui ainda uma transformação em um ou mais valores numéricos ou representações gráficas da representação digital que pode ser utilizada para fornecer um resultado (por exemplo, a determinação da fração fetal ou estimativa de uma amostra de teste). Em certas modalidades, um ou mais valores numéricos e/ou representações gráficas ou de dados digitalmente representados podem ser usados para representar a aparência de genoma físico de um sujeito de teste (por exemplo, representam virtualmente ou representam visualmente a presença ou ausência de uma inserção, duplicação ou deleção genômica; representar a presença ou ausência de uma variação na quantidade física de uma sequência associada com condições médicas). Uma representação virtual, por vezes, é ainda transformada em um ou mais valores numéricos ou representações gráficas da representação digital do material de partida. Estes métodos podem transformar o material de partida físico em um valor numérico ou representação gráfica, ou uma representação da aparência física de um genoma do sujeito de teste.[515]As mentioned above, data is sometimes transformed from one form to another form. The terms "transformed", "transformation", and grammatical derivations or their equivalents, as used herein, refer to a data alteration of a physical starting material (e.g. test subject and/or sample nucleic acid of the reference subject) into a digital representation of the physical starting material (e.g., readable sequence data), and in some embodiments further includes a transformation into one or more numeric values or graphical representations of the digital representation that can be used to provide a result (for example, determination of the fetal fraction or estimation of a test sample). In certain embodiments, one or more numeric values and/or graphical representations or digitally represented data may be used to represent the appearance of a test subject's physical genome (e.g., virtually represent or visually represent the presence or absence of an insert , genomic duplication or deletion; representing the presence or absence of a variation in the physical quantity of a sequence associated with medical conditions). A virtual representation is sometimes further transformed into one or more numerical values or graphical representations of the digital representation of the starting material. These methods can transform the physical starting material into a numerical value or graphical representation, or a representation of the physical appearance of a test subject's genome.

[516]Em algumas modalidades, a transformação de um conjunto de dados facilita fornecer um resultado reduzindo a complexidade de dados e/ou dimensionalidade dos dados. Complexidade do conjunto de dados, por vezes, é reduzida durante o processo de transformação de um material de partida físico em uma representação virtual do material de partida (por exemplo, fragmentos (reads) de sequências representativos de material de partida físico). Uma característica ou variável adequada pode ser usada para reduzir a complexidade e/ou dimensionalidade do conjunto de dados. Exemplos não-limitativos de características que podem ser escolhidas para uso como uma característica alvo para processamento de dados incluem teor de GC, predição do gênero fetal, tamanho do fragmento (por exemplo, comprimento de fragmentos CCF, fragmentos (reads) ou uma representação adequada destes (por exemplo, FRS)), sequência de fragmento, identificação de aneuploidia cromossômica, identificação de genes ou proteínas particulares, identificação de câncer, doenças, genes /traços herdados, anormalidades cromossômicas, uma categoria biológica, uma categoria química, uma categoria bioquímica, uma categoria de genes ou proteínas, uma ontologia do gene, uma ontologia de proteínas, genes co- regulados, genes de sinalização celular, genes do ciclo celular, proteínas relacionadas com os genes anteriores, variantes genéticas, variantes de proteína, genes co- regulados, proteínas co-reguladas, sequência de aminoácidos, sequência de nucleotídeo, dados da estrutura da proteína e semelhante, e combinações dos anteriores. Exemplos não-limitativos de redução de complexidade e/ou dimensionalidade do conjunto de dados incluem; redução de uma pluralidade de fragmentos (reads) de sequências para gráficos de perfil, redução de uma pluralidade de fragmentos (reads) de sequências para valores numéricos (por exemplo, valores normalizados, pontuações de Z, valores de p); redução de vários métodos de análise para gráficos de probabilidade ou pontos únicos; análise de componentes principais de grandezas derivadas; e semelhante ou suas combinações.[516]In some embodiments, transforming a dataset facilitates providing a result by reducing data complexity and/or data dimensionality. Dataset complexity is sometimes reduced during the process of transforming a physical starting material into a virtual representation of the starting material (eg, fragments (reads) of sequences representative of physical starting material). A suitable characteristic or variable can be used to reduce the complexity and/or dimensionality of the data set. Non-limiting examples of traits that may be chosen for use as a target trait for data processing include GC content, fetal gender prediction, fragment size (e.g. length of CCF fragments, reads) or a suitable representation (e.g. FRS)), fragment sequence, identification of chromosomal aneuploidy, identification of particular genes or proteins, identification of cancer, diseases, inherited genes/traits, chromosomal abnormalities, a biological category, a chemical category, a biochemical category , a category of genes or proteins, a gene ontology, a protein ontology, co-regulated genes, cell signaling genes, cell cycle genes, proteins related to previous genes, genetic variants, protein variants, co-genes regulated, co-regulated proteins, amino acid sequence, nucleotide sequence, protein structure data and the like, and combinations of the foregoing. Non-limiting examples of dataset complexity and/or dimensionality reduction include; reducing a plurality of sequence reads to profile graphs, reducing a plurality of sequence reads to numerical values (eg, normalized values, Z scores, p values); reducing multiple analysis methods to probability plots or single points; principal component analysis of derived quantities; and the like or combinations thereof.

Certo sistema, máquina e modalidades de produto de programa de computadorCertain system, machine and computer program product modes

[517]É em certos aspectos fornecido um método implementado por computador para determinar a presença ou ausência de uma variação genética, que compreende (a) obtenção de contagens de fragmentos (reads) de sequências de nucleotídeo mapeadas para seções genômicas de um genoma de referência, cujos fragmentos (reads) de sequências são: (i) fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, e (ii) fragmentos (reads) de fragmentos de ácido nucleico tendo comprimentos que são menores do que um comprimento do fragmento selecionado; (b) normalizar as contagens, gerando desse modo contagens normalizadas de fragmentos (reads) de sequências mapeados para as seções genômicas; e (c) determinar a presença ou ausência de uma variação genética de acordo com as contagens normalizadas.[517] There is in certain aspects provided a computer-implemented method for determining the presence or absence of a genetic variation, comprising (a) obtaining fragment counts (reads) of nucleotide sequences mapped to genomic sections of a reference genome , the sequence reads of which are: (i) circulating cell-free nucleic acid reads from a test sample from a pregnant woman, and (ii) nucleic acid fragment reads having lengths that are less than a length of the selected fragment; (b) normalizing the counts, thereby generating normalized counts of sequence reads mapped to the genomic sections; and (c) determining the presence or absence of a genetic variation according to the normalized counts.

[518]É também fornecida em certos aspectos um sistema que compreende um ou mais microprocessadores e memória, cuja memória compreende instruções executáveis por um ou mais microprocessadores e cuja memória compreende contagens de fragmentos (reads) de sequências de nucleotídeo mapeados para seções genômicas de um genoma de referência, cujos fragmentos (reads) de sequências são (i) fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, e (ii) fragmentos (reads) de fragmentos de ácido nucleico tendo comprimentos que são menores do que um comprimento do fragmento selecionado; e que as instruções executáveis por um ou mais microprocessadores estão configuradas para (a) normalizar as contagens, gerando deste modo as contagens normalizadas de fragmentos (reads) de sequências mapeados para as seções genômicas; e (b) determinar a presença ou ausência de uma variação genética de acordo com as contagens normalizadas.[518] Also provided in certain aspects is a system comprising one or more microprocessors and memory, which memory comprises instructions executable by one or more microprocessors, and which memory comprises counts of fragments (reads) of nucleotide sequences mapped to genomic sections of a reference genome, the sequence reads of which are (i) circulating cell-free nucleic acid reads from a test sample of a pregnant woman, and (ii) nucleic acid fragment reads having lengths that are less than a selected fragment length; and that instructions executable by one or more microprocessors are configured to (a) normalize the counts, thereby generating normalized counts of fragments (reads) of sequences mapped to genomic sections; and (b) determining the presence or absence of a genetic variation according to the normalized counts.

[519]É também fornecida em certos aspectos uma máquina que compreende um ou mais microprocessadores e memória, cuja memória compreende instruções executáveis por um ou mais microprocessadores e cuja memória compreende contagens de fragmentos (reads) de sequências de nucleotídeo mapeados para seções genômicas de um genoma de referência, cujos fragmentos (reads) de sequênciass são (i) fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, e (ii) fragmentos (reads) de fragmentos de ácido nucleico tendo comprimentos que são menores do que um comprimento do fragmento selecionado; e que as instruções executáveis por um ou mais microprocessadores estão configuradas para (a) normalizar as contagens, gerando deste modo as contagens normalizadas de fragmentos (reads) de sequências mapeados para as seções genômicas; e (b) determinar a presença ou ausência de uma variação genética de acordo com as contagens normalizadas.[519] There is also provided in certain aspects a machine comprising one or more microprocessors and memory, which memory comprises instructions executable by one or more microprocessors and which memory comprises counts of fragments (reads) of nucleotide sequences mapped to genomic sections of a reference genome, the sequence reads of which are (i) circulating cell-free nucleic acid reads from a test sample of a pregnant woman, and (ii) nucleic acid fragment reads having lengths that are less than a selected fragment length; and that instructions executable by one or more microprocessors are configured to (a) normalize the counts, thereby generating normalized counts of fragments (reads) of sequences mapped to genomic sections; and (b) determining the presence or absence of a genetic variation according to the normalized counts.

[520]É fornecido também em certas modalidades um produto de programa de computador tangivelmente incorporado em um meio legível por computador, que compreende as instruções que, quando executadas por um ou mais microprocessadores, estão configuradas para (a) acessar contagens de fragmentos (reads) de sequências de nucleotídeo mapeados para seções genômicas de um genoma de referência , cujos fragmentos (reads) de sequências são: (i) fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, e (ii) fragmentos (reads) de fragmentos de ácido nucleico tendo comprimentos que são menores do que um comprimento do fragmento selecionado; e que as instruções executáveis por um ou mais microprocessadores estão configuradas para (a) normalizar as contagens, gerando deste modo as contagens normalizadas de fragmentos (reads) de sequências mapeadas para as seções genômicas; e (b) determinar a presença ou ausência de uma variação genética de acordo com as contagens normalizadas.[520] Also provided in certain embodiments is a computer program product tangibly embodied in a computer-readable medium, comprising instructions that, when executed by one or more microprocessors, are configured to (a) access fragment counts (reads ) of nucleotide sequences mapped to genomic sections of a reference genome, the sequence reads of which are: (i) circulating cell-free nucleic acid reads from a test sample from a pregnant woman, and ( ii) fragments (reads) of nucleic acid fragments having lengths that are smaller than a selected fragment length; and that instructions executable by one or more microprocessors are configured to (a) normalize the counts, thereby generating normalized counts of fragments (reads) of sequences mapped to genomic sections; and (b) determining the presence or absence of a genetic variation according to the normalized counts.

[521]É também aqui fornecido sistema compreendendo um ou mais microprocessadores e memória, cuja memória compreende instruções executáveis por um ou mais microprocessadores e que a memória compreende os fragmentos (reads) de sequências de nucleotídeo mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, e que instruções executáveis por um ou mais microprocessadores estão configuradas para (a) ponderar, usando um microprocessador, (i) as contagens dos fragmentos (reads) de sequências mapeados para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica da porção de ácido nucleico fetal de acordo com um fator de ponderação associado independentemente com cada porção fornecendo, desse modo, estimativas de fração específica da porção fetal de acordo com os fatores de ponderação, em que cada um dos fatores de ponderação foi determinado de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada de várias amostras, e (ii)contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para várias amostras e (b) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas estimativas de fração específica da porção fetal.[521] Also provided herein is a system comprising one or more microprocessors and memory, which memory comprises instructions executable by one or more microprocessors, and which memory comprises fragments (reads) of nucleotide sequences mapped to portions of a reference genome, whose Sequence reads are circulating cell-free nucleic acid reads from a test specimen from a pregnant woman, and which instructions executable by one or more microprocessors are configured to (a) weight, using a microprocessor, ( i) the sequence reads counts mapped to each chunk, or (ii) another chunk-specific parameter, to a specific fraction of the chunk of fetal nucleic acid according to a weighting factor independently associated with each chunk providing, thus, fetal portion-specific fraction estimates according to the weighting factors, where each of the weighting factors was determined from a ratio adjusted for each portion between (i) a fraction of fetal nucleic acid for each of several samples , and (ii) counts of sequence reads mapped to each chunk, or other chunk-specific parameter, for multiple samples, and (b) estimating a fraction of fetal nucleic acid for the test sample based on the fraction estimates specific to the fetal portion.

[522]É também aqui fornecida uma máquina que compreende um ou mais microprocessadores e memória, cuja memória compreende instruções executáveis por um ou mais microprocessadores e que a memória compreende fragmentos (reads) de sequências de nucleotídeo mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, e que instruções executáveis por um ou mais microprocessadores estão configuradas para (a) ponderar, usando um microprocessador, (i) as contagens dos fragmentos (reads) de sequências mapeados para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica da porção de ácido nucleico fetal de acordo com um fator de ponderação associado independentemente com cada porção fornecendo, desse modo, estimativas de fração específica da porção fetal de acordo com os fatores de ponderação, em que cada um dos fatores de ponderação foi determinado de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada de várias amostras, e (ii) contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para várias amostras e (b) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas estimativas de fração específica da porção fetal.[522] Also provided herein is a machine comprising one or more microprocessors and memory, which memory comprises instructions executable by one or more microprocessors, and which memory comprises fragments (reads) of nucleotide sequences mapped to portions of a reference genome, which sequence reads are circulating cell-free nucleic acid reads of a test sample from a pregnant woman, and which instructions executable by one or more microprocessors are configured to (a) weight, using a microprocessor, (i) counts of sequence reads mapped to each chunk, or (ii) another chunk-specific parameter, to a specific fraction of the chunk of fetal nucleic acid according to a weighting factor independently associated with each chunk providing , therefore, fetal portion-specific fraction estimates according to the weighting factors, where each of the weighting factors was determined from a ratio adjusted for each portion between (i) a fraction of fetal nucleic acid for each of several samples, and (ii) counts of sequence reads mapped to each chunk, or other chunk-specific parameter, for multiple samples, and (b) estimating a fraction of fetal nucleic acid for the test sample based on the estimates of specific fraction of the fetal portion.

[523]É também aqui fornecido um meio de armazenamento legível por computador não-transitório com um programa executável armazenado no mesmo, onde o programa instrui um microprocessador para executar o seguinte: (a) acessar fragmentos (reads) de sequências de nucleotídeo mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, (b) ponderar, usando um microprocessador, (i) as contagens dos fragmentos (reads) de sequências mapeados para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica da porção de ácido nucleico fetal de acordo com um fator de ponderação associado independentemente com cada porção fornecendo, desse modo, estimativas de fração específica da porção fetal de acordo com os fatores de ponderação, em que cada dos fatores de ponderação foi determinado de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada de várias amostras, e (ii) contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para várias amostras e (c) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas estimativas de fração específica da porção fetal[523] Also provided herein is a non-transient computer-readable storage medium with an executable program stored thereon, where the program instructs a microprocessor to perform the following: (a) access fragments (reads) of nucleotide sequences mapped to portions of a reference genome, the sequence reads of which are circulating cell-free nucleic acid reads from a test sample from a pregnant woman, (b) weight, using a microprocessor, (i) the counts of sequence reads mapped to each chunk, or (ii) another chunk-specific parameter, to a specific fraction of the chunk of fetal nucleic acid according to a weighting factor independently associated with each chunk, thereby providing estimates specific fraction of the fetal portion according to the weighting factors, wherein each of the weighting factors was determined from a ratio adjusted for each portion between (i) a fraction of fetal nucleic acid for each of several samples, and (ii) counts of sequence reads mapped to each portion, or other portion-specific parameter, for multiple samples, and (c) estimating a fetal nucleic acid fraction for the test sample based on the fetal portion-specific fraction estimates

[524]Em certas modalidades, um sistema, máquina, e/ou produto de programa de computador compreende um módulo de contagem configurado para contar fragmentos (reads) mapeados para seções genômicas de um genoma de referência ou sua porção (por exemplo, subconjunto de seções genômicas, conjunto selecionado de seções genômicas). Um módulo de contagem frequentemente é configurado para contar fragmentos (reads) de fragmentos de ácido nucleico tendo comprimentos que são menores do que um comprimento do fragmento selecionado. As contagens, por vezes, são filtradas, contagens normalizadas ou combinação dos anteriores. Em algumas modalidades, um módulo de contagem pode normalizar as contagens, por exemplo, usando qualquer processo de normalização adequada aqui descrito ou conhecido na técnica.[524] In certain embodiments, a system, machine, and/or computer program product comprises a counting module configured to count fragments (reads) mapped to genomic sections of a reference genome or portion thereof (e.g., subset of genomic sections, selected set of genomic sections). A counting module is often configured to count fragment reads of nucleic acid having lengths that are less than a selected fragment length. Counts are sometimes filtered counts, normalized counts, or a combination of the above. In some embodiments, a counting module may normalize the counts, for example, using any suitable normalization process described herein or known in the art.

[525]Em algumas modalidades, um sistema, máquina, e/ou produto de programa de computador compreende um módulo de comparação de contagem. Um módulo de comparação de contagem frequentemente é configurado para comparar o número de contagens de fragmentos (reads) contados por um módulo de contagem, tornando desse modo uma comparação de contagem. Um módulo de comparação de contagem frequentemente está configurado para acessar, receber, utilizar, armazenar, pesquisar e/ou alinhar contagens de fragmentos (reads) (por exemplo, de um módulo de contagem ou módulo de normalização). Um módulo de comparação de contagem frequentemente é configurado para fornecer uma comparação adequada entre as contagens, exemplos não-limitativos dos quais comparação incluem uma comparação simples (por exemplo, corresponde ou não corresponde entre contagens de fragmentos (reads) mapeados para um primeiro conjunto de seções genômicas em comparação com um segundo conjunto de seções genômicas), comparação matemática (por exemplo, proporção, porcentagem), comparação estatística (por exemplo, várias comparações, vários testes, padronização (por exemplo, análises de pontuação de Z)), o semelhante e combinações destes. Um valor de comparação de contagem adequado pode ser fornecido por um módulo de comparação de contagem, exemplos não -limitativos dos quais incluem a presença ou ausência de uma correspondência entre as contagens, uma proporção, percentagem, pontuação de z, um valor acoplado com uma medida da variância ou incerteza (por exemplo, desvio padrão, desvio absoluto mediano, intervalo de confiança), o semelhante e suas combinações. Um módulo de comparação de contagem, por vezes, é configurado para transmitir um valor de comparação com outro módulo ou máquina, tal como um módulo de variação genética, máquina de exibição ou máquina impressora, por exemplo.[525] In some embodiments, a system, machine, and/or computer program product comprises a count comparison module. A count comparison module is often configured to compare the number of fragment counts (reads) counted by a count module, thereby making a count comparison. A count comparison module is often configured to access, receive, use, store, search, and/or align counts of fragments (reads) (for example, from a count module or normalization module). A count comparison module is often configured to provide a suitable comparison between counts, non-limiting examples of which comparison include a simple comparison (e.g. match or mismatch between counts of fragments (reads) mapped to a first set of genomic sections compared to a second set of genomic sections), mathematical comparison (eg, ratio, percentage), statistical comparison (eg, multiple comparisons, multiple tests, standardization (eg, Z-score analyses)), the similar and combinations thereof. A suitable count comparison value can be provided by a count comparison module, non-limiting examples of which include the presence or absence of a match between the counts, a ratio, percentage, z-score, a value coupled with a measure of variance or uncertainty (eg, standard deviation, median absolute deviation, confidence interval), like, and combinations thereof. A count comparison module is sometimes configured to transmit a comparison value to another module or machine, such as a genetic variation module, display machine or printing machine, for example.

[526]Em certas modalidades, um sistema, máquina, e/ou produto de programa de computador compreende um módulo de variação genética. Um módulo de variação genética, por vezes, é configurado para fornecer uma determinação da presença ou ausência de uma variação genética de acordo com as contagens de fragmentos (reads) mapeados para seções genômicas de um genoma de referência. Um módulo de variação genética, por vezes, é configurado para fornecer uma determinação da presença ou ausência de uma variação genética de acordo com uma comparação de contagens. Um módulo de variação genética, frequentemente, está configurado para acessar, receber, utilizar, armazenar, pesquisar e/ou alinhar uma ou mais comparações de um módulo de comparação de contagens e/ou contagens de um módulo de contagem. Um módulo de variação genética pode determinar a presença ou ausência de uma variação genética de uma ou mais comparações ou das contagens de uma maneira adequada. Um módulo de variação genética, por vezes, determina se existe uma diferença significativa entre as contagens para diferentes conjuntos de seções genômicas em um genoma de referência. A significância da diferença pode ser determinada através de um módulo de variação genética em uma maneira adequada (por exemplo, diferença percentual, análise da pontuação de Z). Um módulo de variação genética, por vezes, determina se uma determinação da contagem ou uma comparação de contagens está em uma categoria particular. Por exemplo, um módulo de variação genética pode categorizar uma comparação particular a um limite de uma proporção particular ou uma faixa de proporções associadas com a determinação euplóide, ou um limite de uma proporção particular ou faixa de proporções associadas com uma determinação aneuplóide. Em um outro exemplo não- limitativo, um módulo de variação genética pode categorizar uma determinação da contagem particular para a um limite de uma proporção particular ou uma faixa de proporções associadas om uma determinação euplóide, ou um limite de uma proporção particular ou uma faixa de proporções associadas uma determinação aneuplóide. Um módulo de variação genética pode fornecer um resultado em um formato adequado, o que por vezes é uma ligação pertencente a uma variação genética opcionalmente associada com uma medida da variância ou incerteza (por exemplo, desvio padrão, desvio absoluto mediano, precisão (por exemplo, dentro de um intervalo de confiança particular). Um módulo de variação genética, por vezes, é configurado para transmitir uma determinação da presença ou ausência de uma variação genética para outro módulo ou máquina, tal como uma máquina de exibição ou impressora, por exemplo.[526] In certain embodiments, a system, machine, and/or computer program product comprises a module of genetic variation. A genetic variation module is sometimes configured to provide a determination of the presence or absence of a genetic variation according to fragment counts (reads) mapped to genomic sections of a reference genome. A genetic variation module is sometimes configured to provide a determination of the presence or absence of a genetic variation based on a comparison of counts. A genetic variation module is often configured to access, receive, use, store, search and/or align one or more comparisons of a counts comparison module and/or counts of a count module. A genetic variation module can determine the presence or absence of a genetic variation from one or more comparisons or counts in an appropriate manner. A module of genetic variation sometimes determines whether there is a significant difference between counts for different sets of genomic sections in a reference genome. Difference significance can be determined through a genetic variation module in an appropriate manner (eg percent difference, Z score analysis). A genetic variation module sometimes determines whether a count determination or a count comparison is in a particular category. For example, a module of genetic variation can categorize a particular comparison to a threshold of a particular proportion or range of ratios associated with an euploid determination, or a threshold of a particular proportion or range of ratios associated with an aneuploid determination. In another non-limiting example, a genetic variation module can categorize a particular count determination to a particular ratio threshold or range of ratios associated with an euploid determination, or a threshold of a particular ratio or range of ratios. proportions associated with an aneuploid determination. A genetic variation module can provide a result in a suitable format, which is sometimes a binding pertaining to a genetic variation optionally associated with a measure of variance or uncertainty (e.g. standard deviation, median absolute deviation, precision (e.g. , within a particular confidence interval.) A genetic variation module is sometimes configured to transmit a determination of the presence or absence of a genetic variation to another module or machine, such as a display machine or printer, for example .

[527]Uma máquina ou sistema compreendendo um módulo aqui descrito (por exemplo, um módulo de comparação de referência) pode compreender um ou mais microprocessadores. Em algumas modalidades, uma máquina ou sistema pode incluir vários microprocessadores, tais como microprocessadores coordenados e que trabalham em paralelo. Um microprocessador (por exemplo, um ou mais microprocessadores) em um sistema ou em uma máquina pode executar e/ou implementar uma ou mais instruções (por exemplo, processos, rotinas e/ou sub-rotinas) em um módulo aqui descrito. Um módulo descrito aqui, por vezes, está localizado na memória, ou associado com uma máquina ou sistema. Em algumas modalidades, um módulo aqui descrito opera com um ou mais microprocessadores externos (por exemplo, uma rede interna ou externa, servidor, sistema de armazenamento e/ou rede de armazenamento (por exemplo, uma nuvem)). Em algumas modalidades, um módulo aqui descrito é configurado para acessar, unir, reunir e/ou receber dados e/ou informações de um outro módulo, máquina ou sistema (por exemplo, componente, periférico). Em algumas modalidades, um módulo aqui descrito é configurado para fornecer e/ou transferir dados e/ou informações para outro módulo, máquina ou sistema (por exemplo, componente, periférico). Em algumas modalidades, um módulo aqui descrito é configurado para acessar, aceitar, receber e/ou unir dados e/ou informações de entrada de um operador de uma máquina ou sistema (isto é, usuário). Por exemplo, às vezes um usuário fornece uma constante, um valor limite, uma fórmula e/ou um valor pré-determinado para um módulo. Um módulo aqui descrito, por vezes, está configurado para transformar dados e/ou informações que ele acessa recebe, une e/ou reúne.[527] A machine or system comprising a module described herein (e.g., a reference comparison module) may comprise one or more microprocessors. In some embodiments, a machine or system may include multiple microprocessors, such as microprocessors coordinated and working in parallel. A microprocessor (eg, one or more microprocessors) in a system or machine can execute and/or implement one or more instructions (eg, processes, routines and/or subroutines) in a module described herein. A module described here is sometimes located in memory, or associated with a machine or system. In some embodiments, a module described herein operates with one or more external microprocessors (e.g., an internal or external network, server, storage system, and/or storage network (e.g., a cloud)). In some embodiments, a module described herein is configured to access, join, gather and/or receive data and/or information from another module, machine or system (eg, component, peripheral). In some embodiments, a module described herein is configured to provide and/or transfer data and/or information to another module, machine, or system (e.g., component, peripheral). In some embodiments, a module described herein is configured to access, accept, receive and/or merge input data and/or information from an operator of a machine or system (i.e., user). For example, sometimes a user provides a constant, threshold value, formula, and/or predetermined value for a module. A module described here is sometimes configured to transform data and/or information that it accesses, receives, unites and/or gathers.

[528]Em certas modalidades, um sistema, máquina e/ou produto de programa de computador compreende (i) um módulo de sequenciamento configurado para obter e/ou acessar fragmentos (reads) de sequências de ácido nucleico e/ou fragmentos (reads) de sequências de nucleotídeo parciais; (ii) um módulo de mapeamento configurado para mapear fragmentos (reads) de sequências de ácido nucleico para porções de um genoma de referência; (iii) um módulo de contagem configurado para fornecer contagens de fragmentos (reads)de sequências de ácido nucleico mapeados para porções de um genoma de referência; (iv) um módulo de normalização configurado para fornecer contagens normalizadas; (v) um módulo de comparação configurado para fornecer uma identificação de uma primeira elevação que é significativamente diferente de uma segunda elevação; (vi) um módulo de ajuste de faixa configurado para fornecer uma ou mais faixas de nível esperado; (vii) um módulo de categorização configurado para identificar uma elevação representativa de uma variação do número de cópia; (viii) um módulo de ajuste configurado para ajustar um nível identificado como uma variação do número de cópia; (ix) um módulo de plotagem configurado para plotar e exibir um nível e/ou um perfil; (x) um módulo de resultado configurado para determinar a presença ou ausência de uma variação genética, ou determinar um resultado (por exemplo, resultado determinante da presença ou ausência de uma aneuploidia fetal); (xi) um módulo de organização de exibição de dados configurado para exibir uma determinação da variação genética; (xii) um módulo de processamento lógico configurado para executar uma ou mais fragmentos (reads) de sequências mapeados, contar fragmentos (reads) de sequências mapeados, normalizar contagens e gerar um resultado; (xiii) um módulo de comparação de contagem, (xiv) módulo de fração fetal configurado para fornecer uma determinação da fração fetal; (xv) um módulo de variação genética configurado para fornecer uma determinação da presença ou ausência de uma variação genética; ou (xvi) combinação de dois ou mais dos anteriores.[528] In certain embodiments, a system, machine and/or computer program product comprises (i) a sequencing module configured to obtain and/or access fragments (reads) of nucleic acid sequences and/or fragments (reads) of partial nucleotide sequences; (ii) a mapping module configured to map fragments (reads) of nucleic acid sequences to portions of a reference genome; (iii) a counting module configured to provide counts of fragments (reads) of nucleic acid sequences mapped to portions of a reference genome; (iv) a normalization module configured to provide normalized counts; (v) a comparison module configured to provide an identification of a first elevation that is significantly different from a second elevation; (vi) a range adjustment module configured to provide one or more expected level ranges; (vii) a categorization module configured to identify a representative elevation of a copy number variation; (viii) an adjustment module configured to adjust a level identified as a copy number variation; (ix) a plotting module configured to plot and display a level and/or a profile; (x) a result module configured to determine the presence or absence of a genetic variation, or determine an outcome (eg, result determining the presence or absence of a fetal aneuploidy); (xi) a data display organization module configured to display a determination of genetic variation; (xii) a logic processing module configured to execute one or more mapped sequence reads, count mapped sequence reads, normalize counts and generate a result; (xiii) a count comparison module, (xiv) a fetal fraction module configured to provide a fetal fraction determination; (xv) a genetic variation module configured to provide a determination of the presence or absence of a genetic variation; or (xvi) combination of two or more of the foregoing.

[529]Em algumas modalidades um módulo de sequenciamento e módulo de mapeamento estão configurados para transferir fragmentos (reads) de sequências do módulo de sequenciamento para o módulo de mapeamento. O módulo de contagem e módulo de mapeamento, por vezes, são configurados para transferir fragmentos (reads) de sequências mapeados do módulo de mapeamento para o módulo de contagem. Em algumas modalidades, o módulo de normalização e/ou módulo de comparação são configurados para transferir contagens normalizadas para o módulo de comparação e/ou o módulo de ajuste de faixa. O módulo de comparação, o módulo de ajuste de faixa e/ou o módulo de categorização independentemente são configurados para transferir (i) uma identificação de uma primeira elevação que é significativamente diferente de uma segunda elevação e/ou (ii) um faixa do nível esperado do módulo de comparação e/ou módulo de ajuste de faixa para o módulo de categorização, em algumas modalidades. Em certas modalidades, o módulo de categorização e o módulo de ajuste estão configurados para transferir uma elevação categorizada como uma variação do número de cópia do módulo de categorização para o módulo de ajuste. Em algumas modalidades, o módulo de ajuste, e módulo de plotagem e o módulo de resultado estão configurados para transferir um ou mais níveis ajustados do módulo de ajuste para o módulo do plotagem ou módulo de resultado. O módulo de normalização às vezes é configurado para transferir contagem legível de sequência normalizada mapeadas para um ou mais do módulo de comparação, módulo de ajuste da faixa, módulo de categorização, módulo de ajuste, módulo de resultado ou módulo de plotagem.[529] In some embodiments a sequencing module and mapping module are configured to transfer fragments (reads) of sequences from the sequencing module to the mapping module. The counting module and mapping module are sometimes configured to transfer reads of mapped sequences from the mapping module to the counting module. In some embodiments, the normalization module and/or the comparison module are configured to transfer normalized counts to the comparison module and/or the sizing module. The comparison module, the range adjustment module and/or the categorization module are independently configured to transfer (i) an identification of a first elevation that is significantly different from a second elevation and/or (ii) a range of the level expected from the comparison module and/or range adjustment module to the categorization module, in some embodiments. In certain embodiments, the categorization module and the adjustment module are configured to transfer a categorized elevation as a copy number variation from the categorization module to the adjustment module. In some embodiments, the fit module, plot module, and result module are configured to transfer one or more adjusted levels from the fit module to the plot module or result module. The normalization module is sometimes configured to transfer readable counts of mapped normalized sequences to one or more of the compare module, range fit module, categorization module, fit module, result module, or plot module.

ExemplosExamples

[530]Os exemplos a seguir são fornecidos por meio de ilustração apenas e não por meio de limitação. Desse modo, os exemplos apresentados a seguir ilustram certas modalidades e não limitam a tecnologia. Aqueles versados na técnica reconhecerão facilmente uma variedade de parâmetros não-críticos que poderiam ser alterados ou modificados para se obter essencialmente os mesmos resultados ou semelhantes.[530]The following examples are provided by way of illustration only and not by way of limitation. Thus, the examples presented below illustrate certain modalities and do not limit the technology. Those skilled in the art will readily recognize a variety of non-critical parameters that could be altered or modified to obtain essentially the same or similar results.

Exemplo 1: PERUN e métodos gerais para a detecção de condições associadas com variações genéticasExample 1: PERUN and general methods for detecting conditions associated with genetic variations

[531]Os métodos e teoria subjacente aqui descritos podem ser usados para detectar várias condições associadas com a variação genética e fornecer um resultado determinante, ou determinar a presença ou ausência de uma variação genética.[531]The methods and underlying theory described herein can be used to detect various conditions associated with genetic variation and provide a determinant result, or to determine the presence or absence of a genetic variation.

Remoção de porções não informativas de um genoma de referênciaRemoval of uninformative portions of a reference genome

[532]Várias tentativas de remover porções não informativas de um genoma de referência indicaram que a seleção da porção tem o potencial para melhorar a classificação. Equação A: M = LI + GS[532]Several attempts to remove uninformative portions of a reference genome have indicated that portion selection has the potential to improve classification. Equation A: M = LI + GS

[533]Os vários termos na Equação A têm os seguintes significados: • M: contagens medidas, representando a informação primária poluída pela variação indesejada. • L: nível cromossômico - isso é a saída desejada do processo de processamento de dados. L indica aberrações fetais e/ou maternas de euplóide. Isso é a quantidade que é mascarada ambos por erros estocásticos e pelos a tendência sistemáticos. O nível cromossômico L é ambos específico da amostra e específico da porção. • G: coeficiente da tendência de GC medido usando modelo linear, LOESS, ou qualquer abordagem equivalente. G representa informação secundária, extraída de M e de um conjunto de valores do teor de GC específicos da porção, normalmente derivados do genoma de referência (mas podem ser derivados de teores de GC realmente observados também). G é específico da amostra e não varia ao longo da posição genômica. Ele encapsula uma porção da variação indesejada. • I: Intercepção do modelo linear. Esse parâmetro do modelo é fixo para uma dada configuração experimental, independente da amostra, específico da porção. • S: Declive do modelo linear. Esse parâmetro de modelo é fixo para uma dada configuração experimental, independente da amostra, e específico da porção.[533]The various terms in Equation A have the following meanings: • M: measured counts, representing primary information polluted by unwanted variation. • L: chromosome level - this is the desired output of the data processing process. L indicates fetal and/or maternal euploid aberrations. This is the amount that is masked both by stochastic errors and by systematic biases. The L chromosome level is both sample-specific and portion-specific. • G: GC trend coefficient measured using linear model, LOESS, or any equivalent approach. G represents secondary information, extracted from M and a set of portion-specific GC content values, usually derived from the reference genome (but can be derived from actually observed GC contents as well). G is sample-specific and does not vary across genomic position. It encapsulates a portion of the unwanted variation. • I: Linear model intercept. This model parameter is fixed for a given experimental setup, sample-independent, portion-specific. • S: Slope of the linear model. This model parameter is fixed for a given experimental setup, sample-independent, and portion-specific.

[534]As quantidades M e G são medidas. Inicialmente, os valores específicos da porção I e S são desconhecidos. Para avaliar I e S desconhecidos, nós devemos supor que L = 1 para todas as porções de um genoma de referência em amostras euplóides. A suposição nem sempre é verdade, mas pode razoavelmente esperar que quaisquer amostras com deleções/duplicações irão ser oprimidas por amostras com níveis cromossômicos normais. Um modelo linear aplicado para as amostras euplóides extrai os valores de parâmetro I e S específicos para a porção selecionada (assumindo L = 1). O mesmo procedimento é aplicado a todas as porções de um genoma de referência no genoma humano, obtendo-se um conjunto de interceptos I e declives S para cada local genômico. A validação cruzada seleciona aleatoriamente um conjunto de trabalho que contém 90% de todos os euplóides LDTv2CE e usa esse subconjunto para treinar o modelo. A seleção aleatória é repetida 100 vezes, obtendo-se um conjunto de 100 declives e 100 interceptos para cada porção.[534]Quantities M and G are measured. Initially, the specific values of the I and S portion are unknown. To evaluate unknown I and S, we must assume that L = 1 for all portions of a reference genome in euploid samples. The assumption is not always true, but it can reasonably be expected that any samples with deletions/duplications will be overwhelmed by samples with normal chromosome levels. A linear model applied to the euploid samples extracts the specific I and S parameter values for the selected portion (assuming L = 1). The same procedure is applied to all portions of a reference genome in the human genome, obtaining a set of I intercepts and S slopes for each genomic locus. Cross-validation randomly selects a working set that contains 90% of all LDTv2CE euploids and uses this subset to train the model. The random selection is repeated 100 times, obtaining a set of 100 slopes and 100 intercepts for each portion.

Extração de nível cromossômico de contagens medidasChromosomal level extraction of measured counts

[535]Assumindo que os valores do parâmetro de modelo I e S estão disponíveis para cada porção, medições M coletadas em uma nova amostra de teste são usadas para avaliar o nível cromossômico de acordo com a seguinte Equação B: L = (M-GS)/I (B) Como na Equação A, coeficiente da tendência de CG é avaliado como o coeficiente de regressão linear entre as contagens brutas medidas em porções M e o teor de GC do genoma de referência. O nível cromossômico L, em seguida, é usado para análises posteriores (valores de Z, deleções /duplicações maternas, micro-deleções/micro-duplicações maternas, gênero fetal, aneuploidias do sexo, e desse modo por diante). O procedimento encapsulado pela Eq. B é chamado de Remoção de Erro Parametrizado e Normalização Imparcial (PERUN).[535]Assuming that model parameter values I and S are available for each portion, M measurements collected on a new test sample are used to assess the chromosome level according to the following Equation B: L = (M-GS )/I (B) As in Equation A, coefficient of GC bias is evaluated as the linear regression coefficient between raw counts measured in M portions and the GC content of the reference genome. The L chromosome level is then used for further analysis (Z values, maternal deletions/duplications, maternal microdeletions/microduplications, fetal gender, sex aneuploidies, and so on). The procedure encapsulated by Eq. B is called Parameterized Error Removal and Unbiased Normalization (PERUN).

Exemplo 2: Exemplos de fórmulasExample 2: Examples of formulas

[536]São fornecidos a seguir exemplos não-limitativos de fórmulas matemáticas e/ou estatísticas que podem ser usadas em métodos aqui descritos.[536]Non-limitative examples of mathematical and/or statistical formulas that can be used in methods described herein are provided below.

[537]Pontuações de z e valores de p calculados de pontuações de Z associados com desvios do nível esperado de 1 podem então ser avaliados à luz da estimativa para a incerteza no nível médio. Os valores de p são baseados em uma distribuição de t cuja ordem é determinada pelo número de porções de um genoma de referência em um pico. Dependendo do nível de confiança desejado, um corte pode suprimir ruído e permitir a detecção inequívoca do sinal real. Equação 1: Equação 1 pode ser usada para comparar diretamente nível do pico a partir de duas amostras diferentes, em que N e n referem-se aos números de porções de um genoma de referência em todo o cromossomo e dentro da aberração, respectivamente. A ordem do teste t que produzirá um valor de p medindo a semelhança entre duas amostras é determinada pelo número de porções de um genoma de referência no mais curto dos dois trechos desviantes.[537]Z scores and p-values calculated from Z scores associated with deviations from the expected level of 1 can then be evaluated in light of the estimate for the uncertainty at the mean level. The p values are based on a t distribution whose order is determined by the number of portions of a reference genome in a peak. Depending on the desired confidence level, a cut can suppress noise and allow unambiguous detection of the real signal. Equation 1: Equation 1 can be used to directly compare peak levels from two different samples, where N and n refer to the numbers of portions of a reference genome across the chromosome and within the aberration, respectively. The order of the t-test that will produce a p-value measuring the similarity between two samples is determined by the number of portions of a reference genome in the shorter of the two deviant stretches.

[538]Equação 8 pode ser usada para incorporar fração fetal, ploidia materna, e contagens médias de referência em um esquema de classificação para a determinação da presença ou ausência de uma variação genética no que diz respeito a aneuploidia fetal. Equação 8: onde Yi representa as contagens medidas para uma porção na amostra de teste correspondente à porção no perfil de contagem mediana, F representa a fração fetal, X representa a ploidia fetal, e Mi representa ploidia materna atribuída a cada porção. Os possíveis valores para X usados na equação (8) são: 1 se o feto é euplóide; 3/2, se o feto é triplóide; e, 5/4, se há fetos gêmeos e um é afetado e um não é. 5/4 é utilizado no caso de gêmeos onde um feto é afetado e o outra não, porque o termo F na equação (8) representa o DNA total do feto, por conseguinte, todo o DNA fetal deve ser levado em conta. Em algumas modalidades, grandes deleções e/ou duplicações no genoma materno podem ser contabilizadas atribuindo ploidia materna, Mi para cada porção ou porção. Ploidia materna frequentemente é designada como um múltiplo de 1/2, e pode ser estimada usando normalização e porções, em algumas modalidades. Porque ploidia materna frequentemente é um múltiplo de 1/2, ploidia materna pode ser facilmente explicada, e, portanto, não será incluída em outras equações para simplificar derivações.[538]Equation 8 can be used to incorporate fetal fraction, maternal ploidy, and mean reference counts into a scoring scheme for determining the presence or absence of a genetic variation with respect to fetal aneuploidy. Equation 8: where Yi represents the measured counts for a portion in the test sample corresponding to the portion in the median count profile, F represents the fetal fraction, X represents fetal ploidy, and Mi represents maternal ploidy assigned to each portion. Possible values for X used in equation (8) are: 1 if the fetus is euploid; 3/2, if the fetus is triploid; and, 5/4, if there are twin fetuses and one is affected and one is not. 5/4 is used in the case of twins where one fetus is affected and the other is not, because the F term in equation (8) represents the total DNA of the fetus, therefore, all fetal DNA must be taken into account. In some embodiments, large deletions and/or duplications in the maternal genome can be accounted for by assigning maternal ploidy, Mi to each portion or portion. Maternal ploidy is often designated as a multiple of 1/2, and can be estimated using normalization and portions, in some modalities. Because maternal ploidy is often a multiple of 1/2, maternal ploidy can be easily explained, and therefore will not be included in other equations to simplify derivations.

[539]Ao avaliar a equação (8) com X = 1, (por exemplo, suposição euplóide), a fração fetal é cancelada e a seguinte equação resulta da a soma dos resíduos quadrados. Equação 9: Para simplificar equação (9) e cálculos subsequentes, as equações a seguir são utilizadas. Equação 10: Equação 11: Equação 12: Ao avaliar a equação (8) com X = 3/2 (por exemplo, suposição triplóide), a equação a seguir resulta da soma dos resíduos quadrados. Equação 13: A diferença entre equações (9) e (13) forma o resultado funcional (por exemplo, phi) que pode ser usado para testar a hipótese do nulo (por exemplo, euplóide, X = 1) contra a hipótese alternativa (singleto de trissomia, X = 3/2): Equação 14: Equação 18: Valor ideal de ploidia por vezes é dado pela Equação 20: O termo para ploidia materna, Mi, pode ser omitido para algumas derivações matemáticas. A expressão resultante para X corresponde ao caso especial relativamente simples e muitos vezes que ocorre frequentemente de quando a mãe não tem deleções ou duplicações no cromossomo ou cromossomos sendo avaliados. Equação 21: Xiff e Xify são fornecidos pelas equações (11) e (12), respectivamente. Em modalidades onde todos os erros experimentais são negligenciáveis, equação de solução (21) resulta em um valor de 1 para euplóides onde Xiff = Xify. Em certas modalidades onde todos os erros experimentais são negligenciáveis, equação de solução (21) resulta em um valor de 3/2 paratriplóides (ver equação (15) para relacionamentotriplóide entre Xiff e Xify. Tabela 2 [539]When evaluating equation (8) with X = 1, (eg euploid assumption), the fetal fraction is canceled and the following equation results from the sum of squared residuals. Equation 9: To simplify equation (9) and subsequent calculations, the following equations are used. Equation 10: Equation 11: Equation 12: When evaluating equation (8) with X = 3/2 (eg, triploid assumption), the following equation results from the sum of squared residuals. Equation 13: The difference between equations (9) and (13) forms the functional result (e.g. phi) which can be used to test the null hypothesis (e.g. euploid, X = 1) against the alternative hypothesis (trisomy singlet, X = 3/2): Equation 14: Equation 18: Ideal ploidy value is sometimes given by Equation 20: The term for maternal ploidy, Mi, may be omitted for some mathematical derivations. The resulting expression for X corresponds to the relatively simple and often-frequently occurring special case of when the mother has no deletions or duplications in the chromosome or chromosomes being evaluated. Equation 21: Xiff and Xify are provided by equations (11) and (12), respectively. In embodiments where all experimental errors are negligible, solution equation (21) results in a value of 1 for euploids where Xiff = Xify. In certain embodiments where all experimental errors are negligible, solution equation (21) results in a paratriploid value of 3/2 (see equation (15) for triploid relationship between Xiff and Xify. Table 2

Exemplo 3: Seleção da porção usando FRS.Example 3: Portion selection using FRS.

[541]Porções do genoma humano de referência designado HG19 foram primeiro pré-filtradas através de um método baseado em PERUN que remove porções com alta variabilidade, baixa mapeabilidade e se liga com uma grande percentagem de elementos repetitivos. Porções (como selecionado para LDTv2) com alta variabilidade, baixa mapeabilidade, e uma grande fração de sequências repetidas foram excluídas. Para cada porção de 50 kb (por exemplo, porção), uma proporção estatística fetal foi calculada para fragmentos (reads) de sequências finais pareadas de fragmentos CCF menos de 150 bases e de fragmentos CCF a menos de 600 bases. O FRS foi, então, tirado a média entre 264 amostras não-agrupadas processadas usando preparação da biblioteca de bioquímica TruSeq com o cleanup de grânulo automatizado. Porções com FRS > mediana (FRS) foram selecionados e são apresentados na Tabela 4 com referência a posições de início e fim específicas do cromossomo. Posições de início e fim específicas do cromossomo na tabela 4 referenciam posições de base de nucleotídeo em genoma de referência humano HG19.[541] Portions of the human reference genome designated HG19 were first prefiltered using a PERUN-based method that removes portions with high variability, low mappability, and binds with a high percentage of repetitive elements. Portions (as selected for LDTv2) with high variability, low mappability, and a large fraction of repeated sequences were excluded. For each 50 kb chunk (eg, chunk), a fetal statistical ratio was calculated for fragments (reads) of final sequence paired CCF fragments less than 150 bases and CCF fragments less than 600 bases. The FRS was then averaged across 264 unpooled samples processed using TruSeq biochemistry library preparation with the automated bead cleanup. Portions with FRS > median (FRS) were selected and are presented in Table 4 with reference to specific chromosome start and end positions. Chromosome-specific start and end positions in Table 4 reference nucleotide base positions in human reference genome HG19.

[542]Todas as porções com FRS > mediana (FRS) foram plotadas concorrentemente com o número de posições de início de éxon único em cada respectiva porção. Uma correlação significativa foi mostrada para as regiões de genes que contêm uma super-representação de pequenos fragmentos (Figuras 1 - 9). Uma correlação significativamente mais forte foi mostrada com teor de GC (percentagem de bases de GC em uma porção de 50kb) e FRS (Tabela 3).[542]All portions with FRS > median (FRS) were plotted concurrently with the number of single exon start positions in each respective portion. A significant correlation was shown for gene regions that contain an overrepresentation of small fragments (Figures 1 - 9). A significantly stronger correlation was shown with GC content (percentage of GC bases in a 50kb portion) and FRS (Table 3).

[543]Seleção da porção foi ainda restrita às porções (isto é, porções) do genoma onde o FRS > mediana (FRS) para a detecção de trissomia cromossômica. A aplicação dessa abordagem em um conjunto de dados preliminar de 264 amostras forneceu margens de classificação consistentes para ponderar de descartar 50% dos dados. Por outro lado, restringindo porções onde FRS < mediana (FRS), a margem de classificação foi drasticamente reduzida, o que sugere uma diluição de DNA fetal para análises (Figuras 10 - 11).[543] Portion selection was further restricted to portions (ie, portions) of the genome where FRS > median (FRS) for detection of chromosomal trisomy. Applying this approach to a preliminary dataset of 264 samples provided consistent ranking margins for weighting to discard 50% of the data. On the other hand, by restricting portions where FRS < median (FRS), the classification margin was drastically reduced, which suggests a dilution of fetal DNA for analysis (Figures 10 - 11).

[544]Na figura 10 e Figura 11 existem duas linhas de regressão, uma para amostras não-T21 somente (linha traço- ponto) e outra para as amostras T21 (linha pontilhada). A linha de regressão para as amostras T21 baseadas em altas porções de FRS ficou acima da linha de regressão para amostras não-T21 com base em alto FRS (Figura 10). Por outro lado, essa regressão semelhante foi menor do que as amostras não-T21 quando se comparam as pontuações de Z calculadas em baixas porções de FRS (Figura 11). Isso sugere que o uso de altas porções de FRS pode melhorar a precisão das determinações do resultado, já que as pontuações de Z tendem a ser maiores para as amostras T21. Tabela 3 [544]In Figure 10 and Figure 11 there are two regression lines, one for non-T21 samples only (dash-dot line) and another for T21 samples (dotted line). The regression line for T21 samples based on high FRS portions was above the regression line for non-T21 samples based on high FRS (Figure 10). On the other hand, this similar regression was lower than the non-T21 samples when comparing Z scores calculated on low portions of FRS (Figure 11). This suggests that using high FRS portions can improve the accuracy of outcome determinations, as Z scores tend to be higher for T21 samples. Table 3

Exemplo 4 Detecção de trissomia 21 usando uma combinação de separação baseada na sequência e análises baseadas no comprimentoExample 4 Detection of trisomy 21 using a combination of sequence-based sorting and length-based analyzes

[545]As amostras de plasma contendo o DNA isento de célula circulante obtidas de mulheres grávidas são testadas para trissomia 21, usando o método a seguir.[545]Plasma samples containing the circulating cell-free DNA obtained from pregnant women are tested for trisomy 21 using the following method.

Separação baseada na sequênciaSequence based sorting

[546]Uma biblioteca de captura customizada SURESELECT é obtida a partir da Agilent que inclui um conjunto de RNAs de captura biotinilados projetados customizados. Os RNAs de captura são projetados de acordo com as sequências de nucleotídeos específicos no cromossomo 21 (cromossomo teste) e específicos no cromossomo 14 (cromossomo de referência) e são identificados pela ferramenta de design baseado na web EARRAY da Agilent. 100 RNAs de captura independentes são projetados para cada um dos cromossomos 14 e 21. Sequências de nucleotídeo de cópia único na faixa de 40 a 60 pares de bases que são únicos no cromossomo 14 ou 21 e são ricos em AT são selecionados para o projeto de RNA customizado.[546] A SURESELECT custom capture library is obtained from Agilent that includes a set of custom designed biotinylated capture RNAs. Capture RNAs are designed according to specific nucleotide sequences on chromosome 21 (test chromosome) and specific on chromosome 14 (reference chromosome) and are identified by Agilent's EARRAY web-based design tool. 100 independent capture RNAs are designed for each of chromosomes 14 and 21. Single copy nucleotide sequences in the range of 40 to 60 base pairs that are unique to chromosome 14 or 21 and are rich in AT are selected for the design of Custom RNA.

[547]Amostra de ácido nucleico, que é ácido nucleico de plasma circulante isento de células de uma mulher grávida no primeiro trimestre de gravidez, é dividida em dois tubos e incubada ou com RNA de captura 21 ou RNA de captura 14 do cromossomo durante 24 horas a 65°C, de acordo com as instruções do fabricante. Após a hibridização, os fragmentos capturados alvos e fragmentos de referência capturados (coletivamente referidos como fragmentos capturados) são selecionados, puxando para baixo os híbridos de RNA/fragmento biotinilado usando esferas magnéticas revestidas com estreptavidina (DYNAL DYNAMAG-2, Invitrogen, Carlsbad, CA), e purificados com o kit de purificação de PCR MinElute (Qiagen, Germantown, MD). RNA de captura é digerido e os fragmentos de DNA restantes são amplificados de acordo com as instruções do fabricante.[547]Nucleic acid sample, which is nucleic acid from circulating cell-free plasma of a pregnant woman in the first trimester of pregnancy, is divided into two tubes and incubated with either chromosomal capture RNA 21 or capture RNA 14 for 24 hours at 65°C, according to the manufacturer's instructions. After hybridization, the captured target fragments and captured reference fragments (collectively referred to as captured fragments) are selected by pulling down the RNA/biotinylated fragment hybrids using streptavidin-coated magnetic beads (DYNAL DYNAMAG-2, Invitrogen, Carlsbad, CA ), and purified with the MinElute PCR purification kit (Qiagen, Germantown, MD). Capture RNA is digested and the remaining DNA fragments are amplified according to the manufacturer's instructions.

Análise baseada no comprimentoLength based analysis

[548]As amostras que continham os fragmentos de ácidos nucleicos separados de acima são hibridizadas sob condições rigorosas de hibridização para as sondas de poli-inosina compreendendo inosina biotinilada, cujas sondas são mais longas do que os fragmentos de DNA para os quais elas hibridizam e 500 pares de bases de comprimento. Em algumas modalidades, a hibridização é realizada durante a noite a 65°C em 6 x SSC e 1% de SDS Em algumas modalidades, a hibridização é realizada durante a noite a 43°C em NaCl a 1,0 M, tampão fosfato de sódio a 50 mM (pH 7,4), EDTA a 1,0 mM, 2% (p/v) de dodecil sulfato de sódio, 0,1% (p/v) de gelatina, 50 μg/mL de RNAt e 30% (v/v) de formamida. Quatro lavagens de 30 minutos são realizadas a 55°C em 1,2X SSC (1X SSC é NaCl a 0,15 M mais citrato de sódio a 0,015 M), fosfato de sódio a 10 mM (pH 7,4), EDTA a 1,0 mM e 0,5% (p/v) de dodecil sulfato de sódio. Após a hibridização, as porções da sonda não hibridizada são digeridas usando exonuclease I (New England Biolabs, Ipswich, MA) e fosfodiesterase II (Worthington Biochemical Corp., Lakewood, NJ). Os duplexes de sonda-fragmento são desnaturados a 95°C durante dois minutos, e as sondas são separados longe dos fragmentos (isto é, puxadas para baixo) usando esferas magnéticas revestidas com estreptavidina (Dynal DYNAMAG-2, Invitrogen, Carlsbad, CA), e purificadas com o kit de purificação de PRC MinElute(Qiagen, Germantown, MD). Sondas de poli-inosina aparadas, isoladas e purificadas são medidas para a massa usando espectrometria de massa MALDI. Comprimento da sonda, e desse modo o comprimento do fragmento correspondente, é extrapolado dos picos de massa para cada espécie de comprimento da sonda por comparação com picos de massa para padrões de poli-inosina biotinilada de comprimento conhecido.[548]Samples containing the above separated nucleic acid fragments are hybridized under stringent hybridization conditions to poly-inosine probes comprising biotinylated inosine, which probes are longer than the DNA fragments to which they hybridize and 500 base pairs long. In some embodiments, hybridization is performed overnight at 65°C in 6 x SSC and 1% SDS In some embodiments, hybridization is performed overnight at 43°C in 1.0 M NaCl, sodium phosphate buffer 50 mM sodium (pH 7.4), 1.0 mM EDTA, 2% (w/v) sodium dodecyl sulfate, 0.1% (w/v) gelatin, 50 μg/mL tRNA and 30% (v/v) formamide. Four 30-minute washes are performed at 55°C in 1.2X SSC (1X SSC is 0.15 M NaCl plus 0.015 M sodium citrate), 10 mM sodium phosphate (pH 7.4), 100 ml EDTA 1.0 mM and 0.5% (w/v) sodium dodecyl sulfate. After hybridization, portions of the unhybridized probe are digested using exonuclease I (New England Biolabs, Ipswich, MA) and phosphodiesterase II (Worthington Biochemical Corp., Lakewood, NJ). The probe-fragment duplexes are denatured at 95°C for two minutes, and the probes are separated away from the fragments (i.e., pulled down) using streptavidin-coated magnetic beads (Dynal DYNAMAG-2, Invitrogen, Carlsbad, CA) , and purified with the MinElute PRC Purification Kit (Qiagen, Germantown, MD). Trimmed, isolated and purified polyinosine probes are measured for mass using MALDI mass spectrometry. Probe length, and thus the corresponding fragment length, is extrapolated from the mass peaks for each probe length species by comparison with mass peaks for biotinylated polyinosine standards of known length.

Determinação da trissomia 21Determination of trisomy 21

[549]A quantidade relativa de cada espécie de comprimento de fragmento é determinada com base na amplitude dos picos de massa para cada espécie de comprimento da sonda. Fragmentos de 150 pares de bases ou menos são quantificados para cromossomo 14 e cromossomo 21. As amostras com quantidades substancialmente iguais de fragmentos de cromossomo 14 e cromossomo 21 são determinadas como euplóide para o cromossomo 21. As amostras com uma quantidade significativamente maior de fragmentos do cromossomo 21 versus cromossomo 14 (por exemplo, a elevação de 2% nos fragmentos de cromossomo 21 versus cromossomo 14) são determinadas como triplóide para cromossomo 21.[549]The relative amount of each fragment length species is determined based on the amplitude of the mass peaks for each probe length species. Fragments of 150 base pairs or less are quantified for chromosome 14 and chromosome 21. Samples with substantially equal amounts of chromosome 14 and chromosome 21 fragments are determined to be euploid for chromosome 21. chromosome 21 versus chromosome 14 (for example, the 2% elevation in fragments of chromosome 21 versus chromosome 14) are determined as triploid to chromosome 21.

Exemplo 5: Detecção de trissomia usando a filtragem do comprimento de fragmento e representação do cromossomoExample 5: Trisomy detection using fragment length filtering and chromosome representation

[550]Nesse exemplo, as amostras maternais que contêm o ácido nucleico isento de células foram classificadas como carregando um feto euplóide ou um feto tendo uma aneuploidia (isto é, trissomia 13, trissomia 18, trissomia 21) com base nas contagens legíveis da sequência de nucleotídeos de um subconjunto de fragmentos tendo certos parâmetros de comprimento. As amostras foram obtidas a partir do Hospital de mulheres e crianças (WI study; Palomaki et al. (2011) Genet Med 13 (11):913-20). Fragmentos (reads) de sequências de nucleotídeo (fragmentos (reads)de base 36) para cada amostra foram obtidos usando uma plataforma de sequenciamento de extremidade pareada Illumina (Illumina, Inc., San Diego, CA). Fragmentos (reads) de sequências de nucleotídeo de extremidade pareada foram alinhados para um genoma de referência (build 37 (hg19)) usando o programa de alinhamento BOWTIE 2 beta 3 e o comprimento do fragmento foi determinado com base nos alinhamentos dos fragmentos (reads) de extremidade pareada.[550]In this example, maternal samples containing cell-free nucleic acid were classified as carrying a euploid fetus or a fetus having an aneuploidy (i.e., trisomy 13, trisomy 18, trisomy 21) based on readable sequence counts of nucleotides from a subset of fragments having certain length parameters. Samples were obtained from the Women's and Children's Hospital (WI study; Palomaki et al. (2011) Genet Med 13(11):913-20). Nucleotide sequence reads (base 36 reads) for each sample were obtained using an Illumina paired-end sequencing platform (Illumina, Inc., San Diego, CA). Fragments (reads) of paired-end nucleotide sequences were aligned to a reference genome (build 37 (hg19)) using the BOWTIE 2 beta 3 alignment program and fragment length was determined based on the alignments of the fragments (reads) paired end.

[551]Certos fragmentos (reads) de sequências de nucleotídeo foram filtrados de acordo com os seguintes parâmetros de comprimento de fragmento de ácido nucleico e: 1) os fragmentos tendo comprimentos maiores que ou igual a 120 bases; 2)fragmentos tendo comprimentos maiores do que ou iguais a 130 bases; 3) fragmentos tendo comprimentos maiores do que ou iguais a 140 bases; 4) fragmentos tendo comprimentos maiores do que ou iguais a 150 bases; 5) fragmentos tendo comprimentos maiores do que ou iguais a 160 bases; ou 6) fragmentos tendo comprimentos maiores do que ou iguais a 170 bases. Desse modo, fragmentos (reads) de extremidade pareada correspondentes aos fragmentos iguais ou maiores do que um dado limite de comprimento (por exemplo, 120 bases, 130 bases, 140 bases, 150 bases, 160 bases, 170 bases) foram filtrados e fragmentos (reads) de extremidade pareada correspondendo aos fragmentos mais curtos do que um dado limite de comprimento foram retidos para análise.[551]Certain fragments (reads) of nucleotide sequences were filtered according to the following nucleic acid fragment length parameters and: 1) fragments having lengths greater than or equal to 120 bases; 2) fragments having lengths greater than or equal to 130 bases; 3) fragments having lengths greater than or equal to 140 bases; 4) fragments having lengths greater than or equal to 150 bases; 5) fragments having lengths greater than or equal to 160 bases; or 6) fragments having lengths greater than or equal to 170 bases. Thus, end-paired reads corresponding to fragments equal to or greater than a given length threshold (e.g., 120 bases, 130 bases, 140 bases, 150 bases, 160 bases, 170 bases) were filtered and fragments ( end-paired reads) corresponding to fragments shorter than a given length threshold were retained for analysis.

[552]Representações cromossômicas para cromossomo 13, cromossomo 18 e cromossomo 21 foram calculadas para conjuntos de dados apresentados na Figura 23 usando 1) fragmentos (reads) de sequências não filtrados e 2) fragmentos (reads) de sequências filtrados-comprimento em um limite de 150 fragmentos de base. Representação do cromossomo para cada cromossomo 13, 18 e 21 foram calculadas de acordo com o seguinte: Representação de cromossomo 13 (Chr 13) = ∑ contagens legíveis de sequência Chr 13 (não filtradas)/ ∑ todas as contagens legíveis de sequência autossômica (não filtradas) Representação de cromossomo 13 (Chr 13) = ∑ contagens legíveis de sequência Chr 13 (filtradas)/ ∑ todas as contagens legíveis de sequência autossômica (filtradas) Representação de cromossomo 18 (Chr 18) = ∑ contagens legíveis de sequência Chr 18 (não filtradas)/ ∑ todas as contagens legíveis de sequência autossômica (não filtradas) Representação de cromossomo 18 (Chr 18) = ∑ contagens legíveis de sequência Chr 18 (filtradas)/ ∑ todas as contagens legíveis de sequência autossômica (filtradas) Representação de cromossomo 21 (Chr 21) = ∑ contagens legíveis de sequência Chr 21 (não filtradas)/ ∑ todas as contagens legíveis de sequência autossômica (não filtradas) Representação de cromossomo 21 (Chr 21) = ∑ contagens legíveis de sequência Chr 21 (filtradas)/ ∑ todas as contagens legíveis de sequência autossômica (filtradas) As figuras 14, 16 e 18 mostram representações de cromossomo para os cromossomos 13, 18 e 21, respectivamente, usando fragmentos (reads) de sequências não filtrados. As figuras 15, 17 e 19 mostram representações de cromossomo para os cromossomos 13, 18 e 21, respectivamente, usando fragmentos (reads) de sequências filtrados-comprimento. Para conjuntos de dados filtrados, a representação do cromossomo aumentou para as amostras de trissomia, devido em parte a um aumento nos dados de sequência fetal contribuídos. Embora esse aumento na representação do cromossomo possa aumentar o poder de detectar anormalidades cromossômicas, a variância da representação do cromossomo para amostras com não-trissomia aumentou devido a uma redução aproximada de 63-82% nas contagens de fragmento (read). Distribuições do exemplo de contagens legíveis em vários valores limite do comprimento do fragmento são ilustradas na figura 13 e apresentadas na Tabela 5 abaixo. Tabela 5 [552]Chromosome representations for chromosome 13, chromosome 18 and chromosome 21 were calculated for datasets shown in Figure 23 using 1) unfiltered sequence reads and 2) length-filtered sequence reads on a threshold of 150 base fragments. Chromosome representations for each chromosome 13, 18, and 21 were calculated according to the following: Chromosome 13 (Chr 13) representation = ∑ Chr 13 (unfiltered) sequence readable counts/ ∑ all autosomal (unfiltered) sequence readable counts (filtered) Chromosome 13 (Chr 13) representation = ∑ Chr 13 sequence readable counts (filtered)/ ∑ all autosomal sequence readable counts (filtered) Chromosome 18 (Chr 18) representation = ∑ Chr 18 sequence readable counts ( unfiltered)/ ∑ all readable autosomal sequence counts (unfiltered) Chromosome 18 (Chr 18) representation = ∑ readable counts of Chr 18 sequence (filtered)/ ∑ all readable autosomal sequence counts (filtered) Chromosome representation 21 (Chr 21) = ∑ readable counts of Chr 21 sequence (unfiltered)/ ∑ all readable counts of autosomal sequence (unfiltered) Representation of chromosome 21 (Chr 21) = ∑ readable counts of Chr 21 sequence (filtered)/ ∑ all readable autosomal sequence counts (filtered) Figures 14, 16 and 18 show chromosome representations for chromosomes 13, 18 and 21, respectively, using unfiltered sequence reads. Figures 15, 17 and 19 show chromosome representations for chromosomes 13, 18 and 21, respectively, using length-filtered sequence reads. For filtered datasets, chromosome representation increased for the trisomy samples, due in part to an increase in contributed fetal sequence data. While this increase in chromosome representation may increase the power to detect chromosomal abnormalities, the chromosome representation variance for non-trisomy samples increased due to an approximate 63-82% reduction in fragment counts (read). Example distributions of readable counts at various threshold values of fragment length are illustrated in Figure 13 and presented in Table 5 below. Table 5

[553]A área média sob a curva (AUC) para fragmentos (reads) de fragmentos de menos do que um certo comprimento foi determinada para ilustrar a redução total de fragmentos (reads) (ou seja, a cobertura de sequência) vista em média. Para um dado ensaio que gera cerca de 15 milhões de fragmentos (reads) de sequências (ou cobertura de 0,2X do genoma humano), a exclusão dos fragmentos (reads) maiores do que 150 bases, por exemplo, é equivalente a cerca de cobertura de 0,035X.[553]The average area under the curve (AUC) for fragment reads of less than a certain length was determined to illustrate the total reduction of fragments (reads) (i.e. sequence coverage) seen on average . For a given assay that generates about 15 million sequence reads (or 0.2X coverage of the human genome), excluding reads longer than 150 bases, for example, is equivalent to about 0.035X coverage.

[554]Para determinar um limite do tamanho do fragmento ideal para a representação do cromossomo, limite do tamanho do fragmento variou de 120 a 170 bases, em incrementos de 10 bases. Representação do cromossomo (ou seja, para os cromossomos 13, 18 e 21) foi calculada após normalização da contagem legível de sequência (ou seja, PERUN preenchido com LOESS) para cada conjunto de dados filtrado-comprimento (fragmentos (reads) de extremidade pareada) e para um conjunto de dados não filtrado (fragmentos (reads) de extremidade única; também referida como “todo”). Representações dos cromossomos 13, 18 e 21 são apresentadas nas Figuras 20, 21 e 22, respectivamente. Representação do cromossomo para os conjuntos de dados filtrados no limite de 150, 160 e 170 bases foi bastante consistente com o conjunto de dados não filtrado. As tabelas a seguir apresentam especificidade e sensibilidade observadas para a detecção de trissomia dos cromossomos 13, 18 e 21 nos respectivos valores de corte de pontuação de Z (ou seja, 3,95 para cromossomo 13, 3,95 para o cromossomo 18, e 3 para o cromossomo 21). Valores de pontuação de Z foram baseadas em valores de MAD da população e históricos específicos do conjunto de dados e medianos específicos da célula de fluxo. Adicionalmente, 10 vezes a validação cruzada de análises características de operação do receptor (ROC) foram conduzidas (ou seja, 10 vezes de validação cruzada estratificada, repetida 100 vezes) e a área média sob a curva (AUC; ou seja, uma medida de precisão) para cada análise (calculada pela soma de todos os valores de tempo de sensibilidade (1-especificidade) e implementados usando pacote de R ROCR) é apresentada nas Tabelas 6, 7 e 8 abaixo. [554]To determine an optimal fragment size threshold for chromosome representation, fragment size threshold ranged from 120 to 170 bases, in 10 base increments. Chromosome representation (i.e., for chromosomes 13, 18, and 21) was calculated after normalization of readable sequence counts (i.e., PERUN filled with LOESS) for each length-filtered dataset (end-paired reads). ) and for an unfiltered dataset (single-ended reads; also referred to as “whole”). Representations of chromosomes 13, 18 and 21 are presented in Figures 20, 21 and 22, respectively. Chromosome representation for the filtered datasets at the limit of 150, 160, and 170 bases was quite consistent with the unfiltered dataset. The following tables present the observed specificity and sensitivity for detecting trisomy 13, 18, and 21 at the respective Z score cutoff values (i.e., 3.95 for chromosome 13, 3.95 for chromosome 18, and 3 for chromosome 21). Z score values were based on MAD values from the population and historical dataset-specific and flow cell-specific medians. Additionally, 10-fold cross-validation of receiver operating characteristic (ROC) analyzes were conducted (i.e., 10-fold stratified cross-validation, repeated 100 times) and the mean area under the curve (AUC; i.e., a measurement of precision) for each analysis (calculated by summing all sensitivity time values (1-specificity) and implemented using R ROCR package) is presented in Tables 6, 7 and 8 below.

[555]Os dados mostram que ponderação de uma redução significativa da cobertura da sequência de amostras filtradas-comprimento, trissomias podem ser identificadas usando amostras filtradas em certos limites do comprimento do fragmento (por exemplo, 150 bases, 160 bases), com uma precisão, sensibilidade e especificidade semelhantes em comparação com amostras não filtradas.[555]The data show that weighting a significant reduction in sequence coverage of filtered-length samples, trisomies can be identified using samples filtered at certain fragment length limits (e.g., 150 bases, 160 bases), with an accuracy , similar sensitivity and specificity compared to unfiltered samples.

Exemplo 6:Example 6:

[556]Esse exemplo ilustra, em parte, um relacionamento entre a fração fetal e a proporção estatística fetal (FRS). Como mostrado nas Figuras 25A e 25B, um gráfico de pontuações de Z v. FRS mediana por amostra apresentou semelhante idade notável para um gráfico de pontuações de Z versus estimativas baseadas em FQA da fração fetal. Além disso, FRS mediano por amostras com trissomia 21 restritas a porções de alto FRS (Figura 25A, faixa tracejada acima) foi 0,188 e o FRS mediano por amostras com trissomia 21 para todas as porções (Figura 25B, linha pontilhada acima) foi de 0,172. Para amostras de Chr21 com não-trissomia, o FRS mediano de porções de alto FRS foi de 0,181 (Figura 25A, linha tracejada abaixo) e o FRS mediano para todas as porções foi de 0,166 (Figura 25B, linha tracejada abaixo). Isso sugeriu que a amostras com trissomia 21, de fato, tem uma representação da porção ligeiramente superior as amostras com não-trissomia 21, em particular de porções com uma maior propensão de contribuição fetal.[556]This example illustrates, in part, a relationship between fetal fraction and fetal statistical proportion (FRS). As shown in Figures 25A and 25B, a plot of Z v. Median FRS per sample showed remarkable age similarity to a plot of Z scores versus FQA-based estimates of the fetal fraction. In addition, median FRS for samples with trisomy 21 restricted to high FRS portions (Figure 25A, dashed band above) was 0.188 and median FRS for samples with trisomy 21 for all portions (Figure 25B, dotted line above) was 0.172 . For non-trisomy Chr21 samples, the median FRS of high FRS portions was 0.181 (Figure 25A, dashed line below) and the median FRS for all portions was 0.166 (Figure 25B, dashed line below). This suggested that the trisomy 21 samples, in fact, have a slightly higher portion representation than the non-trisomy 21 samples, in particular portions with a higher propensity for fetal contribution.

[557]Como mostrado na Figura 26, foi determinado que fragmentos (reads) de diferentes comprimentos de fragmento compreendam diferentes teores de GC. Os fragmentos menores, os quais são conhecidos por serem mais fetais na origem, mostraram maior teor de CC em comparação com fragmentos maiores. A diferença no teor de GC também foi relacionada à forma como FRS correlacionou com teor de GC e densidade do gene, já que porções (bins) com maiores FRS foram correlacionadas positivamente com o teor de GC por porção (bin). Essas diferenças sutis de GC no comprimento do fragmento podem ser aproveitadas para fornecer informações da fração fetal. Por exemplo, diferença de GC, comprimento do fragmento e/ou dispersão do comprimento do fragmento em todo o genoma humano de referência pode ser utilizado para prever a origem materna ou fetal de fragmentos. Estes dados demonstraram que o teor de GC por leitura podem ser usados para estimar a contribuição do feto.[557]As shown in Figure 26, it was determined that reads of different fragment lengths comprise different GC contents. Smaller fragments, which are known to be more fetal in origin, showed higher CC content compared to larger fragments. The difference in GC content was also related to how FRS correlated with GC content and gene density, as servings (bins) with higher FRS were positively correlated with GC content per serving (bin). These subtle GC differences in fragment length can be leveraged to provide fetal fraction information. For example, difference in GC, fragment length and/or dispersion of fragment length across the reference human genome can be used to predict maternal or fetal origin of fragments. These data demonstrate that GC content per reading can be used to estimate fetal contribution.

[558]PERUN é a correção aditiva específica da região para remover a tendência de GC em profundidade legível de cobertura. Esse procedimento de normalização envolveu uma estimativa treinada de dois parâmetros específicos de região, o declive, ou seja, o impacto da tendência de GC, e intercepto, ou seja, a cobertura do nível de base na ausência da tendência de GC. A distribuição de interceptos de PERUN dividiu em quantis de FRS sugeridos que aumentando FRS aumenta interceptos de PERUN (Figura 27). No geral, as regiões genômicas com os menores FRS tendem a ter os mais baixos interceptos, possivelmente devido à redução da contribuição fetal em relação a representação de cobertura total. Além disso, os esforços iniciais para a seleção da região incorporaram os erros de validação cruzada máxima, onde valores maiores indicaram um aumento na variabilidade de cobertura. A Figura 28 mostra uma distribuição dos erros de validação cruzada máxima dividindo em quantis. Os quantis extremos (alto e baixo) exibiram maior variabilidade na estabilidade da região. Como regiões genômicas de FRS extremo são potencialmente mais sensíveis à contribuição fetal, o aumento da variabilidade nos erros de validação cruzada máxima pode de fato ser devido à variabilidade do sinal fetal.[558]PERUN is region-specific additive correction to remove GC bias in readable depth of coverage. This normalization procedure involved a trained estimation of two region-specific parameters, the slope, ie the impact of the GC trend, and the intercept, ie the coverage of the baseline level in the absence of the GC trend. The distribution of PERUN intercepts divided into FRS quantiles suggested that increasing FRS increases PERUN intercepts (Figure 27). Overall, genomic regions with the smallest FRS tend to have the lowest intercepts, possibly due to reduced fetal contribution relative to full coverage representation. In addition, initial region selection efforts incorporated maximum cross-validation errors, where higher values indicated an increase in coverage variability. Figure 28 shows a distribution of maximum cross-validation errors broken down into quantiles. The extreme quantiles (high and low) exhibited greater variability in the stability of the region. As extreme FRS genomic regions are potentially more sensitive to fetal input, the increased variability in maximum cross-validation errors may in fact be due to fetal signal variability.

Exemplo 7: Fração Fetal baseada em Porção(bin)Example 7: Fetal Fraction based on Portion(bin)

[559]Esse exemplo demonstra um método para quantificar a quantidade de DNA fetal isento de célula circulante em uma amostra de sangue materno usando dados de cobertura de sequenciamento. A tecnologia engloba um método conhecido aqui como Fração Fetal Baseado em Porção (bin) (BFF) que utiliza mapas de cobertura de sequenciamento para quantificar a fração de DNA fetal em uma amostra de sangue materno. O método tira proveito de métodos de aprendizado em máquina para construir um modelo relacionando à cobertura de sequenciamento para fração fetal.[559]This example demonstrates a method for quantifying the amount of circulating cell-free fetal DNA in a maternal blood sample using sequencing coverage data. The technology encompasses a method known here as Portion-Based Fetal Fraction (bin) (BFF) that uses sequencing coverage maps to quantify the fraction of fetal DNA in a sample of maternal blood. The method takes advantage of machine learning methods to build a model relating to sequencing coverage for fetal fraction.

[560]A primeira etapa do método BFF foi a obtenção de dados de cobertura genômica. Dados de cobertura genômica foram obtidos de uma corrida de sequenciamento e alinhamento. Estes dados de cobertura então serviram como um indicador para a fração fetal. Variáveis preditoras de cobertura podem ser geradas por qualquer método adequado, incluindo, mas não limitado a porção (bin) genômica discreta, porção (bin) de tamanho variável, ou vistas baseadas em ponto de um mapa de cobertura nivelada.[560]The first step of the BFF method was to obtain genomic coverage data. Genomic coverage data were obtained from a sequencing and alignment run. These coverage data then served as an indicator for the fetal fraction. Coverage predictor variables may be generated by any suitable method, including, but not limited to, discrete genomic (bin) portion, variable size (bin) portion, or point-based views of a leveled coverage map.

[561]A segunda etapa do método BFF era treinar um modelo para estimar a fração fetal dos preditores de dados de cobertura (por exemplo, parâmetros). Nesse exemplo, um modelo de regressão múltipla geral foi treinado usando quadrados mínimos simples para estimar fração fetal diretamente do nível de sequenciamento proporcional conhecido de uma porção (bin) particular. Essa abordagem pode ser estendida a um modelo multivariado de regressão múltipla para prever porções (bins) que são conhecidos como sendo proporcionais à fração fetal (a partir do qual a fração fetal, por sua vez, pode ser derivada). Semelhantemente, se porções (bins) estão correlacionados, os modelos de resposta multivariada podem ser treinados para explicar respostas correlacionadas. O seguinte é um exemplo em sua forma mais simples: O modelo de regressão múltipla foi escolhido como equação 30 abaixo; onde Xbin é uma matriz m x p de contagens de porções (bins), yff é um vetor m x 1 de número m de amostras de treinamento e número p de porções (bins) preditoras, ε é um vetor de ruído com a expectativa de E(ε) = 0, onde a covariância Cov(ε) = u2I onde I é a matriz identidade (isto é, os erros são homocedásticos), e rank(Xbin)< p. O vector yff correspondeu a uma porção (bin) com níveis conhecidos por ser proporcional à fetal fração.[561]The second step of the BFF method was to train a model to estimate the fetal fraction from coverage data predictors (eg parameters). In this example, a general multiple regression model was trained using simple least squares to estimate fetal fraction directly from the known proportional sequencing level of a particular portion (bin). This approach can be extended to a multivariate multiple regression model to predict bins that are known to be proportional to the fetal fraction (from which the fetal fraction, in turn, can be derived). Similarly, if bins are correlated, multivariate response models can be trained to explain correlated responses. The following is an example in its simplest form: The multiple regression model was chosen as equation 30 below; where Xbin is an mxp matrix of counts of chunks (bins), yff is a vector mx 1 of m number of training samples and p number of predictor chunks (bins), ε is a noise vector with the expectation of E(ε ) = 0, where the covariance Cov(ε) = u2I where I is the identity matrix (that is, the errors are homoscedastic), and rank(Xbin)< p. The yff vector corresponded to a portion (bin) with levels known to be proportional to the fetal fraction.

[562]Sem perda de generalidade, assumimos que Xbin foi centrado por sua média. Desse modo β o vector de p x 1 de coeficientes de regressão, pode ser estimado a partir da solução das equações normais para β como; [562]Without loss of generality, we assume that Xbin was centered by its mean. Thus β the px 1 vector of regression coefficients, can be estimated from the solution of the normal equations for β as;

[563]A extensão para o modelo de resposta múltipla multivariada simplesmente estendeu o modelo anterior para ter várias variáveis de resposta, ou como uma matriz yff de tamanho m x n, onde n é um número de diferentes porções (bins) que têm níveis proporcionais à fração fetal. O modelo é, portanto; onde E é uma matriz de ruído com premissas paralelas ao modelo múltiplo. A matriz dos coeficientes B pode ser estimada através da solução para B em; onde B é uma matriz de p x n.[563]The extension to the multivariate multiple response model simply extended the previous model to have multiple response variables, or as a yff matrix of size mxn, where n is a number of different bins that have levels proportional to the fraction fetal. The model is therefore; where E is a noise matrix with assumptions parallel to the multiple model. The matrix of coefficients B can be estimated by solving for B in; where B is a matrix of px n.

[564]Se ranque rank(Xbin)< p, então o problema pode ser decomposto em qualquer número de modelos de regressão adequados para explicar multicolinearilidade. Em adição a isso, estimadores de B de ranque reduzido também podem ser encontrados, de modo que o rank(B) <= min (n, p), o que representa a correlação potencial dentro da resposta multivariada. Os estimadores resultantes podem então ser tirados a média ou ponderados em conjunto por um método adequado.[564]If rank(Xbin)< p, then the problem can be decomposed into any number of regression models suitable to explain multicollinearity. In addition to this, reduced rank B estimators can also be found such that rank(B) <= min(n, p), which represents the potential correlation within the multivariate response. The resulting estimators can then be averaged or weighted together by a suitable method.

[565]A abordagem de BFF não está limitada a esse método de regressão. Muitos métodos de aprendizado pela máquina podem ser usados, incluindo, mas não limitado a outros métodos de regressão múltipla, regressão de resposta multivariada, árvores de decisão, máquinas de vetor- suporte, e redes neurais, para melhorar a estimativa. Existem também métodos que podem relaxar as suposições e fornecer a estimativa dimensional alta para que todos as porções (bins) relevantes possam ser incorporadas no modelo. Exemplos não limitativos de tais estimadores são aqueles baseados em restrição tais como ranque reduzido, LASSO, critérios de seleção de ranque ponderado (WRSC), critérios de seleção de ranque (RSC) e estimatores de rede elástica que têm demonstrado melhorar o poder preditivo.[565]The BFF approach is not limited to this regression method. Many machine learning methods can be used, including but not limited to other multiple regression methods, multivariate response regression, decision trees, support vector machines, and neural networks, to improve estimation. There are also methods that can relax the assumptions and provide the high dimensional estimate so that all relevant bins can be incorporated into the model. Non-limiting examples of such estimators are those based on constraints such as reduced rank, LASSO, weighted rank selection criteria (WRSC), rank selection criteria (RSC), and elastic network estimators that have been shown to improve predictive power.

[566]Previsões da fração fetal também foram melhoradas através da medição e incorporação da tendência de cobertura genômica no canalizador. Estes a tendência podem vir de um certo número de fontes, incluindo, mas não limitado ao teor de GC, DNase1-hipersensibilidade, mapeabilidade, e estrutura da cromatina. Tais perfis podem ser quantificados em uma base por amostra e usados para ajustar os dados de cobertura genômica, ou adicionados como preditores ou restrições para o modelo de fração fetal.[566]Fetal fraction predictions have also been improved by measuring and incorporating the genomic coverage trend into the plumber. These biases can come from a number of sources, including but not limited to GC content, DNase1-hypersensitivity, mappability, and chromatin structure. Such profiles can be quantified on a per-sample basis and used to fit genomic coverage data, or added as predictors or constraints to the fetal fraction model.

[567]Por exemplo, a abordagem de regressão múltipla foi treinada em 6.000 amostras euplóides masculinas, usando o nível relativo de cobertura de cromossomo Y através de todos as porções (bins) como o verdadeiro valor da fração fetal (ChrFF). Para evitar circularidade com a detecção de trissomias comuns, o modelo foi treinado apenas em porção (bin) de cobertura autossômica, e não inclui os cromossomos 13, 18 ou 21. O modelo demonstrou forte desempenho em dados de testes, que consiste em 19.312 amostras independentes (Figura 29).[567]For example, the multiple regression approach was trained on 6000 male euploid samples, using the relative level of Y chromosome coverage across all portions (bins) as the true fetal fraction value (ChrFF). To avoid circularity with the detection of common trisomies, the model was trained only on portion (bin) of autosomal coverage, and does not include chromosomes 13, 18, or 21. The model demonstrated strong performance on test data consisting of 19,312 samples independent (Figure 29).

[568]O forte desempenho de BFF é conduzido pelas porções (bins) e regiões que tendem a atrair DNA fetal. Estas regiões tendem a ter maior variância de cobertura, e o modelo faz uso dessa variação. Uma abordagem de bootstrap foi usada para comparar os modelos formados exclusivamente em porção (bin) com representação da fração fetal alta ou baixa (com base em FRS). As porções (bins) com maior teor fetal foram revelados serem melhores preditores da fração fetal (Figura 30). Isso correspondeu com a constatação de que os modelos construídos em porção (bin) com maior representação fetal tendem a terem maiores coeficientes de regressão (Figura 31).[568]BFF's strong performance is driven by the portions (bins) and regions that tend to attract fetal DNA. These regions tend to have greater coverage variance, and the model makes use of this variation. A bootstrap approach was used to compare models formed exclusively in portion (bin) with representation of high or low fetal fraction (based on FRS). Portions (bins) with higher fetal content were shown to be better predictors of fetal fraction (Figure 30). This corresponded with the finding that models built in portion (bin) with greater fetal representation tend to have higher regression coefficients (Figure 31).

[569]Enquanto o exemplo do conjunto de treinamento incluiu apenas amostras masculinas, as previsões foram feitas em ambas as amostras de femininas e amostras com trissomia masculinas, para as quais a fração fetal pode ser estimada independentemente usando a representação cromossômica com trissomia. A estimativa da fração fetal de amostras masculinas e femininas não mostraram nenhuma diferença na distribuição total (Figura 32). Isso demonstra que BFF não é sistematicamente tendenciosa para estimar fração fetal sobre um gênero em comparação com o outro.[569]While the training set example included only male samples, predictions were made on both female samples and male trisomy samples, for which the fetal fraction can be estimated independently using the trisomy chromosome representation. Fetal fraction estimation of male and female samples showed no difference in total distribution (Figure 32). This demonstrates that BFF is not systematically biased towards estimating fetal fraction over one gender compared to the other.

Exemplo 8: Exemplos de modalidadesExample 8: Examples of modalities

[570]Os exemplos apresentados a seguir ilustram certas modalidades e não limitam a tecnologia.[570]The following examples illustrate certain embodiments and do not limit the technology.

[571]A1. O método para estimar uma fração de ácido nucleico fetal em uma amostra de teste de uma mulher grávida, compreendendo: (a) obter contagens de fragmentos (reads) de sequências mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida; (b) ponderar, usando um microprocessador, (i) as contagens dos fragmentos (reads) de sequências mapeados para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica da porção de ácido nucleico fetal de acordo com um fator de ponderação associado independentemente com cada porção fornecendo, desse modo, estimativas de fração fetal específica da porção de acordo com os fatores de ponderação, em que cada um dos fatores de ponderação foi determinado a partir de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada das várias amostras, e (ii) contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para as várias amostras; e (c) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas estimativas de fração fetal específica da porção.[571]A1. A method for estimating a fraction of fetal nucleic acid in a test sample from a pregnant woman, comprising: (a) obtaining counts of sequence reads mapped to portions of a reference genome, the sequence reads of which are circulating cell-free nucleic acid reads from a test specimen from a pregnant woman; (b) weight, using a microprocessor, (i) counts of sequence reads mapped to each chunk, or (ii) other chunk-specific parameter, to a specific fraction of the fetal nucleic acid chunk according to a weighting factor independently associated with each portion, thereby providing estimates of portion-specific fetal fraction according to the weighting factors, where each of the weighting factors was determined from a ratio adjusted for each portion between (i ) a fraction of fetal nucleic acid for each of the various samples, and (ii) counts of fragments (reads) of sequences mapped to each portion, or other portion-specific parameter, for the various samples; and (c) estimating a fetal nucleic acid fraction for the test sample based on the portion-specific fetal fraction estimates.

[572]A2. O método, de acordo com a reivindicação A1, em que os fatores de ponderação são associados com porções em uma pluralidade de porções em todos autossomos e cromossomos X e Y.[572]A2. The method according to claim A1, wherein weighting factors are associated with moieties in a plurality of moieties on all autosomes and X and Y chromosomes.

[573]A2.1. O método, de acordo com a reivindicação A1, em que os fatores de ponderação são associados com porções em uma pluralidade de porções que não incluem porções no cromossomo Y.[573]A2.1. The method of claim A1, wherein the weighting factors are associated with portions in a plurality of portions that do not include portions on the Y chromosome.

[574]A3. O método, de acordo com a reivindicação A2.1, em que os fatores de ponderação são associados com porções em uma pluralidade de porções que não incluem porções nos cromossomos X e Y.[574]A3. The method of claim A2.1, wherein weighting factors are associated with portions in a plurality of portions that do not include portions on X and Y chromosomes.

[575]A4. O método, de acordo com a reivindicação A2, em que os fatores de ponderação são associados com porções em uma pluralidade de porções que incluem porções nos autossomos ou seu subconjunto.[575]A4. The method of claim A2, wherein the weighting factors are associated with moieties in a plurality of moieties that include moieties on autosomes or a subset thereof.

[576]A5. O método, de acordo com a reivindicação A3 ou A4, em que os fatores de ponderação são associados com porções em uma pluralidade de porções que não incluem porções nos cromossomos 13, 18 e 21.[576]A5. The method of claim A3 or A4, wherein the weighting factors are associated with moieties in a plurality of moieties that do not include moieties on chromosomes 13, 18 and 21.

[577]A6. O método, de acordo com qualquer uma das reivindicações A1 a A5, em que as contagens em (b)(i) ou (b)(ii) são contagens normalizadas.[577]A6. The method according to any one of claims A1 to A5, wherein the counts in (b)(i) or (b)(ii) are normalized counts.

[578]A7. O método, de acordo com a reivindicação A6, em que as contagens normalizadas reduziram a tendência de guanina-citosina (GC) em relação às contagens brutas.[578]A7. The method of claim A6, wherein the normalized counts have reduced guanine-cytosine (GC) bias relative to the raw counts.

[579]A8. O método, de acordo com a reivindicação A6 ou A7, em que as contagens normalizadas são um produto de uma normalização em porções (bins), normalização por teor de GC, regressão linear dos mínimos quadrados, regressão por mínimos quadrados não linear, LOESS, GC LOESS, LOWESS, PERUN, normalização-GC e mascaramento repetido (GCRM), normalização de quantis condicional (cQn), ou uma combinação destes.[579]A8. The method of claim A6 or A7, wherein the normalized counts are a product of normalization by portions (bins), normalization by GC content, linear least squares regression, nonlinear least squares regression, LOESS, GC LOESS, LOWESS, PERUN, GC-normalization and repeated masking (GCRM), conditional quantile normalization (cQn), or a combination thereof.

[580]A9. O método, de acordo com qualquer uma das reivindicações A1 a A8, em que a estimativa da fração de ácido nucleico fetal para a amostra de teste compreende a média ou soma das estimativas da fração fetal específica da porção.[580]A9. The method according to any one of claims A1 to A8, wherein the fetal nucleic acid fraction estimate for the test sample comprises the average or sum of the portion-specific fetal fraction estimates.

[581]A10. O método, de acordo com qualquer uma das reivindicações A1 a A9, em que o parâmetro específico da porção é um parâmetro específico da porção ou é um dos dois ou mais parâmetros específicos da porção.[581]A10. The method according to any one of claims A1 to A9, wherein the portion-specific parameter is a portion-specific parameter or is one of two or more portion-specific parameters.

[582]A11. O método, de acordo com qualquer uma das reivindicações A1 a A10, em que o parâmetro específico da porção é escolhido da cobertura genômica, uma quantidade de fragmentos (reads) tendo um comprimento menor do que um comprimento do fragmento selecionado, mapeabilidade, sensibilidade à DNasel, estado de metilação, acetilação, distribuição de histona e a estrutura da cromatina.[582]A11. The method according to any one of claims A1 to A10, wherein the specific parameter of the portion is chosen from genomic coverage, an amount of fragments (reads) having a length smaller than a selected fragment length, mappability, sensitivity to DNasel, methylation status, acetylation, histone distribution and chromatin structure.

[583]A12. O método, de acordo com qualquer uma das reivindicações A1 a A10, em que o parâmetro específico da porção é teor de guanina-citosina (GC).[583]A12. The method according to any one of claims A1 to A10, wherein the portion specific parameter is guanine cytosine (GC) content.

[584]A13. O método, de acordo com qualquer uma das reivindicações A1 a A10, em que o parâmetro específico da porção não é o teor de guanina-citosina (GC).[584]A13. The method according to any one of claims A1 to A10, wherein the portion specific parameter is not guanine cytosine (GC) content.

[585]A14. O método, de acordo com a reivindicação A11, em que a quantidade de fragmentos (reads) tendo um comprimento menor do que um comprimento do fragmento selecionado é determinada de acordo com uma proporção de X para Y, em que X é a quantidade derivada de fragmentos isentos de célula circulante (CCF) tendo um comprimento menor do que um primeiro comprimento de fragmento selecionado, e Y é a quantidade de fragmentos (reads) derivados de fragmentos CCF tendo um comprimento menor do que um segundo fragmento de comprimento selecionado.[585]A14. The method according to claim A11, wherein the amount of fragments (reads) having a length smaller than a selected fragment length is determined according to an X to Y ratio, where X is the amount derived from circulating cell-free (CCF) fragments having a length less than a first fragment length selected, and Y is the amount of fragments (reads) derived from CCF fragments having a length less than a second fragment length selected.

[586]A15. O método, de acordo com a reivindicação A14, em que o comprimento do primeiro fragmento selecionado é cerca de 140 a cerca de 160 bases e o segundo comprimento do fragmento selecionado é cerca de 500 a cerca de 700 bases.[586]A15. The method of claim A14, wherein the first selected fragment length is about 140 to about 160 bases and the second selected fragment length is about 500 to about 700 bases.

[587]A16. O método, de acordo com a reivindicação A15, em que o comprimento do primeiro fragmento selecionado é cerca de 150 bases de comprimento e o segundo fragmento selecionado é cerca de 600 bases.[587]A16. The method of claim A15, wherein the length of the first selected fragment is about 150 bases in length and the second selected fragment is about 600 bases.

[588]A17. O método, de acordo com qualquer uma das reivindicações A14 a A16, em que o fator de ponderação para cada porção está relacionado com a proporção média para a porção para as várias amostras.[588]A17. The method according to any one of claims A14 to A16, wherein the weighting factor for each portion is related to the average proportion for the portion for the various samples.

[589]A18. O método, de acordo com qualquer uma das reivindicações A1 a A16, em que o fator de ponderação para cada porção é proporcional à quantidade média de fragmentos (reads) a partir de fragmentos de ácido nucleico fetal CCF mapeados para a porção para as várias amostras.[589]A18. The method according to any one of claims A1 to A16, wherein the weighting factor for each portion is proportional to the average amount of fragments (reads) from fetal CCF nucleic acid fragments mapped to the portion for the various samples .

[590]A19. O método, de acordo com qualquer uma das reivindicações A1 a A18, em que as porções são escolhidas de porções (bins) genômicas discretas, porções (bins) genômicas tendo sequências contínuas de comprimento pré- determinado, porção (bin) de tamanho variável, vistas baseadas em ponto de um mapa de cobertura nivelada, e uma combinação dos mesmos.[590]A19. The method according to any one of claims A1 to A18, wherein the portions are chosen from discrete genomic portions (bins), genomic portions (bins) having continuous sequences of predetermined length, portion (bin) of variable length, point-based views of a graded coverage map, and a combination thereof.

[591]A20. O método, de acordo com qualquer uma das reivindicações A1 a A19, em que as várias amostras são de sujeitos tendo um feto euplóide.[591]A20. The method according to any one of claims A1 to A19, wherein the various samples are from subjects having an euploid foetus.

[592]A21. O método, de acordo com qualquer uma das reivindicações A1 a A19, em que as várias amostras são de sujeitos tendo um feto com trissomia.[592]A21. The method according to any one of claims A1 to A19, wherein the various samples are from subjects having a fetus with trisomy.

[593]A22. O método, de acordo com qualquer uma das reivindicações A1 a A19, em que as várias amostras são de sujeitos tendo um feto euplóide e de sujeitos tendo um feto com trissomia.[593]A22. The method according to any one of claims A1 to A19, wherein the various samples are from subjects having a euploid fetus and from subjects having a fetus with trisomy.

[594]A23. O método, de acordo com qualquer uma das reivindicações A1 a A22, em que as várias amostras são de sujeitos tendo um feto masculino.[594]A23. The method according to any one of claims A1 to A22, wherein the various samples are from subjects having a male fetus.

[595]A24. O método, de acordo com a reivindicação A23, em que a fração de ácido nucleico fetal é determinada de acordo com um ensaio do cromossomo Y.[595]A24. The method of claim A23, wherein the fetal nucleic acid fraction is determined according to a Y chromosome assay.

[596]A25. O método, de acordo com qualquer uma das reivindicações A1 a A24, em que as contagens em cerca de 1.500 porções a cerca de 200.000 porções são ajustadas.[596]A25. The method of any one of claims A1 to A24, wherein the counts in about 1,500 servings to about 200,000 servings are adjusted.

[597]A25.1. O método, de acordo com a reivindicação A25, em que cada uma das porções são cerca de 10 quilobases contíguas a cerca de 75 quilobases contíguas do genoma de referência.[597]A25.1. The method of claim A25, wherein each portion is about 10 contiguous kilobases to about 75 contiguous kilobases of the reference genome.

[598]A26. O método, de acordo com qualquer uma das reivindicações A1 a A25.1, em que cerca de 75% ou mais dos fatores de ponderação são maiores do que zero.[598]A26. The method according to any one of claims A1 to A25.1, wherein about 75% or more of the weighting factors are greater than zero.

[599]A26.1. O método, de acordo com a reivindicação A26, em que cerca de 85% ou mais dos fatores de ponderação são maiores do que zero.[599]A26.1. The method of claim A26, wherein about 85% or more of the weighting factors are greater than zero.

[600]A26.2. O método, de acordo com a reivindicação A26.1, em que cerca de 95% ou mais dos fatores de ponderação são maiores do que zero.[600]A26.2. The method of claim A26.1, wherein about 95% or more of the weighting factors are greater than zero.

[601]A27. O método, de acordo com qualquer uma das reivindicações A1 a A26.2, em que a largura de uma distribuição dos fatores de ponderação é dependente da quantidade de fragmentos (reads) de fragmentos de ácido nucleico fetal CCF.[601]A27. The method according to any one of claims A1 to A26.2, wherein the width of a distribution of weighting factors is dependent on the amount of fragments (reads) of fetal CCF nucleic acid fragments.

[602]A28. O método, de acordo com qualquer uma das reivindicações A1 a A27, em que a distribuição dos fatores de ponderação é substancialmente simétrica.[602]A28. The method according to any one of claims A1 to A27, wherein the distribution of the weighting factors is substantially symmetrical.

[603]A28.1. O método, de acordo com qualquer uma das reivindicações A1 a A27, em que a distribuição dos fatores de ponderação é substancialmente normal.[603]A28.1. The method according to any one of claims A1 to A27, wherein the distribution of the weighting factors is substantially normal.

[604]A29. O método, de acordo com qualquer uma das reivindicações A1 a A28.1, os fatores de ponderação são coeficientes estimados a partir das relações ajustadas.[604]A29. The method according to any one of claims A1 to A28.1, the weighting factors are estimated coefficients from the fitted ratios.

[605]A30. O método, de acordo com qualquer uma das reivindicações A1 a A29 que compreende estimar coeficientes a partir da relação para cada porção entre (i) a fração de ácido nucleico fetal para cada de várias amostras, e (ii) contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para as várias amostras.[605]A30. The method according to any one of claims A1 to A29 comprising estimating coefficients from the relationship for each portion between (i) the fetal nucleic acid fraction for each of several samples, and (ii) fragment counts (reads) of sequences mapped to each chunk, or other chunk-specific parameter, for the various samples.

[606]A31. O método, de acordo com a reivindicação A29 ou A30, em que cada das relações ajustadas é um modelo de regressão e os fatores de ponderação são, ou são baseados em coeficientes de regressão a partir das relações ajustadas.[606]A31. The method according to claim A29 or A30, wherein each of the fitted relationships is a regression model and the weighting factors are, or are based on, regression coefficients from the fitted relationships.

[607]A32. O método, de acordo com a reivindicação A31, em que o modelo de regressão é escolhido a partir de um modelo de regressão linear, modelo de regressão simples, modelode regressão dos mínimos quadrados ordinários, modelo de regressão múltipla, modelo de regressão múltipla geral, modelo de regressão polinomial, modelo linear geral, modelo linear generalizado, modelo de regressão de escolha discreta, modelo de regressão logística, o modelo logit multinomial, modelo logit misturado, modelo probit, modelo probit multinomial, modelo logit ordenado, modelo probit ordenado, modelo de Poisson, modelo de regressão de resposta multivariada, modelo de multinível, modelo de efeitos fixos, modelo de efeitos aleatórios, modelo misturado, modelo de regressão não-linear, modelo não- paramétrico, modelo semiparamétrico, modelo robusto, modelo quantis, modelo isotônico, modelo de componentes principais, modelo de ângulo menor, modelo local, modelo segmentado, e modelo de erros em variáveis.[607]A32. The method according to claim A31, wherein the regression model is chosen from a linear regression model, simple regression model, ordinary least squares regression model, multiple regression model, general multiple regression model, polynomial regression model, general linear model, generalized linear model, discrete choice regression model, logistic regression model, the multinomial logit model, mixed logit model, probit model, multinomial probit model, ordered logit model, ordered probit model, model Poisson model, multivariate response regression model, multilevel model, fixed effects model, random effects model, mixed model, nonlinear regression model, nonparametric model, semiparametric model, robust model, quantile model, isotonic model , principal components model, minor angle model, local model, segmented model, and errors in variables model.

[608]A33. O método, de acordo com a reivindicação A29 ou A30, em que cada das relações ajustadas não é um modelo de regressão.[608]A33. The method of claim A29 or A30, wherein each of the fitted relationships is not a regression model.

[609]A34. O método, de acordo com a reivindicação A33, em que cada uma das relações ajustadas é escolhida a partir de um modelo de árvore de decisão, modelo de máquina de vetor de suporte e modelo de rede neural.[609]A34. The method according to claim A33, wherein each of the fitted relations is chosen from a decision tree model, support vector machine model and neural network model.

[610]A35. O método, de acordo com qualquer uma das reivindicações A1 a A34, em que as relações ajustadas são ajustadas por uma estimativa de mínimos quadrados, mínimos quadrados comuns, regressão linear, parcial, total, generalizada, pesada, não-linear, interativamente repesada, regressão de cumeeira, desvios menos absolutos, Bayesian, Bayesian multivariada, ranque reduzido, LASSO, estimador de rede elástica e combinação destes.[610]A35. The method according to any one of claims A1 to A34, wherein the fitted relationships are fitted by least squares estimation, common least squares, linear, partial, total, generalized, weighted, nonlinear, interactively reweighted regression, ridge regression, minus absolute deviations, Bayesian, multivariate Bayesian, reduced rank, LASSO, elastic network estimator and combination of these.

[611]A36. O método, de acordo com qualquer uma das reivindicações A1 a A35 em que compreende, antes de (a), determinar as fragmentos (reads) de sequências sequenciando o ácido nucleico isento de célula circulante de um sujeito de teste.[611]A36. The method of any one of claims A1 to A35 wherein it comprises, prior to (a), determining sequence reads by sequencing circulating cell-free nucleic acid from a test subject.

[612]A37. O método, de acordo com a reivindicação A36 em que compreende, antes de (a), o mapeamento das fragmentos (reads) de sequências para as porções do genoma de referência.[612]A37. The method according to claim A36, comprising, prior to (a), mapping sequence reads to portions of the reference genome.

[613]A38. O método, de acordo com a reivindicação A36 ou A37 em que compreende, antes de (a), o isolamento do ácido nucleico isento de célula circulante da amostra de teste.[613]A38. The method of claim A36 or A37 wherein it comprises, prior to (a), isolating circulating cell-free nucleic acid from the test sample.

[614]A39. O método, de acordo com a reivindicação A38 em que compreende, antes de (a), o isolamento da amostra de teste do sujeito teste.[614]A39. The method of claim A38 wherein it comprises, prior to (a), isolating the test sample from the test subject.

[615]A40. O método, de acordo com qualquer uma das reivindicações A1 a 39 em que compreende determinar a presença ou ausência de uma aneuploidia em cromossomo fetal para a amostra de teste com base na fração estimada do ácido nucleico fetal.[615]A40. The method according to any one of claims A1 to 39 wherein it comprises determining the presence or absence of a fetal chromosome aneuploidy for the test sample based on the estimated fetal nucleic acid fraction.

[616]A41. O Método, de acordo com a reivindicação A40 em que a aneuploidia do cromossomo fetal é uma trissomia.[616]A41. The method of claim A40 wherein the fetal chromosome aneuploidy is a trisomy.

[617]A42. O método, de acordo com a reivindicação A41 em que a trissomia é escolhida a partir de uma trissomia do cromossomo 21, cromossomo 18, cromossomo 13 ou uma combinação destes.[617]A42. The method according to claim A41 wherein the trisomy is chosen from a trisomy of chromosome 21, chromosome 18, chromosome 13 or a combination thereof.

[618]A43. O método, de acordo com a reivindicação A41 ou A42 em que a presença ou ausência da trissomia é determinada com uma sensibilidade de 95% ou maior, ou uma especificidade de 95% ou maior, ou uma sensibilidade de 95% ou maior e uma especificidade de 95% ou maior.[618]A43. The method of claim A41 or A42 wherein the presence or absence of trisomy is determined with a sensitivity of 95% or greater, or a specificity of 95% or greater, or a sensitivity of 95% or greater and a specificity of 95% or greater.

[619]A44. Um sistema que compreende um ou mais microprocessadores e memória, em que a memória compreende instruções executáveis por um ou mais microprocessadores e que a memória compreende as fragmentos (reads) da sequência de nucleotídeos mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante a partir de uma amostra de teste de uma mulher grávida, e que instruções executáveis por um ou mais microprocessadores são configuradas para: (a) ponderar, usando um microprocessador, (i) as contagens dos fragmentos (reads) de sequências mapeadas para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica da porção de ácido nucleico fetal de acordo com um fator de ponderação associado independentemente com cada porção fornecendo, desse modo, estimativas de fração fetal específica da porção de acordo com os fatores de ponderação, em que cada um dos fatores de ponderação foi determinado a partir de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada uma das várias amostras, e (ii) contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para as várias amostras; e (b) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas estimativas da fração fetal específica da porção.[619]A44. A system comprising one or more microprocessors and memory, wherein the memory comprises instructions executable by one or more microprocessors, and the memory comprising nucleotide sequence reads mapped to portions of a reference genome, whose reads ) of sequences are fragments (reads) of circulating cell-free nucleic acid from a test sample of a pregnant woman, and which instructions executable by one or more microprocessors are configured to: (a) weight, using a microprocessor, ( i) the fragment counts (reads) of sequences mapped to each portion, or (ii) another portion-specific parameter, to a specific fraction of the portion of fetal nucleic acid according to a weighting factor independently associated with each portion providing, thus, portion-specific fetal fraction estimates according to the weighting factors, where each of the weighting factors was determined from a ratio adjusted for each portion between (i) a fraction of fetal nucleic acid for each of the various samples, and (ii) counts of fragments (reads) of sequences mapped to each portion, or other portion-specific parameter, for the various samples; and (b) estimating a fetal nucleic acid fraction for the test sample based on the portion-specific fetal fraction estimates.

[620]A45. Máquina que compreende um ou mais microprocessadores e memória, cuja memória compreende instruções executáveis por um ou mais microprocessadores e que a memória compreende os fragmentos (reads) da sequência de nucleotídeos mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante a partir de uma amostra de teste de uma mulher grávida, e que instruções executáveis por um ou mais microprocessadores são configuradas para: (a) ponderar, usando um microprocessador, (i) as contagens dos fragmentos (reads) de sequências mapeados para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica da porção de ácido nucleico fetal de acordo com um fator de ponderação associado independentemente com cada porção fornecendo, desse modo, estimativas de fração fetal específica da porção de acordo com os fatores de ponderação, em que cada um dos fatores de ponderação foi determinado a partir de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada uma das várias amostras, e (ii)contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para as várias amostras; e (b) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas estimativas da fração fetal específica da porção.[620]A45. Machine comprising one or more microprocessors and memory, which memory comprises instructions executable by one or more microprocessors, and which memory comprises nucleotide sequence reads mapped to portions of a reference genome, which sequence reads are circulating cell-free nucleic acid reads from a test sample of a pregnant woman, and which instructions executable by one or more microprocessors are configured to: (a) weigh, using a microprocessor, (i) the counts of sequence reads mapped to each chunk, or (ii) another chunk-specific parameter, to a specific fraction of the fetal nucleic acid chunk according to a weighting factor independently associated with each chunk, thereby providing portion-specific fetal fraction estimates according to the weighting factors, where each of the weighting factors was determined from a ratio adjusted for each portion between (i) a fraction of fetal nucleic acid for each of several samples , and (ii) counts of fragments (reads) of sequences mapped to each portion, or other portion-specific parameter, for the various samples; and (b) estimating a fetal nucleic acid fraction for the test sample based on the portion-specific fetal fraction estimates.

[621]A46. Meio de armazenamento legível por computador não-transitório com um programa executável armazenado no mesmo, em que o programa instrui um microprocessador para executar o seguinte: (a) acessar fragmentos (reads) de sequências de nucleotídeo mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida; (b) ponderar, usando um microprocessador, (i) as contagens de fragmentos (reads) de sequências mapeados para cada porção, ou (ii) outro parâmetro específico da porção, a uma fração específica da porção de ácido nucleico fetal de acordo com um fator de ponderação associados independentemente com cada porção fornecendo, desse modo, estimativas de fração fetal específica da porção de acordo com os fatores de ponderação, em que cada um dos fatores de ponderação foi determinado a partir de uma relação ajustada para cada porção entre (i) uma fração de ácido nucleico fetal para cada uma das várias amostras, e (ii) contagens de fragmentos (reads) de sequências mapeados para cada porção, ou outro parâmetro específico da porção, para as várias amostras; e (c) estimar a fração de ácido nucleico fetal para a amostra de teste com base nas estimativas da fração fetal específica da porção.[621]A46. A non-transient computer-readable storage medium with an executable program stored thereon, where the program instructs a microprocessor to perform the following: (a) access fragments (reads) of nucleotide sequences mapped to portions of a reference genome, which sequence reads are circulating cell-free nucleic acid reads from a test sample from a pregnant woman; (b) weight, using a microprocessor, (i) the sequence reads counts mapped to each chunk, or (ii) other chunk-specific parameter, to a specific fraction of the fetal nucleic acid chunk according to a weighting factor independently associated with each portion, thereby providing estimates of portion-specific fetal fraction according to the weighting factors, where each of the weighting factors was determined from a ratio adjusted for each portion between (i ) a fraction of fetal nucleic acid for each of the various samples, and (ii) counts of fragments (reads) of sequences mapped to each portion, or other portion-specific parameter, for the various samples; and (c) estimating the fetal nucleic acid fraction for the test sample based on the portion-specific fetal fraction estimates.

[622]B1. Método para estimar uma fração de ácido nucleico fetal em uma amostra de teste de uma mulher grávida, compreendendo: (a) obter contagens de fragmentos (reads) de sequências mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida; (b)(i) ajustar, usando um microprocessador, as contagens dos fragmentos (reads) de sequências mapeados para cada porção de acordo com um fator de ponderação atribuído independentemente para cada porção fornecendo, desse modo, as contagens ajustadas para as porções, ou (b)(ii) selecionar, usando um microprocessador, um subconjunto de porções fornecendo, desse modo, um subconjunto de contagens, em que o ajuste em (b)(i) ou a seleção ou em (b)(ii) está de acordo com as porções para as quais um aumento da quantidade de fragmentos (reads) de ácido nucleico fetal são mapeados; e (c) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas contagens ajustadas ou o subconjunto de contagens.[622]B1. A method for estimating a fraction of fetal nucleic acid in a test sample from a pregnant woman, comprising: (a) obtaining counts of sequence reads mapped to portions of a reference genome whose sequence reads are circulating cell-free nucleic acid fragments (reads) from a test sample from a pregnant woman; (b)(i) adjust, using a microprocessor, the sequence reads counts mapped to each chunk according to an independently assigned weighting factor for each chunk, thereby providing the adjusted counts for the chunks, or (b)(ii) selecting, using a microprocessor, a subset of portions, thereby providing a subset of counts, where the adjustment in (b)(i) or the selection or in (b)(ii) is in accordance with according to the portions to which an increasing amount of fetal nucleic acid reads are mapped; and (c) estimating a fetal nucleic acid fraction for the test sample based on the adjusted counts or the subset of counts.

[623]B2. O método, de acordo com a reivindicação B1, em que as porções para as quais um aumento da quantidade de fragmentos (reads) de ácido nucleico fetal são mapeados são determinados de acordo com uma proporção de X para Y, em que X é a quantidade de fragmentos (reads) derivados de fragmentos isentos de célula circulante (CCF) tendo um comprimento menor do que um comprimento do primeiro fragmento selecionado, e Y é a quantidade de fragmentos (reads) derivados de fragmentos CCF tendo um comprimento menor do que um segundo fragmento de comprimento selecionado.[623]B2. The method according to claim B1, wherein the portions to which an increased amount of fetal nucleic acid fragments (reads) are mapped are determined according to an X to Y ratio, where X is the amount of fragments (reads) derived from circulating cell-free (CCF) fragments having a length less than one length of the first selected fragment, and Y is the amount of fragments (reads) derived from CCF fragments having a length less than one second fragment of selected length.

[624]B3. O método, de acordo com a reivindicação B2, em que a proporção é uma proporção média de várias amostras.[624]B3. The method according to claim B2, wherein the ratio is an average ratio of several samples.

[625]B4. Método, de acordo com a reivindicação B3, em que o fator de ponderação é determinado, ou porções são selecionadas, de acordo com uma porção que tem uma proporção média maior do que a proporção média calculada para as porções.[625]B4. Method according to claim B3, wherein the weighting factor is determined, or portions are selected, according to a portion having an average proportion greater than the average proportion calculated for the portions.

[626]B5. O método, de acordo com qualquer uma das reivindicações B2 a B4 em que o comprimento do primeiro fragmento selecionado é cerca de 140 a cerca de 160 bases e o segundo comprimento do fragmento selecionado é cerca de 500 a cerca de 700 bases.[626]B5. The method according to any one of claims B2 to B4 wherein the first selected fragment length is about 140 to about 160 bases and the second selected fragment length is about 500 to about 700 bases.

[627]B6. O método, de acordo com a reivindicação B5, em que o comprimento do primeiro fragmento selecionado é cerca de 150 bases e o segundo comprimento do fragmento selecionado é cerca de 600 bases.[627]B6. The method of claim B5, wherein the length of the first selected fragment is about 150 bases and the second length of the selected fragment is about 600 bases.

[628]B7. Um sistema que compreende um ou mais microprocessadores e memória, cuja a memória compreende instruções executáveis por um ou mais microprocessadores e que a memória compreende fragmentos (reads) de sequências de nucleotídeos mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, e que instruções executáveis por um ou mais microprocessadores são configuradas para: (a)(i) ajustar, usando um microprocessador, as contagens de fragmentos (reads) de sequências mapeados para cada porção de acordo com um fator de ponderação atribuído independentemente para cada porção fornecendo, desse modo, contagens ajustadas para as porções, ou (a)(ii) selecionar, usando um microprocessador, um subconjunto de porções fornecendo, desse modo, um subconjunto de contagens, em que o ajuste em (b)(i) ou a seleção em (b)(ii) está de acordo com as porções para as quais um aumento da quantidade de fragmentos (reads) de ácido nucleico fetal são mapeados; e (b) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas contagens ajustadas ou o subconjunto de contagens.[628]B7. A system comprising one or more microprocessors and memory, which memory comprises instructions executable by one or more microprocessors, and which memory comprises fragments (reads) of nucleotide sequences mapped to portions of a reference genome, which fragments (reads) of sequences are circulating cell-free nucleic acid fragments (reads) of a test sample from a pregnant woman, and which instructions executable by one or more microprocessors are configured to: (a)(i) adjust, using a microprocessor, the counts of sequence reads mapped to each chunk according to an independently assigned weighting factor for each chunk, thereby providing adjusted counts for the chunks, or (a)(ii) selecting, using a microprocessor, a subset of portions thus providing a subset of counts, where the adjustment in (b)(i) or the selection in (b)(ii) is in accordance with the portions for which an increase in the amount of fragments (reads) of fetal nucleic acid are mapped; and (b) estimating a fetal nucleic acid fraction for the test sample based on the adjusted counts or the subset of counts.

[629]B8. Uma máquina que compreende um ou mais microprocessadores e memória, cuja memória compreende instruções executáveis por um ou mais microprocessadores e que a memória compreende os fragmentos (reads) de sequências de nucleotídeo mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, e que instruções executáveis por um ou mais microprocessadores são configuradas para: (a)(i) ajustar, usando um microprocessador, as contagens dos fragmentos (reads) de sequências mapeados para cada porção de acordo com um fator de ponderação atribuído independentemente para cada porção fornecendo, desse modo, contagens ajustadas para as porções, ou (a)(ii) selecionar, usando um microprocessador, um subconjunto de porções fornecendo, desse modo, um subconjunto de contagens, em que o ajuste em (b)(i) ou a seleção em (b)(ii) está de acordo com as porções para as quais um aumento da quantidade de fragmentos (reads) de ácido nucleico fetal são mapeados; e (c) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas contagens ajustadas ou o subconjunto de contagens.[629]B8. A machine comprising one or more microprocessors and memory, which memory comprises instructions executable by one or more microprocessors, and which memory comprises fragments (reads) of nucleotide sequences mapped to portions of a reference genome, which fragments (reads) of sequences are circulating cell-free nucleic acid fragments (reads) of a test sample from a pregnant woman, and which instructions executable by one or more microprocessors are configured to: (a)(i) adjust, using a microprocessor, the counts of sequence reads mapped to each chunk according to an independently assigned weighting factor for each chunk, thereby providing adjusted counts for the chunks, or (a)(ii) selecting, using a microprocessor, a subset of portions thus providing a subset of counts, where the adjustment in (b)(i) or the selection in (b)(ii) is in accordance with the portions for which an increase in the amount of fragments (reads) of fetal nucleic acid are mapped; and (c) estimating a fetal nucleic acid fraction for the test sample based on the adjusted counts or the subset of counts.

[630]B9. Meio de armazenamento legível por computador não-transitório com um programa executável armazenado no mesmo, em que o programa instrui um microprocessador para executar o seguinte: (a) acessar fragmentos (reads) de sequências de nucleotídeo mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida; (b)(i) ajustar, usando um microprocessador, as contagens de fragmentos (reads) de sequências mapeados para cada porção de acordo com um fator de ponderação atribuído independentemente para cada porção fornecendo, desse modo, contagens ajustadas para as porções, ou (b)(ii) selecionar, usando um microprocessador, um subconjunto de porções fornecendo, desse modo, um subconjunto de contagens, em que o ajuste em (b)(i) ou a seleção em (b) (ii) está de acordo com as porções para as quais um aumento da quantidade de fragmentos (reads) de ácido nucleico fetal são mapeados; e (c) estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas contagens ajustadas ou o subconjunto de contagens.[630]B9. A non-transient computer-readable storage medium with an executable program stored thereon, where the program instructs a microprocessor to perform the following: (a) access fragments (reads) of nucleotide sequences mapped to portions of a reference genome, which sequence reads are circulating cell-free nucleic acid reads from a test sample from a pregnant woman; (b)(i) adjust, using a microprocessor, the sequence reads counts mapped to each chunk according to an independently assigned weighting factor for each chunk, thereby providing adjusted counts for the chunks, or ( b)(ii) selecting, using a microprocessor, a subset of portions, thereby providing a subset of counts, where the adjustment in (b)(i) or the selection in (b)(ii) conforms to the portions to which an increased amount of fetal nucleic acid reads are mapped; and (c) estimating a fetal nucleic acid fraction for the test sample based on the adjusted counts or the subset of counts.

[631]C1. Método para aumentar a precisão da estimativa de uma fração de ácido nucleico fetal em uma amostra de teste de uma mulher grávida, compreendendo: obter contagens de fragmentos (reads) de sequências mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos (reads) de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida; em que pelo menos um subconjunto das contagens obtidas são derivadas de uma região do genoma que contribui com um maior número de contagens derivadas de ácido nucleico fetal em relação às contagens totais da região do que as contagens de ácido nucleico fetal em relação às contagens totais de outra região do genoma.[631]C1. A method for increasing the accuracy of estimating a fraction of fetal nucleic acid in a test sample from a pregnant woman, comprising: obtaining counts of fragments (reads) of sequences mapped to portions of a reference genome, which fragments (reads) of sequences are circulating cell-free nucleic acid reads from a test sample from a pregnant woman; wherein at least a subset of the counts obtained are derived from a region of the genome that contributes a greater number of counts derived from fetal nucleic acid relative to total counts of the region than fetal nucleic acid counts relative to total counts of another region of the genome.

[632]C2. Método, de acordo com a reivindicação C1, compreendendo: ajustar, usando um microprocessador, as contagens das fragmentos (reads) de sequências mapeados para cada porção de acordo com um fator de ponderação atribuído independentemente para cada porção fornecendo, desse modo, contagens ajustadas para as porções, ou selecionar, usando um microprocessador, um subconjunto de porções fornecendo, desse modo, um subconjunto de contagens; e estimar uma fração de ácido nucleico fetal para a amostra de teste com base nas contagens ajustadas ou o subconjunto de contagens.[632]C2. The method of claim C1, comprising: adjusting, using a microprocessor, the sequence reads counts mapped to each portion according to an independently assigned weighting factor for each portion, thereby providing adjusted counts for the portions, or selecting, using a microprocessor, a subset of portions, thereby providing a subset of counts; and estimating a fetal nucleic acid fraction for the test sample based on the adjusted counts or the subset of counts.

[633]C3. Método, de acordo com a reivindicação C1 ou C2, em que a região do genoma que contribui com um maior número de contagens derivadas de ácido nucleico fetal é determinada de acordo com uma proporção de X para Y, em que X é a quantidade de fragmentos (reads) derivados de fragmentos isentos de célula circulante (CCF) tendo um comprimento menor do que um comprimento do primeiro fragmento selecionado, e Y é a quantidade de fragmentos (reads) derivados de fragmentos CCF tendo um comprimento menor do que um segundo fragmento de comprimento selecionado.[633]C3. Method according to claim C1 or C2, in which the region of the genome that contributes a greater number of counts derived from fetal nucleic acid is determined according to a ratio of X to Y, where X is the amount of fragments (reads) derived from circulating cell free (CCF) fragments having a length less than a length of the first selected fragment, and Y is the amount of fragments (reads) derived from CCF fragments having a length less than a second fragment of selected length.

[634]C4. Método, de acordo com a reivindicação C3, em que a proporção é uma proporção média para várias amostras.[634]C4. Method according to claim C3, wherein the ratio is an average ratio for several samples.

[635]C5. Método, de acordo com a reivindicação C4, em que o fator de ponderação é determinado, ou porções são selecionadas, de acordo com uma porção que tem uma proporção média maior do que a proporção média calculada para as porções.[635]C5. Method according to claim C4, wherein the weighting factor is determined, or portions are selected, according to a portion having an average proportion greater than the average proportion calculated for the portions.

[636]C6. Método, de acordo com qualquer uma das reivindicações C3 a C5, em que o comprimento do primeiro fragmento selecionado é cerca de 140 a cerca de 160 bases e o segundo comprimento do fragmento selecionado é cerca de 500 a cerca de 700 bases.[636]C6. The method of any one of claims C3 to C5, wherein the first selected fragment length is about 140 to about 160 bases and the second selected fragment length is about 500 to about 700 bases.

[637]C7. Método, de acordo com a reivindicação C6, em que o comprimento do primeiro fragmento selecionado é cerca de 150 bases e o segundo comprimento do fragmento selecionado é cerca de 600 bases.[637]C7. The method of claim C6, wherein the length of the first selected fragment is about 150 bases and the second length of the selected fragment is about 600 bases.

[638]A totalidade de cada patente, pedido de patente, publicação e documento referenciados aqui por esse meio é incorporada por referência. A citação de patentes, pedidos de patente, publicações e documentos acima não é uma admissão de que qualquer um dos anteriores é técnica anterior pertinente, nem constitui qualquer admissão aos conteúdos ou data destas publicações ou documentos.[638]The entirety of each patent, patent application, publication and document referenced herein is hereby incorporated by reference. Citation of patents, patent applications, publications and documents above is not an admission that any of the foregoing is pertinent prior art, nor does it constitute any admission to the contents or date of these publications or documents.

[639]As modificações podem ser feitas no precedente sem se afastar dos aspectos básicos da tecnologia. Embora a tecnologia tenha sido descrita em detalhe com referência substancial a uma ou mais modalidades específicas, aqueles versados na técnica reconhecerão que alterações podem ser feitas às modalidades especificamente descritas nesse pedido, ainda estas modificações e melhorias estão dentro do escopo e espírito da tecnologia.[639]Modifications can be made to the foregoing without departing from the basic aspects of the technology. Although the technology has been described in detail with substantial reference to one or more specific embodiments, those skilled in the art will recognize that changes may be made to the embodiments specifically described in this application, still such modifications and improvements are within the scope and spirit of the technology.

[640]A tecnologia ilustrativamente aqui descrita pode ser adequadamente praticada na ausência de qualquer elemento(s) não especificamente aqui revelado. Desse modo, por exemplo, em cada caso, aqui qualquer um dos termos "compreendendo", "consistindo essencialmente em" e "consistindo em" podem ser substituídos por qualquer um dos outros dois termos. Os termos e expressões que foram empregados são usados como termos de descrição e não de limitação, e o uso de tais termos e expressões não excluem quaisquer equivalentes das características mostradas e descritas ou seus segmentos, e várias modificações são possíveis dentro do escopo da tecnologia reivindicada. O termo "um" ou "uma" pode se referir a um ou uma pluralidade dos elementos que modificam (por exemplo, "um reagente" pode significar um ou mais reagentes) a menos que seja contextualmente claro qualquer um dos elementos ou mais do que um dos elementos seja descrito. O termo "cerca de" tal como aqui usado refere-se a um valor dentro de 10% do parâmetro subjacente (ou seja, mais ou menos 10%), e o uso do termo "cerca de", no início de uma série de valores modifica cada dos valores (ou seja, "cerca de 1, 2 e 3" refere-se a cerca de 1, cerca de 2 e cerca de 3). Por exemplo, um "peso de cerca de 100 gramas" pode incluir pesos entre 90 gramas e 110 gramas. Além disso, quando uma lista de valores é aqui descrita (por exemplo, cerca de 50%, 60%, 70%, 80%, 85% ou 86%) a lista inclui todos os valores intermédios e fracionais dos mesmos (por exemplo, 54%, 85,4%). Desse modo, deve ser entendido que, embora a presente tecnologia tenha sido especificamente divulgada pelas modalidades representativas e características opcionais, modificação e variação dos conceitos aqui revelados podem ser invocadas por aqueles versados na técnica, e tais modificações e variações são consideradas dentro do escopo dessa tecnologia.[640] The technology illustratively described herein may be suitably practiced in the absence of any element(s) not specifically disclosed herein. Thus, for example, in each case here any of the terms "comprising", "consisting essentially of" and "consisting of" may be replaced by any of the other two terms. The terms and expressions that have been employed are used as terms of description and not of limitation, and the use of such terms and expressions does not exclude any equivalents of the shown and described features or segments thereof, and various modifications are possible within the scope of the claimed technology . The term "a" or "an" may refer to one or a plurality of the elements they modify (e.g. "a reactant" may mean one or more reactants) unless it is contextually clear any one of the elements or more than one of the elements is described. The term "about" as used herein refers to a value within 10% of the underlying parameter (i.e., plus or minus 10%), and the use of the term "about" at the beginning of a series of values modifies each of the values (that is, "about 1, 2, and 3" refers to about 1, about 2, and about 3). For example, a "weight of about 100 grams" can include weights between 90 grams and 110 grams. Furthermore, when a list of values is described here (e.g. about 50%, 60%, 70%, 80%, 85% or 86%) the list includes all intermediate and fractional values thereof (e.g. 54%, 85.4%). Accordingly, it is to be understood that, although the present technology has been specifically disclosed by the representative embodiments and optional features, modification and variation of the concepts disclosed herein may be invoked by those skilled in the art, and such modifications and variations are considered within the scope of this technology.

[641]Certas modalidades da tecnologia são apresentadas na reivindicação(ões) que se segue(m).[641]Certain embodiments of the technology are set out in the claim(s) that follow(s).

Claims (9)

1. Método para estimar uma fração de ácido nucleico fetal em uma amostra de teste de uma mulher grávida, caracterizado por compreender: (a) obter contagens de fragmentos de sequências mapeados para porções de um genoma de referência, cujos fragmentos (reads) de sequências são fragmentos de ácido nucleico isentos de célula circulante de uma amostra de teste de uma mulher grávida, e em que tais porções são: (i) definidas com base em uma partição do genoma de referência, em que o genoma de referência é particionado de acordo com um ou mais fatores selecionados de tamanho, teor de guanina-citosina (GC), regiões contíguas, regiões contíguas de tamanho arbitrariamente definido e uma combinação dos mesmos; e (ii) selecionadas de porções (bins) genômicas discretas, porções (bins) genômicas tendo sequências sequenciais de comprimento predeterminado, porções (bins) de tamanho variado, vistas baseadas em ponto de um mapa de cobertura nivelada e uma combinação dos mesmos; (b) selecionar um subconjunto de porções fornecendo, desse modo, um subconjunto de contagens, em que: (i) a seleção é de acordo com as porções para as quais um maior número de fragmentos (reads) de ácido nucleico fetal são mapeados; e (ii) as porções para as quais um maior número de fragmentos (reads) de ácido nucleico fetal são mapeados são determinadas de acordo com uma proporção de X para Y, em que X é a quantidade de fragmentos (reads) derivados de fragmentos isentos de célula circulante (CCF) tendo um comprimento menor do que um comprimento do primeiro fragmento selecionado, em que o comprimento do primeiro fragmento selecionado é 140 a 160 bases, e Y é a quantidade de fragmentos (reads) derivados de fragmentos CCF tendo um comprimento menor do que um segundo comprimento de fragmento selecionado, em que o comprimento do segundo fragmento selecionado é 500 a 700 bases ; e (c) estimar uma fração de ácido nucleico fetal para a amostra de teste com base no subconjunto de contagens.1. Method for estimating a fraction of fetal nucleic acid in a test sample from a pregnant woman, comprising: (a) obtaining sequence fragment counts mapped to portions of a reference genome, whose sequence fragments (reads) are circulating cell-free nucleic acid fragments of a test sample from a pregnant woman, and wherein such portions are: (i) defined on the basis of a reference genome partition, wherein the reference genome is partitioned accordingly with one or more factors selected from size, guanine-cytosine (GC) content, contiguous regions, contiguous regions of arbitrarily defined size, and a combination thereof; and (ii) selected from discrete genomic bins, genomic bins having sequential sequences of predetermined length, varying size bins, point-based views of a flattened coverage map, and a combination thereof; (b) selecting a subset of portions, thus providing a subset of counts, where: (i) the selection is according to the portions to which a greater number of fragments (reads) of fetal nucleic acid are mapped; and (ii) the portions to which a greater number of fragments (reads) of fetal nucleic acid are mapped are determined according to a ratio of X to Y, where X is the amount of fragments (reads) derived from exempt fragments (CCF) having a length less than a length of the first selected fragment, where the length of the first selected fragment is 140 to 160 bases, and Y is the number of fragments (reads) derived from CCF fragments having a length less than a second selected fragment length, wherein the length of the second selected fragment is 500 to 700 bases; and (c) estimating a fetal nucleic acid fraction for the test sample based on the subset of counts. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a proporção é uma proporção média para várias amostras.2. Method according to claim 1, characterized in that the proportion is an average proportion for several samples. 3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que as porções são selecionadas de acordo com uma porção que tem uma proporção média maior do que a proporção média calculada para as porções.3. Method according to claim 2, characterized in that the portions are selected according to a portion that has an average proportion greater than the average proportion calculated for the portions. 4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o comprimento do primeiro fragmento selecionado é de 145 a 155 bases e o comprimento do segundo fragmento selecionado é de 550 a 650 bases4. Method according to any one of claims 1 to 3, characterized in that the length of the first selected fragment is 145 to 155 bases and the length of the second selected fragment is 550 to 650 bases 5. Método, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado pelo fato de que o comprimento do primeiro fragmento selecionado é 145 bases, 150 bases ou 155 bases, e o comprimento do segundo fragmento selecionado é 550 bases, 600 bases ou 650 bases.5. Method according to any one of claims 1 to 4, characterized in that the length of the first selected fragment is 145 bases, 150 bases or 155 bases, and the length of the second selected fragment is 550 bases, 600 bases or 650 bases. 6. Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que as contagens são contagens normalizadas.6. Method according to any one of claims 1 to 5, characterized in that the counts are normalized counts. 7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que as contagens são normalizadas de acordo com o teor de guanina-citosina (GC).7. Method according to claim 6, characterized in that the counts are normalized according to the guanine-cytosine (GC) content. 8. Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que o subconjunto das porções são porções de um ou mais autossomos.8. Method according to any one of claims 1 to 7, characterized in that the subset of portions are portions of one or more autosomes. 9. Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o subconjunto das porções são porções de um ou mais autossomos euploides.9. Method according to any one of claims 1 to 8, characterized in that the subset of the portions are portions of one or more euploid autosomes.
BR122022001849-1A 2013-06-21 2014-06-20 METHOD FOR ESTIMATING A FRACTION OF FETAL NUCLEIC ACID IN A TEST SAMPLE FROM A PREGNANT WOMAN BR122022001849B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US61/838,048 2013-06-21

Publications (1)

Publication Number Publication Date
BR122022001849B1 true BR122022001849B1 (en) 2023-06-13

Family

ID=

Similar Documents

Publication Publication Date Title
AU2020203134B2 (en) Methods and processes for non-invasive assessment of genetic variations
US20220205037A1 (en) Methods and compositions for analyzing nucleic acid
ES2902401T3 (en) Methods and processes for the non-invasive evaluation of genetic variations
BR122022001849B1 (en) METHOD FOR ESTIMATING A FRACTION OF FETAL NUCLEIC ACID IN A TEST SAMPLE FROM A PREGNANT WOMAN