JP2019522861A - ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 - Google Patents
ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 Download PDFInfo
- Publication number
- JP2019522861A JP2019522861A JP2019519631A JP2019519631A JP2019522861A JP 2019522861 A JP2019522861 A JP 2019522861A JP 2019519631 A JP2019519631 A JP 2019519631A JP 2019519631 A JP2019519631 A JP 2019519631A JP 2019522861 A JP2019522861 A JP 2019522861A
- Authority
- JP
- Japan
- Prior art keywords
- alignment
- path
- sequencing
- nucleotide
- variant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 169
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 143
- 238000000034 method Methods 0.000 title claims abstract description 140
- 239000002773 nucleotide Substances 0.000 title claims abstract description 125
- 238000004458 analytical method Methods 0.000 title claims abstract description 89
- 238000012545 processing Methods 0.000 claims description 93
- 239000002157 polynucleotide Substances 0.000 claims description 51
- 102000040430 polynucleotide Human genes 0.000 claims description 41
- 108091033319 polynucleotide Proteins 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 30
- 238000013507 mapping Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 7
- 238000012217 deletion Methods 0.000 abstract description 4
- 230000037430 deletion Effects 0.000 abstract description 4
- 230000002068 genetic effect Effects 0.000 abstract description 4
- 238000003780 insertion Methods 0.000 abstract description 4
- 230000037431 insertion Effects 0.000 abstract description 4
- 230000008711 chromosomal rearrangement Effects 0.000 abstract description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 abstract description 3
- 239000007850 fluorescent dye Substances 0.000 description 36
- 210000004027 cell Anatomy 0.000 description 35
- 230000003287 optical effect Effects 0.000 description 22
- 102000053602 DNA Human genes 0.000 description 14
- 108020004414 DNA Proteins 0.000 description 14
- 239000012530 fluid Substances 0.000 description 14
- 238000002073 fluorescence micrograph Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 239000003153 chemical reaction reagent Substances 0.000 description 10
- 239000012634 fragment Substances 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000002864 sequence alignment Methods 0.000 description 6
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical group C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 5
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 5
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 5
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- XYFCBTPGUUZFHI-UHFFFAOYSA-N Phosphine Chemical compound P XYFCBTPGUUZFHI-UHFFFAOYSA-N 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 101000829958 Homo sapiens N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Proteins 0.000 description 3
- 102100023315 N-acetyllactosaminide beta-1,6-N-acetylglucosaminyl-transferase Human genes 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000001717 pathogenic effect Effects 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 125000003545 alkoxy group Chemical group 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 229910000073 phosphorus hydride Inorganic materials 0.000 description 2
- 238000010223 real-time analysis Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 102220573043 RNA polymerase II subunit A C-terminal domain phosphatase_A2R_mutation Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 229910044991 metal oxide Inorganic materials 0.000 description 1
- 150000004706 metal oxides Chemical class 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 244000045947 parasite Species 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 102220281779 rs1555594471 Human genes 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 238000005309 stochastic process Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Medical Informatics (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Data Mining & Analysis (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Databases & Information Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
Description
本願は、2016年10月7日に出芽された米国仮出願番号第62/405824号に基づく優先権を主張しており;その内容は、その全体が参考として本明細書中に援用される。
分野
本開示は、一般に、DNA配列決定の分野に関し、より詳細には、次世代配列決定適用のためにリアルタイム二次分析を行うためのシステムおよび方法に関する。
遺伝子変異は、配列リードにおいて−参照配列に対して−バリアントを識別することによって識別され得る。バリアントを識別するために、被験体に由来するサンプルは、配列リードを得るために、配列決定機器を使用して完全に配列決定され得る。配列リードを得た後、その配列リードは、バリアント呼び出しの前にアセンブルまたは整列され得る。従って、バリアントを識別する工程は、連続して行われかつ配列決定プロセスの完了後に行うために時間を浪費し得る別個の工程を包含する。
本明細書で開示されるのは、ポリヌクレオチドを配列決定するためのシステムおよび方法である。一実施形態において、上記システムは、以下を含む:参照ヌクレオチド配列を含むメモリ;プロセッサであって、以下の工程:リードの第1のヌクレオチド部分配列を配列決定システムから受け取る工程;上記参照配列上での上記リードの第1の複数の候補位置を決定するために、上記第1のヌクレオチド部分配列を第1のアラインメントパスを使用して処理する工程;上記第1のヌクレオチド部分配列が、上記決定された候補位置に基づいて上記参照配列に整列するか否かを決定する工程;第2のヌクレオチド部分配列を上記配列決定システムから受け取る工程;上記参照配列に整列する上記リードの第2の複数の候補位置を決定するために、上記第2のヌクレオチド部分配列を処理する工程であって、上記リードが上記参照配列に整列する場合には、第2のアラインメントパス、およびそうでなければ、第1のアラインメントパスを使用し、ここで上記第2のアラインメントパスは、上記リードの上記第2の複数の候補位置を決定するために、上記第1のアラインメントパスより計算上効率的である工程を包含する方法を行う命令を実行するように構成されたプロセッサ。
以下の詳細な説明において、添付の図面に対して参照が行われる。添付の図面は、本明細書の一部を形成する。図面において、類似記号は、状況が別段規定しなければ、代表的には類似の構成要素を識別する。詳細な説明、図面、および特許請求の範囲において記載される例証的実施形態は、限定することを意味しない。他の実施形態が利用され得、本明細書に示される主題の趣旨または範囲から逸脱することなく他の変更が行われ得る。本開示の局面が、本明細書で一般的に記載されかつ図面の中で図示されるように、広く種々の異なる構成で取り合わせられ得、置き換えられ得、組み合わされ得、分離され得、そして設計され得、これらの全てが、本明細書中で明示的に企図されることは、容易に理解される。
別段定義されなければ、本明細書で使用される技術用語および科学用語は、本開示が属する分野の当業者によって一般的に理解されるものと同じ意味を有する。例えば、Singletonら, Dictionary of Microbiology and Molecular Biology 第2版, J. Wiley & Sons(New York, NY 1994);Sambrookら, Molecular Cloning, A Laboratory Manual, Cold Springs Harbor Press(Cold Springs Harbor, NY 1989)を参照のこと。本開示の目的のために、以下の用語が以下で定義される。
本明細書で開示されるのは、時間および/またはコンピューティング資源効率的様式において、二次分析を反復して行うためのシステムおよび方法である、二次分析は、参照配列(例えば、ヒト参照ゲノム配列)への配列リードのアラインメントおよびサンプルと参照との間の差異を検出するためのこのアラインメントの利用の両方を包含し得る。二次分析は、遺伝的差異の検出、バリアント検出および遺伝子決定、一塩基多型(SNPs)、小さな挿入および欠失(インデル)、ならびにDNAにおける構造的変化(例えば、コピー数バリアント(CNVs)および染色体再配置)の識別を可能にし得る。二次分析は、配列決定データが次の配列決定サイクルのために生成されている最中に、1つの配列決定サイクルに関して行われ得る。
配列決定システム100のコンピューターシステム106は、上記で考察されるように、光学システム102および流体システム104を制御するように構成され得る。コンピューターシステム106に関しては多くの構成が可能であるが、一実施形態は、図2に図示される。図2に示されるように、コンピューターシステム106は、メモリ204、記憶装置206、および通信インターフェース208と電子的に通信状態にあるプロセッサ202を含み得る。一実施形態において、コンピューターシステム106は、配列アラインメントを行い、バリアント呼び出しを生成するために、フィールドプログラマブルゲートアレイ(FPGA)、グラフィクス処理ユニット(GPU)、および/またはベクトル中央演算処理装置(CPU)を含む。
図3は、配列決定システム100を利用して逐次合成配列決定を行うための例示的方法300のフローチャートである。方法300がブロック305で開始した後、フラグメント化二本鎖ポリヌクレオチドフラグメントを含むフローセル114は、ブロック310で受け取られる。そのフラグメント化二本鎖ポリヌクレオチドフラグメントは、デオキシリボ核酸(DNA)サンプルから生成され得る。そのDNAサンプルは、種々の供給源、例えば、生物学的サンプル、細胞サンプル、環境サンプル、またはこれらのうちのいずれかの組み合わせに由来し得る。DNAサンプルは、患者に由来する生物学的流体、組織、および細胞のうちの1またはこれより多くを含み得る。例えば、そのDNAサンプルは、血液、尿、脳脊髄液、胸膜液、羊水、精液、唾液、骨髄、生検サンプル、またはこれらのうちのいずれかの組み合わせから採取され得るか、またはこれらを含み得る。
塩基呼び出しは、グアニン(G)、チミン(T)、シトシン(C)、またはアデニン(A)であると配列決定されている最中の、成長中のプライマー−ポリヌクレオチドのクラスターへと組み込まれたヌクレオチドの塩基を決定するプロセスをいい得る。図4は、配列決定システム100を利用して、塩基呼び出しを行うための例示的方法400のフローチャートである。図3で図示されるブロック335において検出されたシグナルを処理する工程は、方法400の塩基呼び出しを行う工程を包含し得る。ブロック405において開始した後、所定の波長の光が、レーザーを使用して生成され得る。その生成された光は、ブロック410においてヌクレオチドアナログ上で光り得る。例えば、コンピューターシステム106は、その光学システムインターフェース212および通信チャネル108aを通じて、レーザー120に所定の波長にある光を生成させ得る。
本明細書で記載される方法は、種々の核酸配列決定技術とともに使用され得る。特に適用可能な技術は、核酸がアレイの中の固定された位置に付着され、その結果、それらの相対的な位置が変化せず、そしてそのアレイが反復して画像化されるものである。画像が異なるカラーチャネルにおいて、例えば、一方のヌクレオチド塩基タイプを別のものから区別するために使用される異なる標識が同時に存在して得られる実施形態は、特に適用可能である。いくつかの実施形態において、標的核酸のヌクレオチド配列を決定するプロセスは、自動化プロセスであり得る。好ましい実施形態としては、逐次合成配列決定を行う(「SBS」)技術が挙げられる。
図5Aおよび図5Bは、一実施形態に従う例示的な反復アラインメントおよびバリアント呼び出しプロセスを示す。ある数の最小限の配列決定サイクルを画像化した後、リアルタイム一次分析が、各整列されていないリードに関する塩基呼び出しおよび品質スコアを決定するために行われ得る。図5Aにおいて、示される最小限の数の配列決定サイクルは、3である。いくつかの実施形態において、最小限の配列決定サイクルは、16、32、またはこれより多くのサイクルであり得る。塩基呼び出しおよび品質スコア決定は、図3を参照して上記で例証される。各リードは、最も可能性の高いアラインメントが選択された状態で参照配列に整列され得、次いで、そのリードは、積み重ねられて、バリアント呼び出しが行われ得る。
図6は、リアルタイム二次配列分析を行うための例示的方法600のフローチャートである。方法600がブロック605で開始した後、配列決定サイクルの画像化データは、ブロック610において受け取られ得る。例えば、コンピューターシステム106は、その画像化データを検出器126から受け取り得る。ブロック615において、塩基が決定され得、その塩基の品質スコアが決定され得る。画像化データを生成し、塩基を決定し、その決定された塩基の品質を決定する工程は、図3〜4を参照しながら上記で例証される。各配列決定サイクルの後に、配列決定リードの長さは、1ヌクレオチド長くなり得る。例えば、31回目の配列決定サイクルの後に、その配列決定リードは、長さが31ヌクレオチドであり、32回目の配列決定サイクルの後に、その配列決定リードは、長さが1ヌクレオチド長くなって、32ヌクレオチドになる。
さらなる実施形態は、配列決定リードの反復処理を含む二次分析のためのシステムおよび方法である。二次分析は、参照配列(例えば、ヒト参照ゲノム配列)への配列リードのアラインメントおよびサンプルと参照との間の差異を検出するためのこのアラインメントの利用(例えば、バリアント検出および呼び出し)の両方を包含し得る。1つの実行において、アラインメントおよびバリアント呼び出し結果は、配列決定機が実行を終了する前に得られ得る。例えば、これらの結果は、利用可能なコンピューティング資源に依存する時間区間で提供され得る。これは、前の反復からの中間アラインメント結果を、現在の反復からのアラインメント結果で拡張することによって達成され得る。その現在の反復からのアラインメント結果は、現在の反復の新たに配列決定された塩基と、以前に整列された位置における参照配列からの塩基とを比較することによって生成される。その比較の結果は、前の反復からのアラインメント結果と合わせられ、その合わされた出力は、次の反復のために保存される。
図9Aは、リアルタイム二次分析を行うための例示的方法900のフローチャートである。方法900は、2つのパスを含む:旧来の二次分析法の低信頼度・高コンピューテーションプロセシングパスおよび本開示の一実施形態に従う高信頼度・低コンピューテーションプロセシングパス。低信頼度・高プロセシングパスおよび高信頼度・低プロセシングパスは、それぞれ、青色のパスおよび黄色のパスとして本明細書で言及される。
図11Aおよび図11Bは、既存のバリアント呼び出し法、Strelkaスモールバリアント呼び出し側(図11A)、および本開示のバリアント呼び出し法(図11B)の単純化したフロー図を示す。図11Aは、スモールバリアント呼び出し側が、入力としてアライナーから生成された積み重ね情報を使用することを示す。積み重ねから、スモールバリアント呼び出し側は、アクティブ領域として公知の配列バリエーションの領域を識別する。次に、デノボリアセンブリは、そのアクティブ領域に適用され得る。各ゲノム位置において、ゲノム位置における配列決定されたポリヌクレオチドが、A、C、T、またはGである可能性を決定するために、確率が生成される。これらの確率から、バリアントが検出され得る。
特定の実施形態において、例えば、以下が提供される:
(項目1)
ポリヌクレオチドを配列決定するためのシステムであって:
参照ヌクレオチド配列を含むメモリ;
プロセッサであって、以下の工程:
リードの第1のヌクレオチド部分配列を配列決定システムから受け取る工程;
該参照配列上での該リードの第1の複数の候補位置を決定するために、該第1のヌクレオチド部分配列を、第1のアラインメントパスを使用して処理する工程;
該第1のヌクレオチド部分配列が、該決定された候補位置に基づいて該参照配列に整列するか否かを決定する工程;
第2のヌクレオチド部分配列を該配列決定システムから受け取る工程;
該参照配列に整列する該リードの第2の複数の候補位置を決定するために、該第2のヌクレオチド部分配列を処理する工程であって、
該リードが該参照配列に整列される場合には、第2のアラインメントパス、そして
そうでなければ、第1のアラインメントパスを使用し、ここで該第2のアラインメントパスは、該リードの該第2の複数の候補位置を決定するために、該第1のアラインメントパスより計算上効率的である、工程、を包含する方法を行う命令を実行するように構成されたプロセッサ、を含むシステム。
(項目2)
前記第2のヌクレオチド部分配列は、アラインメント品質評価基準に基づいて、前記第1のアラインメントパスまたは前記第2のアラインメントパスを使用して処理される、項目1に記載のシステム。
(項目3)
前記第1のヌクレオチド部分配列は、長さが1またはこれより多くのヌクレオチドである、項目1に記載のシステム。
(項目4)
前記第2のヌクレオチド部分配列は、長さが1またはこれより多くのヌクレオチドである、項目1に記載のシステム。
(項目5)
前記第2のアラインメントパスは、メモリ使用量またはコンピューテーションオペレーションの回数において、前記第1のアラインメントパスより計算上効率的である、項目1に記載のシステム。
(項目6)
前記プロセッサは、前記第1のヌクレオチド部分配列が前記参照配列に整列される場合に、前記第1の複数の候補位置のうちの少なくとも1つに相当するデータを保存するようにさらに構成される、項目1に記載のシステム。
(項目7)
前記プロセッサは、前記リードが前記参照配列に整列したままである場合に、前記第2の複数の候補位置のうちの少なくとも1つに相当するデータを保存するようにさらに構成される、項目6に記載のシステム。
(項目8)
前記第2のヌクレオチド部分配列を、前記第2のアラインメントパスを使用して処理する工程は、単純アラインメントスコアを決定するために、単純アラインメントを行うことを包含する、項目1に記載のシステム。
(項目9)
前記単純アラインメントを行うことは、前記第1の複数の候補位置に基づいて、前記第2のヌクレオチド部分配列と前記参照配列上の該第2のヌクレオチド部分配列の相当する配列とを比較することを包含する、項目8に記載のシステム。
(項目10)
前記第2のヌクレオチド部分配列を、第2のプロセシングパスを使用して処理する工程は、前記リードの前記第2の複数の候補位置の各々についてマッピング品質(MapQ)スコアを決定する工程をさらに包含する、項目8に記載のシステム。
(項目11)
前記単純アラインメントスコアは、前記MapQスコアを含む、項目10に記載のシステム。
(項目12)
前記プロセッサは、前記第1の複数の候補位置のうちの少なくとも1つまたは前記第2の複数の候補位置のうちの少なくとも1つを含む前記第1のまたは第2のアラインメントパスの出力に対してバリアント呼び出しを行うようにさらに構成される、項目1に記載のシステム。
(項目13)
前記第1のまたは第2のアラインメントパスの出力に対して前記バリアント呼び出しを行う工程は、
該第1のまたは第2のアラインメントパスの出力に対して、第1のバリアント呼び出しパスまたは第2のバリアント呼び出しパスを使用してバリアント呼び出しを行うことであって、ここで該第2のバリアント呼び出しパスは、前記第2の部分配列のバリアント呼び出しにおいて、該第1のバリアント呼び出しパスより計算上効率的であることを包含する、項目12に記載のシステム。
(項目14)
前記バリアント呼び出しは、バリアント呼び出し評価基準に基づいて、前記第1のまたは第2のアラインメントパスの出力を使用して行われる、項目12に記載のシステム。
(項目15)
前記バリアント呼び出し評価基準は、前記参照配列の位置において呼び出される多くの異なる塩基タイプに基づいて決定される、項目14に記載のシステム。
(項目16)
前記第1のヌクレオチド部分配列を処理する工程は、前記配列決定システムが、配列決定実行の間に前記第2のヌクレオチド部分配列を決定する前に完了する、項目1に記載のシステム。
(項目17)
前記配列決定システムは、逐次合成配列決定を行う方法を実行して、前記第1の部分配列を決定する、項目1に記載のシステム。
(項目18)
ポリヌクレオチドを配列決定するための方法であって、該方法は、
配列決定実行の間に、リードの第1のヌクレオチド部分配列を、配列決定システムから受け取る工程;および
該リードの該第1のヌクレオチド部分配列の二次分析を、第1の分析パスまたは第2の分析パスを使用して参照配列に基づいて行う工程であって、ここで該第2の分析パスは、該二次分析を行うにあたって前記第1のプロセシングパスより計算上効率的である工程、を包含する方法。
(項目19)
前記二次分析を行う工程は、前記参照配列に整列する前記リードの第1の複数の候補位置を決定するために、前記第1のヌクレオチド部分配列を処理することであって:
該リードが該参照配列に整列されない場合には、第1のアラインメントパス、そして
そうでなければ、第2のアラインメントパスを使用し、ここで該第2のアラインメントパスは、該リードの該第1の複数の候補位置を決定するために、該第1のアラインメントパスより計算上効率的であること、を包含する、項目18に記載の方法。
(項目20)
前記第2のヌクレオチド部分配列を、前記第2のアラインメントパスを使用して処理することは、単純アラインメントスコアを決定するために、単純アラインメントを行うことを包含する、項目19に記載の方法。
(項目21)
前記二次分析の結果は、前記第1のアラインメントパスの出力、前記第2のアラインメントパスの出力、またはこれらのうちの任意の組み合わせを含む、項目19に記載の方法。
(項目22)
前記二次分析を行う工程は、以下:
第1のまたは第2のアラインメントパスの出力に対して、第1のバリアント呼び出しパスまたは第2のバリアント呼び出しパスを使用してバリアント呼び出しを行うことであって、ここで該第2のバリアント呼び出しパスは、前記第1の部分配列のバリアント呼び出しにおいて該第1のバリアント呼び出しパスより計算上効率的であること、を含む前記第1のヌクレオチド部分配列のバリアント呼び出しを行うことを包含する、項目18に記載の方法。
(項目23)
前記二次分析の結果は、前記第1のバリアント呼び出しパスの出力、前記第2のバリアント呼び出しパスの出力、またはこれらのうちのいずれかの組み合わせを含む、項目22に記載の方法。
(項目24)
前記配列決定実行の間に前記二次分析の結果をユーザーに提供する工程をさらに包含する、項目18に記載の方法。
(項目25)
前記二次分析の結果は、固定された区間で前記ユーザーに提供される、項目24に記載の方法。
(項目26)
前記二次分析の結果は、前記ユーザーの要求に応じて、該ユーザーに提供される、項目24に記載の方法。
(項目27)
前記二次分析を行う工程は、前記リードの前記第1のヌクレオチド部分配列の二次分析を、前記配列決定実行の先の配列決定区間からの結果に基づいて行うことを包含する、項目18に記載の方法。
Claims (27)
- ポリヌクレオチドを配列決定するためのシステムであって:
参照ヌクレオチド配列を含むメモリ;
プロセッサであって、以下の工程:
リードの第1のヌクレオチド部分配列を配列決定システムから受け取る工程;
該参照配列上での該リードの第1の複数の候補位置を決定するために、該第1のヌクレオチド部分配列を、第1のアラインメントパスを使用して処理する工程;
該第1のヌクレオチド部分配列が、該決定された候補位置に基づいて該参照配列に整列するか否かを決定する工程;
第2のヌクレオチド部分配列を該配列決定システムから受け取る工程;
該参照配列に整列する該リードの第2の複数の候補位置を決定するために、該第2のヌクレオチド部分配列を処理する工程であって、
該リードが該参照配列に整列される場合には、第2のアラインメントパス、そして
そうでなければ、第1のアラインメントパスを使用し、ここで該第2のアラインメントパスは、該リードの該第2の複数の候補位置を決定するために、該第1のアラインメントパスより計算上効率的である、工程、を包含する方法を行う命令を実行するように構成されたプロセッサ、を含むシステム。 - 前記第2のヌクレオチド部分配列は、アラインメント品質評価基準に基づいて、前記第1のアラインメントパスまたは前記第2のアラインメントパスを使用して処理される、請求項1に記載のシステム。
- 前記第1のヌクレオチド部分配列は、長さが1またはこれより多くのヌクレオチドである、請求項1に記載のシステム。
- 前記第2のヌクレオチド部分配列は、長さが1またはこれより多くのヌクレオチドである、請求項1に記載のシステム。
- 前記第2のアラインメントパスは、メモリ使用量またはコンピューテーションオペレーションの回数において、前記第1のアラインメントパスより計算上効率的である、請求項1に記載のシステム。
- 前記プロセッサは、前記第1のヌクレオチド部分配列が前記参照配列に整列される場合に、前記第1の複数の候補位置のうちの少なくとも1つに相当するデータを保存するようにさらに構成される、請求項1に記載のシステム。
- 前記プロセッサは、前記リードが前記参照配列に整列したままである場合に、前記第2の複数の候補位置のうちの少なくとも1つに相当するデータを保存するようにさらに構成される、請求項6に記載のシステム。
- 前記第2のヌクレオチド部分配列を、前記第2のアラインメントパスを使用して処理する工程は、単純アラインメントスコアを決定するために、単純アラインメントを行うことを包含する、請求項1に記載のシステム。
- 前記単純アラインメントを行うことは、前記第1の複数の候補位置に基づいて、前記第2のヌクレオチド部分配列と前記参照配列上の該第2のヌクレオチド部分配列の相当する配列とを比較することを包含する、請求項8に記載のシステム。
- 前記第2のヌクレオチド部分配列を、第2のプロセシングパスを使用して処理する工程は、前記リードの前記第2の複数の候補位置の各々についてマッピング品質(MapQ)スコアを決定する工程をさらに包含する、請求項8に記載のシステム。
- 前記単純アラインメントスコアは、前記MapQスコアを含む、請求項10に記載のシステム。
- 前記プロセッサは、前記第1の複数の候補位置のうちの少なくとも1つまたは前記第2の複数の候補位置のうちの少なくとも1つを含む前記第1のまたは第2のアラインメントパスの出力に対してバリアント呼び出しを行うようにさらに構成される、請求項1に記載のシステム。
- 前記第1のまたは第2のアラインメントパスの出力に対して前記バリアント呼び出しを行う工程は、
該第1のまたは第2のアラインメントパスの出力に対して、第1のバリアント呼び出しパスまたは第2のバリアント呼び出しパスを使用してバリアント呼び出しを行うことであって、ここで該第2のバリアント呼び出しパスは、前記第2の部分配列のバリアント呼び出しにおいて、該第1のバリアント呼び出しパスより計算上効率的であることを包含する、請求項12に記載のシステム。 - 前記バリアント呼び出しは、バリアント呼び出し評価基準に基づいて、前記第1のまたは第2のアラインメントパスの出力を使用して行われる、請求項12に記載のシステム。
- 前記バリアント呼び出し評価基準は、前記参照配列の位置において呼び出される多くの異なる塩基タイプに基づいて決定される、請求項14に記載のシステム。
- 前記第1のヌクレオチド部分配列を処理する工程は、前記配列決定システムが、配列決定実行の間に前記第2のヌクレオチド部分配列を決定する前に完了する、請求項1に記載のシステム。
- 前記配列決定システムは、逐次合成配列決定を行う方法を実行して、前記第1の部分配列を決定する、請求項1に記載のシステム。
- ポリヌクレオチドを配列決定するための方法であって、該方法は、
配列決定実行の間に、リードの第1のヌクレオチド部分配列を、配列決定システムから受け取る工程;および
該リードの該第1のヌクレオチド部分配列の二次分析を、第1の分析パスまたは第2の分析パスを使用して参照配列に基づいて行う工程であって、ここで該第2の分析パスは、該二次分析を行うにあたって前記第1のプロセシングパスより計算上効率的である工程、を包含する方法。 - 前記二次分析を行う工程は、前記参照配列に整列する前記リードの第1の複数の候補位置を決定するために、前記第1のヌクレオチド部分配列を処理することであって:
該リードが該参照配列に整列されない場合には、第1のアラインメントパス、そして
そうでなければ、第2のアラインメントパスを使用し、ここで該第2のアラインメントパスは、該リードの該第1の複数の候補位置を決定するために、該第1のアラインメントパスより計算上効率的であること、を包含する、請求項18に記載の方法。 - 前記第2のヌクレオチド部分配列を、前記第2のアラインメントパスを使用して処理することは、単純アラインメントスコアを決定するために、単純アラインメントを行うことを包含する、請求項19に記載の方法。
- 前記二次分析の結果は、前記第1のアラインメントパスの出力、前記第2のアラインメントパスの出力、またはこれらのうちの任意の組み合わせを含む、請求項19に記載の方法。
- 前記二次分析を行う工程は、以下:
第1のまたは第2のアラインメントパスの出力に対して、第1のバリアント呼び出しパスまたは第2のバリアント呼び出しパスを使用してバリアント呼び出しを行うことであって、ここで該第2のバリアント呼び出しパスは、前記第1の部分配列のバリアント呼び出しにおいて該第1のバリアント呼び出しパスより計算上効率的であること、を含む前記第1のヌクレオチド部分配列のバリアント呼び出しを行うことを包含する、請求項18に記載の方法。 - 前記二次分析の結果は、前記第1のバリアント呼び出しパスの出力、前記第2のバリアント呼び出しパスの出力、またはこれらのうちのいずれかの組み合わせを含む、請求項22に記載の方法。
- 前記配列決定実行の間に前記二次分析の結果をユーザーに提供する工程をさらに包含する、請求項18に記載の方法。
- 前記二次分析の結果は、固定された区間で前記ユーザーに提供される、請求項24に記載の方法。
- 前記二次分析の結果は、前記ユーザーの要求に応じて、該ユーザーに提供される、請求項24に記載の方法。
- 前記二次分析を行う工程は、前記リードの前記第1のヌクレオチド部分配列の二次分析を、前記配列決定実行の先の配列決定区間からの結果に基づいて行うことを包含する、請求項18に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662405824P | 2016-10-07 | 2016-10-07 | |
US62/405,824 | 2016-10-07 | ||
PCT/US2017/055653 WO2018068014A1 (en) | 2016-10-07 | 2017-10-06 | System and method for secondary analysis of nucleotide sequencing data |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020091991A Division JP7051937B2 (ja) | 2016-10-07 | 2020-05-27 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019522861A true JP2019522861A (ja) | 2019-08-15 |
JP6898441B2 JP6898441B2 (ja) | 2021-07-07 |
Family
ID=60480359
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019519631A Active JP6898441B2 (ja) | 2016-10-07 | 2017-10-06 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
JP2020091991A Active JP7051937B2 (ja) | 2016-10-07 | 2020-05-27 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
JP2022025557A Active JP7387777B2 (ja) | 2016-10-07 | 2022-02-22 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020091991A Active JP7051937B2 (ja) | 2016-10-07 | 2020-05-27 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
JP2022025557A Active JP7387777B2 (ja) | 2016-10-07 | 2022-02-22 | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 |
Country Status (15)
Country | Link |
---|---|
US (2) | US11646102B2 (ja) |
EP (1) | EP3458993A1 (ja) |
JP (3) | JP6898441B2 (ja) |
KR (3) | KR102694651B1 (ja) |
CN (2) | CN109416927B (ja) |
AU (3) | AU2017341069A1 (ja) |
BR (1) | BR122023004154A2 (ja) |
CA (1) | CA3027179C (ja) |
IL (2) | IL263512B2 (ja) |
MX (2) | MX2018015412A (ja) |
MY (1) | MY193917A (ja) |
RU (1) | RU2741807C2 (ja) |
SG (2) | SG11201810924WA (ja) |
WO (1) | WO2018068014A1 (ja) |
ZA (2) | ZA201808277B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9476095B2 (en) | 2011-04-15 | 2016-10-25 | The Johns Hopkins University | Safe sequencing system |
EP3447495B2 (en) | 2012-10-29 | 2024-03-13 | The Johns Hopkins University | Papanicolaou test for ovarian and endometrial cancers |
WO2017027653A1 (en) | 2015-08-11 | 2017-02-16 | The Johns Hopkins University | Assaying ovarian cyst fluid |
US20200087723A1 (en) * | 2016-12-15 | 2020-03-19 | Illumina, Inc. | Methods and systems for determining paralogs |
CA3072195A1 (en) | 2017-08-07 | 2019-04-04 | The Johns Hopkins University | Methods and materials for assessing and treating cancer |
US11210554B2 (en) | 2019-03-21 | 2021-12-28 | Illumina, Inc. | Artificial intelligence-based generation of sequencing metadata |
EP3807887B1 (en) | 2019-05-24 | 2024-06-26 | Illumina, Inc. | Flexible seed extension for hash table genomic mapping |
KR102292599B1 (ko) * | 2019-11-06 | 2021-08-23 | 주식회사 뷰웍스 | 광학 분석 장치 및 광학 분석 방법 |
CA3167358A1 (en) * | 2020-03-11 | 2021-09-16 | Michael J. Carney | Incremental secondary analysis of nucleic acid sequences |
CN113436683B (zh) * | 2020-03-23 | 2024-08-16 | 北京合生基因科技有限公司 | 筛选候选插入片段的方法和系统 |
AU2022202798A1 (en) * | 2021-05-26 | 2022-12-15 | Genieus Genomics Pty Ltd | Processing sequencing data relating to amyotrophic lateral sclerosis |
CN113299344A (zh) * | 2021-06-23 | 2021-08-24 | 深圳华大医学检验实验室 | 基因测序分析方法、装置、存储介质和计算机设备 |
WO2024081805A1 (en) * | 2022-10-13 | 2024-04-18 | Element Biosciences, Inc. | Separating sequencing data in parallel with a sequencing run in next generation sequencing data analysis |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110270533A1 (en) * | 2010-04-30 | 2011-11-03 | Life Technologies Corporation | Systems and methods for analyzing nucleic acid sequences |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2357263A1 (en) | 2001-09-07 | 2003-03-07 | Bioinformatics Solutions Inc. | New methods for faster and more sensitive homology search in dna sequences |
US7575865B2 (en) * | 2003-01-29 | 2009-08-18 | 454 Life Sciences Corporation | Methods of amplifying and sequencing nucleic acids |
CN101137991A (zh) * | 2005-02-11 | 2008-03-05 | 智明基因有限责任公司 | 验证dna测序数据的计算机实施的方法和基于计算机的系统 |
US20120203792A1 (en) | 2011-02-01 | 2012-08-09 | Life Technologies Corporation | Systems and methods for mapping sequence reads |
CA2850785C (en) * | 2011-10-06 | 2022-12-13 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
US10424394B2 (en) * | 2011-10-06 | 2019-09-24 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
KR101394339B1 (ko) * | 2012-03-06 | 2014-05-13 | 삼성에스디에스 주식회사 | 시드의 길이를 고려한 염기 서열 처리 시스템 및 방법 |
US10504613B2 (en) * | 2012-12-20 | 2019-12-10 | Sequenom, Inc. | Methods and processes for non-invasive assessment of genetic variations |
KR101481457B1 (ko) * | 2012-10-29 | 2015-01-12 | 삼성에스디에스 주식회사 | 리드 전체를 고려한 염기 서열 정렬 시스템 및 방법 |
US20140238250A1 (en) * | 2013-02-28 | 2014-08-28 | Wki Holding Company, Inc. | Microwavable Heating Element and Composition |
US20160034638A1 (en) * | 2013-03-14 | 2016-02-04 | University Of Rochester | System and Method for Detecting Population Variation from Nucleic Acid Sequencing Data |
US10191929B2 (en) | 2013-05-29 | 2019-01-29 | Noblis, Inc. | Systems and methods for SNP analysis and genome sequencing |
RU2539038C1 (ru) * | 2013-11-02 | 2015-01-10 | Общество с ограниченной ответственностью "Гамма" | Способ секвенирования днк и устройство для его осуществления (варианты) |
CN104462211B (zh) * | 2014-11-04 | 2018-01-02 | 北京诺禾致源科技股份有限公司 | 重测序数据的处理方法和处理装置 |
-
2017
- 2017-10-06 CA CA3027179A patent/CA3027179C/en active Active
- 2017-10-06 JP JP2019519631A patent/JP6898441B2/ja active Active
- 2017-10-06 WO PCT/US2017/055653 patent/WO2018068014A1/en active Application Filing
- 2017-10-06 IL IL263512A patent/IL263512B2/en unknown
- 2017-10-06 KR KR1020237010257A patent/KR102694651B1/ko active IP Right Grant
- 2017-10-06 IL IL300135A patent/IL300135B2/en unknown
- 2017-10-06 CN CN201780040788.0A patent/CN109416927B/zh active Active
- 2017-10-06 MX MX2018015412A patent/MX2018015412A/es unknown
- 2017-10-06 KR KR1020227011278A patent/KR102515638B1/ko active IP Right Grant
- 2017-10-06 SG SG11201810924WA patent/SG11201810924WA/en unknown
- 2017-10-06 SG SG10201911912XA patent/SG10201911912XA/en unknown
- 2017-10-06 RU RU2018143972A patent/RU2741807C2/ru active
- 2017-10-06 US US16/311,141 patent/US11646102B2/en active Active
- 2017-10-06 CN CN202211557451.6A patent/CN115810396A/zh active Pending
- 2017-10-06 BR BR122023004154-2A patent/BR122023004154A2/pt unknown
- 2017-10-06 EP EP17804976.3A patent/EP3458993A1/en active Pending
- 2017-10-06 KR KR1020187038172A patent/KR102384832B1/ko active IP Right Grant
- 2017-10-06 MY MYPI2018002632A patent/MY193917A/en unknown
- 2017-10-06 AU AU2017341069A patent/AU2017341069A1/en not_active Abandoned
-
2018
- 2018-12-07 ZA ZA2018/08277A patent/ZA201808277B/en unknown
- 2018-12-11 MX MX2022011757A patent/MX2022011757A/es unknown
-
2020
- 2020-05-27 JP JP2020091991A patent/JP7051937B2/ja active Active
- 2020-07-22 AU AU2020207826A patent/AU2020207826B2/en active Active
-
2021
- 2021-03-15 ZA ZA2021/01720A patent/ZA202101720B/en unknown
- 2021-12-01 AU AU2021277671A patent/AU2021277671B2/en active Active
-
2022
- 2022-02-22 JP JP2022025557A patent/JP7387777B2/ja active Active
-
2023
- 2023-04-13 US US18/300,343 patent/US20230410945A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110270533A1 (en) * | 2010-04-30 | 2011-11-03 | Life Technologies Corporation | Systems and methods for analyzing nucleic acid sequences |
Non-Patent Citations (1)
Title |
---|
MILLER JASON R: "ASSEMBLY ALGORITHMS FOR NEXT-GENERATION SEQUENCING DATA", GENOMICS, vol. VOL:95, NR:6, JPN5019005455, 6 March 2010 (2010-03-06), US, pages 315 - 327, ISSN: 0004375196 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7387777B2 (ja) | ヌクレオチド配列決定データの2次分析のためのシステムおよび方法 | |
US20190362810A1 (en) | Systems and methods for determining copy number variation | |
JP7373047B2 (ja) | 圧縮分子タグ付き核酸配列データを用いた融合の検出のための方法 | |
US20240274241A1 (en) | Methods for compression of molecular tagged nucleic acid sequence data | |
US20210358572A1 (en) | Methods, systems, and computer-readable media for calculating corrected amplicon coverages | |
JP2010528608A5 (ja) | ||
JP2024056939A (ja) | 生体試料のフィンガープリンティングのための方法 | |
NZ793021A (en) | System and method for secondary analysis of nucleotide sequencing data | |
BR112018076983B1 (pt) | Sistema e métodos implementados por computadores para sequenciamento eficiente de polinucleotídeos |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181226 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201028 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210610 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6898441 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |