JP6883180B2 - 高正確度変異体コールのためのシステムおよび方法 - Google Patents
高正確度変異体コールのためのシステムおよび方法 Download PDFInfo
- Publication number
- JP6883180B2 JP6883180B2 JP2019095951A JP2019095951A JP6883180B2 JP 6883180 B2 JP6883180 B2 JP 6883180B2 JP 2019095951 A JP2019095951 A JP 2019095951A JP 2019095951 A JP2019095951 A JP 2019095951A JP 6883180 B2 JP6883180 B2 JP 6883180B2
- Authority
- JP
- Japan
- Prior art keywords
- hla
- allele
- patient
- sequence
- alleles
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 65
- 108700028369 Alleles Proteins 0.000 claims description 155
- 238000004458 analytical method Methods 0.000 claims description 20
- 238000012163 sequencing technique Methods 0.000 claims description 19
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 claims description 8
- 108010075704 HLA-A Antigens Proteins 0.000 claims description 8
- 108090000623 proteins and genes Proteins 0.000 claims description 8
- 102100028971 HLA class I histocompatibility antigen, C alpha chain Human genes 0.000 claims description 7
- 108010052199 HLA-C Antigens Proteins 0.000 claims description 7
- 238000003559 RNA-seq method Methods 0.000 claims description 6
- 238000001712 DNA sequencing Methods 0.000 claims description 5
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 claims description 5
- 108010058607 HLA-B Antigens Proteins 0.000 claims description 5
- 238000000126 in silico method Methods 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 206010028980 Neoplasm Diseases 0.000 description 21
- 239000002131 composite material Substances 0.000 description 14
- 108020004414 DNA Proteins 0.000 description 12
- 230000035772 mutation Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 239000012634 fragment Substances 0.000 description 5
- 101001100327 Homo sapiens RNA-binding protein 45 Proteins 0.000 description 4
- 102100038823 RNA-binding protein 45 Human genes 0.000 description 4
- 210000000349 chromosome Anatomy 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 244000052769 pathogen Species 0.000 description 4
- 241000532838 Platypus Species 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 210000004602 germ cell Anatomy 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000000392 somatic effect Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 108010050568 HLA-DM antigens Proteins 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 238000012165 high-throughput sequencing Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- WEVYNIUIFUYDGI-UHFFFAOYSA-N 3-[6-[4-(trifluoromethoxy)anilino]-4-pyrimidinyl]benzamide Chemical compound NC(=O)C1=CC=CC(C=2N=CN=C(NC=3C=CC(OC(F)(F)F)=CC=3)C=2)=C1 WEVYNIUIFUYDGI-UHFFFAOYSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 102100030346 Antigen peptide transporter 1 Human genes 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 101100284398 Bos taurus BoLA-DQB gene Proteins 0.000 description 1
- 102100028970 HLA class I histocompatibility antigen, alpha chain E Human genes 0.000 description 1
- 102100028966 HLA class I histocompatibility antigen, alpha chain F Human genes 0.000 description 1
- 102100028967 HLA class I histocompatibility antigen, alpha chain G Human genes 0.000 description 1
- 102100033079 HLA class II histocompatibility antigen, DM alpha chain Human genes 0.000 description 1
- 102100031258 HLA class II histocompatibility antigen, DM beta chain Human genes 0.000 description 1
- 102100031547 HLA class II histocompatibility antigen, DO alpha chain Human genes 0.000 description 1
- 102100031546 HLA class II histocompatibility antigen, DO beta chain Human genes 0.000 description 1
- 102100029966 HLA class II histocompatibility antigen, DP alpha 1 chain Human genes 0.000 description 1
- 102100031618 HLA class II histocompatibility antigen, DP beta 1 chain Human genes 0.000 description 1
- 102100036242 HLA class II histocompatibility antigen, DQ alpha 2 chain Human genes 0.000 description 1
- 102100040505 HLA class II histocompatibility antigen, DR alpha chain Human genes 0.000 description 1
- 108010093061 HLA-DPA1 antigen Proteins 0.000 description 1
- 108010045483 HLA-DPB1 antigen Proteins 0.000 description 1
- 108010086786 HLA-DQA1 antigen Proteins 0.000 description 1
- 108010067802 HLA-DR alpha-Chains Proteins 0.000 description 1
- 108010024164 HLA-G Antigens Proteins 0.000 description 1
- 102100031180 Hereditary hemochromatosis protein Human genes 0.000 description 1
- 101000986085 Homo sapiens HLA class I histocompatibility antigen, alpha chain E Proteins 0.000 description 1
- 101000986080 Homo sapiens HLA class I histocompatibility antigen, alpha chain F Proteins 0.000 description 1
- 101000866278 Homo sapiens HLA class II histocompatibility antigen, DO alpha chain Proteins 0.000 description 1
- 101000866281 Homo sapiens HLA class II histocompatibility antigen, DO beta chain Proteins 0.000 description 1
- 101000993059 Homo sapiens Hereditary hemochromatosis protein Proteins 0.000 description 1
- 101000866971 Homo sapiens Putative HLA class I histocompatibility antigen, alpha chain H Proteins 0.000 description 1
- 108010023335 Member 2 Subfamily B ATP Binding Cassette Transporter Proteins 0.000 description 1
- 244000089486 Phragmites australis subsp australis Species 0.000 description 1
- 235000014676 Phragmites communis Nutrition 0.000 description 1
- 241000223960 Plasmodium falciparum Species 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013477 bayesian statistics method Methods 0.000 description 1
- 102000004441 bcr-abl Fusion Proteins Human genes 0.000 description 1
- 108010056708 bcr-abl Fusion Proteins Proteins 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 235000012813 breadcrumbs Nutrition 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000711 cancerogenic effect Effects 0.000 description 1
- 231100000315 carcinogenic Toxicity 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 108010087914 epidermal growth factor receptor VIII Proteins 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012405 in silico analysis Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000010445 mica Substances 0.000 description 1
- 229910052618 mica group Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 244000052613 viral pathogen Species 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/40—Population genetics; Linkage disequilibrium
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B35/00—ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/60—In silico combinatorial chemistry
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Library & Information Science (AREA)
- Ecology (AREA)
- Physiology (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Computing Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Description
本
例えば、検討される患者配列リードはDNA配列とRNA配列を含み、それぞれの配列は当技術分野で既知のすべての方法を使用して取得できる。さらに、そのような配列リードは、データ記憶装置(例えばデータベース)から、またはシーケンシング装置から提供され得る。例えば、DNA配列リードはNGSシーケンシング装置から導き出され、RNA配列はrtPCRシーケンシング装置から導き出され得る。したがって、患者配列リードの長さは、一般的に20塩基超、より一般的に50塩基超、最も一般的に100塩基超であるが、通常は5,000塩基未満、もしくは3,000塩基未満、もしくは1,000塩基未満である。したがって、検討される患者配列リードは、100塩基と500塩基の間または150塩基と1,000塩基の間の長さであり得る。
Edge0.配列 = ATATC
Edge0.外向き = [TATCG, TATCC]
Edge0.内向き = [TATAT]
Edge0.サポート = {‘参照’: 1, ‘腫瘍’: T0, ‘正常’: N0}
Edge0.quality_sum = {‘tumor’: TQ0, ‘normal’: NQ0}
Edge1.配列 = TATCG
Edge1.外向き = [ATCGG]
Edge1.内向き = [ATATC]
Edge1.support = {‘reference’: 0, ‘tumor’: T1, ‘normal’: N1}
Edge1.品質_sum = {‘腫瘍’: TQ1, ‘正常’: NQ1}
予測されたHLA型と実験に基づいて決定されたHLA型(「真実」)との間の相違をさらに調査することにより、以下にさらに詳細に検討するように、NA19238とNA19239がNA19240の両親であった場合、実験に基づいて決定されたHLAは予想された遺伝パターンと一致しなかったことが驚くべきことに明らかになった。
親1(NA19238): 16:02、 11:01
親2(NA19239): 13:01、 ? ←問題の対立遺伝子
子供(NA19240): 16:02、 12:01
Claims (42)
- 患者についてHLA型をインシリコ決定する方法であって、
複数の患者配列リードを提供するステップであって、前記患者配列リードの少なくともいくつかが患者特異的HLAをコードする配列を含む、ステップと、
複数の既知のおよび異なるHLA対立遺伝子の配列を含む参照配列を使用して前記複数の患者配列リードをde Bruijnグラフに通すステップであって、各患者配列リードが前記既知のおよび異なるHLA対立遺伝子に対する重み付き投票を提供する、ステップと、
既知のおよび異なる対立遺伝子のそれぞれに対する投票総数を使用して前記対立遺伝子をランク付けし、前記投票を使用して最上位対立遺伝子を第1のHLA型として識別するステップと、
第1の対立遺伝子型にマッチするk−merに対するバイアスを伴う残りの対立遺伝子の再ランク付けを行って第2のHLA型を識別するステップであって、第1の対立遺伝子型とマッチするk−merの投票値を削除するのではなく減少させることによって算出される調節された投票総数を使用して残りの非最上位の既知のおよび異なるHLA対立遺伝子が再びランク付けされ、調節された最上位HLA対立遺伝子が第2のHLA型として識別される、ステップと、
を含む方法。 - 再ランク付けを行うステップは、前記最上位対立遺伝子とマッチしたk−merの投票値が再ランク付け投票で減少するように実施される、請求項1に記載の方法。
- 前記通すステップは、複数の配列リードのそれぞれをk−merへと分解するステップを含む、請求項1に記載の方法。
- 各配列リードに対する重み付き投票は、前記既知のおよび異なるHLA対立遺伝子の配列にマッチする配列リードのk−merに基づいて提供される、請求項1に記載の方法。
- 各k−merが、10〜30塩基の長さを有する、請求項3または4に記載の方法。
- 配列リードについての重み付き投票が、メタデータに基づいて修正される、請求項1に記載の方法。
- ランク付けは、シーケンシング深度、ユニークなk−merの量、およびメタデータからなる群より選択される因子を使用して補正される、請求項1に記載の方法。
- 前記複数の患者配列リードは、HLA型遺伝子が位置するゲノム領域にあらかじめ選択されている、請求項1に記載の方法。
- 前記複数の患者配列リードは、複数のDNAシーケンシングリードを含む、請求項1に記載の方法。
- 前記複数の患者配列リードは、複数のRNAシーケンシングリードを含む、請求項1に記載の方法。
- 前記参照配列は、少なくとも1%の対立遺伝子頻度を有する少なくとも1つのHLA型についての対立遺伝子を含む、請求項1に記載の方法。
- 前記参照配列は、少なくとも1つのHLA型についての少なくとも10の異なる対立遺伝子を含む、請求項1に記載の方法。
- 前記参照配列は、HLA−A型、HLA−B型、HLA−C型、HLA−DRB−1型、および/またはHLA−DQB−1型からなる群より選択される少なくとも2つの異なるHLA型についての対立遺伝子を含む、請求項1に記載の方法。
- 前記患者配列リードは、BAM形式、SAM形式、GAR形式またはRAW形式である、請求項1に記載の方法。
- 患者についてHLA型をインシリコ決定するためのコンピュータシステムであって、
複数の既知のおよび異なるHLA対立遺伝子の配列を含む参照配列を格納する参照配列データベースと、
複数の患者配列リードを格納もしくは提供する患者配列データソースであって、前記患者配列リードの少なくともいくつかが、患者特異的HLAをコードする配列を含む、患者配列データソースと、
(i)前記参照配列を使用して前記複数の患者配列リードをde Bruijnグラフに通し、各患者配列リードが前記既知のおよび異なるHLA対立遺伝子に対する重み付き投票を提供する;
(ii)既知のおよび異なる対立遺伝子のそれぞれに対する投票総数を使用して前記対立遺伝子をランク付け、前記投票を使用して最上位対立遺伝子を第1のHLA型として識別する;
(iii)第1の対立遺伝子型にマッチするk−merに対するバイアスを伴う残りの対立遺伝子の再ランク付けを行って第2のHLA型を識別し、ここで、第1の対立遺伝子型とマッチするk−merの投票値を削除するのではなく減少させることによって算出される調節された投票総数を使用して残りの非最上位の既知のおよび異なるHLA対立遺伝子が再びランク付けされ、調節された最上位HLA対立遺伝子が第2のHLA型として識別される;
ようにプログラムされた解析エンジンと、
を含むコンピュータシステム。 - 再ランク付けを行うステップは、前記最上位対立遺伝子とマッチしたk−merの投票値が再ランク付け投票で減少するように実施される、請求項15に記載のコンピュータシステム。
- 前記解析エンジンはさらに、前記通すステップが、複数の配列リードのそれぞれをk−merへと分解するステップを含むようにプログラムされている、請求項15に記載のコンピュータシステム。
- 各配列リードに対する重み付き投票は、前記既知のおよび異なるHLA対立遺伝子の配列にマッチする配列リードのk−merに基づいて提供される、請求項15に記載のコンピュータシステム。
- 各k−merが、10〜30塩基の長さを有する、請求項17または18に記載のコンピュータシステム。
- 前記解析エンジンはさらに、配列リードについての重み付き投票をメタデータに基づいて修正するようにプログラムされている、請求項15に記載のコンピュータシステム。
- 前記解析エンジンはさらに、シーケンシング深度、ユニークなk−merの量、およびメタデータからなる群より選択される因子を使用してランク付けを補正するようにプログラムされている、請求項15に記載のコンピュータシステム。
- 前記複数の患者配列リードは、HLA型遺伝子が位置するゲノム領域にあらかじめ選択されている、請求項15に記載のコンピュータシステム。
- 前記複数の患者配列リードは、複数のDNAシーケンシングリードを含む、請求項15に記載のコンピュータシステム。
- 前記複数の患者配列リードは、複数のRNAシーケンシングリードを含む、請求項15に記載のコンピュータシステム。
- 前記参照配列は、少なくとも1%の対立遺伝子頻度を有する少なくとも1つのHLA型についての対立遺伝子を含む、請求項15に記載のコンピュータシステム。
- 前記参照配列は、少なくとも1つのHLA型についての少なくとも10の異なる対立遺伝子を含む、請求項15に記載のコンピュータシステム。
- 前記参照配列は、HLA−A型、HLA−B型、HLA−C型、HLA−DRB−1型、および/またはHLA−DQB−1型からなる群より選択される少なくとも2つの異なるHLA型についての対立遺伝子を含む、請求項15に記載のコンピュータシステム。
- 前記患者配列リードは、BAM形式、SAM形式、GAR形式またはRAW形式である、請求項15に記載のコンピュータシステム。
- 参照配列データベースおよび患者配列データソースが解析エンジンに情報的に連結されているコンピュータシステムに、
複数の患者配列リードを提供するステップであって、前記患者配列リードの少なくともいくつかが患者特異的HLAをコードする配列を含む、ステップと、
複数の既知のおよび異なるHLA対立遺伝子の配列を含む参照配列を使用して前記複数の患者配列リードをde Bruijnグラフに通すステップであって、各患者配列リードが前記既知のおよび異なるHLA対立遺伝子に対する重み付き投票を提供する、ステップと、
既知のおよび異なる対立遺伝子のそれぞれに対する投票総数を使用して前記対立遺伝子をランク付け、前記投票を使用して最上位対立遺伝子を第1のHLA型として識別するステップと、
第1の対立遺伝子型にマッチするk−merに対するバイアスを伴う残りの対立遺伝子の再ランク付けを行って第2のHLA型を識別するステップであって、第1の対立遺伝子型とマッチするk−merの投票値を削除するのではなく減少させることによって算出される調節された投票総数を使用して残りの非最上位の既知のおよび異なるHLA対立遺伝子が再びランク付けされ、調節された最上位HLA対立遺伝子が第2のHLA型として識別される、ステップと、
を含む方法を実施させるためのプログラム命令を含む非一時的なコンピュータ可読媒体。 - 再ランク付けを行うステップは、前記最上位対立遺伝子とマッチしたk−merの投票値が再ランク付け投票で減少するように実施される、請求項29に記載のコンピュータ可読媒体。
- 前記通すステップは、複数の配列リードのそれぞれをk−merへと分解するステップを含む、請求項29に記載のコンピュータ可読媒体。
- 各配列リードに対する重み付き投票は、前記既知のおよび異なるHLA対立遺伝子の配列にマッチする配列リードのk−merに基づいて提供される、請求項29に記載のコンピュータ可読媒体。
- 各k−merが、10〜30塩基の長さを有する、請求項31または32に記載のコンピュータ可読媒体。
- 配列リードについての重み付き投票が、メタデータに基づいて修正される、請求項29に記載のコンピュータ可読媒体。
- ランク付けは、シーケンシング深度、ユニークなk−merの量、およびメタデータからなる群より選択される因子を使用して補正される、請求項29に記載のコンピュータ可読媒体。
- 前記複数の患者配列リードは、HLA型遺伝子が位置するゲノム領域にあらかじめ選択されている、請求項29に記載のコンピュータ可読媒体。
- 前記複数の患者配列リードは、複数のDNAシーケンシングリードを含む、請求項29に記載のコンピュータ可読媒体。
- 前記複数の患者配列リードは、複数のRNAシーケンシングリードを含む、請求項29に記載のコンピュータ可読媒体。
- 前記参照配列は、少なくとも1%の対立遺伝子頻度を有する少なくとも1つのHLA型についての対立遺伝子を含む、請求項29に記載のコンピュータ可読媒体。
- 前記参照配列は、少なくとも1つのHLA型についての少なくとも10の異なる対立遺伝子を含む、請求項29に記載のコンピュータ可読媒体。
- 前記参照配列は、HLA−A型、HLA−B型、HLA−C型、HLA−DRB−1型、および/またはHLA−DQB−1型からなる群より選択される少なくとも2つの異なるHLA型についての対立遺伝子を含む、請求項29に記載のコンピュータ可読媒体。
- 前記患者配列リードは、BAM形式、SAM形式、GAR形式またはRAW形式である、請求項29に記載のコンピュータ可読媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562209858P | 2015-08-25 | 2015-08-25 | |
US62/209,858 | 2015-08-25 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510056A Division JP6533011B2 (ja) | 2015-08-25 | 2016-08-25 | 高正確度変異体コールのためのシステムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019169177A JP2019169177A (ja) | 2019-10-03 |
JP6883180B2 true JP6883180B2 (ja) | 2021-06-09 |
Family
ID=58101056
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510056A Active JP6533011B2 (ja) | 2015-08-25 | 2016-08-25 | 高正確度変異体コールのためのシステムおよび方法 |
JP2019095951A Active JP6883180B2 (ja) | 2015-08-25 | 2019-05-22 | 高正確度変異体コールのためのシステムおよび方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018510056A Active JP6533011B2 (ja) | 2015-08-25 | 2016-08-25 | 高正確度変異体コールのためのシステムおよび方法 |
Country Status (13)
Country | Link |
---|---|
US (2) | US11393557B2 (ja) |
EP (1) | EP3341877B1 (ja) |
JP (2) | JP6533011B2 (ja) |
KR (2) | KR102211461B1 (ja) |
CN (1) | CN108351917B (ja) |
AU (2) | AU2016311444B2 (ja) |
BR (1) | BR112018003631A2 (ja) |
CA (1) | CA2996702C (ja) |
HK (1) | HK1257052A1 (ja) |
IL (2) | IL257724B (ja) |
MX (1) | MX2018002293A (ja) |
RU (1) | RU2018106934A (ja) |
WO (1) | WO2017035392A1 (ja) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3280738A4 (en) | 2015-04-08 | 2019-01-02 | Nantomics, LLC | Cancer neoepitopes |
MX2018002293A (es) | 2015-08-25 | 2018-09-05 | Nantomics Llc | Sistemas y métodos para las llamadas variantes de alta precisión. |
KR20180087246A (ko) | 2015-10-12 | 2018-08-01 | 난토믹스, 엘엘씨 | 네오에피토프의 반복적 발견 및 이에 대한 적응성 면역치료 및 방법 |
KR20180087244A (ko) | 2015-10-12 | 2018-08-01 | 난토믹스, 엘엘씨 | 체크포인트 억제제에 대한 감도를 예측하는 msi 및 네오에피토프를 발견하기 위한 위한 시스템, 조성물 및 방법 |
AU2017217877A1 (en) | 2016-02-12 | 2018-08-16 | Nant Holdings Ip, Llc | High-throughput identification of patient-specific neoepitopes as therapeutic targets for cancer immunotherapies |
KR20180117227A (ko) | 2016-03-24 | 2018-10-26 | 난트셀, 인크. | 네오에피토프 제시를 위한 시퀀스들 및 시퀀스 배열들 |
KR20210010678A (ko) | 2016-06-30 | 2021-01-27 | 난트 홀딩스 아이피, 엘엘씨 | 난트 암 백신 |
US10319465B2 (en) * | 2016-11-16 | 2019-06-11 | Seven Bridges Genomics Inc. | Systems and methods for aligning sequences to graph references |
AU2017362730B2 (en) | 2016-11-21 | 2021-04-08 | Nant Holdings Ip, Llc | Fractal combination therapy |
CN110214275B (zh) | 2016-12-01 | 2022-12-06 | 南托米克斯有限责任公司 | 肿瘤抗原性加工和呈递 |
CN116983395A (zh) | 2017-04-24 | 2023-11-03 | 河谷细胞有限公司 | 靶向性新表位载体及其方法 |
EP3933408A1 (en) | 2017-05-30 | 2022-01-05 | Nant Holdings IP LLC | Circulating tumor cell enrichment using neoepitopes |
CN111213210A (zh) * | 2017-09-06 | 2020-05-29 | 河谷控股Ip有限责任公司 | Hla组织匹配及用于其的方法 |
US11823773B2 (en) | 2018-04-13 | 2023-11-21 | Nant Holdings Ip, Llc | Nant cancer vaccine strategies |
TWI787500B (zh) | 2018-04-23 | 2022-12-21 | 美商南特細胞公司 | 新抗原表位疫苗及免疫刺激組合物及方法 |
US11564980B2 (en) | 2018-04-23 | 2023-01-31 | Nantcell, Inc. | Tumor treatment method with an individualized peptide vaccine |
US20220108768A1 (en) * | 2019-03-08 | 2022-04-07 | Nantomics, Llc | System and method for variant calling |
CN112885406B (zh) * | 2020-04-16 | 2023-01-31 | 深圳裕策生物科技有限公司 | 检测hla杂合性缺失的方法及系统 |
CN112289376B (zh) * | 2020-10-26 | 2021-07-06 | 北京吉因加医学检验实验室有限公司 | 一种检测体细胞突变的方法及装置 |
CN114496077B (zh) * | 2022-04-15 | 2022-06-21 | 北京贝瑞和康生物技术有限公司 | 用于检测单核苷酸变异和插入缺失的方法、设备和介质 |
WO2024106826A1 (ko) * | 2022-11-16 | 2024-05-23 | 주식회사 세니젠 | 기준 서열 데이터와 타겟 및 비-타겟종의 교차검증을 활용한, PCR을 위한 K-mer 유전자 데이터 프로세싱 방법 및 그 장치 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100261189A1 (en) * | 2008-10-03 | 2010-10-14 | Roche Molecular Systems, Inc. | System and method for detection of HLA Variants |
DK2511843T3 (en) * | 2009-04-29 | 2017-03-27 | Complete Genomics Inc | METHOD AND SYSTEM FOR DETERMINING VARIATIONS IN A SAMPLE POLYNUCLEOTIDE SEQUENCE IN TERMS OF A REFERENCE POLYNUCLEOTIDE SEQUENCE |
US20130267429A1 (en) * | 2009-12-21 | 2013-10-10 | Lawrence Livermore National Security, Llc | Biological sample target classification, detection and selection methods, and related arrays and oligonucleotide probes |
WO2011143231A2 (en) | 2010-05-10 | 2011-11-17 | The Broad Institute | High throughput paired-end sequencing of large-insert clone libraries |
CA2885058A1 (en) * | 2012-10-08 | 2014-04-17 | Spiral Genetics Inc. | Methods and systems for identifying, from read symbol sequences, variations with respect to a reference symbol sequence |
US9181583B2 (en) | 2012-10-23 | 2015-11-10 | Illumina, Inc. | HLA typing using selective amplification and sequencing |
EP3915369A1 (en) | 2012-12-13 | 2021-12-01 | CytRx Corporation | Anthracycline formulations |
WO2014116729A2 (en) | 2013-01-22 | 2014-07-31 | The Board Of Trustees Of The Leland Stanford Junior University | Haplotying of hla loci with ultra-deep shotgun sequencing |
WO2014197569A1 (en) | 2013-06-05 | 2014-12-11 | Cytrx Corporation | Cytotoxic agents for the treatment of cancer |
JP2015035212A (ja) * | 2013-07-29 | 2015-02-19 | アジレント・テクノロジーズ・インクAgilent Technologies, Inc. | ターゲットシークエンシングパネルから変異を見つける方法 |
KR102386134B1 (ko) | 2013-10-15 | 2022-04-12 | 리제너론 파마슈티칼스 인코포레이티드 | 고분별능 대립유전자 동정 |
CN103699819B (zh) | 2013-12-10 | 2016-09-07 | 深圳先进技术研究院 | 基于多步双向De Bruijn图的变长kmer查询的顶点扩展方法 |
NZ721908A (en) | 2013-12-20 | 2022-12-23 | Massachusetts Gen Hospital | Combination therapy with neoantigen vaccine |
EP3280738A4 (en) | 2015-04-08 | 2019-01-02 | Nantomics, LLC | Cancer neoepitopes |
MX2018002293A (es) | 2015-08-25 | 2018-09-05 | Nantomics Llc | Sistemas y métodos para las llamadas variantes de alta precisión. |
JP2019511903A (ja) | 2016-02-19 | 2019-05-09 | ナント ホールディングス アイピー エルエルシーNant Holdings IP, LLC | 免疫原性調節の方法 |
KR20180118198A (ko) | 2016-03-18 | 2018-10-30 | 난트셀, 인크. | 수지상 세포 감염을 위한 멀티모달 벡터(multimodal vector for dendritic cell infection) |
KR20210010678A (ko) | 2016-06-30 | 2021-01-27 | 난트 홀딩스 아이피, 엘엘씨 | 난트 암 백신 |
CN111225673A (zh) | 2017-09-06 | 2020-06-02 | 河谷细胞有限公司 | 亚德阿霉素组合治疗及方法 |
-
2016
- 2016-08-25 MX MX2018002293A patent/MX2018002293A/es unknown
- 2016-08-25 EP EP16840152.9A patent/EP3341877B1/en active Active
- 2016-08-25 AU AU2016311444A patent/AU2016311444B2/en active Active
- 2016-08-25 WO PCT/US2016/048768 patent/WO2017035392A1/en active Application Filing
- 2016-08-25 US US15/755,095 patent/US11393557B2/en active Active
- 2016-08-25 BR BR112018003631A patent/BR112018003631A2/pt not_active IP Right Cessation
- 2016-08-25 CA CA2996702A patent/CA2996702C/en active Active
- 2016-08-25 RU RU2018106934A patent/RU2018106934A/ru not_active Application Discontinuation
- 2016-08-25 CN CN201680054282.0A patent/CN108351917B/zh active Active
- 2016-08-25 KR KR1020197020554A patent/KR102211461B1/ko active IP Right Grant
- 2016-08-25 JP JP2018510056A patent/JP6533011B2/ja active Active
- 2016-08-25 KR KR1020187008056A patent/KR102011440B1/ko active IP Right Grant
-
2018
- 2018-02-25 IL IL257724A patent/IL257724B/en active IP Right Grant
- 2018-11-19 IL IL263115A patent/IL263115B/en active IP Right Grant
- 2018-12-18 HK HK18116187.9A patent/HK1257052A1/zh unknown
-
2019
- 2019-03-18 AU AU2019201869A patent/AU2019201869A1/en not_active Abandoned
- 2019-05-22 JP JP2019095951A patent/JP6883180B2/ja active Active
-
2022
- 2022-06-16 US US17/842,519 patent/US20220319640A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2019201869A1 (en) | 2019-04-11 |
IL263115B (en) | 2020-06-30 |
KR102011440B1 (ko) | 2019-08-16 |
KR102211461B1 (ko) | 2021-02-03 |
KR20180058718A (ko) | 2018-06-01 |
JP2019169177A (ja) | 2019-10-03 |
US20220319640A1 (en) | 2022-10-06 |
JP6533011B2 (ja) | 2019-06-19 |
CN108351917B (zh) | 2022-03-08 |
CA2996702A1 (en) | 2017-03-02 |
EP3341877A4 (en) | 2018-10-03 |
BR112018003631A2 (pt) | 2018-09-25 |
IL263115A (en) | 2018-12-31 |
CN108351917A (zh) | 2018-07-31 |
HK1257052A1 (zh) | 2019-10-11 |
EP3341877A1 (en) | 2018-07-04 |
JP2018533111A (ja) | 2018-11-08 |
CA2996702C (en) | 2020-07-14 |
EP3341877B1 (en) | 2023-05-10 |
US20180237949A1 (en) | 2018-08-23 |
MX2018002293A (es) | 2018-09-05 |
AU2016311444B2 (en) | 2019-02-07 |
AU2016311444A1 (en) | 2018-03-15 |
RU2018106934A (ru) | 2019-09-26 |
US11393557B2 (en) | 2022-07-19 |
WO2017035392A1 (en) | 2017-03-02 |
RU2018106934A3 (ja) | 2019-09-26 |
IL257724B (en) | 2018-11-29 |
KR20190090022A (ko) | 2019-07-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6883180B2 (ja) | 高正確度変異体コールのためのシステムおよび方法 | |
Cameron et al. | GRIDSS: sensitive and specific genomic rearrangement detection using positional de Bruijn graph assembly | |
CA2964902C (en) | Ancestral human genomes | |
Shi et al. | Winner's curse correction and variable thresholding improve performance of polygenic risk modeling based on genome-wide association study summary-level data | |
Brøndum et al. | Strategies for imputation to whole genome sequence using a single or multi-breed reference population in cattle | |
Chen et al. | TIGRA: a targeted iterative graph routing assembler for breakpoint assembly | |
Nguyen et al. | Definition of high-risk type 1 diabetes HLA-DR and HLA-DQ types using only three single nucleotide polymorphisms | |
US9773091B2 (en) | Systems and methods for genomic annotation and distributed variant interpretation | |
WO2015148776A1 (en) | Systems and methods for genomic annotation and distributed variant interpretation | |
Ullah et al. | Comparison and assessment of family-and population-based genotype imputation methods in large pedigrees | |
Huang et al. | Sequencing strategies and characterization of 721 vervet monkey genomes for future genetic analyses of medically relevant traits | |
Pazhenkova et al. | Genomic introgression from a distant congener in the Levant fritillary butterfly, Melitaea acentria | |
Yorgov et al. | Use of admixture and association for detection of quantitative trait loci in the Type 2 Diabetes Genetic Exploration by Next-Generation Sequencing in Ethnic Samples (T2D-GENES) study | |
Fu et al. | A statistical method for detecting differentially expressed SNVs based on next-generation RNA-seq data | |
Somineni et al. | Talin Haritunians, 5 Claire L. Simpson, 6 Ferdouse Begum, 7 Lisa W. Datta, 7 Antonio J. Quiros, 8 Jenifer Seminerio, 9 Emebet Mengesha, 5 Jonathan S. Alexander, 10 Robert N. Baldassano, 11 Sharon Dudley-Brown, 12 Raymond K. Cross, 13 Themistocles Dassopoulos, 14 Lee A. Denson, 15 Tanvi A. Dhere, 16 Heba Iskandar, 16 Gerald W. Dryden, 17 Jason K. Hou, 18 | |
Yu | Imputation and Fine-Mapping in Genetic Association Studies | |
JP2008152592A (ja) | 個体間の遺伝的非類似度の解析方法およびシステム | |
JP2008125390A (ja) | 逆ホモ接合マッピング法による同祖領域の抽出方法および遺伝子スクリーニング方法 | |
Yu | Statistical Methods and Analyses for Next-generation Sequencing Data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190522 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200804 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20201102 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210209 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20210218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210310 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20210304 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6883180 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |