JP2022021661A - シングルセルゲノム配列とメタゲノム配列を統合する新規処理法 - Google Patents
シングルセルゲノム配列とメタゲノム配列を統合する新規処理法 Download PDFInfo
- Publication number
- JP2022021661A JP2022021661A JP2020125388A JP2020125388A JP2022021661A JP 2022021661 A JP2022021661 A JP 2022021661A JP 2020125388 A JP2020125388 A JP 2020125388A JP 2020125388 A JP2020125388 A JP 2020125388A JP 2022021661 A JP2022021661 A JP 2022021661A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- fragment
- fragment sequence
- cell genome
- metagenomic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 157
- 239000012634 fragment Substances 0.000 claims abstract description 728
- 238000004458 analytical method Methods 0.000 claims abstract description 202
- 230000010354 integration Effects 0.000 claims abstract description 28
- 238000013507 mapping Methods 0.000 claims description 45
- 238000005194 fractionation Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 10
- 238000000926 separation method Methods 0.000 abstract description 6
- 210000004027 cell Anatomy 0.000 description 169
- 108090000623 proteins and genes Proteins 0.000 description 47
- 108020004414 DNA Proteins 0.000 description 45
- 238000011109 contamination Methods 0.000 description 33
- 230000000813 microbial effect Effects 0.000 description 24
- 230000002068 genetic effect Effects 0.000 description 20
- 230000006870 function Effects 0.000 description 15
- 108020004566 Transfer RNA Proteins 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 14
- 238000012163 sequencing technique Methods 0.000 description 13
- 238000001712 DNA sequencing Methods 0.000 description 12
- 239000003550 marker Substances 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 238000007796 conventional method Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 9
- 108091008053 gene clusters Proteins 0.000 description 8
- 108091033319 polynucleotide Proteins 0.000 description 8
- 102000040430 polynucleotide Human genes 0.000 description 8
- 239000002157 polynucleotide Substances 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000007400 DNA extraction Methods 0.000 description 6
- 230000002550 fecal effect Effects 0.000 description 6
- 238000003908 quality control method Methods 0.000 description 6
- VBXBTOGGSZJEEI-UHFFFAOYSA-M sodium;[2-(pyridine-4-carbonyl)hydrazinyl]methanesulfonate;hydrate Chemical compound O.[Na+].[O-]S(=O)(=O)CNNC(=O)C1=CC=NC=C1 VBXBTOGGSZJEEI-UHFFFAOYSA-M 0.000 description 6
- 230000004544 DNA amplification Effects 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 230000009089 cytolysis Effects 0.000 description 5
- 239000002689 soil Substances 0.000 description 5
- 108020005097 23S Ribosomal RNA Proteins 0.000 description 4
- 238000012300 Sequence Analysis Methods 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 108020004465 16S ribosomal RNA Proteins 0.000 description 3
- 108020005075 5S Ribosomal RNA Proteins 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 235000019506 cigar Nutrition 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 239000000592 Artificial Cell Substances 0.000 description 2
- 206010059866 Drug resistance Diseases 0.000 description 2
- 241000589776 Pseudomonas putida Species 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000000090 biomarker Substances 0.000 description 2
- 230000001851 biosynthetic effect Effects 0.000 description 2
- 239000002775 capsule Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 238000005204 segregation Methods 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000003340 combinatorial analysis Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 241000894007 species Species 0.000 description 1
Images
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
(項目1)
複数の単位生物単位を含む生物単位集団の配列を解析する方法であって、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C)A)およびB)について、リードよりも長い元のゲノム配列の再構築、分別および/または統合および/またはキメラ除去をそれぞれ行うステップと、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得るステップと
を含む、方法。
(項目2)
前記メタゲノム断片配列またはそれに由来する配列は、メタゲノム断片配列、メタゲノム断片配列を再構築した配列、およびメタゲノム断片配列を再構築した配列を分別した配列を含み、
前記シングルセルゲノム断片配列またはそれに由来する配列は、シングルセルゲノム断片配列、シングルセルゲノム断片配列を再構築した配列、およびシングルセルゲノム断片配列を再構築した配列を統合した配列を含む、
項目1に記載の方法。
(項目3)
前記組み合わせ解析が、シングルセルゲノム断片配列またはそれに由来する配列を用いた、メタゲノム断片配列またはそれに由来する配列の分別を含む、項目1または2に記載の方法。
(項目4)
前記組み合わせ解析が、メタゲノム断片配列またはそれに由来する配列を用いた、シングルセルゲノム断片配列またはそれに由来する配列の統合を含む、項目1~3のいずれか一項に記載の方法。
(項目5)
前記組み合わせ解析が、シングルセルゲノム断片配列をメタゲノム断片配列を再構築した配列にマッピングすることにより、シングルセルゲノム断片配列をメタゲノム断片配列を再構築した配列に分断して、アライメントされたシングルセルゲノム断片配列をキメラ配列と特定すること、および必要に応じてキメラ配列を除去することを含む、項目1~4のいずれか一項に記載の方法。
(項目6)
前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、リードよりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記メタゲノム断片配列を再構築した配列を分別し、前記シングルセルゲノム断片配列を再構築した配列を統合して、メタゲノム断片配列を再構築した配列を分別した配列およびシングルセルゲノム断片配列を再構築した配列を統合した配列をそれぞれ生成するステップであって、前記メタゲノム断片配列を再構築した配列の分別の際に前記シングルセルゲノム断片配列を参照する、ステップと、
C-3)前記メタゲノム断片配列を再構築した配列を分別した配列から、メタゲノム断片配列を参照して、分別断片配列を生成するステップと、
D)前記分別断片配列と前記シングルセルゲノム断片配列を再構築した配列を分別した配列とを組み合わせて、改良された再構築ゲノム配列を得るステップと
を含む、項目1~5のいずれか一項に記載の方法。
(項目7)
前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、リードよりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記シングルセルゲノム断片配列を再構築した配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列を再構築した配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列を再構築した配列を分別した配列を生成するステップと、
D)前記メタゲノム断片配列を再構築した配列を分別した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、項目1~6のいずれか一項に記載の方法。
(項目8)
前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)B)について、リードよりも長い元のゲノム配列の再構築を行うステップと、
C-2)前記C-1)で得た配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列の分別断片配列を生成するステップと、
C-4)前記メタゲノム断片配列の分別断片配列について、リードよりも長い元のゲノム配列の再構築を行うステップと、
D)前記メタゲノム断片配列の分別断片配列を再構築した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、項目1~7のいずれか一項に記載の方法。
(項目9)
複数の単位生物単位を含む生物単位集団の配列を解析する方法をコンピュータに実装させるプログラムであって、該方法は
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築、分別、統合および/またはキメラ除去をそれぞれ行うステップと、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得るステップと
を含む、プログラム。
(項目10)
前記メタゲノム断片配列またはそれに由来する配列は、メタゲノム断片配列、メタゲノム断片配列を再構築した配列、およびメタゲノム断片配列を再構築した配列を分別した配列を含み、
前記シングルセルゲノム断片配列またはそれに由来する配列は、シングルセルゲノム断片配列、シングルセルゲノム断片配列を再構築した配列、およびシングルセルゲノム断片配列を再構築した配列を統合した配列を含む、
項目9に記載のプログラム。
(項目11)
前記組み合わせ解析が、シングルセルゲノム断片配列またはそれに由来する配列を用いた、メタゲノム断片配列またはそれに由来する配列の分別を含む、項目9または10に記載のプログラム。
(項目12)
前記組み合わせ解析が、メタゲノム断片配列またはそれに由来する配列を用いた、シングルセルゲノム断片配列またはそれに由来する配列の統合を含む、項目9~11のいずれか一項に記載のプログラム。
(項目13)
前記組み合わせ解析が、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列にマッピングすることにより、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列に分断して、アライメントされたシングルセルゲノム断片配列をキメラ配列と特定すること、および必要に応じてキメラ配列を除去することを含む、項目9~12のいずれか一項に記載のプログラム。
(項目14)
前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記メタゲノム断片配列を再構築した配列を分別し、前記シングルセルゲノム断片配列を再構築した配列を統合して、メタゲノム断片配列を再構築した配列を分別した配列およびシングルセルゲノム断片配列を再構築した配列を統合した配列をそれぞれ生成するステップであって、前記メタゲノム断片配列を再構築した配列の分別の際に前記シングルセルゲノム断片配列を参照する、ステップと、
C-3)前記メタゲノム断片配列を再構築した配列を分別した配列から、メタゲノム断片配列を参照して、分別断片配列を生成するステップと、
D)前記分別断片配列と前記シングルセルゲノム断片配列を再構築した配列を分別した配列とを組み合わせて、改良された再構築ゲノム配列を得るステップと
を含む、項目9~13のいずれか一項に記載のプログラム。
(項目15)
前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記シングルセルゲノム断片配列を再構築した配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列を再構築した配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列を再構築した配列を分別した配列を生成するステップと、
D)前記メタゲノム断片配列を再構築した配列を分別した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、項目9~14のいずれか一項に記載のプログラム。
(項目16)
前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)B)について、前記断片配列よりも長い元のゲノム配列の再構築を行うステップと、
C-2)前記C-1)で得た配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列の分別断片配列を生成するステップと、
C-4)前記メタゲノム断片配列の分別断片配列について、リードよりも長い元のゲノム配列の再構築を行うステップと、
D)前記メタゲノム断片配列の分別断片配列を再構築した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、項目9~15のいずれか一項に記載のプログラム。
(項目17)
複数の単位生物単位を含む生物単位集団の配列を解析する方法をコンピュータに実装させるプログラムを格納する記録媒体であって、該方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築、分別、統合および/またはキメラ除去をそれぞれ行うステップと、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得るステップと
を含む、記録媒体。
(項目18)
前記メタゲノム断片配列またはそれに由来する配列は、メタゲノム断片配列、メタゲノム断片配列を再構築した配列、およびメタゲノム断片配列を再構築した配列を分別した配列を含み、
前記シングルセルゲノム断片配列またはそれに由来する配列は、シングルセルゲノム断片配列、シングルセルゲノム断片配列を再構築した配列、およびシングルセルゲノム断片配列を再構築した配列を統合した配列を含む、
項目17に記載の記録媒体。
(項目19)
前記組み合わせ解析が、シングルセルゲノム断片配列またはそれに由来する配列を用いた、メタゲノム断片配列またはそれに由来する配列の分別を含む、項目17または18に記載の記録媒体。
(項目20)
前記組み合わせ解析が、メタゲノム断片配列またはそれに由来する配列を用いた、シングルセルゲノム断片配列またはそれに由来する配列の統合を含む、項目17~19のいずれか一項に記載の記録媒体。
(項目21)
前記組み合わせ解析が、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列にマッピングすることにより、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列に分断して、アライメントされたシングルセルゲノム断片配列をキメラ配列と特定すること、および必要に応じてキメラ配列を除去することを含む、項目17~20のいずれか一項に記載の記録媒体。
(項目22)
前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記メタゲノム断片配列を再構築した配列を分別し、前記シングルセルゲノム断片配列を再構築した配列を統合して、メタゲノム断片配列を再構築した配列を分別した配列およびシングルセルゲノム断片配列を再構築した配列を統合した配列をそれぞれ生成するステップであって、前記メタゲノム断片配列を再構築した配列の分別の際に前記シングルセルゲノム断片配列を参照する、ステップと、
C-3)前記メタゲノム断片配列を再構築した配列を分別した配列から、メタゲノム断片配列を参照して、分別断片配列を生成するステップと、
D)前記分別断片配列と前記シングルセルゲノム断片配列を再構築した配列を分別した配列とを組み合わせて、改良された再構築ゲノム配列を得るステップと
を含む、項目17~21のいずれか一項に記載の記録媒体。
(項目23)
前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記シングルセルゲノム断片配列を再構築した配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列を再構築した配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列を再構築した配列を分別した配列を生成するステップと、
D)前記メタゲノム断片配列を再構築した配列を分別した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、項目17~22のいずれか一項に記載の記録媒体。
(項目24)
前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)B)について、前記断片配列よりも長い元のゲノム配列の再構築を行うステップと、
C-2)前記C-1)で得た配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列の分別断片配列を生成するステップと、
C-4)前記メタゲノム断片配列の分別断片配列について、リードよりも長い元のゲノム配列の再構築を行うステップと、
D)前記メタゲノム断片配列の分別断片配列を再構築した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、項目17~23のいずれか一項に記載の記録媒体。
(項目25)
複数の単位生物単位を含む生物単位集団の配列を解析するシステムであって、該システムは、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るメタゲノム断片配列生成部と、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るシングルセルゲノム断片配列生成部と、
C)メタゲノム断片配列およびシングルセルゲノム断片配列について、前記断片配列よりも長い元のゲノム配列の再構築、分別、統合および/またはキメラ除去をそれぞれ行う配列処理部と、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得る改良ゲノム配列生成部と
を含む、システム。
(項目26)
前記メタゲノム断片配列またはそれに由来する配列は、メタゲノム断片配列、メタゲノム断片配列を再構築した配列、およびメタゲノム断片配列を再構築した配列を分別した配列を含み、
前記シングルセルゲノム断片配列またはそれに由来する配列は、シングルセルゲノム断片配列、シングルセルゲノム断片配列を再構築した配列、およびシングルセルゲノム断片配列を再構築した配列を統合した配列を含む、
項目25に記載のシステム。
(項目27)
前記組み合わせ解析が、シングルセルゲノム断片配列またはそれに由来する配列を用いた、メタゲノム断片配列またはそれに由来する配列の分別を含む、項目25または26に記載のシステム。
(項目28)
前記組み合わせ解析が、メタゲノム断片配列またはそれに由来する配列を用いた、シングルセルゲノム断片配列またはそれに由来する配列の統合を含む、項目25~27のいずれか一項に記載のシステム。
(項目29)
前記組み合わせ解析が、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列にマッピングすることにより、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列に分断して、アライメントされたシングルセルゲノム断片配列をキメラ配列と特定すること、および必要に応じてキメラ配列を除去することを含む、項目25~28のいずれか一項に記載のシステム。
(項目30)
前記システムは、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るメタゲノム断片配列生成部と、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るシングルセルゲノム断片配列生成部と、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行う再構築部と、
C-2)前記メタゲノム断片配列を再構築した配列を分別し、前記シングルセルゲノム断片配列を再構築した配列を統合して、メタゲノム断片配列を再構築した配列を分別した配列およびシングルセルゲノム断片配列を再構築した配列を統合した配列をそれぞれ生成するステップであって、前記メタゲノム断片配列を再構築した配列の分別の際に前記シングルセルゲノム断片配列を参照する、分別統合部と、
C-3)前記メタゲノム断片配列を再構築した配列を分別した配列から、メタゲノム断片配列を参照して、分別断片配列を生成する生成部と、
D)前記分別断片配列と前記シングルセルゲノム断片配列を再構築した配列を分別した配列とを組み合わせて、改良された再構築ゲノム配列を得る改良ゲノム配列生成部と
を含む、項目24~29のいずれか一項に記載のシステム。
(項目31)
前記システムは、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るメタゲノム断片配列生成部と、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るシングルセルゲノム断片配列生成部と、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行う再構築部と、
C-2)前記シングルセルゲノム断片配列を再構築した配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成する統合部と、
C-3)前記メタゲノム断片配列を再構築した配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列を再構築した配列を分別した配列を生成する生成部と、
D)前記メタゲノム断片配列を再構築した配列を分別した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得る改良ゲノム配列生成部と
を含む、項目25~30のいずれか一項に記載のシステム。
(項目32)
前記システムは、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るメタゲノム断片配列生成部と、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るシングルセルゲノム断片配列生成部と、
C-1)B)について、前記断片配列よりも長い元のゲノム配列の再構築を行う再構築部と、
C-2)前記C-1)で得た配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成する統合部と、
C-3)前記メタゲノム断片配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列の分別断片配列を生成するステップと、
C-4)前記メタゲノム断片配列の分別断片配列について、リードよりも長い元のゲノム配列の再構築を行う生成部と、
D)前記メタゲノム断片配列の分別断片配列を再構築した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得る改良ゲノム配列生成部と
を含む、項目25~31のいずれか一項に記載のシステム。
以下に本明細書において特に使用される用語の定義および/または基本的技術内容を適宜説明する。
本明細書において、「分別断片配列」とは、メタゲノム断片配列を、アセンブルすることなく、単位生物単位ごとに分別した配列の集合をいう。
(シングルセルゲノムDNAの調製)
微生物コミュニティからシングルセルゲノムDNAを抽出し調製する手法としては、ドロップレットによる手法(Hosokawa,2017)や、SAG-gel法(Chijiiwa,2020)などがあげられる。
微生物コミュニティからシングルセルゲノムDNAを抽出する手法としては、IHMS DNA extraction protocol Qなどがあげられる。抽出したDNAの調製手法としては、QIAseq FX DNA library kitなどがあげられる。
DNAシーケンスの手法は、illumina MiSeq、illumina HiSeqなどのDNAシーケンサーを用いる方法や、PacBio Sequel System、Oxford nanopre GridIONなどのDNAシーケンサーを用いる方法などがあげられる。
得られたシングルセルゲノムリードの解析は、計算機上で適切な解析ツールを用いて実施される。並列計算が行える高性能計算機上にて実行することが望ましい。リードの品質を評価する解析ツールとしては、bbduk.sh、fastx-toolkit、fastp、fastqc、prinseq-lite.plなどがあげられる。ヒトなどのコンタミリードを除くツールとしては、BWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールとreformat.shなどのフォーマッティングツールがあげられる。リードをアセンブルするツールとしては、SPAdesなどがあげられる。ゲノム配列から遺伝子を予測するツールとしては、Prodigal、Prokka、DFASTなどがあげられる。ゲノム配列の完全性、汚染度を評価するツールとしては、CheckMなどがあげられる。ゲノム配列のアセンブル精度を評価するツールとしては、QUASTなどがあげられる。シングルセルゲノムの同一菌株を同定・グループ化するツールとしては、ccSAG(Kogawa, 2018)などがあげられる。
得られたメタゲノムリードの解析は、計算機上で適切な解析ツールを用いて実施される。並列計算が行える高性能計算機上にて実行することが望ましい。リードの品質を評価する解析ツールとしては、bbduk.sh、fastx-toolkit、fastp、fastqc、prinseq-lite.plなどがあげられる。ヒトなどのコンタミリードを除くツールとしては、BWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールとreformat.shなどのフォーマッティングツールがあげられる。リードをアセンブルするツールとしては、MEGAHIT、SPAdesなどがあげられる。ゲノム配列から遺伝子を予測するツールとしては、Prodigal、Prokka、DFASTなどがあげられる。アセンブル配列に対してビニングを行うツールとしては、CONCOCT、MaxBin2、MetaBAT2などがあげられる。ビニング結果を再構築するツールとしては、DAS_Tool、metaWARAPなどがあげられる。
シングルセルゲノム生物系統によるメタゲノムアセンブル配列の分別ガイドは、計算機上で適切な解析ツールを用いて実施される。並列計算が行える高性能計算機上にて実行することが望ましい。シングルセルゲノムリード、アセンブル配列および統合アセンブル配列を用いてメタゲノムのリードおよびアセンブル配列の分別をガイドする1つの方法としては、それぞれの手法で得られた配列同士をマップして対応を取る方法などがある。配列同士をマッピングするツールとしては、BWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどがあげられる。マッピング結果はbed形式などに変換すると配列カバー率を計算しやすくなる。bed形式に変換するツールとしては、BEDtoolsなどがあげられる。
配列の品質改善は、計算機上で適切な解析ツールを用いて実施される。並列計算が行える高性能計算機上にて実行することが望ましい。
同一の微生物コミュニティに対して、メタゲノム解析およびシングルセルゲノム解析を実施し、断片配列(リード)をそれぞれ取得する。シングルセルゲノム解析では複数細胞由来のリードを取得する。
取得した各シングルセルリードに対し品質チェック処理を行う。品質処理を行ったリードを用いて配列アセンブルを行い、リードよりも長い元のゲノム配列の再構築を行う。シングルセルゲノムアセンブル配列を取得する。
各シングルセルゲノム配列をお互いに比較し、配列相同性やマーカー遺伝子の相同性などにより同一菌株由来のシングルセルを生物系統分類する。分類されたシングルセルゲノムを統合し、統合シングルセルゲノムアセンブル配列を取得する。
取得したメタゲノムリードに対し品質チェック処理を行う。品質処理を行ったリードを用いて配列アセンブルを行い、リードよりも長い元のゲノム配列の再構築を行う。メタゲノムアセンブル配列を取得する。
統合シングルセルゲノムアセンブル配列(またはそれに関連するシングルセルゲノムリード、シングルセルゲノムアセンブル配列)を用いて、メタゲノムアセンブル配列をシングルセルの生物系統に分別する。ここで、メタゲノムアセンブル配列のゲノムカバー率、メタゲノムアセンブル配列と統合シングルセルゲノムアセンブル配列の相同性やゲノム配列組成、マーカー遺伝子の相同性などが分別のための指標となりうる。
分別されたメタゲノムアセンブル配列にメタゲノムリードをマッピング、対応付けられたメタゲノムリードにより再アセンブルを行う。このとき、同一生物系統グループに属する統合シングルセルゲノムアセンブル配列(またはシングルセルゲノムアセンブル配列)をガイドとして利用する。または、分別メタゲノムアセンブル配列またはメタゲノム再アセンブル配列と、シングルセルゲノムアセンブル配列(またはシングルセルゲノムアセンブル配列)を結合したゲノム配列を構築する。
統合シングルセルゲノムアセンブル配列にシングルセルゲノムリードをマッピング、対応付けられたシングルセルゲノムリードにより再アセンブルを行う。このとき、同一生物系統グループに属するメタゲノムアセンブル配列をガイドとして利用する。または、統合シングルセルゲノムアセンブル配列と、メタゲノムアセンブル配列を結合したゲノム配列を構築する。
以下に好ましい実施形態の説明を記載するが、この実施形態は本開示の例示であり、本開示の範囲はそのような好ましい実施形態に限定されないことが理解されるべきである。当業者はまた、以下のような好ましい実施例を参考にして、本発明の範囲内にある改変、変更などを容易に行うことができることが理解されるべきである。これらの実施形態について、当業者は適宜、1または複数の任意の実施形態を組み合わせ得る。
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C)A)およびB)について、断片配列よりも長い元のゲノム配列の再構築、分別および/または統合および/またはキメラ除去をそれぞれ行うステップと、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得るステップと
を含む、方法を提供する。本開示の方法に用いる、シングルセルゲノム解析およびメタゲノム解析用サンプルは、同一のコミュニティに由来するものである。本開示の方法を用いることにより、従来技術より精度高く分類し、配列情報を得ることが可能である。また、本開示の方法は、Supervised Approachでありながら、既知のリファレンスゲノムのデータベースが無くとも精度高く分類し、配列情報を得ることが可能である。
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、リードよりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記メタゲノム断片配列を再構築した配列を分別し、前記シングルセルゲノム断片配列を再構築した配列を統合して、メタゲノム断片配列を再構築した配列を分別した配列およびシングルセルゲノム断片配列を再構築した配列を統合した配列をそれぞれ生成するステップであって、前記メタゲノム断片配列を再構築した配列の分別の際に前記シングルセルゲノム断片配列を参照する、ステップと、
C-3)前記メタゲノム断片配列を再構築した配列を分別した配列から、メタゲノム断片配列を参照して、分別断片配列を生成するステップと、
D)前記分別断片配列と前記シングルセルゲノム断片配列を再構築した配列を分別した配列とを組み合わせて、改良された再構築ゲノム配列を得るステップと
を含む。
複数の単位生物単位を含む生物単位集団のTotal DNAを抽出し、シーケンスライブラリーを構築する。微生物コミュニティからシングルセルゲノムDNAを抽出する手法としては、IHMS DNA extraction protocol Qなどがあげられる。抽出したDNAの調製手法としては、QIAseq FX DNA library kitなどがあげられる。シングルエンドシーケンスまたはペアエンドシーケンスによりメタゲノム断片配列を得る。このときロングリードシーケンスを実施しても良い。DNAシーケンスの手法は、illumina MiSeq、illumina HiSeqなどのDNAシーケンサーを用いる方法や、PacBio Sequel System、Oxford nanopre GridIONなどのDNAシーケンサーを用いる方法などがあげられる。
例えば、複数の単位生物単位を含む生物単位集団から、シングルセルを単離し、単離したシングルセルの溶菌、およびゲノムDNA増幅を行い、シーケンスライブラリーを構築する。微生物コミュニティからシングルセルゲノムDNAを抽出し調製する手法としては、ドロップレットによる手法や、SAG-gel法などがあげられる。シングルエンドシーケンスまたはペアエンドシーケンスによりシングルセルゲノム断片配列を得る。このときロングリードシーケンスを実施してもよい。DNAシーケンスの手法は、illumina MiSeq、illumina HiSeqなどのDNAシーケンサーを用いる方法や、PacBio Sequel System、Oxford nanopre GridIONなどのDNAシーケンサーを用いる方法などがあげられる。
メタゲノムリードから、bbduk.sh、fastx-toolkit、fastp、fastqc、prinseq-lite.plなどの品質管理ツールにより特定の品質のリードを抽出する。さらにこれらのリードからヒトなどのコンタミリードを除去する。ヒトなどのコンタミリードを除くツールとしては、BWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールとreformat.shなどのフォーマッティングツールがあげられる。取得した高品質リードをアセンブルすることによりアセンブル配列を取得する。リードをアセンブルするツールとしては、MEGAHIT、SPAdesなどがあげられる。シングルセルゲノムリードから、bbduk.sh、fastx-toolkit、fastp、fastqc、prinseq-lite.plなどの品質管理ツールにより特定の品質のリードを抽出する。さらにこれらのリードからヒトなどのコンタミリードを除去する。ヒトなどのコンタミリードを除くツールとしては、BWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールとreformat.shなどのフォーマッティングツールがあげられる。取得した高品質リードをアセンブルすることによりアセンブル配列を取得する。リードをアセンブルするツールとしては、SPAdesなどがあげられる。
前述のように取得したシングルセルゲノムアセンブル配列をccSAGなどにより統合する。具体的には、各シングルセルゲノムアセンブル配列のシングルコピーマーカー遺伝子相同性、ANIを用いてクラスタリングを行う。遺伝子相同性はBLAST、ANI計算はfastANIなどを用いることが可能である。グループ化されたシングルセルゲノムリードを結合しSPAdesなどのツールにより再アセンブルすることで、シングルセルゲノム統合配列を取得する。グループ化されたシングルセルゲノムリードを前記メタゲノムアセンブル配列にBWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールを用いてマッピングすることで、メタゲノムアセンブル配列を分別する。分別の1つの基準として、マップされたリードのメタゲノムアセンブル配列に占める領域が最も広範囲となったシングルセルに対応付けるなどがあげられる。
前記分別メタゲノム配列に対して、BWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールを用いてメタゲノムリードをマッピングする。これにより分別メタゲノムリードを取得する。
前記分別メタゲノムリードをSPAdesなどのアセンブルツールにより再アセンブルする。このとき、対応するシングルセルアセンブル配列またはシングルセルゲノム統合配列をアセンブルガイドとして参照する。SPAdesの場合、オプションとして--pacbioや--nanoporeなどを指定することでガイドとして参照することが可能である。
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、リードよりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記シングルセルゲノム断片配列を再構築した配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列を再構築した配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列を再構築した配列を分別した配列を生成するステップと、
D)前記メタゲノム断片配列を再構築した配列を分別した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む。
複数の単位生物単位を含む生物単位集団のTotal DNAを抽出し、シーケンスライブラリーを構築する。シングルエンドシーケンスまたはペアエンドシーケンスによりメタゲノム断片配列を得る。このときロングリードシーケンスを実施してもよい。例えば、微生物コミュニティからシングルセルゲノムDNAを抽出する手法としては、IHMS DNA extraction protocol Qなどがあげられる。抽出したDNAの調製手法としては、QIAseq FX DNA library kitなどがあげられる。DNAシーケンスの手法は、illumina MiSeq、illumina HiSeqなどのDNAシーケンサーを用いる方法や、PacBio Sequel System、Oxford nanopre GridIONなどのDNAシーケンサーを用いる方法などがあげられる。
例えば、複数の単位生物単位を含む生物単位集団から、シングルセルを単離し、単離したシングルセルの溶菌、およびゲノムDNA増幅を行い、シーケンスライブラリーを構築する。微生物コミュニティからシングルセルゲノムDNAを抽出し調製する手法としては、ドロップレットによる手法や、SAG-gel法などがあげられる。シングルエンドシーケンスまたはペアエンドシーケンスによりシングルセルゲノム断片配列を得る。このときロングリードシーケンスを実施してもよい。DNAシーケンスの手法は、illumina MiSeq、illumina HiSeqなどのDNAシーケンサーを用いる方法や、PacBio Sequel System、Oxford nanopre GridIONなどのDNAシーケンサーを用いる方法などがあげられる。
例えば、A)およびB)で得られた断片配列のうち低品質の断片配列を削除し、残った断片配列について断片配列間の共通の配列を用いて複数の断片配列を連結することにより、断片配列より長い配列を構築する。より具体的には、メタゲノムリードから、bbduk.sh、fastx-toolkit、fastp、fastqc、prinseq-lite.plなどの品質管理ツールにより特定の品質のリードを抽出する。さらにこれらのリードからヒトなどのコンタミリードを除去する。ヒトなどのコンタミリードを除くツールとしては、BWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールとreformat.shなどのフォーマッティングツールがあげられる。取得した高品質リードをアセンブルすることによりアセンブル配列を取得する。リードをアセンブルするツールとしては、MEGAHIT、SPAdesなどがあげられる。シングルセルゲノムリードから、bbduk.sh、fastx-toolkit、fastp、fastqc、prinseq-lite.plなどの品質管理ツールにより特定の品質のリードを抽出する。さらにこれらのリードからヒトなどのコンタミリードを除去する。ヒトなどのコンタミリードを除くツールとしては、BWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールとreformat.shなどのフォーマッティングツールがあげられる。取得した高品質リードをアセンブルすることによりアセンブル配列を取得する。リードをアセンブルするツールとしては、SPAdesなどがあげられる。
例えば、C-1)で得られたシングルセルゲノム断片配列を再構築した配列について、単位生物単位ごとにグループ化し、各グループに含まれる配列を再構築する。より具体的には、取得したシングルセルゲノムアセンブル配列をccSAGなどにより統合する。各シングルセルゲノムアセンブル配列のシングルコピーマーカー遺伝子相同性、ANIを用いてクラスタリングを行う。遺伝子相同性はBLAST、ANI計算はfastANIなどを用いることが可能である。グループ化されたシングルセルゲノムリードを結合しSPAdesなどのツールにより再アセンブルすることで、シングルセルゲノム統合配列を取得する。
例えば、C-1)で得られたシングルセルゲノム断片配列を再構築した配列および/またはC-2)で得られたシングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列にマッピングし、メタゲノム断片配列を再構築した配列を最もカバー率の高い系統分類グループに振り分けることで、メタゲノム断片配列を再構築した配列を分別した配列を得る。より具体的には得られたメタゲノムアセンブル配列とシングルセルゲノム統合配列をBLAST等のツールによりマッピングすることで、メタゲノムアセンブル配列を分別する。分別の1つの基準として、マップされたシングルセルゲノム統合配列のメタゲノムアセンブル配列に占める領域が最も広範囲となったシングルセルに対応付けるなどがあげられる。
例えば、メタゲノム断片配列を再構築した配列を分別した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを再構築(結合)することにより、改良された再構築ゲノム配列を得る。より具体的には、前記分別メタゲノムアセンブル配列と対応するシングルセルゲノム統合配列を、CSARやLINKS、HaploMerger2などのツールを用いて結合する。
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)B)について、リードよりも長い元のゲノム配列の再構築を行うステップと、
C-2)前記C-1)で得た配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列の分別断片配列を生成するステップと、
C-4)前記メタゲノム断片配列の分別断片配列について、リードよりも長い元のゲノム配列の再構築を行うステップと、
D)前記メタゲノム断片配列の分別断片配列を再構築した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む。
例えば、複数の単位生物単位を含む生物単位集団のTotal DNAを抽出し、シーケンスライブラリーを構築する。微生物コミュニティからシングルセルゲノムDNAを抽出する手法としては、IHMS DNA extraction protocol Qなどがあげられる。抽出したDNAの調製手法としては、QIAseq FX DNA library kitなどがあげられる。シングルエンドシーケンスまたはペアエンドシーケンスによりメタゲノム断片配列を得る。このときロングリードシーケンスを実施してもよい。DNAシーケンスの手法は、illumina MiSeq、illumina HiSeqなどのDNAシーケンサーを用いる方法や、PacBio Sequel System、Oxford nanopre GridIONなどのDNAシーケンサーを用いる方法などがあげられる。
例えば、複数の単位生物単位を含む生物単位集団から、シングルセルを単離し、単離したシングルセルの溶菌、およびゲノムDNA増幅を行い、シーケンスライブラリーを構築する。微生物コミュニティからシングルセルゲノムDNAを抽出し調製する手法としては、ドロップレットによる手法や、SAG-gel法などがあげられる。シングルエンドシーケンスまたはペアエンドシーケンスによりシングルセルゲノム断片配列を得る。このときロングリードシーケンスを実施してもよい。DNAシーケンスの手法は、illumina MiSeq、illumina HiSeqなどのDNAシーケンサーを用いる方法や、PacBio Sequel System、Oxford nanopre GridIONなどのDNAシーケンサーを用いる方法などがあげられる。
例えば、B)で得られた断片配列のうち低品質の断片配列を削除し、残った断片配列について断片配列間の共通の配列を用いて複数の断片配列を連結することにより、断片配列より長い配列を構築する。より具体的には、シングルセルゲノムリードから、bbduk.sh、fastx-toolkit、fastp、fastqc、prinseq-lite.plなどの品質管理ツールにより特定の品質のリードを抽出する。さらにこれらのリードからヒトなどのコンタミリードを除去する。ヒトなどのコンタミリードを除くツールとしては、BWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールとreformat.shなどのフォーマッティングツールがあげられる。取得した高品質リードをアセンブルすることによりアセンブル配列を取得する。リードをアセンブルするツールとしては、SPAdesなどがあげられる。
例えば、C-1)で得られたシングルセルゲノム断片配列を再構築した配列について、単位生物単位ごとにグループ化し、各グループに含まれる配列を再構築する。より具体的には、取得したシングルセルゲノムアセンブル配列をccSAGなどにより統合する。各シングルセルゲノムアセンブル配列のシングルコピーマーカー遺伝子相同性、ANIを用いてクラスタリングを行う。遺伝子相同性はBLAST、ANI計算はfastANIなどを用いることが可能である。グループ化されたシングルセルゲノムリードを結合しSPAdesなどのツールにより再アセンブルすることで、シングルセルゲノム統合配列を取得する。
例えば、C-1)で得られたシングルセルゲノム断片配列を再構築した配列および/またはC-2)で得られたシングルセルゲノム断片配列を、メタゲノム断片配列にマッピングし、メタゲノム断片配列を最もカバー率の高い系統分類グループに振り分けることで、メタゲノム断片配列の分別断片配列を得る。より具体的には、メタゲノムリードから、bbduk.sh、fastx-toolkit、fastp、fastqc、prinseq-lite.plなどの品質管理ツールにより特定の品質のリードを抽出する。さらにこれらのリードからヒトなどのコンタミリードを除去する。ヒトなどのコンタミリードを除くツールとしては、BWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールとreformat.shなどのフォーマッティングツールがあげられる。取得した高品質リードを前記シングルセルゲノム統合配列にBWA、Bowtie 2、HISAT2、Minimap2、bbmap.shなどのマッピングツールを用いてマッピングし分別する。
例えば、C-3)で得られたメタゲノム断片配列の分別断片配列のうち低品質の分別断片配列を削除し、残った分別断片配列について分別断片配列間の共通の配列を用いて複数の分別断片配列を連結することにより、分別断片配列より長い配列を構築する。より具体的には、前記分別されたメタゲノムリードを、MEGAHIT、SPAdesなどのアセンブルツールによりアセンブルを行う。
例えば、メタゲノム断片配列の分別断片配列を再構築した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを再構築(結合)することにより、改良された再構築ゲノム配列を得る。より具体的には、前記分別メタゲノムアセンブル配列と対応するシングルセルゲノム統合配列を、CSARやLINKS、HaploMerger2などのツールを用いて結合する。
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C)A)およびB)について、リードよりも長い元のゲノム配列の再構築、分別および/または統合および/またはキメラ除去をそれぞれ行うステップと、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得るステップと
を含む、プログラムを提供する。
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C)A)およびB)について、リードよりも長い元のゲノム配列の再構築、分別および/または統合および/またはキメラ除去をそれぞれ行うステップと、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得るステップと
を含む、記録媒体を提供する。
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るメタゲノム断片配列生成部と、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るシングルセルゲノム断片配列生成部と、
C)メタゲノム断片配列およびシングルセルゲノム断片配列について、リードよりも長い元のゲノム配列の再構築、分別および/または統合および/またはキメラ除去をそれぞれ行う配列処理部と、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得る配列再構築部と
を含む、システムを提供する。
必要に応じて、本開示の方法により得られたゲノム配列に対して遺伝子予測ツールを使用するステップと、
前記ゲノム配列および/または遺伝子データ対して遺伝子機能推定ツールを使用して、有用遺伝子および/または有用遺伝子クラスターを識別するステップと
を含む、方法を提供する。
(サンプルの取得)
NITEバイオテクノロジーセンター(NBRC)の提供する菌体カクテル(Cell-Mock-001)を取得した。菌体カクテルは15種のNBRC株を純粋培養し、それぞれの細胞数が等量となるよう混合したものである。
取得した標準菌体カクテル(Cell-Mock-001)に含まれる菌株のNBRC番号などを基に、NCBIから菌体カクテルに含まれる15種類の菌株のリファレンスゲノム配列を取得した。リファレンスゲノムの内容を下表に提示する。
標準菌体カクテルからの微生物シングルセル単離、単離したシングルセルの溶菌、およびゲノムDNA増幅は、SAG-gel法(Chijiiwa, 2020)により行った。Illumina MiSeqを用い、150サイクルペアエンドシーケンスによりDNAシーケンスを取得した(トータルリード数:52M、トータル塩基サイズ:3.9Gb)。
標準菌体カクテルから得られた48個のシングルセルゲノムリードから、bbduk.sh 38.79を用いることで低品質リードを削除した(オプション:threads=4、qtrim=r、trimq=10、minlength=40、maxns=1)。リードのde novoアセンブルはSPAdes 3.14.0を用いて行い(オプション:--sc --careful --disable-rr --disable-gzip-output -t 4 -m 32)、1000bp未満のコンティグは以降の解析から除外した。
得られたシングルセルゲノムアセンブル配列に関して、CheckMによる完全性が10%以上のもの、かつ汚染度が10%未満のもの47個を抽出した。47個の対象に関して、総当たりでfastANI 1.3によりANI(Average Nucleotide Identity)をデフォルトオプションで計算した。また、CheckM v1.1.2 taxonomy work flow(オプション:-nt --tab_table -t 16 domain Bacteria)により得られたシングルコピーマーカー遺伝子で共通なものの相同性をblastn 2.9.0+によりデフォルトオプションで計算した。ANIが95%以上、かつシングルコピーマーカー遺伝子の相同性が99.9%以上のシングルセルを同一菌株とみなし、グループ化した。
IHMS protocol Qに従い、標準菌体カクテルからTotal DNAを抽出した。シーケンスライブラリーは、QIAseq FX DNA library kitを用いて構築した。Illumina MiSeqを用い、150サイクルペアエンドシーケンスによりDNAシーケンスを取得した(トータルリード数:35M、トータル塩基サイズ:2.6Gb)。
標準菌体カクテルから得られた1つのメタゲノムリードは、bbduk.sh 38.79を用いることで低品質リードを削除した(オプション:threads=4、qtrim=r、trimq=10、minlength=40、maxns=1)。リードのde novoアセンブルはSPAdes 3.14.0を用いて行った(オプション:--meta --k auto -t 24 -m 240)。
統合されたシングルセルゲノムリードを、メタゲノムアセンブル配列に対してminimap2 2.17を用いてデフォルトオプションでマッピングした。マッピング結果に関して、bedtools v2.29.2のbamtobed機能によりbed形式に変換し、さらにmerge機能によりbed形式の統合を行った。各メタゲノムアセンブル配列を最もカバー率の高い系統分類グループに振り分けることで、分別メタゲノムアセンブル配列を構築した。
シングルセルゲノムアセンブル配列によって分別されたメタゲノムアセンブル配列に対し、minimap2 2.17によりメタゲノムリードをマッピングすることで対応するメタゲノムリード(分別断片配列)を取得した。分別されたメタゲノムリードをSPAdes 3.14.0によりde novoアセンブルを再度行い最終的なゲノム配列を取得した(オプション:--careful -k auto -t 4 -m 32 --nanopore FILE)。ここで、--nanoporeオプションに対し、対応する系統分類の統合シングルセルゲノムアセンブル配列を指定することで、統合シングルセルゲノムアセンブル配列を疑似ロングリードとしてSPAdesに提示し、分別されたメタゲノムリードと統合シングルセルゲノムアセンブル配列とのハイブリッドアセンブルを行った(図2)。
一般的に行われるメタゲノムアセンブル配列の分別手法として、CONCOCT 1.0.0(Concoct,2014)、MaxBin2 2.2.6(Maxbin2,2014)、MetaBAT2 2.12.1(Metabat2,2015)を用い、デフォルトオプションで実施した。これら3種類の異なる手法で得られた分別結果を再構築するため、DAS_Tool 1.1.2(DAS_Tool,2018)およびMetaWRAP 1.2.3(DAS_Tool,2018)を用い、デフォルトオプションで実施した。
本手法で分別したゲノム配列と一般的な5種のビニングで分別したゲノム配列に関して、fastANI 1.3を用いてリファレンスゲノムに対するANIを計算した。99.5%以上の相同性をもつリファレンスゲノムを各分別ゲノム配列に対応付けた。
各アセンブル配列の評価は、QUAST v.5.0.2(デフォルトオプション)およびChcekM v1.1.2 lineage work flow(オプション:-nt --tab_table -t 16)によって行った。5S, 16S, 23S ribosomal RNA遺伝子の同定はProkka 1.14.6によって行った(オプション:--rawproduct --cpus 8 --mincontiglen 200)。リファレンスゲノムの測定精度を評価するために、minimap2 2.17を用いて、リファレンスゲノムに対して対応する各アセンブル配列をデフォルトオプションでマッピングした。マッピング結果をbedtools v2.29.2によりbed形式に変換し、リファレンスゲノムに対するゲノムカバー率Lを計算した。リファレンスゲノムサイズをG、アセンブル配列サイズをAとしたとき、適合率(precision : P)および再現率(recall : R)、F値(F1 score)を以下の式で計算した。
図5は、それぞれの手法で得たゲノム配列の完全性と汚染度の統合指標を示している。すべてのゲノム配列において完全性のz-score(z.x)および汚染度のz-score(z.y)の平均値を指標とした。ここで、完全性のベクトルをx(%)としたとき、完全性のz-score(z.x)は、
z.x=(x-mx)/sx
である(mxは既存手法および本開示の方法により得られたデータから算出されたxの平均、sxは完全性の標準偏差)。
同様に、汚染度のベクトルをy(%)としたとき、汚染度のz-score(z.y)は、
z.y=(y-my)/sy
である(myは既存手法および本開示の方法により得られたデータから算出されたyの平均、syは汚染度の標準偏差)。
ただし、汚染度に関しては-1を乗算している。既存手法(conococt、maxbin2、metabat2、metawrap、dastool)では、完全性または汚染度のいずれかの水準が高くないため、ゲノム配列の完全性と汚染度の統合指標は、全体の平均値である0を下回るものが存在する。一方で本開示によるゲノム配列(hybrid-contig)はすべて0以上、すなわち高水準な値を示している。
図6は、rRNAとtRNAの取得度合を示している。ここで、それぞれのrRNAの種類(例えば、5S,16S)について、最も長く抽出できた長さをrとしたとき、それぞれのrRNAの取得度合いを示すz-score(z.r)は、
z.r=(r-mr)/sr
である(mrは既存手法および本開示の方法により得られたデータから算出されたrの平均、srはrRNAの取得度合いの標準偏差)。
同様に、tRNAについて、取得できた種類数をtとしたとき、tRNAのz-score(z.t)は、
z.t=(t-mt)/st
である(mtは既存手法および本開示の方法により得られたデータから算出されたtの平均、stは取得できた種類数の標準偏差)。
図7は、リファレンスゲノムの測定精度を示している。精度指標であるF1 scoreは、従来の方法および本開示の方法により取得したゲノム配列のリファレンスゲノム配列に対する適合率と再現率の調和平均を示す指標であり、本開示の方法により得たゲノム配列が最も高い値を示している。図8は、従来の方法および本開示の方法により取得したゲノム配列をリファレンスゲノムにマップしたときの100kbあたりのミスマッチ数を示している。正しくゲノム配列が再現できているほどミスマッチ数は少なくなる。この指標においても、本開示の方法により得たゲノム配列が最も低い値を示している。これらの結果は、本開示の方法が、従来の方法と比較してより高精度のゲノム配列を得ることができることを示している。
(サンプルの取得)
実施例2では、ヒト糞便検体を用いた。テクノスルガラボの採取キット・採取容器を用いて検体を採取し、以降の解析を行った。
糞便検体からの微生物シングルセル単離、単離したシングルセルの溶菌、およびゲノムDNA増幅は、SAG-gel法(Chijiiwa,2020)により行った。Illumina HiSeqを用い、300サイクルペアエンドシーケンスによりDNAシーケンスを取得した(トータルリード数:49M、トータル塩基サイズ:6.5Gb)。
糞便検体から得られた96個のシングルセルゲノムリードから、bbduk.sh 38.79を用いることで低品質リードを削除した(オプション:threads=4、qtrim=r、trimq=10、minlength=40、maxns=1)。リードのde novoアセンブルはSPAdes 3.14.0を用いて行い(オプション:--sc --careful --disable-rr --disable-gzip-output -t 4 -m 32)、1000bp未満のコンティグは以降の解析から除外した。
得られたシングルセルゲノムアセンブル配列に関して、CheckMによる完全性が20%以上のものかつ汚染度が10%未満のもの60個を抽出した。60個の対象に関して、総当たりでfastANI 1.3によりANI(Average Nucleotide Identity)をデフォルトオプションで計算した。また、CheckM v1.1.2 taxonomy work flow(オプション:-nt --tab_table -t 16 domain Bacteria)により得られたシングルコピーマーカー遺伝子で共通なものの相同性をblastn 2.9.0+によりデフォルトオプションで計算した。ANIが95%以上、かつシングルコピーマーカー遺伝子の相同性が99.9%以上のシングルセルを同一菌株とみなし、グループ化した。その結果18個の株違いのゲノム配列を取得した。
IHMS protocol Qに従い、糞便検体からからTotal DNAを抽出した。シーケンスライブラリーは、QIAseq FX DNA library kitを用いて構築した。Illumina HiSeqを用い、300サイクルペアエンドシーケンスによりDNAシーケンスを取得した(トータルリード数:40M、トータル塩基サイズ:6.0Gb)。
糞便検体から得られた1つのメタゲノムリードは、bbduk.sh 38.79を用いることで低品質リードを削除した(オプション:threads=4、qtrim=r、trimq=10、minlength=40、maxns=1)。リードのde novoアセンブルはMEGAHIT v1.1.13を用いて行った(オプション:-t 12)。
BWA 0.7.17を用いて、メタゲノムのアセンブル配列に対して18のシングルセルゲノムの統合配列をデフォルトオプションでマップした。メタゲノムアセンブル配列の各コンティグは、最もコンティグをカバーしている統合配列に対応付けた。8,178のメタゲノムコンティグ(トータル塩基サイズ34.9Mb)を統合配列に対対応付をもって分別できた。
CSAR v1.1.1を用いて、統合配列とメタゲノムアセンブル配列を結合した。ターゲットにシングルセルゲノム統合配列、リファレンスにメタゲノムアセンブル配列を指定した(図3)。オプションは-nucを用いた。
図9は、シングルセルゲノムの統合配列と、メタゲノムアセンブル配列を結合して高品質化したゲノム配列の精度比較である。csagは統合配列、hybridは結合した高品質ゲノム配列を表す。ゲノムサイズは両者ともほぼ同等であるのに対し、コンティグ数はhybridが減少しN50はhybridが上昇していた。つまり、分断されていたシングルセルゲノム統合配列のコンティグが、メタゲノムアセンブル配列により結合され、より品質の高いゲノム配列になっていることを示している。また、ゲノム配列の完全性と汚染度の統合指標およびrRNAとtRNAの取得指標についても評価した結果、両指標について、メタゲノムアセンブル配列より結合したゲノム配列(hybrid)で低下することはなく同等であった(図12)。
ここでは、メタゲノムリードをシングルセルゲノムのアセンブル配列または統合配列で分別する方法の1例を示す。同一サンプルにおいてシングルセルゲノムリードとメタゲノムリードを取得し、シングルセルゲノムリードからアセンブル配列および統合配列を取得する。ここで得られたアセンブル配列と統合配列にメタゲノムリードをマッピングし、分別する。分別されたメタゲノムリードをアセンブルし、分別アセンブル配列を取得する。対応するシングルセルゲノムアセンブル配列・統合配列と結合し、最終的な高品質ゲノム配列を取得する(図4)。
(使用データ)
ここでは、実施例1で取得した標準菌体カクテルのデータを使用して解析を実施した。サンプルの取得、シングルセルゲノムDNAの調製およびDNAシーケンス、メタゲノムDNAの調製およびDNAシーケンス、シングルセルゲノム解析、シングルセルゲノム系統分類および統合、メタゲノム配列解析は実施例1と同じである。本実施例では、Pseudomonas putida(アクセッション番号:GCF_000412675.1)として同定されたデータを用いて解析した。
標準菌体カクテルのPseudomonas putidaのリファレンスゲノム配列に対して、シングルセルゲノムリードをマップした結果を取得した。マッピングツールはminimap2を用い、解析オプションはデフォルトとした。正しいキメラ配列を同定した。
ccSAG法(Kogawa,2018)によりシングルセルゲノムリードのキメラ配列を同定した。シングルセルゲノム統合配列を作るにあたり、マーカー遺伝子やANIなどを基にシングルセルゲノムアセンブル配列の同一株を同定する。同一株と同定されたシングルセルゲノムアセンブル配列に対応する。シングルセルゲノムリードを、自身以外のシングルセルゲノムアセンブル配列へマップした結果を取得した。マッピングツールはminimap2を用い、解析オプションはデフォルトとした。
メタゲノムアセンブル配列に対してシングルセルゲノムリードをマップした結果を取得した。マッピングツールはminimap2を用い、解析オプションはデフォルトとした。
本実施例では、マッピング結果であるSAMフォーマットに記載されているCIGAR文字列を分析することでキメラ配列の同定を行った。CIGAR文字列中にソフトクリップ、ハードクリップ、N文字が含まれているリードをキメラ配列として同定した。なお、ソフトクリップは、一部リードがゲノムにマップされていない部分があり、リードにそのマップされていない部分が情報として残っている状態、ハードクリップは、一部リードがゲノムにマップされていない部分があり、リードからそのマップされていない部分が除去されている状態という処理がなされている。ソフトクリップリードは、マップされている部分とマップされていない部分を分割して2つのリードにして再利用し、ハードクリップはマップされなかった部分はすでにリードからなくなっているため、そのまま1つのリードとして再利用した。N文字は、特定のリードが別個の場所にマッピングされた際に、マッピングされた場所がどの程度離れているかを示しており、例えば、25M5000N25Mという形で出てきた場合、これは50bpのリードが25bp、25bpマップされているが、5000bp離れてマップされていることを意味する。また、CIGAR文字列が45M23Sなどの場合、リードの左側45塩基がマップされ右側23塩基はマップされないことになる。これは45塩基と23塩基の独立した塩基配列が組み合わさったキメラ配列と考えられる。
図11は、従来法と本開示の方法において、リファレンスゲノム配列を用いたキメラ配列同定と同等に同定出来たキメラ配列、リファレンスゲノム配列を用いたキメラ配列同定のみで検出したキメラ配列、リファレンスゲノム配列を用いたキメラ配列同定では検出されなかったキメラ配列に関してそれぞれプロットしたものである。本開示の方法で正しく同定できたキメラ配列は164,019であり、従来法の138,682と比較して18.3%多く検出することができた。また、正解率も従来法の76.7%から94.4%へ大きく向上する結果となった。
以下は、本発明を検体受託解析などで使用する場合の実施例となる。
ユーザから糞便、唾液、皮膚、土壌などの検体を適切な方法で受領する。例えば、糞便検体の場合テクノスルガラボの提供する採便キットなどの使用が考えられる。唾液検体の場合OMNIgene oral kitなどの使用が考えられる。皮膚検体の場合テクノスルガラボの提供するメタフロキーパーなどの使用が考えられる。土壌検体の場合、採取した土壌を冷蔵状態で受領するなどが考えられる。
受領した検体は、メタゲノム解析用とシングルセルゲノム解析用に分けられ、それぞれDNA抽出・調製・DNAシーケンシングを実施する。
データ解析はWindowやMacなどでも可能であるが、ここではLinux(登録商標) OSの動作するコンピュータ上で行うことを想定する。大規模にデータ解析を行う場合は、並列解析を行うことができる高性能計算機を使用することが望ましい。QCツール(bbduck.sh、fastqpなど)、アセンブルツール(MEGAHIT、SPAdesなど)、マッピングツール(BEWA、HISAT2、MiniMap2など)、アセンブリ評価ツール(CheckM、QUASTなど)、遺伝子予測ツール(Prokka、DFASTなど)、機能推定ツール(antiSMASH、ABRicate)、その他ユーティリティ(BLAST、SAMtools、BEDtoolsなど)をインストールしておく。
取得したメタゲノムリードをアセンブルしてメタゲノムアセンブル配列を取得する。シングルセルゲノムリードをメタゲノムアセンブル配列にマップしてキメラ配列を除去する。キメラ除去シングルセルゲノムリードをアセンブルしてシングルセルゲノムアセンブル配列を取得する。シングルセルゲノムアセンブル配列をccSAGなどで統合し、シングルセルゲノム統合配列を作成する。メタゲノムアセンブル配列とシングルセルゲノム統合配列をマッピングなどにより対応付け、メタゲノムアセンブル配列を分別する。メタゲノム分別配列とシングルセルゲノム統合配列を結合することで菌株レベルの高品質ゲノムを取得する。
高品質ゲノムに対し遺伝子予測ツールを実行し、遺伝子データを取得する。高品質ゲノム配列または遺伝子データに対し機能推定ツールを実行し、薬剤耐性をもつ遺伝子の同定や、生合成遺伝子クラスターの同定などを行う。
解析にて取得したデータ(高品質ゲノム配列やそれに付随する遺伝子データなど)は、クラウド上からダウンロードする形でユーザに提供する。もしくは、ポータブルHDDなどを使用して郵送でユーザへ提供する。
(Webサービスの概要)
本実施例では、ユーザが独自に測定したメタゲノムデータとシングルセルゲノムデータを統合解析して高品質ゲノム配列を返すwebアプリケーションに関して言及する。webサーバはapacheやnginxなどを用いることが考えられる。実際の計算は負荷がかかるため、webサーバと別に計算用サーバを用意しておく。計算状態を計算用サーバが管理し、webサーバが問い合わせることでユーザに計算状態を知らせるようにしておく。計算完了後、ユーザはアウトプットをweb経由で取得することが可能となる。
サービスが受け入れるデータは、メタゲノムリードとシングルセルゲノムリード、またはメタゲノムアセンブル配列とシングルセルゲノムアセンブル配列などが考えられる。
ユーザは、高品質ゲノム配列をダウンロードにより取得可能となる。オプションとして予測された遺伝子データや、遺伝子機能情報などの提供も考えられる。
以上のように、本開示の好ましい実施形態を用いて本開示を例示してきたが、本開示は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。本明細書において引用した特許、特許出願及び他の文献は、その内容自体が具体的に本明細書に記載されているのと同様にその内容が本明細書に対する参考として援用されるべきであることが理解される。
Claims (32)
- 複数の単位生物単位を含む生物単位集団の配列を解析する方法であって、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C)A)およびB)について、リードよりも長い元のゲノム配列の再構築、分別および/または統合および/またはキメラ除去をそれぞれ行うステップと、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得るステップと
を含む、方法。 - 前記メタゲノム断片配列またはそれに由来する配列は、メタゲノム断片配列、メタゲノム断片配列を再構築した配列、およびメタゲノム断片配列を再構築した配列を分別した配列を含み、
前記シングルセルゲノム断片配列またはそれに由来する配列は、シングルセルゲノム断片配列、シングルセルゲノム断片配列を再構築した配列、およびシングルセルゲノム断片配列を再構築した配列を統合した配列を含む、
請求項1に記載の方法。 - 前記組み合わせ解析が、シングルセルゲノム断片配列またはそれに由来する配列を用いた、メタゲノム断片配列またはそれに由来する配列の分別を含む、請求項1または2に記載の方法。
- 前記組み合わせ解析が、メタゲノム断片配列またはそれに由来する配列を用いた、シングルセルゲノム断片配列またはそれに由来する配列の統合を含む、請求項1~3のいずれか一項に記載の方法。
- 前記組み合わせ解析が、シングルセルゲノム断片配列をメタゲノム断片配列を再構築した配列にマッピングすることにより、シングルセルゲノム断片配列をメタゲノム断片配列を再構築した配列に分断して、アライメントされたシングルセルゲノム断片配列をキメラ配列と特定すること、および必要に応じてキメラ配列を除去することを含む、請求項1~4のいずれか一項に記載の方法。
- 前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、リードよりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記メタゲノム断片配列を再構築した配列を分別し、前記シングルセルゲノム断片配列を再構築した配列を統合して、メタゲノム断片配列を再構築した配列を分別した配列およびシングルセルゲノム断片配列を再構築した配列を統合した配列をそれぞれ生成するステップであって、前記メタゲノム断片配列を再構築した配列の分別の際に前記シングルセルゲノム断片配列を参照する、ステップと、
C-3)前記メタゲノム断片配列を再構築した配列を分別した配列から、メタゲノム断片配列を参照して、分別断片配列を生成するステップと、
D)前記分別断片配列と前記シングルセルゲノム断片配列を再構築した配列を分別した配列とを組み合わせて、改良された再構築ゲノム配列を得るステップと
を含む、請求項1~5のいずれか一項に記載の方法。 - 前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、リードよりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記シングルセルゲノム断片配列を再構築した配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列を再構築した配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列を再構築した配列を分別した配列を生成するステップと、
D)前記メタゲノム断片配列を再構築した配列を分別した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、請求項1~6のいずれか一項に記載の方法。 - 前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)B)について、リードよりも長い元のゲノム配列の再構築を行うステップと、
C-2)前記C-1)で得た配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列の分別断片配列を生成するステップと、
C-4)前記メタゲノム断片配列の分別断片配列について、リードよりも長い元のゲノム配列の再構築を行うステップと、
D)前記メタゲノム断片配列の分別断片配列を再構築した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、請求項1~7のいずれか一項に記載の方法。 - 複数の単位生物単位を含む生物単位集団の配列を解析する方法をコンピュータに実装させるプログラムであって、該方法は
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築、分別、統合および/またはキメラ除去をそれぞれ行うステップと、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得るステップと
を含む、プログラム。 - 前記メタゲノム断片配列またはそれに由来する配列は、メタゲノム断片配列、メタゲノム断片配列を再構築した配列、およびメタゲノム断片配列を再構築した配列を分別した配列を含み、
前記シングルセルゲノム断片配列またはそれに由来する配列は、シングルセルゲノム断片配列、シングルセルゲノム断片配列を再構築した配列、およびシングルセルゲノム断片配列を再構築した配列を統合した配列を含む、
請求項9に記載のプログラム。 - 前記組み合わせ解析が、シングルセルゲノム断片配列またはそれに由来する配列を用いた、メタゲノム断片配列またはそれに由来する配列の分別を含む、請求項9または10に記載のプログラム。
- 前記組み合わせ解析が、メタゲノム断片配列またはそれに由来する配列を用いた、シングルセルゲノム断片配列またはそれに由来する配列の統合を含む、請求項9~11のいずれか一項に記載のプログラム。
- 前記組み合わせ解析が、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列にマッピングすることにより、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列に分断して、アライメントされたシングルセルゲノム断片配列をキメラ配列と特定すること、および必要に応じてキメラ配列を除去することを含む、請求項9~12のいずれか一項に記載のプログラム。
- 前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記メタゲノム断片配列を再構築した配列を分別し、前記シングルセルゲノム断片配列を再構築した配列を統合して、メタゲノム断片配列を再構築した配列を分別した配列およびシングルセルゲノム断片配列を再構築した配列を統合した配列をそれぞれ生成するステップであって、前記メタゲノム断片配列を再構築した配列の分別の際に前記シングルセルゲノム断片配列を参照する、ステップと、
C-3)前記メタゲノム断片配列を再構築した配列を分別した配列から、メタゲノム断片配列を参照して、分別断片配列を生成するステップと、
D)前記分別断片配列と前記シングルセルゲノム断片配列を再構築した配列を分別した配列とを組み合わせて、改良された再構築ゲノム配列を得るステップと
を含む、請求項9~13のいずれか一項に記載のプログラム。 - 前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記シングルセルゲノム断片配列を再構築した配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列を再構築した配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列を再構築した配列を分別した配列を生成するステップと、
D)前記メタゲノム断片配列を再構築した配列を分別した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、請求項9~14のいずれか一項に記載のプログラム。 - 前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)B)について、前記断片配列よりも長い元のゲノム配列の再構築を行うステップと、
C-2)前記C-1)で得た配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列の分別断片配列を生成するステップと、
C-4)前記メタゲノム断片配列の分別断片配列について、リードよりも長い元のゲノム配列の再構築を行うステップと、
D)前記メタゲノム断片配列の分別断片配列を再構築した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、請求項9~15のいずれか一項に記載のプログラム。 - 複数の単位生物単位を含む生物単位集団の配列を解析する方法をコンピュータに実装させるプログラムを格納する記録媒体であって、該方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築、分別、統合および/またはキメラ除去をそれぞれ行うステップと、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得るステップと
を含む、記録媒体。 - 前記メタゲノム断片配列またはそれに由来する配列は、メタゲノム断片配列、メタゲノム断片配列を再構築した配列、およびメタゲノム断片配列を再構築した配列を分別した配列を含み、
前記シングルセルゲノム断片配列またはそれに由来する配列は、シングルセルゲノム断片配列、シングルセルゲノム断片配列を再構築した配列、およびシングルセルゲノム断片配列を再構築した配列を統合した配列を含む、
請求項17に記載の記録媒体。 - 前記組み合わせ解析が、シングルセルゲノム断片配列またはそれに由来する配列を用いた、メタゲノム断片配列またはそれに由来する配列の分別を含む、請求項17または18に記載の記録媒体。
- 前記組み合わせ解析が、メタゲノム断片配列またはそれに由来する配列を用いた、シングルセルゲノム断片配列またはそれに由来する配列の統合を含む、請求項17~19のいずれか一項に記載の記録媒体。
- 前記組み合わせ解析が、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列にマッピングすることにより、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列に分断して、アライメントされたシングルセルゲノム断片配列をキメラ配列と特定すること、および必要に応じてキメラ配列を除去することを含む、請求項17~20のいずれか一項に記載の記録媒体。
- 前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記メタゲノム断片配列を再構築した配列を分別し、前記シングルセルゲノム断片配列を再構築した配列を統合して、メタゲノム断片配列を再構築した配列を分別した配列およびシングルセルゲノム断片配列を再構築した配列を統合した配列をそれぞれ生成するステップであって、前記メタゲノム断片配列を再構築した配列の分別の際に前記シングルセルゲノム断片配列を参照する、ステップと、
C-3)前記メタゲノム断片配列を再構築した配列を分別した配列から、メタゲノム断片配列を参照して、分別断片配列を生成するステップと、
D)前記分別断片配列と前記シングルセルゲノム断片配列を再構築した配列を分別した配列とを組み合わせて、改良された再構築ゲノム配列を得るステップと
を含む、請求項17~21のいずれか一項に記載の記録媒体。 - 前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行うステップと、
C-2)前記シングルセルゲノム断片配列を再構築した配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列を再構築した配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列を再構築した配列を分別した配列を生成するステップと、
D)前記メタゲノム断片配列を再構築した配列を分別した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、請求項17~22のいずれか一項に記載の記録媒体。 - 前記方法は、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るステップと、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るステップと、
C-1)B)について、前記断片配列よりも長い元のゲノム配列の再構築を行うステップと、
C-2)前記C-1)で得た配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成するステップと、
C-3)前記メタゲノム断片配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列の分別断片配列を生成するステップと、
C-4)前記メタゲノム断片配列の分別断片配列について、リードよりも長い元のゲノム配列の再構築を行うステップと、
D)前記メタゲノム断片配列の分別断片配列を再構築した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得るステップと
を含む、請求項17~23のいずれか一項に記載の記録媒体。 - 複数の単位生物単位を含む生物単位集団の配列を解析するシステムであって、該システムは、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るメタゲノム断片配列生成部と、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るシングルセルゲノム断片配列生成部と、
C)メタゲノム断片配列およびシングルセルゲノム断片配列について、前記断片配列よりも長い元のゲノム配列の再構築、分別、統合および/またはキメラ除去をそれぞれ行う配列処理部と、
D)メタゲノム断片配列またはそれに由来する配列と、シングルセルゲノム断片配列またはそれに由来する配列とを少なくとも含む配列を用いた組み合わせ解析を行い、改良された再構築ゲノム配列を得る改良ゲノム配列生成部と
を含む、システム。 - 前記メタゲノム断片配列またはそれに由来する配列は、メタゲノム断片配列、メタゲノム断片配列を再構築した配列、およびメタゲノム断片配列を再構築した配列を分別した配列を含み、
前記シングルセルゲノム断片配列またはそれに由来する配列は、シングルセルゲノム断片配列、シングルセルゲノム断片配列を再構築した配列、およびシングルセルゲノム断片配列を再構築した配列を統合した配列を含む、
請求項25に記載のシステム。 - 前記組み合わせ解析が、シングルセルゲノム断片配列またはそれに由来する配列を用いた、メタゲノム断片配列またはそれに由来する配列の分別を含む、請求項25または26に記載のシステム。
- 前記組み合わせ解析が、メタゲノム断片配列またはそれに由来する配列を用いた、シングルセルゲノム断片配列またはそれに由来する配列の統合を含む、請求項25~27のいずれか一項に記載のシステム。
- 前記組み合わせ解析が、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列にマッピングすることにより、シングルセルゲノム断片配列を、メタゲノム断片配列を再構築した配列に分断して、アライメントされたシングルセルゲノム断片配列をキメラ配列と特定すること、および必要に応じてキメラ配列を除去することを含む、請求項25~28のいずれか一項に記載のシステム。
- 前記システムは、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るメタゲノム断片配列生成部と、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るシングルセルゲノム断片配列生成部と、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行う再構築部と、
C-2)前記メタゲノム断片配列を再構築した配列を分別し、前記シングルセルゲノム断片配列を再構築した配列を統合して、メタゲノム断片配列を再構築した配列を分別した配列およびシングルセルゲノム断片配列を再構築した配列を統合した配列をそれぞれ生成するステップであって、前記メタゲノム断片配列を再構築した配列の分別の際に前記シングルセルゲノム断片配列を参照する、分別統合部と、
C-3)前記メタゲノム断片配列を再構築した配列を分別した配列から、メタゲノム断片配列を参照して、分別断片配列を生成する生成部と、
D)前記分別断片配列と前記シングルセルゲノム断片配列を再構築した配列を分別した配列とを組み合わせて、改良された再構築ゲノム配列を得る改良ゲノム配列生成部と
を含む、請求項24~29のいずれか一項に記載のシステム。 - 前記システムは、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るメタゲノム断片配列生成部と、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るシングルセルゲノム断片配列生成部と、
C-1)A)およびB)について、前記断片配列よりも長い元のゲノム配列の再構築をそれぞれ行う再構築部と、
C-2)前記シングルセルゲノム断片配列を再構築した配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成する統合部と、
C-3)前記メタゲノム断片配列を再構築した配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列を再構築した配列を分別した配列を生成する生成部と、
D)前記メタゲノム断片配列を再構築した配列を分別した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得る改良ゲノム配列生成部と
を含む、請求項25~30のいずれか一項に記載のシステム。 - 前記システムは、
A)前記生物単位集団に対して、メタゲノム解析を行い、メタゲノム断片配列を得るメタゲノム断片配列生成部と、
B)前記生物単位集団に対して、シングルセルゲノム解析を行い、前記複数の単位生物単位由来のシングルセルゲノム断片配列を得るシングルセルゲノム断片配列生成部と、
C-1)B)について、前記断片配列よりも長い元のゲノム配列の再構築を行う再構築部と、
C-2)前記C-1)で得た配列を統合して、シングルセルゲノム断片配列を再構築した配列を統合した配列を生成する統合部と、
C-3)前記メタゲノム断片配列から、前記シングルセルゲノム断片配列を再構築した配列および/または前記シングルセルゲノム断片配列を再構築した配列を統合した配列を参照して、メタゲノム断片配列の分別断片配列を生成するステップと、
C-4)前記メタゲノム断片配列の分別断片配列について、リードよりも長い元のゲノム配列の再構築を行う生成部と、
D)前記メタゲノム断片配列の分別断片配列を再構築した配列と前記シングルセルゲノム断片配列を再構築した配列を統合した配列とを結合して、改良された再構築ゲノム配列を得る改良ゲノム配列生成部と
を含む、請求項25~31のいずれか一項に記載のシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020125388A JP2022021661A (ja) | 2020-07-22 | 2020-07-22 | シングルセルゲノム配列とメタゲノム配列を統合する新規処理法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020125388A JP2022021661A (ja) | 2020-07-22 | 2020-07-22 | シングルセルゲノム配列とメタゲノム配列を統合する新規処理法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022021661A true JP2022021661A (ja) | 2022-02-03 |
Family
ID=80220594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020125388A Pending JP2022021661A (ja) | 2020-07-22 | 2020-07-22 | シングルセルゲノム配列とメタゲノム配列を統合する新規処理法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022021661A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116825204A (zh) * | 2023-08-30 | 2023-09-29 | 鲁东大学 | 一种基于深度学习的单细胞rna序列基因调控推断方法 |
-
2020
- 2020-07-22 JP JP2020125388A patent/JP2022021661A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116825204A (zh) * | 2023-08-30 | 2023-09-29 | 鲁东大学 | 一种基于深度学习的单细胞rna序列基因调控推断方法 |
CN116825204B (zh) * | 2023-08-30 | 2023-11-07 | 鲁东大学 | 一种基于深度学习的单细胞rna序列基因调控推断方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
De Coster et al. | Towards population-scale long-read sequencing | |
Betancur-R et al. | Phylogenomic incongruence, hypothesis testing, and taxonomic sampling: The monophyly of characiform fishes | |
Press et al. | Hi-C deconvolution of a human gut microbiome yields high-quality draft genomes and reveals plasmid-genome interactions | |
US12087401B2 (en) | Using cell-free DNA fragment size to detect tumor-associated variant | |
Plesivkova et al. | A review of the potential of the MinION™ single‐molecule sequencing system for forensic applications | |
Kerkhof | Is Oxford Nanopore sequencing ready for analyzing complex microbiomes? | |
US20150211054A1 (en) | Haplotype resolved genome sequencing | |
Zhou et al. | Recovering metagenome-assembled genomes from shotgun metagenomic sequencing data: methods, applications, challenges, and opportunities | |
Le Doujet et al. | Closely-related Photobacterium strains comprise the majority of bacteria in the gut of migrating Atlantic cod (Gadus morhua) | |
Castañeda-Rico et al. | Ancient DNA from museum specimens and next generation sequencing help resolve the controversial evolutionary history of the critically endangered Puebla deer mouse | |
JP6644672B2 (ja) | アセンブルされていない配列情報、確率論的方法、及び形質固有(trait−specific)のデータベースカタログを用いた生物材料の特性解析 | |
US20220165363A1 (en) | De novo compartment deconvolution and weight estimation of tumor tissue samples using decoder | |
De Sousa et al. | Microbial omics: applications in biotechnology | |
Kim et al. | Unraveling metagenomics through long-read sequencing: A comprehensive review | |
Meng et al. | A de novo approach to disentangle partner identity and function in holobiont systems | |
Appelt et al. | Genetic diversity and spatial segregation of Francisella tularensis subspecies holarctica in Germany | |
Tekle et al. | A practical implementation of large transcriptomic data analysis to resolve cryptic species diversity problems in microbial eukaryotes | |
Xia et al. | Bioinformatic analysis of microbiome data | |
Prudnikow et al. | A primer on pollen assignment by nanopore-based DNA sequencing | |
Pardo-De la Hoz et al. | Ancient rapid radiation explains most conflicts among gene trees and well-supported phylogenomic trees of Nostocalean cyanobacteria | |
US20220270710A1 (en) | Novel method for processing sequence information about single biological unit | |
JP2022021661A (ja) | シングルセルゲノム配列とメタゲノム配列を統合する新規処理法 | |
JP6744642B1 (ja) | 単一生物単位の配列情報の新規処理法 | |
Zhang et al. | Reading the underlying information from massive metagenomic sequencing data | |
Valencia et al. | Mock community taxonomic classification performance of publicly available shotgun metagenomics pipelines |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230522 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20230726 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20230815 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240417 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241001 |