JP7373843B2 - 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法 - Google Patents

感染の原因生物を予測するための予測装置、予測プログラム及び予測方法 Download PDF

Info

Publication number
JP7373843B2
JP7373843B2 JP2019229363A JP2019229363A JP7373843B2 JP 7373843 B2 JP7373843 B2 JP 7373843B2 JP 2019229363 A JP2019229363 A JP 2019229363A JP 2019229363 A JP2019229363 A JP 2019229363A JP 7373843 B2 JP7373843 B2 JP 7373843B2
Authority
JP
Japan
Prior art keywords
organism
sequence information
infection
indicating
biological species
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019229363A
Other languages
English (en)
Other versions
JP2021093999A (ja
Inventor
千尋 堀場
嘉規 伊藤
朋男 荻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokai National Higher Education and Research System NUC
Original Assignee
Tokai National Higher Education and Research System NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokai National Higher Education and Research System NUC filed Critical Tokai National Higher Education and Research System NUC
Priority to JP2019229363A priority Critical patent/JP7373843B2/ja
Publication of JP2021093999A publication Critical patent/JP2021093999A/ja
Application granted granted Critical
Publication of JP7373843B2 publication Critical patent/JP7373843B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Description

本明細書には、感染の原因生物を予測するための予測装置、予測プログラム及び予測方法が開示される。
近年、検査サンプルから病原体を検出する方法として、ヒト細胞を除去した検査サンプルに含まれるDNA又はRNAのメタゲノム解析が行われている(非特許文献1から5)。
Blauwkamp TA, et al.; Nat Microbiol. 2019 Apr;4(4):663-674. doi: 10.1038/s41564-018-0349-6. Epub 2019 Feb 11. Wilson MR, et al.; N Engl J Med. 2019 Jun 13;380(24):2327-2340. Gu W, Miller S, and Chiu CY; Annu Rev Pathol. 2019 Jan 24;14:319-338. doi: 10.1146/annurev-pathmechdis-012418-012751. Epub 2018 Oct 24. Takeuchi S, et al.;Sci Rep. 2019 Sep 9;9(1):12909. doi: 10.1038/s41598-019-49372-x. Horiba K, et al.;Sci Rep. 2018 Feb 28;8(1):3784. doi: 10.1038/s41598-018-22133-y.
非特許文献1から5に記載の方法は、検査サンプル中に存在する病原体に由来すると推定される配列情報と、そのリード数に基づいて感染の原因であるか否かを推定している。しかし、病原体であると推定するための検査サンプル中のリード数の基準値は共通した値はなく、基準値そのものの客観性が乏しいという問題がある。このため、リード数の基準値のみに依存して判定された結果も客観性は乏しくなる。
本発明は、感染の原因生物を予測するための、より客観性のある判別式を提供することを一課題とする。
本発明の実施形態は、検査対象の生物であるホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測装置(10)に関する。予測装置(10)は、処理部(101)を備える。処理部(101)は、前記ホストに由来する検査サンプル中に存在する複数のポリヌクレオチドのそれぞれについて配列情報を取得し、前記取得した配列情報のうち、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報に、前記異種生物由来配列情報から推定される生物種を示すラベルを付与し、前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応する配列情報のリード数とホスト以外に検出された異種生物の種の多様性指数とを算出し、ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成し、前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルとして決定し、感染の原因生物の予測結果を出力する。
好ましくは、前記生物種を示すラベルは、生物種の科名、属名、及び種名のそれぞれを個別に示すラベルである。
好ましくは、処理部(101)は、系統推定、及び/又は参照配列へのマッピングによって、前記異種生物由来配列情報から生物種を示すラベルを推定する。
好ましくは、処理部(101)は、系統推定、及び/又は参照配列へのマッピングによって、生物種を示すラベルを推定できなかった前記異種生物由来配列情報について、既知ヌクレオチド配列との相同性検索を行い生物種を示すラベルを推定し、系統推定、及び/又は参照配列へのマッピングによって、前記異種生物由来配列情報から推定した生物種を示すラベルと併せて、ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成する。
好ましくは、処理部(101)は、系統推定によって、前記異種生物由来配列情報から生物種を示すラベルを推定し、予測結果を第1の予測結果として出力する。
好ましくは、処理部(101)は、系統推定によって、生物種を示すラベルを推定できなかった前記異種生物由来配列情報について、既知ヌクレオチド配列との相同性検索を行い生物種を示すラベルを推定し、前記系統推定によって、前記異種生物由来配列情報から推定した生物種を示すラベルと併せて、ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成し、予測結果を第2の予測結果として出力する。
好ましくは、前記予測結果が、前記感染の原因生物を示すラベルに対応するリード数及び相対優占度の組み合わせで示される。
好ましくは、処理部(101)は、生物種の科名、属名、又は種名を示すラベルと、各ラベルに対応するリード数とがKronaチャートにより示される解析レポートを生成する。
好ましくは、処理部(101)は、前記生物種を示すラベルに対応するリード数を示す第1の軸と、前記ホスト以外の生物種の多様性指数を示す第2の軸を有するプロット領域であって、前記ロジスティック回帰分析式を二次元回帰式に変換し求められる回帰直線を備えるプロット領域を生成し、前記プロット領域に、前記感染の原因生物である可能性を示すデータを生成したときのリード数と多様性指数の座標を示した二次元プロット図を生成し、前記二次元プロット図で示される解析レポートを生成する。
好ましくは、処理部(101)は、前記感染の原因生物を示すラベルに対応する前記異種生物由来配列情報を含む参照配列を配列データベースから検索し、前記検査サンプルから取得された、前記感染の原因生物を示すラベルに対応する配列情報の全てを前記参照配列にマッピングし、前記検査サンプルから取得された、前記感染の原因生物を示すラベルに対応する参照配列のうちどれだけの配列長が前記感染の原因生物を示すラベルを付された配列情報から解読されたかを示すcoverage percentageを算出し、さらに、前記解読された配列長が何回繰り返して解読されたかを示す値の平均値を示すaverage depth of mapped regionsを算出し、前記感染の原因生物を示すラベルと共に、前記参照配列の識別子と、前記coverage percentageと、前記average depth of mapped regionsを出力する。
処理部(101)は、さらに、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報の群から、抗生物薬に対する耐性遺伝子に由来するリードを検出し、検出されたリードに対応する耐性遺伝子を示すラベルを出力する。
本実施形態は、検査対象の生物であるホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測方法に関する。前記予測方法は、前記ホストに由来する検査サンプル中に存在する複数のポリヌクレオチドのそれぞれについて配列情報を取得することと、前記取得した配列情報のうち、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報に、前記異種生物由来配列情報から推定される生物種を示すラベルを付与することと、前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応するリード数とホスト以外に検出された異種生物の種の多様性指数とを算出することと、ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成し、前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルとして決定すること、を含む。
本実施形態は、コンピュータに実行させたときに、コンピュータに、検査対象の生物であるホストに由来する検査サンプル中に存在する複数のポリヌクレオチドのそれぞれについて配列情報を取得するステップと、前記取得した配列情報のうち、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報に、前記異種生物由来配列情報から推定される生物種を示すラベルを付与するステップと、
前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応するリード数とホスト以外に検出された異種生物の種の多様性指数とを算出するステップと、ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成するステップと、前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルと決定するステップと、予測結果を出力するステップと、をコンピュータに実行させる、前記ホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測プログラムに関する。
メタゲノム解析による感染の原因生物を予測可能なより客観性のある判別式を提供する。
予測結果の一例を示す。 Kronaチャートの例を示す。 二次元プロットの例を示す。星印はpRPMと多様性指数により表される座標を示す。 予測装置のハードウエア構成を示す。 予測装置の機能構成を示す。 第1の実施形態における予測プログラム1042の処理の一例を示す。 第1の実施形態における予測プログラム1042のステップS2の処理の一例を示す。 第1の実施形態における予測プログラム1042のステップS3の処理の一例を示す。 第1の実施形態における予測プログラム1042のステップS6の処理の一例を示す。 第2の実施形態における予測プログラム1043の処理の一例を示す。 第2の実施形態における予測プログラム1043のステップS113の処理の一例を示す。
1.第1の実施形態
1-1.概要
第1の実施形態は、ホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測方法に関する。
予測方法は、はじめに、工程1:ホストに由来する検査サンプル中に存在する複数のポリヌクレオチドのそれぞれについて配列情報を取得する。次に、工程2:前記取得した配列情報のうち、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報に、前記異種生物由来配列情報から推定される生物種を示すラベルを付与する。次に、工程3:前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応するリード数とホスト以外に検出された異種生物の種の多様性指数とを算出する。次に、工程4:ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成する。次に、工程5:前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルとして決定する。最後に、工程6:感染の原因生物を示すラベルとして決定された生物種を示すラベルは、予測結果として出力される。
本実施形態は、後述する予測装置が行ってもよいが、全部又は一部の工程をオペレータが行ってもよい。
(1)用語の説明
本明細書において、ホストは、検査対象となる生物である。生物には、動物、及び植物を含み得る。また生物には個体、組織、細胞等を含み得る。動物には、哺乳類、は虫類、両生類、魚類、鳥類等を含み得る。哺乳類には、ヒト、マウス、ラット、ウサギ、イヌ、ネコ、フェレット、ハムスター、モルモット、リス、ブタ、ウシ、ウマ、ヒツジ、カワウソ、プレリードック、ミーアキャット等を含み得る。ホストとして好ましくは哺乳類である。
感染の原因生物は、ホスト以外の生物である限り制限されない。ウイルス、原核生物、真核生物を含み得る。ウイルスには、RNAウイルス、DNAウイルスを含み得る。原核生物には、細菌等を含み得る。真核生物には、真菌、寄生虫、昆虫を含み得る。
感染は、ホストに感染する態様と、ホストが生存している環境を生物学的に汚染する態様とを含み得る。好ましくは、ホストに感染する態様である。
検査サンプルは、ホストから採取された組織、体液等を含み得る。体液には、全血、血漿、血清等の血液試料、髄液、唾液、腹水、胸水、骨髄、尿、関節液、のう胞液、リンパ液、漏出液、浸出液等を含み得る。さらに、検査サンプルには、気管支洗浄液等の器官洗浄液等も含み得る。また、ホストが培養細胞、培養組織又は培養個体である場合、検査サンプルは、培養上清、培養ゲル、培養培地等も含み得る。検査サンプルは、細胞を含まないことが好ましい。
検査サンプルの量は、多いほど好ましいが、少なくとも100μLから1000μLで検査は可能である。
検査サンプル中には、複数のポリヌクレオチドを含み得る。前記「複数」は、数が複数である場合、及びポリヌクレオチドの由来生物が複数種である場合を含み得る。
ポリヌクレオチドは、DNAであってもRNAであってもよい。また、ポリヌクレオチドは、1本鎖であっても2本鎖であってもよい。
(2)工程1:配列情報の取得
ポリヌクレオチドの配列情報は、ヌクレオチドの配列を意図する。本明細書においてシークエンシングによって得られた1つの配列情報を有するデータの単位を「リード」と呼ぶことがある。配列情報の解析方法は、配列情報を決定できる限り制限されない。本実施形態においては、メタゲノム解析を行うため、配列情報を解析するシークエンサーは、次世代シークエンサー等の数千万から数億のDNA断片の塩基配列を同時並行で解析できるシークエンサーであることが好ましい。次世代シークエンサーとしては、例えば、イルミナ社(サンディエゴ、CA)のMiSeq9(商標)、HiSeq(商標)、NextSeq(商標)、MiSeq(商標);サーモ・フィッシャー社(ウォルサム、MA)のIon Proton(商標)、Ion PGM(商標);ロシュ社(バーゼル、スイス)のGS FLX +(商標)、GS Junior(商標)等が挙げられる。
配列情報は、シークエンサーから直接、又は記録媒体を介して、コンピュータ又はヒトが取得することができる。取得される配列情報は、テキストデータ、FASTQデータ等であることが好ましい。
ここで、シークエンシングを行うための検査サンプルからの核酸抽出方法、及びシークエンシングを行うためのライブラリの作製は公知である。
検査サンプル中には、複数のポリヌクレオチドが含まれるため、検査サンプルから取得される配列情報は複数でありえ、配列情報の群を構成し得る。
(3)工程2:異種生物由来配列情報への生物種を示すラベルの付与
i.取得した配列情報の前処理
シークエンサーから取得した配列情報の群には、アダプター配列、ポリA配列、ポリT配列、重複配列、低品質リード等の解析に適さない不適切リードが含まれていることがある。異種生物由来配列情報への生物種を示すラベルを付与する前に、前記工程1で取得した配列情報の中からこのような不適切リードを除く前処理を行うことが好ましい。
シークエンサーから取得した配列情報の群の全体の品質は、例えば、FastQC(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)等のソフトウエアを使用して評価することができる。取得した配列情報の品質は、例えば「良い」、「許容可」、「悪い」等のレベルで出力され得る。
また、前処理において、シークエンシングの際に付したアダプター配列を除去することが好ましい。この処理は、例えば、Trim galore!(https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/)等のソフトウエアを使用して行うことができる。
さらに、前処理において、低品質のリードを除去することが好ましい。この処理は、例えば、Prinseq(http://prinseq.sourceforge.net/)等のソフトウエアを使用して行うことができる。
さらにまた、前処理において、配列情報の中に存在する検体サンプルとは関係ない同じ塩基配列で構成されたリード(アダプターダイマーやコンカテマー又はPCR duplicate)を除去することが好ましい。この処理は、例えば、CD-HIT(https://github.com/weizhongli/cdhit/releases)等のソフトウエアを用いて行うことができる。
最後に、上記一連の前処理が終わった後に、再度配列情報の群の全体の品質の評価を行う。この処理は、例えば、FastQC、及びMultiQC(https://multiqc.info/)等のソフトウエアを使用して行うことができる。
前処理が終わった後に、取得した配列情報の群の品質が悪い場合や、上記前処理により除去されたリードが多い場合には、シーケンスをし直し配列情報を取得し直すことが好ましい。
ii.取得した配列情報からのホストに由来する配列情報の除去
通常取得した配列情報の群は、大多数がホストに存在するポリヌクレオチドをコードする配列情報(ホスト由来配列情報)である。このため、原因生物に存在するポリヌクレオチドの配列情報を検出するためには、上記i.において前処理が終わった配列情報の群から、ホスト由来配列情報を除去し、ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報を取得する必要がある。ホスト由来配列情報の除去は、例えば、系統推定及び/又はマッピングにより行うことができる。系統推定は、系統推定ソフトウエアKraken2を使用して行うことができる。系統推定を行うためのTaxonomyデータベースは、National Center for Biotechnology Information(NCBI)から提供されるTaxonomy Browser等の外部データベース500を使用することができる。マッピングは、例えば、マッピングソフトウエアBowtie2等を使用して行うことができる。マッピングを行うためのデータベースは、NCBI RefSeq(ウェブページ、www.ncbi.nlm.nih.gov/refseq/)、NCBI GenBank(ウェブページ、www.ncbi.nlm.nih.gov/genbank/)、UCSC Genome Browser等の外部データベース500を使用することができる。ホストがヒトである場合の代表的な参照配列は、GRCh37 reference primary assembly(NCBI提供)、JRGv2(東北大学提供)等である。
例えば、系統推定により、ホスト由来配列情報を工程1で取得した配列情報の群から除去した後、さらに、残った配列情報の群の各リードをホストの参照配列にマッピングし、系統推定で除去しきれなかった、ホスト由来配列情報を除去することが好ましい。
ホスト由来配列情報を除去した後、残った配列情報を、異種生物由来配列情報として以下の解析に用いる。
一般的に、次世代シークエンサーで取得されたリードは、マッピングソフトウエアBowtie2等を使用し、参照配列にマッピングすることで、各リードがコードするゲノム配列を特定する。しかし、この方法は、リード数が膨大である場合、全てをマッピングするのに時間がかかるという問題がある。マッピングの前に、系統推定で各リードがコードする生物種ゲノムを推定することにより、解析スピードが向上する。
次世代シークエンサーによる配列解析では、次世代シークエンサーで解析するポリヌクレオチドを一度ライブラリにするため、ライブラリ作製時に使用したベクター由来のポリヌクレオチドがシークエンシングの際に混じることがある。このため、さらに、系統推定ソフトウエアを使って外部データベース500に格納されているUniVec database(https://www.ncbi.nlm.nih.gov/tools/vecscreen/univec/)に基づく系統推定を行いホスト由来配列情報を除去した後に残った異種生物由来配列情報から、種々のベクターに由来するリードを除去してもよい。
iii.異種生物由来配列情報への生物種ラベルの付与
次に、上記ii.において、ホスト由来配列情報を除去した配列情報の群に含まれる各異種生物由来配列情報について、各配列情報が由来する生物種を推定し、その生物種を示すラベルを各異種生物由来配列情報に付与する。
生物種の推定は、例えば、系統推定及び/又はマッピングにより行うことができる。系統推定は、系統推定ソフトウエアKraken2を使用して行うことができる。マッピングは、例えば、マッピングソフトウエアBowtie2等を使用して行うことができる。系統推定及びマッピングに使用するデータベースは、上記ii.で述べたとおりである。
例えば、系統推定/及びマッピングにより、各異種生物由来配列情報から生物種を推定し、その生物種を示すラベルを生物種の推定を行った対応する異種生物由来情報に付与する。好ましくは、系統推定により各異種生物由来配列情報から生物種を推定する。上述のとおり、系統推定は、マッピングを行うよりも解析速度が速く、迅速推定に有用である。
ここでは、生物種を示すラベルが付与された異種生物由来配列情報の群が生成される。
また、生物種を示すラベルは、生物種の科名、属名、種名のTaxonomic rankに分けて各Taxonomic rankを示すラベルを個別に付すことが好ましい。例えば、大腸菌を例にとると、科名は「Enterobacteriaceae」であり、属名は「Escherichia」であり、種名は「Escherichia coli」である。一般的に系統推定では、種が近いほどヌクレオチド配列が似ているため、近縁種はヌクレオチド配列のみでは、種まで特定できないことがある。このような場合には、例えば、科名を示すラベルを付す、又は属名を示すラベルを付す等、信頼できるTaxonomic rankごとに推定結果のラベルを付すことが好ましい。このようにすることで、誤推定を回避することができる。例えば、ペスト菌(Yersinia pestis)と食中毒の原因菌であるエルシニア菌(Yersinia enterocolitica又はYersinia pseudotuberculosis)は、同じ属の細菌でありゲノム配列も似ているが、臨床的及び公衆衛生的にペスト菌と他のエルシニア菌は扱いが全く異なる。このような場合には、属名までのラベルを付し、培養検査、PCR検査等を併用することが好ましい。
ここで、系統推定/及びマッピングにより生物種が推定できなかった異種生物由来配列情報には、生物種を推定できなかった旨を示すラベル、例えば、「未知の生物種」を示すラベルを付与してもよい。
iV.系統推定/及びマッピングにより生物種が推定できなかった異種生物由来配列情報の生物種の推定
次に上記iii.において、未知の生物種を示すラベルが付された異種生物由来配列情報について、その配列情報について相同性検索を行い生物種を推定することができる。例えばNCBIから提供されるBasic Local Alignment Search Tool(BLAST)を使用し、異種生物由来配列情報と相同性の高い既知ヌクレオチド配列を有する生物種を推定することができる。
相同性検索により生物種が付された異種生物由来配列情報は、上記iii.において、生物種を示すラベルが付された異種生物由来配列情報の群と共に、工程3の解析に用いられる。
(4)工程3:配列情報のリード数と異種生物の種の多様性指数の算出
上記工程2のiii及びivにおいて、生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、各生物種を示すラベルに対応する配列情報のリード数を算出する。リード数は、同じ生物種を示すラベルが付されたリードの数を計数することにより求めることができる。好ましくは、リード数は他の検査サンプルとの比較のため標準化する。具体的には、上記(2)で述べた前処理終了後の配列情報のリード数を1,000,000リードとした場合に、その中に含まれる同生物種のリード数(RPM:reads per million reads)を算出し、標準化されたリード数として用いることができる。各生物種を示すラベルに対応する、ホスト以外の生物種に由来するリード数を標準化した値をpRPMと呼ぶ。
pRPMは、下式1により算出される。
Figure 0007373843000001
また、上記工程2のiii及びivにおいて、生物種を示すラベルが付与された異種生物由来配列情報の群における、異種生物の種の多様性指数を算出する。多様性指数は、多様性を示す数値である限り制限されない。多様性指数としては、例えば、Shannon-WienerのH’、Simpsonのλ等を挙げることができる。好ましくは、下式2で算出されるShannon-WienerのH’である。
Figure 0007373843000002
ここで、Sは生物種数を表し、Piは相対優占度を示す。iは、種を示す。
検体サンプルに存在する異種生物由来のポリヌクレオチドについて、各生物種に対応するリード数に加え、多様性指数を目的変数として使用することで、客観的なリード数の基準値が存在していなくても、各生物種に対応するリード数が有する臨床的意義に客観性を持たせることができる。
(5)工程4:感染の原因生物である可能性を示すデータの生成
次にロジスティック回帰式と、予測確率を用いて、感染の原因生物である可能性を示すデータを生成する。本実施形態では、はじめに、各生物種を示すラベルについて算出した、上記pRPMと、H’を目的変数として使用する下記式3で表される二項ロジスティック回帰式により値Zを算出する。
Figure 0007373843000003
ここで、a、b、cはそれぞれ係数を示す。
各係数a、b、cは、従来法(血液培養法、血清抗体法、又はPCR法)において敗血症と診断され、原因病原微生物が明らかとなっている患者の血液サンプルと、同一患者が感染症を発症する前に採取された血液サンプル(非感染症サンプル)より得たシークエンスデータより下式4及び式5により算出することができる。
Figure 0007373843000004
Figure 0007373843000005
上記工程2のiii及びivにおいて、生物種を示すラベルが付与された異種生物由来配列情報の群を生物種の科名、属名、種名にわけてTaxonomic rankごとに、下記二項ロジスティック回帰式を用いてZf、g、を求めることができる。
1) Family rank:Zf=af*log10(${pRPM}) +bf*${Hf}+cf
2) Genus rank:Zg=ag*log10(${pRPM})+bg*${Hg}+cg
3) Species rank:Zs= as*log10(${pRPM})+bs*${Hs}+cs
Taxonomic rankに対応する二項ロジスティック回帰式の具体例は下記のとおりである。
1) Family rank:Zf=158.688*log10(${pRPM}) -43.257*${Hf} -332.649
2) Genus rank:Zg =165.848*log10(${pRPM}) -33.201*${Hg} -367.08
3) Species rank:Zs=-0.368*log10(${pRPM}) -20.075*${Hs} +51.439
(6)工程5:感染の原因生物を示すラベル決定
さらに、下式6により、感染の原因生物である可能性を示すデータYが導かれる。
Figure 0007373843000006
Yが0.5より大きいとき、感染の原因生物であることが示唆され、Yが0.5以下のとき、感染の原因生物でないことが示唆される。Yは生物種を示すラベルごとに算出されるため、生物種を示すラベルごとに、感染の原因生物であるかいなかが示唆される。
本明細書に開示される感染の原因生物を推定するための判別式は、上記式1に示す二項ロジステッィク回帰式と式6の組み合わせである。
ここで、本実施形態においては、Yが0.5より大きく(すなわち、感染の原因生物であることが示唆され)、さらにpRPM値が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルとして決定する。一定数は、例えば、100、200、300等を例示できる。好ましくは200である。
Taxonomic rankに応じた二項ロジスティック回帰式により、Taxonomic rankごとにZを求めた場合には、Yは、上記式6にしたがって、Taxonomic rankごとに算出される。
(7)工程6:予測結果の出力
感染の原因生物を示すラベルは、予測結果として、後述する出力デバイス112に、通信I/F105を介して他のコンピュータに、あるいはメディアI/F108を介してメディアドライブに出力され得る。予測結果は、解析レポートとして出力されてもよい。予測結果は、感染の原因生物を示すラベルに対応するリード数と共に出力されてもよい。
さらに、予測結果は、感染の原因生物を示すラベルが付されたリードの相対優占度と共に出力されてもよい。相対優占度(P1)は、relative abundance(RA)とも称される。相対優占度は、前記感染の原因生物を示すラベルのリード数が、上記工程2のiii及びivにおいて、生物種を示すラベルが付与された異種生物由来配列情報の群の総リード数内で占める割合であり、下式7により算出される。
Figure 0007373843000007
生物種を示すラベルとして、生物種の科名、属名、又は種名を使用した場合には、Taxonomic rankに応じて、生物種の科名、属名、又は種名ごとに予測結果を出力してもよい。
出力される予測結果の一例を図1に示す。図1は、予測結果を含む解析レポートをテキストデータで出力する例である。
図1のline No.は各行に振られた番号を示す。line No.1は、検査サンプルを識別するための識別子(ID)を示す。line No.4の「Available_read」は、上記(3)工程2のiに記載の前処理を行った後に配列情報の品質の再評価を行い、使用可と判断された配列情報のリード数である。line No.7のPathogen_read(RPM)が、上記(4)工程3及び上記(5)工程4を行い感染の原因生物を示すラベルが付されたリード数の合計のRPM値である。感染の原因生物を示すラベルは、複数種の生物種を示すラベルから生成され、複数存在する場合があるため、ここでは、生物種に関わらず、感染の原因生物を示すラベルが付されたリードに共通のラベルとして、「Pathogen」を付している。
line No.20からline No.22のA欄は、Taxonomic rank (family)を使った解析において、感染の原因生物を示すラベルとして付された科名を示している。line No.20からline No.22のB欄は標準化する前のリード数(reads)を示し、line No.20からline No.22のC欄は標準化後のリード数(RPM)を示し、line No.20からline No.22のD欄はRAを示す。
line No.20からline No.22のA欄は、Taxonomic rank (genus)を使った解析において、感染の原因生物を示すラベルとして付された属名を示している。B欄からD欄の構成はTaxonomic rank (family)を使った場合と同様である。
line No.20からline No.22のA欄は、Taxonomic rank (species)を使った解析において、感染の原因生物を示すラベルとして付された属名を示している。B欄からD欄の構成はTaxonomic rank (family)を使った場合と同様である。
図1の例ではline No.48のA欄に記載の「Tatlockia_micdadei」が、感染の原因生物を示すラベルであり、本実施形態における感染の原因生物を示す「予測結果」である。図1の例では、予測結果が1種類であるが、複数種の生物種を示すラベルについて感染の原因生物を示すラベルであると決定されることもありうる。この場合には、予測結果は複数となりうる。
また、解析レポートには、図1のline No.50からline No.57に示すような、予測結果の検証結果を含めてもよい。この検証は、リード数が少ない場合であって、感染の原因生物として特定された生物の参照配列が存在している場合、上記工(2)工程1から(6)工程5によって得られた結果の裏付けをとることができ、有用である。
検証において、はじめに、上記工程5において感染の原因生物を示すラベルであると決定された生物種を示すラベルについて、このラベルに対応している異種生物由来配列情報を含む参照配列を、配列データベースから検索する。配列データベースは、上記(3)工程2のiiiで使用したNCBI RefSeq(ウェブページ、www.ncbi.nlm.nih.gov/refseq/)、NCBI GenBank(ウェブページ、www.ncbi.nlm.nih.gov/genbank/)、UCSC Genome Browser等の外部データベースを挙げることができる。
図1の例では、line No.48に示された「Tatlockia_micdadei」のラベルに対して、参照配列として、line No.52に「NC_002942.5」が挙げられており、line No.53に「NZ_LN614830.1」が挙げられている。
次に、検査サンプルから取得された、感染の原因生物を示すラベルに対応する配列情報の全てを前記参照配列にマッピングする。感染の原因生物を示すラベルが複数ある場合には、ラベルごとにマッピングを行う。また、図1に示すように、1つの感染の原因生物を示すラベルに対して参照配列が複数ヒットした場合には、それぞれの参照配列に対して、感染の原因生物を示すラベルに対応する配列情報をマッピングする。マッピングは、マッピングソフトウエアBowtie2等を使用して行うことができる。
マッピングの結果に基づいて、特定の感染の原因生物を示すラベルに対応する配列情報のcoverage percentage及びaverage depth of mapped regionsを算出する。coverage percentageは、特定の感染の原因生物を示すラベルに対応する配列情報により対応する参照配列のうちどれだけの配列長が前記感染の原因生物を示すラベルを付された配列情報から解読されたかを示す値である。average depth of mapped regionsは、前記解読された配列長が何回繰り返して解読されたかを示す値の平均値を示す。
例えば、Bowtie2等のマッピングソフトウエアを使用したマッピングの結果は、SAMファイルとして与えられる。SAMファイルは、テキスト形式で参照配列へのマッピング情報を、例えば配列名、アラインメント結果、参照配列上にマップされた位置などをカラムに分けて記録している。例えば、Samtools(http://samtools.sourceforge.net/)等のソフトウエアを使用し、SAMファイル内のデータ内の必要項目を抽出し、コンピュータ処理ができるバイナリ形式に変換することで、Bedtools(https://bedtools.readthedocs.io/en/latest/)に渡す入力データを生成する。Bedtoolsによって、coverage percentageと、average depth of mapped regionsを算出する。
coverage percentageは、下式によって算出される。
coverage percentage(%)=(参照配列にマップされた塩基数/参照配列の総塩基数)×100
average depth of mapped regionsは下式によって算出される。
average depth of mapped regions=
参照配列にマップされた配列の総塩基数/参照配列のうちマップされた領域の塩基数
coverage percentageは100(%)に近づくほど好ましい。例えば図1の例では、coverage percentageは、line No.52及びline No.53のD欄に示されている。line No.52に「NC_002942.5」と、line No.53に「NZ_LN614830.1」が挙げられているが、NC_002942.5のcoverage percentageは0.0044であるのに対して、NZ_LN614830.1のcoverage percentageは2.37222である。NC_002942.5のようにcoverage percentageが低い場合、参照配列における解読できた配列長が短く、異種生物由来配列情報が近縁の生物種に誤ってマップされている可能性が高い。NZ_LN614830.1のようにcoverage percentageが高いものは、より網羅的に参照配列を解読できていると考えることができ、結果の信頼性が高い。
average depth of mapped regionsは1~3程度であることが好ましい。例えば図1の例では、average depth of mapped regionsは、line No.52及びline No.53のF欄に示されている。line No.52に「NC_002942.5」と、line No.53に「NZ_LN614830.1」が挙げられているが、NC_002942.5のaverage depth of mapped regionsは532.384であるのに対して、NZ_LN614830.1のaverage depth of mapped regionsは1.0238である。NC_002942.5のようにaverage depth of mapped regionsが高いものは、参照配列の特定の領域のみに解読配列が集中しており、検査サンプルから検出された配列情報の参照配列全体の網羅性が低いことになる。このような場合、NC_002942.5に割り当てられた異種生物由来配列情報は、PCRエラー等のノイズである可能性が高い。一方、NZ_LN614830.1のようにaverage depth of mapped regionsが1~3程度である場合、参照配列の広い範囲にわたって検査サンプル中から異種生物由来配列情報として参照配列が検出されていることを示す。このため予測結果の信頼性が高いといえる。ただし、line No.52及びline No.53のD欄に示されているcoverage percentageが100%または100%に近い値の場合、解析データ量が増えるほど参照配列の全領域が繰り返して解読されることとなり、average depth of mapped regionsは高値を取りうる。このような場合を想定し、coverage percentageとaverage depth of mapped regionsの2つ値で結果の信頼性を評価する。
(8)その他の実施形態
a.図1では、生物種を示すラベルとして、生物種の科名、属名、種名を示すラベルを用いている。しかし、生物種を示すラベルは、NCBIに登録されている、Taxonomy ID、Reference sequence ID等であってもよい。
b.上記(3)工程2のiii.異種生物由来配列情報を系統推定及び/又はマッピング、あるいは相同性検索により、生物種を示すラベルを付与している。しかし、異種生物由来配列情報について、獲得抗菌薬耐性遺伝子データベース(ResFinder)に対して相同性検索を行い、検査サンプル中に存在する抗生物薬に対する耐性遺伝子の検出を行ってもよい。抗生物薬に対する耐性遺伝子の検出は、BLASTを使って行うことができる。この結果は、図1のline NO.59からline NO.63に示すとおりである。ここでは、アミノグリコシド系抗生物質の耐性遺伝子であるaph(3’)-IIa_1(X57709)と、aph(3’)-IIa_2(V00618)、並びにβラクタム系抗生物質の耐性遺伝子であるblaTEM-231_1(MG821378)が検出されている。
c.別の形態として、解析レポートは、図2に示すようにKronaチャートを使って、生物種の科名、属名、又は種名を示すラベルと、各ラベルに対応するリード数を示してもよい。
d.別の形態として、解析レポートは、図3に示すように、二次元プロット図で示されてもよい。図3の例では、感染の原因生物を示すラベルが、Taxonomic rankで表されている。図3(A)は科名ランク、図3(B)は属名ランク、及び図3(C)は種名ランクを示す。二次元プロットは、第1の軸(縦軸)に生物種を示すラベルに対応するリード数(pRPM)を示す。pRPMは必要に応じて対数軸とすることができる。第2の軸(横軸)に各Taxonomic rankについて前記ホスト以外の生物種の多様性指数を示す。図3において、第1の軸と、第2の軸によって張られた領域が生成され、前記領域には、各Taxonomic rankのロジスティック回帰分析式を二次元回帰式に変換し求められる回帰直線が引かれたプロット領域が生成されている。回帰直線より左は感染の原因生物であることを示し、右は感染の原因生物ではないことを示す。このプロット領域に、上記(5)工程4において、感染の原因生物を示すラベルとして決定された生物種について、上記(4)工程3で求めたリード数、好ましくはpRPMと、その生物種を含む種の多様性指数の座標をプロットすることで予測結果を示す二次元プロット図が生成される。
ロジスティック回帰分析式から二次元回帰式への変換は、下式8によって行われる。
Figure 0007373843000008
ここで、a、b、cはそれぞれ係数を示す。
図3は、縦軸をlog10(${pRPM})、横軸をそれぞれ${H}、${H}、${H}とし、下式に基づいてロジスティック回帰分析式から二次元回帰式への変換を行い、プロット領域を生成した例である。
1) Family rank:0=158.688*log10(${pRPM}) -43.257*${Hf} -332.649
2) Genus rank:0=165.848*log10(${pRPM}) -33.201*${Hg} -367.08
3) Species rank:0=-0.368*log10(${pRPM}) -20.075*${Hs} +51.439
上記プロット領域に上記(4)工程3で求めた各値(Hf,log10(${pRPM})、(H,log10(${pRPM})、(H,log10(${pRPM})を座標としてプロットしている。
e.Kronaチャート、二次元プロット図は、リード数(あるいはpRPM値)、相対優占度、Coverage percentage、average depth of mapped regions等と共に解析レポートに反映されてもよい。
f.上記(3)工程2では外部データベース500に格納されている系統樹データベースDB11、参照配列データベースDB12、UniVec database及び獲得抗菌薬耐性遺伝子データベースにアクセスして解析する方法について述べた。しかし、系統樹データベースDB11、参照配列データベースDB12、UniVec database及び獲得抗菌薬耐性遺伝子データベースの全部又は一部は外部データベース500からデータをダウンロードし、後述する予測装置10又は外部サーバに記録してから解析に用いてもよい。
1-2.予測装置10
本実施形態は、上記1-1.の概要で述べた予測方法を実現するための予測装置1に関する。以下図4及び図5を用いて予測装置10のハードウエア構成及び機能構成について説明する。
(1)ハードウエア構成
図4に、予測装置10のハードウエア構成を示す。予測装置10は、汎用コンピュータであり得る。予測装置10は、入力デバイス111と、出力デバイス112と、メディアドライブ113と通信可能に接続されている。また予測装置10は、ネットワークを介して外部データベース(外部DB)500、外部コンピュータ(PC)600と通信可能である。予測装置10は、CPU101と、メモリ102と、ROM(read only memory)103と、記憶デバイス104と、通信インタフェース(I/F)105と、入力インタフェース(I/F)106と、出力インタフェース(I/F)107と、メディアインターフェース(I/F)108とを備える。予測装置10内の各構成はバス109によって互いにデータ通信可能に接続されている。
記憶デバイス104は、ハードディスク、フラッシュメモリ等の半導体メモリ素子、光ディスク等によって構成される。記憶デバイス104には、オペレーティングシステム(OS)1041と、後述する予測プログラム1042と、アルゴリズムデータベース(DB)DB1と、出力様式データベース(DB) DB2とが格納されている。予測プログラム1042は、オペレーティングシステム1041と協働して、コンピュータを予測装置10として機能させる。
CPU101は、本実施形態において処理部とも呼ばれる。
アルゴリズムデータベースDB1は、上記1-1.(4)工程3で述べたロジスティック回帰式及び確率関数を含む判別式及び判別式に必要な各係数を格納している。
出力様式データベースDB2は、図1から図3に示す各解析レポートの出力様式の設定を格納している。
入力デバイス111は、タッチパネル、キーボード、マウス、ペンタブレット、マイク等から構成され、予測装置10に文字入力又は音声入力を行う。入力デバイス111は、処理部10の外部から接続されても、予測装置10と一体となっていてもよい。
出力デバイス112は、例えばディスプレイ等の表示デバイス、プリンタ等で構成され、各種操作ウインドウ、予測結果、解析レポート等を出力する。
メディアドライブ113は、USBドライブ、フレキシブルディスクドライブ、CD-ROMドライブ、又はDVD-ROMドライブ等であり得る。
外部データベース500は、上記1-1で述べた各種データベースを意図する。
外部コンピュータ600は、検査を依頼する依頼者が使用する端末であり、汎用コンピュータであり得る。
すなわち、予測装置10は、外部データベース500と、外部コンピュータ600が接続された、予測システム1000を構築し得る。さらに、予測システム1000は、配列解析を行うシークエンサーを備えていてもよい。
(2)機能構成
図5に、予測装置10の機能構成を示す。
予測装置10は、配列情報取得手段M1と、ホスト配列情報除去手段M2と、生物種ラベル付与手段M3と、リード数・多様性指数算出手段M4と、解析手段M5と、感染原因生物ラベル決定手段M6と、予測結果出力手段M7とを備える。配列情報取得手段M1と、ホスト配列情報除去手段M2と、生物種ラベル付与手段M3と、リード数・多様性指数算出手段M4と、解析手段M5と、感染原因生物ラベル決定手段M6と、予測結果出力手段M7は、それぞれ、後述するステップS1、ステップS2、ステップS3、ステップS4、ステップS5、ステップS6及びステップS7に該当する。
1-3.予測プログラム1042の処理
図6から図9を用いて、予測プログラム1042がCPU101に実行させる処理を説明する。
CPU101は、オペレータからの処理開始の入力を受け付け、処理を開始する。
CPU101は、図6のステップS1において、検査サンプルに含まれるポリヌクレオチドの配列情報の群を取得する。ポリヌクレオチドの配列情報は、1つのポリヌクレオチドについて1つのリードとして取得される。上記1-1.(2)工程1で述べたように、配列情報は、シークエンサーから直接、記録媒体を介してメディアドライブ113から、あるいは通信I/F105を介してネットワーク経由で外部コンピュータ600から取得することが可能である。配列情報は、テキストデータ、FASTQデータ形式で取得しうる。
上記1-1.(2)工程1と共通する用語の説明は、ここに援用する。
CPU101は、ステップS2において、ステップS1で取得した配列情報の群から、ホストに由来する配列情報を除去する処理を行う。
図7を用いて、図6のステップS2の処理をより詳細に説明する。図7のステップ21において、CPU101は、上記1-1.(3)工程2のi.で説明したFastQC、Trim galore!、Prinseq、CD-HIT、FastQC、及びMultiQC等のソフトウエアを使用し、ステップS1で取得した配列情報の群に対して、上記1-1.(3)工程2のi.で説明した前処理を行う。前処理に必要なソフトウエアは、予測プログラム1042の一部を構成しうる。
次に、CPU101は、ステップS22において、ステップS21において前処理の済んだ配列情報の群に対して、上記1-1.(3)工程2のii.において説明したように、系統推定ソフトウエアKraken2を使用し系統推定を行い、ホスト由来配列情報をステップS21の前処理後に残った配列情報の群から除去する。
続いて、CPU101は、ステップS23において、ステップS22において系統推定によりホスト由来配列情報を除去した配列情報の群内のリードを、マッピングソフトウエアBowtie2等を使用し参照配列にマッピングする。ここで、ホストの参照配列にマッピングされたリードを、配列情報の群からホスト由来配列情報として除去する。
続いて、CPU101は、ステップS24において、ステップS23においてホスト由来配列情報を除去した異種生物由来配列情報の群に含まれるリードについて、系統推定ソフトウエアKraken2を使用しUniVec databaseに基づいてベクターに由来するリードを除去する。
CPU101は、ステップS24においてベクター由来のリードが除去された異種生物由来配列情報の群を用いて、図6に示すステップS3以降の処理を行う。したがって、系統推定ソフトウエアKraken2、及びマッピングソフトウエアBowtie2等は、予測プログラム1042の一部を構成し得る。
図7に示すステップS21からステップS24の処理において使用される用語の説明は、上記1-1.(3)工程2のii.の説明をここに援用する。
図6に戻って、予測プログラム1042によって行われる処理の続きを説明する。
CPU101は、図6に示すステップS3において、図7に示すステップS24においてベクター由来のリードが除去された異種生物由来配列情報の群に含まれる各リードについて、各リードが由来する生物種を推定する。そして、各リードから推定された生物種を示すラベルを、各リードに付与する。
ステップS3の処理の詳細を図8に示す。CPU101は、ステップS31において、系統推定ソフトウエアKraken2を使用して、上記1-1.(3)工程2のiii.に記載した方法にしたがって、各リードに推定された生物種を示すラベルを付与する。
次にCPU101は、ステップS32において、ステップS3の処理の対象となった全リードについて生物種を示すラベルが付与されたか否かを判断する。全リードについて生物種を示すラベルが付与された場合(「YES」の場合)、CPU101は、図6に示すステップS4に進む。図8に示すステップS32において、全リードについて生物種を示すラベルが付与されなかった場合(「NO」の場合)、CPU101は、図8のステップS33に進む。
次にCPU101は、ステップS33において、上記1-1.(3)工程2のiv.に記載した方法にしたがって、ステップS31において生物種を示すラベルを付与できなかったリードについて相同性検索を行う。相同性検索を行う場合、CPU101は、通信I/F105からネットワークを介して、例えばNCBIのBLASTサイトにアクセスし、検索したい配列をBLASTサイトの所定の領域に入力し、BLASTサイト上にて相同性検索を行う。
続いてCPU101は、ステップS34において、ステップS33の相同性検索により決定された生物種を示すラベルを各リードの配列情報に付与する。
CPU101は、ステップS34の後に図6に示すステップS4に進むが、ステップS4に進む前に、ステップS31及びステップS34で生物種を示すラベルを付した異種生物由来配列情報の群を、記憶デバイス104に記録してもよい。
CPU101は、図6に示すステップS4に進み、上記1-1.(4)工程3に記載の方法にしたがって、生物種を示すラベルが付与された異種生物由来配列情報の群について各生物種を示すラベルに対応する配列情報のリード数を算出する。また、上記1-1.(4)工程3に記載の方法にしたがって、ステップS3において、生物種を示すラベルが付与された異種生物由来配列情報の群における、異種生物の種の多様性指数を算出する。
CPU101は、続いてステップS5に進み、上記1-1.(5)工程4に記載の方法にしたがって、感染の原因生物である可能性を示すデータYを算出する。
CPU101は、続いてステップS6に進み、上記1-1.(6)工程5に記載の方法にしたがって、感染の原因生物を示すラベルを決定する。図9を用いてステップS6の処理をより詳細に説明する。
CPU101は、図9に示すS61において、ステップS5において各生物種を示すラベルについて算出したYが0.5より大きいか否かを判定する。
ステップS61において、Yが0.5以下である場合(「NO」の場合)、CPU101はステップS64へ進み、Yが0.5以下である生物種を示すラベルを「感染の原因生物を示すラベルではない」と決定する。
ステップS61において、Yが0.5より大きい場合(「YES」の場合)、CPU101はステップS62へ進む。ステップS62において、CPU101はステップS4で算出されたリード数、好ましくはpRPMが200より大きいか否かを判定する。
ステップS62において、リード数が200以下である場合(「NO」の場合)、CPU101はステップS64へ進み、リード数が200以下である生物種を示すラベルを「感染の原因生物を示すラベルではない」と決定する。
ステップS62において、リード数が200より大きい場合(「YES」の場合)、CPU101はステップS63へ進み、リード数が200より大きい生物種を示すラベルを「感染の原因生物を示すラベルである」と決定する。
CPU101は、ステップS34の後に図6に示すステップS7に進むが、ステップS7に進む前に、ステップS63及びステップS64で行った判定の結果を、判定を行った生物種を示すラベルと紐付けて、記憶デバイス104に記録する。
次にCPU101は、図6に示すステップS7に進む。ステップS7において、上記1-1.(7)工程6に記載した方法にしたがって相対優占度を算出する。また、感染の原因生物を示すラベルであると決定されたラベルに対応する生物種について参照配列が入手できる場合には、Coverage percentage、及びaverage depth of mapped regionsを算出する。Coverage percentage、及びaverage depth of mapped regionsの算出には、ソフトウエアSamtools、及びBedtoolsを使用するため、これらのソフトウウエアは、予測プログラム1042の一部を構成する。算出結果は、記憶デバイス104に記録される。ステップS7は、任意である。
次にCPU101は、ステップS8に進み、上記1-1.(8)b.にしたがって、検査サンプル中に存在する抗生物薬に対する耐性遺伝子の検出を行う。検出結果は、記憶デバイス104に記録される。ステップS8は、任意である。
最後に、CPU101は、ステップS9に進み、感染の原因生物の予測結果を出力する。CPU101は、出力様式データベースDB2に格納されている出力様式を呼び出し、各出力様式に感染の原因生物の予測結果及び各様式に図6に示すステップS2からS8において導かれる各数値を反映し、解析レポートを生成する。生成された解析レポートは、記憶デバイス104に格納される。
解析レポートの様式は、図1に示すようなテキスト形式を選択しうる。また、別の解析レポートの様式として図2に示すKronaチャートを選択しうる。さらに、別の解析レポートの様式として図3に示す二次元プロットの様式を選択しうる。これらの解析レポートの生成方法は、上記1-1.(7)工程6及び、上記1-1.(8) d.に記載したとおりである。解析レポートの様式の選択は、予測装置10のオペレータ若しくは、外部コンピュータ600を操作する検査の依頼者が行うことができる。CPU101は、オペレータによる入力デバイス111からの解析レポートの様式の選択要求を受け付けるか、検査の依頼者が外部コンピュータ600から要求した選択要求を通信I/F105を介して受け付け、要求された解析レポートの様式により、少なくとも予測結果を含む解析レポートを出力する。解析レポートの出力は、予測装置10の出力デバイス112又は通信I/F105を介した外部コンピュータ600への出力であり得る。
1-4.予測プログラム1042を格納した記録媒体
予測プログラム1042は、記録媒体に記憶されていてもよい。すなわち、前記コンピュータプログラムは、ハードディスク、フラッシュメモリ等の半導体メモリ素子、光ディスク等の記録媒体に記憶される。また前記コンピュータプログラムは、クラウドサーバ等のネットワークで接続可能な記録媒体に記憶されていてもよい。コンピュータプログラムは、ダウンロード形式の、又は記録媒体に記録されたプログラム製品であってもよい。
前記記録媒体へのプログラムの記憶形式は、前記提示装置が前記プログラムを読み取り可能である限り制限されない。前記記録媒体への記憶は、不揮発性であることが好ましい。
2.第2の実施形態
第1の実施形態では、予測結果を最後に出力した。第2の実施形態では、はじめに系統推定のみで異種生物由来配列情報の群に含まれる各リードについて、各リードが由来する生物種を推定し、感染の原因生物を示すラベルを決定し、このラベルに基づく感染の原因生物の予測結果を第1の予測結果として出力する。次に、系統推定により生物種が特定されず、未知の生物種を示すラベルが付与された異種生物由来配列情報のリードについて相同性検索を行い対応する生物種を推定し、推定された生物種を示すラベルを検索対象となった異種生物由来配列情報に付与する。そして、先に系統推定により生物種を示すラベルが付与された異種生物由来配列情報の群と、相同性検索により生物種を示すラベルが付与された異種生物由来配列情報の群を用いて、感染の原因生物のラベルを決定し、その予測結果を第2の予測結果として出力する。
第1の予測結果を反映した解析レポートは、中間レポート又は迅速解析レポートとも呼ばれる。第2の予測結果を反映した解析レポートは、最終レポートとも呼ばれる。
2-1.予測装置20
予測装置20のハードウエア構成及び機能構成は、基本的には予測装置10と同様である。ただし、図4に示す記憶デバイス104には、予測プログラム1042に替えて予測プログラム1043が格納される。
また、図5に示す機能構成において、配列情報取得手段M1と、ホスト配列情報除去手段M2と、生物種ラベル付与手段M3と、リード数・多様性指数算出手段M4と、解析手段M5と、感染原因生物ラベル決定手段M6と、予測結果出力手段M7は、それぞれ、後述するステップS111;ステップS112;ステップS113及びステップS118;ステップS114及びステップS119;ステップS115及びステップS120;ステップS116及びステップS121;並びにステップS117及びステップS122に該当する。
2-2.予測プログラム1043の処理
図10及び図11を用いて、予測プログラム1043がCPU101に実行させる処理を説明する。ここで、予測プログラム1042と同様に、上記1-1.(3)工程2で使用したFastQC、Trim galore!、Prinseq、CD-HIT、FastQC、及びMultiQC、系統推定ソフトウエアKraken2、及びマッピングソフトウエアBowtie2等は、予測プログラム1043の一部を構成しうる。また、必要に応じて、Samtools、及びBedtoolsも予測プログラム1043の一部を構成しうる。
CPU101は、オペレータからの処理開始の入力を受け付け、処理を開始する。
CPU101は、図10のステップS111において、検査サンプルに含まれるポリヌクレオチドの配列情報の群を取得する。この処理は、上記1-3.のステップS1の処理と同様であるから、上記1-3.のステップS1(図6)の説明をここに援用する。
CPU101は、ステップS112において、ステップS111で取得した配列情報の群から、ホストに由来する配列情報を除去する処理を行う。この処理は、上記1-3.のステップS2の処理と同様であるから、上記1-3.のステップS2(図6)の説明をここに援用する。
CPU101は、ステップS113において、S112においてベクター由来のリードが除去された異種生物由来配列情報の群に含まれる各リードについて、各リードが由来する生物種を推定する。そして、各リードから推定された生物種を示すラベルを、各リードに付与する。
図11を用いて、ステップS113の処理の詳細を説明する。CPU101は、ステップS1131において、上記1-3.のステップS31(図8)と同様に異種生物由来配列情報の群に含まれる各リードが由来する生物種を推定する。そして、各リードから推定された生物種を示すラベルを、各リードに付与する。
次にCPU101は、ステップS1132において、ステップS113の処理の対象となった全リードについて生物種が推定できたか否かを判断する。全リードについて生物種を推定できた場合(「YES」の場合)、CPU101は、図10に示すステップS114に進む。図11に示すステップS1132において、全リードについて生物種が推定できなかった場合(「NO」の場合)、CPU101は、図11のステップS1133に進む。
次にCPU101は、ステップS1133において、ステップS1131において生物種を推定できなかったリードに未知の生物種であることを示すラベルを付与し、図10のステップS114に進む。
CPU101は、図10に示すステップS114において、生物種を示すラベルを付されたリード及び未知の生物種を示すラベルを付された異種生物由来配列情報についてリード数を算出する。リード数の算出方法は、上記1-3.のステップS4(図6)と同様であるから、上記1-3.のステップS4(図6)の説明をここに援用する。また、ステップS113において、生物種を示すラベルが付与された異種生物由来配列情報と未知の生物種を示すラベルを付された異種生物由来配列情報の群における、異種生物の種の多様性指数を算出する。多様性指数の算出方法は、上記1-3.のステップS4(図6)と同様であるから、上記1-3.のステップS4(図6)の説明をここに援用する。
CPU101は、続いてステップS115に進み、感染の原因生物である可能性を示すデータYを算出する。この処理は、上記1-3.のステップS5と同様であるから、上記1-3.のステップS5の説明をここに援用する。
CPU101は、続いてステップS116に進み、感染の原因生物を示すラベルを決定する。この処理は、上記1-3.のステップS6(図6)と同様であるから、上記1-3.のステップS6の説明をここに援用する。
CPU101は、続いてステップS117に進み、相対優占度、Coverage percentage、及びaverage depth of mapped regionsを算出する。この処理は、上記1-3.のステップS7(図6)と同様であるから、上記1-3.のステップS7の説明をここに援用する。
CPU101は、ステップS118に進み、感染の原因生物の第1の予測結果を出力する。この処理は、名称は異なるものの、上記1-3.のステップS9(図6)と同様であるから、上記1-3.のステップS9の説明をここに援用する。
続いてCPU101は、ステップS119に進み、ステップS113において未知の生物種を示すラベルが付された異種生物由来配列情報について相同性検索を行い生物種を示すラベルを付与する。この処理は、上記1-3.のステップS33及びS34(図7)と同様であるから、上記1-3.のステップS33及びS34の説明をここに援用する。
次にCPU101は、ステップS120に進み、ステップS113とステップS119において、生物種を示すラベルが付与された異種生物由来配列情報の群について、各生物種を示すラベルに対応する配列情報のリード数を算出する。また、ステップS113とステップS119において、生物種を示すラベルが付与された異種生物由来配列情報の群における、異種生物の種の多様性指数を算出する。この処理は、上記1-3.のステップS4(図6)と同様であるから、上記1-3.のステップS4の説明をここに援用する。
CPU101は、続いてステップS121に進み、感染の原因生物である可能性を示すデータYを算出する。この処理は、上記1-3.のステップS5と同様であるから、上記1-3.のステップS5の説明をここに援用する。
CPU101は、続いてステップS122に進み、感染の原因生物を示すラベルを決定する。この処理は、上記1-3.のステップS6(図6)と同様であるから、上記1-3.のステップS6の説明をここに援用する。
次にCPU101は、ステップS123に進み、相対優占度、Coverage percentage、及びaverage depth of mapped regionsを算出する。この処理は、上記1-3.のステップS7(図6)と同様であるから、上記1-3.のステップS7の説明をここに援用する。このステップは、任意である。
次にCPU101は、ステップS124に進み、検査サンプル中に存在する抗生物薬に対する耐性遺伝子の検出を行う。この処理は、上記1-3.のステップS8(図6)と同様であるから、上記1-3.のステップS8の説明をここに援用する。このステップは、任意である。
最後に、CPU101は、ステップS125に進み、感染の原因生物の第2の予測結果を出力する。この処理は、名称は異なるものの、上記1-3.のステップS9(図6)と同様であるから、上記1-3.のステップS9の説明をここに援用する。
2-3.予測プログラム1043を格納した記録媒体
予測プログラム1043は、記録媒体に記憶されていてもよい。すなわち、前記コンピュータプログラムは、ハードディスク、フラッシュメモリ等の半導体メモリ素子、光ディスク等の記録媒体に記憶される。また前記コンピュータプログラムは、クラウドサーバ等のネットワークで接続可能な記録媒体に記憶されていてもよい。コンピュータプログラムは、ダウンロード形式の、又は記録媒体に記憶されたプログラム製品であってもよい。
前記記録媒体へのプログラムの記憶形式は、前記提示装置が前記プログラムを読み取り可能である限り制限されない。前記記録媒体への記憶は、不揮発性であることが好ましい。
3.効果の検証
3-1.NGS解析
(1)実験室内(Wet)
1.サンプル調製と核酸抽出
臨床サンプルは液体の場合140μL、固体の場合、滅菌生理食塩水に溶解し液体として140μLを核酸抽出として使用した。溶解しない場合はサンプル溶液にビーズ破砕を加え破砕した。
(A)DNA
QIAamp UCP Pathogen Mini Kit (Qiagen, Hilden, Germany)によりDNA抽出を行った。
(B)RNA
Nucleospin RNA (Macherey-Nagel)によりRNA抽出を行った。Ovation RNA-Seq system v2(NuGen)によりRNAをcDNA化した。
2.サンプルのライブラリ調製
ライブラリとは解析目的のサンプルに含まれていた核酸由来である挿入配列をシークエンス機器に認識されるアダプター配列によって挟み込んだ配列である。Nextera XT library Prep Kit (Illumina, San Diego, CA, USA)によって作成した。これは、サンプルに含まれていた核酸をtransposaseによりランダムに断片化、アダプター配列の付加を行うことでライブラリを作成する試薬である。なお、調製時にアダプター付加目的にPCR反応を行った。
3.調製されたライブラリの品質評価
ライブラリの品質評価のために以下の3ステップが行われる。
この3ステップを経てシークエンス可能なライブラリと評価できた場合下記4.へ進む。
(A)核酸濃度の測定
Qubit dsDNA BR Assay Kit (Thermo Fisher Scientific, Waltham, MA, USA)を使用し、調製したライブラリの核酸としての濃度を測定した。
(B)ライブラリ濃度の測定
QX200TM Droplet Digital PCR System (Bio-rad, Richmond, CA, USA)使用し、アダプター配列をプライマーとしてddPCRを行うことでアダプター配列が付加されているシークエンス可能なライブラリの濃度を測定した。
(C)ライブラリ中の挿入配列の測定
Bioanalyzer high sensitivity DNA assays (Agilent, Santa Clara, CA, USA)を使用し、ライブラリ長を測定した。
4.サンプルのシークエンス
Illumina社のショートリードシークエンサーでシークエンスを行った。
5.二項ロジスティック回帰式
非特許文献5に記載された、血液培養で微生物感染が陽性であり、かつ原因微生物が特定された患者の血漿を用いて、上記式1に示す二項ロジスティック回帰式の係数a、b、cを算出した。係数は、Taxonomic rankごとに算出した。
式は以下のとおりである。
1) Family rank:Zf=158.688*log10(${pRPM}) -43.257*${Hf} -332.649
2) Genus rank:Zg =165.848*log10(${pRPM}) -33.201*${Hg} -367.08
3) Species rank:Zs=-0.368*log10(${pRPM}) -20.075*${Hs} +51.439
これに式6を組み合わせ判別式とした。また、pRPMが200以上の生物種を感染の原因微生物とした。
また、学習データとして下記表1に示す学習データを使用した。
Figure 0007373843000009
メタゲノム解析データは7名の患者から取得した。学習データとして、7名の微生物検査により病原菌が特定された時点、治療開始し治癒した時点でデータを取得した。onsetサンプルは発症時に採取した血漿であり、培養検査によって表1に示す細菌が検出、証明された。Post-onsetは治療後の血漿であり、培養検査は施行されていないが、臨床上、治療上、血液中には細菌が存在しないと考えられたサンプルである。Post-onsetに記載されている菌名は、原因細菌に適切な抗菌薬を投与された患者の治療後のデータであることを指し、陰性コントロールとして適切であることを示している。
onsetサンプルについて得られた配列情報の解析により、各Taxonomic rank(今回ならばFamily、Genus、Species)ごとの結果を得た。表1において、各Taxonomic rankにおいて、培養法で証明された菌種の所属するTaxonomy名(種、属、科)が検出できていればPositiveとした。例えば、表1のL007では、Speciesがnegativeとなっている。これは、Bacillus(genus名)までは大量に検出されていたが、B.cereus(species名)はバックグラウンドで検出されている細菌と同程度であったため、negativeとラベルとした。
7.結果
(1)臨床実施例1
発熱性好中球減少症と診断された患者97例について血液培養を行い、感染の原因生物を特定できなかった87例を抽出した。87例の患者の血漿を検査サンプルとして、上記予測方法を適用した結果、15例について原因微生物を特定できた。
(2)臨床実施例2
培養で原因細菌が特定できなかった臨床嫉視例1には含まれない症例の予測結果を図1に示す。血液試料からTatlockia micdadeiが検出された。相対優占度、Coverage percentage及びaverage depth of mapped regionsを考慮すると感染の原因微生物として特定されたTatlockia micdadeiは、信頼性の高い結果であると考えられた。
(3)臨床実施例3
主訴が発熱のみの患者から、血液試料を採取し本予測方法を適用した。その結果、アデノウイルスを検出した。採血時当該患者にはアデノウイルス感染症を疑う所見はなかった。しかし、その後、肝機能異常と血尿の症状等のアデノウイルス感染を疑う所見が現れ、PCR検査によってアデノウイルス感染症と診断された。本例は、本予測方法により迅速診断ができた例である。
(4)臨床実施例4
本症例は、名古屋大学医学部附属病院にて、神経芽細胞腫を治療するために臍帯血移植を受けた10歳の患者であり、表1においてPatient_ID B07で示される。移植後、患者は、発熱と悪寒を発症し、血流感染症が疑われた。症状の発症直後から、患者は、セファロスポリン系抗生物質であるセフォゾプランを投与された。セフォゾプラン治療開始後も発熱が持続したため、セフタジジムが追加投与された。表1に示すように血液試料のNGS解析によりStenotrophomonas maltophiliaが感染の原因生物であると予測された。発症から4日後、カテーテルを除去しカテーテル先端の細菌培養検査を行ったところStenotrophomonas maltophiliaが検出された。患者はカテーテルを抜いた後に回復した。
(5)臨床実施例5
本症例は、名古屋大学医学部附属病院にて、神経芽細胞腫を治療するために臍帯血移植を受けた8歳の患者であり、表1においてPatient_ID B10で示される。移植後、患者は、発熱と悪寒を発症し、血流感染症が疑われた。症状の発症直後から、患者は、セファロスポリン系抗生物質であるセフォゾプランを投与された。表1に示すように血液試料のNGS解析によりSphingomonas paucimobilisが感染の原因生物であると予測された。発症から4日後、カテーテルを除去しカテーテル先端の細菌培養検査を行ったところSphingomonas paucimobilisが検出された。患者はカテーテルを抜いた後に回復した。
以上の結果から、本予測方法は、感染の原因生物の決定、及び感染の予測に有効であると考えられた。
10 予測装置
101 処理部

Claims (13)

  1. 検査対象の生物であるホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測装置であって、
    前記予測装置は、処理部を備え、
    前記処理部は、
    前記ホストに由来する検査サンプル中に存在する複数のポリヌクレオチドのそれぞれについて配列情報を取得し、
    前記取得した配列情報のうち、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報に、前記異種生物由来配列情報から推定される生物種を示すラベルを付与し、
    前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応する配列情報のリード数とホスト以外に検出された異種生物の種の多様性指数とを算出し、
    ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成し、
    前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルとして決定し、
    感染の原因生物の予測結果を出力する、
    前記予測装置。
  2. 前記生物種を示すラベルが、生物種の科名、属名、及び種名のそれぞれを個別に示すラベルである、
    請求項1に記載の予測装置。
  3. 前記処理部は、
    系統推定、及び/又は参照配列へのマッピングによって、前記異種生物由来配列情報から生物種を示すラベルを推定する、請求項1又は2に記載の予測装置。
  4. 前記処理部は、
    系統推定、及び/又は参照配列へのマッピングによって、生物種を示すラベルを推定できなかった前記異種生物由来配列情報について、既知ヌクレオチド配列との相同性検索を行い生物種を示すラベルを推定し、
    系統推定、及び/又は参照配列へのマッピングによって、前記異種生物由来配列情報から推定した生物種を示すラベルと併せて、ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成する、請求項1又は2に記載の予測装置。
  5. 前記処理部は、
    系統推定によって、前記異種生物由来配列情報から生物種を示すラベルを推定し、予測結果を第1の予測結果として出力する、請求項1又は2に記載の予測装置。
  6. 前記処理部は、
    系統推定によって、生物種を示すラベルを推定できなかった前記異種生物由来配列情報について、既知ヌクレオチド配列との相同性検索を行い生物種を示すラベルを推定し、
    前記系統推定によって、前記異種生物由来配列情報から推定した生物種を示すラベルと併せて、ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成し、予測結果を第2の予測結果として出力する、請求項1又は2に記載の予測装置。
  7. 前記予測結果が、前記感染の原因生物を示すラベルに対応するリード数及び相対優占度の組み合わせで示される、
    請求項1から6のいずれか一項に記載の予測装置。
  8. 前記処理部は、
    生物種の科名、属名、又は種名を示すラベルと、各ラベルに対応するリード数とがKronaチャートにより示される解析レポートを生成する、
    請求項1から6のいずれか一項に記載の予測装置。
  9. 前記処理部は、
    前記生物種を示すラベルに対応するリード数を示す第1の軸と、前記ホスト以外の生物種の多様性指数を示す第2の軸を有するプロット領域であって、前記ロジスティック回帰分析式を二次元回帰式に変換し求められる回帰直線を備えるプロット領域を生成し、
    前記プロット領域に、前記感染の原因生物である可能性を示すデータを生成したときのリード数と多様性指数の座標を示した二次元プロット図を生成し、
    前記二次元プロット図で示される解析レポートを生成する、
    請求項1から6のいずれか一項に記載の予測装置。
  10. 前記処理部は、
    前記感染の原因生物を示すラベルに対応する前記異種生物由来配列情報を含む参照配列を配列データベースから検索し、
    前記検査サンプルから取得された、前記感染の原因生物を示すラベルに対応する配列情報の全てを前記参照配列にマッピングし、
    前記検査サンプルから取得された、前記感染の原因生物を示すラベルに対応する参照配列のうちどれだけの配列長が前記感染の原因生物を示すラベルを付された配列情報から解読されたかを示すcoverage percentageを算出し、
    さらに、前記解読された配列長が何回繰り返して解読されたかを示す値の平均値を示すaverage depth of mapped regionsを算出し、
    前記感染の原因生物を示すラベルと共に、前記参照配列の識別子と、前記coverage percentageと、前記average depth of mapped regionsを出力する、
    請求項1から9のいずれか一項に記載の予測装置。
  11. 前記処理部は、
    さらに、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報の群から、抗生物薬に対する耐性遺伝子に由来するリードを検出し、検出されたリードに対応する耐性遺伝子を示すラベルを出力する、
    請求項1から10のいずれか一項に記載の予測装置。
  12. 検査対象の生物であるホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測方法であって、
    前記ホストに由来する検査サンプル中に存在する複数のポリヌクレオチドのそれぞれについて配列情報を取得することと、
    前記取得した配列情報のうち、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報に、前記異種生物由来配列情報から推定される生物種を示すラベルを付与することと、
    前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応するリード数とホスト以外に検出された異種生物の種の多様性指数とを算出することと、
    ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成し、
    前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルとして決定すること、
    を含む、
    前記予測方法。
  13. コンピュータに実行させたときに、
    コンピュータに、
    検査対象の生物であるホストに由来する検査サンプル中に存在する複数のポリヌクレオチドのそれぞれについて配列情報を取得するステップと、
    前記取得した配列情報のうち、前記ホスト以外の異種生物に存在するポリヌクレオチドをコードする異種生物由来配列情報に、前記異種生物由来配列情報から推定される生物種を示すラベルを付与するステップと、
    前記生物種を示すラベルが付与された異種生物由来配列情報の群に基づいて、前記各生物種を示すラベルに対応するリード数とホスト以外に検出された異種生物の種の多様性指数とを算出するステップと、
    ロジスティック回帰分析式を使って、前記算出したリード数と多様性指数に基づいて、各生物種を示すラベルについて感染の原因生物である可能性を示すデータを生成するステップと、
    前記感染の原因生物である可能性を示すデータが感染の原因生物であることを示唆し、かつリード数が一定数以上である生物種を示すラベルを、感染の原因生物を示すラベルと決定するステップと、
    予測結果を出力するステップと、
    を実行させる、
    前記ホスト又は前記ホストの生存環境における感染の原因生物を予測するための予測プログラム。
JP2019229363A 2019-12-19 2019-12-19 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法 Active JP7373843B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019229363A JP7373843B2 (ja) 2019-12-19 2019-12-19 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019229363A JP7373843B2 (ja) 2019-12-19 2019-12-19 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法

Publications (2)

Publication Number Publication Date
JP2021093999A JP2021093999A (ja) 2021-06-24
JP7373843B2 true JP7373843B2 (ja) 2023-11-06

Family

ID=76429693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019229363A Active JP7373843B2 (ja) 2019-12-19 2019-12-19 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法

Country Status (1)

Country Link
JP (1) JP7373843B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007522819A (ja) 2004-02-20 2007-08-16 ザ レジェンツ オブ ザ ユニバーシティー オブ カリフォルニア 唾液mRNAプロファイリング、バイオマーカーならびに関連した方法およびキット
JP2010522554A (ja) 2007-03-27 2010-07-08 ロゼッタ ゲノミックス エルティーディー. 癌の分類のための遺伝子発現サイン
US20140257710A1 (en) 2013-03-07 2014-09-11 Ofek Eshkolot Research And Development Ltd. Method and system for analyzing the taxonomic composition of a metagenome in a sample
JP2016518822A (ja) 2013-03-15 2016-06-30 コスモシド インク.Cosmosid Inc. アセンブルされていない配列情報、確率論的方法、及び形質固有(trait−specific)のデータベースカタログを用いた生物材料の特性解析

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007522819A (ja) 2004-02-20 2007-08-16 ザ レジェンツ オブ ザ ユニバーシティー オブ カリフォルニア 唾液mRNAプロファイリング、バイオマーカーならびに関連した方法およびキット
JP2010522554A (ja) 2007-03-27 2010-07-08 ロゼッタ ゲノミックス エルティーディー. 癌の分類のための遺伝子発現サイン
US20140257710A1 (en) 2013-03-07 2014-09-11 Ofek Eshkolot Research And Development Ltd. Method and system for analyzing the taxonomic composition of a metagenome in a sample
JP2016518822A (ja) 2013-03-15 2016-06-30 コスモシド インク.Cosmosid Inc. アセンブルされていない配列情報、確率論的方法、及び形質固有(trait−specific)のデータベースカタログを用いた生物材料の特性解析

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Horiba, K. et al.,Comprehensive detection of pathogens in immunocompromised children with bloodstream infections by next-generation sequencing,Scientific Reports,2018年02月28日,Vol. 8, No. 3784,pp. 1-9
Ondov, B.D. et al.,Interactive metagenomic visualization in a Web browser,BMC Bioinformatics,2011年09月30日,Vol. 12, No. 385,pp. 1-9

Also Published As

Publication number Publication date
JP2021093999A (ja) 2021-06-24

Similar Documents

Publication Publication Date Title
Zhang et al. Understanding UCEs: a comprehensive primer on using ultraconserved elements for arthropod phylogenomics
RU2704286C2 (ru) Подавление ошибок в секвенированных фрагментах днк посредством применения избыточных прочтений с уникальными молекулярными индексами (umi)
Ghosh et al. Transformation of animal genomics by next-generation sequencing technologies: a decade of challenges and their impact on genetic architecture
JP7067896B2 (ja) 品質評価方法、品質評価装置、プログラム、および記録媒体
Plassais et al. Natural and human-driven selection of a single non-coding body size variant in ancient and modern canids
Sales et al. KrillDB: A de novo transcriptome database for the Antarctic krill (Euphausia superba)
JP2020533688A (ja) Hla組織照合およびそのための方法
Baker et al. Whole lung tissue is the preferred sampling method for amplicon-based characterization of murine lung microbiota
Zhang et al. Genome-wide comparative analyses reveal selection signatures underlying adaptation and production in Tibetan and Poll Dorset sheep
Castañeda-Rico et al. Ancient DNA from museum specimens and next generation sequencing help resolve the controversial evolutionary history of the critically endangered Puebla deer mouse
Franco‐Sierra et al. Rapid mitochondrial genome sequencing based on Oxford Nanopore Sequencing and a proxy for vertebrate species identification
Lippolis et al. Symposium review: Omics in dairy and animal science—Promise, potential, and pitfalls
CN113889187A (zh) 单样本等位基因拷贝数变异检测方法、探针组和试剂盒
CN115701286A (zh) 使用无循环mRNA谱分析检测阿尔茨海默病风险的系统和方法
Hu et al. The electronic tree of life (eToL): a net of long probes to characterize the microbiome from RNA-seq data
Waits et al. The utility of reptile blood transcriptomes in molecular ecology
US6996477B2 (en) Computational subtraction method
Langsiri et al. Targeted sequencing analysis pipeline for species identification of human pathogenic fungi using long-read nanopore sequencing
CN112331268B (zh) 目标物种特有序列的获取方法及目标物种检测方法
JP7373843B2 (ja) 感染の原因生物を予測するための予測装置、予測プログラム及び予測方法
Guo et al. Identification of putative effector genes across the GWAS Catalog using molecular quantitative trait loci from 68 tissues and cell types
Srivastava et al. Genome resources for the ex-type of Phytophthora citricola, and well-authenticated isolates of P. hibernalis, P. nicotianae, and P. syringae
CN116802313A (zh) 用于宏基因组学分析的方法和系统
Wang et al. PHARP: A pig haplotype reference panel for genotype imputation
JP6902258B2 (ja) 被験者のhla遺伝子のアレルペアを判定する方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230929

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231010

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231017

R150 Certificate of patent or registration of utility model

Ref document number: 7373843

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150