JP2021193963A - 遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラム - Google Patents

遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラム Download PDF

Info

Publication number
JP2021193963A
JP2021193963A JP2020104040A JP2020104040A JP2021193963A JP 2021193963 A JP2021193963 A JP 2021193963A JP 2020104040 A JP2020104040 A JP 2020104040A JP 2020104040 A JP2020104040 A JP 2020104040A JP 2021193963 A JP2021193963 A JP 2021193963A
Authority
JP
Japan
Prior art keywords
gene
information
microorganisms
search
possessed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020104040A
Other languages
English (en)
Inventor
悟志 湯原
Satoshi Yuhara
祐馬 岡
Yuma Oka
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HU Group Research Institute GK
Original Assignee
HU Group Research Institute GK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by HU Group Research Institute GK filed Critical HU Group Research Institute GK
Priority to JP2020104040A priority Critical patent/JP2021193963A/ja
Publication of JP2021193963A publication Critical patent/JP2021193963A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

【課題】対象となる微生物種等の情報を設定するだけで当該対象に特異的な遺伝子情報を検索することができ、延いては、微生物検出に最適な核酸プローブを簡易に設計可能とすることに貢献する遺伝子検索装置等を提供すること。【解決手段】核酸プローブ設計を支援するための遺伝子検索装置は、所定の複数の微生物における所定の複数の遺伝子の保有数と、当該所定の複数の微生物の系統情報と、を含む保有遺伝子データテーブルから、設定された系統情報に紐付く微生物が共通して保有し、且つ、当該テーブルで管理されている、当該微生物以外の全ての微生物における保有率が下位の遺伝子を検索する。【選択図】図1

Description

本発明は、核酸プローブ設計を支援するための、遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラムに関する。
マイクロバイオーム研究では、次世代シーケンサー(NGS:Next Generation Sequencer)と呼ばれる超並列シーケンサーを用いた網羅的解析が主流である。また、当該網羅的解析は微生物や遺伝子のスクリーニング手法として強力である。
一方で、検出対象となる菌種が定まった後には、PCR(Polymerase chain reaction)などの別の測定手法により遺伝子の検出が行われるようになることが考えられる。
なお、遺伝子抽出に関連する先行技術文献として、非特許文献1および非特許文献2が挙げられる。非特許文献1には、ウイルスに特徴的な遺伝子を抽出し、当該抽出した遺伝子を未知のウイルスの分類に使用する技術が開示されている。非特許文献2には、対象となる生物種のゲノム中の保存配列のみを抽出し、当該抽出した保存配列を対象にプライマーを設計する技術が開示されている。
Taxonomic assignment of uncultivated prokaryotic virus genomes is enabled by gene-sharing networks. Nature Biotechnology (2019) DOI: 10.1038/s41587-019-0100-8 HiMAP: Robust phylogenomics from highly multiplexed amplicon sequencing. Molecular Ecology Resources (2018) doi:10.1111/1755-0998.12783
例えば、検出対象となる菌に特異的な遺伝子(例えば病原性遺伝子など)を対象にプライマーを設計する場合、当該遺伝子を検索するにあたって、菌ごとに深い事前知識と文献調査が必要となる。また、例えば、多くの菌が有する遺伝子(例えば生育必須遺伝子など)を対象にプライマーを設計する場合、特異性を確保することが困難である。
本発明は、対象となる微生物種等の情報を設定するだけで当該対象に特異的な遺伝子情報を検索することができ、延いては、微生物検出に最適な核酸プローブを簡易に設計可能とすることに貢献する遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明に係る遺伝子検索装置は、核酸プローブ設計を支援するための、制御部を備える遺伝子検索装置であって、所定の複数の微生物における所定の複数の遺伝子の保有数と、前記所定の複数の微生物の系統情報と、を含む保有遺伝子情報にアクセス可能であり、前記制御部は、設定された系統情報に紐付く微生物が共通して保有し、且つ、前記保有遺伝子情報で管理されている、前記微生物以外の全ての微生物における保有率が下位の遺伝子を、前記保有遺伝子情報から検索する検索手段を備える。
ここで、核酸プローブとは、標的核酸とハイブリダイズし得る核酸分子である。標的核酸とは、検出対象となる微生物に特異的な遺伝子をコードする核酸である。核酸プローブは、概念的に、核酸増幅法におけるプライマーやCRISPR(Clustered Regularly Interspaced Shot Palindromic Repeat)-CAS(CRISPR-associated protein)システムなどにおけるガイド、核酸検査におけるプローブなどを含む。核酸プローブは、標的核酸と異なる核酸から構成されてもよい。標的核酸と異なる核酸から核酸プローブが構成されるとは、標的核酸の主鎖構造(糖部分およびリン酸部分から構成される構造)と異なる主鎖構造を、主鎖構造の一部または全体として核酸プローブが有することを意味する。例えば、標的核酸がDNAである場合、標的核酸とは異なる核酸の核酸プローブとしては、DNAプローブ以外の核酸プローブ(例えばRNAプローブ)を用いることができる。
なお、本発明に係る遺伝子検索装置において、前記所定の複数の微生物および前記系統情報は、全ゲノム解析結果から得られたものでもよく、前記所定の複数の遺伝子は、前記全ゲノム解析結果に登録されている前記所定の複数の微生物の全ゲノム配列から各全ゲノム配列上の遺伝子領域配列を予測し、前記予測した各遺伝子領域配列の機能アノテーションを行うことによって決定されたものでもよい。
また、本発明に係る遺伝子検索装置において、前記保有遺伝子情報は、さらに、メタゲノム解析を行うことによって得られた微生物叢由来の単一または複数のコンティグ配列における前記所定の複数の遺伝子の保有数と、前記単一または複数のコンティグ配列が属するグループのグループ情報であって系統情報に相当するものと、を含んでもよく、前記検索手段は、設定されたグループ情報で特定されるグループが共通して保有し、且つ、前記保有遺伝子情報で管理されている、前記グループ以外の全てのコンティグ配列と全ての微生物における保有率が下位の遺伝子を、前記保有遺伝子情報から検索してもよい。
また、本発明に係る遺伝子検索装置において、前記設定されたグループ情報は、完全性を有するコンティグ配列が属するグループのグループ情報でもよい。
また、本発明に係る遺伝子検索装置において、前記完全性は、単一コピー遺伝子セットの保有率とコンタミネーション率で定義されるものでもよい。
また、本発明に係る遺伝子検索装置において、前記グループ情報は、塩基組成とデータカバレッジに関する情報を基に前記複数のコンティグ配列のビニング(binning)を行った結果得られたビン(bin)の識別情報でもよい。
また、本発明に係る遺伝子検索装置において、前記検索手段は、前記保有率が最下位の遺伝子を検索してもよい。
また、本発明に係る遺伝子検索装置において、前記微生物は、細菌、ウイルスまたは真菌でもよい。
また、本発明に係る遺伝子検索方法は、制御部を備える情報処理装置において実行される、核酸プローブ設計を支援するための遺伝子検索方法であって、所定の複数の微生物における所定の複数の遺伝子の保有数と、前記所定の複数の微生物の系統情報と、を含む保有遺伝子情報にアクセス可能な前記情報処理装置の前記制御部において実行される、設定された系統情報に紐付く微生物が共通して保有し、且つ、前記保有遺伝子情報で管理されている、前記微生物以外の全ての微生物における保有率が下位の遺伝子を、前記保有遺伝子情報から検索する検索ステップを含む。
また、本発明に係る遺伝子検索プログラムは、制御部を備える情報処理装置において実行させるための、核酸プローブ設計を支援するための遺伝子検索プログラムであって、所定の複数の微生物における所定の複数の遺伝子の保有数と、前記所定の複数の微生物の系統情報と、を含む保有遺伝子情報にアクセス可能な前記情報処理装置の前記制御部において実行させるための、設定された系統情報に紐付く微生物が共通して保有し、且つ、前記保有遺伝子情報で管理されている、前記微生物以外の全ての微生物における保有率が下位の遺伝子を、前記保有遺伝子情報から検索する検索ステップを含む。
本発明は、対象となる微生物種等の情報を設定するだけで当該対象に特異的な遺伝子情報を検索することができ、延いては、微生物検出に最適な核酸プローブを簡易に設計可能とすることに貢献する、という効果を奏する。
図1は、遺伝子検索装置100の構成の一例を示すブロック図である。 図2は、保有遺伝子データテーブル106aの一例を示す図である。 図3は、増幅産物の解析結果を示す図である。 図4は、増幅産物の解析結果を示す図である。 図5は、取得したデータから得られた相対定量値の算出結果とショットガンシーケンシングで得られた定量結果との比較結果を示す図である。
以下に、本発明に係る遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラムの実施形態を、図面を参照して説明する。なお、本実施形態により本発明が限定されるものではない。
図1は、遺伝子検索装置100の構成の一例を示すブロック図である。遺伝子検索装置14は、CPU(Central Processing Unit)等の当該装置を統括的に制御する制御部102と、当該装置を有線または無線の通信回線を介してインターネットなどのネットワーク300に通信可能に接続する通信インターフェース部104と、各種のデータベース、テーブルまたはファイルなどを記憶可能な記憶部106と、入力装置112および出力装置114に接続する入出力インターフェース部108と、を備える。遺伝子検索装置100が備える各部は、任意の通信路を介して通信可能に接続される。
入力装置112には、キーボード、マウスまたはマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタ、または、タッチパネルなどを用いることができる。出力装置114には、モニタの他、スピーカまたはプリンタなどを用いることができる。
記憶部106は、ストレージ手段である。記憶部106として、例えば、RAM(Random Access Memory)・ROM(Read Only Memory)等のメモリ装置、ハードディスクのような固定ディスク装置、フレキシブルディスク、または光ディスク等を用いることができる。記憶部106には、OS(Operating System)と協働してCPUに命令を与えて各種処理を行うためのコンピュータプログラムが記録されていてもよい。
記憶部106は、例えば、保有遺伝子データテーブル106a(本発明の保有遺伝子情報に相当)などを格納する。保有遺伝子データテーブル106aは、例えば、遺伝子検索装置100がネットワーク300を介してアクセス可能な外部DB(データベース)200に格納されてもよい。
図2は、保有遺伝子データテーブル106aの一例を示す図である。保有遺伝子データテーブル106aには、所定の複数の微生物(株)のそれぞれに対応する微生物レコードが格納されている。各々の微生物レコードには、微生物識別情報と、微生物識別情報で特定される微生物における所定の複数の遺伝子のそれぞれの保有数と、微生物識別情報で特定される微生物の系統情報が格納されている。各々の微生物レコードには、所定の複数の遺伝子のそれぞれに対応する遺伝子識別情報と保有数が格納されている。
微生物は、例えば、細菌、ウイルスまたは真菌などである。微生物識別情報は、例えば、微生物名または微生物IDなどである。微生物識別情報で特定される微生物における所定の複数の遺伝子のそれぞれの保有数とは、具体的には、微生物識別情報で特定される微生物の全ゲノム配列が所定の複数の遺伝子領域配列のそれぞれを保有する数である。遺伝子検索装置100は、当該保有数を集計する情報処理機能を備えてもよい。遺伝子識別情報は、例えば遺伝子名または遺伝子IDなどである。系統情報は、例えば、生物種名または生物種IDなどである。
所定の複数の微生物および系統情報は、公共のデータベース(例えばNCBI(National Center for Biotechnology Information)が公開しているゲノムデータベースまたはNCBIが公開しているTaxonomyデータベースなど)または全ゲノム解析結果から取得されたものでもよい。遺伝子検索装置100は、当該取得を実行する情報処理機能を備えてもよい。
所定の複数の遺伝子は、公共のデータベース(例えばNCBIが公開しているゲノムデータベースなど)または全ゲノム解析結果に登録されている、所定の複数の微生物の全ゲノム配列から、各全ゲノム配列上の遺伝子領域配列を予測し、予測した各遺伝子領域配列の機能アノテーションを行うことによって決定されたものでもよい。予測した各遺伝子領域配列の機能アノテーションは、例えば、予測した各遺伝子領域配列と公共のデータベース(例えばKO(KEGG(Kyoto Encyclopedia of Genes and Genomes) Orthology)データベースなど)に登録されている遺伝子領域配列との相同性検索の結果に基づく機能アノテーションでもよい。遺伝子検索装置100は、当該予測および当該機能アノテーションを実行する情報処理機能を備えてもよい。
保有遺伝子データテーブル106aには、さらに、メタゲノム解析を行うことによって得られた微生物叢由来の単一または複数のコンティグ配列のそれぞれに対応するコンティグ配列レコードが格納されていてもよい。各々のコンティグ配列レコードには、コンティグ配列識別情報と、コンティグ配列識別情報で特定されるコンティグ配列における所定の複数の遺伝子のそれぞれの保有数と、コンティグ配列識別情報で特定されるコンティグ配列が属するグループのグループ情報であって系統情報に相当するものと、が格納されている。
コンティグ配列識別情報は、例えば、コンティグ配列に付与された配列名または配列IDなどである。コンティグ配列識別情報で特定されるコンティグ配列における所定の複数の遺伝子のそれぞれの保有数とは、具体的には、コンティグ配列識別情報で特定されるコンティグ配列が所定の複数の遺伝子領域配列のそれぞれを保有する数である。遺伝子検索装置100は、当該保有数を集計する情報処理機能を備えてもよい。
グループ情報は、グループを識別するための識別情報(例えばグループ名またはグループID)であり、例えば、塩基組成とデータカバレッジに関する情報を基に複数のコンティグ配列のビニング(binning)を行った結果得られたビン(bin)の識別情報(例えばbin名またはbinIDなど)などである。遺伝子検索装置100は、当該ビニングを実行する情報処理機能を備えてもよい。
制御部102は、OS等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部102は、検索部102aを備える。
検索部102aは、「オペレータにより設定された系統情報に紐付く微生物」(検出対象)が共通して保有し、且つ、「保有遺伝子データテーブル106aで管理されている、当該微生物以外の全ての微生物」(非検出対象)における保有率が下位の遺伝子を、保有遺伝子データテーブル106aから検索し、当該検索した遺伝子に関する情報(例えば遺伝子識別情報と保有率など)を出力装置114に出力する。
検索部102aは、「オペレータにより設定されたグループ情報で特定されるグループ」(検出対象)が共通して保有し、且つ、「保有遺伝子データテーブル106aで管理されている、当該グループ以外の全てのコンティグ配列と全ての微生物」(非検出対象)における保有率が下位の遺伝子を、保有遺伝子データテーブル106から検索してもよい。
設定されたグループ情報は、例えば、完全性を有するコンティグ配列が属するグループのグループ情報などでもよい。完全性は、例えば、所定値(例えば95%など)以上または超の単一コピー遺伝子セットの保有率と所定値(例えば5%など)以下または未満のコンタミネーション率で定義されるものなどでもよい。遺伝子検索装置100は、当該完全性の確認を実行する情報処理機能を備えてもよい。
検索部102aは、保有率がオペレータにより設定された所定値以下または未満の遺伝子を検索してもよい。所定値は、例えば、0.05、0.01、0.005、0.001などといった小さな値を設定しておくのが好ましいが、例示したこれらの値に限定されるものではない。
検索部102aは、保有率が最下位の遺伝子を検索してもよい。
実施例1では、Akkermansia muciniphila(A.muciniphila)という細菌に特異的な遺伝子を遺伝子検索装置100で検索し、当該検索した遺伝子を対象にプライマーを設計し、当該設計したプライマーを用いて当該遺伝子が実際に検出できるかを検証した。検証は、以下の工程(工程11〜13)で行った。
[工程11.公共データベースを用いてデータテーブルを作成する工程]
以下の手順(手順111〜117)で保有遺伝子データテーブルを作成した。なお、図2に示した保有遺伝子データテーブルは、以下の手順で実際に作成されたものである。
[手順111]NCBIが公開しているゲノムデータベースから、計11,596株の微生物の全ゲノム配列をダウンロードした。
[手順112]遺伝子予測ソフトウェア「Prokka」を用いて、ダウンロードした各全ゲノム配列上における遺伝子領域配列を予測した。これにより、計11,596件の全ゲノム配列のそれぞれに対し、遺伝子領域が紐付けられた。
[手順113]相同性検索ソフトウェア「DIAMOND」を用いて、予測した各遺伝子領域の配列の相同性検索を、遺伝子配列データベース「KO(KEGG Orthology)データベース」に対し行うことによって、各遺伝子領域のアノテーションを行った。これにより、予測した全ての遺伝子領域のそれぞれに対し、機能分類が紐付けられた。
[手順114]各遺伝子領域の機能分類ごとに、遺伝子IDを付与した。これにより、予測した全ての遺伝子領域のそれぞれに対し、遺伝子IDが紐付けられた。
[手順115]ダウンロードした全ゲノム配列ごとに、付与した全ての遺伝子IDのそれぞれの保有数を集計した。
[手順116]NCBIが公開しているTaxonomyデータベースを参照して、ダウンロードした全ゲノム配列ごとに系統情報(生物種名)を付与した。
[手順117]ダウンロードした各全ゲノム配列についての、集計した各遺伝子IDの保有数と付与した系統情報とを含む保有遺伝子データテーブルを作成した。
[工程12.A.muciniphilaに特異的な遺伝子領域を抽出する工程]
以下の手順(手順121〜125)でA.muciniphilaに特異的な遺伝子領域を抽出した。
[手順121]工程11で作成した保有遺伝子データテーブルを記憶する遺伝子検索装置100を用いて、検出対象となる「A.muciniphilaの全ての株」が共通して保有し、且つ、非検出対象となる「保有遺伝子データテーブルで管理されている、A.muciniphila以外の全ての微生物」の保有率が0.005未満の遺伝子IDを検索した。検索結果を表1に示す。なお、A.muciniphilaの株はNCBIのゲノムデータベース中に2つ存在した。
Figure 2021193963
[手順122]検索した遺伝子IDのうち非検出対象における保有率が最も低い遺伝子ID「K10800」に対応する遺伝子領域配列を、ダウンロードしたA.muciniphilaの全ゲノム配列から抽出した。
[手順123]コンセンサス配列作成プログラム「cons」を用いて、遺伝子ID「K10800」に対応する抽出した遺伝子領域配列に対しコンセンサス配列を作成した。
[手順124]プライマー設計プログラム「Primer3」を用いて、作成したコンセンサス配列に対しプライマー配列セットを作成した。作成したフォワードプライマー配列は、「5’−CTGCTTTCCCTCATCACCAT−3’」(配列番号1)であり、リバースプライマー配列は、「5’−ATGCCCAGTTCCTTAAGCTG−3’」(配列番号2)である。配列番号1の塩基配列は、A.muciniphilaに特異的な遺伝子(遺伝子ID「K10800」)検出用のフォワードプライマーの塩基配列を示す。配列番号2の塩基配列は、A.muciniphilaに特異的な遺伝子(遺伝子ID「K10800」)検出用のリバースプライマーの塩基配列を示す。
[手順125]相同性検索プログラム「Blast+」を用いて、設計したプライマー配列の相同性検索を、工程11でダウンロードした計11,596件の全ゲノム配列をデータベースとして行った。結果、設計したプライマー配列が前記非検出対象に存在しないことが確認された。
[工程13.A.muciniphilaに特異的な遺伝子を実験で検出する工程]
以下の手順(手順131〜134)でA.muciniphilaに特異的な遺伝子を実験で検出した。
[手順131]Thermo Fisher Scientific社製の「PureLink Microbiome DNA Purification kit」を用いて、A.muciniphilaの菌培養液(15mL)、ヒト糞便1検体(約3mg)およびヒト唾液1検体(約1mL)からDNAを抽出した。Qiagen社製の「QIAamp DNA Mini Kit」を用いて、ヒト全血1検体(約200μL)からDNAを抽出した。
[手順132]抽出した各DNAを用いて、10μLのPCR反応溶液を調製した。反応溶液の成分は以下の通りである。以下に列挙した計10の反応溶液を調製した。
<反応溶液の成分>
・抽出したDNA:1μL
・New England Biolabs社製の「NEBNext Q5 Hot Start HiFi 2X Master Mix」:5μL
・10μMに調製されたフォワードプライマー(配列番号1):0.5μL
・10μMに調製されたリバースプライマー(配列番号2):0.5μL
・精製水:3μL
<調製した反応溶液>
・A.muciniphilaの菌培養液由来のDNAを用いた反応溶液1
・血液由来のDNAを用いた反応溶液2
・血液由来のDNAを用いた反応溶液にA.muciniphilaの菌培養液由来のDNAが0.01%混合された反応溶液3
・血液由来のDNAを用いた反応溶液にA.muciniphilaの菌培養液由来のDNAが0.1%混合された反応溶液4
・糞便由来のDNAを用いた反応溶液5
・糞便由来のDNAを用いた反応溶液にA.muciniphilaの菌培養液由来のDNAが0.01%混合された反応溶液6
・糞便由来のDNAを用いた反応溶液にA.muciniphilaの菌培養液由来のDNAが0.1%混合された反応溶液7
・唾液由来のDNAを用いた反応溶液8
・唾液由来のDNAを用いた反応溶液にA.muciniphilaの菌培養液由来のDNAが0.01%混合された反応溶液9
・唾液由来のDNAを用いた反応溶液にA.muciniphilaの菌培養液由来のDNAが0.1%混合された反応溶液10
[手順133]調製したPCR反応溶液を用いてPCRを実施した。PCRには、Thermo Fisher Scientific社製のサーマルサイクラー「Veriti」を用いた。PCR反応条件は、98℃で30秒のインキュベーションを行った後、98℃10秒の熱変性、65℃15秒のアニーリングおよび72℃30秒の伸長反応を35サイクル行うというものである。
[手順134]増幅産物を、Agilent Technologies社製の全自動ハイスループット電気泳動システム「Agilent 4200 TapeStation」の「D1000 ScreenTape」を用いて解析した。解析結果を図3に示す。図3において、「L」はラダーを示し、「Am」は反応溶液1から得られた増幅産物の検出結果を示す。図3において、「Bl」は反応溶液2から得られた増幅産物の検出結果を示し、「Bl+0.01%Am」は、反応溶液3から得られた増幅産物の検出結果を示し、「Bl+0.1%Am」は、反応溶液4から得られた増幅産物の検出結果を示す。図3において、「St」は反応溶液5から得られた増幅産物の検出結果を示し、「St+0.01%Am」は、反応溶液6から得られた増幅産物の検出結果を示し、「St+0.1%Am」は、反応溶液7から得られた増幅産物の検出結果を示す。図3において、「Sa」は反応溶液8から得られた増幅産物の検出結果を示し、「Sa+0.01%Am」は、反応溶液9から得られた増幅産物の検出結果を示し、「Sa+0.1%Am」は、反応溶液10から得られた増幅産物の検出結果を示す。
実施例1により、遺伝子検索装置100で検索した遺伝子を対象に設計したプライマーで、対象となる菌が実際に検出できること、および、ヒトゲノムサンプルや多様な菌が存在するメタゲノムサンプルでは、当該プライマーで、対象となる菌が検出されないこと、が確認された。
実施例2では、メタゲノムサンプルを対象として、メタゲノム中の個別の菌種ごとに特異的な遺伝子を遺伝子検索装置100で検索し、当該検索した遺伝子を対象にプライマーを設計し、当該設計したプライマーを用いて当該遺伝子が実際に検出できるかを検証した。検証は、以下の工程(工程21〜24)で行った。
[工程21.メタゲノム解析結果からデータテーブルを作成する工程]
以下の手順(手順211〜218)で保有遺伝子データテーブルを作成した。
[手順211]Thermo Fisher Scientific社製の「PureLink Microbiome DNA Purification kit」を用いて、ヒト糞便5検体(それぞれ約3mg)からDNAを抽出した(Sample1〜Sample5)。Qiagen社製の「QIAamp DNA Mini Kit」を用いて、ヒト全血1検体(約200μL)からDNAを抽出した。
[手順212]抽出したDNAのうちSample1のDNAとSample2のDNAについて、illumina社製の「Nextera DNA Flex library prep kit」を用いて、シーケンシング解析用のライブラリーの調製を行った。
[手順213]illumina社製のNextSeqを用いて、調製したライブラリーのショットガンシーケンシング解析を行った。
[手順214]ゲノムアセンブラー「SPAdes」を用いて、手順213で取得した配列情報のアセンブル解析を行った。
[手順215]binningソフトウェア「MetaBAT2」を用いて、binningを行った。具体的には、塩基組成やデータカバレッジの情報を基に、同じ生物由来と考えられるコンティグ配列をグルーピングした。
[手順216]binningで生成されたグループを1単位として、グループごとに、手順112〜115と同様の手順を実施した。
[手順217]コンティグ配列ごとに、該当するグループを特定するための任意のID(bin名)を系統情報として付与した。
[手順218]各グループについての、集計した各遺伝子IDの保有数と付与した系統情報とを含むレコードを、工程11で作成した保有遺伝子データテーブルに結合した。
[工程22.メタゲノム中の個別の菌種ごとに特異的な遺伝子領域を抽出する工程]
以下の手順(手順221〜226)で、メタゲノム中の個別の菌種ごとに特異的な遺伝子領域を抽出した。
[手順221]完全性評価ソフトウェア「CheckM」を用いて、工程21で取得した全てのグループの完全性の評価を行い、完全性が95%以上で且つコンタミネーション率が5%以下のコンティグ配列のみをプライマーの設計対象に選んだ。選ばれた各グループのうち、Sample1由来のグループに付与されているbin名は、bin.33、bin.13、bin.43およびbin.18であり、Sample2由来のグループに付与されているbin名は、bin.14、bin.18、bin.52およびbin.11であった。
[手順222]手順221で得た8個のbin名のそれぞれに対し、以下の検索処理を実行して、bin名ごとに遺伝子IDを検索した。
<検索処理>
結合後の保有遺伝子データテーブルを記憶する遺伝子検索装置100を用いて、検出対象となる「bin名で特定されるグループ」が保有し、且つ、非検出対象となる「保有遺伝子データテーブルで管理されている、当該bin名で特定されるグループ以外の全てのコンティグ配列と全ての微生物」の保有率が0.05未満の遺伝子IDを検索する。
[手順223]前記8個のbin名のそれぞれに対し、手順222で検索した遺伝子IDのうち非検出対象における保有率が最も低い遺伝子IDの選択をさらに行い、当該選択した各遺伝子IDに対応する遺伝子領域配列を、各bin名に紐付くコンティグ配列から抽出した。前記8個のbin名のそれぞれに対応する、手順223で選択した遺伝子IDを表2に示す。
Figure 2021193963
[手順224]プライマー設計プログラム「Primer3」を用いて、前記8個のbin名のそれぞれに対応する、手順223で抽出した遺伝子領域配列に対し、プライマー配列セットを作成した。前記8個のbin名のそれぞれに対応する、作成したプライマー配列セットを表3に示す。
Figure 2021193963
配列番号3,4の塩基配列は、メタゲノム中のbin名「bin.13」に対応する菌種に特異的な遺伝子ID「K22330」に対応する遺伝子を検出するためのフォワードプライマーとリバースプライマーの塩基配列である。配列番号5,6の塩基配列は、メタゲノム中のbin名「bin.18」に対応する菌に特異的な遺伝子ID「K15303」に対応する遺伝子を検出するためのフォワードプライマーとリバースプライマーの塩基配列である。配列番号7,8の塩基配列は、メタゲノム中のbin名「bin.33」に対応する菌に特異的な遺伝子ID「K05942」に対応する遺伝子を検出するためのフォワードプライマーとリバースプライマーの塩基配列である。配列番号9,10の塩基配列は、メタゲノム中のbin名「bin.43」に対応する菌に特異的な遺伝子ID「K05942」に対応する遺伝子を検出するためのフォワードプライマーとリバースプライマーの塩基配列である。
配列番号11,12の塩基配列は、メタゲノム中のbin名「bin.11」に対応する菌に特異的な遺伝子ID「K15022」に対応する遺伝子を検出するためのフォワードプライマーとリバースプライマーの塩基配列である。配列番号13,14の塩基配列は、メタゲノム中のbin名「bin.14」に対応する菌に特異的な遺伝子ID「K18205」に対応する遺伝子を検出するためのフォワードプライマーとリバースプライマーの塩基配列である。配列番号15,16の塩基配列は、メタゲノム中のbin名「bin.18」に対応する菌に特異的な遺伝子ID「K22340」に対応する遺伝子を検出するためのフォワードプライマーとリバースプライマーの塩基配列である。配列番号17,18の塩基配列は、メタゲノム中のbin名「bin.52」に対応する菌に特異的な遺伝子ID「K22607」に対応する遺伝子を検出するためのフォワードプライマーとリバースプライマーの塩基配列である。
[手順225]相同性検索プログラム「Blast+」を用いて、前記8個のbin名のそれぞれに対応する設計したプライマー配列の相同性検索を、工程21で得た全てのコンティグ配列と工程11でダウンロードした計11,596件の全ゲノム配列をデータベースとして行った。その結果、設計したプライマー配列が前記非検出対象に存在しないことが確認された。
[工程23.メタゲノム中の個別の菌種ごとに特異的な遺伝子を実験で検出する工程]
以下の手順(手順231〜233)で、メタゲノム中の個別の菌種ごとに特異的な遺伝子を実験で検出した。
[手順231]手順211で抽出したDNAを用いて、10μLのPCR反応溶液を調製した。反応溶液の成分は以下の通りである。以下に列挙した計48の反応溶液を調製した。
<反応溶液の成分>
・抽出したDNA:1μL
・New England Biolabs社製の「NEBNext Q5 Hot Start HiFi 2X Master Mix」:5μL
・10μMに調製されたフォワードプライマー(表3に示す配列):0.5μL
・10μMに調製されたリバースプライマー(表3に示す配列):0.5μL
・精製水:3μL
<調製した反応溶液>
・Sample1由来のDNAとプライマーセットID「bin.13.K22330」のプライマーセットを用いた反応溶液1
・Sample2由来のDNAとプライマーセットID「bin.13.K22330」のプライマーセットを用いた反応溶液2
・Sample3由来のDNAとプライマーセットID「bin.13.K22330」のプライマーセットを用いた反応溶液3
・Sample4由来のDNAとプライマーセットID「bin.13.K22330」のプライマーセットを用いた反応溶液4
・Sample5由来のDNAとプライマーセットID「bin.13.K22330」のプライマーセットを用いた反応溶液5
・血液由来のDNAとプライマーセットID「bin.13.K22330」のプライマーセットを用いた反応溶液6
・Sample1由来のDNAとプライマーセットID「bin.18.K15303」のプライマーセットを用いた反応溶液7
・Sample2由来のDNAとプライマーセットID「bin.18.K15303」のプライマーセットを用いた反応溶液8
・Sample3由来のDNAとプライマーセットID「bin.18.K15303」のプライマーセットを用いた反応溶液9
・Sample4由来のDNAとプライマーセットID「bin.18.K15303」のプライマーセットを用いた反応溶液10
・Sample5由来のDNAとプライマーセットID「bin.18.K15303」のプライマーセットを用いた反応溶液11
・血液由来のDNAとプライマーセットID「bin.18.K15303」のプライマーセットを用いた反応溶液12
・Sample1由来のDNAとプライマーセットID「bin.33.K05942」のプライマーセットを用いた反応溶液13
・Sample2由来のDNAとプライマーセットID「bin.33.K05942」のプライマーセット用いた反応溶液14
・Sample3由来のDNAとプライマーセットID「bin.33.K05942」のプライマーセットを用いた反応溶液15
・Sample4由来のDNAとプライマーセットID「bin.33.K05942」のプライマーセットを用いた反応溶液16
・Sample5由来のDNAとプライマーセットID「bin.33.K05942」のプライマーセットを用いた反応溶液17
・血液由来のDNAとプライマーセットID「bin.33.K05942」のプライマーセットを用いた反応溶液18
・Sample1由来のDNAとプライマーセットID「bin.43.K05942」のプライマーセットを用いた反応溶液19
・Sample2由来のDNAとプライマーセットID「bin.43.K05942」のプライマーセット用いた反応溶液20
・Sample3由来のDNAとプライマーセットID「bin.43.K05942」のプライマーセットを用いた反応溶液21
・Sample4由来のDNAとプライマーセットID「bin.43.K05942」のプライマーセットを用いた反応溶液22
・Sample5由来のDNAとプライマーセットID「bin.43.K05942」のプライマーセットを用いた反応溶液23
・血液由来のDNAとプライマーセットID「bin.43.K05942」のプライマーセットを用いた反応溶液24
・Sample2由来のDNAとプライマーセットID「bin.11.K15022」のプライマーセットを用いた反応溶液25
・Sample3由来のDNAとプライマーセットID「bin.11.K15022」のプライマーセット用いた反応溶液26
・Sample4由来のDNAとプライマーセットID「bin.11.K15022」のプライマーセットを用いた反応溶液27
・Sample1由来のDNAとプライマーセットID「bin.11.K15022」のプライマーセットを用いた反応溶液28
・Sample5由来のDNAとプライマーセットID「bin.11.K15022」のプライマーセットを用いた反応溶液29
・血液由来のDNAとプライマーセットID「bin.11.K15022」のプライマーセットを用いた反応溶液30
・Sample2由来のDNAとプライマーセットID「bin.14.K18205」のプライマーセットを用いた反応溶液31
・Sample3由来のDNAとプライマーセットID「bin.14.K18205」のプライマーセットを用いた反応溶液32
・Sample4由来のDNAとプライマーセットID「bin.14.K18205」のプライマーセットを用いた反応溶液33
・Sample1由来のDNAとプライマーセットID「bin.14.K18205」のプライマーセットを用いた反応溶液34
・Sample5由来のDNAとプライマーセットID「bin.14.K18205」のプライマーセットを用いた反応溶液35
・血液由来のDNAとプライマーセットID「bin.14.K18205」のプライマーセットを用いた反応溶液36
・Sample2由来のDNAとプライマーセットID「bin.18.K22340」のプライマーセットを用いた反応溶液37
・Sample3由来のDNAとプライマーセットID「bin.18.K22340」のプライマーセットを用いた反応溶液38
・Sample4由来のDNAとプライマーセットID「bin.18.K22340」のプライマーセットを用いた反応溶液39
・Sample1由来のDNAとプライマーセットID「bin.18.K22340」のプライマーセットを用いた反応溶液40
・Sample5由来のDNAとプライマーセットID「bin.18.K22340」のプライマーセットを用いた反応溶液41
・血液由来のDNAとプライマーセットID「bin.18.K22340」のプライマーセットを用いた反応溶液42
・Sample2由来のDNAとプライマーセットID「bin.52.K22607」のプライマーセットを用いた反応溶液43
・Sample3由来のDNAとプライマーセットID「bin.52.K22607」のプライマーセットを用いた反応溶液44
・Sample4由来のDNAとプライマーセットID「bin.52.K22607」のプライマーセットを用いた反応溶液45
・Sample1由来のDNAとプライマーセットID「bin.52.K22607」のプライマーセットを用いた反応溶46
・Sample5由来のDNAとプライマーセットID「bin.52.K22607」のプライマーセットを用いた反応溶液47
・血液由来のDNAとプライマーセットID「bin.52.K22607」のプライマーセットを用いた反応溶液48
[手順232]調製したPCR反応溶液を用いてPCRを実施した。PCRには、Thermo Fisher Scientific社製のサーマルサイクラー「Veriti」を用いた。PCR反応条件は、98℃で30秒のインキュベーションを行った後、98℃10秒の熱変性、65℃15秒のアニーリングおよび72℃30秒の伸長反応を35サイクル行うというものである。
[手順233]増幅産物を、Agilent Technologies社製の全自動ハイスループット電気泳動システム「Agilent 4200 TapeStation」の「D1000 ScreenTape」を用いて解析した。解析結果を図4に示す。図4において、上段には、反応溶液1〜24のそれぞれから得られた増幅産物の検出結果を左から順に示し、下段には、反応溶液25〜48のそれぞれから得られた増幅産物の検出結果を左から順に示す。図4において、「L」はラダーを示す。
[工程24:メタゲノム中の特異的な遺伝子の定量解析を行う工程]
以下の手順(手順241〜243)で、メタゲノム中の特異的な遺伝子の定量解析を行った。
[手順241]抽出したSample1由来のDNAとSample2由来のDNAを用いて、20μLの定量PCR反応溶液を調製した。反応溶液の成分は以下の通りである。以下に列挙した計8の反応溶液を調製した。
<反応溶液の成分>
・テンプレートDNA:1μL
・Toyobo社製の「2x KOD SYBR qPCR Mix」:10μL
・10μMに調製されたフォワードプライマー(表3に示す配列):1μL
・10μMに調製されたリバースプライマー(表3に示す配列):1μL
・ROX:0.4μL
・精製水:6.6μL
<調製した反応溶液>
・Sample1由来のDNAとプライマーセットID「bin.13.K22330」のプライマーセットを用いた反応溶液1
・Sample1由来のDNAとプライマーセットID「bin.18.K15303」のプライマーセットを用いた反応溶液2
・Sample1由来のDNAとプライマーセットID「bin.33.K05942」のプライマーセットを用いた反応溶液3
・Sample1由来のDNAとプライマーセットID「bin.43.K05942」のプライマーセットを用いた反応溶液4
・Sample2由来のDNAとプライマーセットID「bin.11.K15022」のプライマーセットを用いた反応溶液5
・Sample2由来のDNAとプライマーセットID「bin.14.K18205」のプライマーセットを用いた反応溶液6
・Sample2由来のDNAとプライマーセットID「bin.18.K22340」のプライマーセットを用いた反応溶液7
・Sample2由来のDNAとプライマーセットID「bin.52.K22607」のプライマーセットを用いた反応溶液8
[手順242]調製した定量PCR反応溶液を用いて定量PCRを実施した。定量PCRには、Agilent Technologies社製の「Mx3005P」を用いた。定量PCR反応条件は、98℃で2分のインキュベーションを行った後、98℃10秒の熱変性、60℃10秒のアニーリング、68℃30秒の伸長反応を40サイクル行うというものである。
[手順243]取得したデータからΔCt法で相対定量値を算出し、算出結果をショットガンシーケンシングで得られた定量結果と比較した。比較結果を図5に示す。定量PCRは3回の独立した実験で実施した。1回の実験内では2個のテクニカルレプリケートで実施し、平均値を解析に用いた。想定定量値は、個々のサンプルの定量値を図5に示すグラフ一番左の定量値で標準化して算出した。図5において、白色のグラフはqPCRの定量値を示し、黒色のグラフは、ショットガンシーケンシングの定量値を示す。図5において、白色のグラフ内のドットは、1回の実験での平均値を示す。
実施例2により、遺伝子検索装置100で検索した遺伝子を対象に設計したプライマーで、対象となる菌が実際に検出できること、および、当該設計したプライマーで、ショットガン解析とほぼ同等の定量解析が実施可能であること、が確認された。
本発明は、例えば、核酸プローブ設計に有用である。
100 遺伝子検索装置
102 制御部
102a 検索部
104 通信インターフェース部
106 記憶部
106a 保有遺伝子データテーブル
108 入出力インターフェース部

Claims (10)

  1. 核酸プローブ設計を支援するための、制御部を備える遺伝子検索装置であって、
    所定の複数の微生物における所定の複数の遺伝子の保有数と、前記所定の複数の微生物の系統情報と、を含む保有遺伝子情報にアクセス可能であり、
    前記制御部は、設定された系統情報に紐付く微生物が共通して保有し、且つ、前記保有遺伝子情報で管理されている、前記微生物以外の全ての微生物における保有率が下位の遺伝子を、前記保有遺伝子情報から検索する検索手段を備える、
    遺伝子検索装置。
  2. 前記所定の複数の微生物および前記系統情報は、全ゲノム解析結果から得られたものであり、
    前記所定の複数の遺伝子は、前記全ゲノム解析結果に登録されている前記所定の複数の微生物の全ゲノム配列から各全ゲノム配列上の遺伝子領域配列を予測し、前記予測した各遺伝子領域配列の機能アノテーションを行うことによって決定されたものである、
    請求項1に記載の遺伝子検索装置。
  3. 前記保有遺伝子情報は、さらに、メタゲノム解析を行うことによって得られた微生物叢由来の単一または複数のコンティグ配列における前記所定の複数の遺伝子の保有数と、前記単一または複数のコンティグ配列が属するグループのグループ情報であって系統情報に相当するものと、を含み、
    前記検索手段は、設定されたグループ情報で特定されるグループが共通して保有し、且つ、前記保有遺伝子情報で管理されている、前記グループ以外の全てのコンティグ配列と全ての微生物における保有率が下位の遺伝子を、前記保有遺伝子情報から検索する、
    請求項1から3のいずれか1つに記載の遺伝子検索装置。
  4. 前記設定されたグループ情報は、完全性を有するコンティグ配列が属するグループのグループ情報である、請求項3に記載の遺伝子検索装置。
  5. 前記完全性は、単一コピー遺伝子セットの保有率とコンタミネーション率で定義されるものである、請求項4に記載の遺伝子検索装置。
  6. 前記グループ情報は、塩基組成とデータカバレッジに関する情報を基に前記複数のコンティグ配列のビニング(binning)を行った結果得られたビン(bin)の識別情報である、請求項3から5のいずれか1つに記載の遺伝子検索装置。
  7. 前記検索手段は、前記保有率が最下位の遺伝子を検索する、請求項1から6のいずれか1つに記載の遺伝子検索装置。
  8. 前記微生物は、細菌、ウイルスまたは真菌である、請求項1から7のいずれか1つに記載の遺伝子検索装置。
  9. 制御部を備える情報処理装置において実行される、核酸プローブ設計を支援するための遺伝子検索方法であって、
    所定の複数の微生物における所定の複数の遺伝子の保有数と、前記所定の複数の微生物の系統情報と、を含む保有遺伝子情報にアクセス可能な前記情報処理装置の前記制御部において実行される、
    設定された系統情報に紐付く微生物が共通して保有し、且つ、前記保有遺伝子情報で管理されている、前記微生物以外の全ての微生物における保有率が下位の遺伝子を、前記保有遺伝子情報から検索する検索ステップを含む、
    遺伝子検索方法。
  10. 制御部を備える情報処理装置において実行させるための、核酸プローブ設計を支援するための遺伝子検索プログラムであって、
    所定の複数の微生物における所定の複数の遺伝子の保有数と、前記所定の複数の微生物の系統情報と、を含む保有遺伝子情報にアクセス可能な前記情報処理装置の前記制御部において実行させるための、
    設定された系統情報に紐付く微生物が共通して保有し、且つ、前記保有遺伝子情報で管理されている、前記微生物以外の全ての微生物における保有率が下位の遺伝子を、前記保有遺伝子情報から検索する検索ステップを含む、
    遺伝子検索プログラム。
JP2020104040A 2020-06-16 2020-06-16 遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラム Pending JP2021193963A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020104040A JP2021193963A (ja) 2020-06-16 2020-06-16 遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020104040A JP2021193963A (ja) 2020-06-16 2020-06-16 遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラム

Publications (1)

Publication Number Publication Date
JP2021193963A true JP2021193963A (ja) 2021-12-27

Family

ID=79198049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020104040A Pending JP2021193963A (ja) 2020-06-16 2020-06-16 遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラム

Country Status (1)

Country Link
JP (1) JP2021193963A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023204008A1 (ja) * 2022-04-21 2023-10-26 株式会社島津製作所 微生物判別用のデータベースを構築する方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023204008A1 (ja) * 2022-04-21 2023-10-26 株式会社島津製作所 微生物判別用のデータベースを構築する方法および装置

Similar Documents

Publication Publication Date Title
Mardis The impact of next-generation sequencing technology on genetics
Power et al. Microbial genome-wide association studies: lessons from human GWAS
US11091813B2 (en) Multitag sequencing ecogenomics analysis
KR102393608B1 (ko) 희귀 돌연변이 및 카피수 변이를 검출하기 위한 시스템 및 방법
Orton et al. Distinguishing low frequency mutations from RT-PCR and sequence errors in viral deep sequencing data
JP2005504508A5 (ja)
JP2011516031A (ja) 配列決定可能ライブラリーの作製のための改良された核酸加工のためのシステムおよび方法
Matsumura et al. SuperSAGE: a modern platform for genome-wide quantitative transcript profiling
Bletz et al. Ensuring backwards compatibility: traditional genotyping efforts in the era of whole genome sequencing
Feau et al. Genome-Enhanced Detection and Identification (GEDI) of plant pathogens
Andersen et al. Towards diagnostic metagenomics of Campylobacter in fecal samples
CN115719616A (zh) 一种病原物种特异性序列的筛选方法及系统
US20220136071A1 (en) Methods and systems for detecting pathogenic microbes in a patient
JP2021193963A (ja) 遺伝子検索装置、遺伝子検索方法および遺伝子検索プログラム
US10870879B2 (en) Method for the preparation of bar-coded primer sets
Arenas et al. Steps and tools for PCR-based technique design
WO2021257453A2 (en) Chimeric amplicon array sequencing
Tripathy et al. Massively parallel sequencing technology in pathogenic microbes
Huang et al. Snipe: highly sensitive pathogen detection from metagenomic sequencing data
Baker et al. FUME-TCRseq: Sensitive and accurate sequencing of the T-cell receptor from limited input of degraded RNA
Wan et al. Validation of mixed-genome microarrays as a method for genetic discrimination
Nguyen et al. Next Generation Sequencing in Healthcare
Green et al. Modern Diagnostic Methods in the 21st Century
豊間根耕地 Studies on identification and evaluation of CRISPR diversity on human skin microbiome for development of a new personal identification method
Kumar et al. Bioinformatics: Unveiling the Systems Biology

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20200714

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240604