JP6624736B2 - インフルエンザウイルス解析装置、インフルエンザウイルス解析方法及びインフルエンザウイルス解析プログラム - Google Patents

インフルエンザウイルス解析装置、インフルエンザウイルス解析方法及びインフルエンザウイルス解析プログラム Download PDF

Info

Publication number
JP6624736B2
JP6624736B2 JP2016224126A JP2016224126A JP6624736B2 JP 6624736 B2 JP6624736 B2 JP 6624736B2 JP 2016224126 A JP2016224126 A JP 2016224126A JP 2016224126 A JP2016224126 A JP 2016224126A JP 6624736 B2 JP6624736 B2 JP 6624736B2
Authority
JP
Japan
Prior art keywords
sequence
segment
influenza virus
base
reference sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016224126A
Other languages
English (en)
Other versions
JP2017097873A (ja
Inventor
裕子 内田
裕子 内田
岳彦 西藤
岳彦 西藤
喜洋 竹前
喜洋 竹前
良太 常國
良太 常國
克史 金平
克史 金平
岳彦 岡
岳彦 岡
中村 雄一郎
雄一郎 中村
弘三 川原
弘三 川原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Agriculture and Food Research Organization
Original Assignee
National Agriculture and Food Research Organization
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Agriculture and Food Research Organization filed Critical National Agriculture and Food Research Organization
Publication of JP2017097873A publication Critical patent/JP2017097873A/ja
Application granted granted Critical
Publication of JP6624736B2 publication Critical patent/JP6624736B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、次世代シーケンサで解読したインフルエンザウイルスの大量なデータ解析を行うことができるインフルエンザウイルス解析装置、インフルエンザウイルス解析方法、及びインフルエンザウイルス解析プログラムに関する。
H5N1亜型高病原性鳥インフルエンザウイルス(HPAIV)は、2003年以降世界各地で家禽での発生を引き起こし、アジアを中心に常在化の様相を呈している。2014年には、H5N8亜型HPAIがユーラシア大陸だけでなくアメリカ大陸までに侵入し、HPAIVの世界的蔓延による食糧の供給にも影響が及ぶことが懸念される。我が国においても、HPAIVの侵入を数度経験しており、特に2010年−2011年にかけては家禽及び野鳥での全国的な発生が認められ、2014年にもH5N8亜型HPAIVの侵入が認められた。これらHPAIVの防疫のために、常に監視していなければならない状況である。
国際獣疫事務所において、高病原性鳥インフルエンザウイルス(HPAIV)は、A型インフルエンザウイルスで鶏に病原性を示すもの又はHA亜型がH5またはH7亜型で赤血球凝集素タンパクの開裂部位のアミノ酸配列が既知のHPAIVと類似しているものと定義されている。我が国の法律においては、家禽での症状の有無にかかわらず、家禽に感染したA型インフルエンザウイルスのHA亜型がH5またはH7型であることが確認されれば摘発淘汰の対象となる。従って、A型インフルエンザウイルスの亜型の決定を正確かつ迅速に決定することが大変重要である。
また、インフルエンザウイルスは家畜衛生分野だけでなく、公衆衛生学的にも大変重要な疾病である。人による季節性インフルエンザのサーベイランスにより得られたA型及びB型インフルエンザウイルスは、季節性インフルエンザ予防・治療のためのワクチン選定、薬剤耐性解析等に用いられるため、大量のウイルスデータの解析を迅速に行うことが必須となる。さらに、人でのインフルエンザパンデミックの発生時には、そのウイルスの亜型同定は、迅速なパンデミックワクチン開発に重要である。
最近の技術の進歩により、次世代シーケンサにより遺伝子を解読した後、例えば、特許文献1〜3に示されるような、次世代シーケンサに付帯するソフトウエア又は特殊な解析ソフトを用いてデータを解析している。これにより、次世代シーケンサによりインフルエンザウイルスの遺伝子を大量に解析することが可能となった。
特開2005−135053号公報 特開2006−039867号公報 特開2009−131242号公報
しかし、インフルエンザウイルスの解析に上記従来技術を適用しても、解析にはゲノムが8つの分節に分かれているという特徴を持つインフルエンザウイルスに特異的なストラテジーを要し、それぞれの遺伝子分節ごとにトライアンドエラーを繰り返す必要があり、手間と時間を要するため、緊急な場合には、インフルエンザウイルスの解析を迅速に行うことができずに、役に立たない場合がある。
また、上記従来技術では、大量の解読されたデータを取り扱う為、インフルエンザウイルスの解析を迅速に処理できないという問題もある。
本発明は、上述した課題を解決するために創案されたものであり、インフルエンザウイルスの解析を正確かつ迅速に行うことができるインフルエンザウイルス解析装置、インフルエンザウイルス解析方法及びインフルエンザウイルス解析プログラムを提供することを目的とする。
上記目的を達成するために、本発明のインフルエンザウイルス解析装置は、参照用インフルエンザウイルスデータが入力されるリファレンスデータ入力部と、前記リファレンスデータ入力部に入力された参照用インフルエンザウイルスデータの塩基配列を複数の分節に分類して分節毎にリファレンス配列を集積する分節分割部と、検体の塩基配列が入力される検体データ入力部と、前記分節毎に集積されたリファレンス配列に前記検体の塩基配列をマッピングするマッピング処理部と、前記マッピング処理部によるマッピング結果からリファレンス配列の塩基長に対するマッピング済領域の塩基長の割合であるカバー率を算出するカバー率算出部と、前記算出されたカバー率の最大の値又は上位3位までの高カバー率を有するリファレンス配列のマッピング結果に基づいて変異を反映したコンセンサス配列を分節毎に作成するコンセンサス配列作成部と、分節毎に前記コンセンサス配列と前記集積されたリファレンス配列の相同性検索を実行し所定の類似度以上のリファレンス配列のうち最大の塩基長を有する1つの改定リファレンス配列を決定する相同性検索処理部とを備え、前記マッピング処理部において改定リファレンス配列に前記検体の塩基配列をマッピングしてマッピング結果に基づいて変異を反映した改定コンセンサス配列を作成することを主要な特徴とする。
また、本発明のインフルエンザウイルス解析方法は、参照用インフルエンザウイルスデータの塩基配列を複数の分節に分類して分節毎にリファレンス配列を集積する分節分割工程と、前記分節毎に集積されたリファレンス配列に検体の塩基配列をマッピングする第1のマッピング処理工程と、前記第1のマッピング処理工程によるマッピング結果からリファレンス配列の塩基長に対するマッピング済領域の塩基長の割合であるカバー率を算出するカバー率算出工程と、前記算出されたカバー率の最大の値又は上位3位までの高カバー率を有するリファレンス配列を分節毎に抽出する抽出工程と、前記最大のカバー率又は上位3位までの高カバー率を有するリファレンス配列のマッピング結果に基づいて変異を反映したコンセンサス配列を分節毎に作成するコンセンサス配列作成工程と、分節毎に前記コンセンサス配列と前記集積されたリファレンス配列の相同性検索を実行し所定の類似度以上のリファレンス配列のうち最大の塩基長を有する1つの改定リファレンス配列を決定する相同性検索処理工程と、前記改定リファレンス配列に前記検体の塩基配列をマッピングしてマッピング結果に基づいて変異を反映した改定コンセンサス配列を作成する第2のマッピング処理工程とを備えたことを主要な特徴とする。
また、本発明のインフルエンザウイルス解析プログラムは、上記インフルエンザウイルス解析装置としてコンピュータを機能させるためのコンピュータプログラムである。
本発明によれば、2度のマッピング処理を行うことにより、インフルエンザウイルスの解析を迅速かつ正確に行うことができる。また、インフルエンザウイルスゲノムの全長配列を決定することができる。
インフルエンザウイルス解析装置のブロック構成を示す図である。 FASTA形式ファイルのフォーマットを示す図である。 公開データより取得したFASTA形式ファイルの一例を示す図である。 参照用インフルエンザウイルスデータを分節毎に分割する方法を示すフローチャート図である。 分節に分類する場合の判定に用いられる正規表現を示す図である。 分節分割処理において、NAの分節に属すると判断される場合、いずれの分節にも属さないと判断される場合の具体例を示す。 NA分節として集積された複数のリファレンス配列が記録されているファイルの一例を示す図である。 FASTQ形式ファイルのフォーマットとクオリティ値をチェックする状態を示す図である。 NA分節における相同性検索の結果例を示す。 HA分節に対応する改定コンセンサス配列とha分節に属するリファレンス配列との相同性検索を行った結果例を示す。 図10の正規表現適応部分に基づき、型判定を行う方法を示す。 インフルエンザウイルス解析方法のフローチャートを示す図である。
以下、図面を参照して本発明の一実施形態を説明する。
図1は、本発明のインフルエンザウイルス解析装置100の構成例を示すブロック図で
ある。
インフルエンザウイルス解析装置は、検体データ入力部1、トリミング処理部12、マッピング処理部2、カバー率算出部3、コンセンサス配列作成部4、相同性検索処理部5、型判定部6、登録用データ作成部7、リファレンスデータ入力部11、分節分割部13、制御部10等から構成される。検体データ入力部1には、シーケンサ21で読み取られた検体の塩基配列データが入力される。一方、あらかじめ、公開データベース22等から参照用のインフルエンザウイルスの塩基配列データをリファレンスデータ入力部11で取得しておき、これを分節分割部13で、所定の分類方法により分割を行って集積し、インフルエンザウイルスの分節毎に集積されたリファレンス配列にしておく。また、分節分割部13で分節毎に集積されたリファレンス配列に対し、相同性分析部131で分節毎にリファレンス配列相互の類似度をすべて算出し、類似性の高いリファレンス配列を除外し、一定の類似性以下になるように調整する。分節毎にその後、検体データをリファレンス配列にマッピングする等の処理を行いながら、検体のインフルエンザウイルスの解析を進めることになる。
なお、制御部10は、検体データ入力部1、トリミング処理部12、マッピング処理部2、カバー率算出部3、コンセンサス配列作成部4、相同性検索処理部5、型判定部6、登録用データ作成部7、リファレンスデータ入力部11、分節分割部13の各部を制御し、表示端末部23のデータ入力を受け付けて制御や演算等を行ったり、表示端末部23へのデータ出力や表示制御等を行う。
図12は、インフルエンザウイルス解析方法を示すフローチャートであり、図1〜図12を用いて以下具体的にインフルエンザウイルス解析処理について説明する。
あらかじめ、インフルエンザウイルス公開データを用いてインフルエンザウイルスをインデックス化する。インデックス化は、インフルエンザウイルスデータを8個の各分節に分割し、各分節に塩基配列データを作成することにより行う。これらの8分節に分割されたリファレンス配列は、分節毎に集積される。
元となる公開データは、例えば、NCBI(http://www.ncbi.nlm.nih.gov/)やGISAID(http://platform.gisaid.org/epi3/frontend#60d323)などのインフルエンザウイルス情報をもつ公開データを利用する。リファレンス配列作成の概要は、まず、上記等の公開サイトからインフルエンザウイルスFASTA形式ファイルをリファレンスデータ入力部11にダウンロード等の方法で取得する。取得したファイルを特定のルールに従い、8種類の分節とその他のファイルという形でそれぞれに分割して集約する。次に、8種類の分節配列データを解析に用いることができる特定のフォーマットに変換する。
FASTA形式ファイルとは、良く知られているように、塩基/アミノ酸の配列を記述したテキストファイルであり、行頭が「>」にて始まる配列名と、配列名行の改行後に続く塩基又はアミノ酸行から構成される。
具体的にインフルエンザウイルスのインデックス化について述べる。まず、公開サイト等から取得したFASTA形式のインフルエンザウイルスデータは、図2のフォーマットで記載されている。図2のように、「>」記号に続けて記載されている文字列が当該配列の配列名となり、次行から当該配列名に対応する塩基配列が記載される。
FASTA形式のインフルエンザウイルスデータの具体的な一例を図3に示す。これは、ftp://ftp.ncbi.nlm.nih.gov/genomes/INFLUENZA/influenza.fna.gzの参照配列データベースのリンクよりダウンロードしたファイルを解凍したものである。ファイルの拡張子がfnaとなっているのは、FASTA形式のファイルであることを示し、gzはアーカイブの形式を示す。なお、すべての塩基データを掲載することはできないので、一部は省略している。
図4は、参照用インフルエンザウイルスデータを分節毎に分割する方法を示すフローチャート図である。図3のinfluenza.fna.gzファイルをリファレンスデータ入力部11にシーケンシャルに読み込み(S1)、「>」記号に続けて記載されている配列名を取得する。この配列名を利用して、分節分割部13で8個の分節塩基配列と、その他の塩基配列とに分割する。
S2に示されるように、ファイルヘッダを参照する。すなわち、配列名の部分を参照し
、PB1、PB2、PA、HA、NP、NA、MP、NSの8個の分節と、分節が識別できない塩基配列とに
分類する。
配列名の文字列に、正規表現1〜8のいずれかが存在するかを判定していき、その正規表現が含まれる場合は、識別コードを付与する。正規表現1〜8は、それぞれ、図5(a)〜(h)に対応するもので、正規表現1から順に、PB1、PB2、PA、HA、NP、NA、MP、NS各分節に対応している。図5に示された正規表現は、/で挟まれた文字列が1個のキーワードとなっている。
したがって、正規表現1が含まれる場合とは、図5(a)示すように、[ |(|,]pb1[ |)|,]、basic polymerase 1、polymerase basic 1、polymerase basic protein 1、segment 2、segment: 2の6種類のキーワードのいずれかが配列名に含まれる場合を示す。正規表現2〜8についても同様であり、図5(b)〜(h)に記載されている各キーワードが含まれる場合は、それぞれに対応する分節に属すると判定する。
図4のS3では、最初に正規表現1が配列名に含まれるか判断し、含まれる場合(YES)には、PB1分節の識別コードを当該塩基配列に付与した(S4)後、ステップS5に進み、含まれない場合(NO)は、そのまま次のステップS5に進む。
S5では、正規表現2が配列名に含まれるか否かを判断し、含まれる場合(YES)には、pb2分節の識別コードを当該塩基配列に付与した(S6)後、ステップS7に進み、含まれない場合(NO)は、そのまま次のステップS7に進む。このように、S7では正規表現3が配列名に含まれるか否かを、S9では正規表現4が配列名に含まれるか否かを、S11では正規表現5が配列名に含まれるか否かを、S13では正規表現6が配列名に含まれるか否かを、S15では正規表現7が配列名に含まれるか否かを、S17では正規表現8が配列名に含まれるか否かを次々に判断する。
そして、各々のステップにおいて当該正規表現が含まれる場合(YES)には、S8ではPA分節の識別コードを、S10ではHA分節の識別コードを、S12ではNP分節の識別コードを、S14ではNA分節の識別コードを、S16ではMP分節の識別コードを、S18ではNS分節の識別コードを、当該塩基配列に付与する。
1つの塩基配列に対して、S3〜S18の処理が終了すると、S19で、識別コードが割り当てられており、かつ、それが単一の識別コードであるか否かを判断する。YESの場合は、S20に示すように、識別コードを参照して、当該塩基配列を割り当てられた識別コードに対応する分節の記憶領域に格納する。NOの場合は、S21のように、識別できない塩基配列として、8種類の分節とは異なるその他の領域に格納する。以上のようにして、取得した参照用インフルエンザウイルスデータのすべての塩基配列の分類が終了したか否かを判断し(S22)、終了していなければS2からの処理に戻り、終了していれば、分節分割に関する処理を終了する。これにより、分節分割部13には、分節毎にリファレンス配列データが集積されて格納された、分節毎リファレンス配列データ記憶部13Aが形成される。
図6は、図4の分節分割処理において、NAの分節に属すると判断される場合、いずれの分節にも属さないと判断される場合の具体例を示す。図6(a)に示される配列名には、neuraminidaseのキーワードが存在し、それ以外のキーワードがないので、NAの分節に分類される例である。図6(b)は、図5(a)〜(h)のいずれの正規表現も存在しないので、その他に分類される例である。図6(c)は正規表現のキーワードが、segment7というMP分節に関するキーワード、nonstructural proteinというNS分節に関するキーワードが存在するため、2種類以上の分節に属することになり、単一の分節に決定することができず識別できないので、その他に分類される例である。
このように、いずれの分節にも属さない、又は、2つ以上の分節に属する場合は、その他の識別できない塩基配列に分類し、解析に用いる分節からは除く。
図7は、インフルエンザウイルスの参照配列データベースのリンクよりダウンロードしたファイルから、8種類の分節に分割したもののうち、NA分節として集積された複数のリファレンス配列が記録されているファイルの一例を示す。この例では、4つの塩基配列が記録されている。
以上により、8個の分節FASTA形式ファイルと、1個のいずれの分節にも属さないその他のFASTA形式ファイルとの合計9個のファイルが作成されるので、分節分割部13の分節毎リファレンス配列データ記憶部13Aでこれらのデータを保持しておく。次に、S23に示すように、S20で作成されたファイルを用い、各分節内においてリファレンス配列として集積された塩基配列間相互のすべての相同性分析を相同性分析部131で行い、類似度が高い塩基配列を除外する。これにより、1つの分節内における塩基配列相互の類似度が一定のレベル(80%から90%)以下になるように調整される。これは、分節内における2つの塩基配列のすべての組み合わせについて相同性を計算した場合、そのいずれの数値も一定のレベル以下になることを意味する。各分節内において、前記のように塩基配列相互の類似度が一定のレベル(80%から90%)以下になる調整されたリファレンス配列は、分節毎リファレンス配列データ記憶部13Bで保持しておく。この作業には一般的に配列間の相同性が指定されたパーセンテージになるように配列の取捨選択を行うフリーツールが利用される。一例として、CD-HITを用いた。CD-HITでは、例えば、類似度が高い塩基配列1、塩基配列2、塩基配列3の各塩基配列相互の類似度が一定のレベルを超えている(類似度が高い)場合は、この3つの塩基配列のうち塩基長の最も長い配列を残し、他の2つの塩基配列は捨てるという処理を行う。このように、塩基長が長い配列を残すことにより、公開データベース22に登録されているインフルエンザウイルスには配列の読み取りを行った登録者がウイルスゲノムの全長を完全にシーケンスしていなくても登録した質の低い塩基配列が含まれているため、これらの配列を除去することができる。また、類似度の算出方法は、一般によく知られた方法が使用されており、二つの塩基配列間で塩基の並びを少しずつずらして照合し、もっとも塩基配列間の一致率が高くなった数値を使用している。なお、上記の類似度を調整するレベル(閾値)を下げすぎると、抽出されるリファレンス配列の数がかなり減少し、自然界にこれまで想定していなかったウイルスの配列が出現した場合、リファレンス配列と大幅に配列が異なるために型を判定できない危険性がある。
一方で、シーケンサ21で検体のシーケンシングを実施する。例えば、シーケンサ21は、次世代シーケンサと呼ばれる装置を用い、シーケンシングは、イルミナ社MiSeqもしくはその他のDNAシーケンス装置のプロトコールに従って行われる。シーケンシングした結果をFASTQ形式のデータフォーマットで出力し、検体データ入力部1に入力することで、ST1の検体データの取り込みが行われる。ST1へ取り込まれるシーケンシング結果のデータフォーマットは、FASTQ形式にかかわらず塩基配列のみ又は塩基配列と各塩基のクオリティスコアが含まれたデータ形式のいずれも対応可能である。これは、後述するマッピングソフトでマッピング可能なデータフォーマットとするためである。
FASTQ形式ファイルとは、良く知られているように、塩基配列と各塩基のクオリティスコアを記述したテキストファイルであり、行頭が「@」にて始まる4行に対して、1リード分の塩基配列情報から構成される。具体例を図8(a)に示す。各行は、以下のように構成されている。
1行目は@から始まるリード識別名、2行目はリードの塩基、3行目は+から始まるリード機器別名(リード機器別名自体は省略可能)、4行目は塩基のクオリティスコア、となっている。なお、なお、具体例では、4行目のクオリティスコアは、ASCIIコードで表示されたフレッドスコアとなっており、2行目と同じ文字数になる。
トリミング処理部12では、検体のFASTQ形式のデータをトリミングして分析に用いる。検体のデータをすべて使用しても信頼性に欠けるため、一定のクオリティ値を持つデータのみを抽出して信頼性を向上させる処理である(ST2)。
トリミング処理部12では、ユーザが設定した塩基配列幅の平均のクオリティ値(QV)が指定の値以下になったところまでを切り取る。まず、検体データのリードの先頭付近の塩基はクオリティ値が低いため先頭から1塩基ずつQVをチェックし行き、所定の値以上のQVが出現した時点から設定された塩基配列幅の平均QVを算出する。このとき、先頭の塩基から所定の値以上のQVが見つかった塩基の1つ手前の塩基までを削除する。そして、設定した塩基配列幅を1塩基ずつずらし、設定された塩基配列幅の平均QVを算出する。平均QVが所定のレベルを下回ったときに、その時点で塩基配列幅の最後尾の塩基から以降の塩基配列を削除する。
このようにして、トリミングされたリードの塩基長が一定の値を超えていれば、そのトリミング後の塩基配列を残し、一定の値以下であれば、トリミング後の塩基配列は削除され、使用されない。図8(b)は、リード塩基に対して、ASCIIコードで表示されたフレッドスコアから10進のクオリティ値に変換したものを示している。また、一例として、平均QVを検査するための塩基配列幅は20、トリミング後のリードの塩基長の最小閾値は120、クオリティ値のカットオフ値は7に設定されているものとする。
先頭部分の塩基のクオリティ値は、7より小さいので、この部分は削除する。先頭の塩基から8番目の塩基は、7以上になったので、8番目の塩基(図で始点と記載されている箇所)から順に取り出せる範囲を決定する。8番目の塩基から20塩基分の平均QVを算出する。この平均QVは、単純平均なので、図のWで示された、8番目の塩基から27番目の塩基までについて、クオリティ値を加算して20で割れば算出される。
そして、平均QVを算出するための始点の塩基を1塩基ずつずらして、その塩基から20塩基分の平均QVを逐次算出する。この処理を平均QVが7より小さくなるまで続ける。平均QVが7より小さくなった時点で、この処理を中止し、このときの最後尾の塩基から後の塩基配列はすべて削除する。このようにして、トリミングされて残ったリードの塩基長が120を超えていれば、トリミング後の塩基配列を残し、120以下であれば、トリミング後の塩基配列は削除する。
トリミング処理部12では、上記のクオリティ及び塩基長の判定処理(トリミング処理)を検体のすべてのFASTQデータに対して行い(ST2)、抽出された塩基配列をFASTA形式でマッピング処理部2に出力する。
次に、マッピング処理部2における図12のST3の処理では、2種類のリファレンス配列データと2つの処理ルートの組み合わせにより処理が行われる。2種類のリファレンス配列データは、図12に示される分節毎リファレンス配列データ記憶部13A及び13Bに記憶されているデータである。第1の処理ルートは、図12のP1で示される処理ルートであり、第2の処理ルートはP2で示される処理ルートである。インフルエンザウイルス解析装置100では、分節毎リファレンス配列データ記憶部13A又は13Bのどちらのデータを用いるかを選択できるようになっており、この選択により、マッピング処理部2は、分節毎リファレンス配列データの読み出しルートをR1とするか、あるいはR2とするかを切り替える。また、P1とP2の2つの処理ルートは、インフルエンザウイルス解析装置100において、どちらかを選択できるように構成されている。後述するが、P1の処理ルートでは、1種類のみのインフルエンザウイルス型を分析出力することができ、P2の処理ルートでは、最大3種類までのインフルエンザウイルス型をすべて分析出力することができる。このように、処理方法としては、読み出しルートR1対して処理ルートP1又はP2のいずれかを組み合わせることができ、同様に、読み出しルートR2に対して処理ルートP1又はP2のいずれかを組み合わせることができるので、合計4種類の処理方法を選択することができる。P1の処理ルートは、分節毎リファレンス配列データ記憶部13A又は13Bから読みだされた8分節に分割されたリファレンス配列データに、トリミング処理部12でトリミング処理された検体データをマッピングする(ST3)。マッピングは、各分節毎のリファレンス配列データに対して行われる。マッピングには一例としてフリーツールであるBowtie2を使用した。これにより、各分節のリファレンス配列と検体データとが一致する部分が探索され、検体データが、各分節のリファレンス配列の一致した領域に貼り付けられる。一方、第2のルートは、図12のP2で示される処理ルートである。これは、分節毎リファレンス配列データ記憶部13A又は13Bから読みだされた8分節に分割されたリファレンス配列データに、トリミング処理部12でトリミング処理された検体データをP1の処理と同様なフリーツールを用いてマッピングする(ST3)。
各分節のリファレンス配列に対してすべての検体データのマッピングが行われた後、そのマッピング結果は、良く使用されるSAM形式等で出力される。次に、カバー率算出部3では、マッピング結果に対してカバー率を算出する。カバー率算出は、以下のように行われる。
カバー率=マッピング済領域の塩基長/各分節毎のリファレンス配列の塩基長・・(1)
カバー率算出部3では、マッピング済領域を算出するため、例えば、SAM形式ファイルをBAM形式ファイルに変換し、これをソート済みBAM形式ファイルとし、次にPileup形式ファイルに変換する。Pileup形式ファイルは、以下の項目が含まれている。マッピングされたリファレンス位置、マッピングされたリファレンス側塩基、リファレンス側塩基にマッピングされた塩基数、マッピングされた検体側塩基等である。
(1)特定の分節において、1つのリファレンス配列の総塩基数を、マッピングを実行した際のFASTAファイルから取得する。(2)Pileupファイル中に記録されているリファレンス側塩基にマッピングされた塩基数を取得する。(3)リファレンス配列に対するカバー率を上記(1)式により算出する。(4)上記(1)〜(3)を、pileupファイル中の特定の分節のリファレンス配列すべてに対して行う。P1の処理ルートでは、(5)上記(4)の結果で最大のカバー率を有するリファレンス配列を取得する。(6)上記(1)〜(5)の処理を各分節毎に行う。これにより、一番カバー率の高いリファレンス配列が分節毎に抽出される(ST4)。したがって、合計8個のリファレンス配列が抽出される。
一方、P2の処理ルートでは、(7)上記(4)の結果で、カバー率の高い順に並べた場合、1位〜3位(上位3位)までのカバー率を有するリファレンス配列を取得する。(8)上記(1)〜(4)、(7)の処理を各分節毎に行う。これにより、上位3位までのリファレンス配列が分節毎に抽出される(ST41)。したがって、最大で、24個(8分節×カバー率上位3個)のリファレンス配列が抽出される。
次に、P1の処理ルートでは、コンセンサス配列作成部4で、最大カバー率を有するリファレンス配列を基に分節毎にコンセンサス配列を作成する(ST5)。マッピング済みファイルより作成されたpileupファイルをもとに、最大カバー率を有するリファレンス配列とマッピングパターンの違いを検出(変異検出)し、変異を反映したコンセンサス配列を作成する。この場合、最大カバー率を有するリファレンス配列とマッピングパターンが相違する塩基位置においては、対応するリード側の塩基の出現頻度がオペレーターの指定した最小頻度と最大頻度の間に収まればIUPAC表記に従いコンセンサス配列へ反映し、最大頻度以上であればリード側の塩基がコンセンサス配列に反映される。最小頻度未満であればリファレンス配列側の塩基がコンセンサス配列に反映される。このようにして、コンセンサス配列も、各分節毎に作成され、合計8個が形成される。
一方、P2の処理ルートでは、コンセンサス配列作成部4で、上位3位までのカバー率を有するリファレンス配列を基に分節毎にコンセンサス配列を作成する(ST51)。マッピング済みファイルより作成されたpileupファイルをもとに、カバー率の高い上位3件のリファレンス配列とマッピングパターンの違いを検出(変異検出)し、変異を反映したコンセンサス配列を作成する。この場合、カバー率の高い上位3件のリファレンス配列とマッピングパターンが相違する塩基位置においては、対応するリード側の塩基の出現頻度がオペレーターの指定した最小頻度と最大頻度の間に収まればIUPAC表記に従いコンセンサス配列へ反映し、最大頻度以上であればリード側の塩基がコンセンサス配列に反映される。最小頻度未満であればリファレンス配列側の塩基を反映させるようにする。このようにして、コンセンサス配列も、各分節毎において各リファレンス配列毎に作成され、最大で24個が形成される。
次に、以下のST6〜ST10の処理については、P1の処理ルートについてもP2の処理ルートについても同様である。作成されたコンセンサス配列は、FASTA形式で相同性検索処理部5に出力される。相同性検索処理部5では、コンセンサス配列をクエリーとして、分節毎リファレンス配列データ記憶部13Aから読みだされた対応する各8分節のリファレンス配列に対し相同性検索を実行する(ST6)。相同性検索は、例えば、コンセンサス配列がPB1分節の最大カバー率を有するリファレンス配列又はカバー率上位3位までのリファレンス配列から作成されている場合には、PB1分節に対応したコンセンサス配列であるため、PB1分節のリファレンス配列のみを用いる。
同様に、PB2分節に対応したコンセンサス配列には、PB2分節のリファレンス配列を、PA分節に対応したコンセンサス配列には、PA分節のリファレンス配列のみを、HA分節に対応したコンセンサス配列には、HA分節のリファレンス配列のみを、HA分節に対応したコンセンサス配列には、HA分節のリファレンス配列のみを、NP分節に対応したコンセンサス配列には、NP分節のリファレンス配列のみを、NA分節に対応したコンセンサス配列には、NA分節のリファレンス配列のみを、MP分節に対応したコンセンサス配列には、MP分節のリファレンス配列のみを用いる。
このように、コンセンサス配列を作成する基になったリファレンス配列が属する分節と同じ分節に分類されているリファレンス配列のみと当該コンセンサス配列とで相同性検索を実行する。
相同性検索には、一例としてNCBI-BLASTNを利用した。BLAST結果はTAB区切りフォーマットの特定出力項目を指定および閾値を設定する。これにより、所定の類似度以上のリファレンス配列を表示することができる。BLAST結果より、所定の類似度以上(相同性が高く)であり、最大塩基長を有するリファレンス配列をFASTA形式にて取得し、改定リファレンス配列とする。これを分節毎に行う(ST7)。これにより、最大カバー率を有するリファレンス配列を用いた場合には、合計8個の改定リファレンス配列が作成され、カバー率上位3位までのリファレンス配列を用いた場合には最大で24個の改定リファレンス配列が作成される。
図9は、NA分節におけるBLASTによる相同性検索の結果例を示す。図9では、各配列の1行目に記載された100.00、99.79等の数値が類似度(相同性の高さ)を表し、次に記載されている、1425の数値が塩基長を示している。
図9の例では、コンセンサス配列と類似度の高い順に上位5つのNA分節におけるリファレンス配列が示される。この場合は、一番最初の配列が改定リファレンス配列として決定される。なぜなら、この場合5つのリファレンス配列の塩基長が同じなので、類似度が最も高い唯一のリファレンス配列であるこの配列が選ばれるからである。仮に、5つのリファレンス配列の塩基長が同一ではない場合には、塩基長が最長のリファレンス配列が(たとえ類似度が5つのうちで最も高くなくとも)改定リファレンス配列として決定される。仮に、5つのリファレンス配列の塩基長が同一ではなく、かつ、塩基長が最長のリファレンス配列が複数ある場合には、その複数のうち類似度が最も高いリファレンス配列が改定リファレンス配列として決定される。改定リファレンス配列は、分節毎に決定されるので、合計8個作成される。
次に、上記で得られた8個又は最大24個の改定リファレンス配列に対して検体データ入力部1で得られた検体データをマッピング処理部2で再度マッピング処理を行う(ST8)。そして、改定リファレンス配列のマッピングパターンから2回目のコンセンサス配列を作成する。2回目のコンセンサス配列(改定コンセンサス配列)をコンセンサス配列作成部4で作成する(ST9)。
上記のように、2度のマッピングを行うことにより、検体のインフルエンザウイルスゲノム8分節分の全長配列を決定することができる。1度のマッピングでは、リファレンス配列の数が多いため、リードがまばらに貼り付けられる可能性が高く、かつ、ある領域に対してリードが貼り付けられる数が必然的に減ってしまうため、全長配列は得られない。
そこで、本実施形態では、2度目のマッピングの際に使用されるリファレンス配列は、1度目のマッピングで得られたコンセンサス配列に対して相同性が高いリファレンス配列を分節毎に1つに決定しているので、その改定リファレンス配列は最小限の数となり、上記のような問題はなくなり、全長配列を得ることができる。また、改定リファレンス配列を相同性の高さだけで決定すると、塩基配列長が短いリファレンス配列の方が、相同性は高く算出されてしまい、インフルエンザウイルスゲノムの全長をカバーできない可能性がある。本実施形態では、相同性が高く、最大塩基長を有するリファレンス配列を改定リファレンス配列としており、このように、塩基配列の長さについても条件を設けているので、全長をカバーした改定リファレンス配列となり、全長配列を決定できるという効果がある。
さて、ST9では、VarScanというフリーツールを使用した。この過程はリファレンス配列とマッピングパターンの違い(変異)を反映したデータを出力させる機能を持った何れかのプログラムを用いて実施する。一例としてVarScanに改定リファレンス配列に貼りついたリードのパターンを読み込ませ、その改定リファレンス配列とマッピングパターンの違い(変異)を反映したデータを出力させる。このVarScanから出力されたデータに基づき、ユーザが指定したアレル頻度(ある場所における変異を支持するリードの数と支持しないリードの数の比率)の閾値を超えた変異についてSNV (Single Nucleotide Variant)、Insertion、Deletion 塩基を反映した改定コンセンサス配列を作成する。またマッピングに利用した改定リファレンス配列より3’および5’側が短い場合は塩基「N」を補完する。上記のように、IUPAC形式塩基へ変換され、分節毎に改定コンセンサス配列が作成される。最大カバー率を有するリファレンス配列を用いた場合には、改定コンセンサス配列は8個作成され、カバー率上位3位までのリファレンス配列を用いた場合には最大で24個の改定コンセンサス配列が作成される。
上記各分節に対応した改定コンセンサス配列をFASTA形式にてファイルへ出力する。次に、登録用データ作成部7でFASTA形式からGISAID登録形式に変換される。
8分節における改定コンセンサス配列の作成はA型インフルエンザに由来するリファレンス配列とB型インフルエンザに由来するリファレンス配列それぞれについて同じ方法で別々に実施され、改定コンセンサス配列が作成されたインフルエンザ型がA型であったかB型であったかが判別される。また、カバー率上位3件までのリファレンス配列から作成された改定コンセンサス配列の場合は、改定コンセンサス配列毎に実施される。
改定コンセンサス配列を作成する基となった改定リファレンス配列が属している分節がHA又はNAの場合は、相同性検索処理部5で、改定コンセンサス配列をクエリーにして、分節毎リファレンス配列データ記憶部13Aに保持されている分節毎のリファレンス配列データとの相同性検索を実行し、型判定部6でインフルエンザウイルスの型判定を行う(ST10)。相同性検索は、改定コンセンサス配列を作成する基となった改定リファレンス配列が属している分節がHAの場合は、HA分節に属するリファレンス配列のみを用いて行う。コンセンサス配列を作成する基となった改定リファレンス配列が属している分節がNAの場合は、NA分節に属するリファレンス配列のみを用いて行う。相同性検索には、NCBI-BLASTNを利用した。
例えば、インフルエンザウイルスの型判定は以下のように行われる。最終ウイルスの型判定を行うため、HA又はNAの分節に対応している改定コンセンサス配列をクエリーに、BLASTNを実行した。図10は、HA分節に対応した改定コンセンサス配列とHA分節に対応したリファレンス配列との相同性検索を行った結果例を示す。本実施例では、相同性(類似度)が高い順に5位までを表示させるようにしている。
図11(a)は、図10の正規表現適応部分を示す。すなわち、図10の表示で、A virus〜complete cdsまでの項目を示している。ここで、注目されるのは、図11において、H5N8等と表現されている箇所である。図11(a)は、その部分を実線の枠で囲んで示している。実線の枠で囲まれた部分を用いて型判定が行われる。
図11(b)は、図11(a)の実線の枠で囲まれた部分を取り出して表示したものである。HA分節に対応している改定コンセンサス配列を用いている場合は、HA遺伝子であることはわかるが、亜型はわからないので、その亜型を判定する。図の破線の枠で囲まれた部分を見ると、Hの文字に続いて記載されている数値の部分が全て同値の5であるため、当該検体データはH5亜型と決定される。
このように、亜型判定に際し、HA亜型の判定においては、相同性検索結果において、正規表現のHに続く数値がすべて一致した場合にHA亜型の判定が当該数値により行われる。同様に、NA亜型を判定するNA分節についても、相同性検索結果において、正規表現のNに続く数値がすべて一致した場合にNA亜型の判定が当該数値により行われる。
図11(c)は、HA分節の相同性検索を行った結果の正規表現適応部分を表示しているが、図11(a)とは異なる例を示す。この例では、図11(a)で実線の枠で囲った領域に相当する部分を比較すると、1つの結果が異なる。Hの文字に続いて記載されている数値の部分において上から3番目の数値は3で、他はすべて5であるので、H5とH3が混在しているため、当該サンプルに対して亜型判別は無効となる。すなわち、亜型判定は行われない。また、HA分節は、HA亜型の判定に用いられるものなので、Nに続く数値の部分は全て判定対象とならない。例えば、上から5番目だけN1で、後の4つの結果はN8となっているが、これはHA亜型の判定に影響を与えない。
また、上記の型判定の結果は、登録用データ作成部7でGISAID登録形式に変換される。
以上のように、最終的な結果として出力される全長配列により、A型インフルエンザかB型インフルエンザかの判定が可能で、A型インフルエンザについてはHA、NAの亜型を迅速にかつ正確に判定できる。 HA遺伝子の配列の解明により、H5またはH7亜型HAタンパク質の開裂部位のアミノ酸配列や、HA, NA及び他の6つの遺伝子分節がコードするアミノ酸配列の特徴や、ノンコーディングリージョンでの塩基置換も同定することができる。また、カバー率上位3位までのリファレンス配列を用いた場合は、上述した処理を行うことにより、3種類までの異なった型のインフルエンザが混入していた場合も判定できる。
すなわち、上記処理ルートP1の方法では、最大カバー率のリファレンス配列を用いているため、体内でもっとも多く存在しているインフルエンザウイルス株のみが検出され、ウイルス量が少ないもう一方のインフルエンザウイルス株が検出されない。検出されないウイルス株が毒性の強い亜型であった場合、感染力の強いウイルスの感染を見逃すことになる。処理ルートP2の方法では、カバー率上位3位までのリファレンス配列を用いるため、複数のインフルエンザウイルス株がひとつの個体に重複感染している場合でも量が少ないほうのウイルスを見逃すことがなくなる。また、特に読み出しルートR2と処理ルートP2を組み合わせることにより、マッピングに用いるリファレンス配列相互の類似度が一定のレベル以下に調整されることで、存在量が1位のインフルエンザウイルスと2位のインフルエンザウイルスを見分けることが可能になる。類似度に上限がない場合、例えばA型インフルエンザのHAで一番存在量が多かった亜型がHA5で2番目がHA3だとすると、HA5のリファレンス配列間の類似度が高いためマッピング時に複数のHA5リファレンス配列にリードが張り付き、結果的に存在量1位から3位まですべてHA5に由来するリファレンス配列を基にした型の判定とコンセンサス配列の作成が行われてしまい、HA3が存在量の下位に沈んでしまうため検出できない。亜型内のリファレンス配列の類似度に制限を設けることで、HA5ウイルスに由来するリードはリファレンス配列のHA5の中でもっとも相同性の高いリファレンス配列にマッピングされ、ほかのHA5リファレンス配列に対しては相同性が、例えば80%以下と低くなるためマッピングされない。この結果、検体中に僅かに含まれていたHA3亜型ウイルス由来のリードがHA3にマッピングされたことが上位3位までの検出結果に含まれることになり、3種類までの異なった型のインフルエンザウイルスを判定できることに繋がる。
なお、インフルエンザウイルス解析装置としてコンピュータを機能させるためのインフルエンザウイルス解析プログラムは、半導体メモリ、磁気ディスク、光ディスク、光磁気ディスク、磁気テープなどのコンピュータ読み取り可能な記録媒体に記録でき、また、インターネットなどの通信網を介して伝送させて、広く流通させることができる。
1 検体データ入力部
2 マッピング処理部
3 カバー率算出部
4 コンセンサス配列作成部
5 相同性検索処理部
6 型判定部
7 登録用データ作成部
10 制御部
11 リファレンスデータ入力部
12 トリミング処理部
13 分節分割部
13A 分節毎リファレンス配列データ記憶部
13B 分節毎リファレンス配列データ記憶部
21 シーケンサ
22 公開データベース
23 表示端末部
100 インフルエンザウイルス解析装置
131 相同性分析部

Claims (6)

  1. 参照用インフルエンザウイルスデータが入力されるリファレンスデータ入力部と、
    前記リファレンスデータ入力部に入力された参照用インフルエンザウイルスデータの塩基配列を複数の分節に分類して分節毎にリファレンス配列を集積する分節分割部と、
    検体の塩基配列が入力される検体データ入力部と、
    前記分節毎に集積されたリファレンス配列に前記検体の塩基配列をマッピングするマッ
    ピング処理部と、
    前記マッピング処理部によるマッピング結果からリファレンス配列の塩基長に対するマ
    ッピング済領域の塩基長の割合であるカバー率を算出するカバー率算出部と、
    前記算出されたカバー率の最大の値又は上位3位までの高カバー率を有するリファレンス配列のマッピング結果に基づいて変異を反映したコンセンサス配列を分節毎に作成するコンセンサス配列作成部と、
    分節毎に前記コンセンサス配列と前記集積されたリファレンス配列の相同性検索を実行し所定の類似度以上のリファレンス配列のうち最大の塩基長を有する1つの改定リファレンス配列を決定する相同性検索処理部とを備え、
    前記マッピング処理部において改定リファレンス配列に前記検体の塩基配列をマッピングしてマッピング結果に基づいて変異を反映した改定コンセンサス配列を作成することを特徴とするインフルエンザウイルス解析装置。
  2. 前記分節分割部では、前記参照用インフルエンザウイルスデータの塩基配列をヘッダーに所定のキーワードが含まれるか否かにより、8種類の分節といずれの分節にも分類できない塩基配列とに分類することを特徴とする請求項1に記載のインフルエンザウイルス解析装置。
  3. 前記分節分割部に集積されたリファレンス配列間の相同性分析を分節毎に行い、一定の類似度以下のリファレンス配列に調整する相同性分析部を備え、前記マッピング処理部によりリファレンス配列に前記検体の塩基配列をマッピングする際には、前記一定の類似度以下に調整されたリファレンス配列を用いることを特徴とする請求項1又は2に記載のインフルエンザウイルス解析装置。
  4. 参照用インフルエンザウイルスデータの塩基配列を複数の分節に分類して分節毎にリファレンス配列を集積する分節分割工程と、
    前記分節毎に集積されたリファレンス配列に検体の塩基配列をマッピングする第1のマッピング処理工程と、
    前記第1のマッピング処理工程によるマッピング結果からリファレンス配列の塩基長に対するマッピング済領域の塩基長の割合であるカバー率を算出するカバー率算出工程と、
    前記算出されたカバー率の最大の値又は上位3位までの高カバー率を有するリファレンス配列を分節毎に抽出する抽出工程と、
    前記最大のカバー率又は上位3位までの高カバー率を有するリファレンス配列のマッピング結果に基づいて変異を反映したコンセンサス配列を分節毎に作成するコンセンサス配列作成工程と、
    分節毎に前記コンセンサス配列と前記集積されたリファレンス配列の相同性検索を実行し所定の類似度以上のリファレンス配列のうち最大の塩基長を有する1つの改定リファレンス配列を決定する相同性検索処理工程と、
    前記改定リファレンス配列に前記検体の塩基配列をマッピングしてマッピング結果に基づいて変異を反映した改定コンセンサス配列を作成する第2のマッピング処理工程とを備えたことを特徴とするインフルエンザウイルス解析方法。
  5. 前記分節分割工程で集積されたリファレンス配列間の相同性分析を分節毎に行い、一定の類似度以下のリファレンス配列に調整する相同性分析工程を備え、前記第1のマッピング処理工程では、前記一定の類似度以下に調整されたリファレンス配列を用いることを特徴とする請求項4に記載のインフルエンザウイルス解析方法。
  6. 請求項1に記載のインフルエンザウイルス解析装置としてコンピュータを機能させるた
    めのインフルエンザウイルス解析プログラム。
JP2016224126A 2015-11-18 2016-11-17 インフルエンザウイルス解析装置、インフルエンザウイルス解析方法及びインフルエンザウイルス解析プログラム Active JP6624736B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015225690 2015-11-18
JP2015225690 2015-11-18

Publications (2)

Publication Number Publication Date
JP2017097873A JP2017097873A (ja) 2017-06-01
JP6624736B2 true JP6624736B2 (ja) 2019-12-25

Family

ID=58803972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016224126A Active JP6624736B2 (ja) 2015-11-18 2016-11-17 インフルエンザウイルス解析装置、インフルエンザウイルス解析方法及びインフルエンザウイルス解析プログラム

Country Status (1)

Country Link
JP (1) JP6624736B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001083794A2 (en) * 2000-04-28 2001-11-08 St. Jude Children's Research Hospital Dna transfection system for the generation of infectious influenza virus
JP2003330934A (ja) * 2002-05-10 2003-11-21 Celestar Lexico-Sciences Inc 変異体配列解析装置、変異体配列解析方法、プログラム、および、記録媒体
JP2018183057A (ja) * 2015-09-23 2018-11-22 学校法人麻布獣医学園 ウイルス、細菌および寄生虫等の病原体の型または亜型等の遺伝子型別方法

Also Published As

Publication number Publication date
JP2017097873A (ja) 2017-06-01

Similar Documents

Publication Publication Date Title
US20230366046A1 (en) Systems and methods for analyzing viral nucleic acids
Zhang et al. Morphological and genetic evidence for early Holocene cattle management in northeastern China
Lecocq et al. Methods for species delimitation in bumblebees (H ymenoptera, A pidae, B ombus): towards an integrative approach
Xiao et al. Molecular approaches to identify cryptic species and polymorphic species within a complex community of fig wasps
Austin et al. Whole genome sequencing of the Asian arowana (Scleropages formosus) provides insights into the evolution of ray-finned fishes
Deng et al. Genetic diversity of avian leukosis virus subgroup J (ALV-J): toward a unified phylogenetic classification and nomenclature system
Abalde et al. Comparative transcriptomics of the venoms of continental and insular radiations of West African cones
CN112259167A (zh) 基于高通量测序的病原体分析方法、装置和计算机设备
Nagy et al. A hybrid next generation transcript sequencing-based approach to identify allelic and homeolog-specific single nucleotide polymorphisms in allotetraploid white clover
Niimura Identification of olfactory receptor genes from mammalian genome sequences
JP6624736B2 (ja) インフルエンザウイルス解析装置、インフルエンザウイルス解析方法及びインフルエンザウイルス解析プログラム
Smith et al. Limited domestic introgression in a final refuge of the wild pigeon
CN107862177B (zh) 一种区分鲤群体的单核苷酸多态性分子标记集的构建方法
KR20130097440A (ko) 염기 서열 분석을 위한 참조 서열 처리 시스템 및 방법
Usman et al. Unmapped reads from cattle RNAseq data: a source for missing and misassembled sequences in the reference assemblies and for detection of pathogens in the host
Hadj-Henni et al. Taxonomic assessment of Culicoides brunnicans, C. santonicus and C. vexans (Diptera: Ceratopogonidae) in France: Implications in systematics
Grebennikov Dryophthorinae weevils (Coleoptera: Curculionidae) of the forest. oor in Southeast Asia: Three-marker analysis reveals monophyly of Asian Stromboscerini and new identity of rediscovered Tasactes
US20220172801A1 (en) Training Device, Disease Affection Determination Device, Classification Device, Machine Learning Method, and Classification Method
US20120330563A1 (en) Assembly Error Detection
US20210193262A1 (en) System and method for predicting antimicrobial phenotypes using accessory genomes
Rodrigues et al. Novel RNA viruses associated with avian haemosporidian parasites
Molenaar et al. Detection of a divergent variant of grapevine virus F by next-generation sequencing
Jackson et al. hybpiper-rbgv and yang-and-smith-rbgv: Containerization and additional options for assembly and paralog detection in target enrichment data
Liu et al. Ongoing natural selection drives the evolution of SARS-CoV-2 genomes
You et al. The publicly-accessible RNA barcode segments based on the genetic tests of complete genome sequences for SARS-CoV-2 identification from HCoVs and SARSr-CoV-2 lineages

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170110

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190821

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20190821

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191125

R150 Certificate of patent or registration of utility model

Ref document number: 6624736

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250