JP2023515248A - 微生物の標的断片における特異的領域の識別方法、装置及び応用 - Google Patents

微生物の標的断片における特異的領域の識別方法、装置及び応用 Download PDF

Info

Publication number
JP2023515248A
JP2023515248A JP2022560020A JP2022560020A JP2023515248A JP 2023515248 A JP2023515248 A JP 2023515248A JP 2022560020 A JP2022560020 A JP 2022560020A JP 2022560020 A JP2022560020 A JP 2022560020A JP 2023515248 A JP2023515248 A JP 2023515248A
Authority
JP
Japan
Prior art keywords
candidate
specific region
target
sequence
fragments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2022560020A
Other languages
English (en)
Other versions
JP7366289B2 (ja
Inventor
▲ジ▼匆
邵俊斌
劉燕
斉霞
金宇丹
李啓騰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai ZJ Bio Tech Co Ltd
Original Assignee
Shanghai ZJ Bio Tech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai ZJ Bio Tech Co Ltd filed Critical Shanghai ZJ Bio Tech Co Ltd
Publication of JP2023515248A publication Critical patent/JP2023515248A/ja
Application granted granted Critical
Publication of JP7366289B2 publication Critical patent/JP7366289B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Library & Information Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本発明に係る微生物の標的断片における特異的領域の識別方法は、微生物の標的断片を1又は複数の比較菌株における全ゲノム配列とそれぞれ1対1でアライメントし、類似度が所定値を超えている断片を除去して、残りのいくつかの断片を1回目の切断片T1~Tnとして取得するステップS100と、前記1回目の切断片T1~Tnを残りの比較菌株における全ゲノム配列とそれぞれアライメントし、類似度が所定値を超えている断片を除去して、残った切断片の集合を微生物の標的断片における特異的領域候補として取得するステップS200と、特異的領域を検証及び取得するステップS300とを含む。本発明は精度が高い。また、感度に優れ、亜種レベルを識別可能である。且つ、二重の検証モジュールを有するため、結果が正確である。一部のrRNA遺伝子は同種の区別が不可能である。また、プラスミドは全てが種特異性を有しているわけではなく、普遍性も有さない。これに対し、本発明はあらゆる病原体の全ゲノムにおける特異的領域の識別に適用可能である。【選択図】図1

Description

本発明はバイオ情報学の分野に関し、特に、微生物の標的断片における特異的領域の識別方法、装置及び応用に関する。
生体試料における病原微生物のDNA濃度は非常に低く、検出限界に近いことが大半である。そのため、従来のPCR又はリアルタイムPCR検出を使用する場合には、往々にして検出感度が不足する。ツーステップネステッドPCR(two-step nested PCR)といった別の方法を感度の向上に用いることもできるが、こうした方法は時間を要し、コストが嵩むほか、精度に劣る。そのため、検出感度を向上させることが極めて重要となっている。方式の1つでは、プライマー設計の際に適切な鋳型領域を探すが、通常はプラスミド及び16SrRNAが選択される。
しかし、プラスミドを用いてプライマーを設計する場合には、いくつかの問題が発生する。なぜなら、全ての微生物が種特異的プラスミドを有しているわけではなく、プラスミドを持たない微生物も存在するからである。まず、プラスミドDNAの種特異性は確実ではない。ある種のプラスミドの配列が別の種のプラスミドの配列と非常に似ている場合には、プラスミドに基づくPCR検出の結果に偽陽性又は偽陰性が発生するリスクが高まる。よって、多くの臨床実験室では、依然として別のPCRプライマー対を用いて検証実験を行わねばならない。次に、プラスミドには普遍性がない。種によってはそもそもプラスミドを有さないため、プラスミドを用いてその種を検出することはできず、プラスミドにプライマーを設計して検出感度を向上させることはなおさら不可能である。例えば、およそ5%の淋菌(Neisseria gonorrhoeae)の菌株がプラスミドを有さなかったために検出不可能であったとの研究報告がある。
同様に、rRNA遺伝子領域をPCR検出の鋳型として選択する場合にも、いくつかの問題が存在する。rRNA遺伝子は全ての微生物種のゲノム中に存在し、複数のコピーを有するために検出感度を向上させられる場合が多い。しかし、実際には全てのrRNA遺伝子が特異性を有しているわけではなく、例えば、結核菌H37Rv中のrRNA遺伝子はコピーを1つしか有さない。また、一部のrRNA遺伝子は、配列の変化が検出に適していない。例えば、近親度が大変近い種同士、ないしは同種の異なるサブタイプの菌株同士では、rRNA遺伝子の配列があまりにも保守的なことから、種特異性、ひいては亜種特異性の要求を満たすことができない。
以上で述べた従来技術の欠点に鑑みて、本発明の目的は、微生物の標的断片における特異的領域の識別方法、装置及び応用を提供することである。
本発明は、第1の局面において、微生物の標的断片における特異的領域の識別方法を提供する。上記の方法は、少なくとも以下のステップを含む。
ステップS100:微生物の標的断片を1又は複数の比較菌株における全ゲノム配列とそれぞれ1対1でアライメントし、類似度が所定値を超えている断片を除去して、残りのいくつかの断片を1回目の切断片T~Tとして取得する。ここで、nは≧1の整数とする。
ステップS200:前記1回目の切断片T~Tを残りの比較菌株における全ゲノム配列とそれぞれアライメントし、類似度が所定値を超えている断片を除去して、残った切断片の集合を微生物の標的断片における特異的領域候補として取得する。
ステップS300特異的領域の検証及び取得:特異的領域候補が以下の条件を満たしているか否かを判断する。
1)共有データベースを検索して、特異的領域候補との類似度が所定値よりも大きいその他の種が存在するか否かを探す。
2)特異的領域候補を、各比較菌株の全ゲノム配列、及び微生物標的断片の由来菌株の宿主における全ゲノム配列とそれぞれアライメントし、類似度が所定値よりも大きい断片が存在するか否かを探す。
特異的領域候補が上記の条件をいずれも満たしていない場合には、当該特異的領域候補を微生物の標的断片における特異的領域とする。
本発明は、第2の局面において、微生物の標的断片における特異的領域の識別装置を提供する。前記装置は、少なくとも以下のモジュールを含む。
1回目切断片取得モジュール:微生物の標的断片を1又は複数の比較菌株における全ゲノム配列とそれぞれ1対1でアライメントし、類似度が所定値を超えている断片を除去して、残りのいくつかの断片を1回目の切断片T~Tとして取得する。ここで、nは≧1の整数とする。
特異的領域候補取得モジュール:前記1回目の切断片T~Tを残りの比較菌株における全ゲノム配列とそれぞれアライメントし、類似度が所定値を超えている断片を除去して、残った切断片の集合を微生物の標的断片における特異的領域候補として取得する。
特異的領域検証・取得モジュール:特異的領域候補が以下の条件を満たしているか否かを判断する。
1)共有データベースを検索して、特異的領域候補との類似度が所定値よりも大きいその他の種が存在するか否かを探す。
2)特異的領域候補を、各比較菌株の全ゲノム配列、及び微生物標的断片の由来菌株の宿主における全ゲノム配列とそれぞれアライメントし、類似度が所定値よりも大きい断片が存在するか否かを探す。
特異的領域候補が上記の条件をいずれも満たしていない場合には当該特異的領域候補を微生物の標的断片における特異的領域とする。
本発明は、第3の局面において、コンピュータで読取可能な記憶媒体を提供する。当該記憶媒体にはコンピュータプログラムが記憶されている。当該プログラムは、プロセッサで実行される際に上記微生物の標的断片における特異的領域の識別方法を実現する。
本発明は、第4の局面において、プロセッサ及び前記コンピュータで読取可能な記憶媒体を含むコンピュータ処理デバイスを提供する。前記プロセッサは、前記コンピュータで読取可能な記憶媒体上のコンピュータプログラムを実行することで、前記微生物の標的断片
における特異的領域の識別方法のステップを実現する。
本発明は、第5の局面において、プロセッサ、メモリ及び通信機を含む電子端末を提供する。前記メモリはコンピュータプログラムを記憶するために用いられ、前記通信機は外部機器との通信接続に用いられる。前記プロセッサは、前記端末に前記微生物の標的断片における特異的領域の識別方法を実行させるよう、前記メモリに記憶されているコンピュータプログラムを実行するために用いられる。
前記微生物の標的断片における特異的領域の識別方法、前記微生物の標的断片における特異的領域の識別装置、前記コンピュータで読取可能な記憶媒体、前記コンピュータ処理デバイス又は前記電子端末は、微生物の標的断片における特異的領域を識別する使用に用いられる。
上述したように、本発明に係る微生物の標的断片における特異的領域の識別方法、装置及び応用は、以下の有益な効果を有する。
本発明のテスト事例は、文献データベースと比較して、精度が高く、感度に優れ、亜種レベルを識別可能である。また、二重の検証モジュールを有するため、結果が正確である。プラスミドを利用して特異性を検出する場合には、全てのプラスミドが種特異性を有しているわけではなく、普遍性も有さないとの課題が存在する。また、rRNAを利用して特異性を検出する場合には、一部のrRNA遺伝子が同種を区別できないとの課題が存在する。これに対し、本発明は種特異性を検出可能であり、ひいては亜種特異性標的断片を検出可能である。また、ゲノムアノテーションの存在有無による制限を受けず、ターゲット菌株の名称を提供するか、ローカルから配列ファイルをアップロードするだけでよい。本発明は、細菌、ウィルス、真菌、アメーバ、クリプトスポリジウム、鞭毛虫、微胞子虫、ピロプラズマ原虫、マラリア原虫、トキソプラズマ、トリコモナス原虫、キネトプラスト類等を含む全ての病原性微生物に適用可能である。
図1は、本発明の実施例における方法のフローチャートである。 図1-1は、アライメント配列のカバー率及び配列一致率の計算結果を示す図である。 図1-2は、本発明における1回目の切断片Tを残りの比較菌株における全ゲノム配列とグループ別に繰り返しアライメントする方法を示す図である。 図1-3は、本発明の実施例の方法における配列を示す図である。 図2は、本発明の実施例における装置を示す図である。 図3は、本発明の実施例における電子端末を示す図である。
以下に、特定の具体的実施例によって本発明の実施形態につき説明する。なお、当業者であれば、本明細書に開示の内容から本発明のその他の利点及び効果を容易に理解可能である。更に、本発明は、その他の異なる具体的実施形態によっても実施又は応用が可能である。また、本明細書の各詳細事項については、視点及び応用の違いに応じて、本発明の精神を逸脱しないことを前提に各種の補足又は変更を加えてもよい。
そのほか、理解すべき点として、本発明で言及する1又は複数の方法ステップは、別途説明する場合を除き、これらの組み合わされるステップの前後に更にその他の方法ステップが存在してもよいこと、或いは、これらの明確に言及するステップの間に更にその他の方法ステップを挿入してもよいことを排除するものではない。更に、理解すべき点として、
本発明で提供する1又は複数のステップ間の組み合わせ及び接続関係は、別途説明する場合を除き、これらの組み合わされるステップの前後に更にその他のステップが存在してもよいこと、或いは、これらの明確に言及する2つのステップの間に更にその他のステップを挿入してもよいことを排除するものではない。且つ、別途説明する場合を除き、各方法ステップの番号は各方法ステップを区別するための便宜的な手段にすぎず、各方法ステップの配列順を規制するものでも、本発明で実施可能な範囲を限定するものでもない。よって、これらの相対関係の変更又は調整は、技術内容を実質的に変更しない限り、本発明で実施可能な範囲であるとみなされる。
図1~図3を参照する。説明すべき点として、本実施例で提供する図面は本発明の基本思想を概略的に説明するものにすぎない。図中には本発明に関係するアセンブリのみを示しているが、実際に実施する際のアセンブリの数、形状及びサイズに基づいて記載しているわけではない。実際に実施する際には、各アセンブリの形態、数及び比率を任意に変更してもよく、且つ、アセンブリのレイアウトや形態がより複雑になる場合もある。
図1に示すように、本実施例の標的断片における特異的領域の識別方法は、少なくとも以下のステップを含む。
ステップS100:微生物の標的断片を1又は複数の比較菌株における全ゲノム配列とそれぞれ1対1でアライメントし、類似度が所定値を超えている断片を除去して、残りのいくつかの断片を1回目の切断片T~Tとして取得する。ここで、nは≧1の整数とする。
ステップS200:前記1回目の切断片T~Tを残りの比較菌株における全ゲノム配列とそれぞれアライメントし、類似度が所定値を超えている断片を除去して、残った切断片の集合を微生物の標的断片における特異的領域候補として取得する。
ステップS300:特異的領域の検証及び取得:特異的領域候補が以下の条件を満たしているか否かを判断する。
1)共有データベースを検索して、特異的領域候補との類似度が所定値よりも大きいその他の種が存在するか否かを探す。
2)特異的領域候補を、各比較菌株の全ゲノム配列、及び微生物標的断片の由来菌株の宿主における全ゲノム配列とそれぞれアライメントし、類似度が所定値よりも大きい断片が存在するか否かを探す。
特異的領域候補が上記の条件をいずれも満たしていない場合には、当該特異的領域候補を微生物の標的断片における特異的領域とする。
上記の方法によって、前記微生物標的断片の由来菌株と比較菌株が同一種又は同一亜種であるか否かを区別することができる。
上記のステップにおいて、前記類似度とは、微生物の標的断片のカバー率と一致率の積である。

カバー率=(類似配列断片の長さ/(微生物の標的断片の終端値-微生物の標的断片の始端値+1))%
一致率とは、微生物の標的断片と比較菌株をアライメントしたときのidentity値である。2つの配列をアライメントした際のidentity値は、needle、water又はblat等のソフトウェアを用いて取得すればよい。
類似配列の長さとは、2つの配列をアライメントしたときに、一致した断片が標的断片に占める塩基数のことをいう。即ち、一致する断片の長さである。
類似度の所定値は必要に応じて決定すればよく、類似度の所定値が高いほど除去される断片は少なくなる。類似度の所定値は、例えば、96%、97%、98%、99%、100%というように、95%超とすることを推奨する。
具体的な配列を図1-3のステップS100に示す。図中の淡色の塩基は、類似度が所定値を超えている配列断片を表す。
微生物の標的断片のカバー率及び一致率は、needle、water或いはblatlatといったソフトウェアを利用して計算可能である。
例えば、計算結果は図1-1に示すようになる。配列Aは微生物の標的断片、配列Bは比較菌株1であり、配列AとBをアライメントしたところ、下記のようになった。

配列Aのカバー率=(187/(187-1+1))*100%=100%
また、配列Aと配列Bの一致率=98.4%となっている。
よって、AとBの類似度=100%*98.4%=98.4%となる。
ステップS100における微生物の標的断片と比較菌株は共有データベースから取得する。なお、前記共有データベースとしては主にncbiを選択する(https://www.ncbi.nlm.nih.gov)。
更に、上記の方法は以下のステップを含む。
ステップS110:選定した隣り合う微生物の標的断片を2つずつアライメントし、類似度が所定値よりも低いとのアライメント結果が出た場合には、警報を発するとともに、ターゲット株種に対応するスクリーニング条件を表示する。
これにより、人為的なエラーやその他の原因による異常データを除去可能である。ステップS100における微生物の標的断片は、微生物の全ゲノムとしてもよいし、微生物の遺伝子断片としてもよい。
ステップS200において、アライメントの速度を加速するために、好ましい実施形態では、前記1回目の切断片T~Tを残りの比較菌株における全ゲノム配列とそれぞれグループ別に繰り返しアライメントする。
具体的には、図1-2に示すように、1回目の切断片Tを残りの比較菌株における全ゲノム配列とグループ別に繰り返しアライメントする際には、以下のステップを含む。
ステップS210:残りの比較菌株をP個のグループに分割する。各グループには複数の比較菌株が含まれている。
ステップS211:1回目の切断片Tを第1グループにおける各比較菌株の全ゲノム配列と1対1で同時にアライメントし、類似度が所定値を超えている断片を除去する。そして、残ったいくつかの断片を1回目の切断片Tにおける1回目の配列候補ライブラリとして取得する。
ステップS212:1回目の切断片Tにおける前回の配列候補ライブラリを、次のグループにおける各比較菌株の全ゲノム配列と1対1で同時にアライメントし、類似度が所定値を超えている断片を除去する。そして、残ったいくつかの断片を1回目の切断片Tにおける次の配列候補ライブラリとして取得する。こうして、P回目の配列候補ライブラリを1回目の切断片Tの特異的配列候補ライブラリとして取得するまで、ステップS212を1回目の配列候補ライブラリから繰り返し実行する。
1回目の切断片における全ての特異的配列候補ライブラリの集合を特異的領域候補とする。
マルチスレッドがブロックされないよう、比較菌株の各グループに含まれる比較菌株の数は、演算環境のハードウェア構成に基づいて設定すべきである。当該数量は、動作環境の全体構成に基づいて設定したスレッド数とすればよく、一般的には1~50スレッドとすればよい。具体的には、1~4スレッド、4~8スレッド、8~10スレッド、10~20スレッド、20~50スレッドとすればよく、好ましくは4スレッドとする。なお、図1-2に示す実施形態では8スレッドとしている。
例えば、図1-2に示すように、標的配列が2541個の微生物標的断片を含んでおり、且つ、比較菌株が588個、m=8であるとする。まず、微生物の標的断片1を588個の比較菌株における配列1~8と同時に比較して1回目の切断を行い、一致配列を除去して、全体を取りまとめることで1回目の特異的配列ライブラリを取得する。次に、当該ライブラリを588個の比較菌株における配列9~16と同時に比較して2回目の切断を行い、一致配列を除去して、全体を取りまとめることで2回目の特異的配列ライブラリを取得する。続いて、当該ライブラリを588個の比較菌株における配列17~24と同時に比較して3回目の切断を行い、一致配列を除去して、全体を取りまとめることで3回目の特異的配列ライブラリを取得する。・・・、このようにして、73回目の特異的配列ライブラリを588個の比較菌株における配列585~588と同時に比較して74回目の切断を行い、一致配列を除去して、全体を取りまとめることで74回目の特異的配列ライブラリ(即ち、標的断片1の特異的配列ライブラリ)を取得するまで順に実行する。
続いて、標的配列における微生物の標的断片2を588個の比較菌株における配列1~8と同時に比較して1回目の切断を行い、一致配列を除去して、全体を取りまとめることで1回目の特異的配列ライブラリを取得する。次に、当該ライブラリを588個の比較菌株における配列9~16と同時に比較して2回目の切断を行い、一致配列を除去して、全体を取りまとめることで2回目の特異的配列ライブラリを取得する。続いて、当該ライブラリを588個の比較菌株における配列17~24と同時に比較して3回目の切断を行い、一致配列を除去して、全体を取りまとめることで3回目の特異的配列ライブラリを取得する。・・・、このようにして、73回目の特異的配列ライブラリを588個の比較菌株における配列585~588と同時に比較して74回目の切断を行い、一致配列を除去して、全体を取りまとめることで74回目の特異的配列ライブラリ(即ち、標的断片2の特異的配列ライブラリ)を取得するまで順に実行する。
こうして、標的配列における2541個の微生物標的断片と588個の比較菌株とのアライメントが全て完了するまで順に実行することで得られる切断片が、微生物の標的断片に
おける特異的領域候補となる。
好ましい実施形態では、ステップS200のあとに、更に、ステップS100及びS200を実行して標的配列における各微生物の標的断片の特異的領域候補を取得し、各微生物の標的断片における特異的領域候補の集合を標的配列の特異的領域候補とする。
標的配列は複数の標的断片を含み得る。複数の標的断片は、その他のスクリーニングステップによって微生物のゲノムから選別し、取得した断片としてもよい。例えば、特定の微生物の多コピー断片としてもよい。
ステップS300において、前記共有データベースとしては主にncbiを選択する(https://www.ncbi.nlm.nih.gov)。また、共有データベースを検索するアルゴリズムはblastアルゴリズムとすればよい。
更に、ステップS100、S200及びS300を実行する前に、演算環境のハードウェア構成に基づいて切断サイズを設定し、演算対象のデータをユニット切断する。具体的には、ステップS100において、演算対象のデータは標的断片である。また、ステップS200において、演算対象のデータは、一致配列を繰り返し除去するごとの該当特異的配列ライブラリである。また、ステップS300において、演算対象のデータは特異的領域候補である。
ユニット切断後のユニット数量*ユニットファイルの動作に必要な構成は、動作環境の全体構成を超えてはならない。
ユニット切断では、切断を要する配列の総数をスレッド数mで割ったものがユニット切断後のユニット数となる。マルチスレッド動作環境では、各スレッドが同一数の演算タスクを実行することで、最適な性能条件下における効率的な演算の実現を保証する。
図2に示すように、本実施例に係る微生物の標的断片における特異的領域の識別装置は、少なくとも以下のモジュール含む。
1回目切断片取得モジュール:微生物の標的断片を1又は複数の比較菌株における全ゲノム配列とそれぞれ1対1でアライメントし、類似度が所定値を超えている断片を除去して、残りのいくつかの断片を1回目の切断片T~Tとして取得する。ここで、nは≧1の整数とする。
特異的領域候補取得モジュール:前記1回目の切断片T~Tを残りの比較菌株における全ゲノム配列とそれぞれアライメントし、類似度が所定値を超えている断片を除去して、残った切断片の集合を微生物の標的断片における特異的領域候補として取得する。
特異的領域検証・取得モジュール:特異的領域候補が以下の条件を満たしているか否かを判断する。
1)共有データベースを検索して、特異的領域候補との類似度が所定値よりも大きいその他の種が存在するか否かを探す。
2)特異的領域候補を、各比較菌株の全ゲノム配列、及び微生物標的断片の由来菌株の宿主における全ゲノム配列とそれぞれアライメントし、類似度が所定値よりも大きい断片が存在するか否かを探す。
特異的領域候補が上記の条件をいずれも満たしていない場合には、当該特異的領域候補を微生物の標的断片における特異的領域とする。
上記の装置によって、前記微生物標的断片の由来菌株と比較菌株が同一種又は同一亜種であるか否かを区別することができる。
前記類似度とは、標的断片のカバー率と一致率の積である。また、前記カバー率=(類似配列断片の長さ/(微生物の標的断片の終端値-微生物の標的断片の始端値+1))%である。
前記特異的領域候補取得モジュールは、前記1回目の切断片T~Tを残りの比較菌株における全ゲノム配列とそれぞれグループ別に繰り返しアライメントする。
1回目の切断片Tを残りの比較菌株における全ゲノム配列とグループ別に繰り返しアライメントする場合、前記特異的領域候補取得モジュールは以下のサブモジュールを含む。
比較菌株グループ分けサブモジュール:残りの比較菌株をP個のグループに分割する。各グループには複数の比較菌株が含まれている。
1回目配列候補ライブラリ取得サブモジュール:1回目の切断片Tを第1グループにおける各比較菌株の全ゲノム配列と1対1で同時にアライメントし、類似度が所定値を超えている断片を除去する。そして、残ったいくつかの断片を1回目の切断片Tにおける1回目の配列候補ライブラリとして取得する。
特異的領域候補取得サブモジュール:1回目の切断片Tにおける前回の配列候補ライブラリを、次のグループにおける各比較菌株の全ゲノム配列と1対1で同時にアライメントし、類似度が所定値を超えている断片を除去する。そして、残ったいくつかの断片を1回目の切断片Tにおける次の配列候補ライブラリとして取得する。こうして、P回目の配列候補ライブラリを1回目の切断片Tの特異的配列候補ライブラリとして取得するまで、特異的領域候補取得サブモジュールを1回目の配列候補ライブラリから繰り返し実行させる。
1回目の切断片における全ての特異的配列候補ライブラリの集合を特異的領域候補とする。
比較菌株の各グループに含まれる比較菌株の数は、演算環境のハードウェア構成に基づいて設定する。
一実施形態において、前記装置は、標的配列の特異的領域候補取得モジュールを更に含む。当該モジュールは、標的断片の1回目切断片取得モジュールと標的断片の特異的領域候補取得モジュールを実行し、標的配列における各標的断片の特異的領域候補を取得して、各標的断片の特異的領域候補の集合を標的配列の特異的領域候補とする。
選択的に、1回目切断片取得モジュールは、更に以下のサブモジュールを含む。
元データ類似度比較サブモジュール:選定した隣り合う微生物の標的断片を2つずつアライメントし、類似度が所定値よりも低いとのアライメント結果が出た場合には、警報を発するとともに、ターゲット株種に対応するスクリーニング条件を表示する。
本実施例の装置と上記方法の実施例の原理は基本的に同様のため、上記の方法及び装置の
実施例では、同様の特徴についての定義、計算方法、実施形態の提示、及び好ましい実施形態の提示に関する詳細な記載は互いに共通とできる。よって、繰り返し詳述することはしない。
説明すべき点として、上記の装置における各モジュールの区分は論理機能の区分にすぎず、実際に実現する際には全部或いは一部を1つの物理的実体に集積してもよいし、物理的に切り離してもよいと解釈すべきである。且つ、これらのモジュールは、全てを処理素子でソフトウェアを呼び出す形式で実現してもよいし、全てをハードウェア形式で実現してもよいし、また、一部のモジュールを処理素子でソフトウェアを呼び出す形式で実現して一部のモジュールをハードウェア形式で実現してもよい。例えば、取得モジュールは、単独で設置される処理素子としてもよいし、いずれかのチップに集積して実現してもよい。また、プログラムコードの形式でメモリに記憶してもよいし、いずれかの処理素子により上記取得モジュールの機能を呼び出して実行してもよい。その他のモジュールの実現についてもこれと同様である。また、これらのモジュールの全部又は一部は一体的に集積してもよいし、個別に実現してもよい。ここでいう処理素子は、信号処理能力を有する集積回路とすればよい。実現過程において、上記方法の各ステップ又は上記の各モジュールは、処理素子におけるハードウェアの集積論理回路又はソフトウェア形式の命令により完了してもよい。
例えば、上記のモジュールは上記方法を実施する1又は複数の集積回路として配置すればよい。例えば、1又は複数の特定用途向け集積回路(Application Specific Integrated Circuit,ASICと略称)、或いは、1又は複数のマイクロプロセッサ(digital singnal processor,DSPと略称)、或いは、1又は複数のフィールドプログラマブルゲートアレイ(Field Programmable Gate Array,FPGAと略称)、或いは、GPU(Graphics Processing Unit,GPUと略称)等とすればよい。また、上記いずれかのモジュールを処理素子によりプログラムコードを呼び出す形式で実現する場合、当該処理素子は、例えば中央処理装置(Central Processing Unit,CPUと略称)やプログラムコードを呼び出し可能なその他のプロセッサといった汎用のプロセッサとすればよい。また、これらのモジュールは一体的に集積し、システムオンチップ(System-on-a-chip,SOCと略称)形式で実現してもよい。
本発明のいくつかの実施例では、更に、コンピュータで読取可能な記憶媒体を提供する。当該記憶媒体にはコンピュータプログラムが記憶されている。当該プログラムは、プロセッサで実行される際に上記微生物の標的断片における特異的領域の識別方法を実現する。
本発明のいくつかの実施例では、更に、プロセッサ及び前記コンピュータで読取可能な記憶媒体を含むコンピュータ処理デバイスを提供する。前記プロセッサは、前記コンピュータで読取可能な記憶媒体上のコンピュータプログラムを実行することで、前記微生物の標的断片における特異的領域の識別方法のステップを実現する。
本発明のいくつかの実施例では、更に、プロセッサ、メモリ及び通信機を含む電子端末を提供する。前記メモリはコンピュータプログラムを記憶するために用いられ、前記通信機は外部機器との通信接続に用いられる。前記プロセッサは、前記端末に前記微生物の標的断片における特異的領域の識別方法を実行及び実現させるよう、前記メモリに記憶されたコンピュータプログラムを実行するために用いられる。
図3は、本発明で提供する電子端末を示す図である。前記電子端末は、プロセッサ31、メモリ32、通信機33、通信インターフェース34及びシステムバス35を含む。メモ
リ32及び通信インターフェース34は、システムバス35を介してプロセッサ31及び通信機33に接続され、相互の通信を完了する。メモリ32はコンピュータプログラムを記憶するために用いられ、通信機33、通信インターフェース34はその他のデバイスとの通信に用いられる。プロセッサ31及び通信機33は、電子端末に上記の画像分析方法の各ステップを実行させるよう、コンピュータプログラムを動作させるために用いられる。
上記で言及したシステムバスは、ペリフェラルコンポーネントインターコネクト基準(Peripheral Pomponent Interconnect,PCIと略称)のバスや、イーアイサ(Extended Industry Standard Architecture,EISAと略称)バス等とすればよい。当該システムバスは、アドレスバス、データバス、制御バス等に分けられる。なお、表示の便宜上、図中では1本の太い線のみで示しているが、これは1本のバス又は1種類のバスのみを有することを意味しない。通信インターフェースは、データベースアクセス装置とその他のデバイス(例えば、クライアント、リーダ/ライタライブラリ、リードオンリーライブラリ)との通信の実現に用いられる。メモリは、ランダムアクセスメモリ(Random Access Memory,RAMと略称)を含んでもよいし、更に不揮発性メモリ(non-volatile memory)を含んでもよく、例えば少なくとも1つの磁気ディスクメモリを含む。
上記のプロセッサは、中央処理装置(Central Processing Unit,CPUと略称)、ネットワークプロセッサ(Network Processor,NPと略称)等を含む汎用のプロセッサとしてもよいし、デジタルシグナルプロセッサ(Digital Signal Processing,DSPと略称)、特定用途向け集積回路(Application Specific Integrated Circuit,ASICと略称)、フィールドプログラマブルゲートアレイ(Field-Programmable Gate Array,FPGAと略称)、グラフィックスプロセッサ(Graphics Processing Unit,GPUと略称)、又は、その他のプログラマブルロジックデバイス、ディスクリートゲート、又はトランジスタの論理デバイス、ディスクリートハードウェアユニットとしてもよい。
当業者であれば理解可能なように、上記各方法の実施例を実現する全部又は一部のステップは、コンピュータプログラムに関連するハードウェアで完了可能である。前記コンピュータプログラムは、コンピュータで読取可能な記憶媒体に記憶可能である。当該プログラムは、実行時に上記各方法の実施例に含まれるステップを実行する。前記コンピュータで読取可能な記憶媒体には、フロッピーディスク、光ディスク、CD-ROM(Compact Disc Read-Only Memory)、MOディスク、ROM(Read only memory)、RAM(Random access memory)、EPROM(消去可能プログラマブルROM)、EEPROM(電気的消去可能プログラマブルROM)、磁気カード又は光カード、フラッシュメモリ、或いは、機器で実行可能な命令の記憶に適したその他のタイプの媒体/機械可読媒体が含まれる(ただし、これらに限らない)。前記コンピュータで読取可能な記憶媒体は、コンピュータデバイスに未接続の製品としてもよいし、コンピュータデバイスに接続されて使用される部材としてもよい。
具体的に実現する場合、前記コンピュータプログラムは、特定のタスクの実行又は特定の抽象データ型を実現するルーチン、プログラム、オブジェクト、アセンブリ、データ構造等とする。
前記微生物の標的断片における特異的領域の識別方法、微生物標的断片における特異的領域の識別装置、コンピュータで読取可能な記憶媒体、コンピュータ処理デバイス又は電子
端末は、微生物のPCR検出に応用可能である。
具体的には、鋳型配列のスクリーニングに用いられる。
前記微生物の標的断片における特異的領域の識別方法、前記微生物の標的断片における特異的領域の識別装置、前記コンピュータで読取可能な記憶媒体、前記コンピュータ処理デバイス又は前記電子端末は、微生物の標的断片における特異的領域を識別する使用に用いられる。
上記の使用によって、前記微生物標的断片の由来菌株と比較菌株が同一種又は同一亜種であるか否かを区別する。
微生物は、細菌、ウィルス、真菌、アメーバ、クリプトスポリジウム、鞭毛虫、微胞子虫、ピロプラズマ原虫、マラリア原虫、トキソプラズマ、トリコモナス原虫又はキネトプラスト類の1又は複数から選択される。
上記の実施例は本発明の原理と効果を例示的に説明するものにすぎず、本発明を制限するものではない。本技術を熟知する者であれば、本発明の精神及び範囲を逸脱しないことを前提に、上記の実施例を補足又は変更することが可能である。従って、当業者が本発明で開示した精神及び技術的思想から逸脱することなく遂行するあらゆる等価の補足又は変更もまた本発明の請求の範囲に含まれる。

Claims (15)

  1. 微生物の標的断片を1又は複数の比較菌株における全ゲノム配列とそれぞれ1対1でアライメントし、類似度が所定値を超えている断片を除去して、残りのいくつかの断片を1回目の切断片T~Tとして取得し、nは≧1の整数であるステップS100と、
    前記1回目の切断片T~Tを残りの比較菌株における全ゲノム配列とそれぞれアライメントし、類似度が所定値を超えている断片を除去して、残った切断片の集合を微生物の標的断片における特異的領域候補として取得するステップS200と、
    特異的領域候補が以下の条件を満たしているか否かを判断し、
    1)共有データベースを検索して、特異的領域候補との類似度が所定値よりも大きいその他の種が存在するか否かを探し、
    2)特異的領域候補を、各比較菌株の全ゲノム配列、及び微生物標的断片の由来菌株の宿主における全ゲノム配列とそれぞれアライメントし、類似度が所定値よりも大きい断片が存在するか否かを探し、
    特異的領域候補が上記の条件をいずれも満たしていない場合には、当該特異的領域候補を微生物の標的断片における特異的領域とする特異的領域の検証及び取得ステップS300と、を少なくとも含むことを特徴とする微生物の標的断片における特異的領域の方法。
  2. a.上記の方法によって、前記微生物標的断片の由来菌株と比較菌株が同一種又は同一亜種であるか否かを区別可能であり、
    b.前記類似度とは、微生物の標的断片のカバー率と一致率の積であり、前記カバー率=(類似配列断片の長さ/(微生物の標的断片の終端値-微生物の標的断片の始端値+1))%であり、
    c.ステップS200において、前記1回目の切断片T~Tを残りの比較菌株における全ゲノム配列とそれぞれグループ別に繰り返しアライメントし、
    d.上記の方法は、更に、選定した隣り合う微生物の標的断片を2つずつアライメントし、類似度が所定値よりも低いとのアライメント結果が出た場合には、警報を発するとともに、ターゲット株種に対応するスクリーニング条件を表示するステップS110を含む、との特徴のうちの1又は複数を更に含むことを特徴とする請求項1に記載の微生物の標的断片における特異的領域の識別方法。
  3. 1回目の切断片Tを残りの比較菌株における全ゲノム配列とグループ別に繰り返しアライメントする際には、
    残りの比較菌株をP個のグループに分割し、各グループには複数の比較菌株が含まれているステップS210と、
    1回目の切断片Tを第1グループにおける各比較菌株の全ゲノム配列と1対1で同時にアライメントし、類似度が所定値を超えている断片を除去して、残ったいくつかの断片を1回目の切断片Tにおける1回目の配列候補ライブラリとして取得するステップS211と、
    1回目の切断片Tにおける前回の配列候補ライブラリを、次のグループにおける各比較菌株の全ゲノム配列と1対1で同時にアライメントし、類似度が所定値を超えている断片を除去して、残ったいくつかの断片を1回目の切断片Tにおける次の配列候補ライブラリとして取得し、P回目の配列候補ライブラリを1回目の切断片Tの特異的配列候補ライブラリとして取得するまで、ステップS212を1回目の配列候補ライブラリから繰り返し実行し、1回目の切断片における全ての特異的配列候補ライブラリの集合を特異的領域候補とするステップ212と、を含むことを特徴とする請求項2に記載の微生物の標的断片における特異的領域の識別方法。
  4. 比較菌株の各グループに含まれる比較菌株の数は、演算環境のハードウェア構成に基づき設定することを特徴とする請求項3に記載の微生物の標的断片における特異的領域の識別
    方法。
  5. ステップS200のあとに、
    ステップS100及びS200を実行して標的配列における各微生物の標的断片の特異的領域候補を取得し、各微生物の標的断片における特異的領域候補の集合を標的配列の特異的領域候補とすることを更に含むことを特徴とする請求項1に記載の微生物の標的断片における特異的領域の識別方法。
  6. 微生物の標的断片を1又は複数の比較菌株における全ゲノム配列とそれぞれ1対1でアライメントし、類似度が所定値を超えている断片を除去して、残りのいくつかの断片を1回目の切断片T~Tとして取得し、nは≧1の整数である1回目切断片取得モジュールと、
    前記1回目の切断片T~Tを残りの比較菌株における全ゲノム配列とそれぞれアライメントし、類似度が所定値を超えている断片を除去して、残った切断片の集合を微生物の標的断片における特異的領域候補として取得する特異的領域候補取得モジュールと、
    特異的領域候補が以下の条件を満たしているか否かを判断し、
    1)共有データベースを検索して、特異的領域候補との類似度が所定値よりも大きいその他の種が存在するか否かを探し、
    2)特異的領域候補を、各比較菌株の全ゲノム配列、及び微生物標的断片の由来菌株の宿主における全ゲノム配列とそれぞれアライメントし、類似度が所定値よりも大きい断片が存在するか否かを探し、
    特異的領域候補が上記の条件をいずれも満たしていない場合には、当該特異的領域候補を微生物の標的断片における特異的領域とする特異的領域検証・取得モジュールとを少なくとも含むことを特徴とする微生物の標的断片における特異的領域の識別装置。
  7. a.上記の装置は、前記微生物標的断片の由来菌株と比較菌株が同一種又は同一亜種であるか否かを区別可能であり、
    b.前記類似度とは、微生物の標的断片のカバー率と一致率の積であり、前記カバー率=(類似配列断片の長さ/(微生物の標的断片の終端値-微生物の標的断片の始端値+1))%であり、
    c.前記特異的領域候補取得モジュールは、前記1回目の切断片T~Tを残りの比較菌株における全ゲノム配列とそれぞれグループ別に繰り返しアライメントし、
    d.1回目切断片取得モジュールは、更に、選定した隣り合う微生物の標的断片を2つずつアライメントし、類似度が所定値よりも低いとのアライメント結果が出た場合には、警報を発するとともに、ターゲット株種に対応するスクリーニング条件を表示する元データ類似度比較サブモジュールを含む、
    との特徴のうちの1又は複数を更に含むことを特徴とする請求項6に記載の微生物の標的断片における特異的領域の識別装置。
  8. 1回目の切断片Tを残りの比較菌株における全ゲノム配列とグループ別に繰り返しアライメントする場合、前記特異的領域候補取得モジュールは、
    残りの比較菌株をP個のグループに分割し、各グループに複数の比較菌株が含まれている比較菌株グループ分けサブモジュールと、
    1回目の切断片Tを第1グループにおける各比較菌株の全ゲノム配列と1対1で同時にアライメントし、類似度が所定値を超えている断片を除去して、残ったいくつかの断片を1回目の切断片Tにおける1回目の配列候補ライブラリとして取得する1回目配列候補ライブラリ取得サブモジュールと、
    1回目の切断片Tにおける前回の配列候補ライブラリを、次のグループにおける各比較菌株の全ゲノム配列と1対1で同時にアライメントし、類似度が所定値を超えている断片を除去して、残ったいくつかの断片を1回目の切断片Tにおける次の配列候補ライブラ
    リとして取得し、P回目の配列候補ライブラリを1回目の切断片Tの特異的配列候補ライブラリとして取得するまで、特異的領域候補取得サブモジュールを1回目の配列候補ライブラリから繰り返し実行させ、1回目の切断片における全ての特異的配列候補ライブラリの集合を特異的領域候補とする特異的領域候補取得サブモジュールと、を含むことを特徴とする請求項7に記載の微生物の標的断片における特異的領域の識別装置。
  9. 比較菌株の各グループに含まれる比較菌株の数は、演算環境のハードウェア構成に基づき設定することを特徴とする請求項8に記載の微生物の標的断片における特異的領域の識別装置。
  10. 更に、標的配列の特異的領域候補取得モジュールを含み、当該モジュールは、標的断片の1回目切断片取得モジュールと微生物の標的断片の特異的領域候補取得モジュールを実行し、標的配列における各微生物の標的断片の特異的領域候補を取得して、各微生物の標的断片における特異的領域候補の集合を標的配列の特異的領域候補とすることを特徴とする請求項6に記載の微生物の標的断片における特異的領域の識別装置。
  11. コンピュータプログラムが記憶されている記憶媒体であって、
    当該プログラムは、プロセッサで実行される際に、請求項1~5のいずれかに記載の微生物の標的断片における特異的領域の識別方法を実現することを特徴とするコンピュータで読取可能な記憶媒体。
  12. プロセッサ及び請求項11に記載のコンピュータで読取可能な記憶媒体を含むデバイスであって、
    前記プロセッサは、前記コンピュータで読取可能な記憶媒体上のコンピュータプログラムを実行することで、請求項1~5のいずれかに記載の微生物の標的断片における特異的領域の識別方法のステップを実現することを特徴とするコンピュータ処理デバイス。
  13. プロセッサ、メモリ及び通信機を含む電子端末であって、前記メモリはコンピュータプログラムを記憶するために用いられ、前記通信機は外部機器との通信接続に用いられ、前記プロセッサは、前記端末に請求項1~5のいずれかに記載の微生物の標的断片における特異的領域の識別方法を実行させるよう、前記メモリに記憶されているコンピュータプログラムを実行するために用いられることを特徴とする電子端末。
  14. 請求項1~5に記載の微生物の標的断片における特異的領域の識別方法、請求項6~10に記載の微生物の標的断片における特異的領域の識別装置、請求項11に記載のコンピュータで読取可能な記憶媒体、請求項12に記載のコンピュータ処理デバイス又は請求項13に記載の電子端末の、微生物の標的断片における特異的領域を識別するための使用。
  15. a.上記の使用によって、前記微生物標的断片の由来菌株と比較菌株が同一種又は同一亜種であるか否かを区別し、
    b.微生物は、細菌、ウィルス、真菌、アメーバ、クリプトスポリジウム、鞭毛虫、微胞子虫、ピロプラズマ原虫、マラリア原虫、トキソプラズマ、トリコモナス原虫又はキネトプラスト類の1又は複数から選択される、
    との特徴のうちの1又は複数を更に含むことを特徴とする請求項14に記載の使用。
JP2022560020A 2020-04-02 2020-05-14 微生物の標的断片における特異的領域の識別方法、装置及び応用 Active JP7366289B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN202010254403.4A CN111477274B (zh) 2020-04-02 2020-04-02 微生物目标片段中特异性区域的识别方法、装置及应用
CN202010254403.4 2020-04-02
PCT/CN2020/090180 WO2021196358A1 (zh) 2020-04-02 2020-05-14 微生物目标片段中特异性区域的识别方法、装置及应用

Publications (2)

Publication Number Publication Date
JP2023515248A true JP2023515248A (ja) 2023-04-12
JP7366289B2 JP7366289B2 (ja) 2023-10-20

Family

ID=71750532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022560020A Active JP7366289B2 (ja) 2020-04-02 2020-05-14 微生物の標的断片における特異的領域の識別方法、装置及び応用

Country Status (6)

Country Link
US (1) US20230129284A1 (ja)
EP (1) EP4116983A4 (ja)
JP (1) JP7366289B2 (ja)
CN (1) CN111477274B (ja)
AU (1) AU2020440744A1 (ja)
WO (1) WO2021196358A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005135154A (ja) * 2003-10-30 2005-05-26 Hitachi Ltd 配列類似性に基づく遺伝子オントロジーターム予測方法
WO2006027913A1 (ja) * 2004-08-10 2006-03-16 Waseda University 特徴パターン認識システムおよびその方法、並びにプログラム
US20090006002A1 (en) * 2007-04-13 2009-01-01 Sequenom, Inc. Comparative sequence analysis processes and systems
JP2015536661A (ja) * 2012-11-29 2015-12-24 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 標的シーケンシングリードの正確かつ迅速なマッピング
JP2016502162A (ja) * 2012-10-15 2016-01-21 テクニカル ユニバーシティ オブ デンマーク 未加工のシーケンシングデータのデータベースにより駆動される一次解析

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6996477B2 (en) * 2001-04-19 2006-02-07 Dana Farber Cancer Institute, Inc. Computational subtraction method
US20130267429A1 (en) * 2009-12-21 2013-10-10 Lawrence Livermore National Security, Llc Biological sample target classification, detection and selection methods, and related arrays and oligonucleotide probes
US20140235456A1 (en) * 2012-12-17 2014-08-21 Virginia Tech Intellectual Properties, Inc. Methods and Compositions for Identifying Global Microsatellite Instability and for Characterizing Informative Microsatellite Loci
US10796783B2 (en) * 2015-08-18 2020-10-06 Psomagen, Inc. Method and system for multiplex primer design
CN105274092A (zh) * 2015-11-30 2016-01-27 中国人民解放军军事医学科学院卫生学环境医学研究所 一种特异性等温寡核苷酸探针的批量获取方法
CN105938522A (zh) * 2016-04-11 2016-09-14 中国人民解放军第三军医大学 一种预测细菌iv型分泌系统效应分子的方法
CN107463795A (zh) * 2017-08-02 2017-12-12 南昌大学 一种识别酪氨酸翻译后修饰位点的预测算法
US20190214110A1 (en) * 2017-12-07 2019-07-11 Seven Bridges Genomics Inc. Detection of insufficient homology regions in a reference sequence
CN108359692B (zh) * 2018-01-19 2022-03-15 陕西师范大学 一种特异性靶向hDGKθ基因的荧光素酶报告系统
IL280651B2 (en) * 2018-08-30 2024-05-01 Univ Montreal A proteogenome-based method for identifying tumor-specific antigens
CN109554488B (zh) * 2019-01-24 2021-10-15 中国水产科学研究院长江水产研究所 雌性施氏鲟特异dna片段及应用
CN110808086B (zh) * 2019-09-30 2022-10-28 广州白云山和记黄埔中药有限公司 一种鉴定关键酶基因的植物物种特异性序列片段的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005135154A (ja) * 2003-10-30 2005-05-26 Hitachi Ltd 配列類似性に基づく遺伝子オントロジーターム予測方法
WO2006027913A1 (ja) * 2004-08-10 2006-03-16 Waseda University 特徴パターン認識システムおよびその方法、並びにプログラム
US20090006002A1 (en) * 2007-04-13 2009-01-01 Sequenom, Inc. Comparative sequence analysis processes and systems
JP2016502162A (ja) * 2012-10-15 2016-01-21 テクニカル ユニバーシティ オブ デンマーク 未加工のシーケンシングデータのデータベースにより駆動される一次解析
JP2015536661A (ja) * 2012-11-29 2015-12-24 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 標的シーケンシングリードの正確かつ迅速なマッピング

Also Published As

Publication number Publication date
JP7366289B2 (ja) 2023-10-20
AU2020440744A1 (en) 2022-11-10
CN111477274A (zh) 2020-07-31
US20230129284A1 (en) 2023-04-27
CN111477274B (zh) 2020-11-24
WO2021196358A1 (zh) 2021-10-07
EP4116983A4 (en) 2023-12-13
EP4116983A1 (en) 2023-01-11

Similar Documents

Publication Publication Date Title
JP7333482B2 (ja) 微生物の種特異的共通配列の取得方法、装置及び応用
EP2926288B1 (en) Accurate and fast mapping of targeted sequencing reads
CN111009286A (zh) 对宿主样本进行微生物分析的方法和装置
CN106460045B (zh) 人类基因组常见拷贝数变异用于癌症易感风险评估
Qiu et al. A Bayesian approach to accurate and robust signature detection on LINCS L1000 data
Jung et al. An automatic block and spot indexing with k-nearest neighbors graph for microarray image analysis
Lun et al. From reads to regions: a Bioconductor workflow to detect differential binding in ChIP-seq data
CN115312121A (zh) 靶基因位点检测方法、装置、介质及程序产品
JP2023515248A (ja) 微生物の標的断片における特異的領域の識別方法、装置及び応用
CN110970093B (zh) 一种筛选引物设计模板的方法、装置及应用
JP7367234B2 (ja) 微生物の標的断片における多コピー領域の識別方法、装置及び応用
CN113628682B (zh) 一种t790m和c797s顺反式突变类型识别及计算方法
CN112599196B (zh) 构建对核酸序列进行分类的模型方法及其应用
US20170024514A1 (en) Distance maps using multiple alignment consensus construction
Ji et al. Shine: A novel strategy to extract specific, sensitive and well-conserved biomarkers from massive microbial genomic datasets
CN117894367A (zh) 微生物特异性序列保守性的筛选评估方法
KR20240001450A (ko) 나노포어시퀀싱을 이용한 바이러스 탐색 및 바이롬 분석
Cabanski Statistical Methods for Analysis of Genetic Data
Goldstein et al. De Novo Assembly of Distance Maps using on the fly Multiple Alignment Consensus Construction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221011

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20221011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230913

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231010

R150 Certificate of patent or registration of utility model

Ref document number: 7366289

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150