JP6586088B2 - 配列をアラインするための方法およびシステム - Google Patents
配列をアラインするための方法およびシステム Download PDFInfo
- Publication number
- JP6586088B2 JP6586088B2 JP2016536446A JP2016536446A JP6586088B2 JP 6586088 B2 JP6586088 B2 JP 6586088B2 JP 2016536446 A JP2016536446 A JP 2016536446A JP 2016536446 A JP2016536446 A JP 2016536446A JP 6586088 B2 JP6586088 B2 JP 6586088B2
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- item
- dag
- string
- construct
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/20—Sequence assembly
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Description
本出願は、2013年9月3日に出願された米国特許出願第14/016,833号および2013年8月21日に出願された米国特許出願第61/868,249号の優先権を主張し、当該出願の両方は、その全体が本明細書において参考として援用される。
本発明は、配列(例えば、核酸配列、アミノ酸配列)を互いにアラインして、試料(例えば、遺伝子試料、タンパク質試料)に対応する連続的な配列リードを作製するための方法およびシステムに関する。本発明は加えて、試料中の変異型を同定するための方法にも関する。
遺伝学は、分析科学から、情報科学へと進化している。研究者はかつて、どのようにして核酸を抽出および同定するのかで奮闘したが、今や、このような技法は、些末なものとなっている。次世代シーケンシング(NGS:next−generation sequencing)(例えば、全トランスクリプトームショットガンシーケンシング、ピロシーケンシング、イオン半導体シーケンシング、合成を介するシーケンシング)は、全ゲノムをカバーする何百万ものリードを、わずか数日間で作り出すことが可能である。このスループットを達成するために、NGSシーケンシングでは、小型の核酸配列に対する大規模な並列化であって、併せて、大きな遺伝情報体、例えば、染色体またはゲノムを構成する並列化を使用する。遺伝子試料から出発して、核酸(例えば、DNA)を切断し、増幅し、超高速で読み取る。これらの能力を考慮して、研究者は現在、いかにして(廉価に)リードをアラインして、疾患または疾患の危険性を指し示す配列内の遺伝子座を同定するのかで奮闘している。
(S1)AGCTA−CGTACACTACC(配列番号12)
(S2)AGCTATCGTAC−−TAGC(配列番号13)
を表示する。
MATCH_BONUS:10
MISMATCH_PENALTY:−20
INSERTION_PENALTY:−40
OPENING_PENALTY:−10
DELETION_PENALTY:−5
となる。上記のギャップペナルティー(INSERTION_PENALTY、OPENING_PENALTY)の間の関係は、ギャップ挿入ペナルティーを、ギャップオープニングコストより大きく設定することにより、ギャップオープニングの数を制限する、すなわち、ギャップをまとめてグループ化することを支援する一助となる。当然ながら、MISMATCH_PENALTY、MATCH_BONUS、INSERTION_PENALTY、OPENING_PENALTY、およびDELETION_PENALTYの間の代替的な関係も可能である。
核酸リードをアラインして遺伝子型解析するのに単一の基準配列を使用する先行技術による配列アライメント法と異なり、本発明では、種内、集団内、なおまたは単一の生物における異なる細胞間の遺伝子配列の変異性を構成しうる構築物を使用する。遺伝子変異についての表示は、有向非巡回グラフ(DAG)(上記で論じた)の行−列によるアライメント行列、またはdeBruijnグラフとして提示することができ、これらの構築物は、アライメントアルゴリズムのパラメータを適正に設定する(下記で論じる)ことを条件として、本発明のアライメント法と共に使用することができる。
一実施形態では、アルゴリズムを使用して、配列リードを、有向非巡回グラフ(DAG)にアラインする。「発明の背景」で表されたアルゴリズムと異なり、アライメントアルゴリズムでは、DAG(例えば、基準配列構築物)上の位置において含有される各配列に対する最大スコアを同定することにより、Cijの最大値を同定する。実際、先行する位置を「振り返って」見ることにより、複数の可能な経路にわたり最適のアライメントを同定することが可能である。
(i)dが、そのノードの配列の第1の文字でなければ、そのノード内のdに先行する文字が、その(唯一の)先行成分であり、
(ii)dが、そのノードの配列の第1の文字であれば、任意のノードの配列の最後の文字であって、dのノードの親である文字が、dの先行成分である。
M[j,d]=max{a,i,e,0} (6)
[式中、
P[d]中のp*について、e=max{M[j,p*]+DELETE_PENALTY}
i=M[j−1,d]+INSERT_PENALTY
S[j]=dならば、P[d]中のp*について、a=max{M[j−1,p*]+MATCH_SCORE};
S[j]≠dならば、P[d]中のp*について、a=max{M[j−1,p*]+MISMATCH_PENALTY}
で規定される通り、a、i、e、および0のうちの最大値を見出すことを伴う。
Smith−Waterman−Gotohアルゴリズムの逐次形は、大規模な並列化に適応し、大幅に改変されている。例えば、超並列連想処理を使用するSmith−Waterman法(SWAMP)と呼ばれるASCモデルについては、参照によりその全体において本明細書に組み込まれる、米国特許公開第2012/0239706号において記載されている。SWAMP(および他の並列処理システム)のための並列化の一部は、任意の反対角成分に沿った値が、互いから独立であるという事実から来る。こうして、所与の反対角成分に沿ったセルの全ては、計算資源を分散させるように、並列的に処理することができる。上記の再帰式で示されたデータの依存性により、達成可能な並列処理のレベルは制限されるが、ウェーブフロント法を使用することにより、この有用なアルゴリズムはさらに加速化されると予想される。Wozniak(Comput Appl in the Biosciences(CABIOS)、13巻(2号):145〜150頁、1997年)により、Sun Ultra SPARC上で実行されるウェーブフロント法では、特化したSIMD様のビデオ処理命令を使用する。Wozniakは、SIMDレジスターを使用して、副対角成分に沿った値を保存したところ、同じマシン上の従来の実行に対して2倍の加速化を報告している。Wozniakの例に続く、コードを並列化する同様の様式は、ストリーミングSIMD拡張(SSE:Streaming SIMD Extension)セットを、x86アーキテクチャーに使用することである。Intelにより設計されたベクトル様演算では、少数の値(通例、4つ、8つ、または16の値)に対する単一の演算/命令を、一度に完了させる。多くのAMD製チップおよびIntel製チップが、SSEの多様なバージョンを支援しており、Intelでは、その最新チップセットのためのアドバンストベクトルエクステンション(AVX)に関して、この技術の開発を継続している。
Smith−Waterman配列アライメントを開発および拡張するのに使用される、主要な並列モデルは、連想計算(ASC:ASsociative Computing)(Potterら、Computer、27巻(11号):19〜25頁、1994年)である。本明細書では、Smith−Watermanアルゴリズムの効率的な並列バージョンが記載される。本節では、このモデルおよび他の1つのモデルが詳細に記載される。
複数命令複数データモデルまたはMIMDモデルは、現在利用可能な並列システムの大半について記載するものであり、最新の一般用コンピュータクラスターを含む。MIMDプロセッサーは、各々がそれ固有のローカルメモリを伴う(Quinn、Parallel Computing: Theory and Practice、2版、New York: McGraw−Hill、1994年)、本格的中央処理装置(CPU:central processing unit)を有する。SIMDモデルと異なり、MIMDプロセッサーの各々は、それ固有のプログラムを、非同期的に保存および実行する。MIMDプロセッサーは、それらが通信することを可能とするネットワークを介して接続されるが、使用されるネットワークは、マシン(クラスターノード)間のEthernet(登録商標)接続、Myrinet接続、およびInfiniBand接続にわたり、広く変化しうる。通信は、SIMDよりはるかに拘束の緩やかな通信構造を採用する傾向があり、単一のユニット内に収まらない。データは、ネットワークに沿って、個々のプロセッサーにより、それらが実行しつつある、それらの個々のプログラムの制御下で、非同期的に移送される。通信は、メッセージの送受信を支援する複数の異なる並列言語のうちの1つにより操作されることが典型的である。このための極めて一般的なライブラリーは、メッセージパッシングインターフェース(MPI)として公知である。「SIMD様」方式の通信も可能であるが、データの移動は、非同期的となろう。MIMDによる並列計算は通例、プロセッサーにより実行される多様なタスクが、高度に独立(すなわち、いわゆる「驚異的並列(embarrassingly parallel)」問題または「完全並列(pleasingly parallel)」問題)でない限りにおいて、広範な通信および頻繁な同期化を必要とする。第8節で提示される作業では、InfiniBandを介して接続された、AMD Opteronクラスターを使用する。
SIMDモデルは、PEと呼ばれる、複数の単純な演算処理エレメント(processing element)からなる。各PEは、それ固有のローカルメモリであって、PEがそこからフェッチおよび保存するメモリは有するが、プログラムをコンパイルまたは実行する能力は有さない。本明細書で使用される「並列メモリ」という用語は、計算システム内のローカルメモリを集合的に指す。例えば、並列メモリは、SIMDコンピュータシステム内のローカルメモリの集合体(例えば、PEのローカルメモリ)、MIMDコンピュータシステム内のプロセッサーのローカルメモリの集合体(例えば、中央処理装置のローカルメモリ)などでありうる。プログラムのコンパイルおよび実行は、制御装置(またはフロントエンド)と呼ばれるプロセッサーにより操作される(Quinn、Parallel Computing: Theory and Practice、2版、New York: McGraw−Hill、1994年)。制御装置は、通例はバスにより、全てのPEへと接続される。
連想計算(ASC)モデルとは、Goodyear AerospaceのKenneth Batcher博士により設計されたSIMD式連想コンピュータであるSTARAN、および米国海軍で大いに活用されているその後継モデルであるASPROに基づく拡張型SIMDである。
SWAMPアルゴリズムに関与性の機能については、下記で論じる。
ASCアルゴリズムにおける基礎的演算は、連想検索である。連想検索では、そのローカルデータが、所与の検索キーにマッチするPEを、同時に位置特定する。マッチするデータを有するPEは、レスポンダーと呼ばれ、非マッチしないデータを伴うPEは、非レスポンダーと呼ばれる。検索を実施した後、次いで、アルゴリズムは、非レスポンダーを無効化することにより、さらなる処理を、レスポンダーに影響を及ぼす処理だけに制限することができる(またはこの逆も成り立つ)。さらなる検索を実施することにより、レスポンダーのセットをさらに精緻化することができる。連想検索は、どのPEが、対角成分内の並列動作中でアクティブなのかを選択するときに、SWAMP+により大いに活用される。
各PEが、標準的な比較演算子(等しい、未満など)を使用して、そのローカルデータを、検索キーに照らして比較する、単純検索に加えて、連想コンピュータはまた、全PEアレイからのデータを一体に組み合わせて、レスポンダーのセットを決定する、大域検索も実施しうる。大域検索の最も一般的な種類は、レスポンダーを、それらのデータが、全PEアレイにわたる最大値または最小値であるPEとする、最大値/最小値検索である。SWAMP+は、それが処理するあらゆる対角成分内で最大値を使用して、それまでに計算された最高値を追跡する。最大値検索の使用は、高頻度で、論理的並列動作において1回ずつ、アライメント1つ当たりm+n回生じる。
連想検索は、複数のレスポンダーを結果としてもたらすことが可能であり、連想アルゴリズムは、3つの異なるモード:並列選択、逐次選択、または単独選択のうちの1つにおいて、これらのレスポンダーを処理しうる。並列レスポンダー処理では、同じ演算セットを、各レスポンダーに対して、同時に実施する。逐次レスポンダー処理では、各レスポンダーを、個別に選択し、各レスポンダーについて、異なる演算セットを許容する。単独レスポンダー選択(pickOneとしてもまた公知の)では、1つの任意選択されたレスポンダーを選択して、処理にかける。複数のレスポンダーに加えてまた、連想検索は、レスポンダーを結果としてもたらさない可能性もある。この場合を取り扱うために、ASCモデルでは、その場合に、別個のアクションのセットを検索および実施するのに何らかのレスポンダー(anyRespondersとして公知の)が存在するのかどうかを検出することが可能である。SWAMPでは、アラインされた文字を含有する複数のレスポンダーを、上述の連想検索に基づき、並列的に選択および処理する。単独レスポンダー選択は、最大値/最小値検索を使用する場合に、正確な同じ最大値を有する複数の値が存在すれば、その時点で生じる。
大半の連想プロセッサーは、アレイ内の並列データの移動を可能とする、いくつかの種類のPE相互接続ネットワークを含む。ASCモデルそれ自体は、任意の特定の相互接続ネットワークを指定せず、実際、多くの有用な連想アルゴリズムは、相互接続ネットワークを必要としない。連想プロセッサーは、1D直線状アレイまたは2Dメッシュなど、単純なネットワークを実装することが典型的である。これらのネットワークは、実装が簡単であり、データを、迅速に、同期方式で転送することを可能とする。例えば、1D直線状アレイは、SWAMPアルゴリズムにおける、PE間の明示的通信に十分である。
一般化された並列処理アーキテクチャーを、図5に示す。各コンポーネントは、直接的な接続を有するものとして示されるが、多様なエレメントは、地理的に隔てられうるが、ネットワーク、例えば、インターネットを介して、接続されうることを理解されたい。ハイブリッドコンフィギュレーションも可能であるが、並列コンピュータ内のメインメモリは、単一のアドレス空間内の全ての処理エレメント間で共有されているか、または分散されている、すなわち、各処理エレメントが、それ固有のローカルアドレス空間を有する(分散型メモリとは、メモリが論理的に分散されているという事実を指すがまた、それが、物理的に分散されていることもしばしば示唆する)ことが典型的である。処理エレメントが、それ固有のローカルメモリおよび非ローカルプロセッサー上のメモリへのアクセスを有する場合、分散型共有メモリおよびメモリの視覚化は、2つの手法を組み合わせる。ローカルメモリへのアクセスは、非ローカルメモリへのアクセスより速いことが典型的である。
本発明は、生物学的試料から回収された核酸に対応する配列(例えば、核酸配列、アミノ酸配列)を作製するための方法を含む。一部の実施形態では、結果として得られる情報を使用して、対象から得られた核酸素材中に存在する突然変異を同定することができる。一部の実施形態では、試料、すなわち、核酸(例えば、DNAまたはRNA)を対象から得、核酸を処理し(溶解させ、増幅し、かつ/または精製し)、下記に記載される方法を使用して、核酸をシーケンシングする。多くの実施形態では、シーケンシングの結果は、直鎖状の核酸配列ではなく、何千または何百万もの個々の短い核酸リードであって、対象についての配列へとリアセンブルしなければならない核酸リードのコレクションである。リードをアラインして配列を作製したら、アラインされた配列を、基準配列と比較して、例えば、疾患を指し示す突然変異を同定することができる。他の実施形態では、リードの、基準配列構築物、すなわち、上記で記載した、有向非巡回グラフ(「DAG」)へのアライメントに基づき、特定の突然変異を伴う対象を同定することができる。
シーケンシングは、当技術分野で公知の任意の方法を介しうる。DNAシーケンシング法は、標識されたターミネーターまたはプライマーおよびスラブ内またはキャピラリー内のゲル分離を使用する、古典的なジデオキシシーケンシング反応(サンガー法)、可逆的終結型標識ヌクレオチドを使用する、合成を介するシーケンシング、ピロシーケンシング、454シーケンシング、標識されたオリゴヌクレオチドプローブのライブラリーとの、対立遺伝子特異的ハイブリダイゼーション、標識されたクローンのライブラリーとの対立遺伝子特異的ハイブリダイゼーションに続いてライゲーションを使用する、合成を介するシーケンシング、重合化ステップにおける、標識されたヌクレオチドの組込みについての、リアルタイムモニタリング、ポロニーシーケンシング、およびSOLiDシーケンシングを含む。分離された分子のシーケンシングは、より近年になって、ポリメラーゼまたはリガーゼを使用する、逐次的伸長反応または単一の伸長反応によるほか、プローブのライブラリーとの単一の示差的ハイブリダイゼーションまたは逐次的な示差的ハイブリダイゼーションによっても裏付けられている。シーケンシングの前に、試料中の核酸の一部または全部を増幅することは、さらに有益でありうる。一部の実施形態では、核酸を、当技術分野で公知のポリメラーゼ連鎖反応(PCR)法を使用して増幅する。
本開示を通して特許、特許出願、特許公開、雑誌、書籍、論文、ウェブコンテンツなど、他の文献に対する言及および引用を行ってきた。全てのこのような文献は、参照によりそれらの全体において全て目的で本明細書に組み込まれる。
当業者には、本明細書で示され、記載される実施形態に加えて、本発明の多様な改変およびその多くのさらなる実施形態も、本明細書で引用される研究文献および特許文献への言及を含む、本明細書の全内容から明らかとなろう。本明細書における対象物は、その多様な実施形態における本発明およびその同等物の実施に適応させうる、重要な情報、例示、および指針を含有する。
例えば、本発明は以下の項目を提供する。
(項目1)
複数の配列リードをアラインするための、プロセッサーおよび非一時的メモリを含むシステムであって、前記メモリは、実行された際、前記プロセッサーに、
複数の配列リードを、記号のストリングとして得て;
配列リードに対応する記号の各ストリングを、基準配列構築物内の複数の位置と比較し、ここで前記構築物は、前記構築物内の複数の位置において、記号の少なくとも2つの異なるストリングを含み;
配列リードに対応する記号の各ストリングと、前記基準配列構築物内の前記複数の位置の各々との重複をスコア付けし、ここで高スコアは重複の量が大きいことに対応し;
各配列リードについて、最高のスコアに対応する前記重複を同定し;
各配列リードを、最高のスコアに対応する前記構築物上の場所へと割り当て;
アラインされた各配列リードの前記場所に対応するメモリにファイルを書き込む
ことをさせる命令を含む、システム。
(項目2)
前記配列リードが、核酸配列リードである、項目1に記載のシステム。
(項目3)
前記配列リードが、アミノ酸配列リードである、項目1に記載のシステム。
(項目4)
前記メモリが、実行された際、前記プロセッサーに、
各配列リードの前記割り当てられた場所に基づき、前記複数のアラインされた配列リードをアセンブルして、アセンブルされた配列を得て;
前記アセンブルされた配列に対応するメモリにファイルを書き込む
ことをさせる命令をさらに含む、項目1に記載のシステム。
(項目5)
前記アセンブルされた配列が、生物の遺伝子配列に対応する、項目4に記載のシステム。
(項目6)
前記遺伝子配列が、染色体またはゲノムを実質的に包含する、項目5に記載のシステム。
(項目7)
1または複数のアラインされた配列リードの前記場所に基づき、生物に遺伝子型を割り当てることをさらに含む、項目1に記載のシステム。
(項目8)
前記割り当てられた遺伝子型を、疾患の危険性と相関させることをさらに含む、項目7に記載のシステム。
(項目9)
前記疾患が、がんである、項目8に記載のシステム。
(項目10)
前記基準配列構築物が、非一時的コンピュータ可読メディアに保存された位置および記号についてのデータベースを含む、項目1に記載の方法。
(項目11)
前記システムが、複数のプロセッサーを含み、各プロセッサーが、前記複数の配列リードの部分を前記基準配列構築物と比較しスコア付けするように構成されている、項目1に記載のシステム。
(項目12)
前記メモリが、第2のプロセッサーが、得て、比較し、スコア付けし、同定し、割り当て、次いで前記割り当てられた場所を第1のプロセッサーへと送信することを前記第1のプロセッサーに命令させる命令をさらに含む、項目1に記載のシステム。
(項目13)
前記基準配列構築物上の各位置が、基準配列内の核酸に対応する、項目1に記載のシステム。
(項目14)
前記構築物上の各位置が、基準配列内のアミノ酸に対応する、項目1に記載のシステム。
(項目15)
前記構築物上の各位置が、基準配列内の遺伝子に対応する、項目1に記載のシステム。
(項目16)
前記基準配列構築物が、方向を有する、項目1に記載のシステム。
(項目17)
前記基準配列構築物を前記方向で通る経路が、生物のゲノムを表示する、項目16に記載のシステム。
(項目18)
前記基準配列構築物を前記方向で通る経路が、生物の染色体を表示する、項目16に記載のシステム。
(項目19)
前記基準配列構築物を前記方向で通る経路が、タンパク質を表示する、項目16に記載のシステム。
(項目20)
前記基準配列構築物を前記方向で通る経路が、非巡回経路である、項目16に記載のシステム。
(項目21)
前記構築物内の記号の前記少なくとも2つの異なるストリングが、前記位置における公知の配列変異を表示する、項目1に記載のシステム。
(項目22)
記号の前記少なくとも2つの異なるストリングが、塩基の挿入または塩基の欠失により互いに異なる核酸配列に対応する、項目1に記載のシステム。
(項目23)
記号の前記少なくとも2つの異なるストリングが、アミノ酸の挿入またはアミノ酸の欠失により互いに異なるポリペプチドに対応する、項目1に記載のシステム。
(項目24)
前記基準配列構築物が、1,000を超える記号を含む、項目1に記載のシステム。
(項目25)
前記基準配列構築物が、1,000,000を超える記号を含む、項目24に記載のシステム。
(項目26)
前記複数の配列リードが、1000を超える配列リードを含む、項目1に記載のシステム。
(項目27)
前記複数の配列リードの大部分が、記号100個を超える長さである、項目1に記載のシステム。
(項目28)
前記複数の配列リードが、次世代シーケンシング法の出力ファイルである、項目1に記載のシステム。
(項目29)
複数の配列リードをアラインする方法であって、
複数の配列リードを得るステップと;
基準配列構築物に対する各配列リードごとの配列の重複をスコア付けするステップであり、前記構築物は、前記構築物内の複数の位置において、位置1箇所当たり少なくとも2つの代替配列を含み、ここで重複が大きくなればより高いスコアがもたらされる、ステップと;
各配列リードごとの前記スコアが最大化されるように、各配列リードを前記構築物内の場所にアラインするステップと
を含む方法。
(項目30)
前記構築物に対する前記配列のアライメントに基づき、前記配列リードを互いにアセンブルするステップをさらに含む、項目29に記載の方法。
(項目31)
前記配列リードが、核酸配列リードである、項目29に記載の方法。
(項目32)
前記配列リードが、アミノ酸配列リードである、項目29に記載の方法。
(項目33)
前記構築物内の各位置が、基準配列内の塩基またはアミノ酸に対応する、項目29に記載の方法。
(項目34)
前記構築物内の各位置が、基準配列内の遺伝子に対応する、項目29に記載の方法。
(項目35)
前記基準配列構築物が、方向を有する、項目29に記載の方法。
(項目36)
前記基準配列構築物を前記方向で通る経路が、生物のゲノムを表示する、項目35に記載の方法。
(項目37)
前記基準配列構築物を前記方向で通る経路が、生物の染色体を表示する、項目35に記載の方法。
(項目38)
前記基準配列構築物を前記方向で通る経路が、タンパク質を表示する、項目35に記載の方法。
(項目39)
前記基準配列を通る経路が、非巡回経路である、項目35に記載の方法。
(項目40)
前記構築物内の前記少なくとも2つの代替配列が、前記位置における公知の遺伝子変異を表示する、項目29に記載の方法。
(項目41)
前記核酸リードの前記割り当てられた場所に基づき、生物に遺伝子型を割り当てるステップをさらに含む、項目40に記載の方法。
(項目42)
前記構築物内の前記少なくとも2つの代替配列が、前記位置における公知の構造変異を表示する、項目29に記載の方法。
(項目43)
前記少なくとも2つの代替配列が、塩基の挿入または塩基の欠失により互いに異なる、項目29に記載の方法。
(項目44)
前記少なくとも2つの代替配列が、アミノ酸の挿入またはアミノ酸の欠失により互いに異なる、項目29に記載の方法。
(項目45)
各リードが、核酸塩基の測定された配列を表示する記号のストリングを含む、項目29に記載の方法。
(項目46)
核酸塩基の前記測定された配列が、サンガーシーケンシング、ピロシーケンシング、イオン半導体シーケンシング、合成を介するシーケンシング、ライゲーションを介するシーケンシング、および単一分子リアルタイムシーケンシングから選択されるシーケンシング法により決定される、項目45に記載の方法。
(項目47)
各リードが、アミノ酸の測定された配列を表示する記号のストリングを含む、項目29に記載の方法。
(項目48)
アミノ酸の前記測定された配列が、質量分析により決定される、項目47に記載の方法。
(項目49)
前記基準配列構築物が、1,000を超える塩基を含む、項目29に記載の方法。
(項目50)
前記基準配列構築物が、1,000,000を超える塩基を含む、項目49に記載の方法。
(項目51)
前記複数のリードが、1000を超えるリードを含む、項目29に記載の方法。
(項目52)
前記複数のリードの大部分が、100塩基対を超える長さである、項目29に記載の方法。
(項目53)
前記複数のリードの大部分が、10アミノ酸を超える長さである、項目29に記載の方法。
(項目54)
前記基準配列構築物が、コンピュータ可読メディアに保存された位置および配列のデータベースを含む、項目29に記載の方法。
(項目55)
前記リードが、コンピュータ可読メディアに保存された記号のストリングを含む、項目54に記載の方法。
(項目56)
試料に由来する複数の核酸をシーケンシングするステップをさらに含む、項目29に記載の方法。
(項目57)
前記試料を患者から得るステップをさらに含む、項目56に記載の方法。
(項目58)
前記試料が、血液、尿、唾液、痰、糞便、乳首吸引物、汗、毛包、口腔内スワブ、または組織から選択される、項目56に記載の方法。
(項目59)
複数の核酸を、前記試料から単離するステップをさらに含む、項目58に記載の方法。
(項目60)
前記単離された複数の核酸の少なくとも一部を増幅するステップをさらに含む、項目59に記載の方法。
(項目61)
複数の核酸リードをアラインする方法であって、
複数の核酸リードを得るステップと;
前記リード内の塩基と前記構築物内の塩基との重複をスコア付けするアルゴリズムを使用して、前記核酸リードを、基準配列構築物にアラインするステップであり、前記構築物は、前記構築物内の複数の位置において、位置1箇所当たり少なくとも2つの代替配列を含む、ステップと
を含む方法。
(項目62)
前記アルゴリズムが、前記少なくとも2つの配列間の選択に応じた最大の重複スコアを計算する、項目61に記載の方法。
(項目63)
前記基準配列構築物が、有向非巡回グラフである、項目61に記載の方法。
(項目64)
前記構築物が、少なくとも1,000塩基を含む、項目61に記載の方法。
(項目65)
前記構築物が、少なくとも1,000,000塩基を含む、項目64に記載の方法。
(項目66)
複数のアミノ酸リードをアラインする方法であって、
複数のアミノ酸リードを得るステップと;
前記リード内のアミノ酸と前記構築物内のアミノ酸との重複をスコア付けするアルゴリズムを使用して、前記アミノ酸リードを、基準配列構築物にアラインするステップであり、前記構築物は、前記構築物内の複数の位置において、位置1箇所当たり少なくとも2つの代替配列を含む、ステップと
を含む方法。
(項目67)
前記アルゴリズムが、前記少なくとも2つの配列間の選択に応じた最大の重複スコアを計算する、項目66に記載の方法。
(項目68)
前記基準配列構築物が、有向非巡回グラフである、項目66に記載の方法。
(項目69)
前記構築物が、少なくとも100アミノ酸を含む、項目66に記載の方法。
(項目70)
前記構築物が、少なくとも10,000アミノ酸を含む、項目69に記載の方法。
(項目71)
コンピュータで実行される複数のリードをアラインする方法であって、
複数のリードを、記号のストリングとして得るステップと;
コンピュータプロセッサーを使用して、リードに対応する記号の各ストリングを、基準配列構築物内の複数の位置と比較するステップであり、前記構築物は、前記構築物内の複数の位置において、記号の少なくとも2つの異なるストリングを含む、ステップと;
記号の前記ストリングと、前記基準配列構築物内の前記複数の位置の各々との重複を、プロセッサーによりスコア付けするステップであり、高スコアは重複の量が大きいことに対応する、ステップと;
各リードについて、最高のスコアに対応する前記重複を同定するステップと;
前記リードを、最高のスコアに対応する前記構築物上の場所にアラインするステップとを含む方法。
(項目72)
前記構築物上の、前記アラインされた場所に基づき、前記リードを互いにアセンブルするステップをさらに含む、項目71に記載の方法。
(項目73)
前記リードが、核酸リードである、項目71に記載の方法。
(項目74)
前記リードが、アミノ酸リードである、項目71に記載の方法。
(項目75)
前記構築物上の各位置が、基準配列内の塩基に対応する、項目71に記載の方法。
(項目76)
前記構築物上の各位置が、基準配列内のアミノ酸に対応する、項目71に記載の方法。
(項目77)
前記構築物上の各位置が、基準配列内の遺伝子に対応する、項目71に記載の方法。
(項目78)
前記基準配列構築物が、方向を有する、項目71に記載の方法。
(項目79)
前記基準配列構築物を前記方向で通る経路が、生物のゲノムを表示する、項目78に記載の方法。
(項目80)
前記基準配列構築物を前記方向で通る経路が、生物の染色体を表示する、項目78に記載の方法。
(項目81)
前記基準配列構築物を前記方向で通る経路が、タンパク質を表示する、項目78に記載の方法。
(項目82)
前記基準配列構築物を前記方向で通る経路が、非巡回経路である、項目78に記載の方法。
(項目83)
前記構築物内の前記少なくとも2つの代替配列が、前記位置における公知の遺伝子変異を表示する、項目71に記載の方法。
(項目84)
前記核酸リードの前記割り当てられた場所に基づき、生物に遺伝子型を割り当てるステップをさらに含む、項目83に記載の方法。
(項目85)
前記少なくとも2つの代替配列が、塩基の挿入または塩基の欠失により互いに異なる、項目71に記載の方法。
(項目86)
各核酸リードが、核酸塩基の測定された配列を表示する記号のストリングを含む、項目71に記載の方法。
(項目87)
核酸塩基の前記測定された配列が、サンガーシーケンシング、ピロシーケンシング、イオン半導体シーケンシング、合成を介するシーケンシング、ライゲーションを介するシーケンシング、および単一分子リアルタイムシーケンシングから選択されるシーケンシング法により決定される、項目86に記載の方法。
(項目88)
前記基準配列構築物が、1,000を超える塩基を含む、項目71に記載の方法。
(項目89)
前記基準配列構築物が、1,000,000を超える塩基を含む、項目88に記載の方法。
(項目90)
前記複数の核酸リードが、1000を超えるリードを含む、項目71に記載の方法。
(項目91)
前記複数の核酸リードの大部分が、100塩基対を超える長さである、項目71に記載の方法。
(項目92)
コンピュータで実行される複数のリードをアラインする方法であって、
複数のリードを、記号のストリングとして得るステップと;
前記リードと前記構築物との重複をスコア付けするアルゴリズムを実行するプロセッサーを使用して、前記リードを、基準配列構築物にアラインするステップであり、前記構築物は、前記構築物内の複数の位置において、位置1箇所当たり少なくとも2つの代替配列を含む、ステップとを含む方法。
(項目93)
前記アルゴリズムが、前記少なくとも2つの代替配列の選択に応じて最大の重複スコアを計算する、項目92に記載の方法。
(項目94)
前記基準配列構築物が、有向非巡回グラフである、項目92に記載の方法。
(項目95)
前記複数の核酸リードが、コンピュータ可読メディアに保存される、項目92に記載の方法。
(項目96)
前記基準配列構築物が、コンピュータ可読メディアに保存されたデータベースを含む、項目92に記載の方法。
(項目97)
複数のリードをアラインするための、プロセッサーおよびメモリを含むシステムであって、前記メモリは、実行された際、前記プロセッサーに、
複数のリードを、記号のストリングとして得て;
前記リードと前記構築物との重複をスコア付けするアルゴリズムを使用して、前記リードを基準配列構築物にアラインし、ここで前記構築物は、前記構築物内の複数の位置において、位置1箇所当たり少なくとも2つの代替配列を含み;
前記アラインされた配列に対応するメモリにファイルを書き込む
ことをさせる命令を含む、システム。
(項目98)
前記メモリが、実行された際、前記少なくとも2つの代替配列の選択に応じて最大の重複スコアを計算することを前記プロセッサーにさせる命令をさらに含む、項目97に記載のシステム。
(項目99)
前記基準配列構築物が、有向非巡回グラフである、項目97に記載のシステム。
(項目100)
前記複数のリードが、コンピュータ可読メディアに保存される、項目97に記載のシステム。
(項目101)
前記基準配列構築物が、コンピュータ可読メディアに保存されたデータベースを含む、項目97に記載のシステム。
(項目102)
複数の配列リードをアラインする方法であって、
複数の配列リードを得るステップと;
基準配列構築物に対する各配列リードごとの配列の重複をスコア付けするステップであり、前記構築物は、前記構築物内の複数の位置において、位置1箇所当たり少なくとも2つの代替配列を含み、ここで重複が大きくなればより低いスコアがもたらされる、ステップと;
各配列リードごとの前記スコアが最小化されるように、各配列リードを、前記構築物内の場所にアラインするステップと
を含む方法。
(項目103)
コンピュータで実行される複数のリードをアラインする方法であって、
複数のリードを、記号のストリングとして得るステップと;
コンピュータプロセッサーを使用して、リードに対応する記号の各ストリングを、基準配列構築物内の複数の位置と比較するステップであり、前記構築物は、前記構築物内の複数の位置において、記号の少なくとも2つの異なるストリングを含む、ステップと;
記号の前記ストリングと、前記基準配列構築物内の前記複数の位置の各々との重複を、プロセッサーによりスコア付けするステップであり、低スコアは重複の量が大きいことに対応する、ステップと;
各リードについて、最低のスコアに対応する前記重複を同定するステップと;
前記リードを、最低のスコアに対応する前記構築物上の場所にアラインするステップとを含む方法。
(項目104)
複数のリードをアラインするための、プロセッサーおよびメモリを含むシステムであって、前記メモリは、実行された際、前記プロセッサーに、
複数のリードを、記号のストリングとして得て;
リードに対応する記号の各ストリングを、基準配列構築物内の複数の位置と比較し、ここで前記構築物は、前記構築物内の複数の位置において、記号の少なくとも2つの異なるストリングを含み;
記号の前記ストリングと、前記基準配列構築物内の前記複数の位置の各々との重複をスコア付けし、ここで低スコアは重複の量が大きいことに対応し;
各核酸リードについて、最低のスコアに対応する前記重複を同定し;
前記核酸リードを、最低のスコアに対応する前記構築物上の場所へと割り当て;
前記アラインされた配列に対応するメモリにファイルを書き込む
ことをさせる命令を含む、システム。
Claims (28)
- 複数の配列リードをアラインするための、プロセッサーおよび非一時的メモリを含むシステムであって、前記メモリは、実行された際、前記プロセッサーに、
複数の配列リードを、記号のストリングとして得て;
配列リードに対応する記号の各ストリングを、複数のノードを含む基準有向非巡回グラフ(DAG)内の複数の位置と比較し、ここで各ノードは、1または複数の記号のストリング、および、親ノードのセット、として前記メモリに保存され、前記ストリングは配列を表示し、前記親ノードのセットは、前記ノードの位置を前記基準DAG内の他のノードに対して規定し、前記DAG内の複数の位置における代替的なノードによって、遺伝子変異が表示され;
各配列リードと、前記基準DAG内の前記複数の位置の各々との重複をスコア付けし、ここで高スコアは重複の量が大きいことに対応し;
前記スコア付けがさらに、配列リードに対応する記号の各ストリングと、ある位置に先行する前記DAGの部分との最適のアラインメントを見出すことを含み、前記ノードのストリングの各記号の先行成分が、(i)ある記号がそのノードのストリングの第1の記号でなければ、前記記号に先行する記号が、その唯一の先行成分である;あるいは、(ii)ある記号がそのノードのストリングの第1の記号であれば、任意の親ノードのストリングの最後の記号が先行成分である、によって同定され;
各配列リードを、最高のスコアに対応する前記DAG上の場所へと割り当て;
アラインされた各配列リードの前記場所に対応するメモリにファイルを書き込む
ことをさせる命令を含む、システム。 - 前記配列リードが、核酸配列リードである、請求項1に記載のシステム。
- 前記配列リードが、アミノ酸配列リードである、請求項1に記載のシステム。
- 前記メモリが、実行された際、前記プロセッサーに、
各配列リードの前記割り当てられた場所に基づき、前記複数のアラインされた配列リードをアセンブルして、アセンブルされた配列を得て;
前記アセンブルされた配列に対応するメモリにファイルを書き込むことをさせる命令をさらに含む、請求項1に記載のシステム。 - 前記アセンブルされた配列が、生物の遺伝子配列に対応する、請求項4に記載のシステム。
- 前記遺伝子配列が、染色体またはゲノムを実質的に包含する、請求項5に記載のシステム。
- 1または複数のアラインされた配列リードの前記場所に基づき、生物に遺伝子型を割り当てることをさらに含む、請求項1に記載のシステム。
- 前記割り当てられた遺伝子型を、疾患の危険性と相関させることをさらに含む、請求項7に記載のシステム。
- 前記疾患が、がんである、請求項8に記載のシステム。
- 前記基準DAGが、非一時的コンピュータ可読メディアに保存された位置および記号についてのデータベースを含む、請求項1に記載のシステム。
- 前記システムが、複数のプロセッサーを含み、各プロセッサーが、前記複数の配列リードの部分を前記基準DAGと比較しスコア付けするように構成されている、請求項1に記載のシステム。
- 前記メモリが、第2のプロセッサーが、得て、比較し、スコア付けし、同定し、割り当て、次いで前記割り当てられた場所を第1のプロセッサーへと送信することを前記第1のプロセッサーに命令させる命令をさらに含む、請求項1に記載のシステム。
- 前記基準DAG上の各位置が、基準配列内の核酸に対応する、請求項1に記載のシステム。
- 前記DAG上の各位置が、基準配列内のアミノ酸に対応する、請求項1に記載のシステム。
- 前記DAG上の各位置が、基準配列内の遺伝子に対応する、請求項1に記載のシステム。
- 前記基準DAGが、方向を有する、請求項1に記載のシステム。
- 前記基準DAGを前記方向で通る経路が、生物のゲノムを表示する、請求項16に記載のシステム。
- 前記基準DAGを前記方向で通る経路が、生物の染色体を表示する、請求項16に記載のシステム。
- 前記基準DAGを前記方向で通る経路が、タンパク質を表示する、請求項16に記載のシステム。
- 前記基準DAGを前記方向で通る経路が、非巡回経路である、請求項16に記載のシステム。
- 前記DAG内の記号の前記代替的なノードが、前記位置における公知の配列変異を表示する、請求項1に記載のシステム。
- 前記代替的なノードが、塩基の挿入または塩基の欠失により互いに異なる核酸配列に対応する、請求項1に記載のシステム。
- 前記代替的なノードが、アミノ酸の挿入またはアミノ酸の欠失により互いに異なるポリペプチドに対応する、請求項1に記載のシステム。
- 前記基準DAGが、1,000を超える記号を含む、請求項1に記載のシステム。
- 前記基準DAGが、1,000,000を超える記号を含む、請求項24に記載のシステム。
- 前記複数の配列リードが、1000を超える配列リードを含む、請求項1に記載のシステム。
- 前記複数の配列リードの大部分が、記号100個を超える長さである、請求項1に記載のシステム。
- 前記複数の配列リードが、次世代シーケンシング法の出力ファイルである、請求項1に記載のシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019162661A JP6902073B2 (ja) | 2013-08-21 | 2019-09-06 | 配列をアラインするための方法およびシステム |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361868249P | 2013-08-21 | 2013-08-21 | |
US61/868,249 | 2013-08-21 | ||
US14/016,833 | 2013-09-03 | ||
US14/016,833 US9898575B2 (en) | 2013-08-21 | 2013-09-03 | Methods and systems for aligning sequences |
PCT/US2014/052065 WO2015027050A1 (en) | 2013-08-21 | 2014-08-21 | Methods and systems for aligning sequences |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019162661A Division JP6902073B2 (ja) | 2013-08-21 | 2019-09-06 | 配列をアラインするための方法およびシステム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2016536698A JP2016536698A (ja) | 2016-11-24 |
JP2016536698A5 JP2016536698A5 (ja) | 2017-08-31 |
JP6586088B2 true JP6586088B2 (ja) | 2019-10-02 |
Family
ID=52481122
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016536446A Active JP6586088B2 (ja) | 2013-08-21 | 2014-08-21 | 配列をアラインするための方法およびシステム |
JP2019162661A Active JP6902073B2 (ja) | 2013-08-21 | 2019-09-06 | 配列をアラインするための方法およびシステム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019162661A Active JP6902073B2 (ja) | 2013-08-21 | 2019-09-06 | 配列をアラインするための方法およびシステム |
Country Status (9)
Country | Link |
---|---|
US (2) | US9898575B2 (ja) |
EP (2) | EP3036344B1 (ja) |
JP (2) | JP6586088B2 (ja) |
KR (1) | KR102371953B1 (ja) |
CN (1) | CN105637098B (ja) |
AU (1) | AU2014308794B2 (ja) |
CA (1) | CA2921645C (ja) |
SG (1) | SG11201601124YA (ja) |
WO (1) | WO2015027050A1 (ja) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9116866B2 (en) | 2013-08-21 | 2015-08-25 | Seven Bridges Genomics Inc. | Methods and systems for detecting sequence variants |
US9898575B2 (en) * | 2013-08-21 | 2018-02-20 | Seven Bridges Genomics Inc. | Methods and systems for aligning sequences |
CN105793689B (zh) | 2013-10-18 | 2020-04-17 | 七桥基因公司 | 用于将遗传样本基因分型的方法和系统 |
AU2014337093B2 (en) | 2013-10-18 | 2020-07-30 | Seven Bridges Genomics Inc. | Methods and systems for identifying disease-induced mutations |
WO2015058095A1 (en) | 2013-10-18 | 2015-04-23 | Seven Bridges Genomics Inc. | Methods and systems for quantifying sequence alignment |
US11049587B2 (en) | 2013-10-18 | 2021-06-29 | Seven Bridges Genomics Inc. | Methods and systems for aligning sequences in the presence of repeating elements |
US9092402B2 (en) | 2013-10-21 | 2015-07-28 | Seven Bridges Genomics Inc. | Systems and methods for using paired-end data in directed acyclic structure |
US9817944B2 (en) | 2014-02-11 | 2017-11-14 | Seven Bridges Genomics Inc. | Systems and methods for analyzing sequence data |
WO2016141294A1 (en) | 2015-03-05 | 2016-09-09 | Seven Bridges Genomics Inc. | Systems and methods for genomic pattern analysis |
US10275567B2 (en) | 2015-05-22 | 2019-04-30 | Seven Bridges Genomics Inc. | Systems and methods for haplotyping |
CA2930597A1 (en) | 2015-05-22 | 2016-11-22 | The University Of British Columbia | Methods for the graphical representation of genomic sequence data |
US20160364523A1 (en) * | 2015-06-11 | 2016-12-15 | Seven Bridges Genomics Inc. | Systems and methods for identifying microorganisms |
US10793895B2 (en) | 2015-08-24 | 2020-10-06 | Seven Bridges Genomics Inc. | Systems and methods for epigenetic analysis |
US10724110B2 (en) | 2015-09-01 | 2020-07-28 | Seven Bridges Genomics Inc. | Systems and methods for analyzing viral nucleic acids |
US10584380B2 (en) | 2015-09-01 | 2020-03-10 | Seven Bridges Genomics Inc. | Systems and methods for mitochondrial analysis |
US11347704B2 (en) | 2015-10-16 | 2022-05-31 | Seven Bridges Genomics Inc. | Biological graph or sequence serialization |
US20170199960A1 (en) | 2016-01-07 | 2017-07-13 | Seven Bridges Genomics Inc. | Systems and methods for adaptive local alignment for graph genomes |
US10364468B2 (en) | 2016-01-13 | 2019-07-30 | Seven Bridges Genomics Inc. | Systems and methods for analyzing circulating tumor DNA |
US10460829B2 (en) | 2016-01-26 | 2019-10-29 | Seven Bridges Genomics Inc. | Systems and methods for encoding genetic variation for a population |
US10262102B2 (en) | 2016-02-24 | 2019-04-16 | Seven Bridges Genomics Inc. | Systems and methods for genotyping with graph reference |
US10790044B2 (en) | 2016-05-19 | 2020-09-29 | Seven Bridges Genomics Inc. | Systems and methods for sequence encoding, storage, and compression |
US9940212B2 (en) * | 2016-06-09 | 2018-04-10 | Google Llc | Automatic qubit calibration |
US10600499B2 (en) | 2016-07-13 | 2020-03-24 | Seven Bridges Genomics Inc. | Systems and methods for reconciling variants in sequence data relative to reference sequence data |
US11289177B2 (en) | 2016-08-08 | 2022-03-29 | Seven Bridges Genomics, Inc. | Computer method and system of identifying genomic mutations using graph-based local assembly |
US11250931B2 (en) | 2016-09-01 | 2022-02-15 | Seven Bridges Genomics Inc. | Systems and methods for detecting recombination |
JP7052955B2 (ja) * | 2016-11-16 | 2022-04-12 | イルミナ インコーポレイテッド | 配列決定データリード再整列の方法、コンピュータシステム及びコンピュータプログラム製品 |
US10319465B2 (en) | 2016-11-16 | 2019-06-11 | Seven Bridges Genomics Inc. | Systems and methods for aligning sequences to graph references |
US10726110B2 (en) * | 2017-03-01 | 2020-07-28 | Seven Bridges Genomics, Inc. | Watermarking for data security in bioinformatic sequence analysis |
US11347844B2 (en) | 2017-03-01 | 2022-05-31 | Seven Bridges Genomics, Inc. | Data security in bioinformatic sequence analysis |
US20180260520A1 (en) * | 2017-03-08 | 2018-09-13 | Björn Pollex | Systems and methods for aligning sequences to graph reference constructs |
EP3467690A1 (en) * | 2017-10-06 | 2019-04-10 | Emweb bvba | Improved alignment method for nucleic acid sequences |
JP7054133B2 (ja) * | 2017-11-09 | 2022-04-13 | 国立研究開発法人国立がん研究センター | 配列解析方法、配列解析装置、参照配列の生成方法、参照配列生成装置、プログラム、および記録媒体 |
US20200294622A1 (en) * | 2017-12-04 | 2020-09-17 | Nantomics, Llc | Subtyping of TNBC And Methods |
CN110310705B (zh) * | 2018-03-16 | 2021-05-14 | 北京哲源科技有限责任公司 | 支持simd的序列比对方法及装置 |
JP7428660B2 (ja) | 2018-05-31 | 2024-02-06 | コーニンクレッカ フィリップス エヌ ヴェ | グラフベースの参照ゲノムを使用した対立遺伝子解釈のためのシステムおよび方法 |
WO2020025114A1 (en) * | 2018-07-31 | 2020-02-06 | Vestel Elektronik Sanayi Ve Ticaret A.S. | Method, apparatus, system and computer program for data distribution |
US11726757B2 (en) * | 2019-08-14 | 2023-08-15 | Nvidia Corporation | Processor for performing dynamic programming according to an instruction, and a method for configuring a processor for dynamic programming via an instruction |
EP4309177A1 (en) | 2021-03-17 | 2024-01-24 | Seven Bridges Genomics Inc. | Systems and methods for generating graph references |
CN113268270B (zh) * | 2021-06-07 | 2022-10-21 | 中科计算技术西部研究院 | 一种针对成对隐马尔可夫模型的加速方法、系统及装置 |
TWI801287B (zh) * | 2021-07-20 | 2023-05-01 | 奧義智慧科技股份有限公司 | 用於產生階層式有向無環圖的事件視覺化裝置與相關的電腦程式產品 |
US11550584B1 (en) * | 2021-09-30 | 2023-01-10 | Nvidia Corporation | Implementing specialized instructions for accelerating Smith-Waterman sequence alignments |
US11822541B2 (en) | 2021-09-30 | 2023-11-21 | Nvidia Corporation | Techniques for storing sub-alignment data when accelerating Smith-Waterman sequence alignments |
CN115862740B (zh) * | 2022-12-06 | 2023-09-12 | 中国人民解放军军事科学院军事医学研究院 | 一种面向大规模病毒基因组数据的快速分布式多序列比对方法 |
Family Cites Families (147)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5242794A (en) | 1984-12-13 | 1993-09-07 | Applied Biosystems, Inc. | Detection of specific sequences in nucleic acids |
US4683195A (en) | 1986-01-30 | 1987-07-28 | Cetus Corporation | Process for amplifying, detecting, and/or-cloning nucleic acid sequences |
US5583024A (en) | 1985-12-02 | 1996-12-10 | The Regents Of The University Of California | Recombinant expression of Coleoptera luciferase |
US4988617A (en) | 1988-03-25 | 1991-01-29 | California Institute Of Technology | Method of detecting a nucleotide change in nucleic acids |
US5234809A (en) | 1989-03-23 | 1993-08-10 | Akzo N.V. | Process for isolating nucleic acid |
US5494810A (en) | 1990-05-03 | 1996-02-27 | Cornell Research Foundation, Inc. | Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease |
US5511158A (en) | 1994-08-04 | 1996-04-23 | Thinking Machines Corporation | System and method for creating and evolving directed graphs |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
US5701256A (en) | 1995-05-31 | 1997-12-23 | Cold Spring Harbor Laboratory | Method and apparatus for biological sequence comparison |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
US6054278A (en) | 1997-05-05 | 2000-04-25 | The Perkin-Elmer Corporation | Ribosomal RNA gene polymorphism based microorganism identification |
JP2001516731A (ja) | 1997-09-17 | 2001-10-02 | ジエントラ・システムズ・インコーポレーテツド | 核酸を単離するための装置および方法 |
US6054276A (en) | 1998-02-23 | 2000-04-25 | Macevicz; Stephen C. | DNA restriction site mapping |
US6223128B1 (en) | 1998-06-29 | 2001-04-24 | Dnstar, Inc. | DNA sequence assembly system |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
GB9901475D0 (en) | 1999-01-22 | 1999-03-17 | Pyrosequencing Ab | A method of DNA sequencing |
US6818395B1 (en) | 1999-06-28 | 2004-11-16 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences |
WO2001023610A2 (en) | 1999-09-29 | 2001-04-05 | Solexa Ltd. | Polynucleotide sequencing |
US6582938B1 (en) | 2001-05-11 | 2003-06-24 | Affymetrix, Inc. | Amplification of nucleic acids |
US6448717B1 (en) | 2000-07-17 | 2002-09-10 | Micron Technology, Inc. | Method and apparatuses for providing uniform electron beams from field emission displays |
SG144731A1 (en) | 2000-07-18 | 2008-08-28 | Correlogic Systems Inc | A process for discriminating between biological states based on hidden patterns from biological data |
NO20004869D0 (no) | 2000-09-28 | 2000-09-28 | Torbjoern Rognes | Metode for hurtig optimal lokal sekvensjustering ved bruk av parallell prosessering |
EP1368497A4 (en) | 2001-03-12 | 2007-08-15 | California Inst Of Techn | METHOD AND DEVICE FOR ANALYZING POLYNUCLEOTIDE SEQUENCES BY ASYNCHRONOUS BASE EXTENSION |
US6890763B2 (en) | 2001-04-30 | 2005-05-10 | Syn X Pharma, Inc. | Biopolymer marker indicative of disease state having a molecular weight of 1350 daltons |
US7809509B2 (en) | 2001-05-08 | 2010-10-05 | Ip Genesis, Inc. | Comparative mapping and assembly of nucleic acid sequences |
US7577554B2 (en) | 2001-07-03 | 2009-08-18 | I2 Technologies Us, Inc. | Workflow modeling using an acyclic directed graph data structure |
US20040023209A1 (en) | 2001-11-28 | 2004-02-05 | Jon Jonasson | Method for identifying microorganisms based on sequencing gene fragments |
US6989100B2 (en) | 2002-05-09 | 2006-01-24 | Ppd Biomarker Discovery Sciences, Llc | Methods for time-alignment of liquid chromatography-mass spectrometry data |
US7321623B2 (en) | 2002-10-01 | 2008-01-22 | Avocent Corporation | Video compression system |
US7225324B2 (en) | 2002-10-31 | 2007-05-29 | Src Computers, Inc. | Multi-adaptive processing systems and techniques for enhancing parallelism and performance of computational functions |
US8843356B2 (en) | 2002-12-27 | 2014-09-23 | Merck Sharp & Dohme Corp. | Computer systems and methods for associating genes with traits using cross species data |
US7885840B2 (en) | 2003-01-07 | 2011-02-08 | Sap Aktiengesellschaft | System and method of flexible workflow management |
US7575865B2 (en) | 2003-01-29 | 2009-08-18 | 454 Life Sciences Corporation | Methods of amplifying and sequencing nucleic acids |
US7953891B2 (en) | 2003-03-18 | 2011-05-31 | Microsoft Corporation | Systems and methods for scheduling data flow execution based on an arbitrary graph describing the desired data flow |
JP2005092719A (ja) | 2003-09-19 | 2005-04-07 | Nec Corp | ハプロタイプ推定方法、推定装置、プログラム |
WO2005042781A2 (en) | 2003-10-31 | 2005-05-12 | Agencourt Personal Genomics Corporation | Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof |
US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
US20060195266A1 (en) | 2005-02-25 | 2006-08-31 | Yeatman Timothy J | Methods for predicting cancer outcome and gene signatures for use therein |
US8185367B2 (en) | 2004-04-30 | 2012-05-22 | Merck Sharp & Dohme Corp. | Systems and methods for reconstructing gene networks in segregating populations |
JP2005346340A (ja) * | 2004-06-02 | 2005-12-15 | Hitachi Ltd | フラグメントによる配列クラスタリング・アラインメント方法 |
US7642511B2 (en) | 2004-09-30 | 2010-01-05 | Ut-Battelle, Llc | Ultra high mass range mass spectrometer systems |
US8340914B2 (en) | 2004-11-08 | 2012-12-25 | Gatewood Joe M | Methods and systems for compressing and comparing genomic data |
US7483585B2 (en) | 2004-12-01 | 2009-01-27 | Ati Technologies Ulc | Image compression using variable bit size run length encoding |
EP2230315A1 (en) | 2005-02-01 | 2010-09-22 | AB Advanced Genetic Analysis Corporation | Nucleic acid sequencing by performing successive cycles of duplex extension |
EP1910537A1 (en) | 2005-06-06 | 2008-04-16 | 454 Life Sciences Corporation | Paired end sequencing |
US7329860B2 (en) | 2005-11-23 | 2008-02-12 | Illumina, Inc. | Confocal imaging methods and apparatus |
KR100722504B1 (ko) | 2006-01-18 | 2007-05-29 | 학교법인 포항공과대학교 | 비선형 공정 계획 생성 방법 및 이를 이용한 인터넷 기반step-nc 시스템 |
US7580918B2 (en) | 2006-03-03 | 2009-08-25 | Adobe Systems Incorporated | System and method of efficiently representing and searching directed acyclic graph structures in databases |
GB2436564A (en) | 2006-03-31 | 2007-10-03 | Plant Bioscience Ltd | Prediction of heterosis and other traits by transcriptome analysis |
US7282337B1 (en) | 2006-04-14 | 2007-10-16 | Helicos Biosciences Corporation | Methods for increasing accuracy of nucleic acid sequencing |
US7702468B2 (en) | 2006-05-03 | 2010-04-20 | Population Diagnostics, Inc. | Evaluating genetic disorders |
US7754429B2 (en) | 2006-10-06 | 2010-07-13 | Illumina Cambridge Limited | Method for pair-wise sequencing a plurity of target polynucleotides |
EP2463390A1 (en) | 2006-10-20 | 2012-06-13 | Innogenetics N.V. | Methodology for analysis of sequence variations within the HCV NS5B genomic region |
EP2674751B1 (en) | 2006-12-14 | 2017-02-01 | Life Technologies Corporation | Apparatus for measuring analytes using large scale FET arrays |
US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
CA2676570C (en) | 2007-01-26 | 2016-05-03 | Illumina, Inc. | Nucleic acid sequencing system and method |
WO2008098014A2 (en) | 2007-02-05 | 2008-08-14 | Applied Biosystems, Llc | System and methods for indel identification using short read sequencing |
US8146099B2 (en) | 2007-09-27 | 2012-03-27 | Microsoft Corporation | Service-oriented pipeline based architecture |
US20090119313A1 (en) | 2007-11-02 | 2009-05-07 | Ioactive Inc. | Determining structure of binary data using alignment algorithms |
US8478544B2 (en) | 2007-11-21 | 2013-07-02 | Cosmosid Inc. | Direct identification and measurement of relative populations of microorganisms with direct DNA sequencing and probabilistic methods |
US20090164135A1 (en) | 2007-12-21 | 2009-06-25 | Brodzik Andrzej K | Quaternionic algebra approach to dna and rna tandem repeat detection |
US20090233809A1 (en) | 2008-03-04 | 2009-09-17 | Affymetrix, Inc. | Resequencing methods for identification of sequence variants |
US8628940B2 (en) * | 2008-09-24 | 2014-01-14 | Pacific Biosciences Of California, Inc. | Intermittent detection during analytical reactions |
US8271206B2 (en) | 2008-04-21 | 2012-09-18 | Softgenetics Llc | DNA sequence assembly methods of short reads |
US20100010992A1 (en) | 2008-07-10 | 2010-01-14 | Morris Robert P | Methods And Systems For Resolving A Location Information To A Network Identifier |
KR100992169B1 (ko) | 2008-07-25 | 2010-11-04 | 한국생명공학연구원 | 정보 분석프로세스 추천 설계시스템 및 방법 |
US20100041048A1 (en) | 2008-07-31 | 2010-02-18 | The Johns Hopkins University | Circulating Mutant DNA to Assess Tumor Dynamics |
US20100035252A1 (en) | 2008-08-08 | 2010-02-11 | Ion Torrent Systems Incorporated | Methods for sequencing individual nucleic acids under tension |
US20120040851A1 (en) | 2008-09-19 | 2012-02-16 | Immune Disease Institute, Inc. | miRNA TARGETS |
US8546128B2 (en) | 2008-10-22 | 2013-10-01 | Life Technologies Corporation | Fluidics system for sequential delivery of reagents |
US20100301398A1 (en) | 2009-05-29 | 2010-12-02 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
US8691510B2 (en) | 2008-11-07 | 2014-04-08 | Sequenta, Inc. | Sequence analysis of complex amplicons |
US8370079B2 (en) | 2008-11-20 | 2013-02-05 | Pacific Biosciences Of California, Inc. | Algorithms for sequence determination |
DE102008061772A1 (de) | 2008-12-11 | 2010-06-17 | Febit Holding Gmbh | Verfahren zur Untersuchung von Nukleinsäure-Populationen |
US10839940B2 (en) | 2008-12-24 | 2020-11-17 | New York University | Method, computer-accessible medium and systems for score-driven whole-genome shotgun sequence assemble |
ES2735514T3 (es) | 2009-02-03 | 2019-12-19 | Ande Corp | Purificación de ácido nucleico |
US8352195B2 (en) | 2009-03-20 | 2013-01-08 | Siemens Corporation | Methods and systems for identifying PCR primers specific to one or more target genomes |
DK2511843T3 (en) | 2009-04-29 | 2017-03-27 | Complete Genomics Inc | METHOD AND SYSTEM FOR DETERMINING VARIATIONS IN A SAMPLE POLYNUCLEOTIDE SEQUENCE IN TERMS OF A REFERENCE POLYNUCLEOTIDE SEQUENCE |
US8673627B2 (en) | 2009-05-29 | 2014-03-18 | Life Technologies Corporation | Apparatus and methods for performing electrochemical reactions |
US8574835B2 (en) | 2009-05-29 | 2013-11-05 | Life Technologies Corporation | Scaffolded nucleic acid polymer particles and methods of making and using |
US9524369B2 (en) | 2009-06-15 | 2016-12-20 | Complete Genomics, Inc. | Processing and analysis of complex nucleic acid sequence data |
WO2011050341A1 (en) | 2009-10-22 | 2011-04-28 | National Center For Genome Resources | Methods and systems for medical sequencing analysis |
JP2011091775A (ja) | 2009-10-26 | 2011-05-06 | Toshiba Corp | 固体撮像装置 |
MX2012008233A (es) | 2010-01-14 | 2012-08-17 | Fluor Tech Corp | Sistemas y metodos de modelacion tridimensional de plantas. |
EP2536854B1 (en) | 2010-02-18 | 2017-07-19 | The Johns Hopkins University | Personalized tumor biomarkers |
US9165109B2 (en) | 2010-02-24 | 2015-10-20 | Pacific Biosciences Of California, Inc. | Sequence assembly and consensus sequence determination |
US20110257889A1 (en) | 2010-02-24 | 2011-10-20 | Pacific Biosciences Of California, Inc. | Sequence assembly and consensus sequence determination |
WO2011139797A2 (en) | 2010-04-27 | 2011-11-10 | Spiral Genetics Inc. | Method and system for analysis and error correction of biological sequences and inference of relationship for multiple samples |
US9342651B2 (en) * | 2010-05-13 | 2016-05-17 | Life Technologies Corporation | Computational methods for translating a sequence of multi-base color calls to a sequence of bases |
US20120030566A1 (en) * | 2010-07-28 | 2012-02-02 | Victor B Michael | System with touch-based selection of data items |
EP3822975A1 (en) | 2010-09-09 | 2021-05-19 | Fabric Genomics, Inc. | Variant annotation, analysis and selection tool |
KR20130113447A (ko) | 2010-09-24 | 2013-10-15 | 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 | 고정된 프라이머들을 이용하여 표적 dna의 직접적인 캡쳐, 증폭 및 서열화 |
US20130289099A1 (en) | 2010-12-17 | 2013-10-31 | Universite Pierre Et Marie Curie (Paris 6) | Abcg1 gene as a marker and a target gene for treating obesity |
CA2823815A1 (en) | 2011-01-14 | 2012-07-19 | Keygene N.V. | Paired end random sequence based genotyping |
JP6420543B2 (ja) | 2011-01-19 | 2018-11-07 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | ゲノムデータ処理方法 |
US20120239706A1 (en) | 2011-03-18 | 2012-09-20 | Los Alamos National Security, Llc | Computer-facilitated parallel information alignment and analysis |
EP2754078A4 (en) | 2011-04-14 | 2015-12-02 | Complete Genomics Inc | PROCESSING AND ANALYSIS OF COMPLEX NUCLEIC ACID SEQUENCE DATA |
US20130059738A1 (en) | 2011-04-28 | 2013-03-07 | Life Technologies Corporation | Methods and compositions for multiplex pcr |
TW201243117A (en) | 2011-04-28 | 2012-11-01 | Hsueh-Ting Chu | Method and system of assembling DNA reads with paired-end sequencing |
US9506167B2 (en) | 2011-07-29 | 2016-11-29 | Ginkgo Bioworks, Inc. | Methods and systems for cell state quantification |
WO2013035904A1 (ko) | 2011-09-08 | 2013-03-14 | 한국과학기술정보연구원 | 생명 정보 분석 파이프라인 처리 시스템 및 방법 |
KR101282798B1 (ko) | 2011-09-08 | 2013-07-04 | 한국과학기술정보연구원 | 생명 정보 분석 파이프라인 처리 시스템 및 방법 |
EP2758908A1 (en) | 2011-09-20 | 2014-07-30 | Life Technologies Corporation | Systems and methods for identifying sequence variation |
US8954475B2 (en) | 2011-11-10 | 2015-02-10 | Microsoft Technology Licensing, Llc | Deep cloning of objects using binary format |
EP2608096B1 (en) | 2011-12-24 | 2020-08-05 | Tata Consultancy Services Ltd. | Compression of genomic data file |
CN104204221B (zh) | 2011-12-31 | 2016-04-13 | 深圳华大基因科技服务有限公司 | 一种检验融合基因的方法及系统 |
EP2802666B1 (en) | 2012-01-13 | 2018-09-19 | Data2Bio | Genotyping by next-generation sequencing |
US9047133B2 (en) | 2012-03-02 | 2015-06-02 | Vmware, Inc. | Single, logical, multi-tier application blueprint used for deployment and management of multiple physical applications in a cloud environment |
US9552458B2 (en) | 2012-03-16 | 2017-01-24 | The Research Institute At Nationwide Children's Hospital | Comprehensive analysis pipeline for discovery of human genetic variation |
US8209130B1 (en) | 2012-04-04 | 2012-06-26 | Good Start Genetics, Inc. | Sequence assembly |
US20130345066A1 (en) | 2012-05-09 | 2013-12-26 | Life Technologies Corporation | Systems and methods for identifying sequence variation |
US20130324417A1 (en) | 2012-06-04 | 2013-12-05 | Good Start Genetics, Inc. | Determining the clinical significance of variant sequences |
US9104656B2 (en) | 2012-07-03 | 2015-08-11 | International Business Machines Corporation | Using lexical analysis and parsing in genome research |
US10777301B2 (en) | 2012-07-13 | 2020-09-15 | Pacific Biosciences For California, Inc. | Hierarchical genome assembly method using single long insert library |
US20140066317A1 (en) | 2012-09-04 | 2014-03-06 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
EP2918047A4 (en) | 2012-11-06 | 2016-04-20 | Hewlett Packard Development Co | IMPROVED GRAPHIDE RUNNING |
CA2888779A1 (en) | 2012-11-07 | 2014-05-15 | Good Start Genetics, Inc. | Validation of genetic tests |
US9128861B2 (en) | 2013-01-17 | 2015-09-08 | Personalis, Inc. | Methods and systems for genetic analysis |
US10346551B2 (en) | 2013-01-24 | 2019-07-09 | New York University | Systems, methods and computer-accessible mediums for utilizing pattern matching in stringomes |
US10032195B2 (en) | 2013-03-13 | 2018-07-24 | Airline Tariff Publishing Company | System, method and computer program product for providing a fare analytic engine |
US9087007B2 (en) | 2013-03-14 | 2015-07-21 | International Business Machines Corporation | Generating fault tolerant connectivity API |
WO2014170762A2 (en) | 2013-03-15 | 2014-10-23 | James Webber | Graph database devices and methods for partitioning graphs |
US9189224B2 (en) | 2013-07-11 | 2015-11-17 | Oracle International Corporation | Forming an upgrade recommendation in a cloud computing environment |
US9898575B2 (en) | 2013-08-21 | 2018-02-20 | Seven Bridges Genomics Inc. | Methods and systems for aligning sequences |
US9116866B2 (en) | 2013-08-21 | 2015-08-25 | Seven Bridges Genomics Inc. | Methods and systems for detecting sequence variants |
US20150066383A1 (en) | 2013-09-03 | 2015-03-05 | Seven Bridges Genomics Inc. | Collapsible modular genomic pipeline |
EP3053073B1 (en) | 2013-09-30 | 2019-07-03 | Seven Bridges Genomics Inc. | Methods and system for detecting sequence variants |
EP3052651B1 (en) | 2013-10-01 | 2019-11-27 | Life Technologies Corporation | Systems and methods for detecting structural variants |
KR102386134B1 (ko) | 2013-10-15 | 2022-04-12 | 리제너론 파마슈티칼스 인코포레이티드 | 고분별능 대립유전자 동정 |
WO2015058095A1 (en) | 2013-10-18 | 2015-04-23 | Seven Bridges Genomics Inc. | Methods and systems for quantifying sequence alignment |
CN105793689B (zh) | 2013-10-18 | 2020-04-17 | 七桥基因公司 | 用于将遗传样本基因分型的方法和系统 |
US11049587B2 (en) | 2013-10-18 | 2021-06-29 | Seven Bridges Genomics Inc. | Methods and systems for aligning sequences in the presence of repeating elements |
AU2014337093B2 (en) | 2013-10-18 | 2020-07-30 | Seven Bridges Genomics Inc. | Methods and systems for identifying disease-induced mutations |
US9092402B2 (en) | 2013-10-21 | 2015-07-28 | Seven Bridges Genomics Inc. | Systems and methods for using paired-end data in directed acyclic structure |
US10867693B2 (en) | 2014-01-10 | 2020-12-15 | Seven Bridges Genomics Inc. | Systems and methods for use of known alleles in read mapping |
US9817944B2 (en) | 2014-02-11 | 2017-11-14 | Seven Bridges Genomics Inc. | Systems and methods for analyzing sequence data |
WO2016141294A1 (en) | 2015-03-05 | 2016-09-09 | Seven Bridges Genomics Inc. | Systems and methods for genomic pattern analysis |
US20160364523A1 (en) | 2015-06-11 | 2016-12-15 | Seven Bridges Genomics Inc. | Systems and methods for identifying microorganisms |
US10793895B2 (en) | 2015-08-24 | 2020-10-06 | Seven Bridges Genomics Inc. | Systems and methods for epigenetic analysis |
US10724110B2 (en) | 2015-09-01 | 2020-07-28 | Seven Bridges Genomics Inc. | Systems and methods for analyzing viral nucleic acids |
US10584380B2 (en) | 2015-09-01 | 2020-03-10 | Seven Bridges Genomics Inc. | Systems and methods for mitochondrial analysis |
US20170199960A1 (en) | 2016-01-07 | 2017-07-13 | Seven Bridges Genomics Inc. | Systems and methods for adaptive local alignment for graph genomes |
US20170199959A1 (en) | 2016-01-13 | 2017-07-13 | Seven Bridges Genomics Inc. | Genetic analysis systems and methods |
US10364468B2 (en) | 2016-01-13 | 2019-07-30 | Seven Bridges Genomics Inc. | Systems and methods for analyzing circulating tumor DNA |
US10262102B2 (en) | 2016-02-24 | 2019-04-16 | Seven Bridges Genomics Inc. | Systems and methods for genotyping with graph reference |
-
2013
- 2013-09-03 US US14/016,833 patent/US9898575B2/en active Active
-
2014
- 2014-08-21 JP JP2016536446A patent/JP6586088B2/ja active Active
- 2014-08-21 SG SG11201601124YA patent/SG11201601124YA/en unknown
- 2014-08-21 EP EP14837955.5A patent/EP3036344B1/en active Active
- 2014-08-21 KR KR1020167007423A patent/KR102371953B1/ko active IP Right Grant
- 2014-08-21 AU AU2014308794A patent/AU2014308794B2/en active Active
- 2014-08-21 CN CN201480055430.1A patent/CN105637098B/zh active Active
- 2014-08-21 EP EP20162191.9A patent/EP3702472B1/en active Active
- 2014-08-21 CA CA2921645A patent/CA2921645C/en active Active
- 2014-08-21 WO PCT/US2014/052065 patent/WO2015027050A1/en active Application Filing
-
2018
- 2018-02-20 US US15/899,713 patent/US11211146B2/en active Active
-
2019
- 2019-09-06 JP JP2019162661A patent/JP6902073B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
CN105637098B (zh) | 2021-04-30 |
JP6902073B2 (ja) | 2021-07-14 |
CA2921645C (en) | 2023-03-28 |
AU2014308794A1 (en) | 2016-03-10 |
EP3036344A1 (en) | 2016-06-29 |
CN105637098A (zh) | 2016-06-01 |
KR20160047506A (ko) | 2016-05-02 |
US11211146B2 (en) | 2021-12-28 |
EP3702472A1 (en) | 2020-09-02 |
JP2020042813A (ja) | 2020-03-19 |
US20150057946A1 (en) | 2015-02-26 |
KR102371953B1 (ko) | 2022-03-08 |
US20180357367A1 (en) | 2018-12-13 |
JP2016536698A (ja) | 2016-11-24 |
WO2015027050A1 (en) | 2015-02-26 |
EP3036344A4 (en) | 2017-04-26 |
US9898575B2 (en) | 2018-02-20 |
CA2921645A1 (en) | 2015-02-26 |
EP3036344B1 (en) | 2020-03-11 |
EP3702472B1 (en) | 2021-08-11 |
SG11201601124YA (en) | 2016-03-30 |
AU2014308794B2 (en) | 2020-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6902073B2 (ja) | 配列をアラインするための方法およびシステム | |
US11837328B2 (en) | Methods and systems for detecting sequence variants | |
US20210280272A1 (en) | Methods and systems for quantifying sequence alignment | |
US20210398616A1 (en) | Methods and systems for aligning sequences in the presence of repeating elements | |
EP3053073B1 (en) | Methods and system for detecting sequence variants | |
JP2016533182A (ja) | 疾患に誘導された変異を同定するための方法およびシステム | |
JP2017500004A (ja) | 遺伝子試料について遺伝子型解析するための方法およびシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170720 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180706 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181005 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181130 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190709 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20190806 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190906 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6586088 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |