JP6941680B2 - 核酸内に存在する情報の秘匿化 - Google Patents

核酸内に存在する情報の秘匿化 Download PDF

Info

Publication number
JP6941680B2
JP6941680B2 JP2019543186A JP2019543186A JP6941680B2 JP 6941680 B2 JP6941680 B2 JP 6941680B2 JP 2019543186 A JP2019543186 A JP 2019543186A JP 2019543186 A JP2019543186 A JP 2019543186A JP 6941680 B2 JP6941680 B2 JP 6941680B2
Authority
JP
Japan
Prior art keywords
nucleic acid
nucleic acids
barcode
barcodes
pooled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019543186A
Other languages
English (en)
Other versions
JP2019533478A (ja
Inventor
サワヤ、スターリング
Original Assignee
ジェネインフォセック、インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ジェネインフォセック、インコーポレイテッド filed Critical ジェネインフォセック、インコーポレイテッド
Publication of JP2019533478A publication Critical patent/JP2019533478A/ja
Application granted granted Critical
Publication of JP6941680B2 publication Critical patent/JP6941680B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/66General methods for inserting a gene into a vector to form a recombinant vector using cleavage and ligation; Use of non-functional linkers or adaptors, e.g. linkers containing the sequence for a restriction endonuclease
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • C40B20/04Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes

Description

関連出願の相互参照
本出願は、参照により本明細書に組み込まれる2016年10月24日に出願された米国特許仮出願番号第62/411,998号明細書に対する優先権の利益を主張する。
核酸は、その核酸が由来する生物に関する遺伝情報(例えば、疾患リスク)を提供することができる。この遺伝情報は個体を識別するために使用することができ、したがって個体のプライバシーを維持しながら遺伝情報を取得するうえで課題をもたらす。例えば、遺伝関連試験からのデータを使用して、当該関連試験の参加者を識別することができ、参加者の疾患リスクを推定することができる。患者は遺伝子検査を受けている際に識別されることを恐れている可能性があるため、これはまた臨床評価の際の核酸の使用に課題をもたらす可能性がある。核酸の秘匿化は、植物及び/又は動物の育種者にとっても興味深い可能性がある。これらの育種者は、それらの品種の核酸から遺伝情報を探索することがあるが、それらの品種及び/又は育種方法に関する情報を秘匿化することにも関心がある可能性がある。同様に、工業用及び/又は医療用の微生物の開発者は、潜在的な敵対者から核酸を秘匿化することから利益を得る可能性がある。また、データ記憶媒体としての核酸の使用は、核酸として記憶されている情報の秘匿化を保証し得る。
ヒトのゲノムのプライバシーに関する問題を軽減するために、研究者らは、インフォームド・コンセント、ゲノムデータの暗号化、ゲノムデータの共有の制限、及び被験者がデータベースに参加しない権利を含む様々な解決策を提案してきた。これらの方法はいずれも核酸配列データのみに適用され、核酸それ自体には適用されない。
核酸の分析の前にそれらのプライバシーを維持する方法は深刻に欠如している。分析の前に、個々の試料がバーコードによってタグ付けされたそれらの核酸を有し、単一のバーコードによって試料全体を識別することができる。これらの試料をプールし、バーコード(名前又は他の識別子ではなく)によってそれらを識別するだけで、ある程度の秘匿化が可能になる。しかし、配列データにアクセスする敵対者であれば、プールされた試料の数を直接観察することができ、各試料の遺伝子型を知るであろう。これらの遺伝子型は、その後、試料の起源を識別し、試料の形質について予測するために使用され得る。
さらに、核酸をデータ記憶媒体として使用することができる。そのような場合、データは、データの媒体を検索及び/又は(例えば、デジタルフォーマットに)変換するためにシーケンサーを必要とする。敵対者が配列データにアクセスすることがあれば、核酸に記憶されたデータの秘匿化は有用であるはずである。これらの又は類似の状況では、核酸に存在するデータの種類又は形態を難読化及び秘匿化することは有用であり得る。
したがって、分析の前に、核酸自体を秘匿化する方法に対する必要性は満たされていない。核酸を秘匿化することによって、目的の核酸から提供される情報を最小限に抑えながら、第三者による分析のためにそれらを送ることができる。
本明細書に記載の技術は核酸の調製に関する。本明細書に記載の方法は、分析(例えば、配列決定)前の核酸の秘匿化に関する。いくつかの実施形態では、核酸の供給源の同一性は秘匿化され、核酸は匿名化される。いくつかの実施形態では、核酸の存在は秘匿化される。いくつかの実施形態では、生物の形質に関する核酸内に含まれる情報は秘匿化される。いくつかの実施形態では、核酸を分析するための潜在的な目的は秘匿化される。いくつかの実施形態では、情報記憶媒体として使用されている核酸内に情報が秘匿化される。いくつかの実施形態では、本明細書に記載の方法は、分析前の核酸の濃縮に関する。
一態様では、本明細書に記載の技術は、核酸が秘匿化及び/又は難読化及び/又は匿名化されるように、配列分析の前に核酸を調製する方法に関する。該方法は、
(a)安全な施設内で、核酸から構成されるバーコードのセットを生成し、それらを消費者に供給することにより、バーコードの特性が消費者以外の全員に隠されるようにすることと、
(b)分析対象の核酸にバーコードを付加することと、
(c)このバーコード化(barcoded)核酸と他のバーコード化核酸とを組み合わせて、分析前にそれらの情報を秘匿化することと
を含む。
工程(a)において材料を安全に生成する方法
いくつかの実施形態では、バーコード及びそれらの関連アダプター、インデックス、又は核酸を秘匿化するのを支援するように機能する他の核酸もしくは化学物質は、いかなる監視装置も有しないことが保証され、安全な施設の外部のいかなる形態の通信も有しない施設内で生成される。いくつかの実施形態では、安全な施設は、望ましくない電磁通信を防ぐために、ファラデーケージなどの電磁シールドによって囲まれる。いくつかの実施形態では、施設内の機器及び機械は、電磁シールドによって囲まれる。いくつかの実施形態では、安全な施設は、銅製の電話回線又は光ファイバケーブルなど、施設の外部の通信ケーブルを欠いているであろう。いくつかの実施形態では、そのような施設内の電子装置は、施設の外部のいかなるものへの接続を欠き、外界から「空隙がある」であろう。いくつかの実施形態では、施設で働く個体は、カメラなどのいかなる種類の記録装置を有することも許可されないであろう。いくつかの実施形態では、安全な施設は建物として存在し、他の実施形態では、安全な施設は建物内の部屋又は部屋の集合として存在する。
いくつかの実施形態では、バーコード配列のセットがコンピュータによってランダムに生成され、セット内の各バーコードが固有であり、セット内の任意のバーコードに関する知識が、セット内の他のバーコードに関するいかなる形態での予測も可能にしないであろうことを保証するであろう。いくつかの実施形態では、バーコードのセット内のいくつかのバーコードに関する知識を使用して、そのセット内の他のバーコード配列に関して限られた量の予測を行うことができる。そのような実施形態では、所与のセキュリティ環境に許容されるバーコードのセットに関する予測量が、いくつかの実施形態では、当業者によって測定され得る。このバーコードのセットは、その後、いくつかのサブセットに分割されることになる。各サブセットは固有の識別子によってラベル付けされ、これらの識別子をバーコードと照合する表もコンピュータ上に生成されるであろう。バーコードの表は、CD−ROM、DVD−ROM又はフラッシュメモリドライブなどの安全なデータ転送装置に配置されるであろう。いくつかの実施形態では、紙などの媒体にもバーコード識別表が印刷される。
いくつかの実施形態では、バーコードの生成前にバーコードのセットを検査して、バーコード配列が本発明のその後の工程でのそれらの使用を妨げないようにする。この比較は、当業者に公知の方法によって生成することができるコンピュータプログラムによって達成することができる。いくつかの実施形態では、任意のバーコード配列の生成前に、使用に理想的ではないバーコード配列が生成され、バーコードの生成前にバーコード配列のセットをフィルタリングするために使用される。
いくつかの実施形態では、バーコードに関する情報が、それらの関連するアダプター、インデックス、又はこの技術に使用される他の材料とともに、バーコードを生成するために使用される機械に転送されるであろう。任意の機械及び/又はコンピュータ間のあらゆる情報転送は、電磁放射から遮蔽された配線を使用して行われ、配線から情報が漏れるのを防ぐであろう。他の実施形態では、ランダムなバーコードのセットを生成するコンピュータが、ランダムバーコードを生成するために使用される1つ又は複数の機械に組み込まれる。そのような実施形態では、電磁放射から機械全体を遮蔽することによって、バーコードに関する情報が検出されるのを防ぐであろう。
バーコード及びそれらの関連材料が生成され、試験管又はマイクロウェルプレートのウェルなどのそれぞれの容器内に配置されるであろう。これらの容器は、コンピュータによって生成されたバーコードの表を使用してバーコードの同一性を調べることができるように、ラベル付け及び/又は識別される。
いくつかの実施形態では、バーコード化材料のサブセットは、そのバーコードの表とともに容器内に配置される。次いで、この容器は、例えば、箱が開けられた後に再び密封することができないシールを使用して、それが開けられたか、そうでなければ手が付けられたかどうかを示すような方法で密封される。いくつかの実施形態では、この容器はまた、該技術のその後の工程で核酸とともにプールするために使用され得る他の核酸を含んでもよい。いくつかの実施形態では、含まれる核酸は、バーコード化されていてもよいか、部分的にバーコード化されていてもよいか、バーコードが付加されていなくてもよい。いくつかの実施形態では、この技術の使用を指示するために使用されるソフトウェア及び/又はファイルが、この容器内に提供される。
いくつかの実施形態では、バーコードは完全に固有ではない。いくつかの実施形態では、バーコードのサブセットは、他のサブセットに存在するいくつかのバーコードを含む。これらの実施形態のいくつかでは、完全に固有ではないバーコードのこれらのセットの生成は、やはりコンピュータによって指示することができる。他の実施形態では、バーコードは、それらの配列が部分的又は全体的に分かるように完全にランダムに生成され、バーコード配列に関する情報は安全に記録される。これらの実施形態では、ランダムに生成されたバーコードに関する情報は、CD−ROM、DVD−ROM又はフラッシュメモリドライブなどの安全なデータ転送装置に安全に配置されるであろう。これらの実施形態では、セット内のいくつかのバーコードの知識が、セット内の他のバーコードに関する情報を提供しないであろうこと、又は消費者が要求するセキュリティ基準を満たすために、他のバーコードについて最低限の情報のみを提供するであろうことを保証するために、バーコード生成の真のランダム性が確認されるであろう。これらの実施形態では、望ましくないバーコードを取り除くことができるフィルタリングプロセスを各群のバーコードに適用して、バーコードが本発明のその後の工程を妨げないようにする。
工程(b)におけるバーコード化(barcoding)法
いくつかの実施形態では、ともに参照により本明細書に組み込まれる米国特許公開第US2015/0211050号明細書及び米国特許公開第2015/0211061号明細書に記載の技術を用いて、濃縮前又は濃縮中に核酸にバーコードが付加される。
いくつかの実施形態では、ライゲーションによってバーコードが付加され、その後濃縮は行われない。いくつかの実施形態では、ライゲーションによるバーコード化は、バーコードが既に存在する場合に行われ得る。いくつかの実施形態では、バーコード分子は、バーコードと他の核酸とのライゲーションを容易にするアダプターを含む。いくつかの実施形態では、粘着末端ライゲーション、例えば、TAライゲーションを使用して、アダプターを有するバーコードをライゲーションすることができる。
いくつかの実施形態では、制限酵素を使用して、バーコード化の前に核酸を消化する。いくつかの実施形態では、制限酵素消化は粘着末端を生成する。これらの実施形態では、バーコード上のアダプターは、制限酵素によって生成された粘着末端に対応する粘着末端を含み、バーコードのライゲーションを容易にする。
いくつかの実施形態では、あらゆる標的及び/又はデコイ核酸がバーコード化されるわけではない。いくつかの実施形態では、ランダムな量の核酸がバーコード化される。いくつかの実施形態では、分子生物学技術に固有のランダム性を利用して、一部の核酸をランダムにバーコード化する。いくつかの実施形態では、コンピュータを利用して、標的核酸から必要な情報を得るのに必要なバーコードの量を推定し、バーコード化法とプール化(pooling)法とを比較して、そのような方法によって得られるプライバシーを推定する。いくつかの実施形態では、コンピュータは、ランダムな割合の核酸をバーコード化するように指示する。
工程(c)においてバーコード化核酸を組み合わせる方法
いくつかの実施形態では、秘匿化対象のバーコード化核酸は、類似のバーコード化核酸(すなわち、対照及び/又はデコイ核酸配列)とともにプールされる。例えば、対照核酸は、同じ種の同じ遺伝子に由来するが異なる個体に由来する核酸であり得る。いくつかの実施形態では、プールされた核酸は、関連する集団に見られるであろう核酸と類似しており、秘匿化対象の核酸とも類似している。例えば、集団内の同じ遺伝子及び同じ民族に由来する核酸。いくつかの実施形態では、バーコード化核酸は、潜在的形質を表し得る比較的高い比率の核酸を含む他のバーコード化核酸とともにプールされる。例えば、バーコード化核酸は、疾患保有変異体(disease carrying variant)の割合が高い(民族的に適合する集団に見出されるであろうよりも疾患保有変異体の割合が高い)バーコード化核酸とともにプールされるであろう。
いくつかの実施形態では、秘匿化対象の核酸の供給源に密接に関連する親及び/又は他の個体がバーコード化され、秘匿化対象のバーコード化核酸とともにプールされる。いくつかの実施形態では、秘匿化対象の核酸の量よりもはるかに多い量の近縁種由来の核酸が使用される。いくつかの実施形態では、異なる核酸の相対量は、それらの割合が、異なる近縁種と秘匿化対象の核酸との間で異なるように修正される。いくつかの実施形態では、秘匿化対象の一群の核酸がバーコード化され、互いにプールされる。いくつかの実施形態では、秘匿化対象ではなく、消費者にとって関心のない一群の核酸が、目的のバーコード化核酸とともにプールされる。そのような実施形態では、目的の核酸とともにプールされる核酸のプールは十分に制御される。これらの例では、特定の核酸を選択して、秘匿化を最適化してもよい。そのような実施形態では、目的の核酸の分析を秘匿化するために、大量の目的外の分析が行われる。
いくつかの実施形態では、データ記憶媒体としてのデオキシリボ核酸の使用など、データを記憶するために核酸が使用される。いくつかの実施形態では、これらのデータ記憶核酸はバーコード化され、他のデータ記憶核酸とともにプールされる。いくつかの実施形態では、これらのデータ記憶核酸は、消費者にとって関心のあるデータを含まない他の核酸とともにプールされる。
本発明の一実施形態は、分析のための標的核酸配列を調製する方法であって、核酸を含むバーコードのセットを生成することと、分析対象の標的核酸配列にバーコードを付加することと、分析対象のバーコード化標的核酸配列と、バーコードを含む対照又はデコイ核酸配列とを組み合わせるかプールすることとを含む方法に関する。
本発明の一実施形態は、標的核酸配列を匿名化する方法に関し、該方法は、核酸を含むバーコードのセットを生成することと、標的核酸配列にバーコードを付加することと、バーコード化標的核酸配列と、バーコードを含む対照又はデコイ核酸配列とを組み合わせるかプールすることとを含み、バーコード化標的核酸配列と対照又はデコイ核酸配列との組合せは、標的核酸配列を匿名化する。
いくつかの実施形態では、ランダムな量のバーコード及び/又は非バーコード化標的核酸、及び/又はランダムな量のバーコード化及び/又は非バーコード化デコイ核酸が配列決定のためにプールされる。これらの実施形態では、コイン、サイコロ一式、又は当業者によって設計されたコンピュータプログラムなどのランダム化手段によって、プールされる量のランダム性を決定することができる。これらの実施形態では、ランダム性の量及び/又はランダムな量を決定する方法は、消費者が必要とするプライバシーの量がプール化によって確実に達成されるように当業者によって設計される。
いくつかの実施形態では、分子生物学的方法の予測不可能な性質により、ランダム性が生じると予測される。一例として、核酸がポリメラーゼ連鎖反応を使用して増幅される場合、標的とされる核酸の正確なコピー数は未知である(しかし、誤差の範囲内で予測することはできる)。別の例として、溶液中に存在する核酸の量が未知であるが、やはりある程度の誤差を伴って予測される場合、核酸のその溶液を他の核酸とともにプールすると、各オリゴヌクレオチドの正確な量が確実に分からない核酸のプールをもたらす。いくつかの実施形態では、一群の核酸をプールし、そのプールのサブセットを取り除くことによってランダム性が得られ、その結果、そのプールからのランダム選択がもたらされる。いくつかの実施形態では、分子生物学的方法に生じるランダム性は、そのランダム性が本発明に使用されるプライバシー及び/又は秘匿化にどのように影響を及ぼすかを予測するために推定される。
本明細書に記載されるように、核酸をバーコード化(図1A)し、プールする(図1B)ことにより、それらの情報がバーコードの表(図1C)にアクセスできない個体には秘匿化されるようにするためのワークフロー図を示す。 本明細書に記載されるように、核酸をバーコード化(図1A)し、プールする(図1B)ことにより、それらの情報がバーコードの表(図1C)にアクセスできない個体には秘匿化されるようにするためのワークフロー図を示す。 本明細書に記載されるように、核酸をバーコード化(図1A)し、プールする(図1B)ことにより、それらの情報がバーコードの表(図1C)にアクセスできない個体には秘匿化されるようにするためのワークフロー図を示す。 本明細書に記載されるように、核酸にバーコードを付加するため、又はバーコード化された後の核酸を秘匿化するために使用されるバーコード及び任意の関連材料の安全な生成のためのワークフロー図を示す。 本明細書に記載されるように、核酸を用いて実現可能な多数の候補バーコードの説明を示す。 本明細書に記載されるように、どのバーコードがどの容器内に見出されるかを特定するために使用することができるバーコードの表とともに、各容器に別個に配置されるバーコードのサブセットの生成のためのワークフロー図を示す。 本明細書に記載されるように、バーコードのサブセットを使用して、それらを一緒にプールすることによって他のバーコード化核酸によって秘匿化されるバーコード化核酸を生成するためのワークフロー図を示す。 本明細書に記載されるように、粘着末端ライゲーションを使用して核酸にバーコードを付加するためのワークフロー図を示す。 本明細書に記載されるように、粘着末端ライゲーションを使用して核酸にバーコードを付加するためのワークフロー図を示す。
本明細書で使用される用語「秘匿化」とは、特に核酸に含まれる情報に関して、情報を隠すことを意味する。秘匿化(情報を秘匿化する行為)は、核酸に存在する様々な情報をそれぞれ秘匿化する様々な方法によって達成することができる。それらには、限定するものではないが、特定の供給源に由来することが知られている核酸の存在を検出する能力を低下させること、核酸の供給源に存在する形質を特定する能力を低下させること、どの核酸がどの供給源に由来するかを特定する能力を低下させること、核酸に記憶されている任意のデータを取得する能力を低下させること、核酸が由来する供給源の種類を特定する能力を低下させることが挙げられる。
本明細書で使用される用語「標的核酸」とは、配列分析などの分析を目的とする核酸オリゴヌクレオチドを指す。
本明細書で使用される用語「デコイ核酸」とは、標的核酸の秘匿化を支援するために標的核酸とともにプールされる任意の核酸オリゴヌクレオチドを指す。これらのデコイ核酸は、様々な供給源由来の標的核酸を含み得るか、それから構成され得る。すなわち、ある供給源由来の標的核酸を他の供給源由来の標的核酸のプール内に秘匿化することができ、その結果、他の標的核酸に対するデコイ核酸として作用する標的核酸が得られる。
本明細書で使用される用語「匿名化」とは、標的核酸を個体、家族、民族、又は任意の他の指定された実体もしくは群に何らかの方法で結び付ける能力を低下させることを指す。
本明細書で使用される用語「難読化」とは、標的核酸が分析されている目的及び/又は状況及び/又は理由を不明瞭にする作用を指す。
本明細書で使用される用語「秘匿化」は、用語「匿名化」及び「難読化」を包含し、用語「秘匿化」の使用は、秘匿化及び/又は匿名化及び/又は難読化を意味し得る。
本明細書で使用される用語「バーコード」とは、標的核酸分子のための識別子として使用されるオリゴヌクレオチドを指す。
いくつかの実施形態では、本明細書に記載の技術は核酸の調製に関する。いくつかの実施形態では、本明細書に記載の方法は、核酸の分析(例えば、配列決定)の前に核酸に存在する情報を秘匿化する。いくつかの実施形態では、本明細書に記載の方法は核酸の濃縮に関する。
核酸は、核酸の供給源を識別するために使用される情報を含み得る。それらの供給源が個人である場合、潜在的な敵対者によって既に知られているその個人に関するあらゆる情報が、その個人を識別するのに役立つ。これは、例えば、特定の姓によって、世界の特定の地域から、特定の民族から、又はそのような核酸変異体と関連していることが知られている個人の他の任意の特徴から、個体に生じることが知られるまれな変異であり得る。核酸変異体を使用して、それらの供給源の特徴(例えば、それらの供給源が赤毛であること)を特定することができる場合、その情報を使用して、その供給源の識別を援助することができる。匿名化とは、供給源の識別に使用することができる情報を減らすことである。
多くの個体は様々な民族の組合せであり、それらの個体の祖先は世界の様々な場所に由来する。その結果、それらの個体の遺伝的構成は、それらの様々な民族性を反映している。父系から継承されたDNAは、母系に由来するDNAとは異なる1つ又は複数の民族に由来し得る。
核酸の民族的組成を観察することによって、それらの核酸が由来する個体を識別することができる。他の識別情報、例えば、髪の色、体型又は任意の他の遺伝的形質を組み合わせることによって、核酸の供給源を特定することがさらに容易になり得る。本明細書に開示されるように、バーコード化し、プールすることによってこの情報を分割し、核酸の供給源に関する個々の情報が、個々の供給源に由来するものとして一緒にグループ化されないようにする。プールされるバーコード化核酸の種類は、様々な遺伝的形質を有する個体とともに様々な民族に由来し得、配列データにアクセスする敵対者が、いずれかの特定の個体がプール内に存在する核酸を有するかどうかを特定することができないようにする。バーコード化プールは、複数の供給源由来の変異体を含む核酸の集まりからなり、バーコードをそれらの供給源に結び付ける表がなければ、これらの供給源のいずれかの同一性を特定しようとしても妨げられる。
核酸内に含まれる情報を秘匿化するために、本明細書に記載の技術は以下の工程を利用する。(a)バーコード、及び該技術に使用される他の必要な材料を安全に生成する工程、(b)標的核酸にバーコードを付加する工程(図1A)及び(c)他の核酸とともに、バーコード化標的核酸をプールする工程(図1B)。
いくつかの実施形態では、この技術に使用される材料の安全な生成は、安全な施設内で行われ得る(図2)。いくつかの実施形態では、この施設は、施設の外部のいかなる通信も必要としない。いくつかの実施形態では、材料はロボットなどの機械によって生成され、直接的な人間の関与を必要とし得ない。いくつかの実施形態では、人間は材料生成のプロセスのうち一部の工程に関与する。安全を確保するために、人間が関与する場合、施設内に見出される情報を漏らす可能性のある施設内の何らかの記録装置(例えば、カメラ)を使用することを防ぐために、施設に入る前にその人間を選別しなければならない。
いくつかの実施形態では、施設の外部のいかなる通信も防止するために、施設の内部と外部との間に電子通信の手段はない。例えば、限定するものではないが、銅製電話線又は光ファイバケーブル線などの通信に使用することができる、施設に出入りするケーブルはない。電磁信号が施設に出入りするのを防ぐために、施設を囲むファラデーケージの使用、又は他の手段による電磁通信の妨害など、電磁信号を遮断する方法が使用される。いくつかの実施形態では、施設の周囲の領域は、視覚的及び聴覚的監視により、通信に関して監視される。いくつかの実施形態では、この監視は、電磁信号を監視して、起こり得るスパイ行為を検出することを含む。いくつかの実施形態では、施設内のあらゆるコンピュータシステムは「空隙があり」、施設に出入りするあらゆる個体は不正な通信について監視される。
いくつかの実施形態では、コンピュータが施設内で、バーコードとして使用されるランダム核酸配列のセットを生成する。これらのバーコード配列は、そのセットからの任意の情報を使用してそのセット内のバーコード配列に関していかなる予測をすることも防ぐような方法で生成されるはずであり、その結果、バーコードのセットは固有であり、また各バーコードは、それ以外の場合はセット内の他のバーコードから完全に独立している固有のバーコードになるように生成される。いくつかの実施形態では、これらの配列は、情報が配線から出ないように電磁シールドを有する配線を使用して、核酸からバーコードを生成する機械に配線に従って送信される。いくつかの実施形態では、バーコード配列のセットは、バーコードを生成するために使用される機械に組み込まれているコンピュータによって生成される。いくつかの実施形態では、これらのバーコードは、他の核酸にバーコードを付加するのを援助するのに役立つ、バーコードに連結した任意の材料とともに生成される。これらの材料には、限定するものではないが、アダプター、インデックス、又は該技術の次の工程で使用される任意の他の化学物質もしくは分子が挙げられる。
核酸を用いて多数のバーコードを実現することができる。従来、バイオテクノロジーでは、アデニン、シトシン、チミン及びグアニンの4種類の核酸塩基が使用されている。いくつかの実施形態では、本明細書の技術は、任意の従来使用されていないヌクレオチド塩基(例えば、5−メチルシトシン)を使用することができる。本明細書に記載の技術では、従来使用されていないヌクレオチド塩基を利用すれば、さらに多くの種類のバーコードが実現可能であるという理解とともに、4つのヌクレオチド塩基のみを使用して生成することができる多数のバーコードが論じられている(図3)。
4つのヌクレオチド塩基を用いると、これらのヌクレオチドの4の組合せが実現可能になり、ここで「n」はバーコード内のオリゴヌクレオチドの長さである。例えば、バーコードの長さが4(n=4)の場合、4=256の異なるバーコード配列が実現可能である。一部のバーコードが他のバーコードとは異なる長さになるように、バーコードの長さを変えることが可能な場合、実現可能なバーコード配列がさらに増える。例えば、バーコードの長さが1、2、3又は4の場合、4+4+4+4=340の配列が実現可能である。
バーコードの長さが長くなるにつれて、多数のバーコードが手早く実現可能になる。例えば、バーコードの長さが8で、核酸の長さがわずか8の場合、65,536の組合せが実現可能である。バーコードを20、核酸の長さをわずか20に延ばすと、1兆を超える異なる組合せが可能になる。この技術のいくつかの実施形態では、あらゆるバーコード配列が使用するのに理想的とは限らない場合があり、一部のバーコードを使用から除外することができる。もっとも、一部が除外された後であっても、多数のバーコードが実現可能である。
いくつかの実施形態では、どのバーコード配列が潜在的な分析に理想的であるかを決定するために、コンピュータプログラムを使用して、実現可能なバーコード配列を検査し、それらと分析前又は分析中に相互作用し得る他のヌクレオチド配列とを比較する。実現可能なバーコード配列の検査には、限定するものではないが、それらの二次構造の予測(例えば、G−四重鎖DNA又はRNA構造を形成するそれらの能力の推定)、ホモポリマーランの検査、ホモプリン/ホモピリマジン(homopyrimadine)領域の検査、ヘアピンループ形成能力の検査、又は分析及び/又は分析のための調製を妨げ得る配列の任意の他の特性が挙げられ得る。実現可能なバーコードと他の配列との比較には、限定するものではないが、他のバーコードに対する相補性に関するバーコードの比較、代替構造を形成する能力に関する他のバーコードとのバーコードの比較(三重鎖又は四重鎖DNA形成など)、実現可能なバーコードと相補性を回避するための潜在的な標的核酸との比較、又は実現可能なバーコードと調製中又は分析中に遭遇する可能性のある任意の他の配列との比較が挙げられ得る。これらの実施形態では、使用に理想的ではないと決定された配列は、実現可能なバーコード配列の全セットから取り除かれ、残りの配列はその後サブセットにランダムに分割され、製造される。
いくつかの実施形態では、各サブセットは固有のバーコードのセットを含むが、他の実施形態では、同一の配列を共有する異なるサブセットにいくつかのバーコードが存在する。バーコードのサブセット内でいくつかのバーコードを非固有にすることを可能にし、及び/又はバーコードのサブセット間でいくつかのバーコードを非固有にすることを可能にすると、標的核酸に対して行われ得る分析に応じて秘匿化を援助することができる。いくつかの実施形態では、バーコード生成の前に、コンピュータプログラムを使用して、提案された分析に対してバーコードの非固有性が望ましいかどうかを決定することができる。また、当業者によって生成されたこのコンピュータプログラムを使用して、分析対象の分子がいずれもバーコード化を必要とするかどうか、又はその代わりに分析が異なるサブセット間及び/又はサブセット内でバーコード配列のいくらかの重複を許容し得るかどうかを決定することができる。
いくつかの実施形態では、バーコードがランダムなサブセットで生成され、これらのバーコードのサブセット、及びそれらの関連する連結された化学物質が、他のバーコードのサブセットとは別個にパッケージ化されるようにする(図4)。いくつかの実施形態では、バーコードは、それらに連結した関連する化学物質を伴わずサブセットにパッケージ化される(すなわち、それらはバーコードとしてのみパッケージ化される)。このパッケージ化は、パッケージ内の化学物質を安定化又は輸送するために使用される任意の必要な液体又は他の化学物質を含む。いくつかの実施形態では、バーコードのサブセットは、96ウェルプレート又は384ウェルプレートなどのマイクロウェルプレート上に一緒にパッケージ化される。いくつかの実施形態では、各サブセットに存在するバーコードの表が生成され、紙に印刷される。いくつかの実施形態では、各サブセットに存在するバーコードの表は、CD−ROM、DVD−ROM又はフラッシュメモリドライブなどの外部データ記憶装置に転送される。
いくつかの実施形態では、バーコードの生成は、生成されたバーコードの正確な配列に何らかのランダム性を含む。いくつかの実施形態では、バーコード配列に見られるランダム性は、バーコードを製造するために使用される技術の結果である。いくつかの実施形態では、コンピュータ、又はバーコードオリゴヌクレオチドの生成をランダムに指示する他のプロセスなどのランダム化手段によって、バーコードオリゴヌクレオチドの構築に誘導されるランダム性が加えられる。例えば、バーコードは次のようにランダムに生成され得る。
TACGCGAGATA(配列番号1)又は
TACGCGAGATA(配列番号2)又は
TACGCGAGATA(配列番号3)又は
TACGCGAGATA(配列番号4)
(これらの例のそれぞれでは、配列中の最後のヌクレオチドは4つのヌクレオチド塩基のうちの1つを取り得る)。このランダム化により、一部のサブセット内の一部のバーコードが他のサブセット内のバーコードと同一になる可能性がある。いくつかの実施形態では、ランダムバーコード配列は製造プロセスの前、後、又は製造プロセス中に完全に記録され、他の実施形態では、各サブセットに存在する正確なバーコード配列について不確実性が存在する。各サブセットに存在する正確なバーコード配列に関する不完全な情報は、安全性を高め、及び/又は製造コストを削減することができるが、結果として、分析から得られる結果に関する確実性を低下させる可能性がある。この不確実性は、消費者及び潜在的な敵対者が標的核酸とデコイとを区別する能力を低下させることができる。いくつかの実施形態では、当業者によって設計されたコンピュータプログラムを使用して費用便益分析を実行して、ランダムな潜在的に不完全に知られているバーコードサブセットの便益がこの技術の特定の用途に理想的であるかどうかを決定することができる。
いくつかの実施形態では、バーコードのサブセット及びバーコードの表は、シールが開かれた後に再び密封することができないように容器内に密封される。いくつかの実施形態では、バーコード及びそれらの関連表を有する容器は、信頼できる配達人によって顧客に送られる。他の実施形態では、これらの容器は物流センターに出荷される。
サブセット内のバーコードを安全に生成することによって、この技術の消費者は、それらの標的核酸に対して使用するバーコードのサブセット、及び任意のデコイ核酸に対して消費者が場合により使用し得るサブセットを選択することができる。
いくつかの実施形態では、安全な施設はデコイ核酸も生成する。これらのデコイ核酸は、該技術の今後の工程で使用される。いくつかの実施形態では、デコイに存在する核酸配列は、紙又は電子データフォーマットなどの媒体を使用して、この技術の消費者と共有される。いくつかの実施形態では、デコイの正確な性質は共有されず、デコイ核酸のセットは存在する核酸の種類の一般的な指示のみとともに出荷される。例えば、デコイ核酸のセットは、集団、サブグループ、民族、種、亜種に由来する一群の核酸、又は植物の株、動物の品種、微生物の株、又は植物/動物/微生物の複数の種由来の関連する核酸のセットであってよい。いくつかの実施形態では、これらのデコイ核酸は、第三者によって、又は該技術の消費者によって提供される。いくつかの実施形態では、どのデコイ核酸を使用するかに関して提案が行われる。いくつかの実施形態では、デコイ核酸は、消費者及び安全な施設の両方によって提供され、消費者によって組み合わされる。
安全な施設からデコイ核酸を提供することは、消費者から核酸内に含まれる情報を安全に秘匿化することに役立つが、バーコードが消費者に提供されるため、消費者は自らバーコード化デコイ核酸を安全に生成することができる。秘匿化に最適なデコイの種類は、標的核酸、及び消費者が秘匿化したい情報に応じて決まる。敵対者がデコイ核酸に関して前もって知識を有しないようにすることにより、最大の秘匿化がもたらされるため、デコイ核酸の秘匿生成は理想的である。消費者が適切なデコイ核酸を生成する能力を有しない場合があり、そのような場合には、安全な施設からデコイ核酸を提供することが必要になるであろう。
いくつかの実施形態では、この技術の核酸のバーコード化には、参照により本明細書に組み込まれる米国特許公開第2015/0211050号明細書及び米国特許公開第第2015/0211061号明細書の技術を利用した。いくつかの実施形態では、この技術の使用は、濃縮中又は濃縮前のバーコードの付加を伴う標的核酸の濃縮を含む。濃縮前又は濃縮中のバーコードの付加は、同じオリゴヌクレオチドに由来する複数の核酸オリゴヌクレオチドをタグ付けする個々のバーコードをもたらす。そのような実施形態では、標的核酸と同様に、個々のバーコードがデコイ核酸内の複数の核酸オリゴヌクレオチドをタグ付けするように、濃縮前又は濃縮中にデコイ核酸がバーコードによりタグ付けされる(図5)。
いくつかの実施形態では、長さ1、長さ2、長さ3、長さ4、長さ5、長さ6、長さ7又は長さ8の核酸の小さなバーコードが使用される。いくつかの実施形態では、小さなバーコード及び大きなバーコード、例えば長さ8、長さ9、長さ10、長さ11、長さ12、長さ13、長さ14、長さ15、長さ16、長さ17、長さ18、長さ19、長さ20、長さ21、長さ22、長さ23、長さ24、長さ25、長さ26、長さ27、長さ28、長さ29及び/又は長さ30又はそれ以上のバーコードが一緒に使用される。様々な長さのバーコードが一緒に使用され、核酸がバーコード化された後に濃縮工程がある場合、異なるオリゴヌクレオチドの濃縮の相対速度を考慮しなければならない。例えば、バーコードが長ければ重合されるのにさらに多くの時間が必要になり得るため、これらの比較的長いバーコードによってタグ付けされた核酸の濃縮は、比較的短い核酸によってタグ付けされた核酸よりも少ない濃縮核酸分子をもたらし得る。
いくつかの実施形態では、バーコードならびにそれらのインデックス及びアダプターは異なる重合速度を有するため、これらの異なる分子によってタグ付けされた核酸間で濃縮速度が異なる。いくつかの実施形態では、濃縮速度は、濃縮速度を変える核酸塩基の修飾によって、重合速度を中断又は遅延させる代替二次構造によって、又はポリメラーゼに干渉し、濃縮速度を変えるためにバーコードに他の分子を付加することによって変わる。これらの実施形態では、バーコードならびにそれらのアダプター及びインデックスが重合速度に及ぼす可能性があるランダム効果を利用して、この技術の任意の濃縮工程中に生じる相対濃縮速度を変えることによって、異なるバーコードを有する核酸の量をランダムに変えてもよい。
いくつかの実施形態では、濃縮速度を変えることを利用して、異なるバーコードを有する核酸の量を変えることができ、これを用いて標的核酸をさらに秘匿化してもよい。いくつかのバーコード化標的核酸が標的核酸上のバーコードとは異なる量で存在する場合、同じ供給源に由来するものとしてこれら2つの核酸を連結することはさらに困難になる。例えば、個体がゲノム領域(例えば、遺伝子)について配列決定される場合、その個体は、このゲノム領域の2つの異なる変異体(各親から1つ)を有する可能性が高い。同量の各変異体が存在する場合、それらは単一の供給源に起因する可能性があるが、濃縮されたバーコード化変異体の量が2つの領域で異なる場合、これら2つの領域を同じ供給源に結び付けることはさらに困難になる。
いくつかの実施形態では、ライゲーション工程によってバーコードが付加され、これらの実施形態では、バーコードがライゲーションされた後に続いて濃縮は行わない。いくつかの実施形態では、バーコードのライゲーションの前に濃縮工程がある。いくつかの実施形態では、バーコードのライゲーション前の濃縮工程でもバーコードを付加する。
いくつかの実施形態では、粘着末端ライゲーションを使用して、標的核酸にバーコードがライゲーションされる。いくつかの実施形態では、使用される粘着末端ライゲーションはTAライゲーションであり(図6A)、これはライゲーションの前に標的核酸にアデノシン核酸を付加することを含む。そのような実施形態では、突出しているチミン核酸を含むアダプター分子にバーコードを連結して、標的核酸上の突出しているアデノシンと一致させる。
いくつかの実施形態では、バーコードのライゲーションの前に、核酸に対して制限酵素が使用される(図6B)。制限酵素を用いた核酸の切断は、限定するものではないが、核酸をさらに小さな大きさのオリゴヌクレオチドに分割して分析の必要条件を容易にすること(例えば、次世代シーケンシングは特定の長さよりも小さなオリゴヌクレオチドの入力を必要とする)、核酸に存在する可能性のある変異体が同じ分子上に存在しないように核酸の領域を互いに分離し、秘匿化をさらに向上させること、核酸上に粘着末端を生成して、制限酵素消化によって核酸上に生成された粘着末端に対応するアダプターを用いて設計されたバーコードとのライゲーションを容易にすることなど、複数の目的に役立つ可能性がある。
いくつかの実施形態では、バーコードは、特定の配列決定技術の目的のために使用される工程に組み込まれる。配列決定技術は、分析前に核酸に分子を付加することを必要とするか、それから利益を受け得る。この技術のいくつかの実施形態では、配列分析の前に核酸に付加される分子は、核酸を秘匿化するために設計されたバーコードの付加を含む。例えば、Pacific Biosciences Real−Timeシーケンサーを用いた配列決定は、配列決定される核酸への一本鎖領域の付加から利益を得る(参照により本明細書に組み込まれる米国特許公開第2012/0196279号明細書を参照されたい)。この一本鎖領域はバーコード情報を含むことができ、この技術のいくつかの実施形態では、この領域にバーコードを付加して、分析前に核酸の秘匿化を容易にする。いくつかの実施形態では、前の工程で付加されたバーコードに加えて、この工程でバーコードが付加される。
いくつかの実施形態では、この技術の消費者によってデコイ核酸にバーコードが付加される。これらの実施形態では、任意の標的核酸を用いて行われるのと同様の工程がデコイ核酸を用いて行われる。このような実施形態では、どの核酸にバーコードのどのサブセットを付加するかを消費者が選択することができるため、消費者のみが、標的核酸上に存在するバーコード及びデコイ核酸上に存在するバーコードに関する知識を有する(図5)。いくつかの実施形態では、安全な施設によってデコイ核酸がバーコード化され、消費者に提供される。これらの実施形態では、消費者に提供されるバーコードの表は、どのバーコードをそれらの標的核酸に付加し得るかに関して消費者に情報を与えるであろう。いくつかの実施形態では、安全な施設によって提供されるデコイ核酸上に存在するバーコードの表が、消費者に開示されなくてもよい。他の実施形態では、デコイ核酸に付加されたバーコードの表が消費者に提供される。
いくつかの実施形態では、標的核酸上に見られるいくつかのバーコード配列は、デコイ核酸上に見られるいくつかのバーコード配列と同一である。そのような実施形態では、デコイ核酸上に存在するバーコードの知識が必要であり、安全な施設によって提供されるデコイ核酸に関するバーコードの表が提供されるであろう。標的核酸上及びデコイ核酸上のバーコードのセット間の重複は、消費者でさえ完全な情報を有しないことから、どの核酸が標的であり、どの核酸がデコイであるかに関して秘匿化を向上させることができる!そのような実施形態では、十分な数の固有のバーコードが標的核酸上に存在する限り、消費者は標的核酸に関する有用な情報を依然として得ることができる。いくつかの実施形態では、標的核酸に関する十分な情報を得るために必要とされる固有のバーコードの数は消費者によって決定される。いくつかの実施形態では、標的核酸とデコイ核酸との間でいくつのバーコードが重複し得るかに関して助言が提供される。
いくつかの実施形態では、あらゆる標的及び/又はデコイ(対照)核酸がバーコードを受け取るわけではない。いくつかの実施形態では、それ以外の場合はバーコードを含むであろう非バーコード化アダプター、プライマー又は他の材料の一部が、バーコードを用いずに生成される。いくつかの実施形態では、増幅工程の後又は増幅工程を用いずにバーコードを付加する場合、あらゆる核酸がバーコードを受け取らないように、核酸にバーコードをライゲーションすることができる(例えば、あらゆる核酸がバーコードを受け取らないように、核酸に限られた量のバーコードを付加する)。いくつかの実施形態では、当業者によって生成されたコンピュータプログラムを使用して、あらゆる標的核酸がバーコード化されていない場合に分析が十分な情報を提供できるかどうかを特定することができる。
いくつかの実施形態では、分子生物学的手順及び技術に固有のランダム性を利用して、秘匿化を援助することができる。これらの実施形態では、分析のために調製されたヌクレオチドのバーコード化をランダム化することによって、秘匿化を援助することができる。いくつかの実施形態では、任意のバーコードを受け取る核酸の割合及び/又は数はランダム化される。いくつかの実施形態では、同じバーコードを受け取る核酸の数はランダム化される。例えば、濃縮工程中又は濃縮工程前にバーコードが付加される場合、核酸の全プール内に見られる同一のバーコードの相対量は、それによって核酸が増幅された分子過程におけるランダム性の影響を受けるであろう。いくつかの実施形態では、任意のバーコードを受け取るバーコードの数及び/又は割合のランダム性を利用して、秘匿化を援助する。いくつかの実施形態では、核酸にバーコードを付加するために使用される方法が、バーコードを受け取る核酸全部よりも少ない結果をもたらす場合、バーコードを受け取るか、受け取らない特定の核酸はランダムであり得る。いくつかの実施形態では、当業者によって生成されたコンピュータプログラムを使用して、様々な核酸の量の分布の推定、及びランダム化手順が秘匿化に及ぼす影響を予測することができる。いくつかの実施形態では、ランダム性を推定するために使用されるコンピュータプログラムはまた、分子遺伝学的手順を使用してランダム性がどのように達成されるかを指示することができる。
この技術で核酸をプールする方法は、限定するものではないが、標的とされる核酸の種類(例えば、標的核酸の種、亜種又は民族)、標的核酸に関して敵対者が有する可能性のある知識、消費者が秘匿化したい情報の種類、核酸の分析に使用される技術の正確性、消費者に対するデコイ核酸の利用可能性、標的核酸について利用可能な知識、配列分析の費用、分析に利用可能な資金、又は消費者及び/又は潜在的な敵対者が、使用された標的核酸及びデコイ核酸に関して有し得る情報に影響を及ぼす他の任意の要因を含む様々な要因に応じて決まる。
本明細書に提供される方法は、秘匿化のために核酸をプールするための様々な技術を提供する。秘匿化のためのバーコード化核酸のプールの使用は、本明細書に提供される例に限定されない。
いくつかの実施形態では、シミュレーション及び/又はシミュレーションが可能なコンピュータプログラムが消費者に提供されて、プール化に関する決定を下すのを援助する。いくつかの実施形態では、消費者によって選択されたプライバシーのレベルに必要なプール化の種類を決定するために、差分プライバシー(参照により本明細書に組み込まれる米国特許第7,698,250号明細書を参照)などの1つ以上のプライバシーの尺度が使用される。いくつかの実施形態では、プール化の方法に関して消費者に提案が行われる。
いくつかの実施形態では、デコイ核酸のプールは、部分的又は全体的に、他の標的核酸、すなわち互いに同一ではない標的核酸からなる。ある供給源からの標的核酸を他の供給源からの標的核酸のためのデコイ核酸として使用することによって、有用な分析の相対的な費用が削減される。使用されるデコイ核酸の一部又は全部が消費者にとって関心のある標的核酸ではない場合、標的核酸をこれらのデコイとともにプールすると、目的外の核酸の分析が必要になる。配列決定分析の費用が減少し続けるにつれて、分析のための目的外のデコイ核酸の核酸プールへの追加は比較的安価になるであろう。しかし、この技術のいくつかの実施形態では、プールされた核酸はいずれも、消費者にとって関心がある(すなわち、複数の標的核酸が互いにデコイとして機能する)ため、この技術は消費者にとって費用対効果の高い安価な配列決定を必要としない。いくつかの実施形態では、プール化に関する決定は、分析の費用、及び消費者が分析のために有する予算の影響を受ける。
バーコード化核酸をプールすることにより、それらの核酸に関する情報を秘匿化することができる。秘匿化されることが望まれる情報によって、プール化の方法が決定される。この技術によって秘匿化することができる核酸に存在する情報の種類の例が、本明細書に提供される。情報を秘匿化するためのこの技術の使用は、本明細書に提供される例に限定されない。
予測的な例として、標的核酸が、ある個人に由来し、それらの標的核酸が疾患リスクをもたらし得る遺伝子(例えば、その個人を乳癌/卵巣癌に罹りやすくするBRCA1遺伝子変異体)に富んでいると仮定する。標的核酸がバーコード化され、他の個体から得られた同じ遺伝子に由来するバーコード化核酸(デコイプール)と組み合わされたと仮定する。デコイプールが民族的に類似した個体からなると仮定すると、プール全体の構成は、標的が追加される前のデコイプール単独とほぼ同じである。このため、プールにある個体の核酸が追加されてもプールはわずかに変化するにとどまるため、いかなる敵対者であってもプールに何らかの個体が存在するかどうかを特定することが困難になるはずである。したがって、プール内の個体を識別するために使用され得る核酸からの情報は、固有の分子バーコードの使用によって秘匿化される。敵対者は、プールが複数の未知の個体由来の遺伝子の多数のコピーからなると特定することはできるが、これらの個体を識別することは困難になるはずである。
一致する集団から得られた核酸の大きなプールを用いて核酸を匿名化すると、単一の標的に関する情報を得るためにプール全体を分析することが必要になる。論じたように、デコイ核酸のプールが他の標的核酸からなる場合、プールの分析から提供される情報はいずれも消費者にとって有用である。いくつかの実施形態では、プールは互いにデコイとして機能する標的核酸のみからなる。いくつかの実施形態では、プールは、標的核酸を秘匿化するように作用するのみである、消費者にとって関心のないデコイ核酸からなる。いくつかの実施形態では、デコイプールは様々な供給源の組合せであり、そのうちの一部は消費者にとって関心のある標的核酸であり、そのうちの一部は消費者にとって関心のないデコイ核酸である。
また、核酸の分析から、必ずしも核酸の供給源を識別するのに役立ち得ない形質に関する遺伝情報(例えば、疾患リスク)を得ることができる場合がある。いくつかの実施形態では、本明細書に記載の技術はまた、その形質情報を秘匿化し得る。一部の形質については、核酸変異体の組合せを使用して、その形質を予測する。例えば、ゲノム中の遺伝子座にホモ接合性を有する個体は、ある疾患に易罹患性である可能性がある。バーコード化及びプール化は、標的核酸の様々な部分に由来する情報を分割する。例えば、一方の親から継承された対立遺伝子変異体は、他方の親に由来する対立遺伝子変異体とは異なってバーコード化されるため、個体が継承した遺伝子型を特定するにはバーコードの表を使用する必要がある。結果として、匿名化のみのために設計されたプール化法であっても、核酸に存在する他の情報を秘匿化する。
ただし、プール化のいくつかの方法では、形質情報に関する秘匿化が強化される。別の予測的な例として、この場合もやはり遺伝子の変異(例えば、やはりBRCA1など)について標的が分析されていると仮定し、それらのバーコード化核酸が互いにデコイとして作用するように一緒にプールされると仮定する。このプールを使用して、敵対者がプールに関する一般的な形質情報を入手する可能性がある。例えば、プール内の多くの個体が、癌リスクを生じさせやすくするBRCA1変異体を保有している場合、敵対者が配列分析にアクセスすれば、そのプールが一般集団よりも比較的高い癌のリスクを有することを特定できるはずである。形質情報が秘匿化されるように、プール用にデコイ核酸を選択することができる。同じ予測的な例の中では、プールが一般集団と同量の疾患リスク変異体を有するように見えるように、デコイ核酸を選択することができる。この場合、配列決定された核酸のプールが由来する個体は、一般集団に生じることが既に知られている比率と同等の比率で存在する形質を有すると予測されるであろう。したがって、プールは、プールに存在する形質に関して情報価値がなくなる。いくつかの実施形態では、バックグラウンド集団と同様の比率で形質を含むように見えるようにプールを設計することによって、核酸をプールして、プールに存在する形質を秘匿化する。
標的核酸に由来しないデコイ核酸を選択すると、プールに存在する形質をさらに正確に制御することができるため、形質がさらに秘匿化されるようになる可能性がある。いくつかの実施形態では、デコイ核酸が追加されて、プールが特定の形質を有するように見えるようにし、プール内の標的核酸の供給源の形質を秘匿化する。いくつかの実施形態では、既知の形質(例えば、癌リスクの高い遺伝的変異体)を有するデコイ核酸をプールに追加し、その形質を有する核酸変異体をプールが豊富に含むようにする。予測された形質を有する核酸の圧倒的な存在により、標的核酸もその形質を有するかどうかを秘匿化することができる。予測的な例として、形質(例えば、個体由来のBRCA遺伝子を用いた癌リスク)について分析されている標的核酸の同じプールを得、その形質を有する大量のデコイ核酸を追加する。標的核酸の供給源の形質とは無関係に、プールは今やその形質を有する多くの個体を含むように見える。
いくつかの実施形態では、標的核酸は、標的核酸の供給源に対して測定された形質、標的核酸の供給源の家族に存在する形質、標的核酸の供給源の血統分析、標的核酸の民族的背景、又は標的核酸の供給源について知られている任意の他の情報などの他の要因に起因する特定の形質を有すると先験的に考えることができる。いくつかの実施形態では、この情報を用いて標的核酸がプールされる。
いくつかの実施形態では、ランダム性を利用して、プールに追加される様々な供給源由来の核酸の量を変える。いくつかの実施形態では、分析用の核酸を調製するために使用される分子遺伝学プロトコルにランダム性が生じる。一例として、核酸の増幅は、ランダムな量の核酸の生成をもたらす。分子生物学技術におけるランダム性の別の例では、既に核酸を含んでいてもいなくてもよい別の液体に核酸を含む液体を分注すると、精度が低下する。したがって、分注される核酸の正確な量はランダムである。さらに、核酸を分析する際に、分析の正確な結果は、限定するものではないが、分析を受ける正確な核酸オリゴヌクレオチドのランダム性、分析結果の質のランダム性(例えば、ランダム誤差)、及び/又は所与の核酸オリゴヌクレオチドに関する結果の量のランダム性を含む多くの方法でランダム性を含む。
いくつかの実施形態では、分子生物学技術に固有のランダム性は消費者によって修正される。いくつかの実施形態では、消費者は、プール内の核酸の量のランダム性を高めるために、自らの検査技法を修正する。このランダム性には、限定するものではないが、ランダム性を高めることが知られている検査技法(例えば、ピペット操作量の精度が低いピペッティング技術)の使用、増幅から生じる核酸の量の精度が低いことが知られている核酸増幅法の使用(例えば、タイミング及び/又は温度の精度が限られているサーモサイクラーの使用)、及び/又はランダム性を導入することが知られている試薬及び化学物質の(例えば、核酸の精製又は核酸の増幅時の)使用が挙げられ得る。いくつかの実施形態では、核酸を調製するために使用される技術をさらにランダム化するためのランダム化手段(例えば、限定するものではないが、コイン、サイコロ又はコンピュータなど)の使用。ランダム化手段は、核酸調製及び/又は分析の任意の工程をランダム化して、精製、単離、増幅及び/又は分注される核酸の量をランダム化するための検査技法をさらにランダム化して、得られるプール内の核酸の量のランダム性を高めることができる。当業者は、任意の所与の技法又は技法のグループに許容されるランダムな量の材料の範囲を決定して、ランダムに導出されたプロトコルがいずれも確実に成功するようにすることができる。1つの予測的な例では、コイン投げを使用して、プールに追加される核酸の量を決定することができ、当業者が許容される最小値(ランダム化手段によって導出される(ここではコイン))を決定して、分析を成功させるために十分な核酸が確実に存在するようにする。
いくつかの実施形態では、当業者によって設計されたコンピュータプログラムを使用して、この技術の所与の用途に対してどれほどのランダム性が理想的であるかを決定する。いくつかの実施形態では、情報理論を使用して、プール化によってどれほどのランダム性が生じ得るかを測定する。いくつかの実施形態では、アドバーサリアルモデリング(adversarial modeling)を使用して、どれほどのランダム性がプール化に使用されるかを決定する。いくつかの実施形態では、ランダムプール化によって生じる追加費用の推定値を使用して、どれほどのランダム性がプール化に使用されるかを決定する。そのような費用には、限定するものではないが、ランダムな量の様々な核酸の増幅及び/又はピペッティングによって核酸の量をランダムに変えることによって生じる費用、及び標的核酸を十分に分析するために必要とされる全配列決定を増加する必要性によって生じる費用を挙げることができる。核酸がランダムにプールされると、一部の標的核酸がプール内に少量しか存在しなくなる可能性がある。そのようなプールを分析する場合、これらの数少ない核酸は、その後、もっと多く存在する核酸よりも少ない回数の分析を受けることになる。プールに対して行われる分析の総数を増やすと、数少ない核酸であっても十分な分析を確実に受けることができる。いくつかの実施形態では、所与のランダムプール化法に必要とされる分析の総量は、当業者によって推定される。
配列決定プロトコルにおけるランダム性によって引き起こされる変動は、さらに秘匿化を援助することができる。配列決定分析は、配列データを生成するために核酸のプールを利用する。これらのデータはプール内の各核酸と同等には提供されない。配列決定により、一部の核酸オリゴヌクレオチドがデータ内に1つ以上の核酸配列を生成するのに対して、同じプール内の他の核酸オリゴヌクレオチドはデータ内に配列を生成しない。さらに、シーケンサーによって生成された配列データは、配列決定されたあらゆるオリゴヌクレオチドについて同等の品質の配列データ結果を提供するわけではない。いくつかの実施形態では、分析の固有のランダム性を推定し、異なる試料量の間にさらにランダムな変動を導入するであろう追加のランダム性を提案し、及び/又はこれらの方法によって得られるプライバシーを推定するために、当業者によって設計されたコンピュータプログラムが使用されるであろう。同様に、コンピュータプログラムを使用して、セキュリティを高め、及び/又は分析に使用されるバーコードの量を制限するために、(バーコードのサブセット間又はサブセット内の)非固有のバーコードを使用することができるかどうか、及び/又は使用すべきかどうかを推定することができる。
いくつかの実施形態では、匿名化は消費者にとって関心が低く、標的核酸内の他の情報の秘匿化が優先される。例えば、敵対者が配列分析結果にアクセスし、分析されている核酸の供給源も知っている場合。「家族プール化(family pooling)」のための方法を使用して、その家族の子孫の核酸を秘匿化することができる。子孫の核酸は、主に、各親に由来する核酸から構成される。大量の核酸プールが各親由来の核酸からなる場合、その子孫由来の少量の核酸をプールに追加し、プールにわずかな変更のみを加えることができる。したがって、子孫由来の核酸を、その親由来の核酸のプールに都合よく隠すことができる。この技術のいくつかの実施形態では、家族プール化を使用して子孫の核酸を秘匿化する。家族プール化のいくつかの実施形態では、各親に由来する様々な量の核酸が使用される。いくつかの実施形態では、親及び子孫由来の核酸が濃縮され、濃縮中にバーコードが追加される。いくつかの実施形態では、異なるバーコードを有する核酸が濃縮される速度を変えることによって、一部の核酸が他の核酸よりも濃縮される。いくつかの実施形態では、例えば、濃縮中に起こる重合のサイクル数を変えるなどの他の手段を用いて濃縮速度を変えることによって、標的核酸又はデコイ核酸の変動を生じさせる。いくつかの実施形態では、追加される異なる核酸の量を変えることによって、様々な量の異なる核酸をプールに存在させる。
プール内の変異体の相対量をランダムに変えることによって、異なる変異体の相対頻度を変化させる。それ以外の場合は、プールに存在する変異体の相対比率が、どの変異体が子孫によって継承されたかを示すのに役立ち得るため、子孫の核酸が親の核酸のプール内でさらに秘匿化され得る。
育種計画に同様の方法を使用して、子孫由来の核酸を秘匿化することができる。例えば、所望の1つ又は複数の形質を最適化するために二倍体生物をハイブリダイズさせることができ、核酸分析はその形質が発現する前に子孫の形質を特定するのを支援することができる。例えば、子牛に対して核酸分析を用いて畜牛の乳汁生産を推定することができ、若木由来の核酸に対して作物収量を推定することができ、又は形質が完全に発現する前に子孫の成熟を必要とする任意の他の形質を予測するのに核酸分析が役立ち得る。いくつかの実施形態では、この「系統プール化(pedigree pooling)」を使用して、育種計画の際に子孫をバーコード化及びプールすることによって、育種計画の際に子孫に関する情報を秘匿化することができる。いくつかの実施形態では、子孫由来のバーコード化核酸とともに、子孫の両親又は他の近縁種に由来するバーコード化核酸をプールして、秘匿化を支援する。いくつかの実施形態では、子孫の核酸のみを一緒にバーコード化及びプールして、互いにデコイとして機能させる。いくつかの実施形態では、プール化にランダム性が利用される。前述のランダム性の適用と同様に、コンピュータプログラムを使用して、プロセス内の固有のランダム性を推定し、バーコード化及び/又はプール化をさらにランダム化して所望のセキュリティを達成する方法を提供することができる。
「系統プール化」を使用する実施形態では、敵対者は、プールの混合物が様々な品種の植物又は動物に由来すると特定することはできるであろうが、その品種がどのようにしてその系統に混合されたか、又はその品種がそれらの核酸がプール内で一緒に混合された純粋な品種であるかどうかを特定することは困難になるはずである。いくつかの実施形態では、プール化は、多数の多様な子孫及び/又はそれらの近縁種に由来する核酸をプールすることによって、育種計画に存在する品種及び/又は雑種の種類を秘匿化するように設計される。
育種者は、特定の遺伝的形質について選択された雑種の系統を繁殖させ、その結果、それらの雑種に特定の核酸が存在するようにする場合がある。したがって、それらの雑種は、異なる系統由来の特定の量の異なる変異体を含むことになり、これらの雑種の核酸分析では、育種計画、及び品種に存在する形質に関する情報が明らかにされる可能性がある。いくつかの実施形態では、元の品種に由来する核酸と雑種に由来する核酸とを混合して、異なる変異体の相対頻度を変え、さらに、目的の品種に存在する形質を秘匿化し、育種計画を難読化する。
いくつかの実施形態では、データ記憶媒体として核酸が使用されており、核酸に記憶されているデータを秘匿化するために、この技術が使用される。いくつかの実施形態では、これらのデータ記憶核酸のバーコード化はそれらの核酸内の情報を秘匿化するのに十分であり、追加のバーコード化核酸は核酸を含むデータのプールに加えられない(すなわち、標的核酸の一部は他の部分のためのデコイとして作用することができる)。いくつかの実施形態では、データを含むバーコード化核酸が、データを含まないバーコード化核酸とともにプールされる。いくつかの実施形態では、データを含むバーコード化核酸が、生物に由来するバーコード化核酸とともにプールされ、その生物の核酸のプール内にデータ含有核酸を秘匿化する。
本明細書に引用された文書はいずれも、参照により本明細書に組み込まれる。
本発明の様々な実施形態を詳細に説明してきたが、当業者であれば、それらの実施形態の修正及び適応を思いつくことは明らかである。しかし、そのような修正及び適応は、以下の例示的な特許請求の範囲に記載されているように、本発明の範囲内であることを明確に理解されたい。
配列表1〜4 <223>例示的な配列

Claims (23)

  1. 核酸内に存在し得る情報を秘匿化する方法であって、方法が、
    (a)バーコードを安全に生成することと、
    (b)核酸にバーコードを付加してバーコード化核酸を作製することと、
    (c)他の核酸とともにバーコード化核酸をプールすることと
    を含み、
    安全なバーコード生成が、各セットに存在するバーコードの表とともに多数のセットのバーコードを生成する施設内で行われ、
    バーコード及びバーコードの表が、密封が破られた時を示す容器内に密封され、
    同じ個々の核酸の試料を有する異なる核酸間でバーコードが完全に同一ではないように、バーコードが核酸分子に付加され、
    バーコード化核酸と他のバーコード化核酸とのプール化が、核酸内に存在する情報を秘匿化する、上記方法。
  2. 消費者にとって関心のある核酸をバーコード化しプールすることができる核酸が提供される、請求項1に記載の方法。
  3. 提供される核酸が安全な施設内でバーコード化される、請求項2に記載の方法。
  4. 核酸に付加されたバーコードの表が消費者に提供される、請求項3に記載の方法。
  5. 濃縮工程の前又は濃縮工程の間に核酸にバーコードが付加される、請求項1に記載の方法。
  6. バーコードが濃縮工程の間又は濃縮工程の前に選択され、付加されて、異なるバーコードを有する核酸の相対量を変える、請求項5に記載の方法。
  7. バーコードが、粘着末端ライゲーションを使用して核酸に付加される、請求項1に記載の方法。
  8. バーコードが、TAライゲーションを使用して核酸に付加される、請求項7に記載の方法。
  9. 核酸が制限酵素によって消化される、請求項7に記載の方法。
  10. バーコードが、制限酵素によって生成された粘着末端に対応する粘着末端を含み、これらの粘着末端が、核酸にバーコードをライゲーションするために使用される、請求項9に記載の方法。
  11. 制限酵素による消化が、オリゴヌクレオチドの大きさを減少させるために使用される、請求項9に記載の方法。
  12. 制限酵素による消化を使用して、分析前に核酸内の変異体を互いに連結解除する、請求項9に記載の方法。
  13. 配列分析のための核酸の調製のために通常行われるであろう工程の間にバーコードが加えられる、請求項1に記載の方法。
  14. 核酸に付加された一部のバーコードが、他の核酸に付加された他のバーコードと同一の配列を共有する、請求項1に記載の方法。
  15. 核酸が含み得る情報を秘匿化するために核酸をどのようにプールし得るかについて、消費者に助言が与えられる、請求項1に記載の方法。
  16. バーコード化核酸が、何らかの類似性を共有する他のバーコード化核酸とともにプールされる、請求項1に記載の方法。
  17. バーコード化核酸が、類似の起源を共有する他のバーコード化核酸とともにプールされる、請求項1に記載の方法。
  18. 核酸の供給源に存在する形質について行われ得る予測を制御するように、バーコード化核酸が他のバーコード化核酸とともにプールされるように選択される、請求項1に記載の方法。
  19. 核酸の供給源の同一性が秘匿化されるように、バーコード化核酸がプールされる、請求項1に記載の方法。
  20. 核酸の供給源の一部に存在する形質に関する情報が秘匿化されるように、バーコード化核酸がプールされる、請求項1に記載の方法。
  21. 育種者がそれらの品種に存在する形質を秘匿化し得るように、バーコード化核酸がプールされる、請求項1に記載の方法。
  22. 育種者がそれらの育種計画に使用された方法を秘匿化し得るように、バーコード化核酸がプールされる、請求項1に記載の方法。
  23. データを含むバーコード化核酸をプールして、それらが含むデータを秘匿化する、請求項1に記載の方法。
JP2019543186A 2016-10-24 2017-10-24 核酸内に存在する情報の秘匿化 Active JP6941680B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662411998P 2016-10-24 2016-10-24
US62/411,998 2016-10-24
PCT/US2017/058076 WO2018081113A1 (en) 2016-10-24 2017-10-24 Concealing information present within nucleic acids

Publications (2)

Publication Number Publication Date
JP2019533478A JP2019533478A (ja) 2019-11-21
JP6941680B2 true JP6941680B2 (ja) 2021-09-29

Family

ID=62025409

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019543186A Active JP6941680B2 (ja) 2016-10-24 2017-10-24 核酸内に存在する情報の秘匿化

Country Status (8)

Country Link
US (1) US11667951B2 (ja)
EP (1) EP3529400B1 (ja)
JP (1) JP6941680B2 (ja)
CN (1) CN110312825A (ja)
CA (1) CA3041645C (ja)
ES (1) ES2870639T3 (ja)
IL (1) IL266197B2 (ja)
WO (1) WO2018081113A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3276526A1 (en) * 2008-12-31 2018-01-31 23Andme, Inc. Finding relatives in a database
WO2018081113A1 (en) 2016-10-24 2018-05-03 Sawaya Sterling Concealing information present within nucleic acids
KR20210098491A (ko) 2018-11-30 2021-08-10 진인포섹, 아이엔씨. 무작위 올리고뉴클레오티드를 생성하고 그 서열을 결정하는 방법

Family Cites Families (244)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5106727A (en) 1989-04-27 1992-04-21 Life Technologies, Inc. Amplification of nucleic acid sequences using oligonucleotides of random sequences as primers
CA2036946C (en) 1990-04-06 2001-10-16 Kenneth V. Deugau Indexing linkers
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US6087186A (en) 1993-07-16 2000-07-11 Irori Methods and apparatus for synthesizing labeled combinatorial chemistry libraries
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
USRE43097E1 (en) 1994-10-13 2012-01-10 Illumina, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US5763175A (en) 1995-11-17 1998-06-09 Lynx Therapeutics, Inc. Simultaneous sequencing of tagged polynucleotides
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
US5963722A (en) 1997-07-31 1999-10-05 Advanced Micro Devices, Inc. Byte granularity data checking in a bus bridge verification system
US6607878B2 (en) 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
US6537747B1 (en) * 1998-02-03 2003-03-25 Lucent Technologies Inc. Data transmission using DNA oligomers
US5998175A (en) 1998-07-24 1999-12-07 Lumigen, Inc. Methods of synthesizing and amplifying polynucleotides by ligation of multiple oligomers
AU772281B2 (en) 1998-12-14 2004-04-22 Li-Cor Inc. A system and methods for nucleic acid sequencing of single molecules by polymerase synthesis
DE60032259D1 (de) * 1999-05-06 2007-01-18 Sinai School Medicine Steganographie auf DNA basis
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
US6620584B1 (en) 1999-05-20 2003-09-16 Illumina Combinatorial decoding of random nucleic acid arrays
US6235483B1 (en) 2000-01-31 2001-05-22 Agilent Technologies, Inc. Methods and kits for indirect labeling of nucleic acids
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7157564B1 (en) 2000-04-06 2007-01-02 Affymetrix, Inc. Tag nucleic acids and probe arrays
US6917726B2 (en) 2001-09-27 2005-07-12 Cornell Research Foundation, Inc. Zero-mode clad waveguides for performing spectroscopy with confined effective observation volumes
US6936702B2 (en) 2000-06-07 2005-08-30 Li-Cor, Inc. Charge-switch nucleotides
US6869764B2 (en) 2000-06-07 2005-03-22 L--Cor, Inc. Nucleic acid sequencing using charge-switch nucleotides
US6958217B2 (en) 2001-01-24 2005-10-25 Genomic Expression Aps Single-stranded polynucleotide tags
CA2387277C (en) * 2001-05-25 2015-03-03 Hitachi, Ltd. Information processing system using nucleotide sequence-related information
US6613523B2 (en) 2001-06-29 2003-09-02 Agilent Technologies, Inc. Method of DNA sequencing using cleavable tags
US20040142325A1 (en) 2001-09-14 2004-07-22 Liat Mintz Methods and systems for annotating biomolecular sequences
EP1451365A4 (en) 2001-11-13 2006-09-13 Rubicon Genomics Inc DNA AMPLIFICATION AND SEQUENCING WITH DNA MOLECULES CREATED BY RANDOM FRAGMENTATION
AU2002366098A1 (en) 2001-11-19 2003-06-10 Parallele Bioscience Inc Multiplex pcr
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
US8855935B2 (en) 2006-10-02 2014-10-07 Ancestry.Com Dna, Llc Method and system for displaying genetic and genealogical data
EP2365095A1 (en) 2003-02-26 2011-09-14 Callida Genomics, Inc. Random array DNA analysis by hybridization
WO2004092331A2 (en) 2003-04-08 2004-10-28 Li-Cor, Inc. Composition and method for nucleic acid sequencing
RU2470077C2 (ru) 2003-12-17 2012-12-20 ГЛЭКСОСМИТКЛАЙН ЭлЭлСи Биологически активное соединение, содержащее кодирующий олигонуклеотид (варианты), способ его синтеза, библиотека соединений (варианты), способ ее синтеза и способ поиска соединения, связывающегося с биологической мишенью (варианты)
US7972994B2 (en) 2003-12-17 2011-07-05 Glaxosmithkline Llc Methods for synthesis of encoded libraries
US7381529B2 (en) 2003-12-31 2008-06-03 Intel Corporation Methods and compositions for detecting nucleic acids using scanning probe microscopy and nanocodes
WO2005080604A2 (en) 2004-02-12 2005-09-01 Compass Genetics, Llc Genetic analysis by sequence-specific sorting
US7462452B2 (en) 2004-04-30 2008-12-09 Pacific Biosciences Of California, Inc. Field-switch sequencing
US8071755B2 (en) 2004-05-25 2011-12-06 Helicos Biosciences Corporation Nucleotide analogs
CN101010436B (zh) 2004-07-14 2012-12-05 Zs遗传学有限公司 分析核酸聚合物的系统和方法以及相关组件
US7476503B2 (en) 2004-09-17 2009-01-13 Pacific Biosciences Of California, Inc. Apparatus and method for performing nucleic acid analysis
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
US7892731B2 (en) * 2004-10-01 2011-02-22 Radix Biosolutions, Ltd. System and method for inhibiting the decryption of a nucleic acid probe sequence used for the detection of a specific nucleic acid
US8340914B2 (en) 2004-11-08 2012-12-25 Gatewood Joe M Methods and systems for compressing and comparing genomic data
US7647186B2 (en) 2004-12-07 2010-01-12 Illumina, Inc. Oligonucleotide ordering system
AU2006213692C1 (en) 2005-02-09 2011-08-04 Pacific Biosciences Of California, Inc. Nucleotide compositions and uses thereof
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US7407757B2 (en) 2005-02-10 2008-08-05 Population Genetics Technologies Genetic analysis by sequence-specific sorting
WO2006116455A2 (en) 2005-04-26 2006-11-02 Applera Corporation System for genetic surveillance and analysis
CA2611671C (en) 2005-06-15 2013-10-08 Callida Genomics, Inc. Single molecule arrays for genetic and chemical analysis
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
EP1924704B1 (en) 2005-08-02 2011-05-25 Rubicon Genomics, Inc. Compositions and methods for processing and amplification of dna, including using multiple enzymes in a single reaction
CA2624324A1 (en) * 2005-10-06 2007-04-19 Lucigen Corporation Thermostable viral polymerases and methods of use
US7960104B2 (en) 2005-10-07 2011-06-14 Callida Genomics, Inc. Self-assembled single molecule arrays and uses thereof
DK2341140T3 (da) 2005-12-01 2017-11-06 Nuevolution As Fremgangsmåde til enzymatisk kodning ved effektiv syntese af store biblioteker
US7698250B2 (en) 2005-12-16 2010-04-13 Microsoft Corporation Differential data privacy
CA2633476C (en) 2005-12-22 2015-04-21 Pacific Biosciences Of California, Inc. Active surface coupled polymerases
US9966153B2 (en) 2005-12-29 2018-05-08 Quest Diagnostics Investments Incorporated Graphical presentation of medical data
US7537897B2 (en) 2006-01-23 2009-05-26 Population Genetics Technologies, Ltd. Molecular counting
WO2007087310A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Nucleic acid analysis using sequence tokens
WO2007092538A2 (en) 2006-02-07 2007-08-16 President And Fellows Of Harvard College Methods for making nucleotide probes for sequencing and synthesis
US8975216B2 (en) 2006-03-30 2015-03-10 Pacific Biosciences Of California Articles having localized molecules disposed thereon and methods of producing same
US7563574B2 (en) 2006-03-31 2009-07-21 Pacific Biosciences Of California, Inc. Methods, systems and compositions for monitoring enzyme activity and applications thereof
CA2652052A1 (en) 2006-05-16 2007-11-29 Nugen Technologies, Inc. Nucleic acid separation and purification method based on reversible charge interactions
EP2038429B1 (en) 2006-06-30 2013-08-21 Nugen Technologies, Inc. Methods for fragmentation and labeling of nucleic acids
EP2405272B1 (en) 2006-06-30 2015-01-14 DiscoveRx Corporation Detectable nucleic acid tag
US7910302B2 (en) 2006-10-27 2011-03-22 Complete Genomics, Inc. Efficient arrays of amplified polynucleotides
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
AU2008237018B2 (en) 2007-04-10 2014-04-03 Nanostring Technologies, Inc. Methods and computer systems for identifying target-specific sequences for use in nanoreporters
US9163053B2 (en) 2007-05-18 2015-10-20 Fluidigm Corporation Nucleotide analogs
GB0712245D0 (en) * 2007-06-25 2007-08-01 Cythera Technologies Ltd Combinatorial libraries and related methods
EP2173872B1 (en) 2007-06-29 2014-04-02 CellScript, Inc. Copy dna and sense rna
US8589437B1 (en) 2007-10-15 2013-11-19 23Andme, Inc. De-identification and sharing of genetic data
US9336177B2 (en) 2007-10-15 2016-05-10 23Andme, Inc. Genome sharing
US8518640B2 (en) 2007-10-29 2013-08-27 Complete Genomics, Inc. Nucleic acid sequencing and process
US8093063B2 (en) 2007-11-29 2012-01-10 Quest Diagnostics Investments Incorporated Assay for detecting genetic abnormalities in genomic nucleic acids
JP2011509095A (ja) 2008-01-09 2011-03-24 ライフ テクノロジーズ コーポレーション 核酸配列決定のための対をなすタグのライブラリーを製造する方法
WO2009114182A1 (en) 2008-03-13 2009-09-17 Pacific Biosciences Of California, Inc. Labeled reactants and their uses
CA2719747C (en) 2008-03-28 2018-02-20 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing
AU2009251881B2 (en) 2008-03-31 2015-03-26 Pacific Biosciences Of California, Inc Single molecule loading methods and compositions
EP2274446B1 (en) 2008-03-31 2015-09-09 Pacific Biosciences of California, Inc. Two slow-step polymerase enzyme systems and methods
CN102203287B (zh) 2008-08-26 2017-09-19 弗卢迪格姆公司 增加样本和/或靶通量的测定方法
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
US8748103B2 (en) 2008-11-07 2014-06-10 Sequenta, Inc. Monitoring health and disease status using clonotype profiles
US9506119B2 (en) 2008-11-07 2016-11-29 Adaptive Biotechnologies Corp. Method of sequence determination using sequence tags
WO2010057185A1 (en) 2008-11-17 2010-05-20 Pacific Biosciences Of California, Inc. Phospholink nucleotides for sequencing applications
WO2010059206A2 (en) 2008-11-19 2010-05-27 Pacific Biosciences Of California, Inc. Modular nucleotide compositions and uses therefor
US9175338B2 (en) 2008-12-11 2015-11-03 Pacific Biosciences Of California, Inc. Methods for identifying nucleic acid modifications
SG183029A1 (en) 2009-01-13 2012-08-30 Fluidigm Corp Single-cell nucleic acid analysis
NZ594420A (en) 2009-02-13 2013-06-28 Chem Inc X Methods of creating and screening dna-encoded libraries
AU2010232439C1 (en) 2009-04-02 2017-07-13 Fluidigm Corporation Multi-primer amplification method for barcoding of target nucleic acids
WO2010117470A2 (en) 2009-04-10 2010-10-14 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
US8053744B2 (en) 2009-04-13 2011-11-08 Src, Inc. Location analysis using nucleic acid-labeled tags
WO2011021102A2 (en) 2009-08-20 2011-02-24 Population Genetics Technologies Ltd Compositions and methods for intramolecular nucleic acid rearrangement
US8236570B2 (en) 2009-11-03 2012-08-07 Infoscitex Methods for identifying nucleic acid ligands
US9023769B2 (en) 2009-11-30 2015-05-05 Complete Genomics, Inc. cDNA library for nucleic acid sequencing
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
CA2767182C (en) 2010-03-25 2020-03-24 Bio-Rad Laboratories, Inc. Droplet generation for droplet-based assays
WO2011161549A2 (en) 2010-06-24 2011-12-29 Population Genetics Technologies Ltd. Methods and compositions for polynucleotide library production, immortalization and region of interest extraction
MY173793A (en) 2010-06-30 2020-02-24 Bgi Genomics Co Ltd New pcr sequencing method and use thereof in hla genotyping
US20140342940A1 (en) 2011-01-25 2014-11-20 Ariosa Diagnostics, Inc. Detection of Target Nucleic Acids using Hybridization
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
ES2595433T3 (es) * 2010-09-21 2016-12-30 Population Genetics Technologies Ltd. Aumento de la confianza en las identificaciones de alelos con el recuento molecular
CA2814049C (en) 2010-10-08 2021-07-13 President And Fellows Of Harvard College High-throughput single cell barcoding
US9074251B2 (en) 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
US8865404B2 (en) 2010-11-05 2014-10-21 President And Fellows Of Harvard College Methods for sequencing nucleic acid molecules
EP2652155B1 (en) 2010-12-16 2016-11-16 Gigagen, Inc. Methods for massively parallel analysis of nucleic acids in single cells
AU2012211081B2 (en) 2011-01-28 2016-02-04 Illumina, Inc. Oligonucleotide replacement for di-tagged and directional libraries
US20120196279A1 (en) 2011-02-02 2012-08-02 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
EP2675819B1 (en) 2011-02-18 2020-04-08 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
EP2689028B1 (en) 2011-03-23 2017-08-30 Pacific Biosciences Of California, Inc. Isolation of polymerase-nucleic acid complexes and loading onto substrates
EP2702175B1 (en) 2011-04-25 2018-08-08 Bio-Rad Laboratories, Inc. Methods and compositions for nucleic acid analysis
US20130059762A1 (en) 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
SI2702146T1 (sl) * 2011-04-28 2019-06-28 The Board Of Trustees Of The Leland Stanford Junior University Identifikacija polinukleotidov, povezanih z vzorcem
US8722585B2 (en) 2011-05-08 2014-05-13 Yan Wang Methods of making di-tagged DNA libraries from DNA or RNA using double-tagged oligonucleotides
WO2012162267A2 (en) 2011-05-20 2012-11-29 Fluidigm Corporation Nucleic acid encoding reactions
US9005935B2 (en) 2011-05-23 2015-04-14 Agilent Technologies, Inc. Methods and compositions for DNA fragmentation and tagging by transposases
US9752176B2 (en) 2011-06-15 2017-09-05 Ginkgo Bioworks, Inc. Methods for preparative in vitro cloning
US8932989B2 (en) * 2011-07-25 2015-01-13 Bioinventors & Entrepreneurs Network, Llc Sieving of nucleic acid samples
US9506167B2 (en) 2011-07-29 2016-11-29 Ginkgo Bioworks, Inc. Methods and systems for cell state quantification
US9340826B2 (en) 2011-08-01 2016-05-17 Celemics, Inc. Method of preparing nucleic acid molecules
WO2013022961A1 (en) 2011-08-08 2013-02-14 3The Broad Institute Compositions and methods for co-amplifying subsequences of a nucleic acid fragment sequence
EP2748801B1 (en) 2011-08-26 2020-04-29 Life Technologies Corporation Systems and methods for identifying an individual
WO2013033721A1 (en) 2011-09-02 2013-03-07 Atreca, Inc. Dna barcodes for multiplexed sequencing
US9347900B2 (en) 2011-10-14 2016-05-24 Pacific Biosciences Of California, Inc. Real-time redox sequencing
US9935765B2 (en) 2011-11-03 2018-04-03 Genformatic, Llc Device, system and method for securing and comparing genomic data
US10325067B1 (en) 2011-12-31 2019-06-18 Quest Diagnostics Investments Incorporated Statistical quality control of medical laboratory results
EP3578697B1 (en) 2012-01-26 2024-03-06 Tecan Genomics, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US9528107B2 (en) 2012-01-31 2016-12-27 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US10102927B2 (en) 2012-02-11 2018-10-16 YouGene, Inc. Systems and methods for storing, processing and utilizing proprietary genetic information
US20130252280A1 (en) 2012-03-07 2013-09-26 Genformatic, Llc Method and apparatus for identification of biomolecules
US8751166B2 (en) 2012-03-23 2014-06-10 International Business Machines Corporation Parallelization of surprisal data reduction and genome construction from genetic data for transmission, storage, and analysis
ES2582554T3 (es) 2012-05-08 2016-09-13 Adaptive Biotechnologies Corporation Composiciones y método para medir y calibrar el sesgo de la amplificación en reacciones de PCR multiplexadas
US8812243B2 (en) 2012-05-09 2014-08-19 International Business Machines Corporation Transmission and compression of genetic data
SG11201407901PA (en) 2012-05-21 2015-01-29 Fluidigm Corp Single-particle analysis of particle populations
US10308979B2 (en) 2012-06-01 2019-06-04 Agilent Technologies, Inc. Target enrichment and labeling for multi-kilobase DNA
GB2517875A (en) 2012-06-08 2015-03-04 Pacific Biosciences California Modified base detection with nanopore sequencing
EP2861761A1 (en) 2012-06-15 2015-04-22 Adaptive Biotechnologies Corporation Uniquely tagged rearranged adaptive immune receptor genes in a complex gene set
AU2013282323B2 (en) 2012-06-29 2018-05-10 Massachusetts Institute Of Technology Massively parallel combinatorial genetics
ES2637538T3 (es) * 2012-07-17 2017-10-13 Counsyl, Inc. Sistema y métodos para la detección de una variación genética
CN108875312A (zh) 2012-07-19 2018-11-23 哈佛大学校长及研究员协会 利用核酸存储信息的方法
CA2878280A1 (en) 2012-07-19 2014-01-23 Ariosa Diagnostics, Inc. Multiplexed sequential ligation-based detection of genetic variants
EP2882870A4 (en) 2012-08-10 2016-03-16 Sequenta Inc HIGHLY SENSITIVE DETECTION OF MUTATIONS BY SEQUENCE TAGS
US10221442B2 (en) 2012-08-14 2019-03-05 10X Genomics, Inc. Compositions and methods for sample processing
US9951386B2 (en) 2014-06-26 2018-04-24 10X Genomics, Inc. Methods and systems for processing polynucleotides
MX364957B (es) 2012-08-14 2019-05-15 10X Genomics Inc Composiciones y metodos para microcapsulas.
US9266370B2 (en) 2012-10-10 2016-02-23 Apdn (B.V.I) Inc. DNA marking of previously undistinguished items for traceability
CA2889862C (en) 2012-11-05 2021-02-16 Rubicon Genomics, Inc. Barcoding nucleic acids
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
US9222122B2 (en) 2012-11-20 2015-12-29 Src, Inc. System and method for rapid detection and identification of nucleic acid labeled tags
KR101600902B1 (ko) 2012-12-11 2016-03-10 주식회사 셀레믹스 코돈 조합화 및 변이유발을 이용한 유전자 라이브러리의 합성 방법
CA2894694C (en) * 2012-12-14 2023-04-25 10X Genomics, Inc. Methods and systems for processing polynucleotides
CA2900481A1 (en) 2013-02-08 2014-08-14 10X Genomics, Inc. Polynucleotide barcode generation
US20140242582A1 (en) 2013-02-28 2014-08-28 Ariosa Diagnostics, Inc. Detection of genetic abnormalities using ligation-based detection and digital pcr
US9850482B2 (en) 2013-03-07 2017-12-26 Seoul National University R&Db Foundation Heterologous DNA barcoding method
EP2774998A1 (en) 2013-03-08 2014-09-10 Roche Diagniostics GmbH Improved sequence tags
US20140255929A1 (en) 2013-03-11 2014-09-11 Sequenta, Inc. Mosaic tags for labeling templates in large-scale amplifications
GB2525568B (en) 2013-03-15 2020-10-14 Abvitro Llc Single cell barcoding for antibody discovery
WO2014151117A1 (en) 2013-03-15 2014-09-25 The Board Of Trustees Of The Leland Stanford Junior University Identification and use of circulating nucleic acid tumor markers
AU2014218418A1 (en) 2013-03-15 2015-10-01 Ancestry.Com Dna, Llc Family networks
CN114107458A (zh) 2013-03-15 2022-03-01 血统生物科学公司 测序免疫组库的方法
US9328382B2 (en) 2013-03-15 2016-05-03 Complete Genomics, Inc. Multiple tagging of individual long DNA fragments
US9929985B1 (en) 2013-03-15 2018-03-27 Quest Diagnostics Investments Incorporated Systems and methods for electronically distributing information
CA2915033C (en) 2013-06-12 2023-08-29 The General Hospital Corporation Methods, kits, and systems for multiplexed detection of target molecules and uses thereof
EP2816496A1 (en) 2013-06-19 2014-12-24 Sophia Genetics S.A. Method to manage raw genomic data in a privacy preserving manner in a biobank
US9708657B2 (en) 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
RU2698125C2 (ru) 2013-08-19 2019-08-22 Эбботт Молекьюлар Инк. Библиотеки для секвенирования нового поколения
US20150087556A1 (en) 2013-09-20 2015-03-26 University Of Massachusetts COMPOSITIONS AND METHODS FOR MAKING cDNA LIBRARIES FROM SMALL RNAs
US10266904B2 (en) 2013-10-09 2019-04-23 Stc.Unm Synthetic long read DNA sequencing
DK3572527T3 (da) 2013-10-17 2021-08-23 Illumina Inc Fremgangsmåder og præparater til fremstilling af nukleinsyrebiblioteker
US9416414B2 (en) 2013-10-24 2016-08-16 Pacific Biosciences Of California, Inc. Delaying real-time sequencing
US9834814B2 (en) 2013-11-22 2017-12-05 Agilent Technologies, Inc. Spatial molecular barcoding of in situ nucleic acids
US9824068B2 (en) 2013-12-16 2017-11-21 10X Genomics, Inc. Methods and apparatus for sorting data
US9719136B2 (en) 2013-12-17 2017-08-01 Takara Bio Usa, Inc. Methods for adding adapters to nucleic acids and compositions for practicing the same
US10296927B2 (en) 2013-12-20 2019-05-21 Iqvia Inc. System and method for projecting product movement
CN106062214B (zh) 2013-12-28 2020-06-09 夸登特健康公司 用于检测遗传变异的方法和系统
ES2912183T3 (es) 2013-12-30 2022-05-24 Atreca Inc Análisis de ácidos nucleicos asociados a células individuales utilizando códigos de barras de ácidos nucleicos
WO2015112948A2 (en) 2014-01-27 2015-07-30 Iafrate Anthony John Methods for determining a nucleotide sequence
CA2938080A1 (en) 2014-01-27 2015-07-30 The General Hospital Corporation Methods of preparing nucleic acids for sequencing
US20150337364A1 (en) 2014-01-27 2015-11-26 ArcherDX, Inc. Isothermal Methods and Related Compositions for Preparing Nucleic Acids
ES2808651T3 (es) 2014-02-03 2021-03-01 Univ Chicago Composiciones y métodos para la evaluación cuantitativa de la densidad del complejo de ADN-proteína
RS61976B1 (sr) 2014-02-18 2021-07-30 Illumina Inc Postupci i kompozicije za određivanje dnk profila
CA2941612A1 (en) 2014-03-05 2015-09-11 Adaptive Biotechnologies Corporation Methods using randomer-containing synthetic molecules
US10354748B1 (en) 2014-03-28 2019-07-16 Google Llc Storing genetic data in a storage system
US9354922B2 (en) 2014-04-02 2016-05-31 International Business Machines Corporation Metadata-driven workflows and integration with genomic data processing systems and techniques
AU2015243445B2 (en) 2014-04-10 2020-05-28 10X Genomics, Inc. Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same
ES2777529T3 (es) 2014-04-17 2020-08-05 Adaptive Biotechnologies Corp Cuantificación de genomas de células inmunitarias adaptativas en una mezcla compleja de células
CA3060708A1 (en) 2014-04-29 2015-11-05 Illumina, Inc Multiplexed single cell gene expression analysis using template switch and tagmentation
US10975371B2 (en) 2014-04-29 2021-04-13 Illumina, Inc. Nucleic acid sequence analysis from single cells
JP5902747B2 (ja) 2014-04-30 2016-04-13 ファナック株式会社 加工再開準備機能を有するレーザ加工システム
ES2876432T3 (es) 2014-05-16 2021-11-12 Illumina Inc Técnicas de síntesis de ácidos nucleicos
US9809847B2 (en) 2014-06-19 2017-11-07 Somagenics, Inc. Methods and compositions for detecting polynucleotides and fragments thereof
CN114214314A (zh) 2014-06-24 2022-03-22 生物辐射实验室股份有限公司 数字式pcr条码化
US10017759B2 (en) 2014-06-26 2018-07-10 Illumina, Inc. Library preparation of tagged nucleic acid
US10619163B2 (en) 2014-07-03 2020-04-14 Rhodx, Inc. Tagging and assessing a target sequence
EP3626834B1 (en) 2014-07-15 2022-09-21 Qiagen Sciences, LLC Semi-random barcodes for nucleic acid analysis
WO2016011177A1 (en) 2014-07-18 2016-01-21 Fluidigm Corporation Reagents and kit compositions for single-cell whole genome amplification
US10116632B2 (en) 2014-09-12 2018-10-30 New York University System, method and computer-accessible medium for secure and compressed transmission of genomic data
CA2964487C (en) 2014-10-15 2024-03-19 Sage Science, Inc. Apparatuses, methods and systems for automated processing of nucleic acids and electrophoretic sample preparation
US20160122817A1 (en) 2014-10-29 2016-05-05 10X Genomics, Inc. Methods and compositions for targeted nucleic acid sequencing
US9975122B2 (en) 2014-11-05 2018-05-22 10X Genomics, Inc. Instrument systems for integrated sample processing
US10233490B2 (en) 2014-11-21 2019-03-19 Metabiotech Corporation Methods for assembling and reading nucleic acid sequences from mixed populations
SG11201705615UA (en) 2015-01-12 2017-08-30 10X Genomics Inc Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same
CN107250381B (zh) 2015-01-16 2022-03-08 斯库维尔公司 Dna集合的归一化迭代条形码和测序
US10208339B2 (en) 2015-02-19 2019-02-19 Takara Bio Usa, Inc. Systems and methods for whole genome amplification
BR112017017518A2 (pt) 2015-02-19 2018-04-17 Troy Group Inc sistema de registro de documento seguro encoberto
US10246702B1 (en) 2015-02-23 2019-04-02 New England Biolabs, Inc. Compositions and methods for labeling target nucleic acid molecules
US9727810B2 (en) 2015-02-27 2017-08-08 Cellular Research, Inc. Spatially addressable molecular barcoding
SG11201706636PA (en) 2015-02-27 2017-09-28 Fluidigm Corp Single-cell nucleic acids for high-throughput studies
US9785792B2 (en) 2016-03-04 2017-10-10 Color Genomics, Inc. Systems and methods for processing requests for genetic data based on client permission data
US10344336B2 (en) 2015-06-09 2019-07-09 Life Technologies Corporation Methods, systems, compositions, kits, apparatus and computer-readable media for molecular tagging
US9771575B2 (en) 2015-06-19 2017-09-26 Agilent Technologies, Inc. Methods for on-array fragmentation and barcoding of DNA samples
JP6920275B2 (ja) 2015-07-13 2021-08-18 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸を用いた回収可能な情報記憶のための方法
WO2017024017A1 (en) 2015-08-06 2017-02-09 Pacific Biosciences Of California, Inc. Systems and methods for selectively addressing sparsely arranged electronic measurement devices
US20170058332A1 (en) 2015-09-02 2017-03-02 Guardant Health, Inc. Identification of somatic mutations versus germline variants for cell-free dna variant calling applications
CN107111685A (zh) 2015-10-01 2017-08-29 基因动力公司 用于安全传递生物信息的方法、装置和系统
WO2017087910A1 (en) 2015-11-19 2017-05-26 10X Genomics, Inc. Transformable tagging compositions, methods, and processes incorporating same
US20170166956A1 (en) * 2015-12-11 2017-06-15 Shoreline Biome, Llc Methods for DNA Preparation for Multiplex High Throughput Targeted Sequencing
EP3402904A4 (en) 2016-01-12 2019-06-05 Bio-Rad Laboratories, Inc. SYNTHESIS OF BARCODING SEQUENCES USING PHASE SHIFT BLOCKS AND USES THEREOF
US20170260584A1 (en) 2016-02-11 2017-09-14 10X Genomics, Inc. Cell population analysis using single nucleotide polymorphisms from single cell transcriptomes
US10640822B2 (en) 2016-02-29 2020-05-05 Iridia, Inc. Systems and methods for writing, reading, and controlling data stored in a polymer
US10883140B2 (en) 2016-04-21 2021-01-05 President And Fellows Of Harvard College Method and system of nanopore-based information encoding
US10619205B2 (en) 2016-05-06 2020-04-14 Life Technologies Corporation Combinatorial barcode sequences, and related systems and methods
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10240196B2 (en) 2016-05-27 2019-03-26 Agilent Technologies, Inc. Transposase-random priming DNA sample preparation
US10296709B2 (en) 2016-06-10 2019-05-21 Microsoft Technology Licensing, Llc Privacy-preserving genomic prediction
US10370701B2 (en) 2016-06-17 2019-08-06 Pacific Biosciences Of California, Inc. Methods and compositions for generating asymmetrically-tagged nucleic acid fragments
US10190155B2 (en) 2016-10-14 2019-01-29 Nugen Technologies, Inc. Molecular tag attachment and transfer
EP4026905B1 (en) 2016-10-19 2024-04-17 10X Genomics, Inc. Methods for barcoding nucleic acid molecules from individual cells or cell populations
WO2018075785A1 (en) 2016-10-19 2018-04-26 Illumina, Inc. Methods for chemical ligation of nucleic acids
WO2018081113A1 (en) 2016-10-24 2018-05-03 Sawaya Sterling Concealing information present within nucleic acids
EP3692161A4 (en) 2016-11-11 2022-05-25 Psomagen, Inc. METHODS AND SYSTEM FOR FRAGMENT ARRANGEMENT AND SEQUENCE IDENTIFICATION
EP3559231B1 (en) 2016-11-11 2022-08-17 Bio-Rad Laboratories, Inc. Methods for processing nucleic acid samples
GB2559319B (en) 2016-12-23 2019-01-16 Cs Genetics Ltd Reagents and methods for the analysis of linked nucleic acids
US10447661B1 (en) 2016-12-23 2019-10-15 Iqvia Inc. System and method for privacy-preserving genomic data analysis
WO2018132459A1 (en) 2017-01-10 2018-07-19 Paragon Genomics, Inc. Methods and compositions for reducing redundant molecular barcodes created in primer extension reactions
US10347365B2 (en) 2017-02-08 2019-07-09 10X Genomics, Inc. Systems and methods for visualizing a pattern in a dataset
US11174512B2 (en) 2017-05-31 2021-11-16 Molecular Assemblies, Inc. Homopolymer encoded nucleic acid memory
US11186862B2 (en) 2017-06-20 2021-11-30 Bio-Rad Laboratories, Inc. MDA using bead oligonucleotide
US10296842B2 (en) 2017-07-21 2019-05-21 Helix OpCo, LLC Genomic services system with dual-phase genotype imputation
US10162678B1 (en) 2017-08-14 2018-12-25 10X Genomics, Inc. Systems and methods for distributed resource management
US10748643B2 (en) 2017-08-31 2020-08-18 10X Genomics, Inc. Systems and methods for determining the integrity of test strings with respect to a ground truth string

Also Published As

Publication number Publication date
IL266197B1 (en) 2023-11-01
EP3529400A1 (en) 2019-08-28
US11667951B2 (en) 2023-06-06
CA3041645C (en) 2021-11-02
EP3529400B1 (en) 2021-02-17
ES2870639T3 (es) 2021-10-27
EP3529400A4 (en) 2020-05-06
IL266197A (en) 2019-06-30
IL266197B2 (en) 2024-03-01
JP2019533478A (ja) 2019-11-21
US20190233877A1 (en) 2019-08-01
CN110312825A (zh) 2019-10-08
WO2018081113A1 (en) 2018-05-03
CA3041645A1 (en) 2018-05-03

Similar Documents

Publication Publication Date Title
Gupta et al. Next generation sequencing and its applications
Mardis The impact of next-generation sequencing technology on genetics
Costa et al. First steps in the analysis of prokaryotic pan-genomes
Wolf Principles of transcriptome analysis and gene expression quantification: an RNA‐seq tutorial
Fraser et al. Microbial genome sequencing
Poland et al. Development of high-density genetic maps for barley and wheat using a novel two-enzyme genotyping-by-sequencing approach
Wei et al. Correlated variation and population differentiation in satellite DNA abundance among lines of Drosophila melanogaster
Kidd et al. Mapping and sequencing of structural variation from eight human genomes
Meyer et al. Sequencing and de novo analysis of a coral larval transcriptome using 454 GSFlx
Wedd et al. Differentially methylated obligatory epialleles modulate context-dependent LAM gene expression in the honeybee Apis mellifera
JP6941680B2 (ja) 核酸内に存在する情報の秘匿化
Leboldus et al. Genotype‐by‐sequencing of the plant‐pathogenic fungi P yrenophora teres and S phaerulina musiva utilizing I on T orrent sequence technology
Woodcock et al. Genomic plasticity and rapid host switching can promote the evolution of generalism: a case study in the zoonotic pathogen Campylobacter
Chen et al. Compound microsatellites in complete Escherichia coli genomes
Solé et al. Inter-and intra-breed genome-wide copy number diversity in a large cohort of European equine breeds
JP2022505050A (ja) プーリングを介した多数の試料の効率的な遺伝子型決定のための方法および試薬
Womack et al. Genomics of complex traits
Janssen et al. Strain-specific genes of Helicobacter pylori: distribution, function and dynamics
Vrieze et al. In search of rare variants: preliminary results from whole genome sequencing of 1,325 individuals with psychophysiological endophenotypes
Casey et al. Heteroduplex molecules cause sexing errors in a standard molecular protocol for avian sexing
Saldivar et al. Microarray analysis of acaricide‐inducible gene expression in the southern cattle tick, Rhipicephalus (Boophilus) microplus
Duan et al. Comprehensive evaluation of structural variant genotyping methods based on long-read sequencing data
Villoutreix et al. Testing for fitness epistasis in a transplant experiment identifies a candidate adaptive locus in Timema stick insects
Gilbertson et al. Conservation and divergence in gene regulation between mouse and human immune cells deserves equal emphasis
Ruchi Bioinformatics: genomics and proteomics

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190425

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200717

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210901

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210906

R150 Certificate of patent or registration of utility model

Ref document number: 6941680

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150