JP2022524208A - 腫瘍モデルの同定のための方法および組成物 - Google Patents

腫瘍モデルの同定のための方法および組成物 Download PDF

Info

Publication number
JP2022524208A
JP2022524208A JP2021555073A JP2021555073A JP2022524208A JP 2022524208 A JP2022524208 A JP 2022524208A JP 2021555073 A JP2021555073 A JP 2021555073A JP 2021555073 A JP2021555073 A JP 2021555073A JP 2022524208 A JP2022524208 A JP 2022524208A
Authority
JP
Japan
Prior art keywords
sample
mouse
snp
genotype
human
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021555073A
Other languages
English (en)
Inventor
グオ,シェン
チェン,シャオボ
キアン,ウービン
リ,ヘンリー
Original Assignee
クラウン バイオサイエンス (スーチョウ) インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by クラウン バイオサイエンス (スーチョウ) インコーポレイテッド filed Critical クラウン バイオサイエンス (スーチョウ) インコーポレイテッド
Publication of JP2022524208A publication Critical patent/JP2022524208A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6879Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for sex determination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Cell Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本開示は、一群のSNP遺伝子座における試料、例えば腫瘍モデル、の遺伝子型に基づいて試料を同定または認証するための方法および組成物、例えばキット、を提供する。【選択図】なし

Description

関連出願の相互参照
本出願は、2019年3月12日出願の出願PCT/CN2019/077750号に基づく優先権を主張するものであり、その開示を本明細書に参考として組み込む。
本発明は全般に、分子生物学、がん生物学および動物モデルに関する。
細胞株、オルガノイド、異種移植および同種移植モデルは、腫瘍学およびその他の生物医学的研究において有用なモデルシステムである。モデルの認証および特徴づけは、それらの適切な利用を助け、誤同定および誤用、交差夾雑、誤ったがん分類、長期培養および遺伝的浮動に起因するゲノム変化などの一連の問題を軽減するが、これらは全て、それらの一般的な使用に起因して、細胞株において特に十分に注目されたものである。例えば、様々な研究が、細胞株バンクについて、約10~40%の誤同定/夾雑率を報告している。
細胞形態学試験、イソ酵素学〔isoenzymology〕、細胞遺伝学的分析(核型分析およびFISH)、ヒトリンパ球抗原(HLA)タイプ分け、ショートタンデムリピート(STR)プロファイリング、単一ヌクレオチド多型(SNP)タイプ分け、DNAおよびRNAシークエンシングを含む、細胞株を認証するための様々な方法が存在している(Freedman,L.P.et al.Biotechniques 59,189-90,192(2015);Nims,R.W.&Reid,Y.In Vitro Cell Dev Biol Anim 53,880-887(2017))。これらの技術のうち、STRプロファイリングは最も広く使用されており、ヒト細胞株を認証する際のその適用を指南する基準(ASN-0002)が存在する(Almeida,J.L.,Cole,K.D.&Plant,A.L.PLoS Biol 14,e1002476(2016))。マウス細胞株については、19のSTRマーカーのパネルも開発されている(Zaaijer,S.et al.Elife 6(2017))。夾雑物を検出するためのSTRアッセイの感度は、約5~10%である(Yu,M.et al.Nature 520,307-11(2015))。近年、SNPタイプ分けは、その改善された精度、感度および低減されたコストのおかげで、細胞株および生体試料認証のためにますます使用されるようになってきている。SNPは、PCR、ならびにトランスクリプトームシークエンシングまたはRNA-seq、全エキソームシークエンシング(WES)および全ゲノムシークエンシング(WGS)を含む次世代シークエンシング(NGS)によってプロファイリングすることができる。現行のSNPアッセイは、約3~5%の検出感度を有する。それらの認証および特徴づけを促進する、STR、SNPおよび細胞株についてのその他の情報を含むデータベースも存在する。
細胞株に加えて、オルガノイドおよびマウス腫瘍モデルが、腫瘍学研究および薬物開発において広く使用されている。オルガノイドは、幹細胞、初代および操作された腫瘍試料、ならびに多くの生物構造および機能を維持する異種移植されたヒト腫瘍に由来するin vitro 三次元培養物である。マウス腫瘍モデルは、患者由来異種移植(PDX)、細胞株由来異種移植(CDX)、同系またはマウス細胞株由来モデル、マウス同種移植モデルなどを含むin vivoシステムである。PDXなど、これらのモデルの一部は、細胞株よりも、原発性腫瘍についての病理組織学およびゲノミクスを忠実に捕捉することができる。細胞株と同様、これらの腫瘍モデルには、類似の品質管理上の問題があるが、さらなる問題が存在する。異種移植モデルでは、腫瘍は、ヒト腫瘍細胞およびマウス間質細胞を含有し、後者は、モデルの継代の間にヒトの対応物を徐々に置き換え、これがゲノム不均一性、移植部位の違い(皮下および同所)、増殖の変動および切開のランダムさと複合されると、腫瘍のヒト-マウス遺伝子組成は、同じPDXからのものであっても、一部の試料がほとんど純粋なヒト内容またはマウス内容である程度まで、かなり異なることになる。このような腫瘍-宿主混合および干渉は、全ての移植された腫瘍モデルに生じ、STRマーカーおよびSNPについての対立遺伝子頻度のゆらぎを引き起こし、したがって、従来のSTRおよびSNPベースの認証方法に有害な影響を与える。大規模試料認証はまた、多くの種類のin vitroおよびin vivoモデルが同時に維持され使用されるバイオバンクについては特に、ロジスティック上の負荷があり、エラープローンである。したがって、腫瘍モデルを同定および認証するための新たなSNPベースのアッセイを開発する必要がある。
一態様では、本開示は、試料を同定または認証するための方法を提供する。一実施形態では、この方法は、試料から核酸を得ること;複数のヒト単一ヌクレオチド多型(SNP)遺伝子座または複数のマウスSNP遺伝子座において、試料について遺伝子型を検出すること;試料についての遺伝子型を参照遺伝子型と比較すること;および試料の同定を決定することを含む。ある種の実施形態では、ヒトSNPは、表1に示される群から選択される。ある種の実施形態では、マウスSNPは、表2に示される群から選択される。
ある種の実施形態では、試料は、細胞、組織、オルガノイド、またはそれらの組合せである。ある種の実施形態では、試料は、細胞株または腫瘍組織である。ある種の実施形態では、試料は、異種移植または同種移植腫瘍モデルに由来する。ある種の実施形態では、試料は、患者由来異種移植(PDX)、細胞株由来異種移植(CDX)、同系またはマウス細胞株由来モデル、マウス同種移植モデルに由来する。
ある種の実施形態では、試料は夾雑物を含み、方法は、試料中の夾雑物のパーセンテージを決定することをさらに含む。ある種の実施形態では、この方法は、夾雑物の正体を決定することをさらに含む。
ある種の実施形態では、検出するステップは、次世代シークエンシング(NGS)またはシークエンシングベースのSNPアレイを使用する。ある種の実施形態では、核酸は、バーコード化される。
ある種の実施形態では、この方法は、試料を得た対象の性別を同定することをさらに含む。ある種の実施形態では、この方法は、試料を得た対象の民族性を同定することをさらに含む。ある種の実施形態では、この方法は、試料中のウイルスまたはマイコプラズマの存在を検出することをさらに含む。ある種の実施形態では、この方法は、試料を得た免疫不全マウスの系統を決定することをさらに含む。
別の態様では、本開示は、ヒト構成成分およびマウス構成成分を含む試料を認証する方法を提供する。ある種の実施形態では、この方法は、試料から核酸を得ること;100個以上のマウスゲノム遺伝子座において、試料の遺伝子型を検出すること、ここで、マウスゲノム遺伝子座の各々が、対応する相同なヒトゲノム遺伝子座を有し、マウスゲノム遺伝子座の各々および対応する相同なヒトゲノム遺伝子座が、同一な隣接ヌクレオチド配列を有する;ならびに遺伝子型に基づいて、試料中のマウス構成成分の比率を決定すること、を含む。ある種の実施形態では、マウスゲノム遺伝子座は、表6から選択される。
別の態様では、本開示は、試料を同定するためのキットを提供する。ある種の実施形態では、このキットは、試料中の一群のヒトSNP遺伝子座または一群のマウスSNP遺伝子座を検出するためのプライマーを含む。ある種の実施形態では、このキットは、ヒトまたはマウスSNPを含有するDNA断片を、これらのプライマーを使用して増幅するための薬剤をさらに含む。
別の態様では、本開示は、ヒトまたはマウス試料を同定するためのマイクロアレイを提供する。ある種の実施形態では、このマイクロアレイは、一群のヒトまたはマウスSNP遺伝子座において試料の遺伝子型を検出するためのプローブを含む。
さらに別の態様では、本開示は、指示が記憶された非一過性のコンピュータ可読媒体であって、指示がプロセッサによって実行されるとき、指示がプロセッサに、一群のヒトまたはマウスSNP遺伝子座における試料の遺伝子型の検索;試料の遺伝子型の、参照遺伝子型との比較;および試料の同定の決定、を行わせる、コンピュータ可読媒体を提供する。
さらに別の態様では、本開示は、主要構成成分および微量構成成分を含む試料を認証するための方法を提供する。ある種の実施形態では、この方法は、100個以上のSNP遺伝子座において、試料の遺伝子型を検出すること;表11に示される式に従って、SNP遺伝子座の各々についてSNP不均一性比率を決定すること;遺伝子型をモデル化する混合ガウス分布を使用して、SNP遺伝子座についてのSNP不均一性比率に基づいて試料不均一性比率を決定すること;および試料の遺伝子型を、参照試料において各々検出された一群の参照遺伝子型と比較すること、試料の遺伝子型に対して最も高い同一性を有する参照遺伝子型を有する参照試料を同定すること、(i)参照遺伝子型が試料の遺伝子型に対して90%よりも高く同一であり、かつ試料不均一性比率が10%未満であるときに、または(ii)参照遺伝子型が試料の遺伝子型に対して80%よりも高く同一であり、かつ試料不均一性比率が10%よりも高いときに、主要構成成分が参照試料であることを決定することによって、試料の主要構成成分を決定すること、を含む。
ある種の実施形態では、この方法は、試料の微量構成成分を決定することをさらに含む。ある種の実施形態では、この方法は、試料中の主要構成成分および微量構成成分のパーセンテージを決定することをさらに含む。
以下の図面は本明細書の一部を構成し、本開示のある特定の態様をさらに示すために含まれる。本開示は、本明細書で提示した特定の実施形態の詳細な説明と組み合わせてこれらの図面の1つまたは複数を参照することによって、よりよく理解することができる。
図1A~1Cは、細胞株の認証および試料の遺伝的不均一性を示す。図1A:無関係/不一致、同一な、および密接に関係する細胞株対についての遺伝子型類似性。 図1B:118の夾雑なしの細胞株、220のPDXおよび31のPDXOモデルにおける不均一性比率。 図1C:不均一性比率は、PDXモデルでは、マウス比率と正に相関する。 図2A~2Dは、不均一性比率が夾雑を検出および定量するために使用できることを示している。図2A~2D:後者について5%、2.5%、1.25%および0.625%の細胞比率での、細胞株MV-4-11(MV411)およびLNCaPクローンFGC(LNCAPCLONEFGC)の連続混合、図2E:純粋なLNCaPクローンFGC細胞株、図2F:純粋なMV-4-11細胞株。横軸上の各刻みは、対応するSNP不均一性比率を有するインフォーマティブなSNP部位を示す。確率密度は、2/3成分混合ガウスを仮定することによって推定した。試料の通し番号は、括弧内の主要構成成分細胞株と共に、右上のボックス中に表示される。試料不均一性比率は下に示される。 図3A~3Fは、夾雑検出、夾雑物推論および夾雑比率推定を示す。図3A:試料19R58129は、夾雑している微量細胞株LNCaPクローンFGC(LNCAPCLONEFGC)と混合されたMV411である。LNCAPCLONEFGCは、1.41%の夾雑比率で、夾雑物として正確に同定された(p値=5.01E-17)。LNCaP-C4-2(C42)およびLNCAPCLONEFGCは共に、LNCaPに由来し、高い遺伝的同一性を共有している。分位数-分位数プロットにおいて、各ドットは、参照細胞株であり、理論的分位数および試料分位数を、MV411参照細胞株と1055参照細胞株との間の遺伝子型類似性にフィットさせたベータ分布から計算した。99%信頼帯は影付きである。図3B:異なる不均一性比率下で細胞株中に夾雑している第2の細胞株を推論する精度。既知の第2の細胞株が夾雑している合計94の細胞株試料を試験し、試料を、不均一性比率によってビニングした。図3C:細胞株「G-292クローンA141B1」は、7.62%の試料不均一性比率を有し、SNP不均一性比率の確率密度における区別できる右ピークを伴うが、これは、この細胞株が夾雑していたことを示している。図3D:OCI-AML-2は、6.21%の夾雑比率で、細胞株「G-292クローンA141B1」中の夾雑物として推論された(p値=1.58E-07)。図3E:シミュレートされた細胞株混合物における、推定夾雑比率と既知の夾雑比率との間の完璧に近い相関。図3F:既知の夾雑を有する細胞株試料についての不均一性比率と夾雑比率との間の高い相関。 図4A~4Dは、ヒト-マウス混合物中のマウス比率の推定を示す。図4A:90%、80%、70%、50%、30%、20%、10%、7%、5%および0%のマウス比率を有する一連のヒト-マウスDNA混合物における、ディープNGSシークエンシングによるマウス比率の正確な推定。図4B~4C:3つのアプローチによって220のPDXおよび31のPDX由来オルガノイドモデルにおいて推定し、各モデルについて同じ試料についてアッセイしたマウス比率。図4D:220のPDXモデルにおける、ディープNGSシークエンシングによって推定したマウス比率とWESによって推定したマウス比率との間の二次関係。
本開示をより詳細に説明する前に、本開示は記載した特定の実施形態に限定されず、それ自体もちろん変化することができることを理解されたい。本明細書で使用した専門用語は、特定の実施形態を説明するためだけのものであって、限定を意味するものではなく、なぜならば、本開示の範囲は添付の特許請求の範囲によってのみ限定されるからであることも理解されたい。
他に規定しなければ、本明細書で使用した技術用語および科学用語は全て、本開示が属する業界の当業者によって通常理解されるのと同じ意味を有する。本明細書で記載したものと類似の、または同等のいかなる方法および材料も本開示の実践または試験において使用することができるが、好ましい方法および材料をここで説明する。
本明細書で引用した刊行物および特許は全て、それぞれ個々の刊行物または特許が具体的かつ個々に参考として組み込まれることが指示されているように参考として本明細書に組み込まれており、刊行物が引用されたものに関連して方法および/または材料を開示して記載するために、参考として本明細書に組み込まれている。いかなる刊行物の引用も、その開示が本出願日より前であるためであり、本開示は先行開示によりこのような刊行物に先行する権利がないことの承認と解釈されるべきではない。さらに、提供された刊行物の日付は、個別に確認する必要があり得る実際の刊行日とは異なっていてもよい。
本開示を読めば当業者には明らかなように、本明細書で記載し例示した個々の実施形態のそれぞれは、本開示の範囲または精神を逸脱することなく、その他のいくつかの実施形態のいずれかの特性から容易に分離するか、または一緒にすることができる別個の構成成分および特性を有する。任意の引用した方法は、引用した事象の順番で、または論理的に可能な任意のその他の順番で実施することができる。
定義
以下の定義は読者を支援するために提供される。他に規定しなければ、本明細書で使用した技術用語、表記およびその他の科学的用語または医学用語または専門用語は全て、化学および医学業界の当技術者によって通常理解される意味を有するものとする。場合によっては、通常理解される意味を有する用語は、明瞭になるように、および/または容易に参照できるように本明細書で定義されており、本明細書にこのような定義を含めるのは、当業界で一般的に理解されるような用語の定義をめぐる実質的な違いを表すためのものと必ずしも解釈されるべきではない。
本明細書で使用する場合、単数形「a」、「an」および「the」は、文脈が明確に他のことを指示していない限り、複数の参照物を含む。
用語「対立遺伝子」は、特定の多型遺伝子座の2つ以上の既存の遺伝的バリアントのうち1つを意味する。
用語「量」または「レベル」は、試料中に存在する目的のポリヌクレオチドまたは目的のポリペプチドの量を意味する。このような量は、絶対的に、すなわち、試料中のポリヌクレオチドまたはポリペプチドの全量で表現されているか、あるいは相対的に、すなわち、試料中のポリヌクレオチドまたはポリペプチドの濃度で表現されていてもよい。
本明細書で使用する場合、用語「がん」または「腫瘍」は、異常な細胞増殖が関与する任意の疾患を意味し、体内の任意の組織、器官または細胞に影響を及ぼす疾患の全病期および全形態を含む。この用語には、悪性、良性、軟組織または固形物として特徴づけられる公知のがんおよび新生物状態の全て、ならびに転移前および転移後のがんを含む全病期およびグレードのがんが含まれる。全般的に、がんは、がんが位置する、またはがんが発生した組織または器官ならびに癌性組織および細胞の形態によって分類することができる。本明細書で使用する場合、がんの種類には、限定されるものではないが、急性リンパ性白血病(ALL)、急性骨髄性白血病、副腎皮質癌、肛門がん、星状細胞腫、小児小脳または大脳基底細胞癌、胆管がん、膀胱がん、骨腫瘍、脳がん、小脳星状細胞腫、大脳星状細胞腫/悪性神経膠腫、上衣腫、髄芽腫、テント上原始神経外胚葉性腫瘍、視覚路および視床下部神経膠腫、乳がん、バーキットリンパ腫、子宮頸がん、慢性リンパ性白血病、慢性骨髄性白血病、結腸がん、肺気腫、子宮内膜がん、上衣腫、食道がん、ユーイング肉腫、網膜芽細胞腫、胃〔gastric〕(胃〔stomach〕)がん、神経膠腫、頭部および頸部がん、心臓がん、ホジキンリンパ腫、膵島細胞癌(膵内分泌部)、カポジ肉腫、腎臓がん(腎細胞がん)、咽頭がん、白血病、肝臓がん、肺がん、神経芽細胞腫、非ホジキンリンパ腫、卵巣がん、膵臓がん、咽頭がん、前立腺がん、直腸がん、腎細胞癌(腎臓がん)、網膜芽細胞腫、ユーイングファミリーの腫瘍、皮膚がん、胃がん、精巣がん、咽頭がん、甲状腺がん、膣がんが含まれる。
本明細書で使用する「細胞」は、原核細胞であっても真核細胞であってもよい。原核細胞には、例えば、細菌が含まれる。真核細胞には、例えば、真菌、植物細胞および動物細胞が含まれる。動物細胞(例えば、哺乳類細胞またはヒト細胞)の種類には、例えば、循環/免疫系または器官の細胞(例えば、B細胞、T細胞(細胞傷害性T細胞、ナチュラルキラーT細胞、制御性T細胞、ヘルパーT細胞)、ナチュラルキラー細胞、顆粒球(例えば、好塩基性顆粒球、好酸性顆粒球、好中性顆粒球および過分葉好中球)、単核球またはマクロファージ、赤血球細胞(例えば、網状赤血球)、肥満細胞、血小板または巨核球、および樹状細胞)、内分泌系または器官の細胞(例えば、甲状腺細胞(例えば、甲状腺上皮細胞、傍濾胞細胞)、副甲状腺細胞(例えば、副甲状腺主細胞、好酸性細胞)、副腎細胞(例えば、クロム親和性細胞)および松果体の細胞(例えば、松果体細胞))、神経系または器官の細胞(例えば、神経膠芽細胞(例えば、星状膠細胞および乏突起膠細胞)、小膠細胞、巨細胞性神経分泌細胞、星状細胞、ベッチェル細胞および下垂体細胞(例えば、性腺刺激ホルモン分泌細胞、副腎皮質刺激ホルモン分泌細胞、甲状腺刺激ホルモン分泌細胞、成長ホルモン分泌細胞および乳腺刺激ホルモン分泌細胞))、呼吸系または器官の細胞(例えば、肺胞細胞(I型肺胞細胞およびII型肺胞細胞)、クララ細胞、杯状細胞、肺胞マクロファージ)、循環系または器官の細胞(例えば、心筋細胞および周辺細胞)、消化系または器官の細胞(例えば、胃主細胞、壁細胞、杯状細胞、パネート細胞、G細胞、D細胞、ECL細胞、I細胞、K細胞、S細胞、腸内分泌細胞、腸クロム親和性細胞、APUD細胞、肝臓の細胞(例えば、肝実質細胞およびクッパー細胞))、外被系または器官の細胞(例えば、骨の細胞(例えば、骨芽細胞、骨細胞および破骨細胞)、歯の細胞(例えば、セメント芽細胞およびエナメル芽細胞)、軟骨の細胞(例えば、軟骨芽細胞および軟骨細胞)、皮膚/髪の細胞(例えば、毛胞、角化細胞およびメラニン形成細胞(母斑細胞))、筋肉細胞(例えば、筋細胞)、脂肪細胞、線維芽細胞および腱細胞)、泌尿器系または器官の細胞(例えば、有足細胞、傍糸球体細胞、糸球体内メサンギウム細胞、糸球体外メサンギウム細胞、腎臓近位尿細管刷子縁細胞および緻密斑細胞)ならびに生殖器系または器官の細胞(例えば、精子、セルトリ細胞、ライディッヒ細胞、卵子、卵母細胞)が含まれる。細胞は、正常で健康な細胞であるか、または病的で不健康な細胞(例えば、がん細胞)であってもよい。細胞にはさらに、哺乳類接合子または胚性幹細胞、胎児幹細胞、人工多能性幹細胞および成人幹細胞を含む幹細胞が含まれる。幹細胞とは、未分化状態を維持しながら細胞分裂のサイクルを経て、特殊化した細胞種に分化することができる細胞である。幹細胞は、全能性幹細胞、多能性幹細胞、複能性幹細胞、寡能性幹細胞および単能性幹細胞であってもよく、いずれも体細胞から誘導することができる。幹細胞はまた、がん性幹細胞を含むことができる。哺乳類細胞は、齧歯類細胞、例えば、マウス、ラット、ハムスター細胞であってもよい。哺乳類細胞は、ウサギ目細胞、例えば、ウサギ細胞であってもよい。哺乳類細胞はまた、霊長類細胞、例えば、ヒト細胞であってもよい。ある特定の例では、細胞は、マスバイオプロダクションで使用される細胞、例えば、CHO細胞である。
用語「相補性」は、伝統的なワトソン-クリックまたはその他の非伝統的な方法のいずれかによって、別の核酸配列と水素結合を形成する核酸の能力を意味する。パーセント相補性は、第2の核酸配列と水素結合(例えば、ワトソン-クリック塩基対)を形成することができる核酸分子中の残基のパーセンテージを指し示す(例えば、10のうち5、6、7、8、9、10は50%、60%>、70%>、80%>、90%および100%相補性である)。「完全に相補性である」は、核酸配列の連続した残基が全て、第2の核酸配列中の同じ数の連続した残基と水素結合することを意味する。本明細書で使用する「実質的に相補性である」は、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、またはそれ以上のヌクレオチドの領域に亘って少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%または100%である相補性の程度を意味するか、あるいはストリンジェント条件下でハイブリダイズする2つの核酸を意味する。
本開示では、「含む〔comprises〕」、「含んだ〔comprised〕」、「含んでいる〔comprising〕」、「含有する〔contains〕」、「含有している〔containing〕」などの用語は、米国特許法にある意味を有し、これらは包括的またはオープンエンドであり、追加的な、引用されていない要素または方法ステップを排除しないことに注意されたい。「から本質的になっている〔consisting essentially of〕」および「から本質的になる〔consists essentially of〕」などの用語は、米国特許法にある意味を有し、これらは請求された発明の基本的で新規な特質に著しい影響を及ぼさない追加的な成分またはステップを含むことを許可する。用語「からなる〔consists of〕」および「からなっている〔consisting of〕」は米国特許法にあるものとみなされる意味を有し、すなわち、これらの用語はクローズエンドである。
本明細書で使用する場合、用語「夾雑物」は、試料中の主要構成成分とは異なる、または試料の不純物もしくはその他の望ましくない影響、例えば、だめにすること〔spoiling〕、汚染、感染を引き起こす、試料中に存在する構成成分を意味する。
用語「決定する」、「評価する」、「アッセイする」、「測定する」および「検出する」は同義に使用することができ、定量的および半定量的決定の両方を意味する。定量的および半定量的決定のいずれかを意味する場合、目的のポリヌクレオチドまたはポリペプチドの「レベルを決定する」または目的のポリヌクレオチドまたはポリペプチドを「検出する」という語句を使用することができる。
用語「ゲノム」は、その染色体の完全なDNA配列によって示される、個々の生物または細胞が運搬する総遺伝情報を意味する。
用語「ハイブリダイジング」は、ストリンジェント条件下で特定のヌクレオチド配列に対して優先的な核酸分子の結合、二重鎖形成またはハイブリダイジングを意味する。用語「ストリンジェント条件」は、混合した集団(例えば、組織生検からの細胞溶解物またはDNA調製物)中において、プローブがその標的部分配列に優先的にハイブリダイズし、その他の配列に対しては比較的少ない程度でハイブリダイズするか、または全くハイブリダイズしない条件を意味する。核酸ハイブリダイゼーションの場合における(例えば、アレイ、マイクロアレイ、サザンもしくはノザンハイブリダイゼーションにおけるような)「ストリンジェントハイブリダイゼーション」および「ストリンジェントハイブリダイゼーション洗浄条件」は、配列に依存し、異なる環境パラメータ下では異なる。核酸のハイブリダイゼーションの広範な指針は、例えば、Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes part I,Ch.2,“Overview of principles of Hybridization and the strategy of Nucleic acid probe assays,”(1993)Elsevier,N.Y.に見出される。全般的に、高ストリンジェントハイブリダイゼーションおよび洗浄条件は、規定されたイオン強度およびpHでの特定の配列の融点(Tm)より約5℃低くなるように選択される。Tmは、(規定されたイオン強度およびpHで)標的配列の50%が完全に一致したプローブにハイブリダイズする温度である。非常にストリンジェントな条件は、特定のプローブのTmに等しくなるように選択される。サザンまたはノザンブロットにおいてアレイまたはフィルター上に100個を上回る相補的残基を有する相補的核酸のハイブリダイゼーションのためのストリンジェントハイブリダイゼーション条件の一例は、標準的なハイブリダイゼーション溶液を使用して42℃である(例えば、Sambrook and Russell Molecular Cloning:A Laboratory Manual(3rd ed.)Vol.1-3(2001)Cold Spring Harbor Laboratory,Cold Spring Harbor Press,NYを参照のこと)。高ストリンジェント洗浄条件の一例は、NaCl 0.15Mで72℃で約15分間である。ストリンジェント洗浄条件の一例は、0.2×SSC洗浄で65℃で約15分間である。しばしば、バックグラウンドプローブシグナルを除去するために、高ストリンジェント洗浄に先行して低ストリンジェント洗浄を行う。例えば、100ヌクレオチドを上回る二本鎖のための中程度ストリンジェント洗浄の一例は、1×SSCで45℃で15分間である。例えば、100ヌクレオチドを上回る二本鎖のための低ストリンジェント洗浄の一例は、4×SSCから6×SSCで40℃で15分間である。
用語「遺伝子座」は、生物学的機能にかかわらず、当業界で公知の参照ゲノム中の染色体座標によって規定される、ゲノム中のDNA配列の任意のセグメントを意味する。DNA遺伝子座は、複数の遺伝子を含有してもよく、遺伝子を含有しなくてもよい;DNA遺伝子座は、単一の塩基対または数百万の塩基対であり得る。
用語「核酸」および「ポリヌクレオチド」は同義に使用され、デオキシリボヌクレオチドもしくはリボヌクレオチドのいずれかの任意の長さのヌクレオチドの多量体型、またはそれらの類似体を意味する。ポリヌクレオチドは、任意の三次元構造を有することができ、公知のまたは公知ではない任意の機能を果たすことができる。ポリヌクレオチドの非限定的な例には、遺伝子、遺伝子断片、エキソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、リボザイム、cDNA、shRNA、一本鎖の短いかまたは長いRNA、組換えポリヌクレオチド、枝分かれポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、調節領域、任意の配列の単離されたRNA、核酸プローブおよびプライマーが含まれる。核酸分子は、直鎖状または環状であってもよい。
用語「オリゴヌクレオチド」は、少なくとも約5ヌクレオチド~約500ヌクレオチド(例えば、5、6、7、8、9、10、12、15、18、20、21、22、25、30、35、40、45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450または500ヌクレオチド)の核酸配列を意味する。一部の実施形態では、例えば、オリゴヌクレオチドは、例えば、ポリメラーゼ連鎖反応(PCR)増幅アッセイにおけるプライマーとして、および/またはハイブリダイゼーションアッセイもしくはマイクロアレイにおけるプローブとして使用され得る、約15ヌクレオチド~約30ヌクレオチド、または約20ヌクレオチド~約25ヌクレオチドであり得る。本発明のオリゴヌクレオチドは、当業界で周知のように、天然または合成の、例えば、DNA、RNA、PNA、LNA、修飾された骨格などであり得る。
用語「多型遺伝子座」は、2つ以上の対立遺伝子が同定されているゲノム遺伝子座を意味する。
用語「参照遺伝子型」は、本明細書で使用する場合、参照試料、例えば、既知の正体を有する試料中に存在する、1つ以上のゲノム遺伝子座の予め決定された遺伝子型を意味する。参照遺伝子型は、試験試料中に存在する特定のゲノム遺伝子座の遺伝子型を比較するための基礎として機能するように、本発明の方法の使用のために適切である。参照遺伝子型は、試料の性質ならびにこのような参照試料を確立する基となった対象の性別、年齢、民族性などのその他の要素に応じて変化し得る。
本明細書で使用する用語「試料」または「生物学的試料」は、任意の細胞、組織、オルガノイド、または目的の1つ以上の核酸分子を含有する任意のその他の試料を意味する。ある種の実施形態では、試料は、細胞(例えば、正常細胞、がん細胞、細胞株)、組織(例えば、正常組織、がん組織、異種移植または同種異系移植組織)、オルガノイドなどである。
用語「単一ヌクレオチド多型」または「SNP」は、2つ以上の代替的対立遺伝子が集団内に感知できる頻度、例えば>1%で存在する、ゲノム配列中の単一のヌクレオチド位置を意味する。SNPは、遺伝子のコード配列内、遺伝子の非コード領域内、および/または遺伝子の遺伝子間(例えば、イントロン)領域中に存在し得る。タンパク質コード領域中に存在するわけではないSNPもなお、遺伝子スプライシング、転写因子結合および/または非コードRNAの配列に対して影響を有し得る。本明細書で提供したSNP命名法は、GenBank(登録商標)データベースにおいて入手可能な、National Center for Biotechnological Information(NCBI)によって各固有のSNPに割り当てられた公式のReference SNP(rs)同定番号を意味する。
本明細書で使用する場合、用語「対象」は、ヒトまたは任意の非ヒト動物(例えば、マウス、ラット、ウサギ、イヌ、ネコ、ウシ、ブタ、ヒツジ、ウマまたは霊長類)を意味する。ヒトには、出生前および出生後の形態が含まれる。多くの実施形態では、対象は人間である。対象は患者であってもよく、これは疾患の診断または処置のために医療機関に来院した人を意味する。用語「対象」は、本明細書では「個体」または「患者」と同義に使用される。対象は、疾患または障害に罹っているか、または罹りやすくてもよいが、疾患または障害の症状を表していてもいなくてもよい。
用語「基材」は、アレイの文脈で使用する場合、関連するアッセイ構成成分(例えば、アッセイ領域、細胞、試験化合物など)を支持することができる材料を意味する。基材の例には、限定されるものではないが、ガラス、Siベースの材料、官能化ポリスチレン、官能化ポリエチレングリコール、官能化有機ポリマー、ニトロセルロースまたはナイロンメンブレン、紙、綿、および合成に適切な材料が含まれる。基材は、平らである必要はなく、球状形状(例えば、ビーズ)を含む任意の型の形状が含まれる。基材に結合される材料は、基材の任意の部分に結合され得る(例えば、多孔性基材材料の内側部分に結合され得る)。本発明の技術の好ましい実施形態は、基材に結合した核酸プローブを有する。核酸プローブは、非ランダムな化学的または物理的相互作用を介して基材と関連する場合、基材に「結合」されている。一部の好ましい実施形態では、結合は、例えばリンカーによって提供されるような、共有結合を介したものである。
用語「腫瘍モデル」は、本明細書で使用する場合、がんの発達および増悪を研究するため、ならびにヒトに与えられる前に処置を試験するために使用される、細胞、組織または動物を意味する。
用語「腫瘍試料」には、1つまたは複数の腫瘍細胞を含有する生物学的試料または生物源からの試料が含まれる。生物学的試料には、体液、例えば、血液、血漿、血清もしくは尿の試料、または、例えば、生検によって、細胞、組織もしくは器官、好ましくはがん細胞を含むか、もしくは本質的にはがん細胞からなることが疑われる腫瘍組織から得られた試料が含まれる。
腫瘍試料の同定のためのSNP
バイオバンク試料(例えば、細胞株)の誤同定および夾雑は、生物医学的研究を悩ませてきた。ショートタンデムリピート(STR)および単一ヌクレオチド多型(SNP)アッセイは、生体試料を認証するために広く使用されており、それぞれ5~10%および3~5%の感度で夾雑を検出することができる。本開示は、一態様では、夾雑を検出するのに≦1%の感度を有する方法を提供する。この方法はさらに、混合細胞株試料について、夾雑物を同定でき、夾雑比率を推定できる。この方法は、細胞株認証について報告された、ずばぬけて最も高感度かつ正確な方法である。ある種の実施形態では、この方法は、異種移植腫瘍などのヒト-マウス混合試料における種間夾雑を検出することもでき、マウス比率を正確に推定することもできる。ある種の実施形態では、マイコプラズマおよびモリキュートも、研究標的の中にある。ある種の実施形態では、この多機能方法は、ヒト試料の集団構造および性別を同時に推論する。ある種の実施形態では、DNAバーコード化技術のおかげで、本明細書で開示した方法は、従来のSTRアッセイと匹敵する試料当たりのコストで、単一の実行で100~200の試料をプロファイリングすることができ、それにより、高品質のバイオバンクを維持するための真にハイスループットかつ低コストのツールになっている。
本明細書で記載した方法および組成物は、腫瘍モデルから得られた試料を同定および認証するために使用され得る一群のSNP遺伝子座の発見に一部基づく。ある種の実施形態では、腫瘍モデルは、原発性ヒト腫瘍、患者由来異種移植(PDX)、ヒト腫瘍細胞株、ヒト細胞株由来異種移植およびヒトオルガノイドを含むヒト腫瘍モデルである。ある種の実施形態では、SNPは、いくつかのヒト腫瘍モデルのRNAseqまたは全エキソームシークエンシング(WES)データに基づいて、ヒトSNPから選択される。選択されたヒトSNPは、22個の常染色体に亘って主に非連鎖不平衡(非LD)ブロック中に位置する、高度に発現される遺伝子のエキソン領域中に位置する。したがって、各ヒト腫瘍モデルは、選択されたヒトSNP遺伝子座において、固有の遺伝子型(すなわち、SNPフィンガープリント)を有する。
ある種の実施形態では、選択されたヒトSNP遺伝子座は、マウスゲノムにおいて相同性を有する。このようなヒトSNP遺伝子座を標的化するプライマーを使用して試料が増幅される場合、試料がマウスの細胞または組織と混合されていれば、対応するマウス遺伝子座のヌクレオチド配列が生成され得る。このようなヒトSNPは、例えば、これらのSNPのマウスおよびヒト読み取りの数に基づいて、ヒトおよびマウスの細胞/組織の混合物中のマウス含量のパーセンテージを推定するために使用され得る。
ある種の実施形態では、本明細書で使用するヒトSNPは、表1に示される群から選択される。
ある種の実施形態では、SNPには、マウス腫瘍細胞株などのマウス腫瘍モデルを同定および認証するための一群のマウスSNPが含まれる。一部の実施形態では、本明細書で使用するマウスSNPは、表2に示される群から選択される。
ある種の実施形態では、SNPには、試料を得た対象の性別を決定するための、性染色体(X染色体およびY染色体)中のヒトSNPがさらに含まれる。ある種の実施形態では、性染色体SNPは、表3に示される群から選択される。
ある種の実施形態では、SNPには、試料を得た免疫不全マウスの系統を決定するために使用され得るマウスSNPがさらに含まれる。一部の実施形態では、SNPは、表4に示される。
方法
一態様では、本開示は、試料を同定および認証するための方法を提供する。
ある種の実施形態では、本明細書で開示した方法は、試料を参照(例えば、標準的ながん細胞株)と一致させるためのものである。従来のSTRおよびSNPアッセイは、遺伝子型ベースのTanabe-Mastersアルゴリズムおよびそのバリエーションを主に使用していた。STRアッセイは、たくさんのマーカーについて類似のシグナルを生じる。SNPアッセイは、しばしばさらに多くのSNPを遺伝子型決定する。したがって、2つの試料を一致と呼ぶためにSNPアッセイによって使用される類似性閾値は、より高い場合が多い。しかし、従来のアッセイの一致力〔matching power〕は、約100のSNPを用いた場合であっても、夾雑された試料についてひどく損なわれ得る。ある種の実施形態では、本明細書で開示した方法は、ヒト試料について237のSNP部位の高深度(3000×)シークエンシングを実施し、試料、または夾雑された試料の主要構成成分を同定することにおいて100%の精度を示した。
ある種の実施形態では、本明細書で開示した方法は、生物学的試料における夾雑を検出するためのものである。細胞株における夾雑を検出するための感度は、STRアッセイについては約5~10%、SNPアッセイについては3~5%である。しかし、性能はむしろ、>20%の夾雑ですら96-SNPアッセイによって2つの無関係の細胞株の混合物中で検出されなかった程度まで、不安定であり得る(Liang-Chu,M.M.et al.PLoS One 10,e0116218(2015))。ある種の実施形態では、本明細書で開示した方法は一貫して、不均一性比率だけを使用する場合、その値および区別できる二/三峰性分布の両方によって、2%の感度に到達する。感度は、SNPフィンガープリントを有する参照試料のライブラリー中に夾雑物が存在する場合には、≦1%に達する。夾雑なしの細胞株は、多クローン性およびシークエンシングエラーに起因して、約1%の夾雑を有する細胞株試料と匹敵するレベルの遺伝的不均一性を示すので、このような感度は事実上、理論的検出限界である。
ある種の実施形態では、本明細書で開示した方法は、夾雑物を同定するためのものである。細胞株の交差夾雑は、バイオバンクでは一般的である。夾雑された培養物の組成は、細胞株の異なる増殖速度に起因して、経時的に変化する。細胞株は、遺伝子変異など、ゲノミクスが異なっており、薬物処置に異なって応答して、薬物スクリーニングにおいて誤った結果を引き起こし得る。本開示の発明者らは、1000を超えるがん細胞株についてSNPフィンガープリントライブラリーを構築し、それにより、夾雑している細胞株は、一義的に同定され得る。さらに、夾雑比率が正確に推定され得る。細胞株の品質をチェックすることに加えて、この能力は、生物学的または化学的な干渉の下での2つの細胞株の動的組成をモニターすることなどの、その他の利用を有し得る。
種内夾雑に加えて、ある種の実施形態では、本明細書で開示した方法は、ヒトとマウスとの間の種間夾雑を正確に検出および定量することができる。ある種の実施形態では、本明細書で開示した方法は、SNPではなく、2つの種間で異なっているが、同一な隣接ヌクレオチド配列を有する、108の相同なDNAセグメントを使用し、したがって、共通プライマーを、ヒトおよびマウスDNAセグメントの偏りのない増幅のために設計することができる。このアプローチは、一連のマウス-ヒトDNA混合物ベンチマーク試料において、完璧な性能を示した。相同性ベースの原理は、その他の種間夾雑を検出するために使用され得る。
ある種の実施形態では、本明細書で開示した方法の力は、いくつかの新規の特性から来ている。第1は、ディープNGSシークエンシングであり、これは、SNPの遺伝子型およびヌクレオチド頻度の両方を得るものであるが、従来のSTRおよびSNPアッセイは、SNP遺伝子型をプロファイリングするだけである。第2に、SNPプロファイリングとは別に、本明細書で開示した方法は、マイコプラズマ夾雑を検出し、マウス-ヒト混合比率を推定するために、標的化シークエンシングを実施する。第3に、一そろいの統計モデルおよびアルゴリズムが、ディープNGSシークエンシングデータを利用するために開発されており、認証方法を自動的でロバストかつ客観的なものにしている。最後に、DNAバーコード技術が、100~200の試料の同時の並列シークエンシングを可能にするために使用され、コストを大幅に低減させる。
本明細書で開示したハイスループットで低コストの方法は、認証済みの高品質の試料を維持するために、バイオバンクによって慣用的に使用され得る。この方法は、その他の種およびさらにはマイクロバイオームからの試料に広く適応され得、任意のNGSシークエンシングプラットフォーム上で実現され得る。
一実施形態では、この方法は、試料から核酸を得ること;本明細書で開示した複数のヒトまたはマウスの単一のSNP遺伝子座において、試料についての遺伝子型を検出すること;試料についての遺伝子型を、参照試料において検出された参照遺伝子型と比較すること;および試料の同定を決定することを含む。ある種の実施形態では、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200またはそれ以上のSNP遺伝子座における遺伝子型が検出される。
試料から得られた核酸は、RNAまたはDNAであり得る。ある種の実施形態では、試料から得られた核酸は、試料から単離されたゲノムDNAである。ある種の実施形態では、試料から得られた核酸は、ゲノムDNAであり、試料から単離された総RNAまたはmRNAである。ある種の実施形態では、試料から得られた核酸は、例えば、PCR反応または逆転写後のPCRによって増幅される。
SNP遺伝子座における試料についての遺伝子型は、当業界で公知の任意の適切な方法、例えば、限定されるものではないが、シークエンシングベースの方法およびハイブリダイゼーションベースの方法に基づいて検出することができる。
ある種の実施形態では、検出するステップは、増幅ステップを含む。このような場合、検出剤は、SNP遺伝子座を含有するゲノム領域にハイブリダイズし、ポリメラーゼの存在下でそのSNP遺伝子座を包囲するポリヌクレオチド配列を増幅することができる、少なくとも一対のプライマーを含む。SNPを含有するゲノム領域を増幅するために使用されるプライマー対は、プライマーまたはプローブが、ゲノム領域またはその相補鎖に特異的にハイブリダイズできるように、ゲノム領域の少なくとも一部分に対して十分な同一性または相補性を有する。「特異的にハイブリダイズする」は、本明細書で使用する場合、プライマーまたはプローブが、ストリンジェント条件下で意図した配列にハイブリダイズできることを意味する。「ストリンジェント条件」は、本明細書で使用する場合、5×SSPE、5×デンハルト液、0.5%SDSおよび100ug/mL変性サケ精子DNAからなる溶液中で42℃でハイブリダイズし、次いで、0.5×SSCおよび0.1%SDSを含む溶液で42℃で洗浄することを意味する。
PCRなどの適切な核酸増幅方法による増幅後、増幅生成物中の配列またはSNPが検出される。ある種の実施形態では、増幅生成物は、50bp~500bpの長さを有する。ある種の実施形態では、増幅生成物中のSNPの配列は、シークエンシングベースの方法、例えば、次世代シークエンシング(NGS)方法を使用して検出される。ある種の実施形態では、NGS方法は、多数のSNP遺伝子座における配列を決定するために使用される。ある種の実施形態では、NGS方法は、各試料から得られた核酸をバーコード化することによって、多くの試料からのSNP遺伝子座の配列を同時に決定するために使用され得る。
試料から得られた核酸がRNAである場合、増幅ステップは、試料中のRNAのcDNAを産生するための逆転写ステップを任意選択で含み得る。次いで、cDNAは、SNPの存在の検出を可能にするために、プライマーを使用して増幅される。
一部の実施形態では、例えば、マイクロアレイが、核酸中のSNPを検出するために使用される。マイクロアレイは、固相支持体に結合した捕捉プローブの再現性のあるパターンから構成される。標識されたRNAまたはDNAは、アレイ上の相補的プローブにハイブリダイズし、その後レーザースキャンによって検出される。SNPの存在は、アレイ上の特異的プローブに結合する標識されたRNAまたはDNAの強度を測定することによって検出され得る。
機械的合成法を使用したこれらのアレイの合成技術は、例えば、米国特許第5,384,261号に記載されている。平面アレイ表面が使用されることが多いが、アレイは実際にはいかなる形状の表面に製造されていてもよく、多重の表面に製造されてもよい。アレイはまた、ビーズ、ゲル、ポリマー表面、光ファイバーなどの繊維、ガラスまたは任意のその他の適切な基材上の核酸であってもよく、米国特許第5,770,358号、第5,789,162号、第5,708,153号、第6,040,193号および第5,800,992号を参照のこと。アレイは、診断法または包括的装置のその他の操作を可能にするような方法で包装されていてもよい。
本発明を実践するために必要なプローブおよびプライマーは、周知の技術を使用して合成するかまたは標識することができる。プローブおよびプライマーとして使用するオリゴヌクレオチドは、Beaucage and Caruthers,Tetrahedron Letts.(1981) 22:1859-1862によって最初に記載された固相ホスホラミダイトトリエステル法によって、Needham-Van Devanter et al,Nucleic Acids Res.(1984)12:6159-6168に記載されているように、自動合成機を使用して化学合成することができる。
ある種の実施形態では、この方法は、例えば、表3に示される群から選択される性染色体SNPを検出することによって、試料を得た対象の性別を同定することをさらに含む。ある種の実施形態では、この方法は、試料を得た対象の民族性を同定することをさらに含む。ある種の実施形態では、この方法は、例えば、表4に示される供給業者のSNPを検出することによって、試料を得た免疫不全マウスの系統を決定することをさらに含む。
ある種の実施形態では、本明細書で開示した方法は、腫瘍モデルにおける、A/B/C型肝炎ウイルス(HAV/HBV/HCV)、ヒト免疫不全ウイルス(HIV)、エプスタイン・バーウイルス(EBV)およびヒトパピローマウイルス(HPV)を含む一般的なウイルス感染およびマイコプラズマ夾雑を検出することをさらに含む。ある種の実施形態では、ウイルス感染およびマイコプラズマ夾雑を検出するために使用されるマーカーは、表5に示される。
ある種の実施形態では、本明細書で開示した方法は、主要構成成分および微量構成成分を含む試料を認証するために使用され得る。ある種の実施形態では、この方法は、不均一性比率を推定すること;試料の主要構成成分を決定すること;試料の微量構成成分を決定すること;ならびに主要構成成分および微量構成成分の混合比率を推定することを含む。
ある種の実施形態では、不均一性比率は、以下のように推定することができる。ディープNGSシークエンシングデータから不均一性比率を推定するために使用され得る6つのインフォーマティブな遺伝子型組合せが存在する(表11)。これらは、4つの区別できるヌクレオチド頻度パターンを示す。組合せ1および2は、同じパターンを生じ、本発明者らは、微量構成成分S2のパーセンテージ、すなわち不均一性比率を計算するために、平均式を使用する。この式は、SNPの数が大きい場合に接近して近似されるはずのシナリオである、2つの組合せが等しい頻度で生じる場合に、比率の正確な推定を生じる。類似の平均化アプローチが、組合せ4および5に使用される。不均一性比率が低い場合、シークエンシングエラーが、不均一性比率の推論を妨害し得る。これを軽減するために、2段階の統計手法が使用され得る。シークエンシングエラーをe=0.001と仮定し、所与のSNP部位におけるシークエンシング深度をn(n≧500、n<500のSNPはいずれも破棄される)と仮定すると、k個の誤ったヌクレオチドを観測する確率は、パラメータnおよびeによる二項分布に従う。
Figure 2022524208000001
各nについて、累積密度関数が、n個のヌクレオチドのうちh個よりも多くの誤ったヌクレオチドを観測する確率が0.01よりも小さくなるような閾値hを得るために計算され得る。シークエンシングデータにおいて、対応する閾値hよりも小さい数の読み取りを有する低頻度ヌクレオチドはいずれも破棄される。次いで、期待値最大化アルゴリズム(R用パッケージmclust、バージョン3.5.3)が、最大不均一性(この研究では全ての試料について0.2を使用した)よりも小さいヌクレオチド頻度の分布をモデル化する混合ガウス(1~3つの成分を有する)のパラメータを推定するために使用される。単一のガウス成分、または全てのデータポイントの60%よりも多くを占める最小平均を有するガウス成分のみが存在する場合、全てのデータポイントの中央値を試料不均一性比率とし、さもなくば、その他のガウス成分中のデータポイントの中央値を試料不均一性比率とする。
試料中の主要構成成分を決定するために、SNP部位における遺伝子型が、参照試料については10%、夾雑されている可能性がある試験試料については25%である閾値よりも大きい対立遺伝子頻度を有するヌクレオチドのみを使用して決定される。参照試料と試験試料との間の遺伝子型類似性は、試験試料中の500未満のシークエンシング深度を有するSNPを除いた、同一な遺伝子型を有するSNPのパーセンテージである。試験試料の主要構成成分は、最も高い遺伝子型類似性を有する参照試料であり、この類似性は、試験試料の不均一性比率が<10%(または>10%)である場合には、90%(または80%)よりも高くなければならない。さもなくば、主要構成成分はコールされない。
不均一性比率の推定および主要構成成分の決定の後、試験試料の微量構成成分が決定され得る。主要構成成分とその他の参照試料(例えば、ゲノムデータがある全ての細胞株)のうち1つとの混合物について、おそらくは1~4のヌクレオチドを有するキメラ遺伝子型が、全てのSNP部位において得られ得る。ヌクレオチドの頻度が、不均一性比率を使用して計算される。同様に、試験試料のキメラ遺伝子型が得られる。2つのキメラ遺伝子型は、それらが同じヌクレオチドを保有し、各ヌクレオチドの頻度が3倍以内である場合、同一とみなされる。次いで、試験試料と、主要構成成分と組み合わせた各参照試料との間の、遺伝子型類似性が計算される。次いで、全てのペアワイズ遺伝子型類似性のセットに、パラメータ(α,β)を用いるベータ分布がフィットされる。
Figure 2022524208000002
等式中、Γ(α)はガンマ関数であり、xは遺伝子型類似性である。そのパラメータは、R用パッケージfitdistrplus(バージョン3.5.3)によって推定される。フィットさせたベータ分布から、特定の値よりも大きい任意の遺伝子型類似性を観測する確率が計算される。99%信頼帯を伴う分位数-分位数グラフが、視覚化のために、全ての観測された遺伝子型類似性についてプロットされる。参照試料は、(1)それが最も高い遺伝子型類似性を有する場合、(2)その遺伝子型類似性が、分位数-分位数グラフ中の99%信頼上限を上回る場合、および(3)フィットさせたベータ分布におけるそのp値<1.0E-6である場合、微量構成成分とみなされる。
2つの参照試料についての混合比率は、以下のように推定することができる。2つの構成成分S1およびS2を、S1についてΘ、S2について(1-Θ)の比率で混合すると仮定し、このとき、0≦Θ≦1である。ディープNGSシークエンシングデータから、両方の構成成分中のn個全てのSNPのヌクレオチド頻度が、正確に推定され得る。SNPについて、その4つのヌクレオチド頻度が、構成成分S1については{A,T,G,C}、構成成分S2については{A,T,G,C}として示され、これらは合計すると1になる。原理上、頻度のうち1つは、SNPがホモ接合性である場合には1に近く、2つの頻度は共に、SNPがヘテロ接合性である場合には0.5に近い。実際のデータは、シークエンシングエラーおよびランダムさ、ならびに細胞株の多クローン性に起因して、いくらかの偏差を有し得る。
混合試料のシークエンシングデータから、4つのヌクレオチドの実際の発生率は、x={n,n,n,n}として示される。このような観測の尤度は、
Figure 2022524208000003
である。
尤度PΘ(x)は、観測されたデータxを用いて、任意のSNPi∈(1,2,...,n)について計算され得、全てのSNPについてデータX={x,x,...,x}を観測する尤度は、
Figure 2022524208000004
である。
したがって、log-尤度は、
Figure 2022524208000005
である。
尤度を最大化するΘは、Θの段階的増加によって解かれ得る。
キットおよびマイクロアレイ
別の態様では、本開示は前述の方法で使用するためのキットを提供する。このキットは、本明細書で記載した方法を実施するための試薬のいずれかまたは全てを含むことができる。ある種の実施形態では、このキットは、試料中の一群のヒトSNP遺伝子座または一群のマウスSNP遺伝子座を検出するためのプライマーを含む。ある種の実施形態では、このキットは、試料を得た対象の性別を同定するために性染色体SNPを検出するためのプライマーをさらに含む。ある種の実施形態では、このキットは、試料を得た対象の民族性を同定するために民族性SNPを検出するためのプライマーをさらに含む。ある種の実施形態では、このキットは、試料を得た免疫不全マウスの系統を決定するために供給業者のSNPを検出するためのプライマーをさらに含む。ある種の実施形態では、このキットは、試料中のウイルス感染またはマイコプラズマ夾雑を検出するためのプライマーをさらに含む。
ある種の実施形態では、このキットは、ヒトまたはマウスSNPを含有するDNA断片を、これらのプライマーを使用して増幅するための薬剤をさらに含む。さらに、キットは、本明細書で提供した方法の実践のための指示(すなわち、プロトコル)を含有する指示資料を含んでいてもよい。指示資料は典型的に文書または印刷された資料を含むが、これだけに限定されない。このような指示を記憶することができ、末端使用者がこのような指示と連絡することができる任意の媒体が本発明では検討される。このような媒体には、限定されるものではないが、電子記憶媒体(例えば、磁気ディスク、テープ、カートリッジ、チップ)、光学媒体(例えば、CDROM)などが含まれる。このような媒体には、このような指示資料を提供するインターネットサイトへのアドレスを含めることができる。
別の態様では、本開示は、例えば、Eds.,Bowtell and Sambrook DNA Microarrays:A Molecular Cloning Manual(2003)Cold Spring Harbor Laboratory Pressに記載されるようなアレイスライドまたはチップなどの固相支持体に結合したオリゴヌクレオチドプローブを提供する。このような装置の構造は、例えば、米国特許および特許公開、米国特許第5,837,832号、PCT出願第WO95/11995号、米国特許第5,807,522号;米国特許第7,157,229号、第7,083,975号、第6,444,175号、第6,375,903号、第6,315,958号、第6,295,153号および第5,143,854号、第2007/0037274号、第2007/0140906号、第2004/0126757号、第2004/0110212号、第2004/0110211号、第2003/0143550号、第2003/0003032号および第2002/0041420号に記載されたように、当業界では周知である。核酸アレイはまた、以下の参考文献に総括されている:Biotechnol Annu Rev(2002)8:85-101;Sosnowski et al.Psychiatr Genet(2002)12(4):181-92;Heller,Annu Rev Biomed Eng(2002)4:129-53;Kolchinsky et al.,Hum. Mutat(2002)19(4):343-60;およびMcGail et al.,Adv Biochem Eng Biotechnol(2002)77:21-42。
マイクロアレイは、固相支持体に固定された、通常は合成アンチセンスポリヌクレオチドまたはcDNAの断片のいずれかである多数の固有の一本鎖ポリヌクレオチドから構成され得る。典型的なポリヌクレオチドは好ましくは約6~60ヌクレオチド長、より好ましくは約15~30ヌクレオチド長、最も好ましくは約18~25ヌクレオチド長である。ある特定の種類のアレイまたはその他の検出キット/系のために、ほんの約7~20ヌクレオチド長であるオリゴヌクレオチドを使用することが好ましいことがある。化学ルミネセンス検出技術と併せて使用したアレイなどのその他の種類のアレイでは、好ましいプローブ長は、例えば、約15~80ヌクレオチド長、好ましくは約50~70ヌクレオチド長、より好ましくは約55~65ヌクレオチド長、最も好ましくは約60ヌクレオチド長であってもよい。
コンピュータが実現する方法、システムおよび装置
本明細書で記載した方法のいずれも、全体的にまたは部分的に、ステップを実施するために構成することができる1つまたは複数のプロセッサを含むコンピュータシステムで実施することができる。したがって、実施形態は、それぞれのステップまたはステップのそれぞれの群を実施する異なる構成成分を有する可能性のある、本明細書で記載した方法のいずれかのステップを実施するために構成されたコンピュータシステムを対象とする。番号付けしたステップとして提示されているが、本明細書の方法のステップは、同時に、または異なる順番で実施することができる。さらに、これらのステップの一部は、その他の方法のその他のステップの一部と共に使用することができる。また、ステップの全部または一部は任意選択であってもよい。どの方法のどのステップも、これらのステップを実施するためにモジュール、回路またはその他の手段で実施することができる。
本明細書で言及したコンピュータシステムのいずれも、任意の適切な数のサブシステムを利用することができる。一部の実施形態では、コンピュータシステムは、サブシステムがコンピュータ機器の構成成分であり得る単一のコンピュータ機器を含む。その他の実施形態では、コンピュータシステムは、内部構成成分を有する、それぞれがサブシステムである多数のコンピュータ機器を含むことができる。サブシステムはシステムバスを介して相互接続することができる。さらなるサブシステムは、例えば、プリンター、キーボード、記憶装置、ディスプレイアダプターに結合されるモニターおよびその他を含む。I/O調節器と結合する周辺装置および入力/出力(I/O)装置は、シリアルポートなどの当業界で公知の任意の数の手段によってコンピュータシステムに連結することができる。例えば、シリアルポートまたは外部インターフェース(例えば、イーサネット〈登録商標〉、Wi-Fiなど)は、コンピュータシステムをインターネットなどの広域ネットワーク、マウス入力装置またはスキャナーに連結するために使用することができる。システムバスを介した相互接続は、中央処理装置が各サブシステムと連絡し、システムメモリまたは記憶装置(例えば、ハードドライブもしくは光学ディスクなどの固定ディスク)からの指示の実行を制御するのを可能にし、サブシステム間の情報交換を可能にする。システムメモリおよび/または記憶装置はコンピュータ可読媒体を組み入れることができる。本明細書で言及したデータのいずれも、1構成成分から別の構成成分への出力であってもよく、使用者への出力であってもよい。
コンピュータシステムは、例えば、外部インターフェースによって、または内部インターフェースによって一緒に連結した複数の同じ構成成分またはサブシステムを含むことができる。一部の実施形態では、コンピュータシステム、サブシステムまたは機器は、ネットワークと連絡することができる。このような場合、一コンピュータをクライアント、別のコンピュータをサーバーとみなすことができ、それぞれが同じコンピュータシステムの一部であってもよい。クライアントおよびサーバーはそれぞれ、多数のシステム、サブシステムまたは構成成分を含むことができる。
本開示の実施形態のいずれも、ハードウェア(例えば、特定用途向け集積回路もしくはフィールドプログラマブルゲートアレイ)を使用して、および/またはモジュラー型もしくは一体型の一般的なプログラマブルプロセッサを有するコンピュータソフトウェアを使用して、制御論理の形態で実現することができることを理解されたい。本明細書で使用する場合、プロセッサは、同じ集積チップ上にマルチコアプロセッサを含むか、または単一の回路基板上に多数の処理装置を含むか、またはネットワークされた多数の処理装置を含む。本明細書で提供した開示および教示に基づいて、当業者ならば、ハードウェアならびにハードウェアおよびソフトウェアの組合せを使用して、本開示の実施形態を実現するためのその他のやり方および/または方法に気づき、理解するだろう。
本出願で記載したソフトウェア構成成分または機能のいずれも、例えば、Java〈登録商標〉、C++またはPerlなどの任意の適切なコンピュータ言語を使用し、例えば、従来技術またはオブジェクト指向技術を使用して、プロセッサによって実行されるソフトウェアコードとして実現することができる。ソフトウェアコードは、記憶および/または伝達のためのコンピュータ可読媒体上の一連の指示または命令として記憶することができ、適切な媒体には、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、ハードドライブもしくはフロッピーディスクなどの磁気媒体、またはコンパクトディスク(CD)もしくはDVD(デジタル多用途ディスク)などの光学媒体、フラッシュメモリなどが含まれる。コンピュータ可読媒体はこのような記憶もしくは伝達装置の任意の組合せであってもよい。
このようなプログラムはまた、インターネットを含む様々なプロトコルに適合する有線、光学および/または無線ネットワークを介した伝達に適応したキャリア信号を使用して記号化され、伝達され得る。したがって、本発明の実施形態によるコンピュータ可読媒体は、このようなブログラムで記号化されたデータ信号を使用して作製することができる。プログラムコードで記号化されたコンピュータ可読媒体は、互換性がある装置にパッケージ化されてもよく、または(例えば、インターネットダウンロードを介して)その他の装置から別々に提供されてもよい。任意のこのようなコンピュータ可読媒体は、単一のコンピュータ製品(例えば、ハードドライブ、CDまたは全コンピュータシステム)上、または内に存在していてもよく、システムまたはネットワーク内の異なるコンピュータ製品上または内に存在していてもよい。コンピュータシステムは、本明細書で言及した結果のいずれかを使用者に提供するために、モニター、プリンターまたはその他の適切なディスプレイを含んでいてもよい。
以下の実施例は、特許請求した発明をよりよく例示するために提供され、本発明の範囲を限定しないものと解釈される。以下に記載した特定の組成物、材料および方法は全て、全体または一部が本発明の範囲内にある。これらの特定の組成物、材料および方法は、本発明を限定するものではなく、本発明の範囲内にある特定の実施形態を例示するに過ぎない。当業者は、創作能力を発揮することなく、かつ本発明の範囲を逸脱することなく、同等の組成物、材料および方法を開発することができる。本発明の範囲内にありながら、記載した本明細書の手法において多くの変更を行うことができることを理解されたい。このような変更が本発明の範囲内に含まれることは、本発明者らの意図である。
[実施例1]
材料および方法
核酸抽出
細胞、PDXおよびPDXOからのゲノムDNAを、製造業者の指示に従ってDNeasy Blood&Tissue Kit(QIAGEN、Cat.69506、CA)を使用して精製した。DNAの完全性を、2100 Bioanalyser(Agilent)によって決定し、NanoDrop(Thermo Scientific)を使用して定量した。高品質のDNA試料(OD260/280=1.8~2.0、OD260/230≧2.0、>1μg)の1つのアリコートを、ディープNGSシークエンシングおよびWESシークエンシングに使用した。細胞、PDXおよびPDXOからの総RNAを、製造業者の指示に従ってRNeasy Mini Kit(QIAGEN、Cat.74106、CA)を使用して精製した。総RNAの完全性を、2100 Bioanalyser(Agilent)によって決定し、NanoDrop(Thermo Scientific)を使用して定量した。高品質のRNA試料(OD260/280=1.8~2.2、OD260/230≧2.0、RIN≧8.0、>1μg)の1つのアリコートを、ディープNGSシークエンシングおよびRNAseqシークエンシングに使用した。
細胞株混合物の調製
細胞株混合物を、2つの細胞株からの細胞を所与の比率で混合することによって調製した。細胞増殖速度に基づいて、細胞を、T75中で15mlの培地中に播種して、細胞のコンフルエンスを60%~80%に到達させ、その後、COWater Jacketed Incubator(SANYO)で一晩インキュベートした。細胞を対数増殖期間の間に回収し、血球計(Chongguang)でカウントして濃度を計算した。次いで、2つの細胞株からの細胞を、予め規定された比率に従って混合して、細胞株混合物を作製し、これを引き続いて、3,000rpmで5分間遠心分離した。上清を吸引し、細胞ペレットをDNA抽出のために-20℃で貯蔵した。
ヒト-マウスDNA混合物の調製
一連のマウス-ヒトDNA混合物ベンチマーク試料を、マウス脾臓DNAおよびヒトゲノムDNA(Thermo Scientific、Cat.4312660)を混合することによって調製した。マウス脾臓DNAを、製造業者の指示に従ってDNeasy Blood&Tissue Kit(QIAGEN、Cat.69506、CA)を使用して精製し、NanoDrop(Thermo Scientific)を使用して定量した。マウス脾臓DNAおよびヒトゲノムDNAを200ng/μLに希釈し、次いで、予め規定された比率で混合した。DNA混合物を、後にディープNGSシークエンシングに使用した。
ディープNGSシークエンシングをバーコード化する
多重PCRを使用して、150bpのペアードエンド読み取り長さ(pE150)を用いるIlluminaシークエンサーのための標的シークエンシングライブラリーを調製した。NGSディープシークエンシングは、630のアンプリコンをカバーし、それらのサイズは、160bp~260bpの範囲であった。ゲノムDNAを、IGT-EM808ポリメラーゼ混合物(iGene TechBioscience Co.,Ltd、95℃で3分30秒間、98℃で20秒間および60℃で8分間のインキュベーション18サイクル、72℃で5分間維持)を使用して増幅し、次いで、AMPure XPビーズ(Beckman、Cat.A63881)によって精製した。
バーコード化を、第2ラウンドの増幅によって実行した。簡潔に述べると、精製された標的アンプリコンを鋳型とし、PCR反応のための上流のIGT-I5インデックス(10μM)、下流のIGT-I7インデックス(10μM)およびポリメラーゼ混合物と共に添加した。次いで、この混合物を、以下の設定での増幅のためにサーマルサイクラー中に置いた:95℃で3分30秒間、98℃で20秒間、58℃で1分間および72℃で30秒間のインキュベーション9サイクル、72℃で5分間固定。次いで、バーコード化されたライブラリーを、AMPure XPビーズ(Beckmen、Cat.A63881)を使用して精製した。
ライブラリー構築後、Qubit 3.0 fluorometer dsDNA HS Assay(Thermo Fisher Scientific)を使用して、得られたシークエンシングライブラリーの濃度を定量した。Agilent BioAnalyzer 2100(Agilent)を使用して、280bp~420bpの範囲のサイズ分布を分析した。ペアードエンドシークエンシングを、2×150bpペアードエンドシークエンシングのためのIllumina提供のプロトコルに従ってIlluminaシステムを使用して実施した。
RNAseqおよびWESシークエンシング
RNAseqシークエンシングでは、mRNAに焦点を当てたシークエンシングライブラリーを、総RNAから構築した。ポリ-A mRNAを、オリゴ-dTが結合した磁気ビーズを使用して総RNAから精製し、次いで、断片化緩衝剤によって断片化した。短い断片を鋳型として使用して、第1鎖cDNAを、逆転写酵素およびランダムプライマーを使用して合成し、その後、第2鎖cDNAを合成した。次いで、合成されたcDNAを、ライブラリー構築プロトコルに従って、末端修復、リン酸化および「A」塩基付加に供した。次いで、シークエンシングアダプターを、cDNA断片の両方の末端に付加した。cDNA断片についてのPCR増幅後、標的化された250~350bpの断片を浄化した。ライブラリー構築後、Qubit 3.0 fluorometer dsDNA HS Assay(Thermo Fisher Scientific)を使用して、得られたシークエンシングライブラリーの濃度を定量し、サイズ分布を、Agilent BioAnalyzer 2100(Agilent)を使用して分析した。ライブラリーの検証後、HiSeq PE Cluster Kits(Illumina)と併せてIllumina cBOTクラスター生成システムを使用して、クラスターを生成した。ペアードエンドシークエンシングを、2×150ペアードエンドシークエンシングのためのIllumina提供のプロトコルに従ってIlluminaシステムを使用して実施した。
WESは、Wuxi Nextcode Co.Ltd.(Shanghai、China)が実施した。簡潔に述べると、ゲノムDNAを抽出し、180~280bpの平均サイズに断片化した。DNAライブラリーを、Illuminaの製造業者のペアードエンドプロトコルによって生成した。エキソンを、Agilent SureSelect Human All Exon V6によって捕捉し、引き続いて、Illumina NovaSeqプラットフォーム(Illumina Inc.、San Diego、CA、USA)によってシークエンシングして、150bpのペアードエンド読み取りを生成した。
SNPの選択およびプロファイリング
本発明者らは、以下のいくつかの基準によって、ヒト試料認証のためのパネルSNPを選択した:1)SNPがエキソン中にある、2)大きい染色体セグメントの欠失および重複を含む染色体の異常性が腫瘍において共通しているので、SNPが、22個全ての常染色体上に位置し、互いに十分に離れている、3)SNPが、高度に発現される遺伝子中にある、4)SNPのマイナー対立遺伝子頻度(MAF)が、International HapMap Projectの3つの参照集団、すなわち、中国の漢族(CHB)、ナイジェリアのヨルバ族(YRI)ならびにCEPHコレクションからの北および西ヨーロッパ人祖先を持つユタ州住民(CEU)において、0.5に近い。
ベンチマーク試料およびデータ
2つの細胞株ベンチマーク試料セットを調製した。第1のセットは、PANC-1およびRT4、MV-4-11および「LNCaPクローンFGC」、CAL27およびRajiを含む3対の細胞株について、78の試料を有する。各対は、純粋な2つの細胞株と、細胞カウントによる8つの混合比率についての3つの反復とを含む、26の試料を有する(補足の表S2)。第2のセットは、大抵は小さいが特定されない比率で既知の第2の細胞株が各々夾雑した22の細胞株を有する(補足の表S3)。
不均一性比率を推定する
ディープNGSシークエンシングデータから不均一性比率を推定するために使用され得る6つのインフォーマティブな遺伝子型組合せが存在する(表11)。これらは、4つの区別できるヌクレオチド頻度パターンを示す。組合せ1および2は、同じパターンを生じ、我々は、微量構成成分S2のパーセンテージ、すなわち不均一性比率を計算するために、平均式を使用する。この式は、SNPの数が大きい場合に接近して近似されるはずのシナリオである、2つの組合せが等しい頻度で生じる場合に、比率の正確な推定を生じる。類似の平均化アプローチが、組合せ4および5に使用される。不均一性比率が低い場合、シークエンシングエラーが、不均一性比率の推論を妨害し得る。これを軽減するために、我々は、2段階の統計手法を使用する。シークエンシングエラーをe=0.001と仮定し、所与のSNP部位におけるシークエンシング深度をn(n≧500、n<500のSNPはいずれも破棄される)と仮定すると、k個の誤ったヌクレオチドを観測する確率は、パラメータnおよびeによる二項分布に従う。
Figure 2022524208000006
各nについて、我々は、累積密度関数を計算し、n個のヌクレオチドのうちh個よりも多くの誤ったヌクレオチドを観測する確率が0.01よりも小さくなるような閾値hを得る。シークエンシングデータにおいて、対応する閾値hよりも小さい数の読み取りを有する低頻度ヌクレオチドはいずれも破棄される。次いで、我々は、最大不均一性(この研究では全ての試料について0.2を使用した)よりも小さいヌクレオチド頻度の分布をモデル化する混合ガウス(1~3つの成分を有する)のパラメータを推定するために、期待値最大化アルゴリズム(R用パッケージmclust、バージョン3.5.3(Team,R.C.R:A language and environment for statistical computing.3.5.3 edn(R Foundation for Statistical Computing、Vienna、Austria.、2018)))を使用する。単一のガウス成分、または全てのデータポイントの60%よりも多くを占める最小平均を有するガウス成分のみが存在する場合、全てのデータポイントの中央値を試料不均一性比率とし、さもなくば、その他のガウス成分中のデータポイントの中央値を試料不均一性比率とする。
試料の主要構成成分を決定する
SNP部位における遺伝子型が、参照試料については10%、夾雑されている可能性がある試験試料については25%である閾値よりも大きい対立遺伝子頻度を有するヌクレオチドのみを使用して決定される。参照試料と試験試料との間の遺伝子型類似性は、試験試料中の500未満のシークエンシング深度を有するSNPを除いた、同一な遺伝子型を有するSNPのパーセンテージである。試験試料の主要構成成分は、最も高い遺伝子型類似性を有する参照試料であり、この類似性は、試験試料の不均一性比率が<10%(または>10%)である場合には、90%(または80%)よりも高くなければならない。さもなくば、主要構成成分はコールされない。
試料の微量構成成分を決定する
不均一性比率の推定および主要構成成分の決定の後、我々は、試験試料の微量構成成分を決定する。主要構成成分とその他の参照試料(例えば、ゲノムデータがある全ての細胞株)のうち1つとの混合物について、我々は、おそらくは1~4のヌクレオチドを有するキメラ遺伝子型を、全てのSNP部位において得る。ヌクレオチドの頻度が、不均一性比率を使用して計算される。同様に、我々は、試験試料のキメラ遺伝子型を得る。2つのキメラ遺伝子型は、それらが同じヌクレオチドを保有し、各ヌクレオチドの頻度が3倍以内である場合、同一とみなされる。次いで、我々は、試験試料と、主要構成成分と組み合わせた各参照試料との間の、遺伝子型類似性を計算する。次いで、全てのペアワイズ遺伝子型類似性のセットに、パラメータ(α,β)を用いるベータ分布がフィットされる。
Figure 2022524208000007
等式中、Γ(α)はガンマ関数であり、xは遺伝子型類似性である。そのパラメータを、R用パッケージfitdistrplus(バージョン3.5.3)によって推定した。次いで、フィットさせたベータ分布から、我々は、特定の値よりも大きい任意の遺伝子型類似性を観測する確率を計算した。99%信頼帯を伴う分位数-分位数グラフを、視覚化のために、全ての観測された遺伝子型類似性についてプロットした。参照試料は、(1)それが最も高い遺伝子型類似性を有する場合、(2)その遺伝子型類似性が、分位数-分位数グラフ中の99%信頼上限を上回る場合、および(3)フィットさせたベータ分布におけるそのp値<1.0E-6である場合、微量構成成分とみなした。
2つの細胞株の混合比率を推定する
細胞株が、2つの参照試料についての混合比率の推定を説明するために使用される。2つの細胞株S1およびS2を、S1についてΘ、S2について(1-Θ)の比率で混合すると仮定し、このとき、0≦Θ≦1である。ディープNGSシークエンシングデータから、両方の細胞株中のn個全てのSNPのヌクレオチド頻度が、正確に推定され得る。SNPについて、その4つのヌクレオチド頻度が、細胞株S1については{A,T,G,C}、細胞株S2については{A,T,G,C}として示され、これらは合計すると1になる。原理上、頻度のうち1つは、SNPがホモ接合性である場合には1に近く、2つの頻度は共に、SNPがヘテロ接合性である場合には0.5に近い。実際のデータは、シークエンシングエラーおよびランダムさ、ならびに細胞株の多クローン性に起因して、いくらかの偏差を有し得る。
混合試料のシークエンシングデータから、4つのヌクレオチドの実際の発生率は、x={n,n,n,n}として示される。このような観測の尤度は、
Figure 2022524208000008
である。
尤度PΘ(x)は、観測されたデータxを用いて、任意のSNPi∈(1,2,...,n)について計算され得、全てのSNPについてデータX={x,x,...,x}を観測する尤度は、
Figure 2022524208000009
である。
したがって、log-尤度は、
Figure 2022524208000010
である。
次いで、尤度を最大化するΘが、Θの段階的増加によって解かれ得る。上記手法は、任意の2つのヒト試料の混合物についても同様に使用され得る。
夾雑物検出のための細胞株混合物のシミュレーション
シミュレーションを、PANC-1およびRT4、MV-4-11および「LNCaPクローンFGC」、CAL27およびRajiを含む3つの細胞株対について実施した。6つ全ての細胞株を、ディープNGSシークエンシングによってプロファイリングして、それらのSNPフィンガープリントを得た。対になった2つの細胞株を、in silicoで混合したが、第一の細胞株の比率はrであり、rは、以下の値をとる:0.15%、0.30%、0.625%、1.25%、2.5%、5%、10%、15%および20%。各SNP部位について、r×n個のヌクレオチドを第1の細胞株から得、式中、nは、500~5000のランダムな整数であり、r×nを、第1の細胞株におけるそれらの頻度に従って、4つのヌクレオチド(A、T、G、C)にさらに振り分けた。同様に、(1-r)×n個のヌクレオチドを、第2の細胞株から得た。次いで、比率を逆転させ、そうして、対称サンプリングを、第2の細胞株について比率rで実施した。
RNAseqおよびWESデータセットからマウス比率を推定する
シークエンシング読み取りを、デフォルトパラメータを用いて、RNAseqデータについてはマッピングツールSTAR(Dobin,A.et al.STAR:ultrafast universal RNA-seq aligner.Bioinformatics 29,15-21(2013))を使用し、WESデータについてはBWA(Li,H.&Durbin,R.Fast and accurate short read alignment with Burrows-Wheeler transform.Bioinformatics 25,1754-60(2009))を使用して、ヒト(hg19)およびマウス(mm10)ゲノムにマッピングした。読み取りがヒトゲノムのみにマッピングされた場合、またはマウスゲノムに対してよりもヒトゲノムに対しての不一致がより少なかった場合、その読み取りは、ヒト読み取りとして分類した。マウス読み取りも同様に割り当てた。読み取りが、多くても2ずれた近い数の不一致で両方のゲノムにマッピングされた場合、その読み取りは分類不能であり、破棄した。マウス比率は、全ての保持した読み取りのうちのマウス読み取りの割合であった。
[実施例2]
この実施例は、ヒト試料認証および夾雑検出を例示する。
SNPプロファイリングおよびフィンガープリント
SNPのパネルを、細胞株、異種移植片およびオルガノイドを含むヒト試料を認証するために選択した(表1)。SNPを、3000の平均深度を用いるディープNGSシークエンシングによってプロファイリングした。各試料は、全てのSNPについて、ヌクレオチド同一性および頻度の両方からなる固有のSNPフィンガープリントを有する。細胞株は、遺伝的浮動および不均一性に起因して、継代間およびバイオバンク間でゆらぐSNPフィンガープリントを有し得、したがって、現在のSNPフィンガープリントが、より良いキュレーションのためにプロファイリングされ得ることが強調される。SNPフィンガープリントは、比較的低深度のNGSデータによって、低減された正確さで生成され得る。この実施例では、本発明者らは、本発明者らおよびCCLEがプロファイリングしたRNAseqデータから、1050の細胞株についてのSNPフィンガープリントを生成した。これは、参照として機能する。
本発明者らは、217の細胞株試料、220のPDXおよび31のPDX由来オルガノイド(PDXO)試料についてのディープNGSシークエンシングからのSNPプロファイリングデータを使用した、認証、特徴づけ、種内および種間夾雑検出を例示した。細胞株試料について、本発明者らは、連続希釈からの既知の混合比率の2つの細胞株の混合物および6つの対応する純粋な細胞株(表7)、未知の混合比率の2つの細胞株の混合物(表8)、ならびに117の未混合の細胞株(表9)を試験した。
ヒト試料の認証
試料の正体、または夾雑された試料の主要構成成分を、参照試料のライブラリーに対するその遺伝子型類似性によって決定した。217の試験した細胞株試料において、同じ細胞株間の遺伝子型類似性は、98.6%の平均で常に>90%であり、最低は、JEG-3の16.7%の夾雑を伴った、A-875細胞培養物についての91.7%であった(図1A、表8)。対照的に、無関係の細胞株間の遺伝子型類似性は、ほぼ常に50%を下回った。表示ミス、夾雑、同じ患者に由来すること、1つの細胞株が別の細胞株の親であることなどを含む様々な理由によって、密接に関係するまたは同じ同義の群中にある細胞株がなおも存在した。例えば、HCT-15およびHCT-8は、同じ患者に由来した可能性が高い;QGY-7701が夾雑し、これはHeLa誘導体である。データセット中の16のこのような細胞株対についての遺伝子型類似性は、84%~96%の範囲である(表10)。これらの細胞株対は、HLEおよびHLFなどのほぼ同一なものを除き、区別することができる。同じモデル間の遺伝子型類似性は、平均して、220のPDXおよび31のPDX由来オルガノイド(PDXO)試料については98.0%(87.2~100%)であり、ほぼ全てが、異なるモデル間で50%を下回る。
遺伝的不均一性の推定
試料が夾雑なしであり、純粋に単クローン性の二倍体である場合、SNP部位は、ホモ接合性またはヘテロ接合性のいずれかであり、観測されたヌクレオチド頻度は、ディープNGSシークエンシングデータにおいて1または0.5に近く、この違いは、シークエンシングにおけるエラーおよびランダムさのみから来ている。実際には、細胞株は、微量クローンを有している可能性があり、異数体であり、または夾雑されており(夾雑物)、したがって、本発明者らは、SNP部位において、0.5および1からかけ離れた頻度を観測しただけでなく、3または4のヌクレオチドもまた観測した。このような情報は、試料の遺伝的不均一性を推定するために使用することができる。
支配的なクローンは、試料の主要構成成分であり、微量クローンおよび夾雑物は、微量構成成分である。4つの観測されたヌクレオチド頻度パターンに基づいて、SNP不均一性比率を推定するために使用され得る主要構成成分および微量構成成分の6つのインフォーマティブな遺伝子型組合せが存在する(表11)。SNP部位は、4つのパターンのうち1つを生じる場合、インフォーマティブである。引き続いて、試料不均一性比率を、統計的モデル化アプローチによって、個々のSNP不均一性比率から推定する(実施例1を参照のこと)。試験試料を使用して、本発明者らは、夾雑なしの細胞株が、平均して、107のインフォーマティブなSNP部位を有するが、夾雑された細胞株が、わずかに多い112を有することを見出した。平均して、PDXおよびPDXOモデルは、それぞれ、156および111のインフォーマティブなSNP部位を有し、これは、PDXモデルにおけるより高い遺伝的不均一性および/またはマウス夾雑を反映している。
夾雑の検出および定量
本発明者らは、3つの分析を組み合わせることによって、試料夾雑を検出した。第1に、夾雑された試料は、高い不均一性比率を有し得るが、夾雑なしの試料はそれを有さない。試験試料において、118の推定上夾雑なしの細胞株のうち115(97.5%)が、不均一性比率<2%を有し、全てが<3%を有した(図1B)。対照的に、本発明者らは、夾雑された細胞株について高い不均一性比率を観測し、例えば、JEG-3細胞と混合されたA-875細胞培養物は、15.5%の不均一性比率を有した(表8)。上で示したように、不均一性比率は、夾雑比率(夾雑物のパーセンテージ)に比例し、したがって、夾雑の良好な指標である。PDXモデルから切開されたヒト腫瘍は、マウス間質を含有し、実際、本発明者らは、マウス夾雑(図1C)によって引き起こされる、PDX腫瘍におけるより高い不均一性比率(図1B)を観測した。PDXOは、PDXのin vitro培養物として、はるかに小さいおよびしばしば痕跡量のみのマウス細胞に起因して、有意に小さい不均一性比率を有する(図1B)。
夾雑は、試料について、SNP不均一性比率の確率密度における区別できる右ピークによっても示された(図2A~2F)。夾雑および不均一性比率が増加するにつれて、ピークは右にシフトし、時には2つのピークに分かれる。二/三峰性分布は、消滅したか、または夾雑なしの細胞株もしくは非常に低い夾雑比率(<1%)および不均一性比率(<2%)の細胞株についてわずかに出現したに過ぎない。
最後に、夾雑物は、直感的な視覚化および厳密な確率論的測定を与える統計的モデル化によって直接検出することができる(実施例1、図3Aを参照のこと)。各々別の細胞株と混合された94の細胞株試料において、本発明者らは、不均一性比率が≧2%である場合、細胞株中の微量夾雑物細胞株を常に正確に推論することができる(図3B)。不均一性比率が1~2%および<1%であるとき、精度は、約80%および50%まで下がる。8つの不首尾に終わった試料について、7つの試料がクリーンであると特徴づけられ、1つだけが、誤った夾雑している細胞株と評価された。もちろん、このような推論は、夾雑している細胞株も既知のSNPフィンガープリントを有するものである場合にもっともらしいに過ぎない。本発明者らは、我々のバイオバンクにおいていくつかの夾雑された細胞株を検出し、1つの例は、細胞株「G-292クローンA141B1」であり、これは、7.62%の高い不均一性比率を有し(図3C)、6.21%のOCI-AML-2が夾雑していた(図3D)。
夾雑している細胞株を同定した後で、本発明者らは、最尤アプローチを使用して、夾雑比率(すなわち、第2の細胞株のパーセンテージ)を推定することができる(実施例1を参照のこと)。シミュレーション研究により、推定された夾雑比率が、既知の比率と極めて近いことが示された(図3E)。本発明者らは、不均一性比率と夾雑比率との間の緊密な線形の相関を観測した(図3F)。したがって、以前に議論したように、不均一性比率は、夾雑の良好な推定子であり、夾雑物が標準的な細胞株でない場合に特に有用である。やはり夾雑された試料においてであるが、夾雑物は、時には遺伝的不均一性の大部分に寄与するとはいえ、その一部に寄与するだけであり、その結果、夾雑比率は、対応する不均一性比率よりも概して小さく(表8を参照のこと)、わずかな逸脱が、データ処理方法によって引き起こされた。
要約すると、その値および分布による不均一性比率は、ヒト試料についての信頼性のある夾雑尺度である。不均一性比率≧2%を有する細胞株試料は、夾雑されている可能性が非常に高く、夾雑物がこれもまたSNPフィンガープリント情報を有する別の細胞株である場合、その正体が推論され得、夾雑比率は、細胞またはDNA混合比率によって測定すると、≦1%で、前例のない感度で推定され得る(表7および8)。
[実施例3]
この実施例は、マウス腫瘍モデル認証を例示する。
マウスSNPのパネル(表2を参照のこと)を、4T1、A20、B16-BL6、B16-F0、B16-F1、B16-F10、C1498、Colon26、CT26WT、E.G7-Ova、EL4、EMT6、H22、Hepa1-6、J558、J774A1、JC、KLN205、L1210、L5178-R、LLC、MBT2、MC38、MPC-11、Neuro-2a、P388D1、P815、Pan02、Renca、RM1、S91およびWEHI164を含む、前臨床免疫調節薬物開発において一般に使用される32の同系マウス腫瘍モデルを認証するために選択した。ほとんどのモデルは、6つの固有のSNPを有する。Colon26およびCT26WTは、BALB/cマウス系統に起源するマウス結腸腺癌モデルであり、各々、12のSNPを6つの共通のSNPと併せて有し、合計18の固有のSNPを有する。B16-BL6、B16-F0、B16-F1およびB16-F10は、C57BL/6マウス系統におけるマウス黒色腫細胞株であり、全てB16に由来し、したがって、高い遺伝的類似性を共有する。具体的には、B16は、B16-F0の親株であり、順に、B16-F0は、B16-F1の親株である。B16-F10は、B16-F0の10代目の連続継代であり、B16-BL646の親株である。本発明者らは、7つの共通のSNPを使用して、試験細胞株をこの群に最初に割り当て、次いで、6つの固有のSNPを各々が有するB16-BL6、B16-F0およびB16-F10に割り当て、18のSNPのいずれも観測されない場合には、試験細胞株にはB16-F1が割り当てられる。これらのモデルについての認証は、100%の精度を達成した。
[実施例4]
この実施例は、ヒト-マウス種間夾雑検出を例示する。
本発明者らは、ヒトhg19およびマウスmm10ゲノムを比較し、一群の100~300bpのセグメントを同定した(表3を参照のこと)が、その結果、各セグメントは、ヒトとマウスとの間で、挿入、欠失および点変異によって有意に異なっているが(31~97%の配列類似性)、共通のプライマー対が設計できるような同一な隣接配列をなおも有する。NGSシークエンシングの後、本発明者らは、ヒト読み取りとマウス読み取りとを分離し、全てのセグメントについてマウス比率を計算し、これらの比率の中央値を、ヒト-マウス混合試料中のマウス比率とした。この方法は、マウスおよびヒトのDNAが連続希釈によって混合されたベンチマーク試料のセットにおいて極めて高い精度を実証した(図4A)。本発明者らは、RNAseqおよびWESデータからマウス含量を推定する方法もまた開発した(実施例1を参照のこと)。本発明者らは、220のPDXおよび31のPDXOモデルにおいてマウス比率を推定することにおいて、3つの方法を比較した(図4B~C)。DNA(WESおよびディープNGSシークエンシングのため)およびRNA(RNAseqのため)を抽出し、モデルの同じ試料からシークエンシングして、試料の変動を除去した。PDXOモデルは概して、低いマウス含量を有した。PDXモデルでは、ディープNGSシークエンシングデータから正確に推定されたマウス比率は最も高く、次がRNAseqからのものであり、次がWESからのものであった。これは、WESにおいて使用したエキソン捕捉キットがヒトエキソンを富化するように設計されたものであり、相同なマウスエキソンに対する低いハイブリダイゼーション親和性を有したことに主に起因する。RNAseqは、種を優先しないポリA富化プロトコルを使用したが、遺伝子発現は、PDXのヒト腫瘍およびマウス間質において、大きな時空間的可変性を有する。実際、本発明者らは、ディープNGSシークエンシングデータとWESデータとの間に、マウス比率について非常に強い二次関係を観測したが(R=0.96、図4D)、ディープシークエンシングデータとRNAseqデータとの間には、はるかに弱い線形の相関を観測した(R=0.62)。
[実施例5]
この実施例は、試料中のマイコプラズマの検出を例示する。
本発明者らは、有効性が証明された、全てのマイコプラズマ種の検出のための一対のユニバーサルプライマー、ならびにA.laidlawii、M.arginine、M.fermentans、M.genitalium、M.hominis、M.hyorhinis、M.orale、M.pneumonia、M.salivariumおよびU.urealyticumを含む11のモリキュートを検出するための11対のプライマーを使用した(Molla Kazemiha,V.et al.Cytotechnology 61,117-24(2009))。本発明者らは、ディープNGSシークエンシング方法によって、バイオバンクにおいて1つのマイコプラズマ夾雑された細胞株を同定し、引き続いて、マイコプラズマ検出キットによってそれを検証した。
[実施例6]
この実施例は、集団構造分析および性別決定を例示する。
ヒト試料認証に使用したSNPのパネルのうち、143は、International HapMap Project(International HapMap,C.The International HapMap Project.Nature 426,789-96(2003))によって特徴づけられたものである。本発明者らは、fastSTRUCTURE(Raj,A.,Stephens,M.&Pritchard,J.K.Genetics 197,573-89(2014))を使用して、以下の3つの参照集団の集団構造分析を実施した:中国の漢族(CHB)、ナイジェリアのヨルバ族(YRI)ならびにCEPHコレクションからの北および西ヨーロッパ人祖先を持つユタ州住民(CEU)。406人全ての個体を、高い確率で一義的に割り当てた。次いで、本発明者らは、東アジア人患者に由来する423のPDXモデルおよび米国の西洋人患者に由来する634のPDXモデルをプロファイリングした。全ての東アジア人PDXモデルは、1つの例外だけを除いて、支配的なCHB組成を有している。西洋人PDXモデルの大部分は、CEU組成を支配的に有し、残りは、主要なCHBもしくはYRI組成、または参照集団のうち2つもしくは3つの混合物を有している。本発明者らは、性別推論のためにY染色体にある3つのSNPも使用し(表3)、これは、Y染色体が失われた腫瘍試料を除き、常に正確であった。
本開示は、特定の実施形態(そのうちのいくつかは好ましい実施形態である)を参照しながら特に示し説明したが、当業者は、本明細書で開示した本開示の精神および範囲を逸脱することなく形態および詳細の様々な変化を行うことができることを理解されたい。
参考文献
1. Identity crisis. Nature 457, 935-6 (2009).
2. American Type Culture Collection Standards Development Organization Workgroup, A.S.N. Cell line misidentification: the beginning of the end. Nat Rev Cancer 10, 441-8 (2010).
3. Capes-Davis, A. et al. Match criteria for human cell line authentication: where do we draw the line? Int J Cancer 132, 2510-9 (2013).
4. Gartler, S.M. Apparent Hela cell contamination of human heteroploid cell lines. Nature 217, 750-1 (1968).
5. Lacroix, M. Persistent use of "false" cell lines. Int J Cancer 122, 1-4 (2008).
6. Lorsch, J.R., Collins, F.S. & Lippincott-Schwartz, J. Cell Biology. Fixing problems with cell lines. Science 346, 1452-3 (2014).
7. Fusenig, N.E., Capes-Davis, A., Bianchini, F., Sundell, S. & Lichter, P. The need for a worldwide consensus for cell line authentication: Experience implementing a mandatory requirement at the International Journal of Cancer. PLoS Biol 15, e2001438 (2017).
8. Yu, M. et al. A resource for cell line authentication, annotation and quality control. Nature 520, 307-11 (2015).
9. Bian, X., Yang, Z., Feng, H., Sun, H. & Liu, Y. A Combination of Species Identification and STR Profiling Identifies Cross-contaminated Cells from 482 Human Tumor Cell Lines. Sci Rep 7, 9774 (2017).
10. Horbach, S. & Halffman, W. The ghosts of HeLa: How cell line misidentification contaminates the scientific literature. PLoS One 12, e0186281 (2017).
11. de Maagd, R.A. et al. Identification of Bacillus thuringiensis delta-endotoxin Cry1C domain III amino acid residues involved in insect specificity. Appl Environ Microbiol 65, 4369-74 (1999).
12. Azari, S., Ahmadi, N., Tehrani, M.J. & Shokri, F. Profiling and authentication of human cell lines using short tandem repeat (STR) loci: Report from the National Cell Bank of Iran. Biologicals 35, 195-202 (2007).
13. Wu, M.L. et al. A 2-yr service report of cell line authentication. In Vitro Cell Dev Biol Anim 49, 743-5 (2013).
14. Masters, J.R. HeLa cells 50 years on: the good, the bad and the ugly. Nat Rev Cancer 2, 315-9 (2002).
15. MacLeod, R.A. et al. Widespread intraspecies cross-contamination of human tumor cell lines arising at source. Int J Cancer 83, 555-63 (1999).
16. Cosme, B. et al. Are your results valid? Cellular authentication a need from the past, an emergency on the present. In Vitro Cell Dev Biol Anim 53, 430-434 (2017).
17. Ye, F., Chen, C., Qin, J., Liu, J. & Zheng, C. Genetic profiling reveals an alarming rate of cross-contamination among human cell lines used in China. FASEB J 29, 4268-72 (2015).
18. Freedman, L.P. et al. The culture of cell culture practices and authentication--Results from a 2015 Survey. Biotechniques 59, 189-90, 192 (2015).
19. Nims, R.W. & Reid, Y. Best practices for authenticating cell lines. In Vitro Cell Dev Biol Anim 53, 880-887 (2017).
20. Almeida, J.L., Cole, K.D. & Plant, A.L. Standards for Cell Line Authentication and Beyond. PLoS Biol 14, e1002476 (2016).
21. Almeida, J.L. et al. Interlaboratory study to validate a STR profiling method for intraspecies identification of mouse cell lines. PLoS One 14, e0218412 (2019).
22. Zaaijer, S. et al. Rapid re-identification of human samples using portable DNA sequencing. Elife 6(2017).
23. Yousefi, S. et al. A SNP panel for identification of DNA and RNA specimens. BMC Genomics 19, 90 (2018).
24. Jobling, M.A. & Gill, P. Encoded evidence: DNA in forensic analysis. Nat Rev Genet 5, 739-51 (2004).
25. Sanchez, J.J. et al. A multiplex assay with 52 single nucleotide polymorphisms for human identification. Electrophoresis 27, 1713-24 (2006).
26. Didion, J.P. et al. SNP array profiling of mouse cell lines identifies their strains of origin and reveals cross-contamination and widespread aneuploidy. BMC Genomics 15, 847 (2014).
27. Liang-Chu, M.M. et al. Human biosample authentication using the high-throughput, cost-effective SNPtrace(TM) system. PLoS One 10, e0116218 (2015).
28. Pengelly, R.J. et al. A SNP profiling panel for sample tracking in whole-exome sequencing studies. Genome Med 5, 89 (2013).
29. Morgan, A.P. et al. The Mouse Universal Genotyping Array: From Substrains to Subspecies. G3 (Bethesda) 6, 263-79 (2015).
30. Castro, F. et al. High-throughput SNP-based authentication of human cell lines. Int J Cancer 132, 308-14 (2013).
31. El-Hoss, J. et al. A single nucleotide polymorphism genotyping platform for the authentication of patient derived xenografts. Oncotarget 7, 60475-60490 (2016).
32. Ruitberg, C.M., Reeder, D.J. & Butler, J.M. STRBase: a short tandem repeat DNA database for the human identity testing community. Nucleic Acids Res 29, 320-2 (2001).
33. van der Meer, D. et al. Cell Model Passports-a hub for clinical, genetic and functional datasets of preclinical cancer models. Nucleic Acids Res 47, D923-D929 (2019).
34. Tuveson, D. & Clevers, H. Cancer modeling meets human organoid technology. Science 364, 952-955 (2019).
35. Day, C.P., Merlino, G. & Van Dyke, T. Preclinical mouse cancer models: a maze of opportunities and challenges. Cell 163, 39-53 (2015).
36. Guo, S. et al. Molecular Pathology of Patient Tumors, Patient-Derived Xenografts, and Cancer Cell Lines. Cancer Res 76, 4619-26 (2016).
37. Khaled, W.T. & Liu, P. Cancer mouse models: past, present and future. Semin Cell Dev Biol 27, 54-60 (2014).
38. Li, Q.X., Feuer, G., Ouyang, X. & An, X. Experimental animal modeling for immuno-oncology. Pharmacol Ther 173, 34-46 (2017).
39. Chao, C. et al. Patient-derived Xenografts from Colorectal Carcinoma: A Temporal and Hierarchical Study of Murine Stromal Cell Replacement. Anticancer Res 37, 3405-3412 (2017).
40. Fasterius, E. & Al-Khalili Szigyarto, C. Analysis of public RNA-sequencing data reveals biological consequences of genetic heterogeneity in cell line populations. Sci Rep 8, 11226 (2018).
41. Ghandi, M. et al. Next-generation characterization of the Cancer Cell Line Encyclopedia. Nature 569, 503-508 (2019).
42. Vermeulen, S.J. et al. Did the four human cancer cell lines DLD-1, HCT-15, HCT-8, and HRT-18 originate from one and the same patient? Cancer Genet Cytogenet 107, 76-9 (1998).
43. Rebouissou, S., Zucman-Rossi, J., Moreau, R., Qiu, Z. & Hui, L. Note of caution: Contaminations of hepatocellular cell lines. J Hepatol 67, 896-897 (2017).
44. Barretina, J. et al. The Cancer Cell Line Encyclopedia enables predictive modelling of anticancer drug sensitivity. Nature 483, 603-7 (2012).
45. Bairoch, A. The Cellosaurus, a Cell-Line Knowledge Resource. J Biomol Tech 29, 25-38 (2018).
46. Molla Kazemiha, V. et al. PCR-based detection and eradication of mycoplasmal infections from various mammalian cell lines: a local experience. Cytotechnology 61, 117-24 (2009).
47. International HapMap, C. The International HapMap Project. Nature 426, 789-96 (2003).
48. Raj, A., Stephens, M. & Pritchard, J.K. fastSTRUCTURE: variational inference of population structure in large SNP data sets. Genetics 197, 573-89 (2014).
49. Masters, J.R. et al. Short tandem repeat profiling provides an international reference standard for human cell lines. Proc Natl Acad Sci U S A 98, 8012-7 (2001).
50. Hideyuki Tanabe, Y.T., Daisuke Minegishi, Miharu Kurematsu, Tohru Masui, Hiroshi Mizusawa. Cell line individualization by STR multiplex system in the cell bank found cross-contamination between ECV304 and EJ-1/T24. Tiss. Cult. Res. Commun. 18, 329-338 (1999).
51. Team, R.C. R: A language and environment for statistical computing. 3.5.3 edn (R Foundation for Statistical Computing, Vienna, Austria., 2018).
52. Dobin, A. et al. STAR: ultrafast universal RNA-seq aligner. Bioinformatics 29, 15-21 (2013).
53. Li, H. & Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25, 1754-60 (2009).
Figure 2022524208000011
Figure 2022524208000012
Figure 2022524208000013
Figure 2022524208000014
Figure 2022524208000015
Figure 2022524208000016
Figure 2022524208000017
Figure 2022524208000018
Figure 2022524208000019
Figure 2022524208000020
Figure 2022524208000021
Figure 2022524208000022
Figure 2022524208000023
Figure 2022524208000024
Figure 2022524208000025
Figure 2022524208000026
Figure 2022524208000027
Figure 2022524208000028
Figure 2022524208000029
Figure 2022524208000030
Figure 2022524208000031
Figure 2022524208000032
Figure 2022524208000033

Claims (22)

  1. 試料を認証するための方法であって、
    前記試料から核酸を得ること;
    表1に示される群から選択される50個以上のヒト単一ヌクレオチド多型(SNP)遺伝子座または表2に示される群から選択される50個以上のマウスSNP遺伝子座において、前記試料の遺伝子型を検出すること;
    前記試料の遺伝子型を参照遺伝子型と比較すること;および
    前記試料の認証を決定すること
    を含む、方法。
  2. 前記試料が、細胞、組織、オルガノイド、またはそれらの組合せである、請求項1に記載の方法。
  3. 前記試料が、細胞株または腫瘍組織である、請求項2に記載の方法。
  4. 前記試料が夾雑物を含み、前記方法が、前記試料中の夾雑物のパーセンテージを決定することをさらに含む、請求項1に記載の方法。
  5. ヒト試料が夾雑物を含み、前記方法が、夾雑物の正体を決定することをさらに含む、請求項1に記載の方法。
  6. 検出するステップが、次世代シークエンシング(NGS)を使用する、請求項1に記載の方法。
  7. 前記核酸がバーコード化される、請求項1に記載の方法。
  8. 表3に示される群から選択される性染色体SNPを検出することによって、前記試料を得た対象の性別を同定することをさらに含む、請求項1に記載の方法。
  9. 前記試料を得た対象の民族性を同定することをさらに含む、請求項1に記載の方法。
  10. 前記試料中のウイルスまたはマイコプラズマの存在を検出することをさらに含む、請求項1に記載の方法。
  11. 前記試料が、4T1、A20、B16-BL6、B16-F0、B16-F1、B16-F10、C1498、Colon26、CT26WT、E.G7-Ova、EL4、EMT6、H22、Hepa1-6、J558、J774A1、JC、KLN205、L1210、L5178-R、LLC、MBT2、MC38、MPC-11、Neuro-2a、P388D1、P815、Pan02、Renca、RM1、S91およびWEHI164からなる群から選択されるマウス腫瘍モデルである、請求項1に記載の方法。
  12. ヒト構成成分およびマウス構成成分を含む試料を認証する方法であって、
    前記試料から核酸を得ること;
    100個よりも多くのマウスゲノム遺伝子座において、前記試料の遺伝子型を検出すること、ここで、前記マウスゲノム遺伝子座の各々が、対応する相同なヒトゲノム遺伝子座を有し、マウスゲノム遺伝子座の各々および対応する相同なヒトゲノム遺伝子座が、同一な隣接配列を有する;ならびに
    前記遺伝子型に基づいて、前記試料中のマウス構成成分の比率を決定すること
    を含む、方法。
  13. 前記マウスゲノム遺伝子座が、表6から選択される、請求項12に記載の方法。
  14. 検出するステップが、NGSを使用する、請求項12に記載の方法。
  15. 試料を認証するためのキットであって、
    試料中の、表1に示される群から選択される少なくとも50個のヒトSNPまたは表2に示される群から選択される少なくとも50個のマウスSNPを検出するためのプライマー;および
    ヒトまたはマウスSNPを含有するDNA断片を、前記プライマーを使用して増幅するための薬剤
    を含む、キット。
  16. 表3に示される群から選択される性染色体SNPを検出するためのプライマーをさらに含む、請求項15に記載のキット。
  17. 前記試料中のウイルス感染またはマイコプラズマ夾雑を検出するためのプライマーをさらに含む、請求項16に記載のキット。
  18. ヒトまたはマウス試料を同定するためのマイクロアレイであって、
    試料中の、表1に示される群から選択される少なくとも50個のヒトSNPまたは表2に示される群から選択される少なくとも50個のマウスSNPを検出するためのプローブを含む、マイクロアレイ。
  19. 指示が記憶された非一過性のコンピュータ可読媒体であって、前記指示がプロセッサによって実行されるとき、前記指示がプロセッサに、
    表1に示される群から選択される50個以上のヒトSNP遺伝子座または表2に示される群から選択される50個以上のマウスSNP遺伝子座における、試料の遺伝子型の検索;
    前記試料の遺伝子型の、参照遺伝子型との比較;および
    前記試料の認証の決定
    を行わせる、コンピュータ可読媒体。
  20. 主要構成成分および微量構成成分を含む試料を認証するための方法であって、
    100個よりも多くのSNP遺伝子座において、前記試料の遺伝子型を検出すること;
    表11に示される式に従って、SNP遺伝子座の各々についてSNP不均一性比率を決定すること;
    遺伝子型をモデル化する混合ガウスを使用して、SNP遺伝子座についてのSNP不均一性比率に基づいて試料不均一性比率を決定すること;および
    前記試料の遺伝子型を、参照試料において各々検出された一群の参照遺伝子型と比較すること、
    前記試料の遺伝子型に対して最も高い同一性を有する参照遺伝子型を有する参照試料を同定すること、
    参照遺伝子型が前記試料の遺伝子型に対して90%よりも高く同一であり、かつ試料不均一性比率が10%未満であるときに、または、参照遺伝子型が前記試料の遺伝子型に対して80%よりも高く同一であり、かつ試料不均一性比率が10%よりも高いときに、主要構成成分が参照試料であることを決定すること
    によって、前記試料の主要構成成分を決定すること
    を含む、方法。
  21. 前記試料の微量構成成分を決定することをさらに含む、請求項20に記載の方法。
  22. 前記試料中の主要構成成分および微量構成成分のパーセンテージを決定することをさらに含む、請求項21に記載の方法。
JP2021555073A 2019-03-12 2020-03-12 腫瘍モデルの同定のための方法および組成物 Pending JP2022524208A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2019077750 2019-03-12
CNPCT/CN2019/077750 2019-03-12
PCT/CN2020/079067 WO2020182193A1 (en) 2019-03-12 2020-03-12 Methods and compositions for identification of tumor models

Publications (1)

Publication Number Publication Date
JP2022524208A true JP2022524208A (ja) 2022-04-28

Family

ID=72426334

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021555073A Pending JP2022524208A (ja) 2019-03-12 2020-03-12 腫瘍モデルの同定のための方法および組成物

Country Status (5)

Country Link
US (1) US11739387B2 (ja)
EP (1) EP3938536A4 (ja)
JP (1) JP2022524208A (ja)
CN (1) CN113614246A (ja)
WO (1) WO2020182193A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10908066B2 (en) 2010-11-16 2021-02-02 1087 Systems, Inc. Use of vibrational spectroscopy for microfluidic liquid measurement
US8961904B2 (en) 2013-07-16 2015-02-24 Premium Genetics (Uk) Ltd. Microfluidic chip
US11796449B2 (en) 2013-10-30 2023-10-24 Abs Global, Inc. Microfluidic system and method with focused energy apparatus
EP4245140A3 (en) 2019-04-18 2024-01-17 ABS Global, Inc. System and process for continuous addition of cryoprotectant
US11628439B2 (en) 2020-01-13 2023-04-18 Abs Global, Inc. Single-sheath microfluidic chip
AU2021365488A1 (en) * 2020-10-21 2023-06-01 Abs Global, Inc. Methods and systems for processing genetic samples to determine identity or detect contamination
CN112522380A (zh) * 2020-11-19 2021-03-19 赣南医学院第一附属医院 一种基于高通量测序技术检测马凡及其类综合征相关突变基因的方法
CN114464246B (zh) * 2022-01-19 2023-05-30 华中科技大学同济医学院附属协和医院 基于CovMutt框架检测与遗传性增加相关的突变的方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8927213B2 (en) * 2004-12-23 2015-01-06 Greg Hampikian Reference markers for biological samples
ES2682466T3 (es) * 2004-06-04 2018-09-20 Biotheranostics, Inc. Identificación de tumores
US9556482B2 (en) * 2013-07-03 2017-01-31 The United States Of America, As Represented By The Secretary Of Commerce Mouse cell line authentication
US20180142303A1 (en) * 2015-05-19 2018-05-24 The Wistar Institute Of Anatomy And Biology Methods and compositions for diagnosing or detecting lung cancers
CN108647495B (zh) * 2018-05-21 2020-04-10 广州金域医学检验中心有限公司 身份关系鉴定方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2020182193A1 (en) 2020-09-17
US11739387B2 (en) 2023-08-29
EP3938536A1 (en) 2022-01-19
US20210277486A1 (en) 2021-09-09
CN113614246A (zh) 2021-11-05
EP3938536A4 (en) 2023-03-08

Similar Documents

Publication Publication Date Title
JP2022524208A (ja) 腫瘍モデルの同定のための方法および組成物
US11111545B2 (en) Methods for simultaneous amplification of target loci
US20210189498A1 (en) Methods for simultaneous amplification of target loci
US11939634B2 (en) Methods for simultaneous amplification of target loci
US20200157629A1 (en) Methods for simultaneous amplification of target loci
US20210054457A1 (en) Autism associated genetic markers
JP6328934B2 (ja) 非侵襲性出生前親子鑑定法
CN103608818B (zh) 非侵入性产前倍性识别装置
US20190338350A1 (en) Method, device and kit for detecting fetal genetic mutation
US20220411875A1 (en) Methods for simultaneous amplification of target loci
US20220356526A1 (en) Methods for simultaneous amplification of target loci
WO2012173809A2 (en) Method of identifying de novo copy number variants (cnv) using mz twins discordant for attention problems/disorders
US20240158855A1 (en) Methods for simultaneous amplification of target loci
Sheng METHODS AND COMPOSITIONS FOR IDENTIFICATION OF TUMOR MODELS-Patent Information

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240305