JP2022509535A - Cell-free RNA library preparation - Google Patents

Cell-free RNA library preparation Download PDF

Info

Publication number
JP2022509535A
JP2022509535A JP2021548558A JP2021548558A JP2022509535A JP 2022509535 A JP2022509535 A JP 2022509535A JP 2021548558 A JP2021548558 A JP 2021548558A JP 2021548558 A JP2021548558 A JP 2021548558A JP 2022509535 A JP2022509535 A JP 2022509535A
Authority
JP
Japan
Prior art keywords
rna
cdna
biological sample
mrna
blood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021548558A
Other languages
Japanese (ja)
Inventor
ニーラジ サラティア,
マイケル ネレンバーグ,
アルカイツ イバラ,
ジアリー ジュアン,
Original Assignee
モレキュラー ステソスコープ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by モレキュラー ステソスコープ, インコーポレイテッド filed Critical モレキュラー ステソスコープ, インコーポレイテッド
Publication of JP2022509535A publication Critical patent/JP2022509535A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1003Extracting or separating nucleic acids from biological samples, e.g. pure separation or isolation methods; Conditions, buffers or apparatuses therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/10Libraries containing peptides or polypeptides, or derivatives thereof

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Immunology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Figure 2022509535000001

無細胞mRNAに由来する多様なcDNAライブラリーおよびそれを調製する方法が提供される。ライブラリーは、RNAを血清または血漿などの体液から抽出すること、RNAを夾雑物から分離すること、cDNAを逆転写酵素によって合成すること、およびタンパク質コードヌクレオチド配列を濃縮することにより、調製され得る。ライブラリーは、固体組織からの非常に多数の転写物を含み得る。cf-RNAをqPCR、シークエンシングまたは他の好適な方法により測定することができる。

Figure 2022509535000001

A variety of cDNA libraries derived from cell-free mRNA and methods for preparing them are provided. Libraries can be prepared by extracting RNA from body fluids such as serum or plasma, separating RNA from contaminants, synthesizing cDNA by reverse transcriptase, and concentrating protein-encoding nucleotide sequences. .. The library can contain a large number of transcripts from solid tissue. cf-RNA can be measured by qPCR, sequencing or other suitable method.

Description

相互参照
本出願は、2018年10月30日に出願した米国仮出願第62/752,533号の利益を主張するものであり、前記仮出願は全体が参照により本明細書に組み込まれる。
Cross-reference This application claims the benefit of US Provisional Application No. 62 / 752,533 filed October 30, 2018, which provisional application is incorporated herein by reference in its entirety.

様々なマーカーを様々な状態の検出に利用することができる。しかし、これらの状態の多くは、異なる組織を冒し得るものである。循環において、例えば血液試料において、これらの状態のマーカーを検出することが、どの組織が罹患しているのかを同定する際に常に役立つとは限らない。例えば、炎症の遺伝子マーカーは、体内のどこかでの炎症反応を示すことができるが、肝臓、腎臓、肺または関節などの、どの組織がその反応を起こしているのかは分からないことがある。生検などの組織特異的試験は、多くの場合、侵襲的であり、したがって、感染症のリスクを伴い、概して臓器または組織全体を網羅しない。MRIおよびCTスキャンなどのイメージング技術は、組織の健康を評価するために使用されることがあるが、一般に、明白な特徴および変化しか検出することができない。したがって、これらのイメージング技術には、状態の早期開始または状態のごく最近の発生を捕捉できるほどの感度が一般にない。 Various markers can be used to detect various conditions. However, many of these conditions can affect different tissues. Detecting markers of these conditions in the circulation, for example in blood samples, is not always helpful in identifying which tissue is affected. For example, a genetic marker of inflammation can indicate an inflammatory response somewhere in the body, but it may not be known which tissue is causing the response, such as the liver, kidneys, lungs or joints. Tissue-specific tests, such as biopsies, are often invasive and therefore carry the risk of infection and generally do not cover the entire organ or tissue. Imaging techniques such as MRI and CT scans may be used to assess tissue health, but generally only obvious features and changes can be detected. Therefore, these imaging techniques are generally not sensitive enough to capture the early start of a condition or the most recent occurrence of a condition.

参照による組み込み
本明細書で言及される全ての公表文献、特許および特許出願は、個々の公表文献、特許または特許出願各々が参照により組み込まれると具体的かつ個別に示されている場合と同程度に、参照により本明細書に組み込まれる。
Incorporation by Reference All published documents, patents and patent applications referred to herein are to the same extent as if each individual published document, patent or patent application is specifically and individually indicated to be incorporated by reference. Incorporated herein by reference.

無細胞mRNAは、様々な組織および臓器の健康、表現型および発生プログラムへの潜在的ウインドウを提供する。本開示は、非血液遺伝子が濃縮された多様な無細胞mRNAライブラリーおよびそれらを調製する方法を提供する。 Cell-free mRNA provides a potential window to the health, phenotype and developmental programs of various tissues and organs. The present disclosure provides a diverse cell-free mRNA library enriched with non-blood genes and methods for preparing them.

一態様では、cf-RNA試料を調製する方法であって、(a)生体試料を1,600g~16,000gで遠心分離するステップ、および(b)RNAを生体試料から単離するステップを含み、表1のリストから選択される少なくとも50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400もしくは1500の非血液遺伝子または表10から選択される低ストリンジェンシー非血液遺伝子がcf-RNA試料中に存在する、方法が、本明細書で提供される。生体試料は、無細胞生体試料であり得、血清、血漿、唾液、尿、間質液、脳脊髄液、精液、膣液、羊水、涙、滑液、粘液またはリンパ液であり得る。ある特定の実施形態では、生体試料は、血清または血漿である。 In one aspect, a method of preparing a cf-RNA sample comprising (a) centrifuging the biological sample at 1,600 g to 16,000 g and (b) isolating the RNA from the biological sample. , At least 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 or 1500 selected from the list in Table 1 or selected from Table 10. A method is provided herein in which a low stringency non-blood gene is present in a cf-RNA sample. The biological sample can be a cell-free biological sample and can be serum, plasma, saliva, urine, interstitial fluid, cerebrospinal fluid, semen, vaginal fluid, amniotic fluid, tears, synovial fluid, mucus or lymph. In certain embodiments, the biological sample is serum or plasma.

cf-RNA試料を調製する方法は、RNAを生体試料から単離する前に、生体試料においてサイズ選択または免疫選択を実行するステップを含み得る。一部の実施形態では、サイズ選択を実行するステップは、生体試料の遠心分離を含む。遠心分離は、少なくとも1分間、少なくとも10分間、5分~20分間、10分~15分間、または約10分間実行され得る。一部の実施形態では、生体試料は、10,000g~15,000gで遠心分離される。一部の実施形態では、生体試料は、約12,000gで遠心分離される。一部の実施形態では、サイズ選択を実行するステップは、試料を濾過することを含む。 The method of preparing a cf-RNA sample may include performing size selection or immunoselection on the biological sample prior to isolating the RNA from the biological sample. In some embodiments, the step of performing the size selection comprises centrifuging the biological sample. Centrifugation can be performed for at least 1 minute, at least 10 minutes, 5 minutes to 20 minutes, 10 minutes to 15 minutes, or about 10 minutes. In some embodiments, the biological sample is centrifuged at 10,000 g to 15,000 g. In some embodiments, the biological sample is centrifuged at about 12,000 g. In some embodiments, the step of performing size selection involves filtering the sample.

一部の実施形態では、生体試料からRNAを単離するステップは、エキソソームであり得る細胞外小胞を生体試料から単離すること、およびRNAを細胞外小胞から単離することを含む。一部の実施形態では、生体試料からRNAを単離するステップは、ヌクレオプロテイン複合体を生体試料から単離すること、およびRNAをヌクレオプロテイン複合体から単離することを含む。 In some embodiments, the step of isolating RNA from a biological sample comprises isolating the extracellular vesicles, which may be exosomes, from the biological sample, and isolating the RNA from the extracellular vesicles. In some embodiments, the step of isolating RNA from a biological sample comprises isolating the nucleoprotein complex from the biological sample and isolating the RNA from the nucleoprotein complex.

cf-RNA試料を調製する方法は、RNAをデオキシリボヌクレアーゼで処理するステップをさらに含み得る。一部の態様では、デオキシリボヌクレアーゼは、TurboDNase Iである。一部の実施形態では、RNAは、溶液中のデオキシリボヌクレアーゼで処理される。 The method of preparing a cf-RNA sample may further include treating the RNA with a deoxyribonuclease. In some embodiments, the deoxyribonuclease is TurboDNase I. In some embodiments, the RNA is treated with a deoxyribonuclease in solution.

一部の実施形態では、RNAを生体試料から単離するステップは、RNAを親和性カラム、脱塩カラム、またはシリカ膜のうちの少なくとも1つと接触させることを含む。さらなる実施形態では、RNAを親和性カラム、脱塩カラム、およびシリカ膜と接触させる。 In some embodiments, the step of isolating RNA from a biological sample comprises contacting RNA with at least one of an affinity column, a desalting column, or a silica membrane. In a further embodiment, the RNA is contacted with an affinity column, a desalting column, and a silica membrane.

一部の実施形態では、cf-RNA試料を調製する方法は、少なくとも1つのタンパク質コードヌクレオチド配列を濃縮するステップをさらに含む。他の実施形態では、cf-RNA試料を調製する方法は、リボソームRNA配列をRNAから枯渇させるステップを含む。 In some embodiments, the method of preparing a cf-RNA sample further comprises the step of enriching at least one protein-encoding nucleotide sequence. In another embodiment, the method of preparing a cf-RNA sample comprises depleting the ribosomal RNA sequence from RNA.

別の態様では、cf-RNA分子を同定する方法であって、(a)RNAを生体試料から単離するステップ、(b)cDNAライブラリーをRNAから調製するステップ、(c)cDNAライブラリーをシークエンシングするステップ、および(d)cDNAライブラリー中の少なくとも1つの遺伝子を同定するステップを含み、生体試料が実質的に無細胞であり、表1のリストから選択される少なくとも50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400もしくは1500の非血液遺伝子または表10から選択される低ストリンジェンシー非血液遺伝子が検出される、方法が、本明細書で提供される。一部の実施形態では、cf-RNA分子を同定する方法は、cDNAライブラリーからの配列を参照ゲノムとアラインメントするステップをさらに含む。 In another embodiment, a method for identifying a cf-RNA molecule, wherein (a) an RNA is isolated from a biological sample, (b) a cDNA library is prepared from the RNA, and (c) a cDNA library is prepared. At least 50, 100, 200 selected from the list in Table 1 in which the biological sample is substantially cell-free and comprises the steps of sequencing and (d) identifying at least one gene in the cDNA library. , 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 or 1500 non-blood genes or low stringency non-blood genes selected from Table 10 are detected. , Provided herein. In some embodiments, the method of identifying a cf-RNA molecule further comprises aligning a sequence from a cDNA library with the reference genome.

cf-RNA分子を同定するこの方法では、一部の態様では、生体試料は無細胞である。一部の実施形態では、生体試料は、血清、血漿、唾液、尿、間質液、脳脊髄液、精液、膣液、羊水、涙、滑液、粘液またはリンパ液である。他の実施形態では、生体試料は、血清または血漿である。 In this method of identifying cf-RNA molecules, in some embodiments, the biological sample is cell-free. In some embodiments, the biological sample is serum, plasma, saliva, urine, interstitial fluid, cerebrospinal fluid, semen, vaginal fluid, amniotic fluid, tears, synovial fluid, mucus or lymph. In other embodiments, the biological sample is serum or plasma.

一部の実施形態では、cf-mRNA分子を同定する方法は、表2から選択される少なくとも1、5、10、20、50、100、200、300、400もしくは500の組織特異的遺伝子、表6から選択される少なくとも1、5、10、20、50、100もしくは150の脳特異的遺伝子、表7から選択される少なくとも1、5、10、20もしくは50の肝臓特異的遺伝子、または表8からの肝臓診断用遺伝子、またはこれらの任意の組合せを同定する。 In some embodiments, the method for identifying the cf-mRNA molecule is at least 1, 5, 10, 20, 50, 100, 200, 300, 400 or 500 tissue-specific genes selected from Table 2, Table. At least 1, 5, 10, 20, 50, 100 or 150 brain-specific genes selected from 6, liver-specific genes at least 1, 5, 10, 20 or 50 selected from Table 7, or Table 8 Identifies genes for liver diagnosis from, or any combination thereof.

一部の態様では、本明細書で提供されるcf-RNA分子を同定する方法は、第1の遺伝子を同定するステップを含み、RNAは、第1の遺伝子とアラインメントされる500、200、150、100、50、25または15未満のcf-mRNAポリヌクレオチドを含む。 In some embodiments, the method of identifying a cf-RNA molecule provided herein comprises the step of identifying a first gene, where the RNA is aligned with the first gene 500, 200, 150. , 100, 50, 25 or less than 15 cf-mRNA polynucleotides.

cf-mRNA分子を同定する方法の一部の実施形態では、100リード当たり少なくとも2、4、6、8または10のユニーク断片が検出される。一部の実施形態では、10,000リード当たり少なくとも2、4、6、8または10のタンパク質コード遺伝子が検出される。 In some embodiments of the method of identifying cf-mRNA molecules, at least 2, 4, 6, 8 or 10 unique fragments are detected per 100 reads. In some embodiments, at least 2, 4, 6, 8 or 10 protein-encoding genes are detected per 10,000 reads.

一部の実施形態では、cf-mRNA分子を同定する方法は、RNAを生体試料から単離する前に、生体試料においてサイズ選択または免疫選択を実行するステップをさらに含む。一部の態様では、サイズ選択は、生体試料の遠心分離を含む。生体試料は、1,600g~16,000gで遠心分離され得、少なくとも1分間、少なくとも5分間、少なくとも10分間、5分~20分間、10分~15分間、または約10分間、遠心分離され得る。一部の実施形態では、生体試料は、10,000g~15,000gで、または約12,000gで遠心分離される。他の実施形態では、サイズ選択を実行するステップは、試料を濾過することを含む。 In some embodiments, the method of identifying a cf-mRNA molecule further comprises performing size selection or immunoselection on the biological sample prior to isolating the RNA from the biological sample. In some embodiments, the size selection comprises centrifuging the biological sample. The biological sample can be centrifuged at 1,600 g to 16,000 g and centrifuged for at least 1 minute, at least 5 minutes, at least 10 minutes, 5 minutes to 20 minutes, 10 minutes to 15 minutes, or about 10 minutes. .. In some embodiments, the biological sample is centrifuged at 10,000 g to 15,000 g, or about 12,000 g. In another embodiment, the step of performing size selection involves filtering the sample.

本明細書で提供されるcf-RNA分子を同定する方法の一部の実施形態では、RNAを生体分子から単離するステップは、細胞外小胞を生体試料から単離すること、およびRNAを細胞外小胞から単離することを含む。一部の実施形態では、細胞外小胞は、エキソソームである。 In some embodiments of the method of identifying cf-RNA molecules provided herein, the step of isolating RNA from a biomolecule is to isolate extracellular vesicles from a biological sample, and to isolate RNA. Includes isolation from extracellular vesicles. In some embodiments, the extracellular vesicles are exosomes.

一部の実施形態では、RNAを生体試料から単離するステップは、ヌクレオプロテイン複合体を生体試料から単離すること、およびRNAをヌクレオプロテイン複合体から単離することを含む。一部の実施形態では、cf-RNA分子を同定する方法は、第1のヌクレオチド配列を含む外因性RNAポリヌクレオチドを生体試料に添加するステップ、および第1のヌクレオチド配列を含むcDNAポリヌクレオチドを検出するステップをさらに含み、cDNAポリヌクレオチドの第1のヌクレオチド配列は、RNAポリヌクレオチドの第1のヌクレオチド配列がウラシルを含む各位置にチミンを含む。 In some embodiments, the step of isolating RNA from a biological sample comprises isolating the nucleoprotein complex from the biological sample and isolating the RNA from the nucleoprotein complex. In some embodiments, the method of identifying a cf-RNA molecule is to add an extrinsic RNA polynucleotide containing a first nucleotide sequence to a biological sample, and to detect a cDNA polynucleotide containing a first nucleotide sequence. The first nucleotide sequence of the cDNA polynucleotide comprises timine at each position where the first nucleotide sequence of the RNA polynucleotide contains uracil.

一部の実施形態では、cf-RNA分子を同定する方法は、RNAをデオキシリボヌクレアーゼで処理するステップをさらに含む。一部の実施形態では、デオキシリボヌクレアーゼは、TurboDNase Iである。一部の実施形態では、RNAは、デオキシリボヌクレアーゼで処理されるとき溶液中にある。 In some embodiments, the method of identifying a cf-RNA molecule further comprises treating the RNA with a deoxyribonuclease. In some embodiments, the deoxyribonuclease is TurboDNase I. In some embodiments, the RNA is in solution when treated with a deoxyribonuclease.

一部の実施形態では、RNAを生体試料から単離するステップは、RNAを親和性カラム、脱塩カラム、またはシリカ膜のうちの少なくとも1つと接触させることを含む。さらなる実施形態では、RNAを親和性カラム、脱塩カラム、およびシリカ膜と接触させる。 In some embodiments, the step of isolating RNA from a biological sample comprises contacting RNA with at least one of an affinity column, a desalting column, or a silica membrane. In a further embodiment, the RNA is contacted with an affinity column, a desalting column, and a silica membrane.

一部の態様では、ランダムヘキサヌクレオチドであり得るランダム配列を含むRNAからcDNAライブラリーを調製すること。一部の実施形態では、ランダムヘキサヌクレオチドの濃度は、少なくとも60μM、70μM、80μM、90μM、100μM、150μM、200μM、300μM、400μM、500μM、600μM、700μM、800μM、900μM、1000μM、1100μM、1200μM、1300μM、1400μM、または1500μMである。 In some embodiments, preparing a cDNA library from RNA containing a random sequence that can be a random hexanucleotide. In some embodiments, the concentration of random hexanucleotides is at least 60 μM, 70 μM, 80 μM, 90 μM, 100 μM, 150 μM, 200 μM, 300 μM, 400 μM, 500 μM, 600 μM, 700 μM, 800 μM, 900 μM, 1000 μM, 1100 μM, 1200 μM, 1300 μM. It is 1400 μM, or 1500 μM.

一部の実施形態では、cf-mRNA分子を同定するRNAステップからcDNAライブラリーを調製することは、一本鎖cDNAを形成することを含む。一部の態様では、方法は、RNAを逆転写酵素と接触させて一本鎖cDNAを形成するステップをさらに含む。さらなる態様では、二本鎖cDNAが一本鎖cDNAから形成される。さらにさらなる態様では、一本鎖DNAをNEBNext DNAポリメラーゼと接触させて二本鎖cDNAを形成する。一部の実施形態では、方法は、ユニークデュアルインデックスを二本鎖cDNAの両末端にライゲーションさせるステップをさらに含む。 In some embodiments, preparing a cDNA library from an RNA step that identifies a cf-mRNA molecule comprises forming a single-stranded cDNA. In some embodiments, the method further comprises contacting the RNA with reverse transcriptase to form a single-stranded cDNA. In a further embodiment, the double-stranded cDNA is formed from the single-stranded cDNA. In yet a further embodiment, the single-stranded DNA is contacted with the NEBNext DNA polymerase to form the double-stranded cDNA. In some embodiments, the method further comprises ligating the unique dual index to both ends of the double-stranded cDNA.

一部の実施形態では、cf-RNA分子を同定する方法は、少なくとも1つのタンパク質コードヌクレオチド配列を濃縮するステップをさらに含む。濃縮は、一部の実施形態ではリボソームRNA配列をRNAから枯渇させること、および一部の実施形態ではリボソームRNA配列をcDNAライブラリーから枯渇させることを含む。一部の実施形態では、少なくとも1つのタンパク質コードヌクレオチド配列を濃縮するステップは、少なくとも1つのタンパク質コード配列をRNAからまたはcDNAから単離することを含む。一部の実施形態では、少なくとも1つのタンパク質コードヌクレオチド配列を濃縮するステップは、全エクソームベイトをcDNAにハイブリダイズさせることを含む。全エクソームベイトは、RNAポリヌクレオチドまたはDNAポリヌクレオチドであり得る。 In some embodiments, the method of identifying a cf-RNA molecule further comprises the step of enriching at least one protein-encoding nucleotide sequence. Concentration comprises depleting the ribosomal RNA sequence from RNA in some embodiments and depleting the ribosomal RNA sequence from the cDNA library in some embodiments. In some embodiments, the step of enriching at least one protein-encoding nucleotide sequence comprises isolating at least one protein-encoding sequence from RNA or cDNA. In some embodiments, the step of enriching at least one protein-encoding nucleotide sequence comprises hybridizing the entire exome bait to the cDNA. The whole exome bait can be an RNA polynucleotide or a DNA polynucleotide.

本明細書で提供される本開示の他の態様は、表1のリストから選択される少なくとも50、100、200、300、400、500、600、700、800、900もしくは1000の非血液遺伝子または表10から選択される低ストリンジェンシー非血液遺伝子;1,000,000 cDNAポリヌクレオチド当たり、表1のリストから選択される少なくとも1、10、20、50、100、200、300、400、500、600、700、800、900もしくは1000の非血液遺伝子または表10から選択される低ストリンジェンシー非血液遺伝子;表2から選択される少なくとも5、10、20、50、100、200、300、400または500の組織特異的遺伝子;表6から選択される少なくとも1、5、10、20、50または100の脳特異的遺伝子;あるいは表7から選択される少なくとも1、5、10、20もしくは50の肝臓特異的遺伝子、から生じるcDNA分子を含むcf-mRNAシークエンシングライブラリーである。 Other aspects of the disclosure provided herein are at least 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 non-blood genes selected from the list in Table 1. Low stringency non-blood genes selected from Table 10; at least 1, 10, 20, 50, 100, 200, 300, 400, 500, selected from the list in Table 1 per 1,000,000 cDNA polynucleotides. 600, 700, 800, 900 or 1000 non-blood genes or low stringency non-blood genes selected from Table 10; at least 5, 10, 20, 50, 100, 200, 300, 400 or selected from Table 2. 500 tissue-specific genes; at least 1, 5, 10, 20, 50 or 100 brain-specific genes selected from Table 6; or at least 1, 5, 10, 20 or 50 livers selected from Table 7. A cf-mRNA sequencing library containing cDNA molecules resulting from a specific gene.

本開示のさらに別の態様は、少なくとも2000、3000、4000、5000または6000のタンパク質コード遺伝子から生じるcDNAポリヌクレオチドを含むcf-mRNAシークエンシングライブラリーであって、タンパク質コード遺伝子の少なくとも8%、15%または24%が非血液遺伝子である、cf-mRNAシークエンシングライブラリーである。 Yet another aspect of the present disclosure is a cf-mRNA sequencing library containing cDNA polynucleotides resulting from at least 2000, 3000, 4000, 5000 or 6000 protein coding genes, at least 8%, 15 of the protein coding genes. % Or 24% is a non-blood gene, cf-mRNA sequencing library.

本開示の新規特徴は、添付の特許請求の範囲において具体的に示される。本開示の原理が利用される例示的実施形態を示す後続の詳細な説明、および添付の図面を参照することにより、本開示の特徴および利点のよりよい理解が得られるであろう。 The novel features of the present disclosure are specifically demonstrated in the appended claims. Subsequent detailed description showing exemplary embodiments in which the principles of the present disclosure are utilized, as well as the accompanying drawings, will provide a better understanding of the features and advantages of the present disclosure.

図1は、本開示の一部の実施形態によるcf-mRNA解析方法のフローチャートを示す。FIG. 1 shows a flowchart of a cf-mRNA analysis method according to some embodiments of the present disclosure.

図2A~2Eは、1,900g~16,000gの範囲の力での血漿の遠心分離、または0.2um~0.8umの範囲の細孔径を有する膜による血漿の濾過が、赤血球(図2A)、血小板(図2B)、好中球(図2C)、肝臓(図2D)および脳(図2E)に由来するcf-mRNA転写物を枯渇させることを示す、グラフである。2A-2E show plasma centrifugation with a force in the range of 1,900 g to 16,000 g, or filtration of plasma with a membrane having a pore size in the range of 0.2 um to 0.8 um for erythrocytes (FIG. 2A). ), Platelets (FIG. 2B), neutrophils (FIG. 2C), liver (FIG. 2D) and brain (FIG. 2E) depleting cf-mRNA transcripts. 同上。Same as above. 同上。Same as above. 同上。Same as above. 同上。Same as above.

図3A~3Bは、遠心力の増大に伴う非血液cf-mRNA転写物の濃縮を示すグラフである。血液転写物は、非血液転写物より遅い速度で枯渇される。図3Aは、血液および非血液転写物のコピー数を示す。転写物の数を1900g回転の1.0に正規化した。図3Bは、100万当たりの血液および非血液転写物の正規化された数を示す。群ごとに、100万当たりの転写物の最高数を1.0に正規化した。3A-3B are graphs showing enrichment of non-blood cf-mRNA transcripts with increasing centrifugal force. Blood transcripts are depleted at a slower rate than non-blood transcripts. FIG. 3A shows the number of copies of blood and non-blood transcripts. The number of transcripts was normalized to 1.0 at 1900 g rotation. FIG. 3B shows the normalized number of blood and non-blood transcripts per million. For each group, the maximum number of transcripts per million was normalized to 1.0. 同上。Same as above.

図4は、1,900g~16,000gの範囲の力での遠心分離後にcf-mRNA転写物から検出された非血液遺伝子の数を示すグラフである。FIG. 4 is a graph showing the number of non-blood genes detected in the cf-mRNA transcript after centrifugation with a force ranging from 1,900 g to 16,000 g.

図5は、βアクチンcf-mRNAのqPCRにより決定した3つのRNA抽出キットについてのcf-RNA収量を示すグラフである。FIG. 5 is a graph showing cf-RNA yields for three RNA extraction kits determined by qPCR of β-actin cf-mRNA.

図6A~6Bは、バイオアナライザーでキャピラリー電気泳動により決定した、製造業者の標準核酸抽出プロトコール(図6B)と比較して最適化miRNA抽出プロトコール(図6A)を使用するQIAamp Circulating Nucleic Acid Kitでのより短いcf-RNAポリヌクレオチド断片の収量の向上を示すグラフである。FIGS. 6A-6B are on the QIAamp Cycleting Nucleic Acid Kit using an optimized miRNA extraction protocol (FIG. 6A) compared to the manufacturer's standard nucleic acid extraction protocol (FIG. 6B) determined by capillary electrophoresis on a bioanalyzer. FIG. 6 is a graph showing an increase in yield of shorter cf-RNA polynucleotide fragments. 同上。Same as above.

図7は、QIAamp ccfDNA/RNAキットと比較して最適化miRNA抽出プロトコールを使用するQIAamp Circulating Nucleic Acidキットでのcf-RNA収量の向上を示すグラフである。FIG. 7 is a graph showing the improvement in cf-RNA yield in the QIAamp Circulating Nucleic Acid kit using the optimized miRNA extraction protocol compared to the QIAamp cfDNA / RNA kit.

図8は、バイオアナライザーでキャピラリー電気泳動により決定して、溶液中でTurboDNase Iを用いる抽出c-RNAの処理が、DNAポリヌクレオチドでの微量の夾雑を排除したことを例証するグラフである。FIG. 8 is a graph illustrating that treatment of extracted c-RNA with TurboDNase I in solution, as determined by capillary electrophoresis on a bioanalyzer, eliminated trace impurities in DNA polynucleotides.

図9は、18S rRNAのqPCRにより決定して、試料からの阻害剤の除去が、cf-RNAの見かけの収量を増加させたことを示すグラフである。FIG. 9 is a graph showing that removal of the inhibitor from the sample increased the apparent yield of cf-RNA, as determined by qPCR of 18S rRNA.

図10A~10Bは、バイオアナライザーでキャピラリー電気泳動により決定して、OneStep PCR阻害剤除去カラム(現行脱塩カラム)が、他のカラムであるMicro-Bio-Spinカラム(脱塩カラム1)よりも少ないRNAを保持することを示すグラフである。10A-10B show that the OneStep PCR inhibitor removal column (current desalting column) is more than the other column, the Micro-Bio-Spin column (desalting column 1), as determined by capillary electrophoresis on a bioanalyzer. It is a graph which shows that it retains a small amount of RNA. 同上。Same as above.

図11は、古くからある方法(過去)と比較した実施例1に記載の方法(現行)でのcf-RNA抽出失敗の低減を示すグラフである。FIG. 11 is a graph showing the reduction of cf-RNA extraction failure in the method (current) described in Example 1 as compared with the old method (past).

図12は、βアクチンcf-mRNAのqPCRにより決定して、実施例1に記載の方法でのcf-RNAの回収が、線形であり、血漿投入量増加と一致し、それに伴って増加することを示すグラフである。FIG. 12 shows that the recovery of cf-RNA by the method described in Example 1 is linear and consistent with an increase in plasma input, as determined by qPCR of β-actin cf-mRNA. It is a graph which shows.

図13は、18S cDNAのqPCRにより決定した、異なる逆転写酵素でのRNA収量を定量するグラフである。FIG. 13 is a graph quantifying RNA yields with different reverse transcriptases as determined by qPCR of 18S cDNA.

図14は、18S cDNAのqPCRにより決定した、様々な量の投入cf-RNAからのRNAのcDNAへの変換を示すグラフである。FIG. 14 is a graph showing the conversion of RNA from various amounts of input cf-RNA to cDNA, as determined by qPCR of 18S cDNA.

図15A~15Bは、Accel-NGS 1S Plus(Swift 1)およびAccel-NGS 2S Plus(Swift 2)(図15A)ならびに標準および最適化Accel-NGS 2S Plusプロトコール(図15B)を使用して調製したcDNAライブラリーにおけるユニーク配列断片を示すグラフである。FIGS. 15A-15B were prepared using Accel-NGS 1S Plus (Swift 1) and Accel-NGS 2S Plus (Swift 2) (FIG. 15A) and standardized and optimized Accel-NGS 2S Plus protocols (FIG. 15B). It is a graph which shows the unique sequence fragment in a cDNA library. 同上。Same as above.

図16A~16Bは、標準インデックス(図16B)と比較して、ユニークデュアルインデックス(図16A)を使用して誤指定された配列を示すグラフである。16A-16B are graphs showing misdesignated sequences using the unique dual index (FIG. 16A) as compared to the standard index (FIG. 16B).

図17は、DNAシークエンシングにより決定して、全cf-RNA中(ver1)、rRNA枯渇cf-RNA中(Ver2)、およびmRNAの全エクソーム捕捉時(Ver3)の、RNA形態の存在量を示す。FIG. 17 shows the abundance of RNA morphology in total cf-RNA (ver1), in rRNA-depleted cf-RNA (Ver2), and during total exosomal capture of mRNA (Ver3), as determined by DNA sequencing. ..

図18A~18Cは、rRNA枯渇を伴うSMARTerキットと比較して実施例1に記載の方法(Swift 1S)を使用するcf-mRNAシークエンシングの感度を示すグラフである。ERCC標準物質についての検出感度(図18A)。検出された遺伝子の数(図18B)。ERCC標準物質についての検出感度の例示的決定(図18C)。ERCCは、4名の患者(Pt 7171、Pt,7131、Pt 7139およびPt 7155)からの試料にスパイクされた標準物質であった。18A-18C are graphs showing the sensitivity of cf-mRNA sequencing using the method described in Example 1 (Wift 1S) compared to the SMARTer kit with rRNA depletion. Detection sensitivity for ERCC standard material (FIG. 18A). Number of genes detected (Fig. 18B). Illustrative determination of detection sensitivity for ERCC standard material (FIG. 18C). ERCC was a standard material spiked into samples from 4 patients (Pt 7171, Pt, 7131, Pt 7139 and Pt 7155). 同上。Same as above.

図19A~19Eは、実施例1の方法により調製したcf-mRNAライブラリーとPanらにより記載されたcf-mRNAライブラリーとの比較を例証するグラフである:(図19A)シークエンシングリードの数、(図19B)検出されたユニーク断片の数、(図19C)検出されたタンパク質コード遺伝子の数、(図19D)カバレッジ>80%の遺伝子の数、および(図19E)検出された肝臓遺伝子の数。19A-19E are graphs illustrating a comparison between the cf-mRNA library prepared by the method of Example 1 and the cf-mRNA library described by Pan et al .: (FIG. 19A) Number of sequencing reads. , (FIG. 19B) the number of unique fragments detected, (FIG. 19C) the number of protein-encoding genes detected, (FIG. 19D) coverage> 80% of the genes, and (FIG. 19E) the number of detected liver genes. number. 同上。Same as above. 同上。Same as above.

事前遠心分離を利用してcf-mRNAシークエンシングデータから望ましくない「血液」転写物の夾雑を低減させることができる方法が、本明細書で提供される。本明細書における方法は、血液細胞RNA(「血液成分」)から生じるバックグラウンドノイズを低減させることができる。このようなノイズは、シークエンシング深度要件を増加させることおよび組織特異的cf-mRNAからのシグナルを弱めることがある。 Provided herein are methods that can utilize precentrifugation to reduce unwanted "blood" transcript contamination from cf-mRNA sequencing data. The methods herein can reduce background noise resulting from blood cell RNA (“blood components”). Such noise can increase sequencing depth requirements and weaken signals from tissue-specific cf-mRNA.

本明細書で開示されるプロトコール、方法およびキットは、1,500g~20,000g、1,900g~16,000g、4,000g~16,000g、8,000g~16,000、10,000g~14,000g、11,000g~13,000g、11,500g~12,500g、約12,000g、本質的に12,000g、実質的に12,000g、または約12,000gにわたる、これらより小さいまたは大きい範囲などの、広範な遠心力範囲と整合性があり得る。一部の範囲は、約12,000gに及ぶ。一部の範囲は、12,000gの100g以内である。一部の遠心分離プロトコールは、12,000gでの遠心分離などの、12,000gと大幅な差がない。一部の範囲は、16,000gの100g以内である。一部の遠心分離プロトコールは、16,000gでの遠心分離などの、16,000gと大幅な差がない。上に列挙した低い数字での始点または上に列挙した高い数字での終点を有する代替範囲も考えられる。このような遠心分離プロトコールは、処理用の抽出cf-RNA試料の多様性において2.5倍(例えば、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、40倍、または4.0倍より大きい)改善などの、改善に寄与し得る。 The protocols, methods and kits disclosed herein are 1,500 g to 20,000 g, 1,900 g to 16,000 g, 4,000 g to 16,000 g, 8,000 g to 16,000, 10,000 g and up. 14,000 g, 11,000 g to 13,000 g, 11,000 g to 12,500 g, about 12,000 g, essentially 12,000 g, substantially 12,000 g, or about 12,000 g, smaller or smaller than these It can be consistent with a wide range of centrifugal forces, such as a large range. Part of the range extends to about 12,000 g. Some ranges are within 100g of 12,000g. Some centrifuge protocols are not significantly different from 12,000 g, such as centrifugation at 12,000 g. Some ranges are within 100g of 16,000g. Some centrifuge protocols are not significantly different from 16,000 g, such as centrifugation at 16,000 g. Alternative ranges with low starting points listed above or high ending points listed above are also conceivable. Such a centrifuge protocol is 2.5 times (eg, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6) in the variety of extracted cf-RNA samples for processing. 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2 9.9, 3.0, 3.1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.7, 3.8, 3.9, 40 times, or 4.0 Can contribute to improvement, such as (greater than double) improvement.

遠心分離により加えられる重力による粒子の懸濁物中での分離速度は、粒径および密度に一般に依存する。粒子は、密度が高いほどまたはサイズが大きい粒子ほど一般に速い速度で移動し、ある時点で、より密度の低いまたはより小さい粒子から分離され得る。粒子をそれらのサイズに従って分離するための代替技術としては、ゲル濾過クロマトグラフィー、およびサイズ選択膜による濾過が挙げられるが、これらに限定されない。全てのそのような技術は、本開示の範囲内である。 The rate of separation of particles due to gravity applied by centrifugation in a suspension generally depends on the particle size and density. Particles that are denser or larger in size generally move at a faster rate and at some point can be separated from less dense or smaller particles. Alternative techniques for separating particles according to their size include, but are not limited to, gel filtration chromatography and filtration with size-selective membranes. All such techniques are within the scope of this disclosure.

一部の市販の抽出プロトコールは、高い試料抽出失敗率を示すことがあり、少ない量のcf-mRNAを抽出することがあり、下流のアッセイステップの性能が低下する原因となる多くの夾雑物を排除することができないことがある。そのようなキットおよびプロトコールは、より小さいcf-mRNA断片またはより大きいcf-mRNA断片のどちらかの亜集団しか抽出することができない。したがって、生体情報を多く含むことができる高品質シークエンシングデータを生成するのに役立つ、血液からcf-mRNAを抽出するための方法が、本明細書で提供される。本明細書における方法は、血液からのcf-mRNAの、低い失敗率およびcf-mRNAの収量向上を伴う、一貫した抽出のためのキットを利用し得る。そのような収量は、増幅可能なcf-mRNAを生成するために、より小さいcf-mRNA断片とより大きいcf-mRNA断片の両方を保持し得る。 Some commercially available extraction protocols may show high sampling failure rates, may extract small amounts of cf-mRNA, and contain many contaminants that can reduce the performance of downstream assay steps. It may not be possible to eliminate it. Such kits and protocols can only extract subpopulations of either smaller cf-mRNA fragments or larger cf-mRNA fragments. Accordingly, provided herein are methods for extracting cf-mRNA from blood that help generate high quality sequencing data that can be rich in biometric information. The method herein may utilize a kit for consistent extraction of cf-mRNA from blood with a low failure rate and improved yield of cf-mRNA. Such yields may retain both smaller and larger cf-mRNA fragments in order to produce amplifyable cf-mRNA.

本明細書で開示されるように、一部の手法は、少なくとも1つの抽出洗浄ステップの溶出物の保持によって試料抽出の成功またはRNAライブラリーの多様性を改善することができ、その結果、そうしなければ洗浄ステップの溶出物中に失われる小さいRNAポリヌクレオチドが保持されて、処理用のRNAライブラリーの多様性に寄与する。 As disclosed herein, some techniques can improve sample extraction success or RNA library diversity by retaining the eluate from at least one extraction wash step, and as a result, so. Small RNA polynucleotides that are otherwise lost in the eluate of the wash step are retained, contributing to the diversity of the RNA library for processing.

低レベルのDNA夾雑は、遺伝子発現定量の際に誤差の原因になることがあり、その一方で、血液中の夾雑物は、下流のアッセイの生化学的性質を阻害することがある。さらに、市販のRNA抽出キットは、DNAを除去するステップを無視するか、またはDNAの堅固な除去に最適とは言えないことがあるカラム上DNAse処理を推奨していた。例えば、低収量cf-mRNA試料では、低い夾雑レベルが大きなデータ誤表示の一因となり得る。したがって、cf-mRNA洗浄条件を用いて血液中の夾雑物質を除去するように構成された方法およびシステムが、本明細書で提供される。さらに、このような方法は、cf-mRNA試料の散発的なゲノムDNA夾雑を排除し得る。 Low levels of DNA contamination can cause errors in quantifying gene expression, while blood contaminants can interfere with the biochemical properties of downstream assays. In addition, commercially available RNA extraction kits have either ignored the step of removing DNA or recommended on-column DNAse treatment, which may not be optimal for robust removal of DNA. For example, in low yield cf-mRNA samples, low contamination levels can contribute to large data misdisplays. Accordingly, provided herein are methods and systems configured to remove contaminants in blood using cf-mRNA wash conditions. Moreover, such methods can eliminate sporadic genomic DNA contamination of cf-mRNA samples.

代替的にまたは組み合わせて、本明細書で開示される方法およびシステムは、DNA夾雑および/またはキャリーオーバーを除去するために酵素的DNAseステップを加えることにより、夾雑物質を除去し得る。いくつかの酵素的および非酵素的DNA除去処理は、cf-RNA試料からのDNAの除去効果を共有することが多い本明細書における開示と整合性がある。本明細書における方法は、試料の増幅可能性を(例えば、阻害剤の除去により)向上させる、ならびにcf-mRNA濃縮、多様性および収量を向上させる、脱塩クリーンアップカラムを提供することができる。 Alternatively or in combination, the methods and systems disclosed herein may remove contaminants by adding an enzymatic DNAse step to remove DNA contaminants and / or carryover. Some enzymatic and non-enzymatic DNA removal treatments are consistent with the disclosure herein, which often shares the effect of removing DNA from cf-RNA samples. The methods herein can provide a desalted cleanup column that improves sample amplification potential (eg, by removal of inhibitors) and improves cf-mRNA enrichment, diversity and yield. ..

cDNA合成のオリゴ-dTプライミングは、断片化したおよび/または分解したmRNAに最適とは言えないことがある。特に、分解した試料は、ポリAテールを欠いている断片を含むことがあり、不完全な逆転写は、5’領域を欠いている逆転写産物をもたらすことがある。したがって、本明細書における開示と整合性のある一部のシステム、方法およびキットは、最大4、5、6、7、8、9、10のまたは10を超える塩基を含むオリゴ、例えば、ペンタマー、ヘキサマー、ヘプタマー、オクタマー、ノナマーまたはデカマーを使用するものなどの、逆転写のランダムプライミングのための試薬を添加するステップを含み得る。一部の実施形態では、逆転写をプライミングするためにヘキサマーが使用され得る。 Oligo-dT priming for cDNA synthesis may not be optimal for fragmented and / or degraded mRNA. In particular, the degraded sample may contain fragments lacking the poly A tail, and incomplete reverse transcription may result in a reverse transcriptase lacking the 5'region. Accordingly, some systems, methods and kits consistent with the disclosure herein are oligos containing up to 4, 5, 6, 7, 8, 9, 10 or more than 10 bases, such as pentamers. It may include adding reagents for random priming of reverse transcription, such as those using hexamer, heptamer, octamer, nonamar or decamer. In some embodiments, hexamer may be used to prime reverse transcription.

さらに、一部の商用酵素は、前のステップからの阻害剤に起因してcDNA産生を阻害することがあり、その一方で、逆転写酵素のためのcDNAの定量は、既知RNA投入量を使用する際に不良な定量精度を提示することがある。 In addition, some commercial enzymes may inhibit cDNA production due to inhibitors from previous steps, while cDNA quantification for reverse transcriptase uses known RNA inputs. It may present poor quantitative accuracy when doing so.

RNAからcDNAへの変換効率およびcf-mRNAの定量精度を向上させ得るシステムおよび方法が、本明細書で提供される。本明細書における方法は、RNA投入量から最高の品質および量のcDNAを生じさせるために最良の逆転写酵素を選択したが、cDNA合成にオリゴ-dTプライミングではなくヘキサマーなどのオリゴの比較的高い濃度(例えば、一部の市販キットで推奨されているものよりも大きい濃度)を利用してもよい。オリゴ、例えば、ランダムヘキサマーまたは他の長さのオリゴを、本明細書における開示と整合性のある濃度範囲で使用することができる。例えば、最大約もしくは実質的に60μM、70μM、80μM、90μM、100μM、150μM、200μM、300μM、400μM、500μM、600μM、700μM、800μM、900μM、1000μM、1100μM、1200μM、1300μM、1400μM、もしくは1500μM、または1500μMより高い濃度、少なくとも約もしくは実質的にこれらの濃度、約もしくは実質的にこれらの範囲と整合性のある濃度が、考えられる。これらの範囲内の濃度、例えば、少なくとも60μM、70μM、80μM、90μM、100μM、150μM、200μM、300μM、400μM、500μM、600μM、700μM、800μM、900μM、1000μM、1100μM、1200μM、1300μM、1400μM、もしくは1500μM、または1500μMより高い濃度もまた、本明細書における開示と整合性がある。すなわち、一部の場合には、ランダムヘキサマーなどのランダムオリゴを約200μMで使用することができる。一部の場合には、ランダムヘキサマーなどのランダムオリゴを約500μMで使用することができる。一部の場合には、ランダムヘキサマーなどのランダムオリゴを約1000μMで使用することができる。一部の場合には、ランダムヘキサマーなどのランダムオリゴを約1500μMで使用することができる。一部の場合には、ランダムヘキサマーなどのランダムオリゴを約2000μMで使用することができる。分数の濃度も考えられる。 Systems and methods that can improve the efficiency of RNA-to- cDNA conversion and the accuracy of cf-mRNA quantification are provided herein. The method herein has selected the best reverse transcriptase to yield the highest quality and quantity of cDNA from RNA input, but is relatively high in oligos such as hexamer rather than oligo-dT priming for cDNA synthesis. Concentrations (eg, higher than those recommended for some commercial kits) may be utilized. Oligos, such as random hexamers or oligos of other lengths, can be used in a concentration range consistent with the disclosure herein. For example, max. Concentrations above 1500 μM, at least about or substantially these concentrations, and about or substantially consistent with these ranges are considered. Concentrations within these ranges, such as at least 60 μM, 70 μM, 80 μM, 90 μM, 100 μM, 150 μM, 200 μM, 300 μM, 400 μM, 500 μM, 600 μM, 700 μM, 800 μM, 900 μM, 1000 μM, 1100 μM, 1200 μM, 1300 μM, 1400 μM, or 1500 μM. , Or concentrations above 1500 μM are also consistent with the disclosure herein. That is, in some cases, random oligos such as random hexamers can be used at about 200 μM. In some cases, random oligos such as random hexamers can be used at about 500 μM. In some cases, random oligos such as random hexamers can be used at about 1000 μM. In some cases, random oligos such as random hexamers can be used at about 1500 μM. In some cases, random oligos such as random hexamers can be used at about 2000 μM. Fractional concentrations are also possible.

あるいは、ランダムオリゴ、例えば、ランダムヘキサマーまたは他の長さのオリゴを、キットで推奨されている量に対してより高い濃度で使用することができる。濃度、例えば、2x、3x、4x、5x、6x、7x、8x、9x、10x、11x、12x、13x、14x、15x、16x、17x、18x、19x、20x、21x、22x、23x、24x、25x、26x、27x、28x、29x、30x、31x、32x、33x、34x、35x、36x、37x、38x、39x、40x、41x、42x、43x、44x、45x、46x、47x、48x、49x、50x、または50xより高いの範囲の濃度は、本明細書における方法、システムおよびキットでの使用が考えられる。一部の場合には、例えば30倍などの、15倍~40倍、20倍~35倍、25倍~35倍、28倍~32倍の範囲の濃度または少なくとも25倍、26倍、27倍、28倍、29倍、30倍、31倍、32倍、33倍、34倍、35倍、または35倍を超える濃度が、使用される。 Alternatively, random oligos, such as random hexamers or oligos of other lengths, can be used at higher concentrations than the amounts recommended in the kit. Concentrations such as 2x, 3x, 4x, 5x, 6x, 7x, 8x, 9x, 10x, 11x, 12x, 13x, 14x, 15x, 16x, 17x, 18x, 19x, 20x, 21x, 22x, 23x, 24x, 25x, 26x, 27x, 28x, 29x, 30x, 31x, 32x, 33x, 34x, 35x, 36x, 37x, 38x, 39x, 40x, 41x, 42x, 43x, 44x, 45x, 46x, 47x, 48x, 49x, Concentrations in the range of 50x, or higher than 50x, are considered for use in the methods, systems and kits herein. In some cases, concentrations ranging from 15x to 40x, 20x to 35x, 25x to 35x, 28x to 32x, or at least 25x, 26x, 27x, for example 30x. , 28-fold, 29-fold, 30-fold, 31-fold, 32-fold, 33-fold, 34-fold, 35-fold, or more than 35-fold concentrations are used.

高度な量および特異的な逆転写酵素でのランダムヘキサマーのインプリメンテーションは、cDNAの堅固かつ正確な量がライブラリー調製に進むことを可能にし得る。本明細書における方法およびシステムは、改善されたcDNA合成プロセスを利用して、試料失敗数を低減させるためのならびに生体データおよび組織特異的転写物同定の豊富さおよび堅牢性を改善するための改善されたライブラリー調製プロトコールを特定することができる。このような方法は、トランスクリプトームの>80%を構成することもある、リボソームRNAなどの、情報価値のないリードで浪費されるシークエンシング資源の量を、低減させることができる。したがって、本明細書における方法およびシステムは、cf-mRNAのみを捕捉するための全エクソーム濃縮を含み得る。RNA分子検出のアッセイ感度の改善を示すことができる。さらに、本明細書における方法およびシステムは、RNA調製には通常は使用されない濃縮プロトコールを利用し、スパイクイン転写物cDNAを捕捉するためのカスタムプローブを得ることができる。 Implementation of random hexamers with high amounts and specific reverse transcriptase may allow a robust and accurate amount of cDNA to proceed to library preparation. The methods and systems herein utilize an improved cDNA synthesis process to improve sample failures and improve the abundance and robustness of biometric and tissue-specific transcript identification. The library preparation protocol that has been created can be identified. Such methods can reduce the amount of sequencing resources wasted on non-informational reads, such as ribosomal RNA, which may make up> 80% of the transcriptome. Therefore, the methods and systems herein may include total exosomal enrichment to capture only cf-mRNA. It can show an improvement in assay sensitivity for RNA molecule detection. In addition, the methods and systems herein utilize enriched protocols that are not normally used for RNA preparation to obtain custom probes for capturing spike-in transcript cDNA.

一部の実施形態では、cf-mRNAの選択された集団、および/またはcf-mRNAに由来するcDNAの選択された集団を、脳、肝臓、肺、膀胱、腎臓、心臓、乳房、胃、腸、結腸、胆嚢、膵臓、肺、前立腺、卵巣、上皮組織、結合組織、神経組織または筋肉組織などの、ある特定の臓器または組織を代表するベイトへのハイブリダイゼーションにより、濃縮することができる。一部の実施形態では、cf-mRNAの選択された集団、および/またはcf-mRNAに由来するcDNAの選択された集団を、ある特定の臓器もしくは組織間で区別するベイトまたは疾患もしくは状態についての診断もしくは予後予測に役立つベイトへのハイブリダイゼーションにより、濃縮することができる。 In some embodiments, a selected population of cf-mRNA and / or a selected population of cDNA derived from cf-mRNA is used in the brain, liver, lung, bladder, kidney, heart, breast, stomach, intestine. , Colon, gallbladder, pancreas, lung, prostate, ovary, epithelial tissue, connective tissue, nerve tissue or muscle tissue, etc., can be enriched by hybridization to a bait representing a particular organ or tissue. In some embodiments, a bait or disease or condition that distinguishes a selected population of cf-mRNA and / or a selected population of cDNA derived from cf-mRNA between certain organs or tissues. It can be enriched by hybridization to the bait, which is useful for diagnosis or prognosis prediction.

一部の例では、本明細書で提供される方法は、例えば、改善された効率を示すDNA-seqライブラリーキットを選択することにより、RNAをシークエンシング可能なcDNAライブラリーに変換する効率を改善することができる。シークエンシングライブラリープロトコールへの逆転写cf-RNAキットの適用を助長するために、一部の場合には、第2鎖合成酵素またはプロトコールを使用してcDNAライブラリーを処理して試料中のcf-RNAを代表する二本鎖cDNA分子の集団を生成することができる。次いで、二本鎖DNA分子を、RNAまたは一本鎖DNAライブラリー生成ではなくDNAライブラリー生成に方向付けるプロトコールを使用する、解析またはシークエンシングライブラリー生成に付すことができる。一部の場合には、二本鎖DNAに方向付けるライブラリー生成プロトコールを遵守して、下流の解析のために、cf-RNAまたは一本鎖逆転写産物からのライブラリー生成に方向付けられたプロトコールによって産生されるよりも高品質のライブラリー、例えばシークエンシングライブラリー、を生成する。ある特定の実施形態では、二本鎖DNAに方向付けられたシークエンシングライブラリープロトコールの開始前の、例えばNEBNextポリメラーゼを含む、第2鎖合成レジメンの前に、Superscript IVなどの逆転写酵素にRNA試料を接触させるステップを含む方法を使用して、cf-RNAを処理することができる。 In some examples, the methods provided herein increase the efficiency of converting RNA into a sequenceable cDNA library, for example by selecting a DNA-seq library kit that exhibits improved efficiency. Can be improved. In some cases, to facilitate the application of the reverse transcriptase cf-RNA kit to the sequencing library protocol, the cDNA library is processed with a second-strand synthase or protocol to cf in the sample. -A population of double-stranded cDNA molecules representing RNA can be generated. Double-stranded DNA molecules can then be subjected to analysis or sequencing library generation using protocols that direct DNA library generation rather than RNA or single-stranded DNA library generation. In some cases, compliance with the library generation protocol directed to double-stranded DNA was directed to library generation from cf-RNA or single-stranded reverse transcriptase for downstream analysis. Produces a higher quality library than that produced by the protocol, such as a sequencing library. In certain embodiments, RNA is added to a reverse transcriptase such as Superscript IV prior to the initiation of a double-stranded DNA-directed sequencing library protocol, eg, prior to a second-strand synthetic regimen, including a NEBNext polymerase. Methods that include contacting the samples can be used to process the cf-RNA.

間違った試料へのシークエンシングリードの誤指定を軽減することができる方法、システムおよびキットも、本明細書で提供される。方法およびシステムは、濃縮プロセス中にストリンジェントなクリーンアップ条件からのcf-mRNAライブラリーの喪失を最小限に抑えることができる。ストリンジェントな条件は、cf-mRNA由来ライブラリーの後続のPCR増幅に加わることがあるインデックス付きプライマーのキャリーオーバーを防止するために必要とされることがある。方法は、シークエンシングリードのミスアラインメントを防止するためにIDT technologiesからの試薬とユニークデュアルインデックス(UDI)を利用するステップを含み得る。標準インデックスを使用したとき、シークエンシングリードは、陰性対照(NTC)に誤指定された。 Methods, systems and kits that can reduce misdesignation of sequencing leads to the wrong sample are also provided herein. Methods and systems can minimize the loss of cf-mRNA libraries from stringent cleanup conditions during the enrichment process. Stringent conditions may be required to prevent carryover of indexed primers that may participate in subsequent PCR amplification of the cf-mRNA-derived library. The method may include the use of reagents from IDT technologies and a unique dual index (UDI) to prevent misalignment of sequencing reads. When using the standard index, the sequencing read was misdesignated as a negative control (NTC).

血液中に見られる転写物の大多数は血液細胞に由来し得るので、血液中で検出され得る「非血液」遺伝子のリストが本明細書で提供される。このリストは、「非血液」および組織特異的シグネチャーを同定するために試料処理(遠心分離速度)とバイオインフォマティクスツールを融合させることによって決定した。遠心分離速度の関数として非血液対血液転写物を決定した。8,000g~16,000gの範囲の遠心分離速度は、検出される転写物および遺伝子の数とシグナル対ノイズ比のバランスをもたらした。 Since the majority of transcripts found in blood can be derived from blood cells, a list of "non-blood" genes that can be detected in blood is provided herein. This list was determined by fusing sample processing (centrifugation rate) with bioinformatics tools to identify "non-blood" and tissue-specific signatures. Non-blood vs. blood transcripts were determined as a function of centrifugation rate. Centrifugation rates in the range of 8,000 g to 16,000 g provided a balance between the number of transcripts and genes detected and the signal-to-noise ratio.

血液中の非血液cf-RNA転写物の同定に適切な遺伝子の部分的リストは、以下のものを含む:遺伝子ID SEMA3F;HSPB6;MEOX1;CX3CL1;CDKL3;SEMA3G;DCN;IGF1;WWTR1;PHLDB1;SNAI2;CPS1;RAI14;PREX2;KITLG;ELN;BCAR1;ITIH1;LIMCH1;WISP2;CALCRL;EML1;KIF26A;ACSM2B;ADGRF5;GAL;PTPN21;LMCD1;LNX1;FERMT2;CD5L;NTN4;NUAK1;RASAL2;CTTNBP2;RARB;FBLN1;MAP2;NEBL;HOXA9;RAPGEF3;RIMS1;PTPRH;CADPS2;COL16A1;MECOM;MMP2;PIR;EPB41L1;ARHGAP28;NOS1;FXYD3;RAPGEF4;TF;APOH;PITPNM3;ZFHX4;CCDC80;TGFB2;GABRP;FMO2;CRTAC1;PALMD;PALM;CARD10;RASL10A;RBFOX2;GALNT16;CCM2L;PLS3;ASB9;GABRE;FLT1;ZNF423;NDRG4;CD276;TJP1;PLAT;TUSC3;CLEC4M;NOVA2;SYDE1;RASIP1;ATP6V0A4;CAV1;MET;HOXA5;TSPAN12;SFRP4;MEOX2;RARRES2;GLI3;OGN;LHX6;PTGR1;AMBP;MPDZ;GLIS3;APBA1;ATRNL1;CXCL12;PALD1;CCL2;COL1A1;HLF;KIAA1211;SOD3;CRYAB;APOA4;APOC3;ART4;MGP;CDCA3;AICDA;TPD52L1;LAMA4;C7;FGF1;LIFR;DPYSL3;HRG;AMOTL2;RBP1;FGF12;EVA1A;EFEMP1;IGFBP5;EFHD1;TPO;SDC1;RND3;PARD3B;PRRX1;PRG4;PLA2G4A;NR5A2;ADGRL2;MFAP2;KIF17;HSD11B1;PROX1;APOA1;TTR;ELOVL4;FILIP1;PCDH17;ELOVL3;NKX2-3;TEK;KIAA1217;IQSEC3;TBX2;FABP3;TMEM54;HOXA7;DNAI1;RASSF8;IL13RA2;SLC12A5;PTGIS;POF1B;HIF3A;HIST1H1A;NRN1;SSUH2;MT1G;ID1;F10;RHOJ;AIF1L;MASP1;PTPRB;KDR;RFPL1;A4GALT;KRT17;CPA4;FLNC;MYO1B;CHN1;MYO5C;CGNL1;ISLR;RNASE1;SHC2;DOCK6;APOE;APOC1;USHBP1;UNC13A;PXDN;ASS1;GALNT15;PDLIM4;RAMP2;KHDRBS3;RAI2;NR0B2;RHPN2;PPARG;REEP2;HSPA12B;NES;ALDH3B2;BHMT2;STARD13;BEX1;PDZD2;SPINK5;LYVE1;MRO;MEIS2;CABLES1;APLNR;COL4A2;TBX3;AMHR2;HEY2;PKIB;STAB2;THSD1;EDNRB;RAPGEF5;ALPK3;GATA4;DAB2IP;ALDOB;NR5A1;IL33;CCL21;SLCO2B1;LRRC32;SULF1;YAP1;SMAD6;ARHGAP29;TACC2;RBP4;OIT3;AOX1;DUOXA1;GCSH;GATA6;CCDC40;FKBP10;MMEL1;PRDM16;FCN3;TINAGL1;RGS5;RGL1;MALL;RBMS3;IL17RD;SHROOM2;DENND2A;CXorf36;AWAT2;FAM13C;ADIRF;ROM1;OOSP2;CLEC1A;ADGRL3;CCDC102B;DOCK1;MAGI1;THRSP;AKR1C2;PTPN14;HSPB8;TMEM178A;SPARCL1;GJA1;PLOD2;FBXL2;SEMA3D;CABYR;ROBO4;ABI3BP;CEP112;UCHL1;ENAH;PDLIM3;JAM2;FGD5;GNA14;KCNMA1;NMNAT2;CCNB2;AFAP1L1;ERG;HPD;SHROOM4;LAD1;C1QC;CIART;FCN2;AZGP1;COX7A1;CYGB;MPP3;BCL6B;SHANK2;PLPP3;FBLIM1;ADGRL4;SNX7;VCAM1;DDR2;C1orf115;PIGR;RFTN2;FAM84A;NOSTRIN;FABP1;ALB;PRICKLE2;ADAMTS9;APBB2;TM4SF18;EMCN;SPINK1;MYOZ3;BMPER;ZNF704;COL1A2;SOX17;DEFB1;AQP7;KIAA1462;SMCO2;FBN1;LARP6;SPIC;CYYR1;TMEM100;MFAP4;NNMT;GPR182;IGF2;MYO5B;CDC42EP5;SEMA6B;GGT6;KLK4;ACER1;GSDMA;DNASE1L2;ACOX2;FAM107A;COL3A1;FAM178B;CPLX1;EFNA1;SHE;ANTXR1;ROBO1;CTNND2;TM4SF1;MYRIP;FABP4;GPRC5C;GSTA4;PRKCDBP;SOX7;TMEM37;KRT19;PDE7B;KRT20;MAP6;FGA;FGB;PAH;ARNT2;SYNPO2;AGXT;MUCL1;SNTG2;GXYLT2;SNCG;STOX2;C1QTNF1;CD34;PHLDA3;PODN;SLCO2A1;DES;LPL;NR2F1;HOXD8;NUPR1;CIDEA;CLEC14A;C8orf4;C8G;CASKIN2;PTRF;CALML3;PSAPL1;LGALS7B;WSCD1;PIPOX;CDH5;TMEM45A;OR6S1;C1S;BGN;CLEC4G;PYCR1;CTNNA3;FBXL7;FAM167B;MAATS1;DGAT2L6;ALDH1A3;TACSTD2;TCEAL2;WBP5;NR2F2;KRT79;RGS7BP;KRT14;KRTAP23-1;LYPD6;FAM9C;C11orf96;GJA4;NANOS3;PLA2G2A;C15orf52;S100A16;FSIP2;AADACL3;APOD;S100A13;KIF19;HRCT1;ADH1B;CLPSL2;SRGAP1;KIAA1671;FAM177B;HOXA4;MFAP5;PARVA;TEAD4;SULT1C4;ADH4;HMGN5;ZNF442;ARHGEF15;DMD;C1orf53;SMIM9;SOX18;AWAT1;IGFL2;ERICH4;MT1M;C2CD4B;FAM127C;KLHL23;EMP2;UBD;NEURL1B;C1QTNF5;APOC4-APOC2;CFLAR-AS1;PLCL2-AS1;LA16c-395F10.1;C14orf132;AC046143.3;PPP5D1;RP11-14N7.2;HLA-DQB2;PHGR1;RP1-67K17.3;APOC2;RP11-758P17.3;TDGF1;INMT;GSTA1;ETV5;RP11-148B6.1;ECSCR;RP11-548K23.11;IQCJ-SCHIP1;SHANK3;RP11-116G8.5;CTD-2135J3.4;RP11-923I11.5;RP11-315D16.2;HOXB7;RP11-521L9.1;RP11-680G10.1;RP11-1260E13.4;GJA5;CTD-2350C19.2;AP000275.65;RP11-452I5.2;APOC4;AC003002.4;AC007193.8;DOC2B;CCL14;PIK3R3;RP5-1042K10.14;MATR3;RP11-717K11.2;CDR1-AS;およびAL365273.1。 A partial list of genes suitable for the identification of non-blood cf-RNA transcripts in blood includes: Gene ID SEMA3F; HSPB6; MEOX1; CX3CL1; CDKL3; SEMA3G; DCN; IGF1; WWTR1; PHLDB1; NSAI2; CPS1; RAI14; PREX2; KITLG; ELN; BCAR1; ITIH1; LIMCH1; WISP2; CALCRL; EML1; KIF26A; ACSM2B; ADGRF5; GAL; PTPN21; LMCD1; LNX1; RARB; FBRN1; MAP2; NEBL; HOXX9; RAPGEF3; RIMS1; PTPRH; CADPS2; COL16A1; MECOM; MMP2; PIR; EPB41L1; ARHGAP28; NOS1; FXYD3; RAPGEF4; TF; APOH; FMO2; CRTAC1; PALMD; PALM; CARD10; RASL10A; RBFOX2; GALNT16; CCM2L; PLS3; ASB9; GABER; FLT1; ZNF423; NDRG4; CD276; TJP1; PLAT; TUSC3; MET; HOXX5; TSPAN12; SFRP4; MEOX2; RARRES2; GLI3; OGN; LHX6; PTGR1; AMBP; MPDZ; GLIS3; APBA1; ATRNL1; CXCL12; PALD1; CCL2; COL1A1; ART4; MGP; CDCA3; AICDA; TPD52L1; LAMA4; C7; FGF1; LIFR; DPYSL3; HRG; AMOTL2; RBP1; FGF12; EVA1A; EFEMP1; IGFBP5; EFHD1; TPO; SDC1; NR5A2; ADGRL2; MFAP2; KIF17; HSD11B1; PROX1; APOA1; TTR; ELOVL4; FILIP1; PCDH17; ELOVL3; NKX2-3; TEK; KIAA1217; IQSEC3; TBX2; FABP3; SF8; IL13RA2; SLC12A5; PTGIS; POF1B; HIF3A; HIST1H1A; NRN1; SSUH2; MT1G; ID1; F10; RHOJ; AIF1L; MASP1; PTPRB; KDR; RFPL1; A4GALT; KRT17; CPA4; CGNL1; ISLR; RNASE1; SHC2; DOCK6; APOE; APOC1; USHBP1; UNC13A; PXDN; ASS1; GALNT15; PDLIM4; RAMP2; KHDRBS3; RAI2; NR0B2; RHPN2; PPARG; REEP2; BEX1; PDZD2; SPINK5; LYVE1; MRO; MEIS2; CABLES1; APLNR; COL4A2; TBX3; AMHR2; HEY2; PKIB; STAB2; THSD1; EDNRB; LRRC32; SULF1; YAP1; SMAD6; ARHGAP29; TACC2; RBP4; OIT3; AOX1; DUOXA1; GCSH; GATA6; CCDC40; FKBP10; MMEL1; PRDM16; FCN3; TINAGL1; RGS5; CXorf36; AWAT2; FAM13C; ADIRF; ROM1; OOSP2; CLEC1A; ADGRL3; CCDC102B; DOCK1; MAGI1; THRSP; AKR1C2; PTPN14; HSPB8; TMEM178A; SPARCL1; GJA1; PLOD2; UCHL1; ENAH; PDLIM3; JAM2; FGD5; GNA14; KCNMA1; NMNAT2; CCNB2; AFAP1L1; ERG; HPD; SHROOM4; LAD1; C1QC; CIART; FCN2; AZGP1; COX7A1; ADGRL4; SNX7; VCAM1; DDR2; C1orf115; PIGR; RFTN2; FAM84A; NOSTRIN; FABP1; ALB; PRICKLE2; A DAMTS9; APBB2; TM4SF18; EMCN; SPINK1; MYOZ3; BMPER; ZNF704; COL1A2; SOX17; DEFB1; AQP7; KIAA1462; SMCO2; FBN1; LARP6; SPIC; CYYR1; SEMA6B; GGT6; KLK4; ACER1; GSDMA; DNASE1L2; ACOX2; FAM107A; COL3A1; FAM178B; CPLX1; EFNA1; SHE; ANTXR1; ROBO1; CTNND2; TM4SF1; MYRIP; PDE7B; KRT20; MAP6; FGA; FGB; PAH; ARTT2; SYNPO2; AGXT; MUCL1; SNTG2; GXYLT2; SNCG; STOX2; C1QTNF1; CD34; PHLDA3; PODN; SLCO2A1; DES; CLEC14A; C8orf4; C8G; CASKIN2; PTRF; CALML3; PSAPL1; LGALS7B; WSCD1; PIPOX; CDH5; TMEM45A; OR6S1; C1S; BGN; CLEC4G; PYCR1; CTNNA3; FBXL7; WBP5; NR2F2; KRT79; RGS7BP; KRT14; KRTAP23-1; LYPD6; FAM9C; C11orf96; GJA4; NANOS3; PLA2G2A; C15orf52; S100A16; FSIP2; AADACL3; APOD; S100A13; FAM177B; HOXA4; MFAP5; PARVA; TEAD4; SULT1C4; ADH4; HMGN5; ZNF442; ARHGEF15; DMD; C1orf53; SMIM9; SOX18; AWAT1; IFFL2; ERICH4; MT1M; APOC4-APOC2; CFLAR-AS1; PLCL2-AS1; LA16c-395F10. 1; C14orf132; AC046143.3; PPP5D1; RP11-14N7.2; HLA-DQB2; PHGR1; RP1-67K17.3; APOC2; RP11-758P17.3; TDGF1; INMT; GSTA1; ETV5; RP11-148B6.1; ECSCR; RP11-548K23.11; IQCJ-SCHIP1; SHANK3; RP11-116G8.5; CTD-2135J3.4; RP11-923I11.5; RP11-315D16.2; HOXB7; RP11-521L9.1; RP11-680G10. 1; RP11-1260E13.4; GJA5; CTD-2350C19.2; AP000275.65; RP11-452I5.2; APOC4; AC003002.4; AC007193.8; DOC2B; CCL14; PIK3R3; RP5-1042K10.14; MATR3; RP11-717K11.2; CDR1-AS; and AL365273.1.

血液細胞cf-mRNAを優先的に枯渇させることができる、およびそれによって診断のための情報価値がより高い可能性がある臓器由来cf-mRNAを検出する能力を向上させることができる、方法が、本明細書で提供される。遠心分離速度および時間を、適切な臓器特異的転写物を収集するようにおよび異なる臓器型からのcf-mRNA画分を分離するように組織ごとに最適化することができる。血液からの「非血液」臓器特異的cf-mRNAのそのような単離は、意味のある生体情報の抽出を可能にし得る。 Methods that can preferentially deplete blood cell cf-mRNA and thereby improve the ability to detect organ-derived cf-mRNA, which may be of higher informative value for diagnosis, Provided herein. Centrifugation rates and times can be optimized tissue-by-tissue to collect appropriate organ-specific transcripts and to separate cf-mRNA fractions from different organ types. Such isolation of "non-blood" organ-specific cf-mRNA from blood may allow the extraction of meaningful biological information.

最高で、本明細書における手法の大多数または全てを使用する上述の手法の組合せを利用する方法、システムおよびキットを含む、上記の手法のうちの少なくとも1つのインプリメンテーションによって、cf-RNAライブラリー調製の改善または実質的改善を達成することができる。そのような改善を、RNAライブラリー多様性において2.5倍(例えば、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2.0、2.1、2.2、2.3、2.4、2.5、2.6、2.7、2.8、2.9、3.0、3.1、3.2、3.3、3.4、3.5、3.6、3.7、3.8、3.9、40倍、または4.0倍より大きい)改善などの、ライブラリー多様性の増大の少なくとも1つによって観察することができる。ライブラリー多様性の増大は、同数のユニーク遺伝子をより少数のシークエンシングリードで検出することまたはよりユニークな転写物を同数のシークエンシングリードの中で観察することを可能にし得る。同様に、様々な場合に、cf-mRNAライブラリーにおいてシークエンシングされる非血液転写物の増加または実質的増加、例えば、最大または少なくとも10%、20%、30%、40%、50%、60%、70%の、または70%より大きい増加を観察することができる。一部のシステム、方法またはキットは、例えば約50%の、増加を示すことができる。そのような増加を、血液関連転写物であると同定された配列の選択的除去の前に、またはそれと併せて、観察することができる。そのような増加は、一部の標準プロトコールと比べて低減された体積、低減されたシークエンシング深度、または低減された体積とシークエンシング深度の両方を有することを助長することができ、またはそれを有する試料において観察され得る。一部の場合には、シークエンシング深度を、検出されるユニーク転写物の数の対応する低減を伴うことなく、最大または少なくとも10%、20%、30%、40%、50%、60%、70%、または70%よりも大きく減少させることができる。一部のシステム、方法またはキットは、例えば約50%の、減少を示すことができ、それにもかかわらず上記の多様性の改善をなお提供することができる。一部の場合には、試料体積を最大または少なくとも10%、20%、30%、33%、40%、50%、60%、70%、または70%より大きく減少させることができる。一部のシステム、方法またはキットは、上記の多様性の改善にもかかわらず、例えば約33%の、減少を示す。 At best, cf-RNA live by implementation of at least one of the above methods, including methods, systems and kits that utilize a combination of the above methods that uses the majority or all of the methods herein. Improvements or substantial improvements in rally preparation can be achieved. Such improvements are 2.5-fold in RNA library diversity (eg, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8). 1, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9, 3.0, 3 .1, 3.2, 3.3, 3.4, 3.5, 3.6, 3.7, 3.8, 3.9, 40 times, or 4.0 times larger) Improvements, etc. It can be observed by at least one of the increase in library diversity. Increased library diversity may allow the same number of unique genes to be detected in fewer sequencing reads or more unique transcripts to be observed in the same number of sequencing reads. Similarly, in various cases, an increase or substantial increase in non-blood transcripts sequenced in the cf-mRNA library, eg, maximum or at least 10%, 20%, 30%, 40%, 50%, 60. An increase of%, 70%, or greater than 70% can be observed. Some systems, methods or kits can show an increase of, for example, about 50%. Such an increase can be observed prior to or in conjunction with the selective removal of sequences identified as blood-related transcripts. Such an increase can help or facilitate having a reduced volume, reduced sequencing depth, or both reduced volume and sequencing depth compared to some standard protocols. Can be observed in a sample with. In some cases, the sequencing depth may be maxed out or at least 10%, 20%, 30%, 40%, 50%, 60%, 70% without a corresponding reduction in the number of unique transcripts detected. , Or can be reduced by more than 70%. Some systems, methods or kits can show a reduction of, for example, about 50%, and nevertheless can still provide an improvement in the above diversity. In some cases, the sample volume can be reduced by a maximum or at least 10%, 20%, 30%, 33%, 40%, 50%, 60%, 70%, or more than 70%. Some systems, methods or kits show a reduction of, for example, about 33%, despite the improvements in diversity described above.

一部の例では、絶対尺度で、本明細書における開示と整合性のある方法、システムおよびキットは、本明細書で提供されるような試料の解析の結果として生じる配列リードライブラリーにおける低存在量転写物配列の分解能を増大させることができる。試料転写物により測定して、または同時にまたは独立してアッセイされた内部標準RNA分子もしくは外部処理分子により測定して、1試料当たり少なくともまたは最大でも900、800、700、600、500、400、300、200、100、90、80、70、60、50、40、30、20、15または10分子などの、1初期試料当たり低い分子数範囲で存在する転写物が最終配列データセットに含まれていることを観察することができる。すなわち、一部の例では、例えば1試料あたり10~100分子の、総量で存在する転写物が最終配列データセットに含まれていることを観察することができる。これは、一部の他の方法に比べて改善を意味し得る。 In some examples, on an absolute scale, methods, systems and kits consistent with the disclosure herein are low in the sequence read library resulting from the analysis of the sample as provided herein. The resolution of the quantity transcript sequence can be increased. At least or at most 900, 800, 700, 600, 500, 400, 300 per sample, measured by sample transcripts, or by internal standard RNA molecules or externally processed molecules assayed simultaneously or independently. , 200, 100, 90, 80, 70, 60, 50, 40, 30, 20, 15 or 10 molecules are included in the final sequence dataset. You can observe that you are there. That is, in some examples, it can be observed that the final sequence data set contains transcripts present in a total amount, for example 10 to 100 molecules per sample. This can mean an improvement over some other methods.

cf-mRNA産生のための生体試料は、任意の体液であり得る。例示的な体液としては、血液、唾液、尿、間質液、脳脊髄液、精液、膣液、羊水、涙、滑液、粘液またはリンパ液が挙げられる。細胞を遠心分離または他の手段、例えば濾過など、により体液から除去することができる。血液中で、cf-RNAは、タンパク質、脂質、塩または他の成分と会合していることがある。一部のcf-RNAは、細胞からエキソソームなどの細胞外小胞内に放出される。エキソソームは、これらに限定されないが、遠心分離で沈降、サイズ排除、濾過、平衡密度勾配遠心分離、免疫隔離、免疫枯渇およびこれらの組合せなどの方法により、単離することができる。 The biological sample for cf-mRNA production can be any body fluid. Exemplary body fluids include blood, saliva, urine, interstitial fluid, cerebrospinal fluid, semen, vaginal fluid, amniotic fluid, tears, synovial fluid, mucus or lymph. The cells can be removed from the body fluid by centrifugation or other means, such as filtration. In blood, cf-RNA may be associated with proteins, lipids, salts or other components. Some cf-RNA is released from cells into extracellular vesicles such as exosomes. Exosomes can be isolated by methods such as, but not limited to, sedimentation by centrifugation, size exclusion, filtration, equilibrium density gradient centrifugation, immunoisolation, immunodepletion and combinations thereof.

一部の実施形態では、本開示の方法は、生体試料(例えば、体液)中の1つまたは複数の細胞外RNA転写物の検出を可能する、または検出できるようにすることができる。生体試料は、血清、血漿、唾液、尿、間質液、脳脊髄液、精液、膣液、羊水、涙、滑液、粘液、リンパ液、または別の好適な体液であり得る。様々な実施形態では、方法は、血清試料中の非血液細胞に由来する1つまたは複数の無細胞mRNA分子の検出を可能にし得る。方法は、造血転写物に加えて血清試料中の非血液細胞に由来する1つまたは複数の無細胞mRNA分子の検出を可能にし得る。 In some embodiments, the methods of the present disclosure allow or allow detection of one or more extracellular RNA transcripts in a biological sample (eg, body fluid). The biological sample can be serum, plasma, saliva, urine, interstitial fluid, cerebrospinal fluid, semen, vaginal fluid, amniotic fluid, tears, synovial fluid, mucus, lymph, or another suitable body fluid. In various embodiments, the method may allow detection of one or more cell-free mRNA molecules derived from non-blood cells in a serum sample. The method may allow the detection of one or more cell-free mRNA molecules derived from non-blood cells in serum samples in addition to hematopoietic transcripts.

cf-mRNAにおいて検出される遺伝子は、起源組織および/もしくは臓器を突き止めることができ(例えば、組織特異的遺伝子;表2~7を参照されたい)、または疾患もしくは状態を診断するために特に興味深いものであることもある(表8~9を参照されたい)。さらに、本明細書で提供される方法は、高感度であり得、したがって、生体試料(例えば、体液)中のわずか10、15、25、50、100、150、200または500の少ないコピー数で存在する細胞外RNA分子を検出することができる。RNA分子は、シークエンシング、qPCR、ddPCR、マイクロアレイ、または任意の他の好適な方法により検出することができる。 The genes detected in cf-mRNA can identify the tissue of origin and / or organ (eg, tissue-specific genes; see Tables 2-7), or are of particular interest for diagnosing diseases or conditions. It can also be (see Tables 8-9). Moreover, the methods provided herein can be sensitive, and thus with a small number of copies of only 10, 15, 25, 50, 100, 150, 200 or 500 in a biological sample (eg, body fluid). Existing extracellular RNA molecules can be detected. RNA molecules can be detected by sequencing, qPCR, ddPCR, microarrays, or any other suitable method.

本明細書で提供される方法は、生体試料に存在する(例えば、体液中で循環している)細胞外RNA分子を検出および/または測定することができる。様々な実施形態では、方法は、造血細胞および/または非造血細胞に由来する無細胞mRNA転写物(例えば、表1または表10の非血液遺伝子)を検出および/または測定することができる。方法は、表1または表10からの1、5、10、20、50、100、200、300、400、500、600、700、800、900、または1000もしくはそれより多くの非血液遺伝子を検出および/または測定することができる、精製cf-RNA試料を生成することができる。方法は、生体試料から抽出されたcf-RNAから、例えば表2~9からの、少なくとも1、5、10、20、50、100、200、300、400または500の組織特異的、臓器特異的または診断に重要な遺伝子を測定または検出することができる。方法は、多くて10、15、25、50、100、150、200もしくは500のまたはそれ未満のコピー数で存在するRNA分子を検出することができる、cf-RNA試料を生体試料から生成することができる。 The methods provided herein can detect and / or measure extracellular RNA molecules present in biological samples (eg, circulating in body fluids). In various embodiments, the method can detect and / or measure acellular mRNA transcripts derived from hematopoietic and / or non-hematopoietic cells (eg, non-blood genes in Table 1 or Table 10). The method detects 1, 5, 10, 20, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, or 1000 or more non-blood genes from Table 1 or Table 10. Purified cf-RNA samples that can be and / or measured can be produced. The method is tissue-specific, organ-specific, at least 1, 5, 10, 20, 50, 100, 200, 300, 400 or 500 from cf-RNA extracted from a biological sample, eg, from Tables 2-9. Alternatively, genes important for diagnosis can be measured or detected. The method is to generate a cf-RNA sample from a biological sample capable of detecting RNA molecules present in copies of at most 10, 15, 25, 50, 100, 150, 200 or 500 or less. Can be done.

生体試料中の少なくとも10、20、30、50または100の非血液cf-mRNA遺伝子を検出する方法も、本明細書で提供される。方法は、これらに限定されないが、(a)血清または血漿試料を少なくとも10分間、8,000g~16,000g(または本明細書で提供されるような他の範囲)で遠心分離して上清を形成するステップ、(b)RNAを上清から抽出するステップ、(c)RNAをデオキシリボヌクレアーゼと接触させるステップ、(d)cDNAをRNAから形成するステップ、(f)cDNAライブラリーをcDNAから調製するステップ、(g)cDNAライブラリーをシークエンシングするステップ、および/または(h)配列を参照ゲノムとアラインメントして、1生体試料当たり少なくとも10、20、30、50または100の非血液cf-mRNA遺伝子から生じる配列を同定するステップを含み得る。 Also provided herein are methods of detecting at least 10, 20, 30, 50 or 100 non-blood cf-mRNA genes in a biological sample. The method is not limited to these, and (a) the serum or plasma sample is centrifuged at 8,000 g to 16,000 g (or other range as provided herein) for at least 10 minutes and the supernatant. Steps to form, (b) extract RNA from the supernatant, (c) contact RNA with deoxyribonuclease, (d) form cDNA from RNA, (f) prepare a cDNA library from cDNA Steps to, (g) sequence the cDNA library, and / or (h) align the sequence with the reference genome to at least 10, 20, 30, 50 or 100 non-blood cf-mRNA per biological sample. It may include the step of identifying the sequence resulting from the gene.

方法は、(i)目的の少なくとも10、20、30、50または100遺伝子からのポリヌクレオチド断片を含むベイトとcDNAライブラリーを接触させて、翻訳される遺伝子を濃縮するステップをも含み得る。一部の場合には、方法の(d)は、RNAを逆転写酵素と接触させて一本鎖cDNAを形成すること、および一本鎖cDNAを第2鎖合成酵素と接触させて二本鎖cDNAを形成することを含み得る。方法は、(j)ユニークデュアルインデックスをcDNAライブラリーにライゲーションさせてインデックス付きcDNAライブラリーを形成するステップをも含み得る。一部の実施形態では、方法は、(k)最大2、3、4、5、6、7、8、9、10またはそれより多くのインデックス付きcDNAライブラリーをプールするステップを含み得る。方法は、(l)プールされたcDNAライブラリーに関する大規模並列シークエンシングを実行するステップをも含み得る。 The method may also include (i) contacting a cDNA library with a bait containing a polynucleotide fragment from at least 10, 20, 30, 50 or 100 genes of interest to enrich the gene to be translated. In some cases, method (d) involves contacting the RNA with reverse transcriptase to form a single-stranded cDNA, and contacting the single-stranded cDNA with a double-stranded synthase to form a double-stranded cDNA. It may include forming cDNA. The method may also include (j) ligating a unique dual index to a cDNA library to form an indexed cDNA library. In some embodiments, the method may include (k) pooling up to 2, 3, 4, 5, 6, 7, 8, 9, 10 or more indexed cDNA libraries. The method may also include (l) performing a massively parallel sequencing on the pooled cDNA library.

一部の実施形態では、少なくとも25、50、75、100、200、300、400、500、600、700、800、900または1000遺伝子が、生体試料において検出される。様々な実施形態では、配列を参照ゲノムとアラインメントして、1生体試料当たり少なくとも25、50、75、100、200、300、400、500、600、700、800、900または1000の非血液cf-mRNA遺伝子から生じる配列を同定することができる。方法は、一本鎖cDNAを第2鎖合成酵素と接触させて二本鎖cDNAを形成するステップをさらに含み得る。一部の場合には、(c)は、溶液中で実行され得る。 In some embodiments, at least 25, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 genes are detected in a biological sample. In various embodiments, the sequence is aligned with the reference genome to at least 25, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 non-blood cf- per biological sample. The sequence resulting from the mRNA gene can be identified. The method may further comprise the step of contacting the single-stranded cDNA with a double-stranded synthase to form a double-stranded cDNA. In some cases, (c) can be performed in solution.

ある特定の実施形態では、生体試料中の少なくとも10、20、30、50または100の非血液cf-mRNA遺伝子を検出する方法は、これらに限定されないが、(a)血清または血漿試料を1,900g~16,000g(または本明細書で提供されるような他の範囲)で遠心分離または濾過するステップ、(b)上清からRNA試料を抽出するステップ、(c)RNA試料をデオキシリボヌクレアーゼと接触させるステップ、(d)RNAを逆転写酵素と接触させて一本鎖cDNAを形成するステップ、(e)二本鎖cDNAをRNAから形成するステップ、(f)cDNAライブラリーを二本鎖cDNAから調製するステップ、(g)ポリヌクレオチド断片を含むベイトとインデックス付きcDNAライブラリーを接触させて、翻訳される遺伝子を濃縮するステップ、(h)cDNAライブラリーをシークエンシングするステップ、および/または(i)配列を参照ゲノムとアラインメントして、1生体試料当たり少なくとも10、20、30、50または100の非血液cf-mRNA遺伝子から生じる配列を同定するステップを含み得る。 In certain embodiments, the method of detecting at least 10, 20, 30, 50 or 100 non-blood cf-mRNA genes in a biological sample is, but is not limited to, (a) a serum or plasma sample. A step of centrifugation or filtering from 900 g to 16,000 g (or other range as provided herein), (b) a step of extracting an RNA sample from the supernatant, (c) an RNA sample with deoxyribonuclease. Contacting, (d) contacting RNA with reverse transcriptase to form single-stranded cDNA, (e) forming double-stranded cDNA from RNA, (f) double-stranded cDNA in the cDNA library Preparation from, (g) contacting a bait containing a polynucleotide fragment with an indexed cDNA library to concentrate the gene to be translated, (h) sequencing the cDNA library, and / or ( i) The sequence may be aligned with the reference genome to identify sequences originating from at least 10, 20, 30, 50 or 100 non-blood cf-mRNA genes per biological sample.

方法は、(j)ユニークデュアルインデックスをcDNAライブラリーに付加させてインデックス付きcDNAライブラリーを(例えば、ライゲーション、PCRなどによって)形成するステップをさらに含み得る。一部の実施形態では、方法は、(k)最大10のインデックス付きcDNAライブラリーをプールするステップを含み得る。方法は、(l)プールされたcDNAライブラリーに関する大規模並列シークエンシングを実行するステップをさらに含み得る。一部の場合には、方法は、一本鎖cDNAを第2鎖合成酵素と接触させて二本鎖cDNAを形成するステップをさらに含み得る。一部の実施形態では、(c)は、溶液中で実行され得る。 The method may further include (j) adding a unique dual index to the cDNA library to form an indexed cDNA library (eg, by ligation, PCR, etc.). In some embodiments, the method may include (k) pooling up to 10 indexed cDNA libraries. The method may further include (l) performing a massively parallel sequencing on the pooled cDNA library. In some cases, the method may further comprise the step of contacting the single-stranded cDNA with a double-stranded synthase to form a double-stranded cDNA. In some embodiments, (c) can be performed in solution.

遺伝子と「アラインメントされる」ポリヌクレオチド配列は、遺伝子の一部または全ての配列に対して約100%の同一性を一般に有する。 Polynucleotide sequences that are "aligned" with a gene generally have about 100% identity to some or all of the sequences in the gene.

本明細書で使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈による別段の明白な指示がない限り、複数形の言及対象を含む。本明細書における「または」へのあらゆる言及は、別段の記述がない限り、「および/または」を包含するように意図されている。 As used herein, the singular forms "one (a)", "one (an)" and "the" are plural references unless otherwise expressly indicated by the context. Including the subject. All references to "or" herein are intended to include "and / or" unless otherwise stated.

本開示の好ましい実施形態が本明細書で示され、説明されているが、このような実施形態が単なる例として提供されることは当業者には明らかであろう。本開示から逸脱することなく、非常に多くの変形形態、変更形態および置換形態がすぐに当業者の心に浮かぶことであろう。本明細書に記載の本開示の実施形態の様々な代替形態を本開示の実施の際に利用することができることは、理解されるはずである。 Although preferred embodiments of the present disclosure are shown and described herein, it will be apparent to those skilled in the art that such embodiments are provided by way of example only. Numerous variants, modifications and substitutions will immediately come to the minds of those skilled in the art without departing from the present disclosure. It should be understood that various alternatives of the embodiments described herein are available in the practice of the present disclosure.

本願の例示的実施形態として提供する以下の非限定的実施例を参照することにより、本願をよりよく理解することができる。以下の実施例を、実施形態をより十分に説明するために提示するが、いかなる点においても本願の広い範囲を限定するものと解釈すべきでない。 The present application can be better understood by reference to the following non-limiting examples provided as exemplary embodiments of the present application. The following examples are presented to better illustrate the embodiments, but should not be construed as limiting the broad scope of the present application in any way.

(実施例1 方法)
無細胞mRNA(cf-mRNA)解析に使用したプロセスは、生体試料処理、cf-mRNA抽出、cf-mRNA精製、cDNA合成、ライブラリー調製、DNAシークエンシング、およびバイオインフォマティクスを含む(図1)。
(Example 1 method)
The processes used for acellular mRNA (cf-mRNA) analysis include biological sample processing, cf-mRNA extraction, cf-mRNA purification, cDNA synthesis, library preparation, DNA sequencing, and bioinformatics (FIG. 1).

血液を血漿処理のためにEDTAバキュテナー(BD)にまたは血清処理のために赤キャップバキュテナー(BD)に採取した。血清処理のために、血液を少なくとも30分間室温でインキュベートした。採取後2時間未満の室温での保管後、血液を10分間1600gで遠心分離して血漿または血清(上清)を得た。試料を処理することができ、または-80℃での保管のために凍結することができる。凍結または新鮮試料から残留細胞を除去するために、血漿/血清を、適用に依存して10,000g~16,000gで10分間、2回目の遠心分離をした。 Blood was collected on EDTA vacutainer (BD) for plasma treatment or on a red cap vacutainer (BD) for serum treatment. Blood was incubated for at least 30 minutes at room temperature for serum treatment. After storage at room temperature for less than 2 hours after collection, blood was centrifuged at 1600 g for 10 minutes to obtain plasma or serum (supernatant). The sample can be processed or frozen for storage at −80 ° C. Plasma / serum was centrifuged at 10,000 g to 16,000 g for 10 minutes for a second time to remove residual cells from frozen or fresh samples.

QIAamp Circulating Nucleic Acid Kit(Qiagenカタログ番号55114)からの試薬を使用して、無細胞RNAを抽出し、精製した。以下の条件を最大1mlの血清または血漿に使用した。上清を新しいチューブに移し、130μlのプロテイナーゼK、1.1mlの緩衝液ACL(担体なし)、および330μlの緩衝液ATLと混合し、60℃で45分間インキュベートした。生成物を3mlの緩衝液ACB、1μlの希釈ERCC RNA Spike-In Mix(Life Technologiesカタログ番号4456740)、および2.5mlの冷却イソプロパノールと混合し、5分間、氷上でインキュベートした。真空マニホールドを使用して試料をQiAmp Miniカラムに負荷し、次いで、600μlの緩衝液ACW1、続いて750μlの緩衝液ACW2、そして2×750μlのEtOHで洗浄した。カラムを56℃で10分間乾燥させた。次いで、RNAを50μlの緩衝液AVEで2回、各々室温での3分間のインキュベーション、続いての16,000gでの1分の遠心分離によって溶出した。溶出物(約100μl)を、1×Turbo DNA緩衝液中のTurbo DNase(Life Technologiesカタログ番号AM1907)3μlで20分間、37℃で処理した。10μlのDNase Inactivationミックスで反応を停止させ、5分間、室温でインキュベートし、10,000gで90秒間遠心分離した。 Cell-free RNA was extracted and purified using reagents from the QIAamp Circulating Nucleic Acid Kit (Qiagen Catalog No. 55114). The following conditions were used for up to 1 ml of serum or plasma. The supernatant was transferred to a new tube, mixed with 130 μl Proteinase K, 1.1 ml buffer ACL (without carrier), and 330 μl buffer ATL and incubated at 60 ° C. for 45 minutes. The product was mixed with 3 ml buffer ACB, 1 μl diluted ERCC RNA Spike-In Mix (Life Technologies Catalog No. 4456740), and 2.5 ml cold isopropanol and incubated on ice for 5 minutes. Samples were loaded onto a QiAmp Mini column using a vacuum manifold and then washed with 600 μl buffer ACW1, followed by 750 μl buffer ACW2, and 2 × 750 μl EtOH. The column was dried at 56 ° C. for 10 minutes. RNA was then eluted with 50 μl buffer AVE twice, each for 3 minutes at room temperature, followed by 1 minute centrifugation at 16,000 g. The eluate (approximately 100 μl) was treated with 3 μl of Turbo DNase (Life Technologies Catalog No. AM1907) in 1 × Turbo DNA buffer for 20 minutes at 37 ° C. The reaction was stopped with 10 μl DNase Incubation mix, incubated for 5 minutes at room temperature, and centrifuged at 10,000 g for 90 seconds.

上清中のRNAを必要に応じて水で100μlにし、OneStep PCR Inhibitor Removal Kit(Zymoカタログ番号D6030)を使用して清浄化した。Zymoスピンカラムを600μlの調製用緩衝液、続いて400μlおよび100μlの水で準備し、全て、8000gで3分間、遠心分離した。次いで、試料を8000gで3分間の遠心分離によりカラムに通した。次いで、RNeasy MinElute Cleanupキット(Qiagenカタログ番号74204)からの試薬を使用して、試料に2回目の清浄化を行った。RNA試料を350μlのRLT緩衝液および900μlのEtOHと混合し、>8,000gでの遠心分離によりRNeasy MinEluteカラムに負荷した。カラムを500μlのRPE洗浄緩衝液、続いて500μlの80%エタノールで洗浄し、次いで、製造業者による推奨通りに乾燥させた。溶出のために、15μlの水をカラムに添加し、1分間、室温でインキュベートし、次いで、16,000gで1分間の遠心分離により微量遠心チューブに回収した。品質管理のために、バイオアナライザーでRNA 6000 Pico試薬(Agilent)を使用して1μl(15μlのうちの)を分析した。 RNA in the supernatant was made into 100 μl with water as needed and cleaned using the OneStep PCR Inhibitor Removal Kit (Zymo Catalog No. D6030). Zymo spin columns were prepared with 600 μl of preparation buffer followed by 400 μl and 100 μl of water, all centrifuged at 8000 g for 3 minutes. The sample was then passed through the column by centrifugation at 8000 g for 3 minutes. The sample was then cleaned a second time using reagents from the RNeasy MinElute Cleanup kit (Qiagen Catalog No. 74204). RNA samples were mixed with 350 μl RLT buffer and 900 μl EtOH and loaded onto the RNeasy MinElute column by centrifugation at> 8,000 g. The column was washed with 500 μl of RPE wash buffer followed by 500 μl of 80% ethanol and then dried as recommended by the manufacturer. For elution, 15 μl of water was added to the column, incubated for 1 minute at room temperature, and then collected in a microcentrifuge tube by centrifugation at 16,000 g for 1 minute. For quality control, 1 μl (out of 15 μl) was analyzed using RNA 6000 Pico Reagent (Agilent) with a bioanalyzer.

SuperScript IV逆転写酵素(Life Technologiesカタログ番号18090050)を使用してcDNAを合成し、その後、NEBNext(登録商標)Second Strand Synthesisキット(New England BioLabsカタログ番号E6111L)で処理した。RNA(最大10μl)を1.12μlのランダムヘキサマープライマー(3mg/ml)および0.56μlのdNTP(各10mM)と14μlの総体積で混合し、5分間、65℃でインキュベートし、次いで4℃に冷却した。次いで、試料を0.43μlの水、4μlのSSIV緩衝液、0.57μlのDTT(0.1M)および1μlの逆転写酵素(200U/μl)と混合し、23℃で10分間、50℃で50分間、80℃で10分間インキュベートし、次いで4℃で保持した。第2鎖合成のために、反応に4μlの反応緩衝液、2μlのNEBNext酵素を補充し、水で40μlの総体積にし、1時間、16℃でインキュベートした。dsDNAをAMPure XP SPRIビーズ(Beckman Coulter Inc.カタログ番号A63882)で清浄化した。40μlのdsDNAを2分間、40μlのLow EDTA TE(Swift Biosciencesカタログ番号90296)および144μlのSPRIビーズと混合し、その後、3分間、室温でインキュベートした。磁石ラックを使用してビーズを回収し、200μlの80%エタノールで2回洗浄し、5分間、空気乾燥させた。 CDNA was synthesized using SuperScript IV reverse transcriptase (Life Technologies Catalog No. 18090050) and then treated with NEBNext® Second Strand Synthesis Kit (New England BioLabs) Catalog Number E6. RNA (up to 10 μl) was mixed with 1.12 μl of random hexamer primer (3 mg / ml) and 0.56 μl of dNTP (10 mM each) in a total volume of 14 μl, incubated for 5 minutes at 65 ° C., then 4 ° C. Cooled to. The sample was then mixed with 0.43 μl water, 4 μl SSIV buffer, 0.57 μl DTT (0.1 M) and 1 μl reverse transcriptase (200 U / μl) at 23 ° C. for 10 minutes at 50 ° C. It was incubated for 50 minutes at 80 ° C. for 10 minutes and then kept at 4 ° C. For second chain synthesis, the reaction was supplemented with 4 μl of reaction buffer and 2 μl of NEBNext enzyme to a total volume of 40 μl with water and incubated for 1 hour at 16 ° C. The dsDNA was cleaned with AMPure XP SPRI beads (Beckman Coulter Inc. Catalog No. A63882). 40 μl of dsDNA was mixed with 40 μl of Low EDTA TE (Swift Biosciences Catalog No. 90296) and 144 μl of SPRI beads for 2 minutes and then incubated for 3 minutes at room temperature. Beads were collected using a magnetic rack, washed twice with 200 μl of 80% ethanol and air dried for 5 minutes.

Accel-NGS 2S Plus DNA Library Kit(Swift Biosciencesカタログ番号SP-2014-96)からの試薬、およびユニークデュアルインデックス(Unique Dual Indexes)(UDI)(Integrated DNA Technologies)を用いて、ライブラリーを調製した。SPRIビーズを53μlのLow EDTA TE、6μlの緩衝液W1および1μlの酵素W2に懸濁させ、10分間、37℃でインキュベートした。108μlのPEG NaCl溶液(Swift Biosciencesカタログ番号90196)を添加した。ビーズを2分間、混合し、3分間、室温でインキュベートし、次いで5分間、磁石ラックで回収した。上清を除去した後、ビーズを30秒間、180μlの80%エタノールで2回洗浄し、次いで空気乾燥させた。ビーズを30μlのLow EDTA TE、5μlの緩衝液G1、13μlの試薬G2、1μlの酵素G3および1μlの酵素G4に再懸濁させ、20℃で20分間インキュベートした。82.5μlのPEG NaCl溶液を添加し、続いて2分間混合し、3分間、室温でインキュベートし、5分間、磁石ラックで回収した。上清を除去した後、ビーズを30秒間、180μlの80%エタノールで2回洗浄し、次いで1分間、空気乾燥させた。ビーズを20μlのLow EDTA TE、5μlの試薬Y2、3μlの緩衝液Y1および2μlの酵素Y3に再懸濁させ、15分間、25℃でインキュベートした。49.5μlのPEG NaCl溶液を添加し、続いて2分間混合し、3分間、室温でインキュベートし、5分間、磁石ラックで回収した。上清を除去した後、ビーズを30秒間、180μlの80%エタノールで2回洗浄し、次いで1分間、空気乾燥させた。ビーズを30μlのLow EDTA TE、5μlの緩衝液B1、2μlの試薬B2、9μlの試薬B3、1μlの酵素B4、2μlの酵素B5および1μlの酵素B6に再懸濁させ、40℃で10分間インキュベートし、次いで25℃に戻した。70μlのPEG NaCl溶液を添加し、続いて2分間混合し、3分間、室温でインキュベートし、5分間、磁石ラックで回収した。上清を除去した後、ビーズを30秒間、180μlの80%エタノールで2回洗浄し、次いで1分間、空気乾燥させた。ビーズを2分間の混合、続いての2分間のインキュベーションにより、21μlのLow EDTA TEに再懸濁させた。ビーズを磁石ラックで回収し、上清を新しいプレートに移し、5μlのIllumina UDI Primer Mix(1-72)(Integrated DNA Technologies)、10μlのLow EDTA TE、4μlの試薬R2、10μlの緩衝液R3および1μlの酵素R4と混合した。PCR反応を30秒間、98℃に加熱し、98℃で10秒間、60℃で30秒間そして68℃で60秒間のサイクリングを16回行い、次いで4℃で保持した。70μlのSPRIビーズを添加した。ビーズと試料を2分間、混合し、さらに2分間インキュベートし、磁石ラックで5分間、回収した。上清を除去した後、ビーズを30秒間、180μlの80%エタノールで2回洗浄し、次いで1分間、空気乾燥させた。核酸を21μlの水で溶出した。 Reagents from Accel-NGS 2S Plus DNA Library Kit (Swift Biosciences Catalog No. SP-2014-96), and unique dual indexes (Unique Dual Indexes) (UDI) (Integrated DNA Techniques). SPRI beads were suspended in 53 μl Low EDTA TE, 6 μl buffer W1 and 1 μl enzyme W2 and incubated for 10 minutes at 37 ° C. 108 μl of PEG NaCl solution (Swift Biosciences Catalog No. 90196) was added. The beads were mixed for 2 minutes, incubated for 3 minutes at room temperature, and then collected in a magnetic rack for 5 minutes. After removing the supernatant, the beads were washed twice with 180 μl of 80% ethanol for 30 seconds and then air dried. The beads were resuspended in 30 μl Low EDTA TE, 5 μl buffer G1, 13 μl reagent G2, 1 μl enzyme G3 and 1 μl enzyme G4 and incubated at 20 ° C. for 20 minutes. 82.5 μl of PEG NaCl solution was added, then mixed for 2 minutes, incubated for 3 minutes at room temperature, and recovered in a magnet rack for 5 minutes. After removing the supernatant, the beads were washed twice with 180 μl of 80% ethanol for 30 seconds and then air dried for 1 minute. The beads were resuspended in 20 μl Low EDTA TE, 5 μl reagent Y2, 3 μl buffer Y1 and 2 μl enzyme Y3 and incubated for 15 minutes at 25 ° C. 49.5 μl of PEG NaCl solution was added, then mixed for 2 minutes, incubated for 3 minutes at room temperature and recovered in a magnet rack for 5 minutes. After removing the supernatant, the beads were washed twice with 180 μl of 80% ethanol for 30 seconds and then air dried for 1 minute. The beads are resuspended in 30 μl Low EDTA TE, 5 μl buffer B1, 2 μl reagent B2, 9 μl reagent B3, 1 μl enzyme B4, 2 μl enzyme B5 and 1 μl enzyme B6, and incubated at 40 ° C. for 10 minutes. Then, the temperature was returned to 25 ° C. 70 μl of PEG NaCl solution was added, then mixed for 2 minutes, incubated for 3 minutes at room temperature, and recovered in a magnet rack for 5 minutes. After removing the supernatant, the beads were washed twice with 180 μl of 80% ethanol for 30 seconds and then air dried for 1 minute. The beads were resuspended in 21 μl Low EDTA TE by mixing for 2 minutes followed by incubation for 2 minutes. The beads are collected in a magnetic rack, the supernatant is transferred to a new plate, 5 μl Illumina UDI Primer Mix (1-72) (Integrated DNA Technologies), 10 μl Low EDTA TE, 4 μl reagent R2, 10 μl buffer R3 and It was mixed with 1 μl of enzyme R4. The PCR reaction was heated to 98 ° C. for 30 seconds, cycled 16 times at 98 ° C. for 10 seconds, 60 ° C. for 30 seconds and 68 ° C. for 60 seconds, and then held at 4 ° C. 70 μl of SPRI beads were added. The beads and sample were mixed for 2 minutes, incubated for an additional 2 minutes and collected in a magnet rack for 5 minutes. After removing the supernatant, the beads were washed twice with 180 μl of 80% ethanol for 30 seconds and then air dried for 1 minute. The nucleic acid was eluted with 21 μl of water.

SureSelect Custom Reagentキット(Agilent Technologiesカタログ番号931170)に関連してSure Select XT V6全エクソーム+UTR捕捉用プローブおよびERCC捕捉用プローブを使用してcDNAおよびERCC DNAを濃縮して、cf-mRNAシークエンシングライブラリーを形成した。750~1000ngの総cDNAライブラリー質量を有するインデックス付き試料最大10個をプールした。真空遠心分離を使用して体積を3.4μlに低減させた。次いで、試料を5.6μlのSureSelect XT2 Block Mixと混合した。9μlの試料をPCRストリップチューブに移し、密封し、95℃で5分間インキュベートし、次いで65℃で少なくとも5分間保持した。1.5μlの水、0.5μlのSureSelect RNase Block、6.63μlのHyb1、0.27μlのHyb2、2.65μlのHyb3、3.45μlのHyb4、1μlのERCC Captureライブラリー(Agilent)および5μlのCapture Library≧3Mb(全てExon V6 60Mb)を添加し、加熱蓋を用いて試料を一晩、65℃でインキュベートした。200μlのSureSelect結合緩衝液での4回の洗浄により、MyOneストレプトアビジンビーズ(50μl)を準備した。プールした試料をストレプトアビジンビーズに添加し、30分間、1800rpmで混合した。ビーズを磁石で回収し、15分間200μlのSureSelect洗浄緩衝液1で洗浄し、次いで200μlのSureSelect洗浄緩衝液2で10分間、65℃で3回洗浄した。核酸を20μlの水中で5分間の95℃でのインキュベーションによりビーズから溶出し、新しいチューブに移し、6μlの水、25μlの2X Herculase Master Mixおよび1μlのXT2 Primer Mixと混合した。試料を98℃で2分間インキュベートし、98℃で30秒、60℃で30秒そして72℃で1分間のサイクリングを15回行い、72℃で10分間、伸長を行い、次いで4℃で保持した。反応物を90μlのAMPureXPビーズで清浄化し、15μlの水で溶出した。生成物をKapa qPCRおよびキャピラリー電気泳動により分析した。Kapa qPCRのために、10mM Tris-HCl、pH8で希釈物を調製した。キャピラリー電気泳動は、バイオアナライザーで行った。 Cf-mRNA sequencing library by enriching cDNA and ERCC DNA using the Sure Select XT V6 whole exome + UTR capture probe and ERCC capture probe in connection with the SureSelect Custom Reagent kit (Agilent Technologies Catalog No. 931170). Formed. Up to 10 indexed samples with a total cDNA library mass of 750-1000 ng were pooled. Vacuum centrifugation was used to reduce the volume to 3.4 μl. The sample was then mixed with 5.6 μl of SureSelect XT2 Block Mix. A 9 μl sample was transferred to a PCR strip tube, sealed, incubated at 95 ° C. for 5 minutes, and then held at 65 ° C. for at least 5 minutes. 1.5 μl water, 0.5 μl SureSelect RNase Block, 6.63 μl Hyb1, 0.27 μl Hyb2, 2.65 μl Hyb3, 3.45 μl Hyb4, 1 μl ERCC Capture Library (Agilent) and 5 μl. Capture Library ≧ 3Mb (all Exon V6 60Mb) was added and the samples were incubated overnight at 65 ° C. with a heating lid. MyOne streptavidin beads (50 μl) were prepared by 4 washes with 200 μl of SureSelect binding buffer. The pooled sample was added to the streptavidin beads and mixed for 30 minutes at 1800 rpm. The beads were collected with a magnet and washed with 200 μl of SureSelect wash buffer 1 for 15 minutes and then with 200 μl of SureSelect wash buffer 2 for 10 minutes at 65 ° C. three times. Nucleic acid was eluted from the beads by incubation in 20 μl water at 95 ° C. for 5 minutes, transferred to new tubes and mixed with 6 μl water, 25 μl 2X Herculase Master Mix and 1 μl XT2 Primer Mix. The sample was incubated at 98 ° C. for 2 minutes, cycled 15 times at 98 ° C. for 30 seconds, 60 ° C. for 30 seconds and 72 ° C. for 1 minute, stretched at 72 ° C. for 10 minutes, and then held at 4 ° C. .. The reaction was cleaned with 90 μl of AMPureXP beads and eluted with 15 μl of water. The products were analyzed by Kapa qPCR and capillary electrophoresis. Dilutions were prepared at 10 mM Tris-HCl, pH 8 for Kap a qPCR. Capillary electrophoresis was performed on a bioanalyzer.

定量後、シークエンシングプールを、それらのサイズに従っておよびIlluminaの推奨に従って変性させ、希釈して、最適なクラスター形成を達成した。PhiX対照を試料に参照として添加した。1000uLピペットを使用して、全ての希釈ライブラリーをNextSeq 500(Illumina)の説明書に従ってリザーバー#10に負荷した。Illumina Basespaceをそれらの説明書に従って使用してシークエンシング試行を行った。シークエンシングをペアエンドで行い、読み取りサイクルを76に設定した。NextSeqをシークエンシングマシンとして選択した。シークエンシング試行をNextSeq 500で製造業者の説明書に従って開始した。 After quantification, the sequencing pools were denatured and diluted according to their size and according to Illumina's recommendations to achieve optimal cluster formation. A PhiX control was added to the sample as a reference. Using a 1000 uL pipette, all dilution libraries were loaded into reservoir # 10 according to the instructions for NextSeq 500 (Illumina). Sequencing trials were performed using Illumina Basespace according to their instructions. Sequencing was done on a paired end and the read cycle was set to 76. NextSeq was selected as the sequencing machine. Sequencing trials were initiated on the NextSeq 500 according to the manufacturer's instructions.

BaseSpaceプラットフォーム(Illumina Inc)でFASTQ Generation Applicationを使用して、塩基コールを行った。シークエンシングデータ解析のために、cutadapt(v1.11)を使用して、アダプター配列を除去し、低品質塩基をトリミングした。トリミング後に15塩基対より短いリードをその後の解析から除外した。STAR(v2.5.2b)とGENCODE v24遺伝子モデルを使用して、15塩基対より大きいリード配列をヒト参照ゲノムGRCh38とアラインメントした。samtools(v1.3.1)rmdupコマンドを使用して、重複リードを除去した。 Base calls were made using FASTQ Generation Application on the BaseSpace platform (Illumina Inc). For sequencing data analysis, cutadapt (v1.11) was used to remove adapter sequences and trim low quality bases. Reads shorter than 15 base pairs after trimming were excluded from subsequent analysis. Using STAR (v2.5.2b) and the GENCODE v24 gene model, read sequences larger than 15 base pairs were aligned with the human reference genome GRCh38. Duplicate reads were removed using the samtools (v1.3.1) rmdup command.

細胞型デコンボリューションのために、各遺伝子の発現レベルを全試料にわたってのその最大値で割る、正規化を実行した。このステップは、少数の高度に発現される遺伝子による分解プロセスの支配を回避するために異なる遺伝子間の発現レベルを再スケーリングする。次いで、正規化された発現行列を、Pythonライブラリーサイキット・ラーンの中のsklearn.decomposition.NMFを使用して非負値行列因子分解(NMF)に付した。NMF分解は、発現行列を2つの行列の積に分解することによってデータのより簡潔な表現X=WHを達成するものであり、式中のXは、n行(n個の試料)およびm列(m個の遺伝子)を有する発現行列であり、Wは、n行(n個の試料)およびp列(p個の成分)を有する係数行列であり、Hは、p行(p個の成分)およびm列(m個の遺伝子)を有する負荷行列である。Wは、ある意味では、低減された次元数を有する元の行列Hの要約である。Hは、各遺伝子が成分にどの程度寄与するのかについての情報を含有する。各成分に最も寄与する上位の遺伝子に関する経路解析を実行することによって導出成分の生物学的解釈を実現した。 For cell-type deconvolution, normalization was performed in which the expression level of each gene was divided by its maximum over all samples. This step rescales expression levels between different genes to avoid control of the degradation process by a small number of highly expressed genes. The normalized expression matrix is then presented in scikit-learn in the Python library Cykit Learn. Decomposition. It was subjected to non-negative matrix factorization (NMF) using NMF. NMF degradation achieves a more concise representation of the data, X = WH, by decomposing the expression matrix into the product of two matrices, where X in the equation is n rows (n samples) and m columns. It is an expression matrix having (m genes), W is a coefficient matrix having n rows (n samples) and p columns (p components), and H is a p row (p components). ) And m columns (m genes). W is, in a sense, a summary of the original matrix H with a reduced number of dimensions. H contains information on how much each gene contributes to the component. A biological interpretation of the derived components was achieved by performing pathway analysis on the top genes that contribute most to each component.

全血およびマッチした血漿試料をシークエンシングして「非血液」遺伝子を同定した。遺伝子は、その正規化された発現(100万当たりの転写物数、TPM)が血漿において全血(血液細胞を含有する)と比較して3倍高い場合、「非血液」と見なす。「非血液」遺伝子は、血液細胞ではなく組織および/または臓器に恐らく由来する。血液細胞ポリヌクレオチドは、血液細胞遺伝子とアラインメントされる配列を有し、非血液遺伝子とアラインメントされる配列を有する非血液ポリヌクレオチドではない。非血液遺伝子は、11%~24%の範囲である、平均するとライブラリー内のTPMの18%に相当した。非血液遺伝子は、検出された全遺伝子(TPM≧3の場合に検出して計数した遺伝子)の15%、範囲8%~24%、に相当した。本研究で検出された2,855の非血液遺伝子のリストを表1に提示する。本研究で検出された、ストリンジェンシーがより低い非血液遺伝子のリストを、表10に提示する。
表1:無細胞mRNAにおいて検出された非血液遺伝子

Figure 2022509535000002
Figure 2022509535000003
Figure 2022509535000004
Figure 2022509535000005
Figure 2022509535000006
Figure 2022509535000007
Figure 2022509535000008
Figure 2022509535000009
Figure 2022509535000010
Figure 2022509535000011
Figure 2022509535000012
Figure 2022509535000013
Figure 2022509535000014
表10:無細胞mRNAにおいて検出された低ストリンジェンシー非血液遺伝子
Figure 2022509535000015
Figure 2022509535000016
Figure 2022509535000017
Figure 2022509535000018
Figure 2022509535000019
Figure 2022509535000020
Figure 2022509535000021
Figure 2022509535000022
Figure 2022509535000023
Figure 2022509535000024
Figure 2022509535000025
Figure 2022509535000026
Figure 2022509535000027
Figure 2022509535000028
Figure 2022509535000029
Figure 2022509535000030
Figure 2022509535000031
Figure 2022509535000032
Figure 2022509535000033
Figure 2022509535000034
Figure 2022509535000035
Figure 2022509535000036
Figure 2022509535000037
Figure 2022509535000038
Figure 2022509535000039
Figure 2022509535000040
Figure 2022509535000041
Figure 2022509535000042
Figure 2022509535000043
Figure 2022509535000044
Figure 2022509535000045
Figure 2022509535000046
Figure 2022509535000047
Figure 2022509535000048
Figure 2022509535000049
Figure 2022509535000050
Figure 2022509535000051
Figure 2022509535000052
Figure 2022509535000053
Figure 2022509535000054
Figure 2022509535000055
Whole blood and matched plasma samples were sequenced to identify "non-blood" genes. A gene is considered "non-blood" if its normalized expression (transcriptions per million, TPM) is three-fold higher in plasma than whole blood (containing blood cells). The "non-blood" gene is probably derived from tissues and / or organs rather than blood cells. A blood cell polynucleotide has a sequence aligned with a blood cell gene and is not a non-blood polynucleotide having a sequence aligned with a non-blood gene. Non-blood genes ranged from 11% to 24%, representing 18% of the TPM in the library on average. Non-blood genes corresponded to 15% of all detected genes (genes detected and counted when TPM ≧ 3), ranging from 8% to 24%. A list of 2,855 non-blood genes detected in this study is presented in Table 1. A list of non-blood genes with lower stringency detected in this study is presented in Table 10.
Table 1: Non-blood genes detected in cell-free mRNA
Figure 2022509535000002
Figure 2022509535000003
Figure 2022509535000004
Figure 2022509535000005
Figure 2022509535000006
Figure 2022509535000007
Figure 2022509535000008
Figure 2022509535000009
Figure 2022509535000010
Figure 2022509535000011
Figure 2022509535000012
Figure 2022509535000013
Figure 2022509535000014
Table 10: Low stringency non-blood genes detected in cell-free mRNA
Figure 2022509535000015
Figure 2022509535000016
Figure 2022509535000017
Figure 2022509535000018
Figure 2022509535000019
Figure 2022509535000020
Figure 2022509535000021
Figure 2022509535000022
Figure 2022509535000023
Figure 2022509535000024
Figure 2022509535000025
Figure 2022509535000026
Figure 2022509535000027
Figure 2022509535000028
Figure 2022509535000029
Figure 2022509535000030
Figure 2022509535000031
Figure 2022509535000032
Figure 2022509535000033
Figure 2022509535000034
Figure 2022509535000035
Figure 2022509535000036
Figure 2022509535000037
Figure 2022509535000038
Figure 2022509535000039
Figure 2022509535000040
Figure 2022509535000041
Figure 2022509535000042
Figure 2022509535000043
Figure 2022509535000044
Figure 2022509535000045
Figure 2022509535000046
Figure 2022509535000047
Figure 2022509535000048
Figure 2022509535000049
Figure 2022509535000050
Figure 2022509535000051
Figure 2022509535000052
Figure 2022509535000053
Figure 2022509535000054
Figure 2022509535000055

(実施例2 サイズ分画による組織由来cf-mRNAの濃縮)
一般に、血液中の大部分のRNAは血液細胞内に見られる。血清および血漿を調製するための方法は、大部分の血液細胞を除去する低速回転を一般に伴う。しかし、残留血液細胞は、cf-RNAの解析に干渉し得るノイズの大きな原因である。
(Example 2 Concentration of tissue-derived cf-mRNA by size fractionation)
Generally, most RNA in blood is found in blood cells. Methods for preparing serum and plasma generally involve slow rotation to remove most blood cells. However, residual blood cells are a major source of noise that can interfere with the analysis of cf-RNA.

GTEx組織発現データベースを使用して、組織特異的および臓器特異的遺伝子を同定した。遺伝子は、その発現が、ある組織または臓器において全ての他の組織および臓器と比較して少なくとも5倍高い場合、組織または臓器特異的と見なす。本研究で検出された組織特異的および臓器特異的遺伝子を表2~7に提示する。
表2:無細胞mRNAにおいて検出された組織特異的遺伝子(455)

Figure 2022509535000056
Figure 2022509535000057
Figure 2022509535000058
表3:無細胞mRNAにおいて検出された赤血球特異的遺伝子(23)
Figure 2022509535000059
表4:無細胞mRNAにおいて検出された血小板特異的遺伝子(326)
Figure 2022509535000060
Figure 2022509535000061
表5:無細胞mRNAにおいて検出された好中球特異的遺伝子(239)
Figure 2022509535000062
Figure 2022509535000063
表6:無細胞mRNAにおいて検出された脳特異的遺伝子(163)
Figure 2022509535000064
表7:無細胞mRNAにおいて検出された肝臓特異的遺伝子(63)
Figure 2022509535000065
The GTEx tissue expression database was used to identify tissue-specific and organ-specific genes. A gene is considered tissue or organ specific if its expression is at least 5-fold higher in one tissue or organ compared to all other tissues and organs. The tissue-specific and organ-specific genes detected in this study are presented in Tables 2-7.
Table 2: Tissue-specific genes detected in cell-free mRNA (455)
Figure 2022509535000056
Figure 2022509535000057
Figure 2022509535000058
Table 3: Erythrocyte-specific genes detected in cell-free mRNA (23)
Figure 2022509535000059
Table 4: Platelet-specific genes detected in cell-free mRNA (326)
Figure 2022509535000060
Figure 2022509535000061
Table 5: Neutrophil-specific genes detected in cell-free mRNA (239)
Figure 2022509535000062
Figure 2022509535000063
Table 6: Brain-specific genes detected in cell-free mRNA (163)
Figure 2022509535000064
Table 7: Liver-specific genes detected in cell-free mRNA (63)
Figure 2022509535000065

表8および9は、非血液遺伝子のストリンジェントな基準を満たさない、肝臓特異的疾患および妊娠の診断のための目的の遺伝子を提示する。
表8:無細胞mRNAにおいて検出されたさらなる肝臓特異的遺伝子

Figure 2022509535000066
表9:無細胞mRNAにおいて検出された妊娠関連遺伝子
Figure 2022509535000067
Tables 8 and 9 present genes of interest for the diagnosis of liver-specific diseases and pregnancies that do not meet the stringent criteria for non-blood genes.
Table 8: Additional liver-specific genes detected in cell-free mRNA
Figure 2022509535000066
Table 9: Pregnancy-related genes detected in cell-free mRNA
Figure 2022509535000067

(実施例2 サイズ分画による組織由来cf-mRNAの濃縮)
一般に、血液中の大部分のRNAは血液細胞内に見られる。血清および血漿を調製するための方法は、大部分の血液細胞を除去する低速回転を一般に伴う。しかし、残留血液細胞は、cf-RNAの解析に干渉し得るノイズの大きな原因である。
(Example 2 Concentration of tissue-derived cf-mRNA by size fractionation)
Generally, most RNA in blood is found in blood cells. Methods for preparing serum and plasma generally involve slow rotation to remove most blood cells. However, residual blood cells are a major source of noise that can interfere with the analysis of cf-RNA.

血清または血漿に関して行うサイズ選択は、血液細胞由来cf-mRNAと比較して固形組織由来cf-mRNAの比を増加させることができる。血漿または血清を調製するために、細胞を1,600g回転で沈降させる。第2の遠心分離ステップを実行して組織由来cf-mRNAを濃縮した。血漿を、1,900g~16,000gの範囲の沈降力を生じさせる様々な速度で10分間、遠心分離し、その後、cf-RNA単離、cDNA合成、ライブラリー調製およびシークエンシングを行った。遠心分離速度が上昇すると、血液細胞成分からのRNA転写物である血小板、および好中球転写物(血液細胞からの転写物を代表する)は、肝臓または脳からの転写物などの組織特異的転写物よりも迅速に減少し、その結果、非血液cf-mRNAの血液細胞由来cf-mRNAに対する比が増加した(図2A~3B)。この濃縮は、検出可能な組織由来遺伝子の数の減少によって相殺された(図4)。低ノイズの、しかし代表的なかつ多様なcf-mRNAライブラリーの調製に最適な速度は、適用に依存し、多くの場合、10,000g~16,000gの範囲である。例えば、脳cf-mRNA転写物と比較して肝臓cf-mRNA転写物の解析には、より速い遠心分離速度のほうが好ましい。下記に提示する結果には16,000gのgを使用した。 Size selection made for serum or plasma can increase the ratio of solid tissue-derived cf-mRNA compared to blood cell-derived cf-mRNA. To prepare plasma or serum, cells are settled at a rotation of 1,600 g. A second centrifugation step was performed to concentrate tissue-derived cf-mRNA. Plasma was centrifuged for 10 minutes at various rates producing sedimentation forces ranging from 1,900 g to 16,000 g, followed by cf-RNA isolation, cDNA synthesis, library preparation and sequencing. As the rate of centrifugation increases, platelets, which are RNA transcripts from blood cell components, and neutrophil transcripts (representing transcripts from blood cells) are tissue-specific, such as transcripts from the liver or brain. It decreased more rapidly than the transcript, resulting in an increased ratio of non-blood cf-mRNA to blood cell-derived cf-mRNA (FIGS. 2A-3B). This enrichment was offset by a decrease in the number of detectable tissue-derived genes (Fig. 4). Optimal rates for the preparation of low-noise, but representative and diverse cf-mRNA libraries depend on application and are often in the range of 10,000 g to 16,000 g. For example, faster centrifugation rates are preferred for analysis of liver cf-mRNA transcripts as compared to brain cf-mRNA transcripts. 16,000 g of g was used for the results presented below.

サイズ選択は、0.8μm、0.45μmまたは0.2μmのサイズカットオフでの膜による濾過によっても実行した(図2)。細孔径が減少すると、血液細胞成分からのRNA転写物である血小板、および好中球転写物(血液細胞からの転写物を代表する)は、肝臓または脳からの転写物などの組織特異的転写物よりも迅速に減少し、その結果、非血液cf-mRNAの血液細胞由来cf-mRNAに対する比が増加した。(図2)。 Size selection was also performed by membrane filtration with a size cutoff of 0.8 μm, 0.45 μm or 0.2 μm (FIG. 2). When the pore size decreases, platelets, which are RNA transcripts from blood cell components, and neutrophil transcripts (representing transcripts from blood cells) are tissue-specific transcripts such as transcripts from the liver or brain. It decreased more rapidly than the substance, resulting in an increase in the ratio of non-blood cf-mRNA to blood cell-derived cf-mRNA. (Fig. 2).

(実施例3 cf-mRNA抽出方法論の選択)
cf-mRNA抽出を最適化するために、全cf-RNAのフェノールに基づく抽出:TRIzol、miRNeasy(Qiagen)、Direct-zol(Zymo Research)、nucleoZOL(Macherey-Nagel)、mirVana(Life Technologies);細胞外小胞捕捉に基づく手法に続いての溶解(フェノールに基づくまたは基づかない、どちらか):exoRNeasy(Qiagen)、ExoComplete(Hitachi);小胞の免疫選択または免疫枯渇に続いての核酸の抽出;溶解に続いての全RNA/核酸単離:Plasma/Serum RNA Purification Mini Kit(Norgen)、QIAamp Circulating Nucleic Acids kit(「CNAキット」)、QIAamp ccfDNA/RNAキット(Qiagen);などを含む、様々なキットおよび方法を評価した。CNAキットは、cf-RNA抽出の効率とスケーラビリティーと線形性と整合性との最高のバランスを示した(図5を参照)ため、選択した。CNAキットは、循環cf-RNAが遊離RNAとして移動するのか、タンパク質、脂質または小胞により保護されるのかを問わない、全cf-RNA抽出キットである。
(Example 3 Selection of cf-mRNA extraction methodology)
To optimize cf-mRNA extraction, phenol-based extraction of total cf-RNA: TRIzol, miRNeasy (Qiagen), Direct-zol (Zymo Research), nucleic acid ZOL (Machery-Nagel), mirVana (Life) Dissolution following a technique based on external vesicle capture (either based or non-phenolic): exoRNAsy (Qiagen), ExoComplete (Hitachi); nucleic acid extraction following vesicle immunoselection or immunodepletion; Total RNA / nucleic acid isolation following lysis: Plasma / Serum RNA Purification Mini Kit (Norgen), QIAamp Circulating Nucleic Acids kit (“CNA kit”), various QIAamp cfDNA / RNA kits (Qiagen, etc.) The kit and method were evaluated. The CNA kit was selected because it showed the best balance between efficiency, scalability, linearity and consistency of cf-RNA extraction (see Figure 5). The CNA kit is a total cf-RNA extraction kit regardless of whether the circulating cf-RNA is transferred as free RNA or protected by proteins, lipids or vesicles.

cf-RNAは、in vivoで分解される傾向があり、抽出プロセス中にさらに断片化される。miRNAも、典型的にmRNAより短い。したがって、Qiagenの「miRNA精製」プロトコールを、それらの標準的な「核酸精製」プロトコールの代わりに選択した。 The cf-RNA tends to be degraded in vivo and is further fragmented during the extraction process. MiRNAs are also typically shorter than mRNAs. Therefore, Qiagen's "miRNA purification" protocol was selected in place of their standard "nucleic acid purification" protocol.

抽出の効率および整合性を最大にするために、CNAキットで供給されるプロトコールに複数の変更を加えた。プロトコールを、(1)担体RNAを、それはシークエンシング結果に干渉するので、溶解緩衝液に添加しないこと;(2)溶解中にERCC外部参照RNAをスパイクインすること;(3)溶解緩衝液を溶解温度(25℃ではなく60℃)に予め加温すること;(4)溶解時間を30分から最低45分に延長すること;(5)試料から阻害剤をよりよく除去するために第2の100%エタノール洗浄ステップを加えること;および(6)カラムからRNAをより完全に除去するために第2の核酸溶出ステップを加えることによって、適応させた。改良した方法で抽出されたポリヌクレオチドのサイズ分布は、標準核酸精製プロトコールと比較して断片化cf-RNAの収量改善を明示した(図6A~6B)。CNAキットでのこの改良型抽出法は、QIAamp ccfDNA/RNAキットよりも多くのcf-mRNAをもたらし、血漿投入量の増加または低減に伴って線形的によりよい結果を示した(図7)。 Several changes were made to the protocol supplied with the CNA kit to maximize extraction efficiency and consistency. Do not add the protocol, (1) carrier RNA, to the lysis buffer as it interferes with the sequencing results; (2) spike in ERCC external reference RNA during lysis; (3) lyse buffer. Pre-warming to a dissolution temperature (60 ° C instead of 25 ° C); (4) extending the dissolution time from 30 minutes to a minimum of 45 minutes; (5) a second to better remove the inhibitor from the sample. Adapted by adding a 100% ethanol wash step; and (6) adding a second nucleic acid lysis step to more completely remove RNA from the column. The size distribution of the polynucleotides extracted by the improved method demonstrated improved yields of fragmented cf-RNA compared to the standard nucleic acid purification protocol (FIGS. 6A-6B). This improved extraction method with the CNA kit yielded more cf-mRNA than the QIAamp cfDNA / RNA kit and showed linearly better results with increasing or decreasing plasma input (FIG. 7).

DNA夾雑およびキャリーオーバーを除去するために専用の酵素的DNaseステップをプロトコールに組み込んだ。低レベルDNA夾雑は、遺伝子発現定量の際に誤差の原因になることがあるが、血清または血漿中のcf-RNAの量が極めて少ないのでcf-RNA単離には妥当であることもある。一部の市販のcf-RNA抽出キットは、DNAを除去するステップを無視するか(例えば、フェノールに基づく多くのキット)、またはDNAの完全な除去に最適とは言えないことがあるカラム上DNase I処理を推奨していた。実際、DNase Iは、RNA抽出中に大量に存在する塩に対して感受性であり得、低いDNA濃度で低い効率を有することがあり得る(これは、無細胞体液で作用させる場合に当てはまり得る)。DNAに対する親和性が増大したDNase Iの変異バージョンであるTurbo DNase(Ambion)を利用した。なぜなら、これは、微量のDNAの除去に特に有効であり、阻害剤に対する耐性がより高いからである。DNase処理は、1試料当たり酵素2.5~3μlに酵素の量を増加させたことを除いて、Ambionプロトコールに従って行った。DNase I処理は、そうしなければcf-RNA分析に干渉することになる夾雑核酸の実質的な量を排除した(図8)。 A dedicated enzymatic DNase step was incorporated into the protocol to remove DNA contamination and carryover. Low-level DNA contamination can cause errors in quantifying gene expression, but it may also be valid for cf-RNA isolation due to the very low amount of cf-RNA in serum or plasma. Some commercially available cf-RNA extraction kits either ignore the step of removing DNA (eg, many phenol-based kits) or may not be optimal for complete removal of DNA. I recommended processing. In fact, DNase I can be sensitive to salts that are abundant in RNA extraction and can have low efficiency at low DNA concentrations (this may be the case when working with cell-free body fluids). .. A mutant version of DNase I with increased affinity for DNA, Turbo DNase (Ambion), was used. This is because it is particularly effective in removing trace amounts of DNA and is more resistant to inhibitors. DNase treatment was performed according to the Ambion protocol, except that the amount of enzyme was increased to 2.5-3 μl per sample. DNase I treatment eliminated a substantial amount of contaminating nucleic acid that would otherwise interfere with cf-RNA analysis (FIG. 8).

抽出された材料の下流の反応への投入量の滴定は、生化学反応の効率を低下させる、血液からの可変的な微量の阻害剤を明示した。それ故、阻害剤除去ステップおよびシリカ膜に基づく精製ステップをDNAse処理後に実行した。阻害剤除去は、OneStep PCR Inhibitor Removalキット(Zymo)と、調製用緩衝液の完全な除去を確実にするための追加のカラム洗浄を用いて実行した。このカラムに対するクリーンアップは、酵素に干渉する夾雑物を除去することによりcf-RNAの見かけの収量を増加させ、OneStepカラムは、Micro Bio-Spinカラム(Bio-Rad)よりも高い見かけの収量を有した(図9)。OneStep PCR Inhibitor Removalキットを使用するクリーンアップは、断片化cf-RNAポリヌクレオチドの回収も保った(図10A~10B)。シリカ膜精製は、MinElute PCR Purificationキット(Qiagen)を用いて、最大回収のためにより大量のエタノールを使用して行った。 Titration of the amount of the extracted material into the downstream reaction revealed variable trace inhibitors from the blood that reduced the efficiency of the biochemical reaction. Therefore, inhibitor removal steps and silica membrane-based purification steps were performed after DNAse treatment. Inhibitor removal was performed using the OneStep PCR Inhibitor Removal Kit (Zymo) and additional column washes to ensure complete removal of preparation buffer. Cleanup for this column increases the apparent yield of cf-RNA by removing impurities that interfere with the enzyme, and the OneStep column yields a higher apparent yield than the Micro Bio-Spin column (Bio-Rad). Had (Fig. 9). Cleanup using the OneStep PCR Inhibitor Removal kit also preserved the recovery of fragmented cf-RNA polynucleotides (FIGS. 10A-10B). Silica membrane purification was performed using the MinElute PCR Purification Kit (Qiagen) with higher ethanol for maximum recovery.

最終cf-RNA抽出および精製プロセスは、20pg未満のRNAの最適とは言えない収量に起因するアッセイ失敗頻度を劇的に低下させ、ある範囲の投入体積(100ul~3ml)を使用すると無細胞mRNAの効率的かつ線形の回収をもたらした(図11~12)。 The final cf-RNA extraction and purification process dramatically reduces the frequency of assay failures due to suboptimal yields of RNA below 20 pg, and cell-free mRNA using a range of input volumes (100 ul-3 ml). Produced an efficient and linear recovery of (Figs. 11-12).

(実施例4 cDNA合成、ライブラリー調製、および全エクソーム捕捉)
市販の低投入量RNAシークエンシングキットは、cDNA合成のための試薬および情報価値のないRNA種の除去のための試薬を一般に含む。SMARTer(Takara)でのcDNA合成ステップは、非効率的であることが判明した。それ故、専用の最初のcDNA合成ステップと、第2鎖合成反応と、低レベルのdsDNAからのライブラリー調製および続いての全エクソームの捕捉用に最適化した市販のキットとを用いる、3ステップ戦略を開発した。
(Example 4 cDNA synthesis, library preparation, and total exosome capture)
Commercially available low input RNA sequencing kits generally include reagents for cDNA synthesis and removal of RNA species of no informative value. The cDNA synthesis step in SMARTer (Takara) has been found to be inefficient. Therefore, a three-step process using a dedicated first cDNA synthesis step and a second-strand synthesis reaction followed by a commercially available kit optimized for library preparation from low levels of dsDNA and subsequent capture of whole exosomes. Developed a strategy.

SuperScript IV(Invitrogen)を逆転写用の酵素として選択した。なぜなら、これは、iScript(Bio-Rad)、qScript(Quantabio)、SuperScript III(Invitrogen)およびSMARTScribe(Takara)と比較してcf-RNA投入を用いて、酵素効率、線形性および微量の阻害剤に対する耐性の増大を実証したからである。SuperScript IVでの変換効率を、(1)オリゴdTではなくランダムヘキサマーでプライミングすること、(2)プライマー濃度を30倍増加させて3mg/mlにすること、および(3)万が一に備えて反応時間を10分から50分に延長することによって、さらに最適化した。最適化したSuperScript IV方法は、iScriptよりも多いcDNAをもたらし(図13)、SMARTScribeよりも良好な線形性を有した(図14)。 SuperScript IV (Invitrogen) was selected as the enzyme for reverse transcription. Because it uses cf-RNA input compared to iScript (Bio-Rad), qScript (Quantavio), SuperScript III (Invitrogen) and SMARTScribe (Takara), for enzyme efficiency, linearity and trace inhibitors. This is because it demonstrated increased resistance. The conversion efficiency in SuperScript IV is (1) primed with random hexamers instead of oligo dT, (2) the primer concentration is increased 30-fold to 3 mg / ml, and (3) reaction in case of emergency. It was further optimized by extending the time from 10 minutes to 50 minutes. The optimized SuperScript IV method yielded more cDNA than iScript (FIG. 13) and had better linearity than SMARTScribe (FIG. 14).

NEBNext酵素を使用する第2鎖合成反応で二本鎖cDNAを生成した。第1鎖合成と第2鎖合成の間にクリーンアップを実行しなかった。使用する試薬および総反応体積を50%低減させることによって、第2鎖合成反応を最適化した。 A double-stranded cDNA was produced by a double-strand synthesis reaction using the NEBNext enzyme. No cleanup was performed between the first and second chain synthesis. The second chain synthesis reaction was optimized by reducing the reagents used and the total reaction volume by 50%.

Accel-NGS 2S Plusは、Accel-NGS 1S Plus(Swift Biosciences)およびその他、例えば、NxSeq(登録商標)UltraLow DNA Library Preparation Kit(Lucigen)と比較して、少量の投入cDNAからシークエンシングライブラリーを生成する最も堅牢性の高いスケーラブルなライブラリー調製方法であることが判明した。詳細には、ユニーク配列断片の数は、Accel-NGS 1S Plusと比較してAccel-NGS 2S Plusを使用するほうがおおよそ30%多かった(図15A)。NEBNext第2鎖合成ステップから残存する試薬は、Accel-NGS 2S Plusの修復Iステップの化学的性質と適合しなかった。それ故、修復Iの前に1.8倍SPRIビーズを使用してcDNAを清浄化した。試料喪失を最小限に抑えるために、溶液中でSPRIビーズを用いて修復Iを実行し、修復Iの後にポリエチレングリコール(PEG)を添加してビーズへのDNA結合を促進した。アプタマーおよびダイマーをはじめとする夾雑物を回避しながら回収を最大にするために、ビーズの量を、修復Iについては1.8倍、修復IIについては1.65、ライゲーションIについては1.65およびライゲーションIIについては1.4に調整した。Accel-NGS 2S Plusプロトコールに対するこれらの改良は、ユニーク配列断片の数をおおよそ20%増加させた(図15B)。 Accel-NGS 2S Plus is sequenced from Accel-NGS 1S Plus (Swift Biosciences) and other, eg, NxSeq® UltraLow DNA Library Preparation Kit (Lucien), in small amounts. It turned out to be the most robust and scalable library preparation method. Specifically, the number of unique sequence fragments was approximately 30% higher with Accel-NGS 2S Plus compared with Accel-NGS 1S Plus (FIG. 15A). The reagents remaining from the NEBNext 2nd chain synthesis step did not match the chemistry of the Repair I step of Accel-NGS 2S Plus. Therefore, the cDNA was cleaned using 1.8x SPRI beads prior to Repair I. Repair I was performed with SPRI beads in solution to minimize sample loss, and polyethylene glycol (PEG) was added after repair I to promote DNA binding to the beads. To maximize recovery while avoiding contaminants such as aptamers and dimers, increase the amount of beads 1.8 times for Repair I, 1.65 for Repair II, and 1.65 for Ligation I. And ligation II was adjusted to 1.4. These improvements to the Accel-NGS 2S Plus protocol increased the number of unique sequence fragments by approximately 20% (FIG. 15B).

PCR中および濃縮前に、各ライブラリー調製物の両端をUDIで一意に標識した。標準インデックスではなくUDIを選択してインデックスホッピングを最小限に抑えた。これは、投入材料の少ないコピー数を考えるとcf-RNAライブラリーにとって特に重要であった。標準インデックスを使用したとき、シークエンシングリードは、陰性対照(NTC)に誤指定された。この夾雑が、UDIの使用により軽減される(図16A~16B)。 Both ends of each library preparation were uniquely labeled with UDI during PCR and prior to enrichment. I chose UDI instead of the standard index to minimize index hopping. This was particularly important for the cf-RNA library given the small number of copies of the input material. When using the standard index, the sequencing read was misdesignated as a negative control (NTC). This contamination is reduced by the use of UDI (FIGS. 16A-16B).

cf-mRNAを全エクソーム捕捉によって全cf-RNAから濃縮した。mRNAが循環中のRNA分子の10%未満を構成するので、rRNA枯渇ではなくこの方法を選択した。捕捉は、RNAベイト(Agilent)またはDNA捕捉用プローブ(IDT)のどちらかで行う。目的の特異的領域についてのより高いカバレッジのため、RNAベイトのほうが好ましい。しかし、両方を両方とも使用することができる。正規化および品質管理のために、全エクソームプローブを、広範なコピー数およびサイズをカバーする35 ERCC標準物質を捕捉するように設計したプローブの別のセットと組み合わせ、これらを抽出ステップ中にスパイクした。捕捉は、XT2ブロッカーおよび試薬をXTプローブとともに使用するAgilentプロトコールの改良バージョンに従って、最大10のcDNA試料のプールを用いて実行した。mRNAならびに他の供給源、例えば、リボソームRNA、ミトコンドリアRNA、ノンコーディングRNAおよび他のRNA種、から生じるRNAポリヌクレオチドのパーセンテージをシークエンシングにより決定して、異なる濃縮戦略を比較した。mRNA分率は、rRNA枯渇による負の濃縮および全RNAの出発プールと比較して全エクソーム捕捉でのほうが実質的に高かった(図17)。詳細には、全エクソン捕捉材料からの配列リードのおおよそ80%がmRNA配列であり、rRNA枯渇後の配列のおおよそ45%がmRNA配列であり、全RNAからの配列の5%未満がmRNA配列であった。 cf-mRNA was enriched from total cf-RNA by total exosome capture. This method was chosen over rRNA depletion because mRNA constitutes less than 10% of the circulating RNA molecules. Capture is performed with either an RNA bait or a DNA capture probe (IDT). RNA baits are preferred because of the higher coverage for the specific region of interest. However, both can be used. For normalization and quality control, whole exome probes were combined with another set of probes designed to capture 35 ERCC standards covering a wide range of copy numbers and sizes, and these were spiked during the extraction step. did. Capture was performed using a pool of up to 10 cDNA samples according to an improved version of the Agilent protocol using XT2 blockers and reagents with XT probes. Different enrichment strategies were compared by sequencing the percentage of RNA polynucleotides resulting from mRNA and other sources, such as ribosomal RNA, mitochondrial RNA, non-coding RNA and other RNA species. The mRNA fraction was substantially higher in total exosomal capture compared to negative enrichment due to rRNA depletion and the starting pool of total RNA (FIG. 17). Specifically, approximately 80% of sequence reads from total exon capture material are mRNA sequences, approximately 45% of sequences after rRNA depletion are mRNA sequences, and less than 5% of sequences from total RNA are mRNA sequences. there were.

このセクションで提示したcDNA合成、ライブラリー調製および全エクソーム捕捉方法は、SMARTerキットを使用して構築し、rRNAを枯渇させたライブラリーと比較して、広範囲のcf-mRNAをよりよく代表するシークエンシングリードをもたらした。少量のスパイクインERCC標準物質を検出する感度を5~20倍改善した(図18A)。この感度増大は、実質的により多くのタンパク質コード遺伝子の検出を助長した(図18B)。既知濃度のスパイクインERCC標準物質を使用して、検出感度は、おおよそ14コピーであると推定した(図18C)。 The cDNA synthesis, library preparation and total exosome capture methods presented in this section were constructed using the SMARTer kit and are sequences that better represent a wide range of cf-mRNA compared to rRNA-depleted libraries. Brought a single lead. The sensitivity to detect a small amount of spike-in ERCC standard material was improved by 5 to 20 times (Fig. 18A). This increased sensitivity facilitated the detection of substantially more protein-encoding genes (Fig. 18B). Using a known concentration of spike-in ERCC standard material, the detection sensitivity was estimated to be approximately 14 copies (FIG. 18C).

(実施例5 他のcf-mRNAライブラリーとの比較)
実施例1の方法により調製した無細胞mRNAライブラリーは、「Panら」無細胞mRNAライブラリー(Pan et al, Clin Chem.2017 Nov;63(11):1695-1704)よりも優れていた。この解析のために、両方の研究からの生シークエンシングデータを、実施例1で説明したバイオインフォマティクスパイプラインを使用して処理した。Panライブラリーは、1調製当たり500μlの血清の等価物から調製されたが、実施例1ライブラリーを調製するために1調製当たり165μlの血清しか使用しなかった。1調製当たりおおよそ2分の1のシークエンシングリード(図19A)にもかかわらず、実施例1プロトコール(16,000gでの遠心分離およびDNA捕捉用プローブでの濃縮を用いて改良した)は、おおよそ6倍多いユニーク断片(図19B)、おおよそ3倍多いタンパク質コード遺伝子(図19C)、>80%のカバレッジを有する、おおよそ4倍多い遺伝子(図19D)、およびおおよそ8倍多い肝臓遺伝子(図19E)をもたらした。
(Example 5 Comparison with other cf-mRNA libraries)
The cell-free mRNA library prepared by the method of Example 1 was superior to the "Pan et al." Cell-free mRNA library (Pan et al, Clin Chem. 2017 Nov; 63 (11): 1695-1704). For this analysis, raw sequencing data from both studies were processed using the bioinformatics pipeline described in Example 1. The Pan library was prepared from an equivalent of 500 μl serum per preparation, but only 165 μl serum per preparation was used to prepare the Example 1 library. Despite approximately half the sequencing leads per preparation (FIG. 19A), the Example 1 protocol (improved using centrifugation at 16,000 g and concentration with a DNA capture probe) is approximately. 6-fold more unique fragments (Fig. 19B), approximately 3-fold more protein-encoding genes (Fig. 19C), approximately 4-fold more genes with> 80% coverage (Fig. 19D), and approximately 8-fold more liver genes (Fig. 19E). ) Was brought.

本開示の好ましい実施形態を本明細書で示し、説明したが、このような実施形態が単なる例として提供されていることは当業者には明らかであろう。本開示から逸脱することなく、非常に多くの変形形態、変更形態および置換形態が、今や当業者の心に浮かぶことであろう。本明細書に記載の本開示の実施形態の様々な代替形態を、本開示の実施の際に利用することができることは、理解されるはずである。下記の請求項により本開示の範囲が定義されること、およびこれらの請求項の範囲内の方法および構造ならびにそれらの均等物がこれらの請求項に包含されることを意図している。 Preferred embodiments of the present disclosure have been shown and described herein, but it will be apparent to those of skill in the art that such embodiments are provided by way of example only. Numerous variants, modifications and substitutions will now come to the minds of those skilled in the art without departing from the present disclosure. It should be understood that various alternatives of the embodiments described herein are available in the practice of the present disclosure. The following claims define the scope of the present disclosure, and it is intended that the methods and structures within these claims and their equivalents are included in these claims.

Claims (86)

cf-RNA試料を調製する方法であって、
(a)生体試料を1,600g~16,000gで遠心分離するステップ、および
(b)RNAを前記生体試料から単離するステップ
を含み、
表1のリストから選択される少なくとも500、600、700、800、900、1000、1100、1200、1300、1400もしくは1500の非血液遺伝子、または表10から選択される低ストリンジェンシー非血液遺伝子が、前記cf-RNA試料中に存在する、方法。
A method for preparing a cf-RNA sample.
It comprises (a) centrifuging the biological sample at 1,600 g to 16,000 g and (b) isolating RNA from the biological sample.
At least 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 or 1500 non-blood genes selected from the list in Table 1 or low stringency non-blood genes selected from Table 10 are: The method present in the cf-RNA sample.
前記生体試料が無細胞である、請求項1に記載の方法。 The method according to claim 1, wherein the biological sample is cell-free. 前記生体試料が、血清、血漿、唾液、尿、間質液、脳脊髄液、精液、膣液、羊水、涙、滑液、粘液またはリンパ液である、請求項1または2に記載の方法。 The method according to claim 1 or 2, wherein the biological sample is serum, plasma, saliva, urine, interstitial fluid, cerebrospinal fluid, semen, vaginal fluid, amniotic fluid, tears, synovial fluid, mucus or lymph. 前記生体試料が、血清または血漿である、請求項1から3のいずれか一項に記載の方法。 The method according to any one of claims 1 to 3, wherein the biological sample is serum or plasma. (b)の前に前記生体試料においてサイズ選択または免疫選択を実行するステップをさらに含む、請求項1から4のいずれか一項に記載の方法。 The method according to any one of claims 1 to 4, further comprising a step of performing size selection or immunoselection in the biological sample prior to (b). 前記サイズ選択を実行するステップが、前記生体試料の遠心分離を含む、請求項5に記載の方法。 5. The method of claim 5, wherein the step of performing the size selection comprises centrifuging the biological sample. 前記遠心分離が、少なくとも1分間、少なくとも10分間、5分~20分、10分~15分、または約10分間実行される、請求項6に記載の方法。 The method of claim 6, wherein the centrifugation is performed for at least 1 minute, at least 10 minutes, 5 minutes to 20 minutes, 10 minutes to 15 minutes, or about 10 minutes. 前記サイズ選択を実行するステップが、前記試料を濾過することを含む、請求項5に記載の方法。 5. The method of claim 5, wherein the step of performing the size selection comprises filtering the sample. 前記生体試料が、10,000g~15,000gで遠心分離される、請求項1から8のいずれか一項に記載の方法。 The method according to any one of claims 1 to 8, wherein the biological sample is centrifuged at 10,000 g to 15,000 g. 前記生体試料が、約12,000gで遠心分離される、請求項1から9のいずれか一項に記載の方法。 The method according to any one of claims 1 to 9, wherein the biological sample is centrifuged at about 12,000 g. (b)が、細胞外小胞を前記生体試料から単離すること、および前記RNAを前記細胞外小胞から単離することを含む、請求項1から10のいずれか一項に記載の方法。 The method according to any one of claims 1 to 10, wherein (b) comprises isolating the extracellular vesicle from the biological sample and isolating the RNA from the extracellular vesicle. .. 前記細胞外小胞が、エキソソームである、請求項11に記載の方法。 11. The method of claim 11, wherein the extracellular vesicles are exosomes. (b)が、ヌクレオプロテイン複合体を前記生体試料から単離すること、および前記RNAを前記ヌクレオプロテイン複合体から単離することを含む、請求項1から12のいずれか一項に記載の方法。 The method according to any one of claims 1 to 12, wherein (b) comprises isolating the nucleoprotein complex from the biological sample and isolating the RNA from the nucleoprotein complex. .. 前記RNAをデオキシリボヌクレアーゼで処理するステップをさらに含む、請求項1から13のいずれか一項に記載の方法。 The method according to any one of claims 1 to 13, further comprising treating the RNA with a deoxyribonuclease. 前記デオキシリボヌクレアーゼが、TurboDNase Iである、請求項14に記載の方法。 15. The method of claim 14, wherein the deoxyribonuclease is TurboDNase I. 前記RNAが、前記デオキシリボヌクレアーゼで処理されるとき溶液中にある、請求項14または15に記載の方法。 The method of claim 14 or 15, wherein the RNA is in solution when treated with the deoxyribonuclease. (b)が、前記RNAを親和性カラム、脱塩カラム、またはシリカ膜のうちの少なくとも1つと接触させることを含む、請求項1から16のいずれか一項に記載の方法。 The method according to any one of claims 1 to 16, wherein (b) comprises contacting the RNA with at least one of an affinity column, a desalted column, or a silica membrane. (b)が、前記RNAを親和性カラム、脱塩カラム、およびシリカ膜と接触させることを含む、請求項17に記載の方法。 17. The method of claim 17, wherein (b) comprises contacting the RNA with an affinity column, a desalting column, and a silica membrane. 少なくとも1つのタンパク質コードヌクレオチド配列を濃縮するステップをさらに含む、請求項1から18のいずれか一項に記載の方法。 The method of any one of claims 1-18, further comprising the step of concentrating at least one protein-encoding nucleotide sequence. リボソームRNA配列を前記RNAから枯渇させるステップを含む、請求項1から19のいずれか一項に記載の方法。 The method of any one of claims 1-19, comprising the step of depleting the ribosomal RNA sequence from said RNA. cf-RNA分子を同定する方法であって、
(a)RNAを生体試料から単離するステップ、
(b)cDNAライブラリーを前記RNAから調製するステップ、
(c)前記cDNAライブラリーをシークエンシングするステップ、および
(d)前記cDNAライブラリー中の少なくとも1つの遺伝子を同定するステップ
を含み、前記生体試料が実質的に無細胞であり、表1のリストから選択される少なくとも500、600、700、800、900、1000、1100、1200、1300、1400もしくは1500の非血液遺伝子、または表10から選択される低ストリンジェンシー非血液遺伝子が検出される、方法。
A method for identifying cf-RNA molecules,
(A) Steps to isolate RNA from a biological sample,
(B) Steps to prepare a cDNA library from the RNA,
The list in Table 1, comprising (c) sequencing the cDNA library and (d) identifying at least one gene in the cDNA library, wherein the biological sample is substantially cell-free. A method of detecting at least 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400 or 1500 non-blood genes selected from, or low stringency non-blood genes selected from Table 10. ..
前記生体試料が無細胞である、請求項21に記載の方法。 21. The method of claim 21, wherein the biological sample is cell-free. (e)前記cDNAライブラリーからの配列を参照ゲノムとアラインメントするステップをさらに含む、請求項21または22に記載の方法。 (E) The method of claim 21 or 22, further comprising aligning the sequence from the cDNA library with the reference genome. 前記生体試料が、血清、血漿、唾液、尿、間質液、脳脊髄液、精液、膣液、羊水、涙、滑液、粘液またはリンパ液である、請求項21から23のいずれか一項に記載の方法。 13. The method described. 前記生体試料が、血清または血漿である、請求項21から23のいずれか一項に記載の方法。 The method according to any one of claims 21 to 23, wherein the biological sample is serum or plasma. 表2から選択される少なくとも35、50、75、100、200、300、400または500の組織特異的遺伝子が同定される、請求項21から25のいずれか一項に記載の方法。 The method of any one of claims 21-25, wherein at least 35, 50, 75, 100, 200, 300, 400 or 500 tissue-specific genes selected from Table 2 are identified. 表6から選択される少なくとも20、30、40、50、100または150の脳特異的遺伝子が同定される、請求項21から25のいずれか一項に記載の方法。 The method of any one of claims 21-25, wherein at least 20, 30, 40, 50, 100 or 150 brain-specific genes selected from Table 6 are identified. 表7から選択される少なくとも3、5、10、20もしくは50の肝臓特異的遺伝子、または表8から選択される1つの肝臓診断用遺伝子が、同定される、請求項21から25のいずれか一項に記載の方法。 One of claims 21 to 25, wherein at least 3, 5, 10, 20 or 50 liver-specific genes selected from Table 7 or one liver diagnostic gene selected from Table 8 are identified. The method described in the section. 表9から選択される少なくとも3、5、10または15の妊娠関連遺伝子が同定される、請求項21から25のいずれか一項に記載の方法。 The method of any one of claims 21-25, wherein at least 3, 5, 10 or 15 pregnancy-related genes selected from Table 9 are identified. 第1の遺伝子が同定され、前記RNAが、前記第1の遺伝子とアラインメントされる500、200、150、100、50、25または15未満のcf-mRNAポリヌクレオチドを含む、請求項21から28のいずれか一項に記載の方法。 21-28, wherein the first gene is identified and the RNA comprises less than 500, 200, 150, 100, 50, 25 or 15 cf-mRNA polynucleotides aligned with the first gene. The method described in any one of the items. 100リード当たり少なくとも2、4、6、8または10のユニークな断片が検出される、請求項21から30のいずれか一項に記載の方法。 The method of any one of claims 21-30, wherein at least 2, 4, 6, 8 or 10 unique fragments are detected per 100 reads. 10,000リード当たり少なくとも2、4、6、8または10のタンパク質コード遺伝子が検出される、請求項21から31のいずれか一項に記載の方法。 The method of any one of claims 21-31, wherein at least 2, 4, 6, 8 or 10 protein-encoding genes are detected per 10,000 reads. (a)の前に前記生体試料においてサイズ選択または免疫選択を実行するステップをさらに含む、請求項21から32のいずれか一項に記載の方法。 The method of any one of claims 21-32, further comprising the step of performing size selection or immunoselection in the biological sample prior to (a). 前記サイズ選択を実行するステップが、前記生体試料の遠心分離を含む、請求項33に記載の方法。 33. The method of claim 33, wherein the step of performing the size selection comprises centrifuging the biological sample. 前記生体試料を1,600g~16,000gで遠心分離することをさらに含む、請求項34に記載の方法。 34. The method of claim 34, further comprising centrifuging the biological sample at 1,600 g to 16,000 g. 前記遠心分離が、少なくとも1分間、少なくとも5分間、少なくとも10分間、5分~20分、10分~15分、または約10分間実行される、請求項35に記載の方法。 35. The method of claim 35, wherein the centrifugation is performed for at least 1 minute, at least 5 minutes, at least 10 minutes, 5 minutes to 20 minutes, 10 minutes to 15 minutes, or about 10 minutes. 前記生体試料が、10,000g~15,000gで遠心分離される、請求項35または36に記載の方法。 35. The method of claim 35 or 36, wherein the biological sample is centrifuged at 10,000 g to 15,000 g. 前記生体試料が、約12,000gで遠心分離される、請求項35または36に記載の方法。 35. The method of claim 35 or 36, wherein the biological sample is centrifuged at about 12,000 g. 前記サイズ選択を実行するステップが、前記試料を濾過することを含む、請求項34に記載の方法。 34. The method of claim 34, wherein the step of performing the size selection comprises filtering the sample. (a)が、細胞外小胞を前記生体試料から単離すること、および前記RNAを前記細胞外小胞から単離することを含む、請求項21から39のいずれか一項に記載の方法。 The method according to any one of claims 21 to 39, wherein (a) comprises isolating the extracellular vesicle from the biological sample and isolating the RNA from the extracellular vesicle. .. 前記細胞外小胞が、エキソソームである、請求項40に記載の方法。 40. The method of claim 40, wherein the extracellular vesicle is an exosome. (a)が、ヌクレオプロテイン複合体を前記生体試料から単離すること、および前記RNAを前記ヌクレオプロテイン複合体から単離することを含む、請求項21から41のいずれか一項に記載の方法。 The method according to any one of claims 21 to 41, wherein (a) comprises isolating the nucleoprotein complex from the biological sample and isolating the RNA from the nucleoprotein complex. .. 第1のヌクレオチド配列を含む外因性RNAポリヌクレオチドを前記生体試料に添加するステップ、および前記第1のヌクレオチド配列を含むcDNAポリヌクレオチドを検出するステップをさらに含み、前記cDNAポリヌクレオチドの前記第1のヌクレオチド配列が、前記RNAポリヌクレオチドの前記第1のヌクレオチド配列がウラシルを含む各位置にチミンを含む、請求項21から42のいずれか一項に記載の方法。 The first of the cDNA polynucleotides further comprises the step of adding an exogenous RNA polynucleotide comprising the first nucleotide sequence to the biological sample and the step of detecting a cDNA polynucleotide comprising the first nucleotide sequence. The method of any one of claims 21-42, wherein the nucleotide sequence comprises timine at each position where the first nucleotide sequence of the RNA polynucleotide comprises uracil. 前記RNAをデオキシリボヌクレアーゼで処理するステップをさらに含む、請求項21から43のいずれか一項に記載の方法。 The method of any one of claims 21-43, further comprising treating the RNA with a deoxyribonuclease. 前記デオキシリボヌクレアーゼが、TurboDNase Iである、請求項44に記載の方法。 44. The method of claim 44, wherein the deoxyribonuclease is TurboDNase I. 前記RNAが、前記デオキシリボヌクレアーゼで処理されるとき溶液中にある、請求項44または45に記載の方法。 44. The method of claim 44 or 45, wherein the RNA is in solution when treated with the deoxyribonuclease. (a)が、前記RNAを親和性カラム、脱塩カラム、またはシリカ膜のうちの少なくとも1つと接触させることを含む、請求項21から46のいずれか一項に記載の方法。 The method of any one of claims 21-46, wherein (a) comprises contacting the RNA with at least one of an affinity column, a desalted column, or a silica membrane. (a)が、前記RNAを親和性カラム、脱塩カラム、およびシリカ膜と接触させることを含む、請求項47に記載の方法。 47. The method of claim 47, wherein (a) comprises contacting the RNA with an affinity column, a desalting column, and a silica membrane. (b)が、前記RNAを、ランダム配列を含むプライマーと接触させることを含む、請求項21から48のいずれか一項に記載の方法。 The method of any one of claims 21-48, wherein (b) comprises contacting the RNA with a primer comprising a random sequence. 前記プライマーが、ヘキサヌクレオチドである、請求項49に記載の方法。 49. The method of claim 49, wherein the primer is a hexanucleotide. 前記ヘキサヌクレオチドの濃度が、少なくとも60μM、70μM、80μM、90μM、100μM、150μM、200μM、300μM、400μM、500μM、600μM、700μM、800μM、900μM、1000μM、1100μM、1200μM、1300μM、1400μMまたは1500μMである、請求項50に記載の方法。 The concentration of the hexanucleotide is at least 60 μM, 70 μM, 80 μM, 90 μM, 100 μM, 150 μM, 200 μM, 300 μM, 400 μM, 500 μM, 600 μM, 700 μM, 800 μM, 900 μM, 1000 μM, 1100 μM, 1200 μM, 1300 μM, 1400 μM or 1500 μM. The method according to claim 50. (b)が、一本鎖cDNAを形成することを含む、請求項21から51のいずれか一項に記載の方法。 The method according to any one of claims 21 to 51, wherein (b) comprises forming a single-stranded cDNA. 前記RNAを逆転写酵素と接触させて前記一本鎖cDNAを形成することをさらに含む、請求項52に記載の方法。 52. The method of claim 52, further comprising contacting the RNA with reverse transcriptase to form the single-stranded cDNA. 前記一本鎖cDNAから二本鎖cDNAを形成するステップをさらに含む、請求項51から53のいずれか一項に記載の方法。 The method according to any one of claims 51 to 53, further comprising the step of forming a double-stranded cDNA from the single-stranded cDNA. 前記一本鎖DNAをNEBNext DNAポリメラーゼと接触させて前記二本鎖cDNAを形成することをさらに含む、請求項54に記載の方法。 54. The method of claim 54, further comprising contacting the single-stranded DNA with a NEBNext DNA polymerase to form the double-stranded cDNA. ユニークデュアルインデックスを前記二本鎖cDNAの両末端にライゲーションするステップをさらに含む、請求項55に記載の方法。 55. The method of claim 55, further comprising ligating the unique dual index to both ends of the double-stranded cDNA. 少なくとも1つのタンパク質コードヌクレオチド配列を濃縮するステップをさらに含む、請求項21から56のいずれか一項に記載の方法。 The method of any one of claims 21-56, further comprising the step of concentrating at least one protein-encoding nucleotide sequence. リボソームRNA配列を前記RNAから枯渇させるステップを含む、請求項57に記載の方法。 57. The method of claim 57, comprising depleting the ribosomal RNA sequence from said RNA. リボソームRNA配列を前記cDNAライブラリーから枯渇させるステップを含む、請求項57に記載の方法。 57. The method of claim 57, comprising depleting the ribosomal RNA sequence from the cDNA library. 前記少なくとも1つのタンパク質コード配列を前記RNAから単離するステップを含む、請求項57から59のいずれか一項に記載の方法。 The method of any one of claims 57-59, comprising the step of isolating the at least one protein coding sequence from said RNA. 前記少なくとも1つのタンパク質コード配列を前記cDNAから単離するステップを含む、請求項57から59のいずれか一項に記載の方法。 The method of any one of claims 57-59, comprising the step of isolating the at least one protein coding sequence from the cDNA. 全エクソームベイトを前記cDNAにハイブリダイズさせるステップを含む、請求項61に記載の方法。 61. The method of claim 61, comprising the step of hybridizing whole exome bait to the cDNA. 前記全エクソームベイトが、RNAポリヌクレオチドを含む、請求項62に記載の方法。 62. The method of claim 62, wherein the whole exome bait comprises an RNA polynucleotide. 前記全エクソームベイトが、DNAポリヌクレオチドを含む、請求項62に記載の方法。 62. The method of claim 62, wherein the whole exome bait comprises a DNA polynucleotide. 生体試料中の少なくとも10、20、30、50または100の非血液cf-mRNA遺伝子を検出する方法であって、
(a)血清または血漿試料を少なくとも10分間、8,000g~16,000gで遠心分離して上清を形成するステップ、
(b)前記上清からRNAを抽出するステップ、
(c)前記RNAをデオキシリボヌクレアーゼと接触させるステップ、
(d)cDNAを前記RNAから形成するステップ、
(e)cDNAライブラリーを前記cDNAから調製するステップ、
(f)前記cDNAライブラリーをシークエンシングするステップ、および
(g)配列を参照ゲノムとアラインメントして、1生体試料当たり少なくとも10、20、30、50または100の非血液cf-mRNA遺伝子から生じる配列を同定するステップ
を含む、方法。
A method for detecting at least 10, 20, 30, 50 or 100 non-blood cf-mRNA genes in a biological sample.
(A) A step of centrifuging a serum or plasma sample at 8,000 g to 16,000 g for at least 10 minutes to form a supernatant.
(B) Step of extracting RNA from the supernatant,
(C) The step of contacting the RNA with a deoxyribonuclease,
(D) The step of forming cDNA from the RNA,
(E) A step of preparing a cDNA library from the cDNA,
(F) Steps to sequence the cDNA library, and (g) sequences resulting from at least 10, 20, 30, 50 or 100 non-blood cf-mRNA genes per biological sample aligned with the reference genome. A method that includes the steps to identify.
(h)目的の少なくとも10、20、30、50または100遺伝子からのポリヌクレオチド断片を含むベイトと前記cDNAライブラリーを接触させて、翻訳される遺伝子を濃縮するステップをさらに含む、請求項65に記載の方法。 (H) Claim 65 further comprises contacting the cDNA library with a bait containing a polynucleotide fragment from at least 10, 20, 30, 50 or 100 genes of interest to enrich the gene to be translated. The method described. (d)が、前記RNAを逆転写酵素と接触させて一本鎖cDNAを形成すること、および前記一本鎖cDNAを第2鎖合成酵素と接触させて二本鎖cDNAを形成することを含む、請求項65に記載の方法。 (D) comprises contacting the RNA with reverse transcriptase to form a single-stranded cDNA, and contacting the single-stranded cDNA with a double-stranded synthase to form a double-stranded cDNA. , The method of claim 65. (e)が、ユニークデュアルインデックスを前記cDNAライブラリーにライゲーションさせてインデックス付きcDNAライブラリーを形成することをさらに含む、請求項65に記載の方法。 65. The method of claim 65, further comprising ligating the unique dual index to the cDNA library to form an indexed cDNA library. 最大10のインデックス付きcDNAライブラリーをプールするステップをさらに含む、請求項68に記載の方法。 28. The method of claim 68, further comprising pooling up to 10 indexed cDNA libraries. (f)が、前記プールされたcDNAライブラリーに関する大規模並列シークエンシングを実行することを含む、請求項69に記載の方法。 39. The method of claim 69, wherein (f) comprises performing massively parallel sequencing with respect to the pooled cDNA library. 少なくとも25、50、75、100、200、300、400、500、600、700、800、900または1000遺伝子が、前記生体試料において検出される、請求項65から70のいずれか一項に記載の方法。 The invention according to any one of claims 65 to 70, wherein at least 25, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 genes are detected in the biological sample. Method. 前記配列が、1生体試料当たり少なくとも25、50、75、100、200、300、400、500、600、700、800、900または1000の非血液cf-mRNA遺伝子から生じる配列を同定するために、参照ゲノムとアラインメントされる、請求項65から71のいずれか一項に記載の方法。 To identify sequences that result from at least 25, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 non-blood cf-mRNA genes per biological sample. The method of any one of claims 65-71, which is aligned with the reference genome. 前記一本鎖cDNAを第2鎖合成酵素と接触させて前記二本鎖cDNAを形成するステップをさらに含む、請求項65から70のいずれか一項に記載の方法。 The method according to any one of claims 65 to 70, further comprising contacting the single-stranded cDNA with a double-stranded synthase to form the double-stranded cDNA. (c)が、溶液中で実行される、請求項65から70のいずれか一項に記載の方法。 The method according to any one of claims 65 to 70, wherein (c) is carried out in a solution. 生体試料中の少なくとも10、20、30、50または100の非血液cf-mRNA遺伝子を検出する方法であって、
(a)血清または血漿試料を1,900g~16,000gで遠心分離または濾過するステップ、
(b)RNA試料を上清から抽出するステップ、
(c)前記RNA試料をデオキシリボヌクレアーゼと接触させるステップ、
(d)前記RNAを逆転写酵素と接触させて一本鎖cDNAを形成するステップ、
(e)前記一本鎖cDNAを第2鎖合成酵素と接触させて二本鎖cDNAを形成するステップ、
(f)cDNAライブラリーを前記二本鎖cDNAから調製するステップ、
(g)ポリヌクレオチド断片を含むベイトとインデックス付きcDNAライブラリーを接触させて、翻訳される遺伝子を濃縮するステップ、
(h)前記cDNAライブラリーをシークエンシングするステップ、および
(i)配列を参照ゲノムとアラインメントして、1生体試料当たり少なくとも10、20、30、50または100の非血液cf-mRNA遺伝子から生じる配列を同定するステップ
を含む、方法。
A method for detecting at least 10, 20, 30, 50 or 100 non-blood cf-mRNA genes in a biological sample.
(A) A step of centrifuging or filtering a serum or plasma sample at 1,900 g to 16,000 g.
(B) Step of extracting RNA sample from supernatant,
(C) The step of contacting the RNA sample with a deoxyribonuclease,
(D) The step of contacting the RNA with reverse transcriptase to form a single-stranded cDNA.
(E) A step of contacting the single-stranded cDNA with a double-stranded synthase to form a double-stranded cDNA.
(F) The step of preparing a cDNA library from the double-stranded cDNA,
(G) A step of contacting a bait containing a polynucleotide fragment with an indexed cDNA library to concentrate the gene to be translated.
(H) Steps to sequence the cDNA library, and (i) Sequences resulting from at least 10, 20, 30, 50 or 100 non-blood cf-mRNA genes per biological sample, aligned with the reference genome. A method that includes the steps to identify.
(j)ユニークデュアルインデックスを前記cDNAに付加させてインデックス付きcDNAライブラリーを形成するステップをさらに含む、請求項65に記載の方法。 (J) The method of claim 65, further comprising the step of adding a unique dual index to the cDNA to form an indexed cDNA library. (k)最大10のインデックス付きcDNAライブラリーをプールするステップをさらに含む、請求項66に記載の方法。 (K) The method of claim 66, further comprising pooling up to 10 indexed cDNA libraries. (l)前記プールされたcDNAライブラリーに関する大規模並列シークエンシングを実行するステップをさらに含む、請求項77に記載の方法。 (L) The method of claim 77, further comprising performing massively parallel sequencing on the pooled cDNA library. (c)が、溶液中で実行される、請求項75から78のいずれか一項に記載の方法。 The method of any one of claims 75-78, wherein (c) is performed in solution. 表1のリストから選択される少なくとも500、600、700、800、900、1000、1250もしくは1500の非血液遺伝子または表10から選択される低ストリンジェンシー非血液遺伝子から生じるcDNA分子を含むcf-mRNAシークエンシングライブラリー。 Cf-mRNA containing cDNA molecules derived from at least 500, 600, 700, 800, 900, 1000, 1250 or 1500 non-blood genes selected from the list in Table 1 or low stringency non-blood genes selected from Table 10. Sequencing library. 1,000,000 cDNAポリヌクレオチド当たり、表1のリストから選択される少なくとも25、50、100、200、300、400、500、600、700、800、900もしくは1000の非血液遺伝子または表10から選択される低ストリンジェンシー非血液遺伝子から生じる少なくとも1つのcDNA分子を含むcf-mRNAシークエンシングライブラリー。 From at least 25, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900 or 1000 non-blood genes or Table 10 selected from the list in Table 1 per 1,000,000 cDNA polynucleotides. A cf-mRNA sequencing library containing at least one cDNA molecule originating from a low stringency non-blood gene of choice. 表2から選択される少なくとも35、50、100、200、300、400または500の組織特異的遺伝子から生じるcDNA分子を含む、請求項80または81に記載のcf-mRNAシークエンシングライブラリー。 The cf-mRNA sequencing library of claim 80 or 81, comprising cDNA molecules originating from at least 35, 50, 100, 200, 300, 400 or 500 tissue-specific genes selected from Table 2. 表6から選択される少なくとも18、20、50または100の脳特異的遺伝子から生じるcDNA分子を含む、請求項80または81に記載のcf-mRNAシークエンシングライブラリー。 The cf-mRNA sequencing library of claim 80 or 81, comprising cDNA molecules originating from at least 18, 20, 50 or 100 brain-specific genes selected from Table 6. 表7から選択される少なくとも3、5、10、20もしくは50の肝臓特異的遺伝子または表8から選択される目的の肝臓遺伝子から生じるcDNA分子を含む、請求項80または81に記載のcf-mRNAシークエンシングライブラリー。 The cf-mRNA according to claim 80 or 81, comprising a cDNA molecule derived from at least 3, 5, 10, 20 or 50 liver-specific genes selected from Table 7 or the liver gene of interest selected from Table 8. Sequencing library. 表9から選択される少なくとも3、5、10または15の妊娠関連遺伝子から生じるcDNA分子を含む、請求項80または81に記載のcf-mRNAシークエンシングライブラリー。 The cf-mRNA sequencing library of claim 80 or 81, comprising cDNA molecules originating from at least 3, 5, 10 or 15 pregnancy-related genes selected from Table 9. 少なくとも2000、3000、4000、5000または6000のタンパク質コード遺伝子から生じるcDNAポリヌクレオチドを含むcf-mRNAシークエンシングライブラリーであって、前記タンパク質コード遺伝子の少なくとも8%、15%または24%が非血液遺伝子である、cf-mRNAシークエンシングライブラリー。 A cf-mRNA sequencing library containing cDNA polynucleotides originating from at least 2000, 3000, 4000, 5000 or 6000 protein coding genes, wherein at least 8%, 15% or 24% of the protein coding genes are non-blood genes. The cf-mRNA sequencing library.
JP2021548558A 2018-10-30 2019-10-30 Cell-free RNA library preparation Pending JP2022509535A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862752533P 2018-10-30 2018-10-30
US62/752,533 2018-10-30
PCT/US2019/058961 WO2020092646A1 (en) 2018-10-30 2019-10-30 Cell-free rna library preparations

Publications (1)

Publication Number Publication Date
JP2022509535A true JP2022509535A (en) 2022-01-20

Family

ID=70463885

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021548558A Pending JP2022509535A (en) 2018-10-30 2019-10-30 Cell-free RNA library preparation

Country Status (7)

Country Link
US (1) US20220081685A1 (en)
EP (1) EP3874079A4 (en)
JP (1) JP2022509535A (en)
CN (1) CN114072546A (en)
AU (1) AU2019372123A1 (en)
CA (1) CA3117675A1 (en)
WO (1) WO2020092646A1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023048713A1 (en) * 2021-09-23 2023-03-30 Genomic Testing Cooperative, LCA Compositions and methods for targeted ngs sequencing of cfrna and cftna
US11866707B2 (en) 2022-05-18 2024-01-09 Zhejiang Cancer Hospital Use of non-coding RNA SNHG17 as biomarker and therapeutic target
CN114959041B (en) * 2022-06-19 2023-08-22 瓯江实验室 Novel target and diagnostic marker for inhibiting colorectal cancer proliferation metastasis and application thereof

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9708643B2 (en) * 2011-06-17 2017-07-18 Affymetrix, Inc. Circulating miRNA biomaker signatures
CN113337604A (en) * 2013-03-15 2021-09-03 莱兰斯坦福初级大学评议会 Identification and use of circulating nucleic acid tumor markers
CA2965528A1 (en) * 2014-11-14 2016-05-19 Liquid Genomics, Inc. Use of circulating cell-free rna for diagnosis and/or monitoring cancer
CA3007426A1 (en) * 2015-12-03 2017-06-08 Alfred Health Monitoring treatment or progression of myeloma
US20180126003A1 (en) * 2016-05-04 2018-05-10 Curevac Ag New targets for rna therapeutics
WO2018057928A1 (en) * 2016-09-23 2018-03-29 Grail, Inc. Methods of preparing and analyzing cell-free nucleic acid sequencing libraries
AU2018335290A1 (en) * 2017-09-20 2020-05-07 Molecular Stethoscope, Inc. Methods and systems for detecting tissue conditions

Also Published As

Publication number Publication date
EP3874079A4 (en) 2022-11-09
AU2019372123A1 (en) 2021-06-17
CA3117675A1 (en) 2020-05-07
EP3874079A1 (en) 2021-09-08
CN114072546A (en) 2022-02-18
US20220081685A1 (en) 2022-03-17
WO2020092646A1 (en) 2020-05-07

Similar Documents

Publication Publication Date Title
JP7128866B2 (en) Methods for isolating microvesicles and methods for extracting nucleic acids from biological samples
JP5909444B2 (en) Nucleic acid analysis
US9657330B2 (en) Serial isolation of multiple DNA targets from stool
JP2022509535A (en) Cell-free RNA library preparation
US20160122753A1 (en) High-throughput rna-seq
US20070254305A1 (en) Methods of whole genome or microarray expression profiling using nucleic acids prepared from formalin fixed paraffin embedded tissue
JP2022115972A (en) Sequencing and analysis of exosome associated nucleic acids
CN104685071A (en) Method and kit for preparing a target RNA depleted sample
WO2012002541A1 (en) Method for detection of target molecule
Quackenbush et al. Isolation of circulating microRNAs from microvesicles found in human plasma
US9309559B2 (en) Simultaneous extraction of DNA and RNA from FFPE tissues
WO2016148073A1 (en) Method for assisting detection of alzheimer's disease or mild cognitive impairment
US20200149036A1 (en) Methods to distinguish rna and dna in a combined preparation
JP2013545463A (en) Methods for isolation of nucleic acid-containing particles and extraction of nucleic acids from the particles
US20160222456A1 (en) URINE EXOSOME mRNAs AND METHODS OF USING SAME TO DETECT DIABETIC NEPHROPATHY
JP2022160425A (en) Method for collective quantification of target proteins using next-generation sequencing and uses thereof
EP2679689B1 (en) Method for improved quantification of miRNAs
CN106459965A (en) Method for isolating poly(A) nucleic acids
US10577645B2 (en) Methods and kits for improving global gene expression analysis of human blood, plasma and/or serum derived RNA
RU2585232C1 (en) Method of extracting micro-rna from biological fluids
EP4373971A1 (en) Diagnosing inflammatory bowel diseases
JP2022521209A (en) Improved Nucleic Acid Target Concentration and Related Methods
CN118139991A (en) Diagnosis of inflammatory bowel disease
CN114438168A (en) Full transcriptome horizontal RNA structure detection method and application thereof
Vaidya et al. Optimization of RNA purification and analysis for automated, pre-symptomatic disease diagnostics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221028

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230914

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20231212

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240508