WO2013097744A1 - 用于扩增cdr3编码序列的引物组合物及其用途 - Google Patents

用于扩增cdr3编码序列的引物组合物及其用途 Download PDF

Info

Publication number
WO2013097744A1
WO2013097744A1 PCT/CN2012/087668 CN2012087668W WO2013097744A1 WO 2013097744 A1 WO2013097744 A1 WO 2013097744A1 CN 2012087668 W CN2012087668 W CN 2012087668W WO 2013097744 A1 WO2013097744 A1 WO 2013097744A1
Authority
WO
WIPO (PCT)
Prior art keywords
primer
coding sequence
cdr3
chain
cell receptor
Prior art date
Application number
PCT/CN2012/087668
Other languages
English (en)
French (fr)
Inventor
刘晓
洪雪玉
曾晓静
张瑞芳
苏政
张俊杰
郑春婷
王俊
Original Assignee
深圳华大基因科技有限公司
深圳华大基因研究院
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN201110444740.0A external-priority patent/CN103184216B/zh
Priority claimed from CN201210011443.1A external-priority patent/CN103205420B/zh
Priority claimed from CN201210017173.5A external-priority patent/CN103215255B/zh
Priority claimed from CN201210055230.9A external-priority patent/CN103289994B/zh
Application filed by 深圳华大基因科技有限公司, 深圳华大基因研究院 filed Critical 深圳华大基因科技有限公司
Publication of WO2013097744A1 publication Critical patent/WO2013097744A1/zh

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Definitions

  • the invention relates to the field of biotechnology.
  • the invention relates to primer compositions for amplifying CDR3 coding sequences and their use. More specifically, the present invention relates to a primer composition for amplifying a CDR3 coding sequence, a method of enriching a CDR3 coding sequence, a method of constructing a sequencing library of a CDR3 coding sequence, a method of determining sequence information of a CDR3 coding sequence, and determining an individual immunity State methods, systems for determining individual immune status, and kits.
  • the immune system is an important system for the body to resist the invasion and immune regulation of pathogens. It is of great significance to study it.
  • Immunoglobulins, T cell receptors (TCRs) and HLAs human leukocyte antigens
  • TCRs T cell receptors
  • HLAs human leukocyte antigens
  • the diversity of immune macromolecules allows the body to recognize numerous foreign substances and remove some of the metabolites produced in the body.
  • the mechanisms underlying immune macromolecular diversity include gene rearrangements, somatic mutations, and insertion and deletion of non-template nucleotides.
  • the immunoglobulin heavy chain rearrangement finger, D and J gene segments are rearranged to form a plurality of CDR3 coding sequences.
  • the first is the rearrangement of the DJ gene fragment, and the rearranged gene fragment is combined with the V gene to obtain the CDR3 encoding.
  • the ⁇ chain gene rearrangement is performed first. If the rearrangement fails, the ⁇ chain gene begins to rearrange, and various mechanisms such as rearrangement and insertion and deletion of non-template nucleotides are generated. Specific gene fragment. Thus, 10 11 specific molecules may be produced in an individual.
  • the diversity of sputum cell receptors is mainly caused by the rearrangement of the ⁇ -chain and ⁇ -chain of the sputum cell receptor mainly expressed by human peripheral blood sputum cells, while the sputum cell receptor ⁇ chain and ⁇ chain rearrangement cause sputum cells.
  • the diversity of the receptor alpha chain and beta chain CDR3 coding sequences can better represent the diversity of sputum cell receptors and even the immune status of individuals.
  • the present invention aims to solve at least one of the technical problems existing in the prior art. To this end, it is an object of the present invention to provide a means for efficiently enriching the CDR3 coding sequences of the immunoglobulin heavy and light chain, sputum cell receptor alpha chain and beta chain.
  • the invention provides a primer composition for amplifying a CDR3 coding sequence.
  • the primer composition comprises a first primer set consisting of at least one V-region primer, each of the at least one V-region primer comprising at least one V gene fragment a complementary sequence; and a second primer set, the second primer set consisting of at least one J region primer, each of the at least one J region primer comprising a sequence complementary to at least one J gene fragment, wherein
  • the CDR3 coding sequence is derived from at least one selected from the group consisting of an immunoglobulin heavy chain, an immunoglobulin light chain, a T cell receptor a chain, and a T cell receptor ⁇ chain.
  • the CDR3 coding sequence of the immunoglobulin heavy chain, the immunoglobulin light chain, the sputum cell receptor a chain and the T cell receptor ⁇ chain can be efficiently enriched, thereby deepening the above CDR3 Research provides a convenient tool.
  • the invention also provides a method of enriching a CDR3 coding sequence.
  • the method comprises the steps of: providing a nucleic acid sample comprising a nucleic acid sequence encoding a CDR3; and using the primer composition of the invention as described above, using the nucleic acid sample as a template, PCR amplification is performed to obtain an amplification product enriched for the CDR3 coding sequence, wherein the CDR3 coding sequence is derived from an immunoglobulin heavy chain, an immunoglobulin light chain, a purine cell receptor a chain, and a T At least one of the cell receptor beta chains.
  • the CDR3 coding sequence of the immunoglobulin heavy chain, the immunoglobulin light chain, the sputum cell receptor a chain and the T cell receptor ⁇ chain can be efficiently enriched.
  • the invention provides a method of constructing a sequencing library of CDR3 coding sequences.
  • the method comprises the steps of: obtaining an amplification product enriched for the CDR3 coding sequence according to the method described above; and constructing a DNA sequencing library for the amplification product, the DNA sequencing The library constitutes a sequencing library of the CDR3 coding sequence, wherein the CDR3 coding sequence is derived from at least one selected from the group consisting of an immunoglobulin heavy chain, an immunoglobulin light chain, a purine cell receptor alpha chain, and a purine cell receptor beta chain.
  • the CDR3 coding sequence is derived from at least one selected from the group consisting of an immunoglobulin heavy chain, an immunoglobulin light chain, a purine cell receptor alpha chain, and a purine cell receptor beta chain.
  • the auto-globulin heavy chain, the immunoglobulin light chain, the sputum cell receptor alpha chain or the sputum cell receptor beta can be Based on the enrichment of the CDR3 coding sequence of the strand, a sequencing library that can be used for sequencing is constructed.
  • the invention proposes a method of determining sequence information of a CDR3 coding sequence.
  • the method comprises the steps of: constructing a sequencing library of CDR3 coding sequences according to the methods described above; and sequencing the sequencing library of the CDR3 coding sequence to determine the sequence of the CDR3 coding sequence Information, wherein the CDR3 coding sequence is derived from at least one selected from the group consisting of an immunoglobulin heavy chain, an immunoglobulin light chain, a T cell receptor alpha chain, and a T cell receptor beta chain.
  • the sequence information of the CDR3 coding sequence of the immunoglobulin heavy chain, the immunoglobulin light chain, the sputum cell receptor a chain and the T cell receptor ⁇ chain can be efficiently determined.
  • the invention provides a method of determining an immune status of an individual.
  • the method comprises the steps of: sequencing the CDR3 coding sequence of the individual according to the method described above to obtain a sequencing result consisting of a plurality of sequencing data; and based on the sequencing result, The immune state of the individual is determined, wherein the CDR3 coding sequence is derived from at least one selected from the group consisting of an immunoglobulin heavy chain, an immunoglobulin light chain, a purine cell receptor alpha chain, and a purine cell receptor beta chain.
  • the sequence information of the CDR3 coding sequence of the individual immunoglobulin heavy chain, immunoglobulin light chain, sputum cell receptor a chain or T cell receptor ⁇ chain can be effectively obtained, thereby effectively determining the individual immunity status.
  • the invention proposes a system for determining an immune status of an individual.
  • the system comprises: a CDR3 coding sequence enrichment device, wherein the CDR3 coding sequence enrichment device is provided with the primer composition described above to enrich the CDR3 coding sequence of the nucleic acid sample of the individual
  • the CDR3 coding sequence is derived from at least one selected from the group consisting of an immunoglobulin heavy chain, an immunoglobulin light chain, a purine cell receptor alpha chain, and a purine cell receptor beta chain
  • a library construction device the library construction a device coupled to said CDR3 coding sequence enrichment device for constructing a sequencing library of CDR3 coding sequences for said enriched CDR3 coding sequence
  • a sequencing device said sequencing device being coupled to said library construction device for use in a sequencing library of the CDR3 coding sequence is sequenced to obtain a sequencing result composed of a plurality of sequencing data
  • an analysis device coupled to the sequencing
  • the present invention also provides a kit.
  • the kit is provided with the primer composition described above.
  • the kit can be used to detect VJ rearrangements of immunoglobulin heavy chains, immunoglobulin light chains, purine cell receptor alpha chains, and purine cell receptor beta chains, or to detect immunoglobulin heavy chains, Coding sequences for the CDR3 of the immunoglobulin light chain, the sputum cell receptor a chain, and the T cell receptor beta chain.
  • Figure 1 is a schematic view showing the structure of CDR3 composed of V H , D H and J H in an immunoglobulin heavy chain;
  • FIG. 2 is a schematic flow diagram of enriching and sequencing a CDR3 coding sequence according to an embodiment of the present invention
  • FIG. 3 is a schematic diagram showing the structure of a system for determining an immune state of an individual according to an embodiment of the present invention
  • Figure 4 is a result of agarose gel electrophoresis of the multiplex PCR product in Example 1 of the present invention.
  • Figure 5 is a diagram showing the results of paired distribution and abundance of the obtained V-J gene fragment after sequencing the immunoglobulin heavy chain CDR3 coding sequence in Example 1 of the present invention
  • Figure 6 is a schematic diagram showing the CDR3 sequence consisting of the primer-amplified V-J rearrangement in the immunoglobulin light chain in Example 2 of the present invention
  • Figure 7 is a result of the multiplex PCR product agarose gel electrophoresis in Example 2 of the present invention
  • Figure 8 is a diagram showing the results of the distribution and abundance of the obtained V K -J K gene fragment after sequencing the immunoglobulin light chain CDR3 sequence in Example 2 of the present invention.
  • Figure 9 is a diagram showing the results of the distribution and abundance of the V A -JA gene fragment obtained by sequencing the immunoglobulin light chain CDR3 sequence in Example 2 of the present invention.
  • Figure 10 is a result of agarose gel electrophoresis of the multiplex PCR product in Example 3 of the present invention.
  • FIG. 1 is a schematic diagram showing the results of paired distribution and abundance of the V-J gene fragment obtained by sequencing the T cell receptor a-chain CDR3 coding sequence in Example 3 of the present invention
  • Figure 12 is a result of agarose gel electrophoresis of the multiplex PCR product in Example 4 of the present invention.
  • Fig. 13 is a view showing the results of paired distribution and abundance of the obtained VJ gene fragment after sequencing the T cell receptor ⁇ -chain CDR3 coding sequence in Example 4 of the present invention. Detailed description of the invention
  • the invention proposes a primer composition for amplifying a CDR3 coding sequence.
  • the primer composition comprises a first primer set and a second primer set.
  • the first primer set is composed of at least one V region primer
  • the second primer set is composed of at least one J region primer derived from an immunoglobulin heavy chain, an immunoglobulin light chain, a T cell.
  • V region primer refers to a primer that specifically recognizes an immunoglobulin heavy chain, an immunoglobulin light chain, a purine cell receptor a chain or a T cell receptor.
  • the V gene fragment in the ⁇ chain family can thereby direct the polymerase chain reaction, whereby each of the V region primers contained in the first primer set contains a sequence complementary to at least one V gene fragment.
  • J region primer refers to a primer that specifically recognizes an immunoglobulin heavy chain, an immunoglobulin light chain, a purine cell receptor a chain or a T.
  • each of the J region primers contained in the first primer set contains a sequence complementary to at least one J gene fragment .
  • the coding comprising the V gene fragment and the J gene fragment can be specifically amplified from the nucleic acid sample containing the nucleic acid sequence encoding the CDR3 by an amplification reaction such as PCR amplification. sequence.
  • the immunoglobulin heavy chain, the immunoglobulin light chain, the T cell receptor alpha chain and the T cell receptor ⁇ chain are encoded by V, D, J gene segments or rearrangement products of V and J gene segments,
  • an amplification product of the CDR3 coding sequence can be efficiently amplified from the nucleic acid sample containing the above CDR3 coding sequence.
  • the primer composition according to the embodiment of the present invention the coding sequence for obtaining the CDR3 can be amplified and enriched from the sample with high specificity, and no other interference sequence exists.
  • CDR3 coding sequences from different sources, such as CDR3 coding sequences derived from immunoglobulin heavy chain, immunoglobulin light chain, purine cell receptor alpha chain or purine cell receptor beta chain, respectively.
  • a primer composition that amplifies the CDR3 coding sequence.
  • the CDR3 coding sequence is derived from an immunoglobulin heavy chain.
  • the primer composition of the present invention for amplifying a CDR3 coding sequence can have the following characteristics:
  • the roles of the V region primer and the J region primer in the PCR amplification process are not particularly limited.
  • the V region primer can serve as a sense strand primer and the J region primer can serve as an antisense strand primer.
  • the inventors have found that by setting the V region primer and the J region primer in this way, the enrichment efficiency when the primer composition is used for enrichment of the CDR3 coding sequence can be further improved.
  • the type of immunoglobulin to which the above primer composition can be applied is not particularly limited, and those skilled in the art can select an appropriate immunoglobulin as a research object according to research needs.
  • the immunoglobulin is a human immunoglobulin.
  • the primer composition can be effectively used for enriching the human immunoglobulin heavy chain CDR3 coding sequence, thereby being effectively used for studying human immune status.
  • a sequence of the V region primer and the J region primer can be selected to realize that one primer can recognize a plurality of V gene segments, thereby further improving the amplification efficiency and reducing the number of primers. Fight for low cost.
  • at least one primer of the first primer set comprises a sequence complementary to a conserved region of a plurality of V gene segments.
  • At least one of the second primer set comprises a sequence complementary to a conserved region of a plurality of J gene segments.
  • the efficiency of enrichment of the immunoglobulin heavy chain CDR3 coding sequence can be improved while reducing the number of primers, and the inventors have also found that such an operation can improve the uniformity of amplification of each CDR3 coding sequence, thereby enabling real The distribution ratio of the CDR3 coding sequence in the host is reflected.
  • the second primer set may be composed of only one primer.
  • the second primer set consists of a degenerate primer comprising a sequence complementary to a conserved region of a plurality of J gene segments.
  • the present invention proposes a set of V region primers (SEQ ID NO: 1-20) and a J region primer (SEQ ID NO: 1-20) for the sequence characteristics of the human immunoglobulin heavy chain CDR3. : 21 ), its sequence and name are summarized as follows:
  • V-zone or J-sub-family listed in the above table is not exhaustive, but only all the sub-families currently reported.
  • the inventors have surprisingly found that the use of the above specific primer sequences can fully cover all subfamilies of human immunoglobulin CDR3, including the discovery of a new CDR3 subfamily, thereby enabling full enrichment of human immunoglobulin heavy chain CDR3
  • the coding sequence in addition, the inventors have also found that by using the above primer sequences, multiplex PCR (also sometimes referred to as "multiplex PCR”) can be performed simultaneously in one PCR reaction system, and the CDR3 contained in the sample can be effectively performed.
  • the coding sequence is amplified, and the uniformity of amplification of each CDR3 coding sequence can be ensured, thereby truly reflecting the distribution ratio of the CDR3 coding sequence in the host.
  • the annealing temperature of the multiplex primer PCR may be 60 degrees Celsius. The inventors have surprisingly found that the efficiency of multiplex primer PCR amplification of CDR3 is significantly improved when the annealing temperature is 60 degrees Celsius.
  • the present invention contains specific primers which can amplify all V regions and J regions of the IMGT database immunoglobulin CDR3 sequence, and can enrich the coding sequence of the human immunoglobulin heavy chain CDR3 in the most comprehensive manner.
  • the amplified product is capable of distinguishing each subfamily of immunoglobulin heavy chains, and the same template is not specifically amplified by the two sets of primers.
  • the primers of the present invention can better represent the collection and distribution of immune macromolecules, and have a more reliable effect on finding information related to diseases or changes in immune system.
  • the CDR3 coding sequence is derived from the immunoglobulin light chain.
  • the primer composition of the present invention for amplifying a CDR3 coding sequence can have the following characteristics:
  • the immunoglobulin light chain has two types, ⁇ -rearrangement and VK-JK rearrangement, specifically, in the embodiment of the present invention, V is specifically recognized.
  • V is specifically recognized. 1 into the gene fragment primers, ie, SEQ ID NO: 22-36 in the first primer set and SEQ ID NO: 41-43 in the second primer set, capable of selectively and efficiently from the nucleic acid sample containing the CDR3 coding sequence
  • Amplification of the amplification product of the lambda light chain CDR3 sequence; amplification of the kappa light chain CDR3 amplification product is similar, using SEQ ID NO: 37-40 in the first primer set and SEQ in the second primer set ID NO: 44 and SEQ ID NO: 45 primer set; similarly, using the first primer set SEQ ID NO: 22-40 and the second primer set SEQ ID NO: 41-45, multiplex PCR can be combined
  • the CDR3 sequences of the two types of light chains of ⁇ , ⁇ are obtained; in the light chain,
  • the roles of the V region primer and the J region primer in the PCR amplification process are not particularly limited.
  • the V region primer can serve as a sense strand primer and the J region primer can serve as an antisense strand primer.
  • the inventors have found that by setting the V region primer and the J region primer in this way, it is possible to further enhance the enrichment when the primer composition is used to enrich the immunoglobulin light chain CDR3 sequence. Set efficiency.
  • the type of immunoglobulin to which the above primer composition can be applied is not particularly limited, and those skilled in the art can select an appropriate immunoglobulin as a research object according to research needs.
  • the immunoglobulin is a human immunoglobulin.
  • a sequence of the V region primer and the J region primer can be selected to realize that one primer can recognize a plurality of V gene segments, thereby further improving the amplification efficiency and reducing the number of primers. Fight for low cost.
  • at least one primer of the first primer set comprises a sequence complementary to a conserved region of a plurality of V gene segments.
  • At least one of the reverse primer sets comprises a sequence complementary to a conserved region of a plurality of J gene segments.
  • the present invention proposes a set of V region primers (SEQ ID NO: 22-40) and a set of J region primers (SEQ ID NO: 22-40) for a sequence characteristic of a human immunoglobulin light chain CDR3 (SEQ ID NO: 22-40) : 41-45 ), its sequence and name are summarized as follows:
  • R A/G
  • Y C/T
  • M A/C
  • H A/C/T
  • S C/G
  • W A/T
  • sequences listed in the above table can identify at least one V region or J region subfamily sequence, and the representative subfamily identified by it
  • V-zone or J-sub-family listed in the above table is not exhaustive, but only all the sub-families currently reported.
  • the inventors have surprisingly discovered that the use of the above specific primer sequences can fully cover all subfamilies of the human immunoglobulin light chain CDR3, including the discovery of a new CDR3 subfamily, thereby enabling full enrichment of human immunoglobulin light.
  • the annealing temperature of the multiplex primer PCR may be 60 degrees Celsius.
  • the inventors have surprisingly found that the efficiency of multiplex PCR amplification of CDR3 is significantly improved when the annealing temperature is 60 degrees Celsius.
  • the present invention contains specific primers for mutating all V regions and J regions of the IMGT database immunoglobulin CDR3 sequence, and can be most comprehensively enriched for human immunoglobulin light chain CDR3 sequences, and amplified.
  • the resulting product is capable of distinguishing each subfamily of immunoglobulin light chains, and the same template is not amplified by the specific binding of the two primers.
  • the primers of the present invention can better represent the collection and distribution of immune molecules in the body, and have a more reliable effect on finding information related to diseases or changes in the immune system.
  • the CDR3 coding sequence is derived from the T cell receptor a chain.
  • the primer composition of the present invention for amplifying the CDR3 coding sequence may have the following characteristics:
  • the roles of the V region primer and the J region primer in the PCR amplification process are not particularly limited.
  • the V region primer can serve as a sense strand primer and the J region primer can serve as an antisense strand primer.
  • the inventors have found that by setting the V region primer and the J region primer as described above, the enrichment efficiency when the primer composition is used for enrichment of the T cell receptor a chain CDR3 coding sequence can be further improved.
  • the type of T cell receptor to which the above primer composition can be applied is not particularly limited, and those skilled in the art can select an appropriate T cell receptor as a research object according to research needs.
  • the T cell receptor is a human T cell receptor.
  • the primer composition can be effectively used to enrich the human T cell receptor a-chain CDR3 coding sequence, and thus can be effectively used for studying human immune status.
  • a sequence of the V region primer and the J region primer can be selected to realize that one primer can recognize a plurality of V gene segments, thereby further improving the amplification efficiency and reducing the number of primers. Fight for low cost.
  • at least one primer of the first primer set comprises a sequence complementary to a conserved region of a plurality of V gene segments.
  • At least one of the second primer set comprises a sequence complementary to a conserved region of a plurality of J gene segments.
  • the present invention provides a set of V region primers (SEQ ID NO: 46-84) and a set of J region primers (SEQ ID) for the sequence characteristics of the human sputum cell receptor alpha chain CDR3. NO: 85-134), the sequence and name are summarized as follows: Primer type Primer No. Primer sequence (SEQ ID NO: )
  • the V region primer (SEQ ID NO: 46-84) and the J region primer (SEQ ID NO: 85-134) of the present invention are capable of distinguishing each subfamily and capable of More intuitively showing the VJ pairing after gene rearrangement and the preference of the V gene.
  • the primers are easy to synthesize, the mismatch rate is low, the specificity is high, and the annealing temperatures of all the primers are close, thereby reducing the amplification bias. Sex.
  • the inventors have surprisingly discovered that the use of the above specific primer sequences can fully cover all subfamilies of the human T cell receptor CDR3, including the discovery of a novel CDR3 subfamily, thereby fully enriching the human T cell receptor CDR3 coding sequence,
  • multiplex primer PCR (sometimes referred to as "multiplex PCR") can be simultaneously performed in one PCR reaction system, and the CDR3 coding sequence contained in the sample can be efficiently amplified. And the uniformity of amplification of each CDR3 coding sequence can be ensured, thereby being able to truly reflect the distribution ratio of the CDR3 coding sequence in the host.
  • the annealing temperature of the multiplex primer PCR may be 60 degrees Celsius.
  • the inventors have surprisingly found that when the annealing temperature is 60 degrees Celsius, the efficiency of PCR amplification of CDR3 by multiplex primers is significantly improved.
  • the present invention contains specific primers for amplifying all V region genes and J region genes of the T cell receptor a-chain CDR3 sequence of the IMGT database, and is the most comprehensive enrichment of human T cell receptors.
  • the coding sequence of the a-chain CDR3, the amplified product is able to distinguish each subfamily of the T cell receptor a chain, and the same template is not specifically amplified by the two sets of primers.
  • the primers of the present invention can better represent the collection and distribution of immune macromolecules in the body, and have a more reliable effect on finding information related to diseases or changes in the immune system.
  • the CDR3 coding sequence is derived from the T cell receptor ⁇ chain.
  • the primer composition of the present invention for amplifying the CDR3 coding sequence can have the following characteristics:
  • the roles of the V region primer and the J region primer in the PCR amplification process are not particularly limited.
  • the V region primer can serve as a sense strand primer and the J region primer can serve as an antisense strand primer.
  • the inventors have found that by setting the V region primer and the J region primer in this way, the enrichment efficiency when the primer composition is used for enrichment of the T cell receptor ⁇ chain CDR3 coding sequence can be further improved.
  • the type of sputum cell receptor to which the above primer composition can be applied is not particularly limited, and those skilled in the art can select an appropriate sputum cell receptor as a research object according to research needs.
  • the sputum cell receptor is a human sputum cell receptor.
  • the primer composition can be effectively used to enrich the human ⁇ cell receptor ⁇ chain CDR3 coding sequence, and thus can be effectively used for research on human immune status.
  • a sequence of the V region primer and the J region primer can be selected to realize that one primer can recognize a plurality of V gene segments, thereby further improving the amplification efficiency and reducing the number of primers. Fight for low cost.
  • at least one primer of the first primer set comprises a sequence complementary to a conserved region of a plurality of V gene segments.
  • At least one of the second primer set comprises a sequence complementary to a conserved region of a plurality of J gene segments.
  • the efficiency of enrichment of the T cell receptor ⁇ -chain CDR3 coding sequence can be improved while reducing the number of primers, and the inventors have also found that such an operation can improve the uniformity of amplification of each CDR3 coding sequence, thereby enabling The proportion of distribution of CDR3 coding sequences in the host is truly reflected.
  • the present invention provides a set (SEQ ID NO: ⁇ / RTI> for the sequence characteristics of the human ⁇ cell receptor ⁇ chain CDR3
  • Primer type primer sequence primer sequence (SEQ ID NO: ) I3/: O 899/-8osl£ m/-6oiAV
  • the V region primer and the J region primer of the present invention are capable of distinguishing each subfamily, and can more intuitively display the VJ pairing after gene rearrangement and the preference of the V gene, and in addition, the primer synthesis is easy.
  • the mismatch ratio is low, the specificity is high, and the annealing temperatures of all the primers are close to each other, so that the bias of the amplification can be low.
  • the inventors have surprisingly discovered that the use of the above specific primer sequences can fully cover all subfamilies of the human T cell receptor CDR3, including the discovery of a novel CDR3 subfamily, thereby fully enriching the human T cell receptor CDR3 coding sequence,
  • multiplex primer PCR (sometimes referred to as "multiplex PCR") can be simultaneously performed in one PCR reaction system, and the CDR3 coding sequence contained in the sample can be efficiently amplified. And the uniformity of amplification of each CDR3 coding sequence can be ensured, thereby being able to truly reflect the distribution ratio of the CDR3 coding sequence in the host.
  • the annealing temperature of the multiplex primer PCR may be 60 degrees Celsius.
  • the inventors have surprisingly found that when the annealing temperature is 60 degrees Celsius, the efficiency of PCR amplification of CDR3 by multiplex primers is significantly improved.
  • the present invention contains specific primers for amplifying all V region genes and J region genes of the T cell receptor ⁇ -chain CDR3 sequence of the IMGT database, and is the most comprehensive enrichment of human T cell receptors.
  • the coding sequence of the ⁇ -chain CDR3, the amplified product is able to distinguish the sub-families of the ⁇ -chain of the sputum cell receptor, and the same template is not specifically amplified by the two sets of primers.
  • the primers of the present invention can better represent the collection and distribution of immune macromolecules in the body, and have a more reliable effect on finding information related to diseases or changes in the immune system.
  • the invention also provides a method of enriching a CDR3 coding sequence.
  • the method comprises the steps of: firstly, providing a nucleic acid sample comprising a nucleic acid sequence encoding CDR3; and subsequently, using the primer composition described above, using the provided nucleic acid sample as a template PCR amplification is carried out.
  • an amplification product can be obtained by PCR amplification, and the amplification product is enriched in the CDR3 coding sequence.
  • the CDR3 coding sequence is derived from at least one selected from the group consisting of an immunoglobulin heavy chain, an immunoglobulin light chain, a purine cell receptor a chain, and a T cell receptor ⁇ chain.
  • the immunoglobulin heavy chain CDR3 coding sequence can be efficiently amplified, thereby effectively enriching the immunoglobulin CDR3 coding sequence.
  • the source of the nucleic acid sample is not particularly limited. One skilled in the art can select the source from which the nucleic acid sample can be obtained, depending on the research needs. For example, to study the specific immune status of a tissue, immune cells can be extracted from the tissue or its vicinity as a source of nucleic acid samples.
  • a single nuclear cell containing the above nucleic acid sample can be isolated from human peripheral blood, and the nucleic acid sample can be obtained by isolating the nucleic acid.
  • the step of providing a nucleic acid sample may further comprise: first, isolating peripheral blood mononuclear cells from human peripheral blood; next, extracting a nucleic acid sample from peripheral blood mononuclear cells.
  • a nucleic acid sample containing the nucleic acid sequence encoding the CDR3 can be efficiently obtained, whereby the efficiency of enriching the CDR3 coding sequence can be further improved.
  • Those skilled in the art can extract peripheral blood mononuclear cells from peripheral blood by any conventional means.
  • the peripheral blood mononuclear cells can be isolated by density gradient centrifugation. And genomic DNA and total RA can be extracted from the isolated peripheral blood mononuclear cells as a nucleic acid sample for amplification by a conventional means. Thereby, the nucleic acid sample can be obtained conveniently, quickly and at low cost. It will be understood by those skilled in the art that when amplification is performed as a nucleic acid sample when total RA is employed, total RA can be first converted to cDNA by reverse transcription according to experimental needs.
  • the type of the above PCR is not particularly limited, that is, multiple PCR reactions may be performed in sequence, or multiple rounds of PCR amplification may be performed in one PCR system.
  • PCR amplification is multiplex primer PCR amplification.
  • the amplification product obtained by at least one isolation purification selected from agarose gel electrophoresis, magnetic bead purification, and purification column purification may be further included.
  • the purity of the amplified product can be increased, thereby increasing the efficiency of enriching the coding sequence of the immunoglobulin heavy chain CDR3.
  • the V region in the first primer set The primer may have the nucleotide sequence shown in SEQ ID NOS: 1-20, and the J region primer in the second primer set has the nucleotide sequence shown in SEQ ID NO: 21, and the length of the obtained amplification product Is a 140-280 bp;
  • the V-region primer in the first primer set can be Having the nucleotide sequence shown in SEQ ID NOS: 22-40, the J region primer in the second primer set may have the nucleotide sequence shown in SEQ ID NOS: 41-45, and the length of the obtained amplification product a
  • the invention features a method of constructing a sequencing library of CDR3 coding sequences.
  • the method may comprise the steps of: First, obtaining an amplification product enriched for the CDR3 coding sequence according to the method described above. Next, a DNA sequencing library is constructed for the obtained amplification product, and the DNA sequencing library can be used as a sequencing library of the CDR3 coding sequence.
  • the CDR3 coding sequence is derived from at least one selected from the group consisting of an immunoglobulin heavy chain, an immunoglobulin light chain, a T cell receptor a chain, and a T cell receptor ⁇ chain.
  • a sequencing library that can be used for sequencing can be constructed based on the enrichment of the CDR3 coding sequences of the immunoglobulin heavy chain, the immunoglobulin light chain, the sputum cell receptor a chain or the T cell receptor ⁇ chain. .
  • a method of constructing a DNA sequencing library for an amplification product is not particularly limited. According to an embodiment of the present invention, constructing the DNA sequencing library for the amplification product may further comprise:
  • the amplified product is subjected to end repair to obtain an end-repaired amplification product.
  • the terminal repair is carried out using a Klenow fragment, T4 DNA polymerase and T4 polynucleotide kinase, the Klenow fragment having 5' ⁇ 3' polymerase activity and 3' ⁇ 5' Digestive activity, but lacking 5' ⁇ 3' exonuclease activity.
  • the efficiency of the end repair can be further improved, so that the efficiency of constructing the sequencing library can be further improved.
  • the terminal-repaired amplification product was subjected to addition of the base A at the 3' end to obtain an amplification product of the base A added at the 3' end.
  • the end-repaired amplification product is subjected to 3, terminal addition of base A using Klenow (3 '-5' exo-).
  • Klenow 3 '-5' exo-
  • the obtained amplification product of the base A is added to the linker to obtain a ligation product; the resulting ligation product is subjected to PCR amplification to obtain a second amplification product.
  • the amplification product having the cohesive terminus A is ligated to a linker using T4 DNA ligase.
  • the obtained second amplification product is purified and recovered to obtain a recovered product, and the resulting recovered product constitutes the sequencing library.
  • the method for purifying and recovering the second amplification product is not particularly limited, and according to a specific example of the present invention, at least a column selected from agarose gel electrophoresis, magnetic bead purification, and purification may be purified. A second amplification product is isolated and purified. Thereby, the efficiency of constructing the sequencing library can be further improved.
  • the sequencing library can be efficiently constructed, thereby facilitating subsequent sequencing and further analysis.
  • the invention proposes a method of determining sequence information of a CDR3 coding sequence.
  • the method may comprise the following steps:
  • the CDR3 coding sequence is derived from at least one selected from the group consisting of an immunoglobulin heavy chain, an immunoglobulin light chain, a T cell receptor a chain, and a T cell receptor ⁇ chain.
  • the sequencing library of the CDR3 coding sequence is sequenced to determine the sequence information of the CDR3 coding sequence.
  • the sequencing is performed using at least one selected from the group consisting of Hiseq2000, SOLiD, 454, and single molecule sequencing devices.
  • the CDR3 coding sequence of the obtained immunoglobulin heavy chain, immunoglobulin light chain, T cell receptor a chain or T cell receptor ⁇ chain can be encoded with high throughput with high precision, thereby further improving the determination of CDR3.
  • the efficiency of the method of encoding sequence information Method and system for determining individual immune status, kit
  • the immune pool is the sum of the diverse immune cells at a certain time in an individual, which reflects the individual genetic factors, the history of antigen exposure, and the immune regulation of individual moments.
  • the immune library can be used for disease-related research, and the mechanism of disease can be explored as an effective means to find biomarkers.
  • the results of the immune library can promote early diagnosis, treatment and even prevention of more diseases.
  • relevant studies have shown that IgH and TCR have a certain relationship with the occurrence of immune system diseases.
  • the increase or decrease of a certain clone directly affects the occurrence and progress of the disease.
  • studies have shown that the rearrangement of specific IgH clones is non-Hodgkin's lymph.
  • Tumor biomarkers; specific B cell monoclonal increase is the first biomarker of chronic lymphocytic leukemia.
  • another aspect of the present invention provides a method of determining an immune status of an individual.
  • the method for determining an immune state of an individual of the present invention may comprise the steps of: first, sequencing the immunoglobulin heavy chain CDR3 coding sequence of the individual according to the method described above, in order to obtain Sequencing data constitutes a sequencing result; and then, based on the obtained sequencing result, the immune status of the individual is determined.
  • the CDR3 coding sequence is derived from at least one selected from the group consisting of an immunoglobulin heavy chain, an immunoglobulin light chain, a T cell receptor alpha chain, and a T cell receptor ⁇ chain.
  • the sequence information of the CDR3 coding sequence of the individual immunoglobulin heavy chain, immunoglobulin light chain, sputum cell receptor a chain or T cell receptor ⁇ chain can be effectively obtained, thereby effectively determining the individual immunity status.
  • the term "immune state” as used herein shall be understood broadly to mean any CDR3 encoding that may be through an immunoglobulin heavy chain, an immunoglobulin light chain, a purine cell receptor alpha chain or a purine cell receptor beta chain.
  • the sequence information of the sequence reflects the immune information.
  • determining the immune status of the individual based on the obtained sequencing result may further comprise: comparing the obtained sequencing result with a control sequence to determine a subfamily of CDR3 included in the individual Type, and the relative proportion of each subfamily type.
  • a control sequence to determine a subfamily of CDR3 included in the individual Type
  • the relative proportion of each subfamily type may be effectively judged, thereby effectively determining the immune status of the individual.
  • an individual may be monitored multiple times to determine the subfamily type of CDR3, and the relative proportion of each subfamily type as a function of time.
  • samples are taken from the same individual at a plurality of different time points, and a plurality of sequencing results are obtained for the sample according to the method described above;
  • the sequencing results are aligned to determine changes in the CDR3 subfamily type and relative proportions in the individual. Therefore, the CDR3 subfamily type and the relative proportion change in the individual can be effectively determined based on the alignment of the sequencing results of the samples at different time points, thereby more effectively determining the individual.
  • the immune status can be sampled at different times to analyze, for example, changes in the individual's immune pool before and after the disease or a particular event, period, and to understand the individual's immune system changes for a particular event, at a particular time. For example, it is possible to know the detailed changes of the current sample from a single cloning level to find information related to the history of the disease.
  • the system 1000 for determining an individual immune state includes: a CDR3 coding sequence enrichment device 100, a library construction device 200, a sequencing device 300, and an analysis device 400.
  • the CDR3 coding sequence enrichment device 100 is provided with the primer composition described above to enrich the CDR3 coding sequence of the nucleic acid sample of the individual, wherein the CDR3 coding sequence is derived from an immunoglobulin heavy chain, an immunoglobulin At least one of a protein light chain, a T cell receptor a chain, and a T cell receptor ⁇ chain.
  • Library construction device 200 is ligated to CDR3 coding sequence enrichment device 100 to construct a sequencing library of CDR3 coding sequences for the enriched CDR3 coding sequences.
  • a sequencing library for an amplification product those skilled in the art can appropriately select according to different sequencing technologies.
  • a manufacturer of a sequencing instrument such as Illumina.
  • the procedures provided by the company are described, for example, in the Illumina Corporation Multiplexing Sample Preparation Guide (Part # 1005361; Feb 2010) or the Paired-End SamplePrep Guide (Part # 1005063; Feb 2010), which is incorporated herein by reference.
  • the term "connected” as used herein shall be understood broadly and may be either directly connected or indirectly connected as long as the above functional connections are achieved.
  • the sequencing device 300 is coupled to the library construction device 200 for sequencing the CDR3 coding sequence sequencing library to obtain sequencing results consisting of multiple sequencing data.
  • the analysis device 400 is coupled to the sequencing device 300 for determining the immune status of the individual based on the sequencing results.
  • the analyzing device 400 may further comprise a comparison unit, wherein the comparison unit stores a comparison sequence for comparing the sequencing result with the control sequence to determine a subfamily of the CDR3 included in the individual.
  • related sequence information may be pre-stored in the analysis device 300, or the analysis device 300 may be connected to a remote database (not shown) for networking operation.
  • a control sequence such as the known immune genome database IMGT
  • the subfamily type distribution of CDR3 and the distribution of each subfamily type can be determined, thereby further improving the efficiency of determining the immune state of the individual.
  • the present invention also provides a kit.
  • the kit is provided with the primer composition described above.
  • the kit can be effectively used for detecting the coding sequences of the CDR3 of the immunoglobulin heavy chain, the immunoglobulin light chain, the T cell receptor alpha chain and the sputum cell receptor ⁇ chain, thereby effectively determining the immune status of the individual. .
  • the kit may comprise a primer composition according to the foregoing.
  • the kit can be used to detect V-J rearrangements of immunoglobulin heavy chains, immunoglobulin light chains, purine cell receptor a chains, and T cell receptor beta chains.
  • the kit of the present invention can be used for detecting the coding sequence of the CDR3 of the immunoglobulin heavy chain, the immunoglobulin light chain, the sputum cell receptor alpha chain and the sputum cell receptor ⁇ chain.
  • the first primer set and the second primer set may be disposed in different containers, or may be disposed in the same container as a composition.
  • the technical means used in the examples are conventional means well known to those skilled in the art, and can be referred to the third edition of the Guide to Molecular Cloning, or related products, and the reagents and products used are also available. Commercially obtained.
  • the various processes and methods not described in detail are conventional methods in the field of public service.
  • the source of the reagents used, the trade name, and the components necessary to list them are indicated on the first occurrence, and the same reagents used thereafter are not special. The descriptions are the same as the first ones.
  • the method for enriching CDR3 coding sequences, constructing a sequencing library and sequencing of the present invention may generally comprise the following steps:
  • PBMC normal human peripheral blood is drawn, specifically, blood is collected using a sterile blood collection tube containing an anticoagulant, and then PBMC is separated by density gradient centrifugation using a Ficoll-Paque PLUS or Percoll lymphocyte separation solution.
  • genomic DNA and total RA are extracted, specifically, genomic DNA is extracted by proteinase K digestion or phenol chloroform extraction; total RA is extracted by Trizol method.
  • S300 Amplification with primer composition
  • multiplex PCR amplification was carried out using the primer composition of the present invention to obtain an amplification product enriched in the CDR3 coding sequence.
  • the purified amplification product was recovered by agarose gel electrophoresis and MiniElute PCR Purification Kit (Qiagen). Among them, when the total R A is used as a template, it is necessary to reverse-transcribe R A into cDNA.
  • the purified amplified product is subjected to terminal repair by dNTP as a substrate for the action of an enzyme such as T4 DNA polymerase, Klenow fragment and T4 polynucleotide kinase to obtain an end-repaired amplification product.
  • an enzyme such as T4 DNA polymerase, Klenow fragment and T4 polynucleotide kinase to obtain an end-repaired amplification product.
  • the Klenow fragment (3 '-5'exo-) polymerase and dATP were then used to add base A to the 3' end of the end-repaired amplification product to obtain an amplification product of base A added at the 3' end.
  • the amplification product of the base A added at the 3' end was recovered by using the MiniElute PCR Purification Kit (Qiagen).
  • the resulting amplification product of the 3, terminal addition base A was ligated to the linker by the action of T4 DNA ligase to obtain a ligated product. Then, the purified ligation product was recovered by agarose gel electrophoresis and MiniElute PCR Purification Kit (Qiagen).
  • a universal PCR primer and a sequencing primer were added, and PCR amplification was carried out using Phusion enzyme to obtain a second amplification product. Then, the second amplification product is recovered by agarose gel electrophoresis to obtain a recovered product, and the recovered product constitutes a DNA sequencing library.
  • the DNA sequencing library obtained above was quantified by Agilent 2100 detection and Q-PCR, and sequenced using a Hiseq2000 sequencing platform to obtain sequencing results composed of multiple sequencing data, and then immunoglobulin heavy chain and immunoglobulin on IMGT.
  • the sequence of the CDR3 of the protein light chain, the T cell receptor a chain or the T cell receptor ⁇ chain was used as a reference sequence, and the sequencing results were analyzed.
  • the CDR3 coding sequence of the immunoglobulin heavy chain is enriched, sequenced, sequenced and analyzed according to the following steps:
  • the DNA extraction kit extracts PBMC DNA. ( Qiagen )
  • the DNA obtained in the previous step was subjected to multiplex PCR amplification as a template DNA.
  • the reaction system was LX500, LX800, ZXJ500, ZXJ800, and 4 parallel experiments.
  • the PCR reaction conditions are:
  • the PCR product was electrophoresed on a 2% agarose gel at a voltage of 4 V/cm for an electrophoresis time of 2 h.
  • the gel was then cut, and a 140-280 bp fragment was taken and purified using QIAquick Gel Purification Kit (Qiagen), and finally the sample was dissolved in 30 ⁇ of elution buffer.
  • the results are shown in Fig. 4. There are multiple amplification bands. Before the formal establishment of the library, the experiment was performed. The Sanger sequencing results showed that the 140-280 bp band is the target product, ie the heavy chain CDR3 coding sequence. -280 bp strip.
  • the DNA obtained in the previous step was prepared in a 1.5 mL centrifuge tube according to the following table. Four end-repair reaction systems were prepared.
  • the tube was then placed on a Thermomixer (Eppendorf) adjusted to 20 ° C for 30 min. After completion of the reaction, purification was carried out using QIAquick PCR Purification Kit (Qiagen), and finally the sample was dissolved in 32 ⁇ L of elution buffer.
  • Thermomixer Eppendorf
  • QIAquick PCR Purification Kit Qiagen
  • the DNA obtained in the previous step was prepared in a 200 ⁇ PCR tube according to the following table. Four 3' end-added bases were used.
  • the linker sequence is:
  • Linker 1 5, GATCGGAAGAGCGGTTCAGCAGGAATGCCGAG (SEQ ID NO: 178);
  • Linker 2 5'TACACTCTTTCCCTACACGACGCTCTTCCGATCT (SEQ ID NO: 179).
  • the tube was then placed on a Thermomixer (Eppendorf) adjusted to 20 ° C for 15 min. After the reaction was completed, it was separated by electrophoresis on a 2% agarose gel at a voltage of 120 V and an electrophoresis time of 120 minutes. After the end of the electrophoresis, the band of interest was excised, purified using QIAquick PCR Purification Kit (Qiagen), and finally the sample was dissolved in 30 ⁇ l of elution buffer.
  • the DNA obtained in the previous step was prepared according to the following system: 4 PCR reaction systems
  • T SEQ ID NO: 181
  • the base ⁇ is any combination of four bases of eight, T, C, G as a distinguishing identifier.
  • the PCR reaction conditions are:
  • the Agilent 2100 Bioanalyzer analysis system detects library insert size and content; Q-PCR accurately quantifies library concentration.
  • sequence analysis was performed on a Hiseq2000 sequencer according to the read length of 151 bases at both ends.
  • the basic analysis process of the raw data obtained by sequencing mainly includes the following steps: First, data processing is performed, and the library data of different samples are distinguished by the sequence tag on the linker or the PCR primer, and the raw data obtained by sequencing is decontaminated, de-joined and de-lowered. Mass filtration; then read and compare the reference sequence of the IMGT database, D, J gene, and analyze.
  • the sequenced raw data after filtration was subjected to the results of the alignment analysis. See Table 1 below.
  • the average total sequence obtained was 41.46 megabytes, and the average clones were 2.27 megabytes.
  • IGHV4-34 2417 4052 17750 62345 26275 39808
  • Figure 5 is a VJ gene pairing distribution map of four parallel libraries based on the data in Table 2, and Figure 5 shows all V gene subfamilies and J gene subfamily rearrangements. After the pairing and the abundance of CDR3 in various VJ pairs, the coordinates on the right side of the figure are the classification of all subfamilies of the J gene. In the figure, the abscissa is the classification of each subfamily of the V gene, and the intersection of the two coordinates is the pairing of the VJ gene. One CDR3 sequence, the left coordinate is the abundance of each VJ pair.
  • the primers provided by the present invention can fully enrich the coding sequence of the human immunoglobulin heavy chain CDR3, and the amplified product can distinguish the subfamilies of the immunoglobulin heavy chain. Furthermore, the relative proportions of the various heavy chain CDR3 coding sequences can be determined by the method of the present invention described above, so that the immune status of the individual can be determined based on the relative proportion of the coding sequences or the change in the ratio.
  • the DNA extraction kit extracts PBMC DNA. ( Qiagen )
  • the DNA obtained in the previous step was subjected to multiplex PCR amplification as a template DNA.
  • the PCR reaction system was prepared in a 200 ⁇ PCR tube according to the following table, which was ZXJ.
  • the PCR reaction conditions are:
  • Fig. 6 is a schematic diagram showing the CDR3 sequence consisting of the V-J rearrangement in the primer-amplified immunoglobulin light chain.
  • the PCR product was electrophoresed on a 2% agarose gel at a voltage of 4 V/cm for an electrophoresis time of 2 h.
  • the gel was then cut, and a 110-250 bp fragment was taken and purified using QIAquick Gel Purification Kit (Qiagen), and finally the sample was dissolved in 30 ⁇ of elution buffer.
  • the results are shown in Fig. 7. There are multiple amplification bands. Before the formal establishment of the library, the experiment was performed. The Sanger sequencing results showed that the 110-250 bp band is the target product, ie the light chain CDR3 sequence. 250bp strip.
  • the DNA obtained in the previous step was prepared in a 1.5 mL centrifuge tube according to the following table to prepare four end-repair reaction systems.
  • Component volume ( ) ( )
  • the tube was then placed on a Thermomixer (Eppendorf) adjusted to 20 ° C for 30 min. After completion of the reaction, purification was carried out using QIAquick PCR Purification Kit (Qiagen), and finally the sample was dissolved in 32 ⁇ L of elution buffer.
  • Thermomixer Eppendorf
  • QIAquick PCR Purification Kit Qiagen
  • the DNA obtained in the previous step was separately prepared in a 200 ⁇ PCR tube as shown in the following table. 4 3' end-added bases ⁇ reaction system
  • the tube was then placed on a Thermomixer (Eppendrof) adjusted to 37 ° C for 30 min. After the reaction, purification was carried out using a MiniElute PCR Purification Kit (Qiagen), and finally the sample was dissolved in ⁇ elution buffer.
  • the DNA obtained in the previous step was prepared in a 1.5 mL centrifuge tube according to the following table. Four end-repair reaction systems were prepared.
  • the linker sequence is:
  • Linker 1 5, GATCGGAAGAGCGGTTCAGCAGGAATGCCGAG (SEQ ID NO: 178);
  • Linker 2 5'TACACTCTTTCCCTACACGACGCTCTTCCGATCT (SEQ ID NO: 179).
  • the tube was then placed on a Thermomixer (Eppendorf) adjusted to 20 ° C for 15 min. After the reaction was completed, it was separated by electrophoresis on a 2% agarose gel at a voltage of 120 V and an electrophoresis time of 120 minutes. After the end of the electrophoresis, the band of interest was excised, purified using QIAquick PCR Purification Kit (Qiagen), and finally the sample was dissolved in 30 ⁇ l of elution buffer.
  • the DNA obtained in the previous step was prepared according to the following system: 4 PCR reaction systems
  • T SEQ ID NO: 181
  • the base ⁇ is any combination of four bases of eight, T, C, G as a distinguishing identifier.
  • the PCR reaction conditions are:
  • the Agilent 2100 Bioanalyzer analysis system detects library insert size and content; Q-PCR accurately quantifies library concentration.
  • sequence analysis was performed on a Hiseq2000 sequencer according to the read length of 151 bases at both ends.
  • the basic analysis process of the raw data obtained by sequencing mainly includes the following steps: First, data processing is performed, and the library data of different samples are distinguished by the sequence tag on the linker or the PCR primer, and the raw data obtained by sequencing is decontaminated, de-joined and de-lowered. Mass filtering; then the reads and the reference sequence of the IMGT database, J gene alignment, analysis.
  • Table 4 is the number of sequences paired with the ⁇ -type IGL VJ
  • Table 5 is the sequence of the paired ⁇ -type IGL V-J. Quantity.
  • Figure 8 is a ZXJ V K -J K gene pairing distribution map based on the data in Table 4
  • Figure 9 is a ⁇ ⁇ - ⁇ ⁇ gene pairing distribution map based on the data in Table 5
  • 8-9 shows the rearrangement of all V gene subfamilies and J gene subfamilies and the abundance of various CDR3s.
  • the ordinate is the classification of all subfamilies of the J gene
  • the abscissa is each of the V genes.
  • Family classification the intersection of two coordinates is a CDR3 sequence generated by pairing of VJ genes.
  • each square of the intersection point represents the abundance of each VJ pair, and the right side of the figure corresponds to the abundance color indicator band. From Tables 4-5 and 8-9, it can be concluded that the primers provided by the present invention can fully enrich the human immunoglobulin light chain CDR3 sequence, and the amplified product can distinguish each sub-globulin of the immunoglobulin light chain. Family, and by the methods of the invention described above, the relative proportions of the various light chain CDR3 sequences can be determined such that the immune status of the individual can be determined based further on the relative proportions of these sequences or changes in the ratio. Example 3
  • the CDR3 coding sequence of the T cell receptor ⁇ chain was enriched, sequenced, sequenced and analyzed according to the following procedure:
  • the human peripheral blood mononuclear cell genomic DNA is extracted by using a DNA extraction kit (Qiagen), specifically, including:
  • the DNA obtained in the above step is used as a template, a first primer set consisting of a V region primer having the nucleotide sequence shown by SEQ ID NOS: 46-84, and a nucleotide sequence having SEQ ID NO: 85-134
  • a second primer set consisting of the J region primers was subjected to multiplex PCR amplification.
  • V-region primers each having a concentration of ⁇ are mixed, and then diluted and mixed with water of ⁇ to obtain a first primer set, and each V-region primer in the first primer set is obtained.
  • the concentration is 2 ⁇ .
  • 50 kinds of J-region primers each having a concentration of ⁇ were mixed and mixed to obtain a second primer set, and the concentration of each J-region primer in the second primer set was 2 ⁇ , and then, according to the following table Ratio, prepare a reaction system for multiplex PCR amplification:
  • the prepared reaction system is subjected to PCR amplification under the following reaction conditions:
  • the amplified product was subjected to 2% agarose gel electrophoresis, and a 10-200 bp gel (as shown in Fig. 10) was cut out, and purified by QIAquick Gel Purification Kit (Qiagen), and then the recovered product was dissolved. In 34 ⁇ 1 of elution buffer, spare.
  • the amplification product obtained in the previous step was prepared into a terminal repair reaction system according to the ratio in the following table in a 1.5 ml centrifuge tube:
  • the tube was then placed on a Thermomixer (Eppendorf) adjusted to 20 ° C for 30 min to obtain a terminal-repaired amplification product, and then the end-repaired amplification product was subjected to QIAquick PCR Purification Kit (Qiagen). Purify and finally dissolve in 34 ⁇ l elution buffer and set aside.
  • Thermomixer Eppendorf
  • QIAquick PCR Purification Kit Qiagen
  • the end-repaired amplification product was prepared by adding a base A to the 3' end in a 1.5 ml centrifuge tube as follows:
  • the tube was placed on a Thermomixer (Eppendorf) adjusted to 37 ° C for 30 min to obtain an amplification product of 3, terminal A was added, and then the 3' end was amplified using a MiniElute PCR purification kit (Qiagen).
  • the amplification product of base A was added for purification, and finally it was dissolved in 20 ⁇ l elution buffer and used.
  • Linker 1 TACACTCTTTCCCTACACGACGCTCTTCCGATCT (SEQ ID NO: 179);
  • Linker 2 5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTC AC (SEQ ID NO: 182).
  • the tube was placed on a Thermomixer (Eppendorf) adjusted to 20 ° C for 15 min to obtain a ligation product, and then the ligation product was purified using a MiniElute PCR Purification Kit (Qiagen), and finally dissolved in 28 ⁇ l. In the flush, spare.
  • Thermomixer Eppendorf
  • the ligation product was purified using a MiniElute PCR Purification Kit (Qiagen), and finally dissolved in 28 ⁇ l. In the flush, spare.
  • the ligation product obtained in the previous step was prepared according to the ratio in the following table:
  • the prepared reaction system is subjected to a PCR reaction on a PCR machine to obtain a second amplification product, wherein the PCR reaction conditions are:
  • a second amplification product of 200-300 bp was purified by QIAquick PCR Purification Kit (Qiagen) to obtain a recovered product, which constitutes a DNA sequencing library. Then, the obtained sequencing library sample was dissolved in 20 ⁇ l of the elution buffer.
  • the size and content of the insert in the obtained sequencing library were detected using an Agilent 2100 Bioanalyzer analysis system; the concentration of the library was accurately quantified by Q-PCR.
  • sequence analysis were performed on a Hiseq2000 sequencer according to the read length of 151 bases at both ends. Sequence.
  • a bp or 8 bp tag sequence was introduced into one side of the fragment by a linker or a PCR primer, so that different libraries were directly mixed and then sequenced on the machine.
  • one end of the sample DNA was first sequenced using the SP1 primer, and the other end of the sample DNA was sequenced using the SP2 primer.
  • the obtained sequencing result is subjected to data analysis, wherein the sequence referred to when analyzing the data is the reference sequence of TCRA on the IMGT.
  • the basic analysis of the raw data obtained by sequencing is first performed, which mainly comprises the following steps: performing data processing on the raw data, and distinguishing the library data of different samples by the sequence tag on the linker or the PCR primer, and the raw data obtained by sequencing Decontamination, de-joining and low-quality filtration are performed to determine the reads; then, the readings of the reads and IMGT databases are compared with the V and J genes, and the results are shown in Table 6 below and Figure 11: Table 6: reads analysis Comparison result In addition, Figure 11 shows the rearrangement of all V gene subfamilies and J gene subfamilies after rearrangement and various VJ pairing distributions as well as the abundance of CDR3.
  • the left coordinate is the classification of all subfamilies of the J gene
  • the abscissa is each subfamily classification of the V gene
  • the intersection of the two coordinates is a CDR3 sequence generated by the pairing of the VJ genes
  • the right color band Indicates the shade of each square, representing the abundance of each VJ pair.
  • the primer composition provided by the present invention is capable of fully enriching the sequence of the human T cell receptor CDR3
  • the amplified product is capable of distinguishing various subfamilies of the T cell receptor alpha chain.
  • Example 4 Following the above general procedure, the CDR3 coding sequence of the T cell receptor ⁇ chain was enriched, sequenced, sequenced and analyzed according to the following procedure:
  • the human peripheral blood mononuclear cell genomic DNA is extracted by using a DNA extraction kit (Qiagen), specifically, including:
  • total R A was also possible to use the total R A as a nucleic acid sample.
  • total RNA was extracted using the Trizol method.
  • the total R A obtained is then reverse transcribed into cDNA according to the following procedure:
  • the C region primer (TRBC-R1) is:
  • the obtained mixture was denatured at 65 ° C for 5 min on a PCR machine, immediately placed on ice, and the reagents in the following table were continuously added to the mixture:
  • the DNA obtained in the above step is used as a template, and the first primer set consisting of the V region primer having the nucleotide sequence shown by SEQ ID NO: 135-164 and the nucleotide sequence shown by SEQ ID NO: 165-177
  • a second primer set consisting of the J region primers was subjected to multiplex PCR amplification.
  • V-region primers each having a concentration of ⁇ are mixed, and then diluted and mixed with 20 L of water to obtain a first primer set, and then each V-region primer in the first primer set is obtained.
  • the concentration is 2 ⁇ .
  • 13 kinds of J-region primers each having a concentration of ⁇ were also mixed, and then diluted with 37 L of water to obtain a second primer set, and the concentration of each J-region primer in the second primer set was obtained. Both are 2 ⁇ .
  • the prepared reaction system is subjected to PCR amplification under the following reaction conditions:
  • the amplified product was subjected to 2% agarose gel electrophoresis, wherein the voltage was 100 V, and the electrophoresis time was 2 hours and 20 minutes. Then, a 100-200 bp gel was removed and purified by QIAquick Gel Purification Kit (Qiagen), and the recovered product was dissolved in 30 ⁇ of elution buffer for use. Among them, the electrophoresis results are shown in Figure 12. As shown in Figure 12, where Mark is a 50bp DNA Ladder.
  • the amplification product obtained in the previous step was prepared into a terminal repair reaction system according to the ratio in the following table in a 1.5 mL centrifuge tube:
  • the tube was then placed on a Thermomixer (Eppendorf) adjusted to 20 ° C for 30 min to obtain a terminal-repaired amplification product, and then the end-repaired amplification product was subjected to QIAquick PCR Purification Kit (Qiagen). Purify and finally dissolve in 34 ⁇ L of elution buffer and set aside.
  • Thermomixer Eppendorf
  • QIAquick PCR Purification Kit Qiagen
  • the end-repaired amplification product was prepared by adding a base A at the 3' end according to the ratio in a 1.5 mL centrifuge tube as follows:
  • the tube was placed on a Thermomixer (Eppendorf) adjusted to 37 ° C for 30 min to obtain an amplification product of 3, terminal A was added, and then the 3' end was amplified using a MiniElute PCR purification kit (Qiagen).
  • the amplification product of base A was added for purification, and finally it was dissolved in 2C L elution buffer and used.
  • the amplification product of base A was added to the 3' end, and the reaction system of the linker was prepared according to the ratio in the following table in a 1.5 mL centrifuge tube:
  • Linker 1 TACACTCTTTCCCTACACGACGCTCTTCCGATCT ( SEQ ID NO: 179 );
  • Linker 2 5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTC AC (SEQ ID NO: 182).
  • the tube was then placed on a Thermomixer (Eppendorf) adjusted to 20 ° C for 15 min to obtain the ligation product, and then the ligation product was purified using MiniElute PCR Purification Kit (Qiagen), and finally dissolved in 32 ⁇ . In the flush, spare.
  • Eppendorf Thermomixer
  • MiniElute PCR Purification Kit Qiagen
  • the ligation product obtained in the previous step was prepared according to the ratio in the following table:
  • the prepared reaction system is subjected to a PCR reaction on a PCR machine to obtain a second amplification product, wherein the PCR reaction conditions are:
  • the second amplification product is purified and recovered by QIAquick PCR Purification Kit (Qiagen) to obtain a recovered product, which constitutes a DNA sequencing library. Then, the obtained sequencing library sample was dissolved in 20 ⁇ l of elution buffer.
  • sequence analysis were performed on a Hiseq2000 sequencer according to the read length of 151 bases at both ends. Sequence.
  • a bp or 8 bp tag sequence was introduced into one side of the fragment by a linker or a PCR primer, so that different libraries were directly mixed and then sequenced on the machine.
  • one end of the sample DNA was first sequenced using the SP1 primer, and the other end of the sample DNA was sequenced using the SP2 primer.
  • the obtained sequencing result is subjected to data analysis, wherein the sequence referred to when analyzing the data is the reference sequence of TCRB on the IMGT.
  • the basic analysis of the raw data obtained by sequencing is first performed, which mainly comprises the following steps: performing data processing on the raw data, and distinguishing the library data of different samples by the sequence tag on the linker or the PCR primer, and the raw data obtained by sequencing Decontamination, de-joining, and low-quality filtration are performed to determine the reads; then, the readings of the reads and IMGT databases are compared with the V, D, and J genes, and the results are shown in Table 7, Table 8, and Figure 13:
  • Figure 13 shows the rearrangement of all V gene subfamilies and J gene subfamilies after rearrangement and various VJ pairing distributions as well as the abundance of CDR3.
  • the left coordinate is the classification of all subfamilies of the J gene
  • the abscissa is each subfamily classification of the V gene
  • the intersection of the two coordinates is a CDR3 sequence generated by the pairing of the VJ genes
  • the right color band Indicates the shade of each square, representing the abundance of each VJ pair.
  • the primer composition provided by the present invention is capable of fully enriching the sequence of the human T cell receptor ⁇ chain CDR3
  • the amplified product is capable of distinguishing various subfamilies of the ⁇ cell receptor ⁇ chain.
  • a primer composition for amplifying a CDR3 coding sequence of the present invention a method for enriching a CDR3 coding sequence, a method for constructing a sequencing library of a CDR3 coding sequence, a method for determining sequence information of a CDR3 coding sequence, a method for determining an immune state of an individual,
  • a system and kit for determining an individual's immune status can be effectively applied to enrich and sequence CDR3 coding sequences of immunoglobulin heavy and light chain, ⁇ cell receptor alpha and beta chains of an individual, and based on sequencing results , can accurately and efficiently determine the immune status of an individual.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了用于扩增CDR3编码序列的引物组合物及其用途。引物组合物包括:第一引物组和第二引物组,该第一引物组由至少一种V区引物组成,该至少一种V区引物的每一种均包含与至少一个V基因片段互补的序列;第二引物组由至少一种J区引物组成,该至少一种J区引物的每一种均包含与至少一个J基因片段互补的序列,其中,该CDR3编码序列来源于选自免疫球蛋白重链、免疫球蛋白轻链、τ细胞受体α链和T细胞受体β链的至少一种。

Description

用于扩增 CDR3编码序列的引物组合物及其用途
优先权信息
本申请请求 201 1年 12月 27 日向中国国家知识产权局提交的、 专利申请号为 201 1 10444740.0 的专利申请, 2012年 1月 13 日向中国国家知识产权局提交的、 专利申请号为 20121001 1443.1的专 利申请, 2012年 1月 19 日向中国国家知识产权局提交的、 专利申请号为 201210017173.5的专利申 请, 以及 2012年 3月 5 日向中国国家知识产权局提交的、 专利申请号为 201210055230.9的专利申 请的优先权和权益, 并且通过参照将其全文并入此处。
技术领域
本发明涉及生物技术领域。 具体地, 本发明涉及用于扩增 CDR3编码序列的引物组合物及其用 途。 更具体地, 本发明涉及用于扩增 CDR3编码序列的引物组合物、 富集 CDR3编码序列的方法、 构建 CDR3编码序列的测序文库的方法、 确定 CDR3编码序列的序列信息的方法、 确定个体免疫状 态的方法、 确定个体免疫状态的系统以及试剂盒。
背景技术
免疫系统是机体抵御病原菌入侵与免疫调节的重要系统, 对其进行研究有很重要的意义。 免疫 球蛋白、 T细胞受体 (TCR ) 和 HLA (人类白细胞抗原)是人类基因组中最活跃的免疫大分子, 决定 和反映了人和环境的相互作用。 免疫大分子的多样性使得机体能识别无数的外来物质和清除体内产 生的部分代谢物。 免疫大分子多样性产生的机制主要有基因重排、 体细胞突变、 非模板核苷酸的插 入与缺失等。
免疫球蛋白重链重排指 、 D、 J三种基因片段重排形成多种 CDR3编码序列, 首先是 DJ基因片段 重排, 重排后的基因片段再与 V基因进行组合, 得到编码 CDR3的基因; 在免疫球蛋白轻链中, 先进行 κ链基因重排, 若重排失败, 则 λ链基因开始重排, 由重排、 非模板核苷酸的插入与缺失等机制产生多种 多样特异性的基因片段。 由此, 一个个体内可能产生 1011个特异性的分子。
Τ细胞受体的多样性主要是通过人外周血 Τ细胞主要表达的 Τ细胞受体的 α链和 β链的重排引 起的,而 Τ细胞受体 α链和 β链重排引起的 Τ细胞受体 α链和 β链 CDR3编码序列的多样性能较好 地代表 Τ细胞受体的多样性甚至个人的免疫状态。
因此,对免疫球蛋白重链和轻链、 Τ细胞受体 α链和 β链的 CDR3编码序列进行研究,意义重大。 然而, 目前对于上述 CDR3编码序列的研究仍有待改进。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。 为此, 本发明的一个目的在于提出一种 能够有效地对免疫球蛋白重链和轻链、 Τ细胞受体 α链和 β链的 CDR3编码序列进行富集的手段。
根据本发明的一个方面, 本发明提供了一种用于扩增 CDR3编码序列的引物组合物。 根据本发明的 实施例, 该引物组合物包括第一引物组, 该第一引物组由至少一种 V区引物组成, 该至少一种 V区引物 的每一种均包含与至少一个 V基因片段互补的序列; 以及第二引物组, 该第二引物组由至少一种 J区引 物组成, 该至少一种 J区引物的每一种均包含与至少一个 J基因片段互补的序列, 其中, 该 CDR3编码序 列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 a链和 T细胞受体 β链的至少一种。 利用 该引物组合物, 能够有效地对免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a链和 T细胞受体 β链的 CDR3编码序列进行富集, 从而为对上述 CDR3进行深入研究提供了便利的工具。
根据本发明的另一方面, 本发明还提供了一种富集 CDR3编码序列的方法。 根据本发明的实施例, 该方法包括以下步骤: 提供核酸样本, 所述核酸样本中包含编码 CDR3的核酸序列; 以及利用前面所述 的本发明的引物组合物, 以所述核酸样本作为模板, 进行 PCR扩增, 以便获得富集所述 CDR3编码序列 的扩增产物, 其中, 所述 CDR3编码序列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a 链和 T细胞受体 β链的至少一种。 由此, 能够有效地富集免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受 体 a链和 T细胞受体 β链的 CDR3编码序列。
根据本发明的又一方面, 本发明提供了一种构建 CDR3编码序列的测序文库的方法。 根据本发明的 实施例, 该方法包括以下步骤: 根据前面所述的方法, 获得富集所述 CDR3编码序列的扩增产物; 以及 针对所述扩增产物, 构建 DNA测序文库, 所述 DNA测序文库构成所述 CDR3编码序列的测序文库, 其 中, 所述 CDR3编码序列来源于选自免疫球蛋白重链、免疫球蛋白轻链、 Τ细胞受体 α链和 Τ细胞受体 β 链的至少一种。 由此, 可以在对自免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 α链或 Τ细胞受体 β 链的 CDR3编码序列进行富集的基础上, 构建可以用于测序的测序文库。
根据本发明的再一方面, 本发明提出了一种确定 CDR3编码序列的序列信息的方法。 根据本发明的 实施例,该方法包括以下步骤:根据前面所述的方法,构建 CDR3编码序列的测序文库;以及对所述 CDR3 编码序列的测序文库进行测序, 以便确定所述 CDR3编码序列的序列信息, 其中, 所述 CDR3编码序列 来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 α链和 T细胞受体 β链的至少一种。 由此, 能够有效确定免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a链和 T细胞受体 β链的 CDR3编码序列 的序列信息。
根据本发明的又一方面, 本发明提供了一种确定个体免疫状态的方法。 根据本发明的实施例, 该方 法包括以下步骤: 根据前面所述的方法, 对所述个体的 CDR3编码序列进行测序, 以便获得由多个测序 数据构成的测序结果; 以及基于所述测序结果, 确定所述个体的免疫状态, 其中, 所述 CDR3编码序列 来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 α链和 Τ细胞受体 β链的至少一种。 通过该 方法, 能够有效地获得个体的免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a链或 T细胞受体 β链的 CDR3编码序列的序列信息, 从而可以有效地确定个体免疫状态。
根据本发明的另一方面, 本发明提出了一种确定个体免疫状态的系统。 根据本发明的实施例, 该系 统包括: CDR3编码序列富集装置, 所述 CDR3编码序列富集装置中设置有前面所述的引物组合物, 以 便对所述个体的核酸样本富集 CDR3编码序列, 其中, 所述 CDR3编码序列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 α链和 Τ细胞受体 β链的至少一种; 文库构建装置, 所述文库构建装置与 所述 CDR3编码序列富集装置相连, 以便针对所述经过富集的 CDR3编码序列构建 CDR3编码序列的测 序文库; 测序装置, 所述测序装置与所述文库构建装置相连, 用于对所述 CDR3编码序列的测序文库进 行测序, 以便获得由多个测序数据构成的测序结果; 以及分析装置, 所述分析装置与所述测序装置相连, 用于基于测序结果, 确定所述个体的免疫状态。 由此, 利用该系统, 能够有效地实施前述确定个体免疫 状态的方法, 从而能够有效地确定个体的免疫状态。
根据本发明的又一方面, 本发明还提供出了一种试剂盒。 根据本发明的实施例, 该试剂盒中设置有 前面所述的引物组合物。 由此, 该试剂盒能够用于检测免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 α 链和 Τ细胞受体 β链的 V-J重排, 或者用于检测免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a链和 T 细胞受体 β链的 CDR3的编码序列。
本发明的附加方面和优点将在下面的描述中部分给出, 部分将从下面的描述中变得明显, 或通 过本发明的实践了解到。
附图说明
本发明的上述和 /或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理 解, 其中:
图 1是免疫球蛋白重链中由 VH、 DH和 JH构成的 CDR3的结构示意图;
图 2是根据本发明一个实施例的对 CDR3编码序列进行富集和测序的流程示意图;
图 3是根据本发明一个实施例的用于确定个体的免疫状态的系统结构示意图;
图 4是本发明实施例 1中的多重 PCR产物琼脂糖凝胶电泳结果;
图 5是本发明实施例 1中, 对免疫球蛋白重链 CDR3编码序列测序后, 所得到的 V-J基因片段 配对分布及丰度的结果示意图;
图 6是本发明实施例 2中, 引物扩增免疫球蛋白轻链中 V-J重排构成的 CDR3序列的示意图; 图 7是本发明实施例 2中的多重 PCR产物琼脂糖凝胶电泳结果;
图 8是本发明实施例 2中, 对免疫球蛋白轻链 CDR3序列测序后, 所得到的 V K -J K基因片段配 对分布及丰度的结果示意图;
图 9是本发明实施例 2中, 对免疫球蛋白轻链 CDR3序列测序后, 所得到的 V A -JA基因片段配 对分布及丰度的结果示意图;
图 10是本发明实施例 3中的多重 PCR产物琼脂糖凝胶电泳结果;
图 1 1是本发明实施例 3中, 对 T细胞受体 a链 CDR3编码序列进行测序后, 所得到的 V-J基 因片段配对分布及丰度的结果示意图;
图 12是本发明实施例 4中的多重 PCR产物琼脂糖凝胶电泳结果; 以及
图 13是本发明实施例 4中, 对 T细胞受体 β链 CDR3编码序列进行测序后, 所得到的 V-J基 因片段配对分布及丰度的结果示意图。 发明详细描述
下面详细描述本发明的实施例。 下面通过参考附图描述的实施例是示例性的, 仅用于解释本发 明, 而不能理解为对本发明的限制。 需要说明的是, 术语 "第一" 、 "第二" 仅用于描述目的, 而 不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。 由此, 限定有 "第一" 、 "第二" 的特征可以明示或者隐含地包括一个或者更多个该特征。 进一步地, 在本发明的描述中, 除非另有说明, "多个" 的含义是两个或两个以上。
用于扩增 CDR3编码序列的引物组合物
根据本发明的一个方面, 本发明提出了一种用于扩增 CDR3编码序列的引物组合物。 根据本发明的 实施例, 该引物组合物包括第一引物组和第二引物组。 其中, 第一引物组由至少一种 V区引物组成, 第 二引物组由至少一种 J区引物组成, 该 CDR3编码序列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 T 细胞受体 a链和 T细胞受体 β链的至少一种。
在本文中所使用的术语 "V区引物" 指的是这样的一种引物, 其能够特异性地识别免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a链或 T细胞受体 β链家族中的 V基因片段, 从而可以引导进行聚合酶链 式反应, 由此第一引物组中所包含的 V区引物的每一种均包含与至少一个 V基因片段互补的序列。 类似 的, 在本文中所使用的术语 "J区引物" 指的是这样的一种引物, 其能够特异性地识别免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a链或 T细胞受体 β链家族中的 J基因片段, 从而可以引导进行聚合酶链 式反应, 由此第一引物组中所包含的 J区引物的每一种均包含与至少一个 J基因片段互补的序列。 进而, 在 V区引物和 J区引物的引导下, 可以通过扩增反应例如 PCR扩增, 从含有编码 CDR3的核酸序列的核 酸样本中特异性地扩增包含 V基因片段和 J基因片段的编码序列。 由于免疫球蛋白重链、 免疫球蛋白轻 链、 T细胞受体 α链和 T细胞受体 β链, 是由 V、 D、 J基因片段或着 V、 J基因片段重排产物所编码的, 因而通过特异性识别 V和 J基因片段的引物,即第一引物组和第二引物组,能够有效地从包含上述 CDR3 编码序列的核酸样本中扩增获得 CDR3编码序列的扩增产物。 进而, 通过采用才艮据本发明实施例的引物 组合物, 能够高特异性地从样本中扩增富集获得 CDR3 的编码序列, 且不会存在其他的干扰序列。 从而 能够实现对免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 a链以及 T细胞受体 β链的 CDR3编码序列 的有效富集, 进而为针对 CDR3进行深入研究提供了便利的工具。
下面针对不同来源的 CDR3编码序列, 例如来源于免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 α 链或 Τ细胞受体 β链的 CDR3编码序列,分别详细描述本发明的用于扩增 CDR3编码序列的引物组合物。
1、 CDR3编码序列来源于免疫球蛋白重链
当 CDR3编码序列来源于免疫球蛋白重链时, 本发明的用于扩增 CDR3编码序列的引物组合物的可 以具有以下特征:
根据本发明的实施例, V区引物和 J区引物在 PCR扩增过程中的作用, 并不受特别限制。 根据本发 明的一个具体示例, V区引物可以作为正义链引物, J区引物可以作为反义链引物。 发明人发现, 通过 如此设置 V区引物和 J区引物, 能够进一步提高将引物组合物用于富集 CDR3编码序列时的富集效率。 根据本发明的实施例, 上述引物组合物能够适用的免疫球蛋白类型, 不受特别限制, 本领域技术人员可 以根据研究需要, 选择适当的免疫球蛋白作为研究对象。 根据本发明的一个实施例, 所述免疫球蛋白为 人类免疫球蛋白。 由此, 可以有效地将引物组合物用于对人类免疫球蛋白重链 CDR3编码序列进行富集, 从而可以有效地用于对人体免疫状况进行研究。
另外, 根据本发明的实施例, 可以通过对 V区引物和 J区引物的序列进行选择, 实现一条引物可以 识别多种 V基因片段, 从而可以进一步提高扩增的效率, 减少引物的数目, P争低成本。 根据本发明的一 个实施例, 第一引物组的至少一种引物包含与多个 V基因片段的保守区互补的序列。 由此, 可以在减少 引物的数量的同时, 提高对免疫球蛋白重链 CDR3编码序列进行富集的效率, 发明人还发现, 这样操作 能够提高各 CDR3编码序列扩增的均一性, 从而能够真实地反映 CDR3编码序列在宿主中的分布比例。 类似的, 根据本发明的一个实施例, 第二引物组的至少一种包含与多个 J基因片段的保守区互补的序列。 由此, 可以在减少引物的数量的同时, 提高对免疫球蛋白重链 CDR3编码序列进行富集的效率, 发明人 还发现, 这样操作能够提高各 CDR3编码序列扩增的均一性, 从而能够真实地反映 CDR3编码序列在宿 主中的分布比例。 另外, 根据 J基因片段的序列特点, 第二引物组可以仅由一条引物构成。 因而根据本 发明的一个实施例, 第二引物组由一种简并引物构成, 该引物包含与多个 J基因片段的保守区互补的序 列。 由此, 可以在减少引物的数量的同时, 提高对免疫球蛋白重链 CDR3编码序列进行富集的效率, 发 明人还发现, 这样操作能够提高各 CDR3编码序列扩增的均一性, 从而能够真实地反映 CDR3编码序列 在宿主中的分布比例。
具体地, 根据本发明的实施例, 针对人类免疫球蛋白重链 CDR3的序列特征, 本发明提出了一组 V 区引物 (SEQ ID NO: 1-20 )和一种 J区引物(SEQ ID NO: 21 ), 其序列和名称分别总结如下:
Figure imgf000005_0002
R=A/G, Y=C/T, M=A/C , K=G/T, S=C/G, W= A/T
上表中所列出的序列, 可以至少识别一种 V区或 J区亚家族的编码序列, 其所识别的代表性亚家族 总结如下:
Figure imgf000005_0001
Figure imgf000006_0001
需要说明的是, 上表中所列出的 V区或 J区亚家族并不是穷尽的, 而仅仅是目前有报道的所有亚家 族。 事实上, 发明人惊奇地发现, 采用上述具体的引物序列, 能够全面覆盖人类免疫球蛋白 CDR3 的全 部亚家族, 包括发现新的 CDR3亚家族, 从而能够全面的富集人类免疫球蛋白重链 CDR3编码序列, 另 夕卜, 发明人还发现通过采用上述引物序列, 能够同时在一个 PCR反应体系中进行多重引物 PCR (有时也 称为 "多重 PCR" ), 可以有效地对样本中所包含的 CDR3编码序列进行扩增, 并且能够保证各 CDR3编 码序列扩增的均一性, 从而能够真实地反映 CDR3编码序列在宿主中的分布比例。 根据本发明的实施例, 多重引物 PCR的退火温度可以为 60摄氏度。 发明人惊奇地发现, 当退火温度为 60摄氏度时, 多重引物 PCR扩增 CDR3的效率得到显著提高。
由此, 现有技术相比, 本发明含有可扩增 IMGT数据库免疫球蛋白 CDR3序列所有 V区和 J区的特 异性引物, 可以最全面的富集人类免疫球蛋白重链 CDR3的编码序列, 扩增出来的产物能够区分免疫球 蛋白重链的各个亚家族, 且同一模板不会被两组引物特异性结合扩增。 本发明中的引物能更好的呈现机 体免疫大分子的集合与分布, 对找到与疾病相关的信息或者免疫系统变化的信息具有更可靠的作用。
2、 CDR3编码序列来源于免疫球蛋白轻链
当 CDR3编码序列来源于免疫球蛋白轻链时, 本发明的用于扩增 CDR3编码序列的引物组合物的可 以具有以下特征:
由于免疫球蛋白轻链有 、 κ两种类型, 存在 VA-JA重排和 VK -JK重排两种方式, 具体地, 在本发明 实施例中, 通过特异性识别 V 。 1入基因片段引物, 即第一引物组中的 SEQ ID NO: 22-36和第二引物组 中的 SEQ ID NO: 41-43 , 能够选择性地有效地从包含 CDR3编码序列的核酸样本中扩增获得 λ型轻链 CDR3序列的扩增产物; κ型轻链 CDR3扩增产物的选择性获得类似, 利用第一引物组中的 SEQ ID NO: 37-40和第二引物组中的 SEQ ID NO: 44和 SEQ ID NO: 45引物组来进行; 类似的, 混合使用第一引物 组 SEQ ID NO: 22-40和第二引物组的 SEQ ID NO: 41-45, 多重 PCR可一并获得 λ、 κ两种类型轻链的 CDR3序列; 在轻链中, CDR3是 V-J重排的产物, 因而通过采用根据本发明实施例的引物组合物, 能够 高特异性地从样本中扩增富集获得 CDR3序列,而不会存在其他的干扰序列。从而能够实现对轻链 CDR3 序列的有效富集, 进而为针对 CDR3进行深入研究提供了便利的工具。
根据本发明的实施例, V区引物和 J区引物在 PCR扩增过程中的作用, 并不受特别限制。 根据本发 明的一个具体示例, V区引物可以作为正义链引物, J区引物可以作为反义链引物。 发明人发现, 通过如 此设置 V区引物和 J区引物, 能够进一步提高将引物组合物用于富集免疫球蛋白轻链 CDR3序列时的富 集效率。 根据本发明的实施例, 上述引物组合物能够适用的免疫球蛋白类型, 不受特别限制, 本领域技 术人员可以根据研究需要, 选择适当的免疫球蛋白作为研究对象。 根据本发明的一个实施例, 所述免疫 球蛋白为人类免疫球蛋白。 由此, 可以有效地将引物组合物用于对人类免疫球蛋白轻链 CDR3序列进行 富集, 从而可以有效地用于对人体免疫状况进行研究。
另外, 根据本发明的实施例, 可以通过对 V区引物和 J区引物的序列进行选择, 实现一条引物可以 识别多种 V基因片段, 从而可以进一步提高扩增的效率, 减少引物的数目, P争低成本。 根据本发明的一 个实施例, 第一引物组的至少一种引物包含与多个 V基因片段的保守区互补的序列。 由此, 可以在减少 引物的数量的同时, 提高对免疫球蛋白轻链 CDR3序列进行富集的效率, 发明人还发现, 这样操作能够 提高各 CDR3序列扩增的均一性, 从而能够真实地反映 CDR3序列在宿主中的分布比例。 类似的, 根据 本发明的一个实施例, 反向引物组的至少一种包含与多个 J基因片段的保守区互补的序列。 由此, 可以 在减少引物的数量的同时, 提高对免疫球蛋白轻链 CDR3序列进行富集的效率, 发明人还发现, 这样操 作能够提高各 CDR3序列扩增的均一性, 从而能够真实地反映 CDR3序列在宿主中的分布比例。
具体地, 根据本发明的实施例, 针对人类免疫球蛋白轻链 CDR3的序列特征, 本发明提出了一组 V 区引物 (SEQ ID NO: 22-40 )和一组 J区引物 (SEQ ID NO: 41-45 ), 其序列和名称分别总结如下:
Figure imgf000007_0001
R=A/G, Y=C/T, M=A/C, H=A/C/T, S=C/G, W= A/T
上表中所列出的序列, 可以至少识别一种 V区或 J区亚家族的序列, 其所识别的代表性亚家族总结
Figure imgf000008_0001
需要说明的是, 上表中所列出的 V区或 J区亚家族并不是穷尽的, 而仅仅是目前有报道的所有亚家 族。 事实上, 发明人惊奇地发现, 采用上述具体的引物序列, 能够全面覆盖人类免疫球蛋白轻链 CDR3 的全部亚家族, 包括发现新的 CDR3亚家族, 从而能够全面的富集人类免疫球蛋白轻链 CDR3序列, 另 外, 发明人还发现通过采用上述引物序列, 能够进行多重 PCR, 可以有效地对样本中所包含的 CDR3序 列进行扩增, 并且能够保证各 CDR3序列扩增的均一性, 从而能够真实地反映 CDR3序列在宿主中的分 布比例。 根据本发明的实施例, 多重引物 PCR的退火温度可以为 60摄氏度。 发明人惊奇地发现, 当退 火温度为 60摄氏度时, 多重 PCR扩增 CDR3的效率得到显著提高。
由此, 现有技术相比, 本发明含有可扩增 IMGT数据库免疫球蛋白 CDR3序列所有 V区和 J区的特 异性引物, 可以最全面的富集人类免疫球蛋白轻链 CDR3序列, 扩增出来的产物能够区分免疫球蛋白轻 链的各个亚家族, 且同一模板不会被两条引物特异性结合扩增。 本发明中的引物能更好的呈现机体免疫 大分子的集合与分布, 对找到与疾病相关的信息或者免疫系统变化的信息具有更可靠的作用。
3、 CDR3编码序列来源于 T细胞受体 a链 当 CDR3编码序列来源于 T细胞受体 a链时, 本发明的用于扩增 CDR3编码序列的引物组合物的可 以具有以下特征:
根据本发明的实施例, V区引物和 J区引物在 PCR扩增过程中的作用, 并不受特别限制。 根据本发 明的一个具体示例, V区引物可以作为正义链引物, J区引物可以作为反义链引物。 发明人发现, 通过如 此设置 V区引物和 J区引物, 能够进一步提高将引物组合物用于富集 T细胞受体 a链 CDR3编码序列时 的富集效率。 才艮据本发明的实施例, 上述引物组合物能够适用的 T细胞受体类型, 不受特别限制, 本领 域技术人员可以根据研究需要, 选择适当的 T细胞受体作为研究对象。 根据本发明的一个实施例, 所述 T细胞受体为人类 T细胞受体。 由此, 可以有效地将引物组合物用于对人类 T细胞受体 a链 CDR3编码 序列进行富集, 从而可以有效地用于对人体免疫状况进行研究。
另外, 根据本发明的实施例, 可以通过对 V区引物和 J区引物的序列进行选择, 实现一条引物可以 识别多种 V基因片段, 从而可以进一步提高扩增的效率, 减少引物的数目, P争低成本。 根据本发明的一 个实施例, 第一引物组的至少一种引物包含与多个 V基因片段的保守区互补的序列。 由此, 可以在减少 引物的数量的同时, 提高对 T细胞受体 a链 CDR3编码序列进行富集的效率, 发明人还发现, 这样操作 能够提高各 CDR3编码序列扩增的均一性, 从而能够真实地反映 CDR3编码序列在宿主中的分布比例。 类似的, 根据本发明的一个实施例, 第二引物组的至少一种包含与多个 J基因片段的保守区互补的序列。 由此, 可以在减少引物的数量的同时, 提高对 T细胞受体 α链 CDR3编码序列进行富集的效率, 发明人 还发现, 这样操作能够提高各 CDR3编码序列扩增的均一性, 从而能够真实地反映 CDR3编码序列在宿 主中的分布比例。
具体地, 根据本发明的实施例, 针对人类 Τ细胞受体 α链 CDR3的序列特征, 本发明提供了一组 V 区引物 (SEQ ID NO: 46-84 )和一组 J区引物 (SEQ ID NO: 85-134 ), 其序列和名称分别总结如下: 引物类型引物序号 引物序列(SEQ ID NO: )
TRAV1- 1-F GTTATGGTTACCTCCTTCTACAGGA(46)
TRAV1-2-F AGGGTACAGTTACCTCCTTTTGAAG(47)
TRAV2-F CTTCATCGCTGCTCATCCTCCAG(48)
TRAV3-F GAAACCATCTGCCCTTGTGAGCG(49)
TRAV4-F CCTGTTTATCCCTGCCGACAGAA(50)
TRAV5-F2 TGAAACAAGACCAAAGACTCACTG(51)
TRAV6-F GGTCACCTTTGATACCACCCTTAA(52)
TRAV7-F2 GCTACATTACTGAAGAATGGAAGCA(53)
TRAV8- 1/8-3-F TAATCTGAGGAAACCCTCTGTGCA(54)
TRAV8-2/8-4-F CCTGACGAAACCCKCAGCCCAT(55)
TRAV8-6-F AGGAAACCCTCAGTCCATATAAGC(56)
TRAV9- 1/9-2-F AAGGTTTTGAAGCCAYGTACCGTA(57)
TRAV10-F CAAAGCTCTCTGCACATCACAGC(58)
TRAV12-1/12-2-F ATTTCCCTGCTCATCAGAGACTCC(59)
TRAV12-3-F ATCTCCTTGTTCATCAGAGACTCAC(60)
V区引物 TRAV13-1-F GACAGCCAAACATTTCTCCCTGC(61)
TRAV13-2-F GCAAATTGCAGCTACTCAACCTGG(62)
Figure imgf000010_0001
TRAJ12-R AGGCCTGACCAGCAGTCTGGT(96)
TRAJ54-R TTGGGTTGATAGTCAGCCTGGTTC(97)
TRAJ45-R AGGGCTGGATGATTAGATGAGTC(98)
TRAJ41-R TGTGACCAACAGCGAGGTGCC(99)
TRAJ22-R CAGGTAAAACAGTCAATTGTGTCC(IOO)
TRAJ36-R AGGGAATAACGGTGAGTCTCGTTC(lOl)
TRAJ6-R ACGGATGAACAATAAGGCTGGTTC( 102)
J区引物 TRAJ26-R GGCAGCACGGAC AATCTGGTTC( 103)
TRAJ5-R TTGGTTGCACTTGGAGTCTTGTTC( 104)
TRAJ34-R TTGGAAAGACTTGTAATCTGGTCC( 105)
TRAJ11-R CTGGAGAGACTAGAAGCATAGTCC(106)
TRAJ14-R CAGGTTTTACTGATAATCTTGTCCC(107)
TRAJ31-R GGGCTTCACCACCAGCTGAGTT( 108)
TRAJ39-R GGGTTTGACCATTAACCTTGTTC(109)
TRAJ18-R AGGCCAGACAGTCAACTGAGTTC(110)
TRAJ30-R TGGGGAGAATATGAAGTCGTGTC(111)
TRAJ48-R TGGGTATGATGGTGAGTCTTGTTC(112)
TRAJ10-R TGAGTTCCACTTTTAGCTGAGTGC(113)
TRAJ3-R2 TACTTACTTGGCCGGATGCTGAG(114)
TRAJ44-R GAGCGTGACCTGAAGTCTTGTTC(115)
TRAJ53-R TTGGATTCACGGTTAAGAGAGTTC( 116)
TRAJ17-R TTGGTTTAACTAGCACCCTGGTTC(117)
TRAJ40-R TGCTAAAACCTTCAGCCTGGTGC(118)
TRAJ57-R ATGGGTTTACTGTCAGTTTCGTTC( 119)
TRAJ43-R TTGGTTTTACTGTCAGTCTGGTCC(120)
TRAJ37-R CTGGTTTTACTTGTAAAGTTGTCCC(121)
TRAJ42-R TTGGTTTAAC AGAGAGTTTAGTGC C( 122)
TRAJ21-R TTGGTTTTACATTGAGTTTGGTCCC(123)
TRAJ28-R TTGGTATGACCGAGAGTTTGGTCC(124)
TRAJ27-R TTGGCTTCAC AGTGAGCGTAGTC( 125)
TRAJ52-R TTGGATGGACAGTCAAGATGGTCC(126)
TRAJ49-R TTGGAATGACCGTCAAACTTGTCC(127)
TRAJ50-R TTGGAATGACTGATAAGCTTGTCC(128) TRAJ15-R TGGAACTCACTGATAGGTGGGTTC(129)
TRAJ13-R GGGATGACTTGGAGCTTTGTTCC( 130)
TRAJ24-R2 GAATGGGGCTTACCTGGGGTGAC(131)
TRAJ23-R GGGTTTCACAGATAGCTCCGTTC(132)
TRAJ47-R GGACTTGACTCTCAGAATGGTTCC(133)
TRAJ32-R TGGCTGGACAGCAAGCAGAGTG(134) 根据本发明的实施例, 本发明的 V区引物(SEQ ID NO: 46-84 )和 J区引物(SEQ ID NO: 85-134 ) 能够区分各亚家族, 且能够更直观地呈现基因重排后 V-J配对的情况和 V基因的使用偏好性, 此外, 引 物合成容易, 错配率低、 特异性高, 且所有引物的退火温度接近, 从而能够降低扩增的偏向性。
发明人惊奇地发现, 采用上述具体的引物序列, 能够全面覆盖人类 T细胞受体 CDR3的全部亚家族, 包括发现新的 CDR3亚家族, 从而能够全面的富集人类 T细胞受体 CDR3编码序列, 另外, 发明人还发 现通过采用上述引物序列,能够同时在一个 PCR反应体系中进行多重引物 PCR(有时也称为 "多重 PCR" ), 能够有效地对样本中所包含的 CDR3编码序列进行扩增,并且能够保证各 CDR3编码序列扩增的均一性, 从而能够真实地反映 CDR3编码序列在宿主中的分布比例。 根据本发明的实施例, 多重引物 PCR的退火 温度可以为 60摄氏度。 发明人惊奇地发现, 当退火温度为 60摄氏度时, 多重引物 PCR扩增 CDR3的效 率得到显著提高。
由此, 与现有技术相比, 本发明含有可扩增 IMGT数据库 T细胞受体 a链 CDR3序列所有 V区基因 和 J区基因的特异性引物, 可以最全面的富集人类 T细胞受体 a链 CDR3的编码序列, 扩增出来的产物 能够区分 T细胞受体 a链的各个亚家族, 且同一模板不会被两组引物特异性结合扩增。 本发明中的引物 能更好的呈现机体免疫大分子的集合与分布, 对找到与疾病相关的信息或者免疫系统变化的信息具有更 可靠的作用。
4、 CDR3编码序列来源于 T细胞受体 β链
当 CDR3编码序列来源于 Τ细胞受体 β链时, 本发明的用于扩增 CDR3编码序列的引物组合物的可 以具有以下特征:
根据本发明的实施例, V区引物和 J区引物在 PCR扩增过程中的作用, 并不受特别限制。 根据本发 明的一个具体示例, V区引物可以作为正义链引物, J区引物可以作为反义链引物。 发明人发现, 通过 如此设置 V区引物和 J区引物, 能够进一步提高将引物组合物用于富集 T细胞受体 β链 CDR3编码序列 时的富集效率。 才艮据本发明的实施例, 上述引物组合物能够适用的 Τ细胞受体类型, 不受特别限制, 本 领域技术人员可以根据研究需要, 选择适当的 Τ细胞受体作为研究对象。 根据本发明的一个实施例, 所 述 Τ细胞受体为人类 Τ细胞受体。 由此, 可以有效地将引物组合物用于对人类 Τ细胞受体 β链 CDR3编 码序列进行富集, 从而可以有效地用于对人体免疫状况进行研究。
另外, 根据本发明的实施例, 可以通过对 V区引物和 J区引物的序列进行选择, 实现一条引物可以 识别多种 V基因片段, 从而可以进一步提高扩增的效率, 减少引物的数目, P争低成本。 根据本发明的一 个实施例, 第一引物组的至少一种引物包含与多个 V基因片段的保守区互补的序列。 由此, 可以在减少 引物的数量的同时, 提高对 T细胞受体 β链 CDR3编码序列进行富集的效率, 发明人还发现, 这样操作 能够提高各 CDR3编码序列扩增的均一性, 从而能够真实地反映 CDR3编码序列在宿主中的分布比例。 类似的, 根据本发明的一个实施例, 第二引物组的至少一种包含与多个 J基因片段的保守区互补的序列。 由此, 可以在减少引物的数量的同时, 提高对 T细胞受体 β链 CDR3编码序列进行富集的效率, 发明人 还发现, 这样操作能够提高各 CDR3编码序列扩增的均一性, 从而能够真实地反映 CDR3编码序列在宿 主中的分布比例。
具体地,根据本发明的实施例,针对人类 Τ细胞受体 β链 CDR3的序列特征,本发明提供了一组( SEQ
ID NO: 135-164 )和一组 J区引物(SEQ ID NO: 165-177 ), 其序列和名称分别总结如下:
引物类型 引物序号 引物序列(SEQ ID NO: ) i3/: O 899/-8osl£ m/-6oiAV
Figure imgf000013_0001
Figure imgf000014_0001
注: R=A/G, Y=C/T, M=A/C。
根据本发明的实施例, 本发明的 V区引物和 J区引物能够区分各亚家族, 且能够更直观地呈现基因 重排后 V-J配对的情况和 V基因的使用偏好性, 此外, 引物合成容易, 错配率低、 特异性高, 且所有引 物的退火温度接近, 从而能够 低扩增的偏向性。
发明人惊奇地发现, 采用上述具体的引物序列, 能够全面覆盖人类 T细胞受体 CDR3的全部亚家族, 包括发现新的 CDR3亚家族, 从而能够全面的富集人类 T细胞受体 CDR3编码序列, 另外, 发明人还发 现通过采用上述引物序列,能够同时在一个 PCR反应体系中进行多重引物 PCR(有时也称为 "多重 PCR" ), 能够有效地对样本中所包含的 CDR3编码序列进行扩增,并且能够保证各 CDR3编码序列扩增的均一性, 从而能够真实地反映 CDR3编码序列在宿主中的分布比例。 根据本发明的实施例, 多重引物 PCR的退火 温度可以为 60摄氏度。 发明人惊奇地发现, 当退火温度为 60摄氏度时, 多重引物 PCR扩增 CDR3的效 率得到显著提高。
由此, 与现有技术相比, 本发明含有可扩增 IMGT数据库 T细胞受体 β链 CDR3序列所有 V区基因 和 J区基因的特异性引物, 可以最全面的富集人类 T细胞受体 β链 CDR3的编码序列, 扩增出来的产物 能够区分 Τ细胞受体 β链的各个亚家族, 且同一模板不会被两组引物特异性结合扩增。 本发明中的引物 能更好的呈现机体免疫大分子的集合与分布, 对找到与疾病相关的信息或者免疫系统变化的信息具有更 可靠的作用。 富集 CDR3编码序列的方法
在本发明的又一方面, 本发明还提出了一种富集 CDR3编码序列的方法。 根据本发明的实施例, 该 方法包括以下步骤: 首先, 提供核酸样本, 该核酸样本中包含编码 CDR3 的核酸序列; 接下来, 利用前 面所述的引物组合物, 以所提供的核酸样本作为模板, 进行 PCR扩增, 如前所述, 基于引物组合物的特 点, 可以通过 PCR扩增获得扩增产物, 该扩增产物中富集了 CDR3编码序列。 其中, 所述 CDR3编码序 列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a链和 T细胞受体 β链的至少一种。 利用 该方法, 能够有效地对免疫球蛋白重链 CDR3编码序列进行扩增, 从而有效地实现免疫球蛋白 CDR3编 码序列的富集。 根据本发明的实施例, 核酸样本的来源不受特别限制。 本领域技术人员可以根据研究需要, 选择可 以获得核酸样本的来源。 例如为了研究某一组织的特有免疫状态, 可以从该组织或其附近提取免疫细胞 作为核酸样本的来源。 根据本发明一个实施例, 可以采用从人外周血能够分离含有上述核酸样本的单个 核细胞, 并且通过分离核酸来获得上述核酸样本。 由此, 提供核酸样本的步骤可以进一步包括: 首先, 从人外周血分离外周血单个核细胞; 接下来, 从外周血单个核细胞提取核酸样本。 由此, 可以有效地获 得含有编码 CDR3的核酸序列的核酸样本, 从而, 可以进一步提高富集 CDR3编码序列的效率。 本领域 技术人员可以通过任何常规的手段从外周血中提取外周血单个核细胞。 根据本发明的一个实施例, 可以 通过密度梯度离心分离所述外周血单个核细胞。 并且可以采用常规的手段从所分离的外周血单个核细胞 中提取基因组 DNA和总 R A作为用于扩增的核酸样本。 由此,可以方便快捷且低成本地获得核酸样本。 本领域技术人员能够理解的是, 当采用总 R A时作为核酸样本进行扩增时, 根据试验需要, 可以首先通 过逆转录将总 R A转换为 cDNA。
根据本发明的实施例, 上述 PCR的类型并不受特别限制, 即可以依次进行多次 PCR反应, 也可以在 一个 PCR体系中完成多轮 PCR扩增。根据本发明的一个实施例, PCR扩增为多重引物 PCR扩增。由此, 可以同时在一个反应体系中完成对目标序列, 即多种样本的 CDR3编码序列的扩增, 并且能够保证各样 本的 CDR3编码序列扩增的均一性, 从而能够真实地反映各样本的 CDR3编码序列的真实相对比例。 在 进行 PCR扩增之后, 可以进一步包括通过选自琼脂糖凝胶电泳、 磁珠纯化和纯化柱纯化的至少一种分离 纯化所得到的扩增产物。 由此, 可以提高扩增产物的纯度, 从而提高富集免疫球蛋白重链 CDR3编码序 列的效率。
此外, 需要说明的是, 当 CDR3编码序列来源于免疫球蛋白重链时, 本发明的富集 CDR3编码序列 的方法中 PCR扩增所采用的引物组合物,其第一引物组中的 V区引物可以具有 SEQ ID NO: 1-20所示的 核苷酸序列, 其第二引物组中的 J区引物具有如 SEQ ID NO: 21所示的核苷酸序列, 获得的扩增产物的 长度为 140-280bp; 当 CDR3编码序列来源于免疫球蛋白轻链时, 本发明的富集 CDR3编码序列的方法中 PCR扩增所采用的引物组合物, 其第一引物组中的 V区引物可以具有 SEQ ID NO: 22-40所示的核苷酸 序列, 其第二引物组中的 J区引物可以具有 SEQ ID NO: 41-45所示的核苷酸序列, 获得的扩增产物的长 度为 110-250bp; 当 CDR3编码序列来源于 T细胞受体 α链时, 本发明的富集 CDR3编码序列的方法中 PCR扩增所采用的引物组合物, 其第一引物组中的 V区引物可以具有 SEQ ID NO: 46-84所示的核苷酸 序列, 其第二引物组中的 J区引物可以具有如 SEQ ID NO: 85- 134所示的核苷酸序列, 获得的扩增产物 的长度为 100-200bp; 当 CDR3编码序列来源于 T细胞受体 β链时,本发明的富集 CDR3编码序列的方法 中 PCR扩增所采用的引物组合物, 其第一引物组中的 V区引物可以具有 SEQ ID NO: 135- 164所示的核 苷酸序列, 其第二引物组中的 J区引物可以具有如 SEQ ID NO: 165- 177所示的核苷酸序列, 获得的扩增 产物的长度为 100-200bp。 由此, 可以进一步提高扩增产物中 CDR3编码序列的纯度, 从而能够提高富集 CDR3编码序列的效率。 构建 CDR3编码序列的测序文库及确定其序列信息的方法
在本发明的又一方面, 本发明提出了一种构建 CDR3编码序列的测序文库的方法。 根据本发明的实 施例, 该方法可以包括以下步骤: 首先, 根据前面所述的方法, 获得富集所述 CDR3编码序列的扩增产 物。 接下来, 针对所得到的扩增产物, 构建 DNA测序文库, 该 DNA测序文库可以作为 CDR3编码序列 的测序文库。 其中, 所述 CDR3编码序列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 a 链和 T细胞受体 β链的至少一种。 由此, 可以在对免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a链 或 T细胞受体 β链的 CDR3编码序列进行富集的基础上, 构建可以用于测序的测序文库。
根据本发明的实施例, 针对扩增产物构建 DNA测序文库的方法并不受特别限制。根据本发明的一个 实施例, 针对扩增产物, 构建 DNA测序文库可以进一步包括:
首先, 对扩增产物进行末端修复, 以便获得经过末端修复的扩增产物。 根据本发明的一个实施例, 所述末端修复是利用 Klenow片段、 T4 DNA聚合酶和 T4多核苷酸激酶进行的,所述 Klenow片段具有 5' →3 '聚合酶活性和 3 '→5'外切酶活性,但缺少 5'→3'外切酶活性。由此,可以进一步提高末端修复的效率, 从而可以进一步提高构建测序文库的效率。 接下来,对经过末端修复的扩增产物进行 3'端添加碱基 A, 以便获得 3 '末端添加碱基 A的扩增产物。 根据本发明的一个实施例,利用 Klenow (3 '-5' exo-)对所述经过末端修复的扩增产物进行 3,端添加碱基 A。 由此, 可以进一步提高在扩增产物的 3,末端添加碱基 A的效率, 从而可以进一步提高构建测序文库的效 率。
接着, 将所得到的 3 '末端添加碱基 A的扩增产物与接头相连, 以便获得连接产物; 对所得到的连接 产物进行 PCR扩增, 以便获得第二扩增产物。 根据本发明的一个实施例, 将所述具有粘性末端 A的扩增 产物与接头相连是利用 T4 DNA连接酶进行的。 由此, 可以进一步提高扩增产物与接头连接的效率, 进 而可以进一步提高构建测序文库的效率。
最后, 将所得到的第二扩增产物进行纯化回收, 以便获得回收产物, 所得到的回收产物构成所述测 序文库。 根据本发明的实施例, 对第二扩增产物进行纯化回收的方法并不受特别限制, 根据本发明的具 体实例, 可以通过选自琼脂糖凝胶电泳、 磁珠纯化和纯化柱纯化的至少一种分离纯化所第二扩增产物。 由此, 可以进一步提高构建测序文库的效率。
由此, 可以有效地构建测序文库, 从而便于后续的测序及进一步分析。
根据本发明的再一方面, 本发明提出了一种确定 CDR3编码序列的序列信息的方法。 根据本发明的 实施例, 该方法可以包括以下步骤:
首先, 才艮据前面所述的方法, 构建 CDR3编码序列的测序文库。 其中, 该 CDR3编码序列来源于选 自免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 a链和 T细胞受体 β链的至少一种。
接下来, 对该 CDR3编码序列的测序文库进行测序, 以便确定该 CDR3编码序列的序列信息。 根据 本发明的实施例, 利用选自 Hiseq2000、 SOLiD、 454、 和单分子测序装置的至少一种进行所述测序。 由 此, 能够高通量高精度地对所得到的免疫球蛋白重链、免疫球蛋白轻链、 T细胞受体 a链或 T细胞受体 β 链的 CDR3编码序列, 从而进一步提高了确定 CDR3编码序列的序列信息的方法的效率。 确定个体免疫状态的方法和系统、 试剂盒
免疫组库作为多样性的免疫细胞在一个个体内某一时刻的总和, 它反应了个体遗传因素、 抗原接触 史和个体时刻的免疫调控。 免疫组库能用于疾病相关研究, 对疾病机理进行探讨, 可作为寻找生物标记 物的一个有效手段, 免疫组库的研究结果可以促进对更多疾病的早期诊断, 治疗甚至预防。 目前已有相 关研究表明 IgH、 TCR与免疫系统疾病的发生有一定关系, 某一种克隆的增多或减少直接影响疾病的发 生和进展, 例如有研究表明特定 IgH克隆的重排是非霍奇金淋巴瘤的生物标志物; 特异性的 B细胞单克 隆增多是慢性淋巴细胞性白血病的首个生物标志物。 由此, 本发明再一方面提出了一种确定个体免疫状 态的方法。
根据本发明的实施例, 本发明的确定个体免疫状态的方法可以包括以下步骤: 首先, 根据前面所述 的方法, 对所述个体的免疫球蛋白重链 CDR3编码序列进行测序, 以便获得由多个测序数据构成的测序 结果; 然后, 基于所得到的测序结果, 确定该个体的免疫状态。 其中, 所述 CDR3编码序列来源于选自 免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 α链和 T细胞受体 β链的至少一种。 通过该方法, 能够 有效地获得个体的免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a链或 T细胞受体 β链的 CDR3编码 序列的序列信息, 从而可以有效地确定个体免疫状态。 在本文中所使用的术语 "免疫状态" 应作广义理 解, 其是指任何可以通过免疫球蛋白重链、免疫球蛋白轻链、 Τ细胞受体 α链或 Τ细胞受体 β链的 CDR3 编码序列的序列信息反映出的免疫信息。
根据本发明的一个实施例, 基于所得到的测序结果, 确定个体的免疫状态可以进一步包括: 将所得 到的测序结果与对照序列进行比对, 以便确定所述个体中所包含的 CDR3的亚家族类型, 以及各亚家族 类型的相对比例。 由此, 可以有效地判断个体免疫系统的组成和分布情况, 从而有效地确定个体的免疫 状态。 另夕卜, 才艮据本发明的实施例, 可以对个体进行多次监控, 判断 CDR3的亚家族类型, 以及各亚家 族类型的相对比例随时间的变化。 为此, 才艮据本发明的一个实施例, 在多个不同的时间点, 从相同的个 体提取样品, 并分别根据前面所述的方法对样品, 获得多个测序结果; 以及将所述多个测序结果进行比 对, 以便确定所述个体中 CDR3亚家族类型以及相对比例的变化。 由此, 可以基于不同时间点的样品的 测序结果的比对, 有效地确定个体中 CDR3亚家族类型以及相对比例的变化, 从而更加有效地判断个体 的免疫状态。 由此, 可以在不同时间对同一个体或多个体进行采样, 分析例如疾病前后或某种特定事件、 时期前后个体免疫组库的变化, 了解个体对特定事件、 在特定时期的免疫系统变化。 例如, 能够从单一 克隆水平知道当前样本的细致变化, 从而寻找与疾病发生发展史相关的信息。
本发明的又一方面提出了一种确定个体免疫状态的系统。 根据本发明的实施例, 参考图 3, 该确定个 体免疫状态的系统 1000包括: CDR3编码序列富集装置 100、 文库构建装置 200、 测序装置 300以及分析 装置 400。 其中, CDR3编码序列富集装置 100中设置有前面所述的引物组合物, 以便对个体的核酸样本 富集 CDR3编码序列, 其中所述 CDR3编码序列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 T细胞 受体 a链和 T细胞受体 β链的至少一种。 文库构建装置 200与 CDR3编码序列富集装置 100相连, 以便 针对经过富集的 CDR3编码序列构建 CDR3编码序列的测序文库。 才艮据本发明的实施例, 关于针对扩增 产物, 构建测序文库的方法和流程, 本领域技术人员可以根据不同的测序技术进行适当选择, 关于流程 的细节, 可以参见测序仪器的厂商例如 Illumina公司所提供的规程, 例如参见 Illumina公司 Multiplexing Sample Preparation Guide ( Part# 1005361 ; Feb 2010 )或 Paired-End SamplePrep Guide ( Part# 1005063 ; Feb 2010 ), 通过参照将其并入本文。 在本文中所使用的术语 "相连" 应作广义理解, 既可以是直接相连, 也 可以是间接相连, 只要能够实现上述功能上的衔接即可。 测序装置 300与文库构建装置 200相连, 用于 对 CDR3编码序列测序文库进行测序, 以便获得由多个测序数据构成的测序结果。 分析装置 400与测序 装置 300相连, 用于基于测序结果, 确定所述个体的免疫状态。 由此, 利用该系统, 能够有效地实施前 述确定个体免疫状态的方法, 从而有效地确定个体的免疫状态。根据本发明的一个实施例, 分析装置 400 可以进一步包括比对单元, 比对单元中存储有对照序列, 用于将测序结果与对照序列进行比对, 以便确 定个体中所包含的 CDR3的亚家族类型, 以及各亚家族类型的相对比例。 根据本发明的实施例, 可以采 用在分析装置 300中预存有相关的序列信息, 也可以采用分析装置 300与远程数据库(图中未显示 )相 连, 进行联网操作。 由此, 可以通过将测序结果与对照序列例如已知的免疫基因组数据库 IMGT进行比 对, 确定 CDR3的亚家族类型分布以及各亚家族类型的分布, 从而进一步提高确定个体免疫状态的效率。
根据本发明的又一方面, 本发明还提出了一种试剂盒。 根据本发明的实施例, 该试剂盒中设置有前 面所述的引物组合物。 利用该试剂盒可以有效地用于检测免疫球蛋白重链、 免疫球蛋白轻链、 T 细胞受 体 α链和 Τ细胞受体 β链的 CDR3的编码序列, 从而可以有效地确定个体的免疫状态。
根据本发明的实施例, 该试剂盒可以包含根据前面所述的引物组合物。 由此, 该试剂盒可以用于检 测免疫球蛋白重链、免疫球蛋白轻链、 Τ细胞受体 a链和 T细胞受体 β链的 V-J重排。根据本发明的另一 个实施例, 本发明的试剂盒可以用于检测免疫球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 α链和 Τ细胞 受体 β链的 CDR3的编码序列。 根据本发明的实施例, 在该试剂盒中, 第一引物组和第二引物组可以设 置在不同的容器中, 也可以设置在相同的容器中以组合物的方式存在。 需要说明的是, 前面描述的关于 本发明的用于扩增 CDR3编码序列的引物组合物的优点, 同样适用于该试剂盒, 在此不再赘述。 下面参考具体实施例, 对本发明进行说明, 需要说明的是, 这些实施例仅仅是说明性的, 而不能理 解为对本发明的限制。
若未特别指明, 实施例中所采用的技术手段为本领域技术人员所熟知的常规手段, 可以参照 《分子 克隆实验指南》 第三版或者相关产品进行, 所采用的试剂和产品也均为可商业获得的。 未详细描述的各 种过程和方法是本领域中公职的常规方法, 所用试剂的来源、 商品名以及有必要列出其组成成分者, 均 在首次出现时标明, 其后所用相同试剂如无特殊说明, 均以首次标明的内容相同。
一般方法
参考图 2, 本发明的富集 CDR3编码序列、 构建测序文库和测序的方法, 一般可以包括以下步骤:
S 100: 从外周血分离单个核细胞(PBMC )
抽取正常人外周血, 具体地, 用含抗凝剂的无菌采血管进行采血, 然后利用 Ficoll-Paque PLUS 或 Percoll淋巴细胞分离液进行密度梯度离心分离 PBMC。
S200: 提取核酸样本
即提取基因组 DNA和总 R A, 具体地,利用蛋白酶 K消化或者酚氯仿抽提的方法提取基因组 DNA; 利用 Trizol法提取总 R A。 S300: 利用引物组合物扩增
以上述核酸样本为模板, 采用本发明的引物组合物进行多重 PCR扩增, 以便获得富集 CDR3编码序 列的扩增产物。
S400: 回收&纯化扩增产物
然后, 利用琼脂糖凝胶电泳以及 MiniElute PCR纯化试剂盒( Qiagen )回收纯化扩增产物。 其中, 当 以总 R A为模板时, 需要先将 R A逆转录为 cDNA。
S500: 构建测序文库
5.1、 末端修复及 3 '末端添加碱基 A
将回收纯化的扩增产物通过 T4 DNA聚合酶、 Klenow片段和 T4多核苷酸激酶等酶的作用以 dNTP 为作用底物进行末端修复, 获得经过末端修复的扩增产物。 然后利用 Klenow 片段 (3 '-5'exo-)聚合酶及 dATP在经过末端修复的扩增产物的 3 '末端添加碱基 A, 以便获得 3 '末端添加碱基 A的扩增产物。 然后, 利用 MiniElute PCR纯化试剂盒( Qiagen ) 回收纯化 3 '末端添加碱基 A的扩增产物。
5.2、 接头连接
将所得到的 3,末端添加碱基 A的扩增产物在 T4 DNA连接酶的作用下与接头进行连接, 以便获得连 接产物。 然后, 利用琼脂糖凝胶电泳以及 MiniElute PCR纯化试剂盒( Qiagen ) 回收纯化连接产物。
5.3、 PCR扩增
以连接产物为模板, 加入通用 PCR引物和测序引物, 用 Phusion酶进行 PCR扩增, 以便获得第二扩 增产物。 然后, 利用琼脂糖胶电泳回收纯化第二扩增产物, 以便获得回收产物, 该回收产物构成 DNA测 序文库。
S600: 测序
将上述获得的 DNA测序文库经安捷伦 2100检测和 Q-PCR定量后, 利用 Hiseq2000测序平台进行测 序, 以便获得由多个测序数据构成的测序结果, 然后, 以 IMGT上免疫球蛋白重链、 免疫球蛋白轻链、 T 细胞受体 a链或 T细胞受体 β链的 CDR3的序列作为参考序列, 对测序结果进行分析。 实施例 1
参照上述一般方法, 按照以下步骤, 对免疫球蛋白重链的 CDR3编码序列进行富集、 构建测序文库、 测序及分析:
1.分离人外周血单个核细胞
1 )取健康人新鲜外周血 lOmL, 注入含有抗凝剂的无菌试管中摇匀, 并加入等量的无菌 PBS摇匀。 2 )取适量体积 Percoll分层液(外周血和分层液的体积比为 2: 1~3 : 1 )于试管中, 将稀释的血液慢慢 加到分层液液面上, 形成清晰界面, 置于水平离心机中离心, 2000 r/m, 20分钟。
3 ) 离心后, 可见从离心管底部到液面分为四层, 分别为红细胞和粒细胞层、 分层液层、 单个核细胞 层、 血浆层。 用吸管插入液面下, 吸取单个核细胞层, 置于另一个无菌试管中。
4 )加入 4倍体积的无菌 PBS充分混匀, 萬心, 1000 r/m, 10分钟; 重复洗涤一次。
5 )用 PBS稀释, 进行细胞计数, 提取的单个核细胞保存于 4 °C备用。 整个分离过程常温下进行。
2. DNA提取
DNA提取试剂盒提取 PBMC DNA。 ( Qiagen )
1 )将 2(^L QIAGEN蛋白酶加入 200μ1样品中, 混匀。
2 )将 200μ 緩冲液 AL加入样品中, 充分混匀, 56°C孵育 10分钟。
3 )加入 200μ 无水乙醇, 充分混匀, 将混合物转移到吸附柱上, 萬心, 8000r/m, 1分钟, 弃废液。
4 )加入 50(^L緩冲液 AW1, 离心, 8000r/m, 1分钟, 弃废液。
5 )加入 500mL緩冲液 AW2 , 离心, 8000 r/m, 1分钟, 弃废液。
6 )全速( 14000 r/m ) 空甩 1分钟。
7 )加入 200μ 緩冲液 AE , 室温静置 1分钟, 萬心, 8000 r/m, 1分钟。 DNA保存于 -20°C备用。 3. 多重 PCR扩增 CDR3
将上一步得到的 DNA作为模板 DNA进行多重 PCR扩增。按下表在 200μ 的 PCR管中配制 4个 PCR 反应体系, 分别为 LX500, LX800, ZXJ500, ZXJ800, 4个平行实验。
Figure imgf000019_0001
PCR反应条件为:
95 °C 15min
94 °C 30s
60 °C 90s 30个循环
72 °C 30s
72 °C 5min
15 °C
PCR产物用 2%琼脂糖凝胶电泳, 电压为 4V/cm, 电泳时间为 2h。 然后切胶, 取 140-280 bp片段, 用 QIAquick Gel纯化试剂盒(Qiagen )进行纯化, 最后将样品溶于 30μ 洗脱緩冲液。 结果如图 4所示, 有多个扩增条带, 在正式建库之前做过摸索实验, Sanger测序结果表明 140-280bp条带才是目的产物即 重链 CDR3编码序列, 建库时回收 140-280bp条带。
4. PCR产物末端修复
将上一步得到的 DNA分别按下表在 1.5mL的离心管中配制 4个末端修复反应体系
Figure imgf000019_0002
然后将管子放到调至 20°C的 Thermomixer(Eppendorf)上反应 30 min, 反应结束后, 用 QIAquick PCR 纯化试剂盒(Qiagen )进行纯化, 最后将样品溶于 32μί洗脱緩冲液。
5. DNA片段 3'末端添加碱基 A
将上一步所得的 DNA分别按下表在 200μ 的 PCR管中配制 4个 3'末端添加碱基 Α反应体系
组分 体积( )
DNA 32 Kl enow緩冲液 5
dATP 10
Klenow (3'-5' exo-) 3
总体积 50 然后将管子放到调至 37°C的 Thermomixer(Eppendrof)上反应 30 min。 反应结束后, 用 MiniElute PCR 纯化试剂盒(Qiagen )进行纯化, 最后将样品溶于 ΙΟμί洗脱緩冲液。
6. 连接接头
Figure imgf000020_0001
其中接头序列为:
接头 1 : 5,GATCGGAAGAGCGGTTCAGCAGGAATGCCGAG ( SEQ ID NO: 178 );
接头 2: 5'TACACTCTTTCCCTACACGACGCTCTTCCGATCT ( SEQ ID NO: 179 )。
然后将管子放到调至 20°C的 Thermomixer(Eppendorf)上反应 15 min。 反应结束后, 用 2%琼脂糖凝胶 电泳分离, 电压为 120V, 电泳时间为 120分钟。 电泳结束后切下目的条带, 用 QIAquick PCR纯化试剂 盒(Qiagen )进行纯化, 最后将样品溶于 30μί洗脱緩冲液。
7. PCR扩增目的产物, 并加入测序引物
将上一步得到的 DNA分别按以下体系配制 4个 PCR反应体系
Figure imgf000020_0002
PI 公用引物:
( SEQ ID
NO: 180 );
Index N:
T ( SEQ ID NO: 181 ), 其中碱基 ]^为八、 T、 C、 G四个碱基的任意组合作为区别标识。
PCR反应条件为:
98 °C 30s
98 °C 10s
65 °C 30s 12个循环
72 °C 30s
72 °C 5min
4°C oo
反应结束后, 用 QIAquick PCR纯化试剂盒(Qiagen )进行纯化, 最后将样品溶于 50μί洗脱緩冲液。 8. 文库检测
Agilent 2100 Bioanalyzer analysis system检测文库插入片段大小及含量; Q-PCR精确定量文库的浓度。
9. 测序与数据分析
文库检测合格后将按照双末端 151个碱基的读长在 Hiseq2000测序仪上进行序列分析。
测序所得的原始数据的基本分析过程主要包括以下步骤: 首先进行数据处理, 通过接头或 PCR引物 上的序列标签区分不同样本的文库数据, 对测序所得的原始数据进行去污染、 去接头和去低质量过滤; 然后将 reads与 IMGT数据库的参考序列进行 、 D、 J基因比对, 分析。
过滤之后的测序原始数据进行比对分析的结果, 见下表 1, 我们平均得到的总序列有 41.46兆条, 特 异性的克隆平均有 2.27兆条。
表 1
Figure imgf000021_0002
文库 LX500测序后获得的各种 V-J基因配对的序列的数量示于表 2中。
Figure imgf000021_0001
IGHV3-20 86 280 1568 3902 1099 2503
IGHV3-21 629 1124 5739 22727 5974 13876
IGHV3-23 4048 4958 22856 105585 27584 43089
IGHV3-30-3 279 379 1820 8628 1981 3796
IGHV3-30 3053 5355 27359 118210 29122 68466
IGHV3-33 913 1545 7584 33983 8111 18606
IGHV3-43 15 17 139 502 142 262
IGHV3-48 1176 2013 10459 41097 10972 24781
IGHV3-49 77 116 733 3305 868 2118
IGHV3-53 938 1401 8393 30037 8680 19023
IGHV3-64 266 447 2214 10022 2480 5449
IGHV3-66 1351 2707 12582 49294 13083 27421
IGHV3-72 41 37 295 1226 308 577
IGHV3-73 48 80 300 1230 281 770
IGHV3-74 440 1104 4068 14417 4482 8542
IGHV3-7 502 881 4756 18178 4742 10843
IGHV3-9 123 116 683 3042 765 1253
IGHV3-d 62 63 352 1431 440 794
IGHV3-NL1 122 128 765 3905 778 1702
IGHV4-28 216 734 3178 7763 4504 5715
IGHV4-30-2 1089 2557 8825 28693 13927 12948
IGHV4-30-4 30 89 418 1280 111 1363
IGHV4-31 360 1146 4831 11602 6614 9944
IGHV4-34 2417 4052 17750 62345 26275 39808
IGHV4-39 1933 4261 15910 53278 24095 28184
IGHV4-4 331 939 4037 9958 5469 8225
IGHV4-59 1701 3991 16976 48053 22818 29273
IGHV4-61 797 2314 10151 25134 12674 17368
IGHV4-b 183 394 1752 4962 2334 2684
IGHV5-51 1120 2040 11141 33538 12097 17690
IGHV5-a 335 565 3091 9606 3522 4134
IGHV6-1 564 1288 4896 20188 6636 12746
IGHV7-4-1 494 893 5175 22487 8672 13910 图 5是基于表 2中数据, 作出的 4个平行文库的 V-J基因配对分布图, 图 5显示了所有的 V基因亚 家族与 J基因亚家族重排后相互配对和各种 VJ配对 CDR3的丰度, 图右侧坐标是 J基因全部亚家族的分 类, 图中横坐标是 V基因的每一种亚家族分类, 两坐标相交点是 V-J基因配对产生的一种 CDR3序列, 左侧坐标则是每种 V-J配对的丰度。从表 2及图 5可以得出结论,使用本发明提供的引物能够全面地富集 人类免疫球蛋白重链 CDR3的编码序列, 扩增出来的产物能够区分免疫球蛋白重链的各个亚家族, 并且 通过上述本发明的方法能够确定各种重链 CDR3编码序列的相对比例, 从而可以进一步基于这些编码序 列的相对比例或该比例的变化, 确定个体的免疫状态。 实施例 1
参照上述一般方法, 按照以下步骤, 对免疫球蛋白轻链的 CDR3编码序列进行富集、 构建测序文库、 测序及分析:
1.分离人外周血单个核细胞 1 )取健康人新鲜外周血 10mL, 注入含有抗凝剂的无菌试管中摇匀, 并加入等量的无菌 PBS摇匀, 样品名 ZXJ。
2 )取适量体积 Percoll分层液(外周血和分层液的体积比为 2: 1~3: 1 ) 于试管中, 将稀释的血液慢慢 加到分层液液面上, 形成清晰界面, 置于水平离心机中离心, 2000 r/m, 20分钟。
3 ) 离心后, 可见从离心管底部到液面分为四层, 分别为红细胞和粒细胞层、 分层液层、 单个核细胞 层、 血浆层。 用吸管插入液面下, 吸取单个核细胞层, 置于另一个无菌试管中。
4 )加入 4倍体积的无菌 PBS充分混匀, 萬心, 1000 r/m, 10分钟; 重复洗涤一次。
5 )用 PBS稀释, 进行细胞计数, 提取的单个核细胞保存于 4°C备用。 整个分离过程常温下进行。
2. DNA提取
DNA提取试剂盒提取 PBMC DNA。 ( Qiagen )
1 )将 2(^L QIAGEN蛋白酶加入 200μ1样品中, 混匀。
2 )将 20(^L緩冲液 AL加入样品中, 充分混匀, 56°C孵育 10分钟。
3 )加入 200μ 无水乙醇, 充分混匀, 将混合物转移到吸附柱上, 萬心, 8000r/m, 1分钟, 弃废液。 4 )加入 50(^L緩冲液 AW1, 离心, 8000r/m, 1分钟, 弃废液。
5 )加入 500mL緩冲液 AW2, 离心, 8000 r/m, 1分钟, 弃废液。
6 )全速( 14000 r/m ) 空甩 1分钟。
7 )加入 20(^L緩冲液 AE, 室温静置 1分钟, 萬心, 8000 r/m, 1分钟。 DNA保存于 -20°C备用。
3. 多重 PCR扩增 CDR3
将上一步得到的 DNA作为模板 DNA进行多重 PCR扩增。按下表在 200μ 的 PCR管中配制 PCR反 应体系, 为 ZXJ。
Figure imgf000023_0001
PCR反应条件为:
95 °C 15min
94 °C 30s
60 °C 90s 30个循环
72 °C 30s
72 °C 5min
15 °C
其中, 图 6是引物扩增免疫球蛋白轻链中 V-J重排构成的 CDR3序列的示意图。
PCR产物用 2%琼脂糖凝胶电泳, 电压为 4V/cm, 电泳时间为 2h。 然后切胶, 取 110-250 bp片段, 用 QIAquick Gel纯化试剂盒(Qiagen )进行纯化, 最后将样品溶于 30μ 洗脱緩冲液。 结果如图 7所示, 有多个扩增条带,在正式建库之前做过摸索实验, Sanger测序结果表明 110-250bp条带才是目的产物即轻 链 CDR3序列, 建库时回收 110-250bp条带。
4. PCR产物末端修复
将上一步得到的 DNA分别按下表在 1.5mL的离心管中配制 4个末端修复反应体系 组分 体积( )
DNA 30
T4 DNA连接酶緩冲液 10
dNTP混合物 4
T4 DNA酶 5
Klenow酶 1
T4 PNK 5
超纯水 45
总体积 100
然后将管子放到调至 20°C的 Thermomixer(Eppendorf)上反应 30 min, 反应结束后, 用 QIAquick PCR 纯化试剂盒(Qiagen )进行纯化, 最后将样品溶于 32μί洗脱緩冲液。
5. DNA片段 3'末端添加碱基 A
将上一步所得的 DNA分别按下表在 200μί的 PCR管中配制 4个 3'末端添加碱基 Α反应体系
Figure imgf000024_0001
然后将管子放到调至 37°C的 Thermomixer(Eppendrof)上反应 30 min。 反应结束后, 用 MiniElute PCR 纯化试剂盒(Qiagen )进行纯化, 最后将样品溶于 ΙΟμί洗脱緩冲液。
6. 连接接头
将上一步得到的 DNA分别按下表在 1.5mL的离心管中配制 4个末端修复反应体系
Figure imgf000024_0002
其中接头序列为:
接头 1 : 5, GATCGGAAGAGCGGTTCAGCAGGAATGCCGAG ( SEQ ID NO: 178 );
接头 2: 5'TACACTCTTTCCCTACACGACGCTCTTCCGATCT ( SEQ ID NO: 179 )。
然后将管子放到调至 20°C的 Thermomixer(Eppendorf)上反应 15 min。 反应结束后, 用 2%琼脂糖凝胶 电泳分离, 电压为 120V, 电泳时间为 120分钟。 电泳结束后切下目的条带, 用 QIAquick PCR纯化试剂 盒(Qiagen )进行纯化, 最后将样品溶于 30μί洗脱緩冲液。
7. PCR扩增目的产物, 并加入测序引物
将上一步得到的 DNA分别按以下体系配制 4个 PCR反应体系
组分 体积( )
接头连接的 DNA 1
P1 公用引物 1 index 51物 1
超纯水 22
Phusion DNA酶 25
总体积 50
PI 公用引物:
AATG ( SEQ ID NO: 180 );
index引物:
T ( SEQ ID NO: 181 ), 其中碱基 ^^为八、 T、 C、 G四个碱基的任意组合作为区别标识。
PCR反应条件为:
98 °C 30s
98 °C 10s
65 °C 30s 12个循环
72 °C 30s
72 °C 5min
4°C oo
反应结束后, 用 QIAquick PCR纯化试剂盒(Qiagen )进行纯化, 最后将样品溶于 50μί洗脱緩冲液。
8. 文库检测
Agilent 2100 Bioanalyzer analysis system检测文库插入片段大小及含量; Q-PCR精确定量文库的浓度。
9. 测序与数据分析
文库检测合格后将按照双末端 151个碱基的读长在 Hiseq2000测序仪上进行序列分析。
测序所得的原始数据的基本分析过程主要包括以下步骤: 首先进行数据处理, 通过接头或 PCR引物 上的序列标签区分不同样本的文库数据, 对测序所得的原始数据进行去污染、 去接头和去低质量过滤; 然后将 reads与 IMGT数据库的参考序列进行 、 J基因比对, 分析。
过滤之后的测序原始数据进行比对分析的结果, 见表 3, 我们平均得到的总序列有 0.4兆条, 特异性 的克隆平均有 0.16兆条。
表 3
Figure imgf000025_0001
文库 ZXJ测序后获得的各种 V-J基因配对的序列的数量示于表 4和表 5中,表 4为 κ型 IGL V-J配对的序 列的数量, 表 5为 λ型 IGL V- J配对的序列的数量。
表 4
^^因
IGKJ1 IGKJ2 IGKJ3 IGKJ4 IGKJ5
\^列数 "-
VK基因 \
IGKV1-12 143 157 48 657 412
IGKV1-13 136 136 41 612 400
IGKV1-16 503 486 133 1585 893
IGKV1-17 164 108 25 517 221
IGKV1-27 253 123 71 738 466
IGKV1-33 91 188 63 631 356 i3/: O 899/-8osl£ m/-6oiAV
Figure imgf000026_0001
IGLV1-51 198 294 1187 55 81
IGLV2-11 1835 2252 9958 603 463
IGLV2-14 5869 5300 17601 659 477
IGLV2-18 1035 1095 4879 498 128
IGLV2-23 2145 2273 9111 447 333
IGLV2-8 1213 1046 3121 103 193
IGLV3-10 182 571 1898 147 215
IGLV3-12 217 337 1191 35 23
IGLV3-16 220 337 1050 66 200
IGLV3-19 777 925 3070 149 192
IGLV3-1 953 1707 4049 199 217
IGLV3-21 1452 2022 6594 223 346
IGLV3-22 33 84 347 14 49
IGLV3-25 532 1340 4094 93 611
IGLV3-27 114 257 1185 71 105
IGLV3-9 82 228 768 26 37
IGLV4-3 7 3 32 0 0
IGLV4-60 169 486 1936 75 226
IGLV4-69 540 1243 6134 322 350
IGLV5-37 163 213 980 25 31
IGLV5-39 67 110 511 14 18
IGLV5-45 392 522 2209 50 69
IGLV5-52 141 184 908 5 15
IGLV6-57 373 768 3961 166 87
IGLV7-43 79 236 1095 28 46
IGLV7-46 92 290 1192 29 138
IGLV8-61 117 174 1006 29 40
IGLV9-49 139 224 1250 45 46 图 8是基于表 4数据作出的文库 ZXJ VK-JK基因配对分布图, 图 9是基于表 5数据作出的 νλ-·Γλ基因 配对分布图, 图 8-9显示了所有的 V基因亚家族与 J基因亚家族重排和各种 CDR3的丰度, 图中, 纵坐 标是 J基因全部亚家族的分类, 横坐标是 V基因的每一种亚家族分类, 两坐标相交点是 V-J基因配对产 生的一种 CDR3序列, 相交点每一方格颜色深浅代表每种 V-J配对的丰度, 图右侧对应有丰度颜色指示 带。 从表 4-5及图 8-9可以得出结论, 使用本发明提供的引物能够全面地富集人类免疫球蛋白轻链 CDR3 序列, 扩增出来的产物能够区分免疫球蛋白轻链的各个亚家族, 并且通过上述本发明的方法能够确定各 种轻链 CDR3序列的相对比例, 从而可以进一步基于这些序列的相对比例或该比例的变化, 确定个体的 免疫状态。 实施例 3
参照上述一般方法, 按照以下步骤, 对 T细胞受体 α链的 CDR3编码序列进行富集、 构建测序文库、 测序及分析:
1. 分离人外周血单个核细胞
1 )取健康人新鲜外周血 5ml于 15ml的离心管中, 并添加 5ml PBS, 混匀, 然后将其靠管壁緩慢加 入到装有 6ml的单核细胞分离液的 50ml离心管中, l,800rpm离心 15min。
2 )吸取单核细胞层于新的 15ml离心管中, 加入三倍体积的 PBS, 轻轻混匀, l,800rpm离心 10min, 弃上清, 获得沉淀。
3 )用 1ml的 PBS将上述沉淀重悬, 然后转移至新的 1.5ml EP管中, l,800rpm离心 lOmin, 弃上清, 获得沉淀。
4 )用 ΙΟΟμΙ的 PBS将上述步骤获得的沉淀重悬, 则单核细胞提取完成。
2. 核酸样本提取
利用 DNA提取试剂盒(Qiagen )提取人外周血单个核细胞基因组 DNA, 具体地, 包括:
1 )将 20μ1 QIAGEN蛋白酶加入 200μ1单核细胞样品中, 混匀。 2 )将 200μ1緩冲液 AL加入样品中, 充分混匀, 56°C孵育 10分钟。
3 )加入 200μ1无水乙醇, 充分混勾, 将混合物转移到吸附柱上, 8000r/m离心 1分钟, 弃废液。
4 ) 然后加入 500μ1緩冲液 AW1 , 8000r/m离心 1分钟, 弃废液。
5 )再加入 500ml緩冲液 AW2, 8000r/m离心 1分钟, 弃废液。
6 ) 然后全速( 14000 r/m ) 空甩 1分钟。
7 )再加入 200μ1緩冲液 AE, 室温静置 1分钟, 8000r/m离心 1分钟, 以便提取获得 DNA, 保存于 -20 °C , 备用。
3. 多重 PCR扩增
以上一步得到的 DNA作为模板, 采用具有 SEQ ID NO: 46-84所示的核苷酸序列的 V区引物组成的 第一引物组和具有 SEQ ID NO: 85-134所示的核苷酸序列的 J区引物组成的第二引物组, 进行多重 PCR 扩增。
具体地, 首先, 将浓度均为 ΙΟΟμΜ的 39种 V区引物各取 Ιμΐ混合, 然后加 Ι ΐμΐ的水稀释混匀, 以 便获得第一引物组, 则获得的第一引物组中各 V区引物的浓度均为 2μΜ。 然后, 同样将浓度均为 ΙΟΟμΜ 的 50种 J区引物各取 Ιμΐ混合,以便获得第二引物组,则获得的第二引物组中各 J区引物的浓度均为 2μΜ 然后, 按下表的配比, 配制多重 PCR扩增的反应体系:
Figure imgf000028_0001
然后, 将配制好的反应体系按以下反应条件进行 PCR扩增:
95 °C 15min
94 °C 30s
60 °C 90s 30个循环
72 °C 30s
72 °C lOmin
12 °C oo
由此, 获得扩增产物。
然后, 将扩增产物进行 2%琼脂糖凝胶电泳, 并切取 10-200bp的胶(如图 10所示) , 并用 QIAquick Gel纯化试剂盒( Qiagen )对其进行纯化回收, 然后将回收产物溶于 34μ1的洗脱緩冲液, 备用。
4. 末端修复
将上一步得到的扩增产物, 按下表中的配比于 1.5ml离心管中配制末端修复反应体系:
扩增产物 32 μΐ
10 多聚核苷酸激酶緩冲液 10
dNTP溶液(每种 10mM ) 3 μΐ
T4 DNA聚合酶 5 μΐ
双蒸水 44 μΐ Klenow片段 1 μΐ
T4多聚核苷酸激酶 5 μΐ
总体积 100 μΐ
然后将离心管放置于调至 20°C的 Thermomixer(Eppendorf)上反应 30 min, 以便获得经过末端修复的 扩增产物, 然后利用 QIAquick PCR纯化试剂盒(Qiagen )将经过末端修复的扩增产物进行纯化, 最后将 其溶于 34μ1洗脱緩冲液中, 备用。
5. 3'末端添加碱基 A
将经过末端修复的扩增产物,按下表中的配比于 1.5ml离心管中配制 3'末端添加碱基 A的反应体系:
Figure imgf000029_0001
然后将离心管放置于调至 37°C的 Thermomixer(Eppendorf)上反应 30 min, 以便获得 3,末端添加碱基 A的的扩增产物, 然后利用 MiniElute PCR纯化试剂盒(Qiagen )将 3'末端添加碱基 A的的扩增产物进 行纯化, 最后将其溶于 20μ1洗脱緩冲液中, 备用。
6. 连接接头
将 3'末端添加碱基 Α的的扩增产物, 按下表中的配比于 1.5ml离心管中配制接头连接的反应体系:
Figure imgf000029_0002
其中 ΡΕΙ-接头的序列为:
接头 1: TACACTCTTTCCCTACACGACGCTCTTCCGATCT ( SEQ ID NO: 179 );
接头 2: 5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTC AC ( SEQ ID NO: 182 )。
然后将离心管放置于调至 20°C的 Thermomixer(Eppendorf)上反应 15min, 以便获得连接产物, 然后利 用 MiniElute PCR纯化试剂盒( Qiagen )将连接产物进行纯化, 最后将其溶于 28μ1洗脱緩冲液中, 备用。
7. PCR扩增
将上一步得到的连接产物, 按下表中的配比配制 PCR反应体系:
连接产物 12.5 μΐ
P1公用引物 1 μΐ
标签 7引物 ( Primer index 7 ) 1 μΐ
双蒸水 10.5 μΐ
2 phusion master mix 25
总体积 50 μΐ PI公用引物:
AATG^ ( SEQ ID NO: 180 );
标签 7引物 ( Primer index7 )
T ( SEQ ID NO: 183 )。
然后, 将配制好的反应体系于 PCR仪上进行 PCR反应, 以便获得第二扩增产物, 其中 PCR反应条 件为:
98 °C lmin
10个循环
Figure imgf000030_0001
12 °C
然后, 利用 QIAquick PCR纯化试剂盒(Qiagen )纯化回收 200-300bp的第二扩增产物, 以便获得回 收产物, 该回收产物构成 DNA测序文库。 然后, 将获得的测序文库样品溶于 20μ1洗脱緩冲液。
8. 文库检测
利用 Agilent 2100 Bioanalyzer analysis system检测获得的测序文库中插入片段大小及含量; 利用 Q-PCR精确定量该文库的浓度。
9. 测序与数据分析
文库检测合格后将按照双末端 151个碱基的读长在 Hiseq2000测序仪上进行测序及序列分析。 序列 定。 为了将来源" ^不同样本制备的 DNA文库在测序后区分开来, 将: bp或 8bp的标签序列通过接 头或者 PCR引物引入到片段的一侧, 以便将不同文库直接混合后上机测序。 测序时, 先用 SP1引物对样 品 DNA的一端进行测序, 再用 SP2引物对样品 DNA的另一端进行测序。
然后,对获得的测序结果进行数据分析, 其中分析数据时参考的序列为 IMGT上 TCRA的参考序列。 具体地, 首先对测序所得的原始数据进行基本分析, 其主要包括以下步骤: 对进行原始数据进行数据处 理, 通过接头或 PCR引物上的序列标签区分不同样本的文库数据, 对测序所得的原始数据进行去污染、 去接头和去低质量过滤, 以便确定 reads; 然后,将 reads与 IMGT数据库的参考序列进行 V、 J基因比对、 分析, 结果见下表 6以及图 11 : 表 6: reads分析比对结果
Figure imgf000030_0002
此外, 图 11显示了所有的 V基因亚家族与 J基因亚家族重排后相互配对和各种 VJ配对分布以及 CDR3的丰度。 如图 11所示, 左侧坐标是 J基因全部亚家族的分类, 横坐标是 V基因的每一种亚家族分 类, 两坐标相交点是 V-J基因配对产生的一种 CDR3序列, 右侧颜色带指示每一方格的颜色深浅, 代表 每种 V-J配对的丰度。 从图 11中可以看出, 使用本发明提供的引物组合物能够全面地富集人类 T细胞受 体 CDR3的序列, 扩增出来的产物能够区分 T细胞受体 α链的各个亚家族。 实施例 4 参照上述一般方法, 按照以下步骤, 对 T细胞受体 β链的 CDR3编码序列进行富集、 构建测序文库、 测序及分析:
1. 分离人外周血单个核细胞
1 )取健康人新鲜外周血 5mL于 15ml的离心管中, 并添加 5ml PBS, 混匀, 然后将其靠管壁緩慢加 入到装有 6ml的单核细胞分离液的 50ml离心管中, l,800rpm离心 15min。
2 )吸取单核细胞层于新的 15ml离心管中, 加入三倍体积的 PBS, 轻轻混匀, l,800rpm离心 10min, 弃上清, 获得沉淀。
3 )用 1ml的 PBS将上述沉淀重悬, 然后转移至新的 1.5ml EP管中, l,800rpm离心 lOmin, 弃上清, 获得沉淀。
4 )用 ΙΟΟμ 的 PBS将上述步骤获得的沉淀重悬, 则单核细胞提取完成。
2. 核酸样本提取
2.1 DNA提取
利用 DNA提取试剂盒(Qiagen )提取人外周血单个核细胞基因组 DNA, 具体地, 包括:
1 )将 2(^L QIAGEN蛋白酶加入 200μΙ^单核细胞样品中, 混匀。
2 )将 20(^L緩冲液 AL加入样品中, 充分混匀, 56°C孵育 10分钟。
3 )加入 200μ 无水乙醇, 充分混勾, 将混合物转移到吸附柱上, 8000r/m离心 1分钟, 弃废液。
4 ) 然后加入 50(^L緩冲液 AW1 , 8000r/m离心 1分钟, 弃废液。
5 )再加入 500mL緩冲液 AW2, 8000r/m离心 1分钟, 弃废液。
6 ) 然后全速( 14000 r/m ) 空甩 1分钟。
7 )再加入 200μ 緩冲液 AE, 室温静置 1分钟, 8000r/m离心 1分钟, 以便提取获得 DNA, 保存于
-20 °C , 备用。
2.2 总 R A提取及逆转录
也可以以总 R A为核酸样本。首先,利用 Trizol法提取总 RNA。然后按照以下步骤将获得的总 R A 逆转录为 cDNA:
( 1 )按下表中的配比配置混合物:
Figure imgf000031_0001
其中, C区引物(TRBC-R1 ) 为:
CTCAAACACAGCGACCTC ( SEQ ID NO: 184 )。
然后, 将获得的混合物于 PCR仪上 65 °C变性 5min后, 立即置于冰上, 并向混合物中继续添加下表 中的试剂:
Figure imgf000031_0002
( 2 )混匀后于室温下放置 2min, 然后加入 l L superscript II ( 20υ/μΐΛ
( 3 )混匀后, 于 PCR仪上按下列条件进行反应:
42 °C 50min
72 °C 15min 以便提取获得 cDNA, 保存备用。
然后, 分别以上一步得到的 DNA和 cDNA进行后续的步骤, 其中, 以 DNA为例, 具体步骤如下所 述:
3. 多重 PCR扩增
以上一步得到的 DNA作为模板, 采用具有 SEQ ID NO: 135-164所示的核苷酸序列的 V区引物组成 的第一引物组和具有 SEQ ID NO: 165-177所示的核苷酸序列的 J区引物组成的第二引物组, 进行多重 PCR扩增。
具体地, 首先, 将浓度均为 ΙΟΟμΜ的 30种 V区引物各取 ΙμΣ混合, 然后加 20 L的水稀释混匀, 以便获得第一引物组,则获得的第一引物组中各 V区引物的浓度均为 2μΜ。然后,同样将浓度均为 ΙΟΟμΜ 的 13种 J区引物各取 Ιμί混合, 然后加 37 L的水稀释混匀, 以便获得第二引物组, 则获得的第二引物 组中各 J区引物的浓度均为 2μΜ。
然后, 按下表的配比, 配制多重 PCR扩增的反应体系:
Figure imgf000032_0001
然后, 将配制好的反应体系按以下反应条件进行 PCR扩增:
95 °C 15min
94 °C 30s
60 °C 90s 30个循环
72 °C 30s
72 °C lOmin
12 °C oo
由此, 获得扩增产物。
然后, 将扩增产物进行 2%琼脂糖凝胶电泳, 其中电压为 100V, 电泳时间为 2小时 20分钟。 然后切 取 100-200 bp的胶, 并用 QIAquick Gel纯化试剂盒( Qiagen )对其进行纯化回收, 然后将回收产物溶于 30μ 的洗脱緩冲液, 备用。 其中, 电泳结果见图 12。 如图 12所示, 其中 Mark为 50bp DNA Ladder。
4. 末端修复
将上一步得到的扩增产物, 按下表中的配比于 1.5mL离心管中配制末端修复反应体系:
扩增产物 32μ1
10 多聚核苷酸激酶緩冲液 10 μ∑
dNTP溶液(每种 10mM ) 3μ∑
T4 DNA聚合酶 5 μΐ^
双蒸水 44μ∑
Klenow片段 1 μ∑
T4多聚核苷酸激酶 5 μΐ^ 总体积 100 μL
然后将离心管放置于调至 20°C的 Thermomixer(Eppendorf)上反应 30 min, 以便获得经过末端修复的 扩增产物, 然后利用 QIAquick PCR纯化试剂盒(Qiagen )将经过末端修复的扩增产物进行纯化, 最后将 其溶于 34μί洗脱緩冲液中, 备用。
5. 3'末端添加碱基 A
将经过末端修复的扩增产物,按下表中的配比于 1.5mL离心管中配制 3'末端添加碱基 A的反应体系:
Figure imgf000033_0001
然后将离心管放置于调至 37°C的 Thermomixer(Eppendorf)上反应 30 min, 以便获得 3,末端添加碱基 A的的扩增产物, 然后利用 MiniElute PCR纯化试剂盒(Qiagen )将 3'末端添加碱基 A的的扩增产物进 行纯化, 最后将其溶于 2C^L洗脱緩冲液中, 备用。
6. 连接接头
将 3'末端添加碱基 A的的扩增产物, 按下表中的配比于 1.5mL离心管中配制接头连接的反应体系:
Figure imgf000033_0002
其中 ΡΕΙ-接头的序列为:
接头 1 : TACACTCTTTCCCTACACGACGCTCTTCCGATCT ( SEQ ID NO: 179 );
接头 2: 5-Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTC AC ( SEQ ID NO: 182 )。
然后将离心管放置于调至 20°C的 Thermomixer(Eppendorf)上反应 15min, 以便获得连接产物, 然后利 用 MiniElute PCR纯化试剂盒( Qiagen )将连接产物进行纯化, 最后将其溶于 32μ 洗脱緩冲液中, 备用。
7. PCR扩增
将上一步得到的连接产物, 按下表中的配比配制 PCR反应体系:
Figure imgf000033_0003
Ρ1公用引物: 180 );
标签 5引物 ( Primer index 5 )
( SEQ ID NO: 185 )。
然后, 将配制好的反应体系于 PCR仪上进行 PCR反应, 以便获得第二扩增产物, 其中 PCR反应条 件为:
98 °C lmin
10个循环
Figure imgf000034_0001
12 °C
然后, 利用 QIAquick PCR纯化试剂盒(Qiagen )对第二扩增产物进行纯化回收, 以便获得回收产物, 该回收产物构成 DNA测序文库。 然后, 将获得的测序文库样品溶于 20μί洗脱緩冲液。
8. 文库检测
利用 Agilent 2100 Bioanalyzer analysis system检测获得的测序文库中插入片段大小及含量; 利用
Q-PCR精确定量该文库的浓度。
9. 测序与数据分析
文库检测合格后将按照双末端 151个碱基的读长在 Hiseq2000测序仪上进行测序及序列分析。 序列 定。 为了将来源" ^不同样本制备的 DNA文库在测序后区分开来, 将: bp或 8bp的标签序列通过接 头或者 PCR引物引入到片段的一侧, 以便将不同文库直接混合后上机测序。 测序时, 先用 SP1引物对样 品 DNA的一端进行测序, 再用 SP2引物对样品 DNA的另一端进行测序。
然后, 对获得的测序结果进行数据分析, 其中分析数据时参考的序列为 IMGT上 TCRB的参考序列。 具体地, 首先对测序所得的原始数据进行基本分析, 其主要包括以下步骤: 对进行原始数据进行数据处 理, 通过接头或 PCR引物上的序列标签区分不同样本的文库数据, 对测序所得的原始数据进行去污染、 去接头和去低质量过滤, 以便确定 reads; 然后, 将 reads与 IMGT数据库的参考序列进行 V、 D、 J基因 比对、 分析, 结果见下表 7、 表 8以及图 13 :
表 7: TCRV-J分布图原始数据
Figure imgf000035_0001
Figure imgf000036_0001
表 8: 表 7的结果总结
Figure imgf000037_0001
此外, 图 13显示了所有的 V基因亚家族与 J基因亚家族重排后相互配对和各种 VJ配对分布以及 CDR3的丰度。 如图 13所示, 左侧坐标是 J基因全部亚家族的分类, 横坐标是 V基因的每一种亚家族分 类, 两坐标相交点是 V-J基因配对产生的一种 CDR3序列, 右侧颜色带指示每一方格的颜色深浅, 代表 每种 V-J配对的丰度。从图 13中可以看出,使用本发明提供的引物组合物能够全面地富集人类 T细胞受 体 β链 CDR3的序列, 扩增出来的产物能够区分 Τ细胞受体 β链的各个亚家族。
工业实用性
本发明的用于扩增 CDR3编码序列的引物组合物、 富集 CDR3编码序列的方法、 构建 CDR3编 码序列的测序文库的方法、 确定 CDR3编码序列的序列信息的方法、 确定个体免疫状态的方法、 确 定个体免疫状态的系统以及试剂盒, 能够有效地应用于对个体的免疫球蛋白重链和轻链、 Τ细胞受体 α链和 β链的 CDR3编码序列进行富集和测序, 并且基于测序结果, 能够准确、 高效地确定个体的免疫 状态。
尽管本发明的具体实施方式已经得到详细的描述, 本领域技术人员将会理解。 根据已经公开的所有 教导, 可以对那些细节进行各种修改和替换, 这些改变均在本发明的保护范围之内。 本发明的全部范围 由所附权利要求及其任何等同物给出。
在本说明书的描述中, 参考术语 "一个实施例"、 "一些实施例"、 "示意性实施例"、 "示例"、 "具体 示例"、 或 "一些示例"等的描述意指结合该实施例或示例描述的具体特征、 结构、 材料或者特点包含于 本发明的至少一个实施例或示例中。 在本说明书中, 对上述术语的示意性表述不一定指的是相同的实施 例或示例。 而且, 描述的具体特征、 结构、 材料或者特点可以在任何的一个或多个实施例或示例中以合 适的方式结合。

Claims

权利要求书
1、 一种用于扩增 CDR3编码序列的引物组合物, 其特征在于, 包括:
第一引物组, 所述第一引物组由至少一种 V区引物组成, 所述至少一种 V区引物的每一种均包含与 至少一个 V基因片段互补的序列; 以及
第二引物组, 所述第二引物组由至少一种 J区引物组成, 所述至少一种 J区引物的每一种均包含与 至少一个 J基因片段互补的序列,
其中, 所述 CDR3编码序列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 α链和 T细 胞受体 β链的至少一种。
2、 根据权利要求 1所述的引物组合物, 其特征在于, 所述 CDR3编码序列来源于免疫球蛋白重链。
3、 根据权利要求 2所述的弓 I物组合物, 其特征在于, 所述 V区引物是正义链引物, 所述 J区引物 是反义链引物。
4、 根据权利要求 2所述的引物组合物, 其特征在于, 所述免疫球蛋白为人类免疫球蛋白。
5、根据权利要求 2所述的引物组合物, 其特征在于, 所述第一引物组的至少一种引物包含与多个 V 基因片段的保守区互补的序列。
6、 根据权利要求 5所述的引物组合物, 其特征在于, 所述 V区引物具有选自 SEQ ID NO: 1-20所 示的核苷酸序列。
7、根据权利要求 2所述的引物组合物, 其特征在于, 所述第二引物组的至少一种包含与多个 J基因 片段的保守区互补的序列。
8、根据权利要求 2所述的引物组合物, 其特征在于, 所述第二引物组由一种引物构成, 该引物包含 与多个 J基因片段的保守区互补的序列。
9、 根据权利要求 8所述的引物组合物, 其特征在于, 所述 J区引物具有如 SEQ ID NO: 21所示的 核苷酸序列。
10、根据权利要求 1所述的引物组合物, 其特征在于, 所述 CDR3编码序列来源于免疫球蛋白轻链。
11、根据权利要求 10所述的引物组合物, 其特征在于, 所述 V区引物是正义链引物, 所述 J区引物 是反义链引物。
12、 根据权利要求 10所述的引物组合物, 其特征在于, 所述免疫球蛋白为人类免疫球蛋白。
13、根据权利要求 10所述的引物组合物, 其特征在于, 所述第一引物组的至少一种引物包含与多个 V基因片段的保守区互补的序列。
14、 根据权利要求 13所述的引物组合物, 其特征在于, 所述 V区引物具有选自 SEQ ID NO: 22-40 所示的核苷酸序列。
15、根据权利要求 10所述的引物组合物, 其特征在于, 所述第二引物组的至少一种包含与多个 J基 因片段的保守区互补的序列。
16、 根据权利要求 15所述的引物组合物, 其特征在于, 所述 J区引物具有选自 SEQ ID NO: 41-45 所示的核苷酸序列。
17、根据权利要求 1所述的引物组合物,其特征在于, 所述 CDR3编码序列来源于 T细胞受体 α链。
18、 根据权利要求 17所述的引物组合物, 其特征在于, 所述 V区引物是正义链引物, 所述 J区引 物是反义链引物。
19、 根据权利要求 17所述的引物组合物, 其特征在于, 所述 T细胞受体为人类 T细胞受体。
20、根据权利要求 17所述的引物组合物, 其特征在于, 所述第一引物组的至少一种引物包含与多个
V基因片段的保守区互补的序列。
21、 根据权利要求 20所述的引物组合物, 其特征在于, 所述 V区引物具有选自 SEQ ID NO: 46-84 所示的核苷酸序列。
22、根据权利要求 17所述的引物组合物, 其特征在于, 所述第二引物组的至少一种引物包含与多个 J基因片段的保守区互补的序列。
23、 根据权利要求 22所述的引物组合物, 其特征在于, 所述 J区引物具有选自 SEQ ID NO: 85- 134 所示的核苷酸序列。
24、根据权利要求 1所述的引物组合物,其特征在于, 所述 CDR3编码序列来源于 T细胞受体 β链。
25、 根据权利要求 24所述的引物组合物, 其特征在于, 所述 V区引物是正义链引物, 所述 J区引 物是反义链引物。
26、 根据权利要求 24所述的引物组合物, 其特征在于, 所述 T细胞受体为人类 T细胞受体。
27、根据权利要求 24所述的引物组合物, 其特征在于, 所述第一引物组的至少一种引物包含与多个 V基因片段的保守区互补的序列。
28、根据权利要求 27所述的引物组合物,其特征在于,所述 V区引物具有选自 SEQ ID NO: 135-164 所示的核苷酸序列。
29、根据权利要求 24所述的引物组合物, 其特征在于, 所述第二引物组的至少一种引物包含与多个 J基因片段的保守区互补的序列。
30、根据权利要求 29所述的引物组合物,其特征在于, 所述 J区引物具有选自 SEQ ID NO: 165- 177 所示的核苷酸序列。
31、 一种富集 CDR3编码序列的方法, 其特征在于, 包括以下步骤:
提供核酸样本, 所述核酸样本中包含编码 CDR3的核酸序列; 以及
利用权利要求 1-30任一项所述的引物组合物, 以所述核酸样本作为模板, 进行 PCR扩增, 以便获 得富集所述 CDR3编码序列的扩增产物,
其中, 所述 CDR3编码序列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 α链和 T细 胞受体 β链的至少一种。
32、 根据权利要求 31所述的方法, 其特征在于, 进一步包括:
从人外周血分离外周血单个核细胞; 以及
从所述外周血单个核细胞提取所述核酸样本。
33、 根据权利要求 32所述的方法, 其特征在于, 所述外周血来源于正常人。
34、 根据权利要求 32所述的方法, 其特征在于, 通过密度梯度离心分离所述外周血单个核细胞。
35、 根据权利要求 31所述的方法, 其特征在于, 所述 PCR扩增为多重引物 PCR扩增。
36、 根据权利要求 35所述的方法, 其特征在于, 所述多重引物 PCR扩增的退火温度为 60摄氏度。
37、根据权利要求 31所述的方法, 其特征在于, 进一步包括通过选自琼脂糖凝胶电泳、 磁珠纯化和 纯化柱纯化的至少一种分离纯化所述扩增产物。
38、 根据权利要求 31所述的方法, 其特征在于, 所述 CDR3编码序列来源于免疫球蛋白重链。
39、 根据权利要求 38所述的方法, 其特征在于, 所述 PCR扩增采用权利要求 2-9任一项所述的引 物组合物进行。
40、 根据权利要求 39所述的方法 其特征在于, 所述扩增产物的长度为 140-280bp。
41、 根据权利要求 31所述的方法 其特征在于, 所述 CDR3编码序列来源于免疫球蛋白轻链。
42、 根据权利要求 41所述的方法 其特征在于, 所述 PCR扩增采用权利要求 10- 16任一项所述的 引物组合物进行。
43、 根据权利要求 42所述的方法 其特征在于, 所述扩增产物的长度为 110-250bp。
44、 根据权利要求 31所述的方法 其特征在于, 所述 CDR3编码序列来源于 T细胞受体 a链。
45、 根据权利要求 44所述的方法 其特征在于, 所述 PCR扩增采用权利要求 17-23任一项所述的 引物组合物进行。
46、 根据权利要求 45所述的方法 其特征在于, 所述扩增产物的长度为 100-200bp。
47、 根据权利要求 31所述的方法 其特征在于, 所述 CDR3编码序列来源于 T细胞受体 β链。
48、 根据权利要求 47所述的方法 其特征在于, 所述 PCR扩增采用权利要求 24-30任一项所述的 引物组合物进行。
49、 根据权利要求 48所述的方法 其特征在于, 所述扩增产物的长度为 100-200bp。
50、 一种构建 CDR3编码序列的测序文库的方法, 其特征在于, 包括以下步骤: 根据权利要求 31-49任一项所述的方法, 获得富集所述 CDR3编码序列的扩增产物; 以及 针对所述扩增产物,构建 DNA测序文库,所述 DNA测序文库构成所述 CDR3编码序列的测序文库, 其中, 所述 CDR3编码序列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 α链和 T细 胞受体 β链的至少一种。
51、 根据权利要求 50所述的方法, 其特征在于, 针对所述扩增产物, 构建 DNA测序文库进一步包 括:
对所述扩增产物进行末端修复, 以便获得经过末端修复的扩增产物;
对所述经过末端修复的扩增产物进行 3 '端添加碱基 Α, 以便获得 3 '末端添加碱基 Α的扩增产物; 将所述 3,末端添加碱基 A的扩增产物与接头相连, 以便获得连接产物;
对所述连接产物进行 PCR扩增, 以便获得第二扩增产物; 以及
将所述第二扩增产物进行纯化回收, 以便获得回收产物, 所述回收产物构成所述 DNA测序文库。
52、 根据权利要求 51所述的方法, 其特征在于, 所述末端修复是利用 Klenow片段、 T4 DNA聚合 酶和 T4多核苷酸激酶进行的, 所述 Klenow片段具有 5'→ 3 '聚合酶活性和 3 '→ 5'外切酶活性, 但缺少 5' → 3 '外切酶活性。
53、 根据权利要求 51所述的方法, 其特征在于, 利用 Klenow (3 '-5' exo-)对所述经过末端修复的扩 增产物进行 3 '端添加碱基 A。
54、 根据权利要求 51所述的方法, 其特征在于, 将所述具有粘性末端 A的扩增产物与接头相连是 利用 T4 DNA连接酶进行的。
55、根据权利要求 51所述的方法, 其特征在于, 通过选自琼脂糖凝胶电泳、磁珠纯化和纯化柱纯化 的至少一种分离纯化所述第二扩增产物。
56、 一种确定 CDR3编码序列信息的方法, 其特征在于, 包括以下步骤:
根据权利要求 50-55任一项所述的方法, 构建 CDR3编码序列的测序文库; 以及
对所述 CDR3编码序列的测序文库进行测序, 以便确定所述 CDR3编码序列的序列信息, 其中, 所述 CDR3编码序列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 α链和 T细 胞受体 β链的至少一种。
57、 根据权利要求 56所述的方法, 其特征在于, 利用选自 Hiseq2000、 SOLiD、 454和单分子测序 装置的至少一种进行所述测序。
58、 一种确定个体免疫状态的方法, 其特征在于, 包括以下步骤:
根据权利要求 56或 57所述的方法, 对所述个体的 CDR3编码序列进行测序, 以便获得由多个测序 数据构成的测序结果; 以及
基于所述测序结果, 确定所述个体的免疫状态,
其中, 所述 CDR3编码序列来源于选自免疫球蛋白重链、 免疫球蛋白轻链、 T细胞受体 α链和 T细 胞受体 β链的至少一种。
59、根据权利要求 58所述的方法, 其特征在于, 基于所述测序结果, 确定所述个体的免疫状态进一 步包括:
将所述测序结果与对照序列进行比对, 以便确定所述个体中所包含的 CDR3的亚家族类型, 以及各 亚家族类型的相对比例。
60、 根据权利要求 59所述的方法, 其特征在于, 在多个不同的时间点, 从相同的个体提取样品, 并 分别根据权利要求 56或 57所述的方法, 获得多个测序结果; 以及
将所述多个测序结果进行比对, 以便确定所述个体中 CDR3的亚家族类型以及相对比例的变化。
61、 一种确定个体免疫状态的系统, 其特征在于, 包括:
CDR3编码序列富集装置, 所述 CDR3编码序列富集装置中设置有权利要求 1-30任一项所述的引物 组合物, 以便对所述个体的核酸样本富集 CDR3编码序列, 其中, 所述 CDR3编码序列来源于选自免疫 球蛋白重链、 免疫球蛋白轻链、 Τ细胞受体 a链和 T细胞受体 β链的至少一种;
文库构建装置, 所述文库构建装置与所述 CDR3编码序列富集装置相连, 以便针对所述经过富集的
CDR3编码序列构建 CDR3编码序列的测序文库; 测序装置, 所述测序装置与所述文库构建装置相连, 用于对所述 CDR3编码序列的测序文库进行测 序, 以便获得由多个测序数据构成的测序结果; 以及
分析装置, 所述分析装置与所述测序装置相连, 用于基于所述测序结果, 确定所述个体的免疫状态。
62、根据权利要求 61所述的系统, 其特征在于, 所述分析装置进一步包括比对单元, 所述比对单元 中存储有对照序列,用于将所述测序结果与所述对照序列进行比对,以便确定所述个体中所包含的 CDR3 的亚家族类型, 以及各亚家族类型的相对比例。
63、 一种试剂盒, 其特征在于, 所述试剂盒中设置有权利要求 1-30任一项所述的引物组合物。
64、根据权利要求 63所述的试剂盒, 其特征在于, 所述试剂盒用于检测选自免疫球蛋白重链、 免疫 球蛋白轻链、 T细胞受体 a链和 T细胞受体 β链的至少一种的 V-J重排。
65、根据权利要求 63所述的试剂盒, 其特征在于, 所述试剂盒用于检测选自免疫球蛋白重链、 免疫 球蛋白轻链、 Τ细胞受体 a链和 T细胞受体 β链的至少一种的 CDR3的编码序列。
PCT/CN2012/087668 2011-12-27 2012-12-27 用于扩增cdr3编码序列的引物组合物及其用途 WO2013097744A1 (zh)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
CN201110444740.0A CN103184216B (zh) 2011-12-27 2011-12-27 用于扩增免疫球蛋白重链cdr3编码序列的引物组合物及其用途
CN201110444740.0 2011-12-27
CN201210011443.1 2012-01-13
CN201210011443.1A CN103205420B (zh) 2012-01-13 2012-01-13 用于扩增T细胞受体β链CDR3编码序列的引物组合物及其用途
CN201210017173.5 2012-01-19
CN201210017173.5A CN103215255B (zh) 2012-01-19 2012-01-19 用于扩增免疫球蛋白轻链cdr3序列的引物集及其用途
CN201210055230.9A CN103289994B (zh) 2012-03-05 2012-03-05 用于扩增T细胞受体α链CDR3编码序列的引物组合物及其用途
CN201210055230.9 2012-03-05

Publications (1)

Publication Number Publication Date
WO2013097744A1 true WO2013097744A1 (zh) 2013-07-04

Family

ID=48696344

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2012/087668 WO2013097744A1 (zh) 2011-12-27 2012-12-27 用于扩增cdr3编码序列的引物组合物及其用途

Country Status (1)

Country Link
WO (1) WO2013097744A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10202640B2 (en) * 2014-05-07 2019-02-12 The Board Of Trustees Of The Leland Stanford Junior University Single cell analysis of T cells using high-throughput multiplex amplification and deep sequencing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010151416A1 (en) * 2009-06-25 2010-12-29 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010151416A1 (en) * 2009-06-25 2010-12-29 Fred Hutchinson Cancer Research Center Method of measuring adaptive immunity

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TEER J. K. ET AL.: "Systematic comparison of three genomic enrichment methods for massively parallel DNA sequencing", GENOME RESEARCH, vol. 20, 1 September 2010 (2010-09-01), pages 1 - 12, XP055074121 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10202640B2 (en) * 2014-05-07 2019-02-12 The Board Of Trustees Of The Leland Stanford Junior University Single cell analysis of T cells using high-throughput multiplex amplification and deep sequencing

Similar Documents

Publication Publication Date Title
AU2016242967B2 (en) Method of identifying human compatible T cell receptors specific for an antigenic target
CN103205420B (zh) 用于扩增T细胞受体β链CDR3编码序列的引物组合物及其用途
EP2364368B1 (en) Methods of monitoring conditions by sequence analysis
KR101709826B1 (ko) 신규 pcr 서열화 방법 및 hla 제노타이핑에서의 상기 방법의 사용
WO2019114146A1 (zh) 基因目标区域富集方法及建库试剂盒
WO2018149091A1 (zh) 一种环状rna高通量测序文库的构建方法及其试剂盒
CN105506746A (zh) 构建可变区测序文库的方法及确定可变区核酸序列的方法
CN103184216B (zh) 用于扩增免疫球蛋白重链cdr3编码序列的引物组合物及其用途
TW201321518A (zh) 微量核酸樣本的庫製備方法及其應用
WO2014116729A2 (en) Haplotying of hla loci with ultra-deep shotgun sequencing
TR201807917T4 (tr) Maternal numunelerde fetal nükleik asitlerin fraksiyonunu belirleme yöntemleri.
TWI467020B (zh) 檢測dmd基因外顯子缺失和/或重複的方法
WO2018095108A1 (zh) 引物组合物、其用途、构建文库和确定核酸序列的方法
CN103298955A (zh) 用于构建血浆dna测序文库的方法和试剂盒
WO2017202389A1 (zh) 一种适用于超微量dna测序的接头及其应用
EP3607065A1 (en) Method and kit for constructing nucleic acid library
CN107699957A (zh) 基于dna的融合基因定量测序建库、检测方法及其应用
CN102839168A (zh) 核酸探针及其制备方法和应用
CN103571822B (zh) 一种用于新一代测序分析的多重目的dna片段富集方法
CN103215255B (zh) 用于扩增免疫球蛋白轻链cdr3序列的引物集及其用途
CN112384608A (zh) 细菌捕获测序平台及其设计、构建和使用方法
WO2012037879A1 (zh) 核酸标签及其应用
WO2013097744A1 (zh) 用于扩增cdr3编码序列的引物组合物及其用途
US20210115435A1 (en) Error-proof nucleic acid library construction method
CN103289994B (zh) 用于扩增T细胞受体α链CDR3编码序列的引物组合物及其用途

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12863395

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12863395

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC, FORM 1205A DATED 25-06-2015

122 Ep: pct application non-entry in european phase

Ref document number: 12863395

Country of ref document: EP

Kind code of ref document: A1