WO2017150677A1 - 標的遺伝子の塩基配列を決定する方法 - Google Patents

標的遺伝子の塩基配列を決定する方法 Download PDF

Info

Publication number
WO2017150677A1
WO2017150677A1 PCT/JP2017/008320 JP2017008320W WO2017150677A1 WO 2017150677 A1 WO2017150677 A1 WO 2017150677A1 JP 2017008320 W JP2017008320 W JP 2017008320W WO 2017150677 A1 WO2017150677 A1 WO 2017150677A1
Authority
WO
WIPO (PCT)
Prior art keywords
base sequence
target gene
gene
mrna
target
Prior art date
Application number
PCT/JP2017/008320
Other languages
English (en)
French (fr)
Inventor
恭行 大川
一満 前原
木村 宏
優子 佐藤
Original Assignee
国立大学法人九州大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人九州大学 filed Critical 国立大学法人九州大学
Priority to JP2018503404A priority Critical patent/JP6869550B2/ja
Priority to US16/079,745 priority patent/US20190048414A1/en
Priority to EP17760140.8A priority patent/EP3425057A4/en
Publication of WO2017150677A1 publication Critical patent/WO2017150677A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Definitions

  • the present invention relates to a method for determining the base sequence of a target gene.
  • hybridoma production technology is widely accepted as a means of producing large amounts of monoclonal antibodies and applying them to research and medicine.
  • the culture of the hybridoma is continued, the reactivity of the antibody produced by somatic mutation may change.
  • 5 ′ Rapid Amplification of cDNA Ends 5 ′ RACE method, degenerate PCR method, and the like have been used to determine the base sequence of an antibody gene (see, for example, Non-Patent Document 1).
  • the 5'RACE method requires a large amount of total RNA and may be difficult to implement.
  • the original base sequence may be lost due to mishybridization of degenerate primers.
  • An object of the present invention is to provide a new technique that can easily and accurately determine the base sequence of a target gene expressed in a target cell.
  • the present invention includes the following aspects.
  • a method for determining the base sequence of a target gene expressed in a target cell comprising comprehensively determining the base sequence of mRNA in the target cell, and among the determined base sequence of the mRNA, Identifying a base sequence having a partial base sequence of the target gene, wherein the identified base sequence is the base sequence of the target gene.
  • the target gene has a rank of 1 to 10 when all genes expressed in the target cell are ranked in descending order of the number of mRNA molecules.
  • the target cell is an antibody-producing cell
  • the target gene is an antibody heavy chain gene
  • a partial base sequence of the target gene is a partial base sequence of a constant region of the antibody heavy chain gene
  • the target gene is an antibody light chain gene
  • the partial base sequence of the target gene is a partial base sequence of a constant region of the antibody light chain gene
  • Experimental Example 1 it is a graph in which transcriptomes are arranged in descending order of expression level.
  • A is a figure which shows the base sequence (SEQ ID NO: 28) and the deduced amino acid sequence (SEQ ID NO: 29) of the hybridoma clone HD1 in Experimental Example 2.
  • B shows the amino acid sequence of the IgH protein of clone HD1 whose nucleotide sequence was determined in Experimental Example 2, and the amino acid sequence of the constant region of known rat IgH (IgG2b) (accession number: AAA6078, SEQ ID NO: 30).
  • FIG. (A) is a figure which shows the base sequence (sequence number 31) and the deduced amino acid sequence (sequence number 32) of Igk of hybridoma clone HD1 in Experimental example 2.
  • FIG. (B) is a diagram in which the amino acid sequence of the IgK protein of clone HD1 whose base sequence was determined in Experimental Example 2 and the amino acid sequence of a known constant region of rat IgK (accession number: CAA24558, SEQ ID NO: 33) are aligned. It is.
  • (A) is a graph which shows the result of having calculated the reconstruction rate of Igh at the time of carrying out de novo assembly from the lead
  • FIG. (B) is a graph showing the result of calculating the reconstruction rate of Igk when de novo assembly is performed from leads of each number of leads in Experimental Example 4.
  • (A)-(d) is the figure which put together the base sequence determination method which
  • the present invention is a method for determining a base sequence of a target gene expressed in a target cell, comprising comprehensively determining a base sequence of mRNA in the target cell, and the determined mRNA A base sequence having a partial base sequence of the target gene is specified, and the specified base sequence is the base sequence of the target gene.
  • the base sequence of the target gene can be determined easily and accurately.
  • the method of this embodiment can also be performed using only about 0.1 ⁇ g of total RNA. Therefore, for example, the base sequence of the target gene can be determined at the single cell level using one target cell as a sample.
  • the step of comprehensively determining the base sequence of mRNA is preferably performed by next-generation sequencing. More specifically, the method of this embodiment can be effectively carried out by mRNA-seq that comprehensively determines the base sequence of mRNA by next-generation sequencing.
  • Next generation sequencing is a term used in contrast to a first generation sequencer represented by a fluorescent capillary sequencer using a sequencing method based on the Sanger method.
  • Next-generation sequencing actually includes a variety of devices and technologies, and various forms will be devised in the future.
  • the maximum number of samples that can be processed at one time was limited to about 96.
  • DNA molecules to be samples for sequencing must be prepared individually by cloning or amplified by the PCR method in advance, and a great deal of labor was required at that stage.
  • DNA fragments containing various sequences are applied in parallel by applying amplification techniques such as emulsion PCR and bridge PCR and high-sensitivity detection techniques such as single-molecule observation. Analyze the sequence. For this reason, it is possible to easily determine a large-scale base sequence.
  • next-generation sequencers include, for example, MiSeq, HiSeq, NovaSeq (Illumina); Genetic Analyzer V2.0, Ion Proton (Thermo Fisher Scientific); MinION, Promethion (Nanopore).
  • a library is prepared according to the method of the next-generation sequencer used.
  • the average read length is 50 to 100 bp
  • the number of reads is 30,000 to 50
  • Sequencing at 000 is sufficient. That is, the number of reads of the base sequence by next-generation sequencing may be 50,000 or less.
  • the base sequence of the target gene can be determined even when the number of reads is as small as this.
  • the base sequence data obtained by sequencing is assembled (bonded) by any method to obtain a contig.
  • contig means a longer base sequence obtained by pasting short leads, for example, a base sequence of assembled full-length mRNA.
  • the base sequence of mRNA in the target cell is determined. For example, it can be assembled by a technique such as de novo assembly that does not require a reference sequence.
  • a base sequence having a partial base sequence of the target gene is specified.
  • the base sequence specified in this way is the base sequence of the target gene.
  • the base sequence of the constant region of the antibody heavy chain (Igh), the base sequence of the constant region of the antibody ⁇ light chain (Igl) or antibody ⁇ light chain (Igk) can be used as a partial base sequence. More specifically, for example, the base sequences described in SEQ ID NOs: 11 to 14 can be used as a partial base sequence of the constant region of rat Igh. Further, for example, the base sequences described in SEQ ID NOs: 15 to 16 can be used as a partial base sequence of the constant region of rat Igl. For example, the base sequence set forth in SEQ ID NO: 17 can be used as a partial base sequence of the constant region of rat Igk.
  • the base sequences described in SEQ ID NOs: 18 to 22 can be used as a partial base sequence of the constant region of mouse Igh.
  • the base sequences described in SEQ ID NOs: 23 to 26 can be used as a partial base sequence of the constant region of mouse Igl.
  • the base sequence set forth in SEQ ID NO: 27 can be used as a partial base sequence of the constant region of mouse Igk.
  • the base sequence of the target gene can be extracted more efficiently.
  • the amino acid sequence of Igh includes 400 or more amino acid residues. Therefore, a contig having a base sequence having a length of 1200 bp or more necessary for encoding this amino acid sequence may be specified. Thereby, contigs of the full-length target gene can be efficiently extracted.
  • the target gene for determining the base sequence is a gene having a rank of 1 to 10 when all the genes expressed in the target cell are ranked in descending order of the number of mRNA molecules. Is preferred. A target gene having a large number of mRNA molecules in the above range can easily determine the base sequence.
  • the expression level of the target gene is preferably 5,000 FPKM (fragments per kilobase of exon per million mapped fragments) or more.
  • the target gene having such an expression level can easily determine the base sequence.
  • the upper limit of the expression level of the target gene is not particularly limited, but generally the upper limit is often about 30,000 FPKM.
  • target genes include, but are not limited to, antibody genes, T cell receptor genes, B cell receptor genes, and the like.
  • the target cell may be an antibody-producing cell
  • the target gene may be an antibody heavy chain gene
  • the partial base sequence of the target gene may be a partial base sequence of the constant region of the antibody heavy chain gene.
  • the target cell may be an antibody-producing cell
  • the target gene may be an antibody light chain gene
  • the partial base sequence of the target gene may be a partial base sequence of the constant region of the antibody light chain gene.
  • antibodies may be produced using animals such as skunks, for example, whose genome sequence has not been clarified.
  • the base sequence of the genome may not be used as a reference sequence for determining the base sequence.
  • the base sequence of the antibody gene can be determined even in such a case.
  • the base sequence of an antibody gene only the base sequence of the variable region could be specified.
  • the full length of the base sequence of the target gene including the constant region can be determined. Therefore, as will be described later in the Examples, when the target gene is an antibody gene, it is possible to specify the antibody isotype and subclass. Further, for example, it is possible to detect a small number of mutants due to somatic mutation of the antibody gene.
  • T cell receptor gene For example, in adoptive cancer immunotherapy and the like, there is a demand for determining the base sequence of a T cell receptor. Therefore, for example, even if the target cell is a T cell, the target gene is a T cell receptor gene, and the partial base sequence of the target gene is a partial base sequence of the constant region of the T cell receptor gene. Good.
  • the target cell is an immature B cell
  • the target gene is a B cell receptor weight chain gene
  • a part of the base sequence of the target gene is a part of the constant region of the B cell receptor weight chain gene.
  • the target cell is an immature B cell
  • the target gene is a B cell receptor light chain gene
  • a partial base sequence of the target gene is a partial base of the constant region of the B cell receptor light chain gene It may be an array.
  • the target gene is not limited to the above gene, and may be any gene.
  • SNVs single nucleotide variants
  • SNPs single nucleotide polymorphisms
  • Indel insertion / deletion
  • splicing variants etc.
  • Hybridoma cell lines (clones HD1, HD2, HD3 and HD4) established by the inventors were used in the experiments. Each hybridoma is 10% fetal bovine serum (FBS), 1.2% penicillin-streptomycin-glutamine (Gibco), hybridoma serum-free medium (Gibco) supplemented with 1 ng / mL interleukin (IL) -6, or Culturing was performed using GIT medium (Wako Pure Chemical Industries) supplemented with 1 ng / mL IL-6.
  • FBS fetal bovine serum
  • Gibco penicillin-streptomycin-glutamine
  • Gibco hybridoma serum-free medium
  • IL interleukin
  • Culturing was performed using GIT medium (Wako Pure Chemical Industries) supplemented with 1 ng / mL IL-6.
  • RNA-seq Total RNA was prepared from each hybridoma cell line using a commercially available kit (model “AllPrep DNA / RNA Mini Kit”, Qiagen). Using 1 ⁇ g of total RNA, a library was prepared using a commercially available kit (model “NEBNext Ultra Directional RNA Library Prep Kit”, New England Biolabs). In this kit, the total RNA used can be reduced to about 0.1 ⁇ g to prepare a library.
  • mRNA-seq was performed by paired end sequencing with an average read length of 50 bp using a next-generation sequencer (model “HiSeq 1500”, Illumina). For each hybridoma cell line, base sequence data with the number of reads of 40 ⁇ 10 6 or more was obtained.
  • Custom transcriptome reference sequences include the bases of the mouse transcript, rat transcript, rat immunoglobulin heavy chain (Igh) constant region, immunoglobulin lambda light chain (Igl) constant region and immunoglobulin ⁇ light chain (Igk) constant region. Contained sequences.
  • BWA-MEM which is a mapping program
  • leads were mapped with parameters of -t8-P-L10000.
  • the TIGAR2 program was used with default settings.
  • the expression level of each gene was quantified by FPKM (fragments per kilobase of exon per million mapped fragments).
  • the base sequence (CDS) coding for Igh and Igl / Igk contains a characteristic base sequence in the constant region of 20-30 bp of Igh or Igl / Igk, as a result of filtering (assembled base sequence). And an appropriate length (over 1200 bp for Igh and over 600 bp for Igl / Igk).
  • RNA of each hybridoma was purified by phenol / chloroform extraction.
  • a reverse transcription reaction was performed using a commercially available kit (model “PrimeScript TM II 1st strand cDNA Synthesis Kit”, Takara Bio Inc.).
  • PCR was performed using an enzyme (model “KOD Plus”, Toyobo Co., Ltd.) and a thermal cycler.
  • the PCR product was purified by gel extraction to remove nonspecific amplification products. Thereafter, the base sequence was determined by the Sanger method. Table 1 below shows the nucleotide sequence numbers of the primers used for PCR.
  • FIG. 1 is a graph in which transcriptomes are arranged in descending order of expression level.
  • the base sequence encoding Igh was extracted by filtering.
  • the filtering contigs having a base sequence of 20-30 bp characteristic of the constant region of Igh were extracted.
  • the sequence numbers of the base sequences used for filtering are shown in Table 2 below.
  • Full length IgH has more than 400 amino acids. Therefore, a base sequence of 1,395 bp was identified as a base sequence of Igh having a length of 1,200 bp or more and including a base sequence of 24 bp characteristic of Ighg2b. The identified Igh base sequence was identical to the Igh base sequence of clone HD1 whose base sequence was determined by the Sanger method.
  • FIG. 2 (a) is a diagram showing the Igh base sequence (SEQ ID NO: 28) and the deduced amino acid sequence (SEQ ID NO: 29) of clone HD1 whose base sequence was determined by de novo transcriptome assembly.
  • FIG. 2 (b) shows the amino acid sequence of the IgH protein of clone HD1 whose base sequence was determined by de novo transcriptome assembly and the amino acid sequence of the constant region of known rat IgH (IgG2b) (accession number: AAA6078, It is the figure which aligned with sequence number 30).
  • IgG2b accession number: AAA6078, It is the figure which aligned with sequence number 30.
  • the base sequence encoding Igl / Igk was extracted by filtering.
  • the filtering contigs having a base sequence of 20 to 30 bp characteristic of the constant region of Igl / Igk were extracted.
  • the sequence numbers of the base sequences used for filtering are shown in Table 3 below.
  • Full length IgK has 200 or more amino acids. Therefore, a base sequence of 705 bp was identified as a base sequence of Igk having a length of 600 bp or more and including a base sequence characteristic of Igk. The identified Igk nucleotide sequence was identical to the Igk nucleotide sequence of clone HD1 whose nucleotide sequence was determined by the Sanger method.
  • FIG. 3 (a) is a diagram showing the Igk base sequence (SEQ ID NO: 31) and the deduced amino acid sequence (SEQ ID NO: 32) of clone HD1 whose base sequence was determined by de novo transcriptome assembly.
  • FIG. 3 (b) shows the amino acid sequence of the IgK protein of clone HD1 whose nucleotide sequence was determined by de novo transcriptome assembly and the amino acid sequence of the known rat IgK constant region (accession number: CAA24558, SEQ ID NO: 33). ).
  • the amino acid sequence of 129 to 234 out of the amino acid sequence of IgK produced by clone HD1 matches the amino acid sequence of a known rat IgK constant region.
  • the inventors similarly identified the nucleotide sequence of the antibody gene produced by clone HD2 (Ighg2a / Igk), clone HD3 (Ighg2a / Igk), and clone HD4 (Ighg2a / Igk).
  • FIG. 4A is a graph showing the result of calculating the reconstruction rate of Igh when de novo assembly is performed from the leads of each number of leads. As a result, it was revealed that in all 4 clones, the Igh base sequence can be completely identified with the number of reads exceeding 30 ⁇ 10 3 reads.
  • FIG. 4B is a graph showing the result of calculating the reconstruction rate of Igk when de novo assembly is performed from leads of each number of leads. As a result, it was revealed that the Igk base sequence could be completely identified with the number of reads exceeding 10 ⁇ 10 3 reads in all 4 clones.
  • FIG. 5 summarizes the current technique.
  • mRNA is extracted from the cells, and the base sequence is determined by next-generation sequencing (NGS).
  • NGS next-generation sequencing
  • FIG. 5 (c) a contig is created by de novo assembly of data obtained by mRNA-seq.
  • FIG. 5D a contig having a specific base sequence is specified by filtering to obtain a base sequence of the target gene.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

対象細胞が発現する標的遺伝子の塩基配列を決定する方法であって、前記対象細胞中のmRNAの塩基配列を網羅的に決定する工程と、決定された前記mRNAの塩基配列のうち、前記標的遺伝子の一部の塩基配列を有する塩基配列を特定する工程と、を含み、特定された前記塩基配列が標的遺伝子の塩基配列である、方法。

Description

標的遺伝子の塩基配列を決定する方法
 本発明は、標的遺伝子の塩基配列を決定する方法に関する。本願は、2016年3月2日に、米国に仮出願された仮出願第62/302,196号に基づき優先権を主張し、その内容をここに援用する。
 例えば、ハイブリドーマ作製技術は、モノクローナル抗体を大量に製造し、研究や医薬に応用する手段として広く受け入れられている。しかしながら、ハイブリドーマの培養を続けると、体細胞変異により産生する抗体の反応性が変わる恐れがある。このため、有用な抗体を保存したり、組換え抗体を製造したりする場合には、ハイブリドーマが産生する抗体の遺伝子の塩基配列を決定することが必要である。
 従来、抗体遺伝子の塩基配列の決定には、5’Rapid Amplification of cDNA Ends(5’RACE)法、縮重PCR法等が用いられてきた(例えば、非特許文献1を参照)。
Zhou, H., et al., Optimization of primer sequences for mouse scFv repertoire display library construction., Nucleic Acids Research, 22 (5), 888-889, 1994.
 しかしながら、5’RACE法は大量の全RNAを必要とし、実施が困難な場合がある。また、縮重PCR法では縮重プライマーのミスハイブリダイゼーション等により、本来の塩基配列が失われてしまう場合がある。
 本発明は、対象細胞が発現する標的遺伝子の塩基配列を簡便かつ正確に決定することができる新たな技術を提供することを目的とする。
 本発明は以下の態様を含む。
[1]対象細胞が発現する標的遺伝子の塩基配列を決定する方法であって、前記対象細胞中のmRNAの塩基配列を網羅的に決定する工程と、決定された前記mRNAの塩基配列のうち、前記標的遺伝子の一部の塩基配列を有する塩基配列を特定する工程と、を含み、特定された前記塩基配列が標的遺伝子の塩基配列である、方法。
[2]前記標的遺伝子は、前記対象細胞が発現する全遺伝子をmRNAの分子数が多いものから順に順位付けした場合の順位が1~10位である、[1]に記載の方法。
[3]前記対象細胞が抗体産生細胞であり、前記標的遺伝子が抗体重鎖遺伝子であり、前記標的遺伝子の一部の塩基配列が抗体重鎖遺伝子の定常領域の一部の塩基配列であるか、又は、前記標的遺伝子が抗体軽鎖遺伝子であり、前記標的遺伝子の一部の塩基配列が抗体軽鎖遺伝子の定常領域の一部の塩基配列である、[1]又は[2]に記載の方法。
[4]mRNAの塩基配列を網羅的に決定する前記工程が、次世代シーケンシングにより行われる、[1]~[3]のいずれかに記載の方法。
[5]次世代シーケンシングにおける塩基配列のリード数が50,000リード以下である、[4]に記載の方法。
 本発明によれば、対象細胞が発現する標的遺伝子の塩基配列を簡便かつ正確に決定することができる新たな技術を提供することができる。
実験例1において、トランスクリプトームを発現レベルが高い順に並べたグラフである。 (a)は、実験例2において、ハイブリドーマクローンHD1のIghの塩基配列(配列番号28)及び推定されるアミノ酸配列(配列番号29)を示す図である。(b)は、実験例2において塩基配列を決定したクローンHD1のIgHタンパク質のアミノ酸配列と、既知のラットIgH(IgG2b)の定常領域のアミノ酸配列(アクセッション番号:AAA6078、配列番号30)とをアラインメントした図である。 (a)は、実験例2において、ハイブリドーマクローンHD1のIgkの塩基配列(配列番号31)及び推定されるアミノ酸配列(配列番号32)を示す図である。(b)は、実験例2において塩基配列を決定したクローンHD1のIgKタンパク質のアミノ酸配列と、既知のラットIgKの定常領域のアミノ酸配列(アクセッション番号:CAA24558、配列番号33)とをアラインメントした図である。 (a)は、実験例4において、各リード数のリードからデノボ・アセンブリした場合のIghの再構成率を算出した結果を示すグラフである。(b)は、実験例4において、各リード数のリードからデノボ・アセンブリした場合のIgkの再構成率を算出した結果を示すグラフである。 (a)~(d)は、実施形態に係る塩基配列決定方法をまとめた図である。
 1実施形態において、本発明は、対象細胞が発現する標的遺伝子の塩基配列を決定する方法であって、前記対象細胞中のmRNAの塩基配列を網羅的に決定する工程と、決定された前記mRNAの塩基配列のうち、前記標的遺伝子の一部の塩基配列を有する塩基配列を特定する工程とを含み、特定された前記塩基配列が標的遺伝子の塩基配列である方法を提供する。
 本実施形態の方法によれば、簡便かつ正確に標的遺伝子の塩基配列を決定することができる。また、本実施形態の方法は、わずか約0.1μgの全RNAを用いて実施することもできる。このため、例えば1個の対象細胞を試料として、1細胞レベルで標的遺伝子の塩基配列を決定することもできる。
 本実施形態の方法において、mRNAの塩基配列を網羅的に決定する工程は、次世代シーケンシングにより行われることが好ましい。より具体的には、次世代シーケンシングでmRNAの塩基配列を網羅的に決定するmRNA-seqにより、本実施形態の方法を効果的に実施することができる。
 次世代シーケンシング(Next Generation Sequencing、NGS)とは、サンガー法によるシークエンシング法を利用した蛍光キャピラリーシークエンサーに代表される第1世代シークエンサーと対比させて使われる用語である。次世代シーケンシングは、実際には多様な機器や技術を含み、今後も様々な形態のものが考案されると考えられる。
 第1世代シークエンサーでは、1度に処理できる検体数が最大96個程度に限られていた。また、配列決定を行うための試料となるDNA分子は、予め個別にクローニングしたりPCR法で増幅したりして用意しておく必要があり、その段階に多大な労力が必要であった。
 これに対し、次世代シークエンサーを用いた次世代シーケンシングでは、多様な配列を含むDNA断片を、エマルジョンPCRやブリッジPCR等の増幅技術や1分子観察等の高感度検出技術を応用して並列的に配列解析する。このため、簡便により大規模な塩基配列決定が可能となっている。
 具体的な次世代シークエンサーとしては、例えば、MiSeq、HiSeq、NovaSeq(イルミナ社);Genetic Analyzer V2.0、Ion Proton(サーモフィッシャーサイエンティフィック社);MinION、PromethION(ナノポア社)等が挙げられる。
 対象細胞中のmRNAの塩基配列を網羅的に決定する工程では、使用する次世代シークエンサーの方式に応じたライブラリー調製を行い、例えば、平均リード長50~100bp、リード数30,000~50,000でシーケンシングを行えばよい。すなわち、次世代シーケンシングによる塩基配列のリード数は50,000リード以下であってもよい。実施例において後述するように、本実施形態の方法によれば、リード数がこの程度に少なくても標的遺伝子の塩基配列を決定することができる。
 シーケンシングにより得られた塩基配列データは、任意の手法によりアセンブル(貼り合わせ)してコンティグを得る。本明細書において、コンティグとは、短いリードを貼り合わせて得られた、より長い塩基配列を意味し、例えばアセンブルした完全長のmRNAの塩基配列を意味する。この結果、対象細胞中のmRNAの塩基配列が決定される。例えば、参照配列を必要としないデノボ・アセンブリ等の手法によりアセンブルすることができる。
 続いて、決定された前記mRNAの塩基配列(コンティグ)のうち、標的遺伝子の一部の塩基配列を有する塩基配列を特定する。このようにして特定された塩基配列が、標的遺伝子の塩基配列である。
 例えば、標的遺伝子が抗体遺伝子である場合、抗体重鎖(Igh)の定常領域の塩基配列、抗体λ軽鎖(Igl)又は抗体κ軽鎖(Igk)の定常領域の塩基配列を、標的遺伝子の一部の塩基配列として利用することができる。より具体的には、例えば、配列番号11~14に記載の塩基配列をラットIghの定常領域の一部の塩基配列として利用することができる。また、例えば、配列番号15~16に記載の塩基配列をラットIglの定常領域の一部の塩基配列として利用することができる。また、例えば、配列番号17に記載の塩基配列をラットIgkの定常領域の一部の塩基配列として利用することができる。また、例えば、配列番号18~22に記載の塩基配列をマウスIghの定常領域の一部の塩基配列として利用することができる。また、例えば、配列番号23~26に記載の塩基配列をマウスIglの定常領域の一部の塩基配列として利用することができる。また、例えば、配列番号27に記載の塩基配列をマウスIgkの定常領域の一部の塩基配列として利用することができる。
 また、標的遺伝子の一部の塩基配列を有するとともに、全長が標的遺伝子の全長以上の長さを有するコンティグを特定することにより、更に効率よく標的遺伝子の塩基配列を抽出することができる。
 例えば、標的遺伝子がIghである場合、Ighのアミノ酸配列は400以上のアミノ酸残基を含む。そこで、このアミノ酸配列をコードするのに必要な1200bp以上の長さの塩基配列を有するコンティグを特定すればよい。これにより、完全長の標的遺伝子のコンティグを効率よく抽出することができる。
 本実施形態の方法において、塩基配列を決定する標的遺伝子は、対象細胞が発現する全遺伝子をmRNAの分子数が多いものから順に順位付けした場合の順位が1~10位である遺伝子であることが好ましい。mRNAの分子数が多く、上記の範囲にある標的遺伝子は、容易に塩基配列を決定することができる。
 あるいは、標的遺伝子の発現量は、5,000FPKM(fragments per kilobase of exon per million mapped fragments)以上であることが好ましい。この程度の発現量である標的遺伝子は、容易に塩基配列を決定することができる。標的遺伝子の発現量の上限に特に制限はないが、一般的に、30,000FPKM程度が上限である場合が多い。
 標的遺伝子としては、例えば、抗体遺伝子、T細胞受容体遺伝子、B細胞受容体遺伝子等が挙げられるがこれらに限定されない。
(抗体遺伝子)
 例えば、対象細胞が抗体産生細胞であり、標的遺伝子が抗体重鎖遺伝子であり、標的遺伝子の一部の塩基配列が抗体重鎖遺伝子の定常領域の一部の塩基配列であってもよい。あるいは、対象細胞が抗体産生細胞であり、標的遺伝子が抗体軽鎖遺伝子であり、標的遺伝子の一部の塩基配列が抗体軽鎖遺伝子の定常領域の一部の塩基配列であってもよい。
 近年、例えばスカンク等の、ゲノムの塩基配列が明らかにされていない動物を用いて抗体が作製される場合がある。このような場合、ゲノムの塩基配列を塩基配列決定の参照配列に用いることができない場合がある。本実施形態の方法によれば、参照配列が存在しない場合においても塩基配列を決定することができるため、このような場合においても抗体遺伝子の塩基配列を決定することができる。
 また、従来の抗体遺伝子の塩基配列の決定方法では、可変領域の塩基配列のみしか特定することができなかった。これに対し、本実施形態の方法によれば、定常領域も含めて標的遺伝子の塩基配列の全長を決定することができる。このため、実施例において後述するように、標的遺伝子が抗体遺伝子である場合、抗体のアイソタイプやサブクラスまで特定することができる。また、例えば、抗体遺伝子の体細胞突然変異による少数の変異体を検出すること等も可能である。
(T細胞受容体遺伝子)
 例えば、癌の養子免疫療法等において、T細胞受容体の塩基配列を決定する需要がある。そこで、例えば、対象細胞がT細胞であり、標的遺伝子がT細胞受容体遺伝子であり、標的遺伝子の一部の塩基配列がT細胞受容体遺伝子の定常領域の一部の塩基配列であってもよい。
(B細胞受容体遺伝子)
 例えば、対象細胞が未成熟なB細胞であり、標的遺伝子がB細胞受容体重鎖遺伝子であり、標的遺伝子の一部の塩基配列がB細胞受容体重鎖遺伝子の定常領域の一部の塩基配列であってもよい。あるいは、対象細胞が未成熟なB細胞であり、標的遺伝子がB細胞受容体軽鎖遺伝子であり、標的遺伝子の一部の塩基配列がB細胞受容体軽鎖遺伝子の定常領域の一部の塩基配列であってもよい。
(その他の標的遺伝子)
 標的遺伝子は、上記の遺伝子に限られず、任意の遺伝子であってもよい。本実施形態の方法により、例えば、任意の標的遺伝子について、single nucleotide variants(SNVs)、single nucleotide polymorphysms(SNPs)、insertion/deletion(Indel)、スプライシングバリアント等を容易に解析することができる。
 次に実施例を示して本発明を更に詳細に説明するが、本発明は以下の実施例に限定されるものではない。
[方法及び材料]
(細胞株)
 発明者らが樹立したハイブリドーマ細胞株(クローンHD1、HD2、HD3及びHD4)を実験に用いた。各ハイブリドーマは、10%ウシ胎児血清(FBS)、1.2%ペニシリン-ストレプトマイシン-グルタミン(ギブコ社)、1ng/mL インターロイキン(IL)-6を添加したハイブリドーマ無血清培地(ギブコ社)、又は、1ng/mL IL-6を添加したGIT培地(和光純薬)を使用して培養した。
(mRNA-seq)
 各ハイブリドーマ細胞株から、市販のキット(型式「AllPrep DNA/RNA Mini Kit」、キアゲン社)を使用して全RNAを調製した。1μgの全RNAを使用し、市販のキット(型式「NEBNext Ultra Directional RNA Library Prep Kit」、ニュー・イングランド・バイオラボ社)を用いてライブラリーを作製した。なお、このキットは、使用する全RNAを約0.1μgにまで減らしてライブラリーを作製することができる。
 続いて、次世代シーケンサー(型式「HiSeq1500」、イルミナ社)を用いて、平均リード長50bpでペアードエンドシーケンシングによりmRNA-seqを行った。各ハイブリドーマ細胞株につき、それぞれ40×10リード以上のリード数の塩基配列データが得られた。
(mRNA-seqデータ解析)
 取得されたリードは、発明者らのカスタムトランスクリプトーム参照配列に対してマッピングした。カスタムトランスクリプトーム参照配列は、マウストランスクリプト、ラットトランスクリプト、ラットイムノグロブリン重鎖(Igh)定常領域、イムノグロブリンλ軽鎖(Igl)定常領域及びイムノグロブリンκ軽鎖(Igk)定常領域の塩基配列を含んでいた。
 マッピングプログラムであるBWA-MEMを使用し、-t 8 -P -L 10000のパラメータでリードをマッピングした。TIGAR2プログラムはデフォルト設定で使用した。各遺伝子の発現レベルはFPKM(fragments per kilobase of exon per million mapped fragments)で定量した。
(デノボ・トランスクリプトーム・アセンブリ)
 全リード又は「fastq-sample」プログラム(http://homes.cs.washington.edu/~dcjones/fastq-tools)によりサブサンプリングしたリードを、「Trinity」プログラムを用いてデノボ・アセンブリした。CPU及びmax-memoryパラメータはリード数に応じて変更した。例えば、40×10リードの場合、CPUパラメータは8、max-memoryパラメータは52Gに設定した。また、例えば、1×10リードの場合、CPUパラメータは2、max-memoryパラメータは12Gに設定した。
 Igh及びIgl/Igkをコードした塩基配列(CDS)は、フィルタリング処理により、コンティグ(アセンブルした塩基配列)が、20~30bpのIgh又はIgl/Igkの定常領域に特徴的な塩基配列を含んでおり、かつ適切な長さ(Ighの場合1200bp超、Igl/Igkの場合600bp超)を有していた場合に抽出した。
(RT-PCR)
 各ハイブリドーマのRNAをフェノール/クロロホルム抽出により精製した。市販のキット(型式「PrimeScript(商標)II 1st strand cDNA Synthesis Kit」、タカラバイオ社)を用いて逆転写反応を行った。酵素(型式「KOD Plus」、東洋紡社)及びサーマルサイクラーを用いてPCRを行った。PCR産物はゲル抽出により精製し、非特異的な増幅産物を除去した。その後サンガー法により塩基配列を決定した。PCR使用したプライマーの塩基配列の配列番号を下記表1に示す。
Figure JPOXMLDOC01-appb-T000001
[実験例1]
(ハイブリドーマのmRNA-seq解析)
 ラットBリンパ球とマウスミエローマ細胞株SP2との細胞融合により樹立したハイブリドーマ細胞株である、クローンHD1、HD2、HD3及びHD4のmRNA-seqをそれぞれ行った。平均リード長50bpでペアードエンドシーケンシングを行った。
 続いて、各トランスクリプトームの発現レベルをBWA-TIGAR2プログラムにより定量し、発現レベルに応じて並べた。図1は、トランスクリプトームを発現レベルが高い順に並べたグラフである。
 その結果、全てのハイブリドーマクローンにおいて、Igh及びIgl/Igkをコードした塩基配列は、発現量が10,000FPKM超であり、最も発現レベルが高いトランスクリプトに順位づけられることが明らかとなった。
 この結果は、ハイブリドーマのmRNA-seqデータが、Igh及びIgl/Igkをコードした塩基配列を再構成するのに十分な数のリード数を有していることを示す。
[実験例2]
(ラットハイブリドーマのIgh及びIgl/Igkの塩基配列のアセンブリ)
 実験例1で得られたmRNA-seqデータのデノボ・トランスクリプトーム・アセンブリにより、Igh及びIgl/Igkの塩基配列の再構成を試みた。
 まず、Trinityプログラムを用いて、クローンHD1のmRNA-seqデータから完全長トランスクリプトームの再構成を行った。ここで、リードのフィルタリングは行わなかった。リード数は45,406,048リードであり、得られたコンティグ数は58,822個であった。
 続いて、Ighをコードする塩基配列をフィルタリングにより抽出した。フィルタリングでは、Ighの定常領域に特徴的な20~30bpの塩基配列を有するコンティグを抽出した。フィルタリングに用いた塩基配列の配列番号を下記表2に示す。
Figure JPOXMLDOC01-appb-T000002
 完全長のIgHは400残基以上のアミノ酸を有している。そこで、1,200bp以上の長さを有し、Ighg2bに特徴的な24bpの塩基配列を含むIghの塩基配列として1,395bpの塩基配列を特定した。同定されたIghの塩基配列は、サンガー法により塩基配列を決定したクローンHD1のIghの塩基配列と同一であった。
 図2(a)は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンHD1のIghの塩基配列(配列番号28)及び推定されるアミノ酸配列(配列番号29)を示す図である。図2(b)は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンHD1のIgHタンパク質のアミノ酸配列と、既知のラットIgH(IgG2b)の定常領域のアミノ酸配列(アクセッション番号:AAA6078、配列番号30)とをアラインメントした図である。その結果、クローンHD1が産生するIgHのアミノ酸配列のうち第133~464番目が、既知のラットIgHの定常領域のアミノ酸配列と一致することが明らかとなった。
 続いて、Igl/Igkをコードする塩基配列をフィルタリングにより抽出した。フィルタリングでは、Igl/Igkの定常領域に特徴的な20~30bpの塩基配列を有するコンティグを抽出した。フィルタリングに用いた塩基配列の配列番号を下記表3に示す。
Figure JPOXMLDOC01-appb-T000003
 完全長のIgKは200残基以上のアミノ酸を有している。そこで、600bp以上の長さを有し、Igkに特徴的な塩基配列を含むIgkの塩基配列として705bpの塩基配列を特定した。同定されたIgkの塩基配列は、サンガー法により塩基配列を決定したクローンHD1のIgkの塩基配列と同一であった。
 図3(a)は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンHD1のIgkの塩基配列(配列番号31)及び推定されるアミノ酸配列(配列番号32)を示す図である。図3(b)は、デノボ・トランスクリプトーム・アセンブリにより塩基配列を決定したクローンHD1のIgKタンパク質のアミノ酸配列と、既知のラットIgKの定常領域のアミノ酸配列(アクセッション番号:CAA24558、配列番号33)とをアラインメントした図である。その結果、クローンHD1が産生するIgKのアミノ酸配列のうち第129~234番目が、既知のラットIgKの定常領域のアミノ酸配列と一致することが明らかとなった。
 発明者らは、同様に、クローンHD2(Ighg2a/Igk)、クローンHD3(Ighg2a/Igk)、クローンHD4(Ighg2a/Igk)が産生する抗体の遺伝子の塩基配列も同定した。
 また、クローンHD1~HD4が産生する抗体のアイソタイプは、ELISAによるアイソタイピングアッセイの結果と一致することが確認された。以上の結果は、mRNA-seqデータのデノボ・アセンブリにより、Igh遺伝子及びIgl/Igk遺伝子の塩基配列を簡便かつ正確に決定できることを示す。
[実験例3]
(マウスハイブリドーマのIgh及びIgl/Igkの塩基配列のアセンブリ)
 実験例2と同様にして、マウスハイブリドーマであるクローン8A2及び13C7のIgh及びIgkの塩基配列を決定した。マウスIgh及びIgl/Igkのフィルタリングに用いた塩基配列の配列番号を下記表4に示す。
Figure JPOXMLDOC01-appb-T000004
 その結果、縮重プライマーにコードされる領域を除いて、サンガー法により決定された、これらのモノクローナル抗体の塩基配列と一致することが確認された。この結果は、mRNA-seqデータのデノボ・アセンブリにより、Igh遺伝子及びIgl/Igk遺伝子の塩基配列を簡便かつ正確に決定できることを更に支持するものである。また、縮重プライマーを用いた方法では、縮重プライマーのミスハイブリダイゼーションにより、本来の塩基配列が失われてしまう場合があることが確認された。
[実験例4]
(抗体遺伝子の塩基配列決定のためのデノボ・アセンブリ条件の最適化)
 ハイブリドーマのmRNA-seqデータを用いてIgh及びIgl/Igk遺伝子の塩基配列を決定する条件の最適化を試みた。まず、抗体遺伝子の塩基配列の決定に必要なリード数を検討した。
 具体的には、クローンHD1~4のmRNA-seqの全リードから、それぞれ、5×10リード、10×10リード、30×10リード、50×10リード、100×10リード、500×10リード、1000×10リードのリードをランダムにサブサンプリングした。
 続いて、これらのリードを用いてデノボ・アセンブリを25回繰り返し実施した。続いて、全リードを用いて同定したIgh及びIgl/Igkの塩基配列を正しい塩基配列であると定義し、完全な塩基配列を得ることができた成功率(再構成率)を算出した。
 図4(a)は、各リード数のリードからデノボ・アセンブリした場合のIghの再構成率を算出した結果を示すグラフである。その結果、4クローン全てにおいて、Ighの塩基配列は30×10リード超のリード数で完全に同定することができることが明らかとなった。また、図4(b)は、各リード数のリードからデノボ・アセンブリした場合のIgkの再構成率を算出した結果を示すグラフである。その結果、4クローン全てにおいて、Igkの塩基配列は10×10リード超のリード数で完全に同定することができることが明らかとなった。
 この結果は、今回の手法により限られた数のリード数のmRNA-seqデータから抗体遺伝子の塩基配列を正確に特定することができることを示す。図5は、今回の手法をまとめた図である。まず図5(a)及び(b)に示すように、細胞からmRNAを抽出し、次世代シークエンシング(NGS)により塩基配列を決定する。続いて、図5(c)に示すように、mRNA-seqにより得られたデータをデノボ・アセンブリしてコンティグを作成する。続いて、図5(d)に示すように、特定の塩基配列を有するコンティグをフィルタリングして特定し、標的遺伝子の塩基配列を得る。
[実験例5]
(他のハイブリドーマが産生する抗体の遺伝子の塩基配列の決定)
 今回の塩基配列決定方法を、更に多数のハイブリドーマに適用し、抗体遺伝子の塩基配列を決定した。その結果、96種類以上のハイブリドーマについて、1サンプルあたり200×10リードでmRNA-seqを行い、抗体遺伝子の塩基配列を正確に決定することができた。
 本発明によれば、対象細胞が発現する標的遺伝子の塩基配列を簡便かつ正確に決定することができる新たな技術を提供することができる。

Claims (5)

  1.  対象細胞が発現する標的遺伝子の塩基配列を決定する方法であって、
     前記対象細胞中のmRNAの塩基配列を網羅的に決定する工程と、
     決定された前記mRNAの塩基配列のうち、前記標的遺伝子の一部の塩基配列を有する塩基配列を特定する工程と、
     を含み、特定された前記塩基配列が標的遺伝子の塩基配列である、方法。
  2.  前記標的遺伝子は、前記対象細胞が発現する全遺伝子をmRNAの分子数が多いものから順に順位付けした場合の順位が1~10位である、請求項1に記載の方法。
  3.  前記対象細胞が抗体産生細胞であり、
     前記標的遺伝子が抗体重鎖遺伝子であり、前記標的遺伝子の一部の塩基配列が抗体重鎖遺伝子の定常領域の一部の塩基配列であるか、又は
     前記標的遺伝子が抗体軽鎖遺伝子であり、前記標的遺伝子の一部の塩基配列が抗体軽鎖遺伝子の定常領域の一部の塩基配列である、
     請求項1又は2に記載の方法。
  4.  mRNAの塩基配列を網羅的に決定する前記工程が、次世代シーケンシングにより行われる、請求項1~3のいずれか一項に記載の方法。
  5.  次世代シーケンシングにおける塩基配列のリード数が50,000リード以下である、請求項4に記載の方法。
PCT/JP2017/008320 2016-03-02 2017-03-02 標的遺伝子の塩基配列を決定する方法 WO2017150677A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018503404A JP6869550B2 (ja) 2016-03-02 2017-03-02 標的遺伝子の塩基配列を決定する方法
US16/079,745 US20190048414A1 (en) 2016-03-02 2017-03-02 Method for determining nucleic acid sequence of target gene
EP17760140.8A EP3425057A4 (en) 2016-03-02 2017-03-02 METHOD FOR DETERMINING A NUCLEIC ACID SEQUENCE OF A TARGET GENE

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201662302196P 2016-03-02 2016-03-02
US62/302,196 2016-03-02

Publications (1)

Publication Number Publication Date
WO2017150677A1 true WO2017150677A1 (ja) 2017-09-08

Family

ID=59743069

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/008320 WO2017150677A1 (ja) 2016-03-02 2017-03-02 標的遺伝子の塩基配列を決定する方法

Country Status (4)

Country Link
US (1) US20190048414A1 (ja)
EP (1) EP3425057A4 (ja)
JP (1) JP6869550B2 (ja)
WO (1) WO2017150677A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014210585A2 (en) * 2013-06-29 2014-12-31 Firmenich Sa Methods of identifying, isolating and using odorant and aroma receptors

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130195843A1 (en) * 2010-06-23 2013-08-01 British Columbia Cancer Agency Branch Biomarkers for Non-Hodgkin Lymphomas and Uses Thereof
AU2013331212A1 (en) * 2012-10-19 2015-05-07 Adaptive Biotechnologies Corp. Monitoring clonotypes of plasma cell proliferative disorders in peripheral blood
US10175242B2 (en) * 2014-02-28 2019-01-08 H. Lee Moffitt Cancer Center And Research Institute, Inc. Personalized myeloma detection

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014210585A2 (en) * 2013-06-29 2014-12-31 Firmenich Sa Methods of identifying, isolating and using odorant and aroma receptors

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
See also references of EP3425057A4
ZHOU, H. ET AL.: "Optimization of primer sequences for mouse scFv repertoire display library construction", NUCLEIC ACIDS RESEARCH, vol. 22, no. 5, 1994, pages 888 - 889

Also Published As

Publication number Publication date
JP6869550B2 (ja) 2021-05-12
EP3425057A4 (en) 2019-07-24
US20190048414A1 (en) 2019-02-14
EP3425057A1 (en) 2019-01-09
JPWO2017150677A1 (ja) 2018-12-27

Similar Documents

Publication Publication Date Title
Oikonomopoulos et al. Methodologies for transcript profiling using long-read technologies
Da Costa et al. Molecular approaches to diagnose Diamond-Blackfan anemia: The EuroDBA experience
Di Genova et al. Whole genome comparison between table and wine grapes reveals a comprehensive catalog of structural variants
Ji et al. Isolation and analyses of genes preferentially expressed during early cotton fiber development by subtractive PCR and cDNA array
Beckmann et al. Effects of high passage cultivation on CHO cells: a global analysis
Wuest et al. Genomics in mammalian cell culture bioprocessing
Ohshima et al. Inference for the initial stage of domain shuffling: tracing the evolutionary fate of the PIPSL retrogene in hominoids
TW201321518A (zh) 微量核酸樣本的庫製備方法及其應用
Kubo et al. Single-cell transcriptome analysis of Physcomitrella leaf cells during reprogramming using microcapillary manipulation
EP3414255B1 (en) Preparative electrophoretic method for targeted purification of genomic dna fragments
US20140302559A1 (en) Rapid method for cloning and expression of cognate antibody variable region gene segments
Cole et al. Highly accurate sequencing of Full-Length immune repertoire amplicons using Tn5-Enabled and molecular Identifier–Guided amplicon assembly
Chen et al. Barcoded sequencing workflow for high throughput digitization of hybridoma antibody variable domain sequences
JP6904953B2 (ja) 細胞クローン性を決定する方法
CN109112217B (zh) 一种与猪体长和乳头数显著关联的遗传标记及应用
US20200355698A1 (en) Use of nanoexpression to interrogate antibody repertoires
Marx et al. The octatricopeptide repeat protein Raa8 is required for chloroplast trans splicing
WO2022018055A1 (en) Circulation method to sequence immune repertoires of individual cells
Rubio et al. Small RNA populations reflect the complex dialogue established between heterograft partners in grapevine
Srila et al. Glutamine synthetase (GS) knockout (KO) using CRISPR/Cpf1 diversely enhances selection efficiency of CHO cells expressing therapeutic antibodies
Subas Satish et al. NAb-seq: an accurate, rapid, and cost-effective method for antibody long-read sequencing in hybridoma cell lines and single B cells
Vollmers et al. Novel exons and splice variants in the human antibody heavy chain identified by single cell and single molecule sequencing
Hamashima et al. Nematode-specific tRNAs that decode an alternative genetic code for leucine
WO2017150677A1 (ja) 標的遺伝子の塩基配列を決定する方法
Bauer et al. An arrayed CRISPR screen reveals Myc depletion to increase productivity of difficult-to-express complex antibodies in CHO cells

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2018503404

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2017760140

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2017760140

Country of ref document: EP

Effective date: 20181002

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17760140

Country of ref document: EP

Kind code of ref document: A1