WO2023008321A1 - スプライシングペプチドの同定方法 - Google Patents

スプライシングペプチドの同定方法 Download PDF

Info

Publication number
WO2023008321A1
WO2023008321A1 PCT/JP2022/028431 JP2022028431W WO2023008321A1 WO 2023008321 A1 WO2023008321 A1 WO 2023008321A1 JP 2022028431 W JP2022028431 W JP 2022028431W WO 2023008321 A1 WO2023008321 A1 WO 2023008321A1
Authority
WO
WIPO (PCT)
Prior art keywords
peptides
peptide
mass spectrometry
splicing
amino acid
Prior art date
Application number
PCT/JP2022/028431
Other languages
English (en)
French (fr)
Inventor
善信 高口
典子 岩本
崇史 嶋田
Original Assignee
プロビデンス ヘルス アンド サービシーズ-オレゴン
株式会社島津製作所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by プロビデンス ヘルス アンド サービシーズ-オレゴン, 株式会社島津製作所 filed Critical プロビデンス ヘルス アンド サービシーズ-オレゴン
Priority to US18/292,641 priority Critical patent/US20240345096A1/en
Priority to EP22849383.9A priority patent/EP4378947A1/en
Priority to CN202280052457.XA priority patent/CN117999271A/zh
Priority to JP2023538484A priority patent/JPWO2023008321A1/ja
Publication of WO2023008321A1 publication Critical patent/WO2023008321A1/ja

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K5/00Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
    • C07K5/04Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
    • C07K5/06Dipeptides
    • C07K5/06008Dipeptides with the first amino acid being neutral
    • C07K5/06017Dipeptides with the first amino acid being neutral and aliphatic
    • C07K5/06034Dipeptides with the first amino acid being neutral and aliphatic the side chain containing 2 to 4 carbon atoms
    • C07K5/06043Leu-amino acid
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K5/00Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
    • C07K5/04Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
    • C07K5/08Tripeptides
    • C07K5/0802Tripeptides with the first amino acid being neutral
    • C07K5/0804Tripeptides with the first amino acid being neutral and aliphatic
    • C07K5/0806Tripeptides with the first amino acid being neutral and aliphatic the side chain containing 0 or 1 carbon atoms, i.e. Gly, Ala
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K5/00Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
    • C07K5/04Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
    • C07K5/08Tripeptides
    • C07K5/0802Tripeptides with the first amino acid being neutral
    • C07K5/0804Tripeptides with the first amino acid being neutral and aliphatic
    • C07K5/0808Tripeptides with the first amino acid being neutral and aliphatic the side chain containing 2 to 4 carbon atoms, e.g. Val, Ile, Leu
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K5/00Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
    • C07K5/04Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
    • C07K5/08Tripeptides
    • C07K5/0821Tripeptides with the first amino acid being heterocyclic, e.g. His, Pro, Trp
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K5/00Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
    • C07K5/04Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
    • C07K5/08Tripeptides
    • C07K5/0821Tripeptides with the first amino acid being heterocyclic, e.g. His, Pro, Trp
    • C07K5/0823Tripeptides with the first amino acid being heterocyclic, e.g. His, Pro, Trp and Pro-amino acid; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K5/00Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
    • C07K5/04Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
    • C07K5/10Tetrapeptides
    • C07K5/1002Tetrapeptides with the first amino acid being neutral
    • C07K5/1005Tetrapeptides with the first amino acid being neutral and aliphatic
    • C07K5/101Tetrapeptides with the first amino acid being neutral and aliphatic the side chain containing 2 to 4 carbon atoms, e.g. Val, Ile, Leu
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/20Screening of libraries
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/435Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
    • G01N2333/705Assays involving receptors, cell surface antigens or cell surface determinants
    • G01N2333/70503Immunoglobulin superfamily, e.g. VCAMs, PECAM, LFA-3
    • G01N2333/70539MHC-molecules, e.g. HLA-molecules

Definitions

  • the present invention relates to a method for identifying splicing peptides.
  • a complex process is required for the immune system to recognize self and non-self and protect itself.
  • the immune system is activated by two mechanisms, innate immunity and acquired immunity. Innate immunity primarily functions to quickly recognize and eliminate foreign foreign substances. Complementary to this innate immunity, there is a complex adaptive immune system.
  • MHC major histocompatibility complex
  • T cells and B cells The function of lymphocytes (T cells and B cells) consists of cytotoxic immunity (T cells) and humoral immunity (B cells). Mature T cells have the ability to target foreign substances by targeting the recognized antigen. B cells have the ability to produce antibodies that bind to recognized antigens and neutralize or inactivate foreign substances (antigens).
  • cancer immunotherapy has attracted attention in order to enhance the effects of cancer treatments (surgery, chemotherapy, radiotherapy, etc.).
  • cancer-specific peptides peptides present only in cancer cells but not in normal cells
  • vaccines to enhance the therapeutic effects of cancer through the function of acquired immunity (peptide vaccines). therapy
  • HLA has a genotype (haplotype) determined by a pair of genetic loci inherited from each parent, and it is said that there are tens of thousands of haplotypes.
  • HLA has various phenotypes (HLA types) according to its various haplotypes.
  • Peptides that bind to HLA as antigens presented to antigen-presenting cells are known to differ depending on the HLA type.
  • Protein splicing occurs during the editing of mRNA transcribed from template DNA.
  • Peptide splicing reaction is known to occur (see, for example, Patent Document 1 (European Patent Application Publication No. 2362225)). Due to this peptide splicing reaction, antigenic peptides have greater diversity, which may further increase the diversity of immune responses among individuals.
  • de novo sequence analysis is performed to identify unknown antigenic peptides, including splicing peptides, using unidentified MS/MS spectra that occur in large quantities in mass spectrometry data.
  • a method is known in which a cutoff value based on a predetermined identification score (ALC: average local confidence, by Peaks Studio software) is set for the amino acid sequence of to identify it as an antigenic peptide.
  • AAC average local confidence, by Peaks Studio software
  • splicing peptide sequences that are neoantigen candidates cannot be performed by sequence prediction or matching based on cancer-specific mutation information obtained by genetic analysis or gene templates.
  • antigen peptides identified by mass spectrometry, peptides identified by de novo sequence analysis, identification information on their splicing sites, information on affinity with HLA, etc. are accumulated in a resource database (amino acid sequence database). It is also used as a prediction engine for affinity prediction between HLA and antigen peptides, structure identification, and the like.
  • the present invention was made to solve the problems of the conventional identification methods described above, and aims to provide a method that can easily and efficiently identify unknown splicing peptides.
  • the present invention is a method of identifying unknown splicing peptides derived from known parent peptides contained in a biological sample, comprising: (1) a first step of performing mass spectrometry on the sample to obtain mass spectrometry data of peptides contained in the sample; (2) a second step of searching a primary library, which is a database of known amino acid sequences, for an amino acid sequence that matches the mass spectrometry data to identify the parent peptide contained in the sample; (3) a third step of creating a secondary library containing candidate groups of splicing peptides that can arise from the identified parent peptide; (4) searching the secondary library for amino acid sequences that match the mass spectrometry data to identify the splicing peptides contained in the sample;
  • unknown splicing peptides can be easily and efficiently identified by using, as a secondary library, a group of splicing peptide candidates that can arise from a specific parent peptide identified by the primary library.
  • FIG. 2 is a flow diagram for explaining a method for identifying splicing peptides according to an embodiment
  • FIG. 2 shows the types of amino acid residues at the N-terminus of splicing peptides generated from S-260.
  • FIG. 2 shows the types of amino acid residues at the N-terminus of splicing peptides generated from S-280.
  • FIG. 2 shows the types of amino acid residues at the N-terminus of splicing peptides generated from S-300.
  • FIG. 2 shows the types of amino acid residues at the N-terminus of splicing peptides generated from S-310.
  • FIG. 2 shows the types of amino acid residues at the N-terminus of splicing peptides generated from S-320.
  • FIG. 2 shows the types of amino acid residues at the N-terminus of splicing peptides generated from S-330.
  • the method for identifying a splicing peptide comprises A method of identifying an unknown spliced peptide derived from a known parent peptide contained in a biological sample, comprising: (1) a first step (S1) of obtaining mass spectrometry data of peptides contained in the sample by performing mass spectrometry on the sample; (2) a second step (S2) in which a primary library, which is a database of known amino acid sequences, is searched for an amino acid sequence that matches the mass spectrometry data to identify the parent peptide contained in the sample; (3) a third step (S3) of creating a secondary library containing candidate groups of splicing peptides that can arise from the identified parent peptide; (4) a fourth step (S4) of searching the secondary library for amino acid sequences that match the mass spectrometry data to identify splicing peptides contained in the sample;
  • the identification method of this embodiment is a method of identifying an unknown splicing peptide derived from a known parent peptide contained in a biological sample.
  • a biological sample is, for example, a sample obtained from a living organism. Samples include, for example, fluids containing cancer cells, culture samples of cancer cell lines, excised cancer tissues, xenograft tissues, blood, exosome fractions, and the like.
  • a protein is ionized by an ionization method such as a matrix-assisted laser desorption ionization (MALDI) method or an electrospray ionization (ESI) method, and the protein ion is decomposed by the mass/charge ratio (m/z). Quantitative analysis is performed based on the intensity of the signal for each peak obtained.
  • Mass spectrometry may also be performed by liquid chromatography-mass spectrometry (LC-MS) or liquid chromatography-tandem mass spectrometry (LC-MS/MS).
  • Mass spectrometers include general single-type mass spectrometers, triple quadrupole (QqQ) mass spectrometers, quadrupole time-of-flight (Q-TOF) mass spectrometers, and tandem time-of-flight mass spectrometers.
  • a tandem mass spectrometer such as a (TOF-TOF) mass spectrometer, a quadrupole ion trap (QIT) mass spectrometer, or a quadrupole ion trap time-of-flight (QIT/TOF) mass spectrometer is suitable. can be used for
  • MRM multiple reaction monitoring
  • LC-MS/MS multiple reaction monitoring
  • LC-MS/MS multiple reaction monitoring
  • SIM method LC/MS
  • the mass spectrometry data may be mass spectrometry spectra (MS spectra, MS/MS spectra, etc.).
  • a primary library which is a database (data set) of known amino acid sequences, is searched for amino acid sequences that match the mass spectrometry data to identify parent peptides contained in the sample.
  • the parent peptide may be a known HLA binding peptide (HLA Class I binding peptide, HLA Class II binding peptide, etc.).
  • Parent peptides may be known peptides derived from cancer cells (cancer antigen peptides, sets of predicted sequences of peptides containing cancer mutated regions).
  • the parent peptide may be a known HLA-binding peptide derived from cancer cells.
  • HLA types are mainly classified into two classes (HLA Class I and HLA Class II).
  • the length of peptides that can bind to HLA is about 8 to 13 residues for HLA Class I and about 10 to 25 residues for HLA Class II.
  • HLA Class I is present in almost all cells, binds to peptides produced by proteasome degradation from intracellular foreign substances (proteins), and presents the peptides as antigens.
  • HLA Class II binds to peptides produced by lysosomal degradation from foreign substances and presents the peptides as antigens.
  • HLA Class I-binding peptides are directly involved in T cell activation, HLA Class I-binding peptides are extremely important in cancer therapy.
  • Amino acid sequence that matches mass spectrometry data is, for example, when the mass spectrometry data is a mass spectrometry spectrum (MS spectrum, MS/MS spectrum, etc.), multivariate analysis (principal component analysis etc.) is an amino acid sequence corresponding to a mass spectrometry spectrum that falls within the permissible range determined to be highly correlated.
  • the "amino acid sequence that matches the mass spectrometry data” means that the mass spectrometry data of the amino acid sequence is compared to the mass spectrometry data of the sample when identifying an amino acid sequence based on mass spectrometry data in the art. It is not necessary to have a perfect correlation as long as it has a correlation within an allowable range. For example, the difference between the two mass spectrometry spectra due to a small amount of contaminants remaining (not completely removed) in the sample finally subjected to mass spectrometry measurement can be tolerated to some extent.
  • the amino acid sequence that matches the mass spectrometry data has the same m/z value or a deviation within a predetermined range with respect to the m/z value (mass-to-charge ratio) of at least one peak in the mass spectrometry spectrum of the sample. It may be an amino acid sequence corresponding to a mass spectrometry spectrum having a peak at an m/z value of .
  • the threshold used in comparing m/z values to determine amino acid sequences that match mass spectrometry data is an absolute deviation between two corresponding m/z values of 0.5 or less. may be set, and may be set to 0.2 or less. The m/z value is calculated based on the molecular weight m and charge state z (1, 2 or 3, 4) of the peptide in the mass spectrometry data.
  • an identification engine used to identify the amino acid sequence of a peptide various known ones can be used, for example, Mascot, Peaks Studio, and the like.
  • the Mascot system is protein identification software that searches protein and genome sequence databases for amino acid sequences that match peptide mass spectrometry data obtained from a mass spectrometer, and identifies proteins or peptides contained in the measurement sample. be. Employing a probabilistic scoring algorithm, statistically significant proteins or peptides can be clearly distinguished and visualized by scores.
  • a secondary library is generated containing a candidate set of splicing peptides that can arise from the identified parental peptides.
  • the candidate group preferably consists of splicing peptides that are highly likely to arise from the parent peptide.
  • the computer processing time for identification can be shortened to a practical time, and the cost of identification can be reduced, compared to the case where all combinations of variant peptides that can be generated by splicing from the parent peptide are added as a candidate group. can do.
  • the candidate group is at least one of deletion of a predetermined number or less of amino acid residues at least one of the C-terminus and N-terminus and addition of a predetermined number or less of amino acid residues to the C-terminus and N-terminus of the parent peptide. It preferably consists of a variant peptide produced by In this case, variant peptides generated by "substitution" in which the number of added and deleted amino acid residues is the same is also included in this candidate group.
  • the candidate group consists of splicing peptides that are highly likely to arise from the parent peptide.
  • the candidate group is obtained by deleting a predetermined number or less of at least one of the C-terminus and N-terminus of the parent peptide and adding a predetermined number or less of amino acid residues to the C-terminus and N-terminus.
  • all combinations of variant peptides generated by at least one all combinations or partial combinations may be used.
  • the above predetermined number is preferably 2 residues. That is, the candidate group consists of deletion of at least one of 2 or less amino acid residues at the C-terminus and N-terminus and addition of 2 or less amino acid residues to the C-terminus and N-terminus of the parent peptide. (see Table 1 below).
  • the candidate group consists of splicing peptides that are more likely to arise from the parent peptide, the computer processing time for identification can be shortened, and the cost of identification can be reduced.
  • MS mass spectrometry
  • MS/MS tandem mass spectrometry
  • Peptide splicing reaction is, as shown in FIG. (see peptide splicing pathways indicated by black arrows in Figure 2).
  • nucleophilic substituents can occur more rapidly and randomly in small molecules.
  • nucleophilic substituents that attack acyl intermediates in peptide splicing reactions.
  • trypsin activity, chymotrypsin activity, peptidylglutamylaminopeptidase activity, etc. are locally retained within the cavity of the proteasome (enzyme complex), and considering that they have the property of actively taking up ubiquitinated proteins, Nucleophilic substituents are believed to be limited to peptides or amino acids.
  • molecules that are advantageous as nucleophilic substituents that attack acyl intermediates are considered to be amino acids and peptides with a relatively small number of residues (such as dipeptides), and amino acids are considered to be the most advantageous.
  • the identification method of the present embodiment is particularly useful in identifying splicing peptides (variant peptides) that are likely to be generated by substitution of one or two amino acids.
  • the number of residues in the amino acid sequence that constitutes the above candidate group may be, for example, 5 to 15 residues.
  • parent peptide when the parent peptide is composed of 9 amino acid residues and the predetermined number is 2 residues, an example of a preferred combination of splicing peptide candidate groups added to the primary library to obtain the secondary library. are as shown in Table 1 below. Parent peptides are not included in the candidate group. In Table 1, each of N1, N2, C1 and C2 means an amino acid selected from 20 amino acids, and the peptide sequences shown in each row have the number of combinations in the right column.
  • Specific operations in the third step and the fourth step include, for example, substitution of one or two amino acid residues at both ends of the peptide list (list of parent peptides) identified by database search.
  • the new sequences performed are randomly generated as FASTA files. After reconstructing the FASTA file (secondary library) on the Mascot server (Matrix Science), re-search is performed to identify splicing peptides.
  • HLA major MHC
  • tools for predicting affinity with HLA various known tools can be used, for example, NetMHCpan (DTU Health Tech, Center for Biological Sequence Analysis, Bioinformatic unit, Technical University of Denmark), Mascot proteome server (Matrix Sciences), PEAKS X (Bioinformatics Solutions), etc.
  • a public database can be used as the protein amino acid sequence database used for identification, but it can be easily replaced with individual cancer clinical sequence information. This not only makes it possible to search for HLA-binding peptides that are directly linked to cancer patient-specific genetic information, but also enables the identification method of the present embodiment to be used for evaluation monitoring of novel cancer vaccines, virus vaccine development, drug efficacy and safety. It is considered that this method can be fully applied to new medical treatment corresponding to individualized medicine such as sex assessment and immune monitoring.
  • Proteasome reaction (peptide splicing reaction) 20S immunoproteasome (15 nM, R & D Systems), PA28 ⁇ activator (150 nM, R & D Systems), a mixture of 20 amino acids (concentration of each amino acid: 25 ⁇ M, Cambridge Isotope and Sigma Aldrich), and proteasome substrate (1 ⁇ M of the following 8 substrate) in 25 mM Tris-HCl buffer at 37° C. for 5 h or overnight. The reaction is stopped by adding FA (final concentration: 1% by mass) and ACN (final concentration: 10% by mass).
  • proteasome substrates peptides degraded by the proteasome reaction
  • the following eight substrates S-220, S-230, S-260, S-280, S-300, S-310, S-320 and S -330: R&D Systems
  • AMC (7-Amino-4-methylcoumarin) on the C-terminal side is a fluorescent chromophore of aminocoumarin, released by hydrolysis of the substrate, and has a fluorescence wavelength (Em) of 345 nm/excitation. It can be monitored at a wavelength (Ex) of 445 nm.
  • Z on the N-terminal side is a benzoyl group
  • Suc is a succinyl group
  • Boc is a tert-butoxycarbonyl group
  • Ac is an acetyl group.
  • Z, Suc, Boc and Ac are protecting groups and may be abbreviated as PG hereinafter.
  • Others are single-letter amino acid abbreviations (eg, L for leucine and E for glutamic acid).
  • the intensity on the vertical axis represents the X (N-terminal amino acid residue) of the splicing product PG-AAs-X-COOH (X represents a random amino acid residue).
  • X represents a random amino acid residue
  • the black bar graph shows the value when the proteasome reaction time is 5 hours (5h), and the white bar graph shows the value when the proteasome reaction time is overnight (O/N).
  • Mouse hybridoma W6/32 cells (ATCC: American Type Culture Collection) are cultured in RPMI1640 synthetic medium (Sigma Aldrich) containing 10 wt% FBS (Fetal Bovine Serum, Gibco).
  • Mouse hybridoma W6/32 cells are cells that produce W6/32 antibody (IgG2a) that binds to HLA-A, HLA-B and HLA-C.
  • FBS Fetal Bovine Serum, Gibco
  • Mouse hybridoma W6/32 cells are cells that produce W6/32 antibody (IgG2a) that binds to HLA-A, HLA-B and HLA-C.
  • the W6/32 antibody contained in the medium is purified by being adsorbed on a Protein A Sepharose (GE) column, and after washing the column, the W6/32 antibody is immediately washed with 100 mM Glycine-HCl buffer (pH 2.7). to elute.
  • the solution from which the W6/32 antibody was eluted was immediately neutralized with 1M Tris-HCl buffer (pH 9.0) and replaced with 200 mM Na Phosphate buffer (pH 7.0).
  • HLA antigen peptide-HLA-W6/32 complex
  • TOSOH TOYOPEARL AF-rProteinA
  • Mass spectrometry (first step in the above embodiment) As the mass spectrometry data of the peptide contained in the sample, the MS / MS spectrum was analyzed with a liquid chromatograph mass spectrometer system (Nexera-Mikros: Shimadzu Corporation) and a Q-TOF mass spectrometer (LCMS-9030: stock It was measured by LC-MS/MS using the company Shimadzu Corporation).
  • HLA Class I binding peptides (parent peptides) known as cancer antigen peptides are identified from among the peptides contained in the sample by ordinary peptidome analysis using mzML format files of the acquired MS/MS spectra. bottom.
  • peptideome analysis "Mascot Proteome Server version 2.6.2” (Matrix Science) and “Peaks Studio software version 10.0” (Bioinformatics Solutions Inc.) are used as the identification engine, and the public protein database (amino acid sequence database) " SwissProt Human protein sequence version 2019.9” was used.
  • the SwissProt database is public protein sequence data, not a peptide ligand database.
  • Table 2 shows the peptide identification results at this step.
  • the candidate group of splicing peptides constituting the secondary library is added to the parent peptide, deleted, deleted and added, or replaced.
  • the peptide identification results are shown separately for cases that can be generated by (substitution).
  • the term “Identified peptides” indicates the total number of identified peptides
  • the term “Identified spliced peptides” indicates the spliced peptides among the identified peptides (not in the primary library but added to the secondary library).
  • the number of peptides identified as amino acid sequences) is shown (the same applies to Table 3 below).
  • ⁇ Reference example 2> Using similar mass spectrometry data as in Example 1, a feasibility test was performed on the method to identify splicing peptides. First, as a known amino acid sequence database, using the primary library consisting of the sequences of ligands (1231612 entries) accumulated in IEDB (Immune Epitope Database) and the sequences of ligands (64201 entries) accumulated in HLAtlas, The situation of splicing frequency was analyzed.
  • a randomized sequence (splicing peptide candidate group) is created by each of the substitutions or additions shown in the second and subsequent rows of Table 3, and the randomized sequences are A rearranged amino acid sequence database (secondary library) was created in addition to the original FASTA file. Using this secondary library, amino acid sequences matching the mass spectrometry data of each peptide contained in the proteasome reaction solution were identified from the secondary library. Table 3 shows the results. For the feasibility study, the results of "SwissProt protein seq" are also shown.
  • Example 1 first, a known peptide (parent peptide) contained in a sample is identified using a primary library, and only for the identified parent peptide, a splicing peptide that can be generated from it is identified. Additional lists (candidates) were added to create a secondary library. Therefore, in Example 1, the database size of the secondary library could be compressed to approximately 300 MB, and the work time could be greatly shortened (approximately 30 minutes). It should be noted that since the work of creating the secondary library can be automated, further reduction in processing time can be expected. If it is this level, it is thought that practical use is also possible enough.
  • Example 2 Affinity prediction analysis for HLA
  • the identification of splicing peptides in Example 1 indicates the possibility that the mass spectrometry data matched the structure of hypothetical splicing peptides derived from HLA-binding peptides. , the affinity of the identified splicing peptides for HLA is not clear. Therefore, in this example, the list of splicing peptides identified in Example 1 was subjected to the NetMHCpan algorithm, and the HLA alleles expressed by A431 cells (HLA-A03:01, HLA-B07:02, HLA-C07: 02) were calculated.
  • the ranking is scored for each of the splicing peptides identified in Example 1, and when the obtained “%Rank score” is less than 0.5, strong binding ("S” in the table) and When the “%Rank score” was 0.5 or more and less than 2, it was evaluated as weak binding ("W” in the table).
  • Table 4 shows a list of evaluation results (total number of peptides with S and W evaluations).
  • splicing peptides can be applied as peptide vaccines for cancer vaccine therapy by obtaining analytical data on affinity with HLA.
  • affinity data for each HLA allele as described above, the splicing peptide identified by the identification method described in the above embodiment can be analyzed for each HLA type possessed by each individual. It is considered possible to select a splicing peptide (neoantigen) that has a high affinity for .
  • a new candidate for a peptide vaccine used in cancer vaccine therapy is selected from splicing peptides, based on information on splicing peptides identified from cancer cells and the patient's HLA type, for each patient It is believed that an optimal peptide vaccine can be selected.
  • a method of identifying a splicing peptide is a method of identifying an unknown splicing peptide derived from a known parent peptide contained in a biological sample, comprising: (1) a first step of performing mass spectrometry on the sample to obtain mass spectrometry data of peptides contained in the sample; (2) a second step of searching a primary library, which is a database of known amino acid sequences, for an amino acid sequence that matches the mass spectrometry data to identify the parent peptide contained in the sample; (3) a third step of creating a secondary library containing candidate groups of splicing peptides that can arise from the identified parent peptide; (4) searching the secondary library for amino acid sequences that match the mass spectrometry data to identify the splicing peptides contained in the sample;
  • the time required for computer processing, etc. for identification can be shortened compared to the case where all combinations of variant peptides that can be generated by splicing from parent peptides are added as a candidate group, Identification can be performed efficiently.
  • the candidate group consists of deletion of a predetermined number or less of at least one of the C-terminus and N-terminus of the parent peptide, and addition of a predetermined number or less of amino acid residues to the C-terminus and N-terminus. 3.
  • the candidate group consists of splicing peptides that are highly likely to be generated from the parent peptides, all combinations that can be generated by splicing from the parent peptides, as in the second term.
  • the time required for computer processing and the like for identification can be shortened, and identification can be performed efficiently.
  • the candidate group consists of splicing peptides that are more likely to be generated from the parent peptide, so that the time for computer processing etc. related to identification can be shortened and efficient. can be identified.
  • the mass spectrometry data is a mass spectrometry spectrum
  • Amino acid sequences that match the mass spectrometry data have the same m/z value or m/z values within a predetermined range of deviation from the m/z value of at least one peak in the mass spectrometry spectrum. 5.
  • a program for executing the above identification method and a medium (non-transitory computer-readable medium) containing the program.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Library & Information Science (AREA)
  • Food Science & Technology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

生物学的なサンプル中に含まれる既知の親ペプチドに由来する未知のスプライシングペプチドを同定する方法であって、(1)前記サンプルに対して質量分析を実施することで、前記サンプル中に含まれるペプチドの質量分析データを得る、第1ステップと、(2)前記質量分析データにマッチするアミノ酸配列を既知のアミノ酸配列のデータベースである1次ライブラリから検索して、前記サンプル中に含まれる前記親ペプチドを同定する、第2ステップと、(3)同定された前記親ペプチドから生じ得るスプライシングペプチドの候補群を含む2次ライブラリを作成する第3ステップと、(4)前記質量分析データにマッチするアミノ酸配列を前記2次ライブラリから検索して、前記サンプル中に含まれる前記スプライシングペプチドを同定する、第4ステップと、を含む方法。

Description

スプライシングペプチドの同定方法
 本発明は、スプライシングペプチドの同定方法に関する。
 免疫システムが自己と非自己とを認識して自己を防御するには、複雑な過程が必要である。自然免疫と獲得免疫という二つの機構により、免疫システムが発動される。自然免疫は、主に、外来性の異物を素早く認識し排除する機能を有する。この自然免疫を補完する形で、複雑な獲得免疫のシステムが存在する。
 獲得免疫のシステムにおいては、外来性の異物が体内に侵入したとき、または、がん細胞等の異物が体内で発生したときには、まず、それらの異物がマクロファージ等によって消化(分解)され、分解された異物は樹状細胞によって認識され樹状細胞に取り込まれる。なお、これらの細胞は、抗原提示細胞と呼ばれる。
 樹状細胞に取り込まれた異物(タンパク質)は、細胞内に輸送され、細胞質内のリソソーム、プロテアソームなどによってペプチドに分解される。このペプチドは、細胞内に存在する主要組織適合性複合体(MHC:major histocompatibility complex)に結合した状態で、リンパ球(T細胞およびB細胞)に提示され、このペプチドが抗原としてリンパ球に認識される。ヒトにおけるMHCは、ヒト白血球型抗原(HLA:human leukocyte antigen)である。
 リンパ球(T細胞およびB細胞)の機能は、細胞傷害性免疫(T細胞)と体液性免疫(B細胞)で構成される。成熟したT細胞は、認識した抗原を目印にして異物を集中的に攻撃する能力を有する。B細胞は、認識した抗原に結合する抗体を産生し、異物(抗原)を中和したり失活させたりする能力を有する。
 近年、癌の治療法(外科手術、化学療法、放射線療法など)の効果を高めるために、癌免疫療法が注目されている。この癌免疫療法の一例としては、癌に特異的なペプチド(正常細胞にはなく癌細胞だけが持つペプチド)をワクチンとして接種して、獲得免疫の機能により癌の治療効果を高める方法(ペプチドワクチン療法)が知られている。
 HLAは、父母それぞれから一つずつ受け継いだ一対の遺伝子座によって決まる遺伝子型(ハプロタイプ)を有し、ハロタイプは数万通り存在すると言われている。HLAには、その多様なハロタイプに応じて多様な表現型(HLA型)が存在する。そして、抗原提示細胞に提示される抗原としてHLAと結合するペプチド(HLA結合ペプチド)は、HLA型によって異なることが知られている。
 このため、あるペプチドワクチンが接種された後に、そのペプチドがHLAに結合して抗原としてリンパ球に提示されて獲得免疫の機能が発現するかどうかは、患者のHLA型によって異なる場合がある。したがって、癌ワクチン療法において、ワクチンとして用いられるペプチドは、患者のHLA型に応じて適切に選択されることが望ましいと考えられる。
 さらに、従来は、タンパク質のスプライシングは、鋳型DNAから転写されたmRNAの編集の際に発生すると考えられてきたが、近年、プロテアソームにおける異物タンパク質の分解中に、ペプチドの配列に置換等が生じる反応(ペプチドスプライシング反応)が起きることが知られている(例えば、特許文献1(欧州特許出願公開第2362225号明細書)参照)。このペプチドスプライシング反応により、抗原ペプチドはさらに大きな多様性を持ち、これが個体間の免疫反応の多様性をさら高めている可能性がある。
 このような、多様なスプライシングペプチドの存在、HLA結合ペプチドの多様性などを考慮して、できるだけ多くの抗原ペプチドを正確に同定するアプローチが試みられている。
欧州特許出願公開第2362225号明細書
 例えば、抗原ペプチド候補領域を含むタンパク質を合成し、そのタンパク質に対して実際にプロテアソームによる分解等を行うことで、スプライシングペプチドを含む抗原ペプチドを同定する方法が検討されている。この方法では、確実に、抗原情報を得ることができ、スプライシングを確認することができるが、スループットが低く、効率的な同定を行うことが難しいという問題がある。
 他の方法として、質量分析データ中に大量に発生する未同定MS/MSスペクトルを利用し、スプライシングペプチド等を含む未知の抗原ペプチドを同定するDe novo配列解析を実施し、ここで同定されたペプチドのアミノ酸配列に対し、所定の同定スコア(ALC:average local confidence、by Peaks Studio software)に基づくカットオフ値を設定して、抗原ペプチドとして同定する方法が知られている。しかし、データ処理が複雑であり、効率的な同定を行うことが難しいという問題があった。またアイソバリックなアミノ酸を分離できないことも原理的な律速となっている。
 なお、ネオアンチゲンの候補となるスプライシングペプチド配列の同定については、遺伝子解析により得られた癌特異的変異情報、遺伝子の鋳型を元にした配列の予測やマッチングによって行うことはできない。一方で、質量分析により同定された抗原ペプチド、De novo配列解析により同定されたペプチド、およびそのスプライシング部位の同定情報、HLAとの親和性に関する情報などが、リソースデータベース(アミノ酸配列データベース)に蓄積され、HLAと抗原ペプチドとの親和性予測、構造同定などの予測エンジンとしても利用されている。
 本発明は、上記の従来の同定方法の問題を解決するためになされたものであり、簡便かつ効率的に未知のスプライシングペプチドを同定することのできる方法を提供することを目的とする。
 本発明は、生物学的なサンプル中に含まれる既知の親ペプチドに由来する未知のスプライシングペプチドを同定する方法であって、
 (1) 前記サンプルに対して質量分析を実施することで、前記サンプル中に含まれるペプチドの質量分析データを得る、第1ステップと、
 (2) 前記質量分析データにマッチするアミノ酸配列を既知のアミノ酸配列のデータベースである1次ライブラリから検索して、前記サンプル中に含まれる前記親ペプチドを同定する、第2ステップと、
 (3) 同定された前記親ペプチドから生じ得るスプライシングペプチドの候補群を含む2次ライブラリを作成する第3ステップと、
 (4) 前記質量分析データにマッチするアミノ酸配列を前記2次ライブラリから検索して、前記サンプル中に含まれる前記スプライシングペプチドを同定する、第4ステップと、を含む方法に関する。
 本発明によれば、1次ライブラリによって同定された特定の親ペプチドから生じ得るスプライシングペプチドの候補群を2次ライブラリとして用いることにより、簡便かつ効率的に未知のスプライシングペプチドを同定することができる。
実施形態に係るスプライシングペプチドの同定方法を説明するためのフロー図である。 アシル中間体を介したペプチドスプライシングの反応メカニズムを示す模式図である。 参考例1におけるペプチドスプライシングの確認のためのin vitro試験を説明するための模式図である。 S-220より生成するスプライシングペプチドのN末端のアミノ酸残基の種類を示す図である。 S-230より生成するスプライシングペプチドのN末端のアミノ酸残基の種類を示す図である。 S-260より生成するスプライシングペプチドのN末端のアミノ酸残基の種類を示す図である。 S-280より生成するスプライシングペプチドのN末端のアミノ酸残基の種類を示す図である。 S-300より生成するスプライシングペプチドのN末端のアミノ酸残基の種類を示す図である。 S-310より生成するスプライシングペプチドのN末端のアミノ酸残基の種類を示す図である。 S-320より生成するスプライシングペプチドのN末端のアミノ酸残基の種類を示す図である。 S-330より生成するスプライシングペプチドのN末端のアミノ酸残基の種類を示す図である。
 図1に示されるように、本実施形態に係るスプライシングペプチドの同定方法は、
 生物学的なサンプル中に含まれる既知の親ペプチドに由来する未知のスプライシングペプチドを同定する方法であって、
 (1) サンプルに対して質量分析を実施することで、サンプル中に含まれるペプチドの質量分析データを得る、第1ステップ(S1)と、
 (2) 質量分析データにマッチするアミノ酸配列を既知のアミノ酸配列のデータベースである1次ライブラリから検索して、サンプル中に含まれる親ペプチドを同定する、第2ステップ(S2)と、
 (3) 同定された親ペプチドから生じ得るスプライシングペプチドの候補群を含む2次ライブラリを作成する、第3ステップ(S3)と、
 (4) 質量分析データにマッチするアミノ酸配列を2次ライブラリから検索して、サンプル中に含まれるスプライシングペプチドを同定する、第4ステップ(S4)と、を含む。
 本実施形態の同定方法は、生物学的なサンプル中に含まれる既知の親ペプチドに由来する未知のスプライシングペプチドを同定する方法である。
 生物学的なサンプルは、例えば、生体から取得されたサンプルである。サンプルとしては、例えば、癌細胞を含む液、癌細胞株の培養サンプル、癌摘出組織、ゼノグラフト組織、血液、エクソソーム画分、などが挙げられる。
 以下、同定方法の各工程について詳細に説明する。
 (第1ステップ:S1)
 本実施形態において第1ステップ(S1)では、
サンプルに対して質量分析を実施することで、サンプル中に含まれるペプチドの質量分析データを得る。
 質量分析法としては、例えば、マトリックス支援レーザー脱離イオン化(MALDI)法、エレクトロスプレーイオン化(ESI)法等のイオン化法によりタンパク質をイオン化させ、タンパク質イオンの質量/電荷比(m/z)により分解されたピークごとのシグナルの強弱をもって定量分析を行う方法が挙げられる。また、液体クロマトグラフ質量分析法(LC-MS)、液体クロマトグラフタンデム質量分析(LC-MS/MS)によって、質量分析を行ってもよい。
 質量分析計としては、一般的なシングルタイプの質量分析計の他、トリプル四重極型(QqQ型)質量分析計、四重極飛行時間型(Q-TOF型)質量分析計、タンデム時間飛行型(TOF-TOF型)質量分析計、四重極イオントラップ型(QIT型)質量分析計、四重極イオントラップ飛行時間型(QIT/TOF型)質量分析計等のタンデム質量分析計を好適に用いることができる。
 LC-MS/MSにおいて、3連(triple)四重極型質量分析計を用いて多重反応モニタリング(MRM:multiple reaction monitoring)を行ってもよい。MRM法は、SIM法(LC/MS)よりも高感度な分析法(LC-MS/MS)である。
 質量分析データは、質量分析スペクトル(MSスペクトル、MS/MSスペクトルなど)であってもよい。
 (第2ステップ:S2)
 本実施形態において第2ステップ(S2)では、
質量分析データにマッチするアミノ酸配列を既知のアミノ酸配列のデータベース(データセット)である1次ライブラリから検索して、サンプル中に含まれる親ペプチドを同定する。
 親ペプチドは、既知のHLA結合ペプチド(HLA Class I結合ペプチド、HLA Class II結合ペプチドなど)であってもよい。
 親ペプチドは、癌細胞に由来する既知のペプチド(癌抗原ペプチド、癌変異領域を含むペプチドの予想配列のセット)であってもよい。
 親ペプチドは、癌細胞に由来する既知のHLA結合ペプチドであってもよい。
 なお、HLA型は、主に2つのクラス(HLA Class IおよびHLA Class II)に分類される。HLAに結合できるペプチドの長さは、HLA Class Iで8~13残基程度、HLA Class IIで10~25残基程度である。HLA Class I は、ほぼ全ての細胞に存在し、細胞内の異物(タンパク質)からプロテアソームでの分解によって生じるペプチドと結合し、該ペプチドを抗原として提示する。HLA Class IIは、外来性の異物からリソソームでの分解によって生じるペプチドと結合し、該ペプチドを抗原として提示する。
 なお、HLA Class Iに結合するペプチド(抗原)は、T細胞の活性化に直接関与するため、癌治療においては、HLA Class Iに結合するペプチドが非常に重要である。
 なお、癌に特異的なペプチドなどを同定するために、これまで多くのリソースデータベース(アミノ酸配列データベース)が開発されている。代表的なものとしては、例えば、NetMHCpan(http://www.cbs.dtu.dk/services/NetMHCpan/)、IEDB(https://www.iedb.org/)、、HLA Ligand Atlas(https://hla-ligand-atlas.org/)、SysteMHC(https://systemhcatlas.org/)、WebLogo(https://weblogo.berkeley.edu/logo.cgi)、HLAthena(http://hlathena.tools/)などのウェブツールが挙げられる。
 「質量分析データにマッチするアミノ酸配列」とは、例えば、質量分析データが質量分析スペクトル(MSスペクトル、MS/MSスペクトルなど)である場合、当該質量分析スペクトルに対して多変量解析(主成分分析など)によって相関が高いと判断されるような許容範囲に収まる質量分析スペクトルに相当するアミノ酸配列である。
 すなわち、「質量分析データにマッチするアミノ酸配列」とは、当該アミノ酸配列の質量分析データが、サンプルの質量分析データに対して、当該技術分野においてアミノ酸配列を質量分析データに基づいて同定する際に許容される範囲内の相関を有するものであればよく、完全な相関性を有している必要はない。例えば、最終的に質量分析スペクトルの測定に供されるサンプル中に残存する(除去しきれなかった)少量の夾雑物等に起因する両者の質量分析スペクトルの差は、ある程度許容され得る。
 なお、質量分析データにマッチするアミノ酸配列は、サンプルの質量分析スペクトルにおける少なくとも1つのピークのm/z値(質量電荷比)に対して、同じm/z値、または、偏差が所定の範囲内であるm/z値の位置にピークを有する質量分析スペクトルに相当するアミノ酸配列であってもよい。
 ここで、質量分析データにマッチするアミノ酸配列を決定するために、m/z値を比較する際に用いる閾値として、対応する2つのm/z値の間の絶対偏差は、0.5以下に設定されてもよく、0.2以下に設定されてもよい。なお、m/z値は、質量分析データにおけるペプチドの分子量mおよび電荷状態z(1、2または3、4)に基づいて計算される。
 また、ペプチドのアミノ酸配列の同定に用いられる同定エンジンとしては、種々公知のものを用いることができ、例えば、Mascot、Peaks Studioなどが挙げられる。例えば、Mascotシステムは、質量分析計から得られたペプチド質量分析データにマッチするアミノ酸配列を蛋白質やゲノムの配列データベースから検索し、測定サンプルに含まれる蛋白質またはペプチドを同定するための蛋白質同定ソフトウェアである。確率的なスコアリングアルゴリズムを採用しており、統計的に有意な蛋白質またはペプチドをスコアによって明確に区別して可視化することができる。
 (第3ステップ:S3)
 本実施形態において第3ステップ(S3)では、
同定された親ペプチドから生じ得るスプライシングペプチドの候補群を含む2次ライブラリを作成する。
 候補群は、親ペプチドから生じる可能性の高いスプライシングペプチドからなることが好ましい。
 この場合、親ペプチドからスプライシングによって生じ得る全ての組合せのバリアントペプチドを候補群として追加する場合に比べて、同定に関するコンピュータ処理の時間を現実的な時間まで短縮することができ、同定のコストを削減することができる。
 候補群は、親ペプチドに対する、C末端およびN末端の少なくともいずれかの所定数以下のアミノ酸残基の削除と、C末端およびN末端への所定数以下のアミノ酸残基の付加と、の少なくともいずれかによって生じる、バリアントペプチドからなることが好ましい。なお、この場合、付加と削除のアミノ酸残基数が同じである場合の「置換」によって生じるバリアントペプチドも、この候補群に含まれる。
 この場合、候補群が親ペプチドから生じる可能性の高いスプライシングペプチドからなるものとなる。
 なお、候補群は、親ペプチドに対する、C末端およびN末端の少なくともいずれかの所定数以下のアミノ酸残基の削除と、C末端およびN末端への所定数以下のアミノ酸残基の付加と、の少なくともいずれかによって生じる、全ての組合せのバリアントペプチドのうち、全ての組合せであってもよく、一部の組合せであってもよい。
 上記の所定数は、2残基であることが好ましい。すなわち、候補群は、親ペプチドに対する、C末端およびN末端の少なくともいずれかの2残基以下のアミノ酸残基の削除と、C末端およびN末端への2残基以下のアミノ酸残基の付加と、の少なくともいずれかによって生じることが好ましい(後述の表1参照)。
 この場合、候補群が親ペプチドから生じる可能性のより高いスプライシングペプチドからなるものとなるため、さらに、同定に関するコンピュータ処理の時間を短縮することができ、同定のコストを削減することができる。
 これまで、未知のスプライシングペプチド等のネオアンチゲンの同定方法は、MS(質量分析)スペクトル、MS/MS(タンデム質量分析)スペクトルなどの質量分析データに依存して、多くの抗原ペプチドについて質量分析データを取得して、アミノ酸配列を同定することを目的としていた。アミノ酸配列の同定には、基本的に配列データベースマッチングまたはDe novo配列解析を用いていた。
 一方、本発明者らは、ペプチドスプライシングの反応メカニズムに着目した。ペプチドスプライシング反応は、図2に示されるように、加水分解に至る途中の経路で、酵素活性中心におけるアシル中間体への求核置換反応により、ペプチドの一部に置換等が起きる反応であると考えられている(図2に黒矢印で示されるペプチドスプライシング経路参照)。
 このように、ペプチドスプライシングがアシル中間体を経由するのであれば、半減期の短いアシル中間体への求核置換基のアタックが速いほうが、スプライシング反応が起こる確率は圧倒的に有利である。この原則に基づくと、求核置換基は、小さな分子のほうがより反応速度が早く、かつランダムに発生できると考えられる。
 また、ペプチドスプライシング反応においてアシル中間体へアタックする求核置換基としては、生体分子中に存在する数多くの候補分子種が考えられる。しかし、プロテアソーム(酵素複合体)のキャビティ内では、トリプシン活性、キモトリプシン活性、ペプチジルグルタミルアミノペプチダーゼ活性等が局所的に保持され、ユビキチン化されたタンパク質を能動的に取り込む性質を有することを考慮すると、求核置換基は、ペプチドまたはアミノ酸に限定されると考えられる。
 したがって、アシル中間体へアタックする求核置換基として有利な分子は、アミノ酸および比較的残基数の小さいペプチド(ジペプチドなど)であると考えられ、アミノ酸が最も有利であると考えられる。
 しかし、これまでのスプライシングペプチドの同定には、MS/MSスペクトルマッチング、アミノ酸配列の相同性検索、De novo配列解析技術などを用いていたため、基本的に、同定できるペプチドは、ローカルアラインメントが認識できるものに限定される。つまり、3残基以上のアミノ酸配列が存在しない場合、ペプチド配列の同定を行うことは出来なかった。
 このため、上記のペプチドスプライシング反応において、アミノ酸やジペプチドが求核置換基となった場合(求核置換基を構成するアミノ酸数が1または2である場合)、これまでのローカルアラインメントを基本とした従来の同定アプローチによるスプライシングペプチドの同定は困難である。
 したがって、本実施形態の同定方法は、特に、1または2残基のアミノ酸による置換等によって生成する可能性が高いスプライシングペプチド(バリアントペプチド)を同定する場合において、有用である。
 尚、このようにスプライシング反応の基本的メカニズムにフォーカスしたスプライシングペプチドの解析手法は、これまで知られていない。
 上記の候補群を構成するアミノ酸配列の残基数は、例えば、5~15残基であってもよい。
 例えば、親ペプチドが9アミノ酸残基から構成され、上記所定数が2残基である場合において、2次ライブラリを得るために1次ライブラリに追加されるスプラシングペプチドの候補群の好ましい組み合わせの一例は、以下の表1に示す通りである。なお、親ペプチドは候補群には含まれない。
 表1において、N1、N2、C1およびC2の各々はアミノ酸20種から選択されるアミノ酸を意味し、各行に示すペプチドの配列は、右欄の組合せ数を有している。
Figure JPOXMLDOC01-appb-T000001
 (第4ステップ:S4)
 本実施形態において第4ステップ(S4)では、
質量分析データにマッチするアミノ酸配列を2次ライブラリから検索して、サンプル中に含まれるスプライシングペプチドを同定する。
 第3ステップおよび第4ステップの具体的な操作としては、例えば、データベース検索により同定されたペプチドリスト(親ペプチドのリスト)に対して、両末端のアミノ酸1残基または2残基の置換等が行われた新規配列を、FASTAファイルとしてランダムに発生させる。そのFASTAファイル(2次ライブラリ)をMascotサーバ(Matrix Science社)に再構成した後、再検索を行い、スプライシングペプチドを同定する。
 なお、上記では、同定されたペプチドから配列のランダム化を実施して再検索を実施する方法について説明したが、今後、ソフトウェア等の開発により、Error tolerant searchのように、想定された配列を仮想的に構築し、再検索できるような解析シーケンス開発も十分に可能であると考えられる。
 (癌ワクチン療法におけるペプチドワクチンの選定)
 癌ネオアンチゲンの探索において、その最終目的は、例えば、効果的な癌ワクチンや細胞治療の開発および評価である。
 癌の性質を考慮すると、癌ワクチンの候補として、ウイルスのような弱毒化ワクチンは使えない。そこで、古典的癌抗原(癌で過剰発現する分子)、癌遺伝子(癌特異的な変異が蓄積しやすい遺伝子)などを、癌ワクチンの候補として用いるトライアルがなされてきたが、残念ながら成功したとは言えない。
 現在考えられる新規癌ワクチンは、癌遺伝子の変異を含む断片、不完全な翻訳タンパク質、スプライシングペプチドなどにフォーカスし、これらから提示されるHLA結合ペプチドの情報と、その個体毎のHLAタイピング(個々のHLA型において発現するHLAアレルに親和性が高いペプチドワクチンを用いること)、マイクロサテライト不安定性などのアッセイ結果を総合的に用いて、ペプチドワクチンを選択的に投与する個別化医療の実施が望ましい。ここで、本実施形態の同定方法は、癌のスプライシングペプチド抗原の効率的な探索に適用可能である。
 なお、主要なMHC(HLA)のクラスIおよびIIとの結合親和性に基づいて、免疫原性T細胞のエピトープを同定するための多数の機械学習ベースの予測因子が開発されている。HLAとの親和性などを予測するためのツールとしては、種々公知のものを用いることができ、例えば、NetMHCpan(DTU Health Tech, Center for Biological Sequence Analysis, Bioinformatic unit, Technical University of Denmark)、Mascot proteome server (Matrix Sciences)、PEAKS X(Bioinformatics Solutions)などが挙げられる。
 本実施形態の同定方法において、同定に使うタンパク質アミノ酸配列のデータベースとしては、公共データベースを利用できるが、個別の癌クリニカルシーケンス情報に容易に置換可能である。このことは、癌患者特有の遺伝子情報とダイレクトにリンクしたHLA結合ペプチドの探索を可能にするだけでなく、本実施形態の同定方法が、新規癌ワクチンの評価モニタリング、ウイルスワクチン開発、薬効および安全性評価、免疫モニタリングなどの個別化医療に対応する新しい医療に十分応用できるものと考えられる。
 また、本実施形態の同定方法を用いることで、ローカルアラインメントを予測できない、ランダムなHLA結合ペプチドのスプライシング断片を効率的に検出できることとなり、新規な癌抗原(癌ネオアンチゲン)の探索(同定)が可能になると考えられる。
 以下、実施例を挙げて本発明をより詳細に説明するが、本発明はこれらに限定されるものではない。なお、以下ではアミノ酸(残基)について3文字略号で表記する場合がある。
 <参考例1>
 プロテアソーム反応中に発生するスプライシングペプチドを確認するためのin vitro試験
 (i) プロテアソーム反応(ペプチドスプライシング反応)
 20Sイムノプロテアソーム(15nM,R&D Systems)、PA28αアクティベーター(150nM,R&D Systems)、20種のアミノ酸の混合物(各アミノ酸の濃度:25μM,Cambridge Isotope and Sigma Aldrich)、および、プロテアソーム基質(1μMの下記8種の基質の等量混合物)を25mM Tris-HClバッファー中、37℃で、5時間または終夜反応させる。なお、反応は、FA(終濃度:1質量%)およびACN(終濃度:10%質量)を添加することにより、停止する。
 プロテアソーム基質(プロテアソーム反応による分解されるペプチド)としては、以下の8種の基質(S-220,S-230,S-260,S-280,S-300,S-310,S-320およびS-330:R&D Systems)の等量混合物を用いた。
S-220: Z-LLL-AMC
S-230: Z-LLE-AMC
S-260: Suc-LY-AMC
S-280: Suc-LLVY-AMC
S-300: Boc-LRR-AMC
S-310: Ac-PAL-AMC
S-320: Ac-ANW-AMC
S-330: Ac-WLA-AMC
 なお、上記右側に示す表記において、C末端側のAMC(7-Amino-4-methylcoumarin)は、アミノクマリンの蛍光発色団であり、基質の加水分解によって遊離し、蛍光波長(Em)345nm/励起波長(Ex)445nmでモニターできる。
 N末端側のZはベンゾイル基であり、Sucはスクシニル基であり、Bocはtert-ブトキシカルボニル基であり、Acはアセチル基である。なお、Z、Suc、BocおよびAcは、保護基(protecting group)であり、以下ではPGと略す場合がある。
 それ以外は、アミノ酸の1文字略号である(例えば、Lはロイシンを示し、Eはグルタミン酸を示す。)。
 (ii) プロテアソーム反応液中に含まれる各ペプチドの質量分析
 上記の基質(ペプチド)の各々について、C末端のAMCが加水分解によって遊離した後、ペプチドのC末端にアミノ酸が付加する反応をMRM(multiple reaction monitoring)によってモニターした。なお、それぞれの基質についてMRMの最適な条件を設定した。
 上記のプロテアソーム反応後の反応液中に含まれる各ペプチドの質量分析は、上記のMRMにより、液体クロマトグラフ質量分析計(LC-MS)(LCMS-8050、株式会社島津製作所製)を用いて行った。LC-MSで検出するトランジションは、上記の基質であるPG-AAs-AMC(PG:protecting group,AAs:amino acids)、遊離発色団であるFree AMC、基質の加水分解物であるPG-AAs-COOH、および、スプライシング生成物であるPG-AAs-X-COOH(Xは、ランダムなアミノ酸残基を示す。)をとした。
 LCMS-8050による分析条件は以下の通りである。
溶媒A: 0.1質量%FAを含み、残部が水である溶媒
溶媒B: 0.1質量%FAおよび100質量%のACNである溶媒
分離カラム: Shimpack GISS,2μm,2×50mm
流速: 0.4mL/min
インターフェイス: ESIインターフェイス
トランジション時間: 10msec
Collisionガス圧: 270kPa
インターフェイス温度: 300℃
DL温度: 250℃
ヒートブロック温度: 400℃
ネブライザーガス: 3L/min
ヒーティングガス: 10L/min
ドライガス: 10L/min
インターフェイス電圧: 4kV
 このようにして、上記8種のプロテアソーム基質(S-220,S-230,S-260,S-280,S-300,S-310,S-320およびS-330)の各々について、スプライシング反応により実際に生成するペプチドの配列を確認した。各基質についての分析結果を、それぞれ図4~図11に示す。
 なお、図4~図11において、縦軸の強度は、スプライシング生成物であるPG-AAs-X-COOH(Xは、ランダムなアミノ酸残基を示す。)のX(N末端のアミノ酸残基)について、横軸に示す各アミノ酸(1文字略号)に対応するMRM transitionにおける測定強度(単位:cps)の値である。図中、黒色の棒グラフは、プロテアソーム反応の時間が5時間(5h)である場合の値を示し、白色の棒グラフは、プロテアソーム反応の時間が終夜(O/N)である場合の値を示す。
 図4~図11に示される結果から、プロテアソームによるスプライシングペプチドの生成が確認される。
 <実施例1>
 本実施例の同定方法を実施するために、まず、以下の準備を行った。
 (W6/32抗体の調製)
 (i) マウスハイブリドーマW6/32細胞(ATCC:American Type Culture Collection)を、10質量%のFBS(Fetal Bovine Serum、Gibco)を含むRPMI1640合成培地(Sigma Aldrich)中で培養する。なお、マウスハイブリドーマW6/32細胞は、HLA-A,HLA-BおよびHLA-Cに結合するW6/32抗体(IgG2a)を産生する細胞である。
 (ii) 70%飽和状態になったときに、細胞を洗浄してFBSを除去し、血清を含まないハイブリドーマ用培地(Hybrigro、Corning)に置換する。
 (iii) 72時間、培養を継続する。
 (iv) 培地を回収し濾過および清浄を行う。
 (v) 培地中に含まれるW6/32抗体をProtein A Sepharose(GE)カラムに吸着させることで精製し、カラムの洗浄後、速やかに100mM Glycine-HClバッファー(pH2.7)でW6/32抗体を溶出する。
 (vi) W6/32抗体が溶出した溶液は、即座に1M Tris-HClバッファー(pH9.0)でpHを中性に戻し、200mM Na Phosphateバッファー(pH7.0)で置換する。
 (vii) 得られた溶液中のタンパク質濃度をビシンコニン酸アッセイにより測定し、W6/32抗体を含む該溶液を4℃で保存する。
 (生物学的サンプルの調製)
 (i) 2×10個のヒト類表皮癌由来のA431細胞(ATCC)を、2質量%のOTG(Octyl-D-1-thioglucopyranoside)およびProtease inhibitor cocktail(Sigma Aldrich)を含む100mMのTris-HClバッファー(pH8.5)に懸濁し、氷上にて30分インキュベートして細胞を溶解する。
 (ii) 細胞が溶解した液を遠心分離(20000g、30min)し、上清を回収する。この上清中には、A431細胞に特有のペプチドが結合したHLA(HLA-A,HLA-BおよびHLA-C)が含まれていると考えられる。
 (iii) 得られた上清にW6/32抗体を200μg加え、4℃にて16時間インキュベーションし、A431細胞に特有のペプチドが結合したHLA(HLA-A,HLA-BおよびHLA-Cの各々)とW6/32抗体との免疫複合体(抗原ペプチド-HLA-W6/32複合体)を形成させる。
 (iv) IgGを吸着するProtein Aが固定化された樹脂である「TOYOPEARL AF-rProteinA」(TOSOH)により、抗原ペプチド-HLA-W6/32複合体を回収する。
 (v) Protein A固定化樹脂に対して、PBS(phosphate-buffered saline)1mLによる5回の洗浄、および、Trisバッファー1mLによる5回の洗浄を行う。
 (vi) 洗浄後のProtein A固定化樹脂に、500μLの10%酢酸を加え、室温で10分間インキュベートした後、抗原ペプチド-HLA-W6/32複合体を含む上清を回収し、遠心乾燥機で完全に乾固する。これにより、抗原ペプチド-HLA-W6/32複合体を含む固形物が得られる。
 (vii) 得られた固形物を0.1%ギ酸水に再溶解する。
 このようにして得られた抗原ペプチド-HLA-W6/32複合体を含む溶液を質量分析用サンプル(生物学的なサンプル)とする。
 〔スプライシングペプチドの同定〕
 次に、本実施例の同定方法、すなわち、上記の生物学的サンプルに含まれる既知の親ペプチドに由来する未知のスプライシングペプチド(未知の抗原ペプチド:ネオアンチゲン)を同定する方法、について説明する。
 (1) 質量分析(上記実施形態における第1ステップ)
 上記サンプル中に含まれるペプチドの質量分析データとして、MS/MSスペクトルを、液体クロマトグラフ質量分析計システム(Nexera-Mikros:株式会社島津製作所)およびQ-TOF型質量分析計(LCMS-9030:株式会社島津製作所)を用いたLC-MS/MSによって測定した。
 LC-MS/MSの分析条件は以下の通りである。
溶媒A: 0.1質量%のFA(ギ酸)および5質量%のACN(アセトニトリル)を含み、残部が水である溶媒
溶媒B: 0.1質量%のFA(ギ酸)および80質量%のACN(アセトニトリル)を含み、残部が水である溶媒
トラップカラム: 「L-column2 ODS」(一般財団法人 化学物質評価研究機構),5μm,0.3×5mm
分離カラム: 「L-column2 ODS」,2μm,0.3×150mm
流速: 5μL/min
インターフェイス: ESIミクロインターフェイス
イベント数: 8-14回
イベント時間: 100msec
Collision電圧: 25±10V
Collisionガス圧: 230kPa
インターフェイス電圧: 3kV
インターフェイス温度: 100℃
DL温度: 200℃
ヒートブロック温度: 250℃
スキャン範囲: 400-700Da
価数未判定イオン: 排除
親イオン分解能: 20ppm
Exclusion時間: 5 sec
ネブライザーガス: 1L/min
ヒーティングガス: 3L/min
ドライガス: 0
データ変換: mzML format
 (2) サンプル中に含まれる親ペプチドの同定(上記実施形態の第2ステップ)
 取得されたMS/MSスペクトルのmzML形式のファイルを用い、通常のペプチドーム解析により、癌の抗原ペプチドとして既知のHLA Class I結合ペプチド(親ペプチド)を、上記サンプル中に含まれるペプチドの中から同定した。なお、ペプチドーム解析では、同定エンジンとして「Mascot Proteome Server version 2.6.2」(Matrix Science)および「Peaks Studio software version 10.0」(Bioinformatics Solutions Inc.)を用い、公共のタンパク質データベース(アミノ酸配列データベース)として「SwissProt Human protein sequence version 2019.9」を用いた。SwissProtデータベース(一次ライブラリ)を用いて検索を行い、同定エンジンの有意なペプチドスコア(P<0.05)でヒットしたペプチドが、親ペプチドとして同定された。なお、SwissProtデータベースは、ペプチドリガンドデータベースではなくタンパク質の公共配列データである。
 (3) 2次ライブラリの作成(上記実施形態の第3ステップ)
 上記のようにして同定された親ペプチドのリストをエクスポートする。その親ペプチド(631種)に対し、ランダム化配列(スプライシングペプチドの候補群)を発生させ、それらの候補群からなる2次ライブラリを作成した。
 (4) スプライシングペプチドの同定(上記実施形態の第4ステップ)
 作成された2次ライブラリを用いて、上記の質量分析データ(MS/MSスペクトル)の再解析(サンプル中に含まれるスプライシングペプチドの同定)を実施した。
 表2に、このステップでのペプチドの同定結果を示す。なお、表2の左列に示すように、2次ライブラリを構成するスプライシングペプチドの候補群が、親ペプチドに対する付加(Addition)、削除(Deletion)、削除および付加(Deletion and Addition)、または、置換(Substitution)によって生じ得るものである場合に分けて、ペプチドの同定結果を示している。
 表中、「Identified peptides」の項は、同定されたペプチドの総数を示し、「Identified spliced peptides」の項は、同定されたペプチドのうちスプライシングペプチド(1次ライブラリになく、2次ライブラリに追加されたアミノ酸配列)として同定されたペプチドの数を示す(後述の表3も同様である)。
Figure JPOXMLDOC01-appb-T000002
 <参考例2>
 実施例1と同様の質量分析データを用いて、スプライシングペプチドを同定する手法について、実行可能性テストを行った。
 まず、既知のアミノ酸配列データベースとして、IEDB(Immune Epitope Database)に蓄積されたリガンド(1231612エントリー)の配列、および、HLAtlasに蓄積されたリガンド(64201エントリー)の配列からなる1次ライブラリを用いて、スプライシング頻度の状況を解析した。
 具体的には、これらの配列全てについて、表3の2行目以降に示される置換または付加の各々によりランダム化された配列(スプライシングペプチドの候補群)を作成し、そのランダム化された配列を元のFASTAファイルに追加して再編成されたアミノ酸配列データベース(2次ライブラリ)を作成した。この2次ライブラリを用いて、上記のプロテアソーム反応液中に含まれる各ペプチドの質量分析データにマッチするアミノ酸配列を2次ライブラリから同定した。その結果を表3に示す。
 なお、フィージビリティスタディのために、「SwissProt protein seq」についての結果を併せて示す。
Figure JPOXMLDOC01-appb-T000003
 表3に示される結果から、平均すると5%程度の頻度でスプライシングペプチドを同定できることがわかった。しかし、配列をランダム化して2次ライブラリを作成する際に、1次ライブラリの全ての配列に対して、そこから生じ得るスプライシングペプチドの候補群を作成したため、膨大な作業時間(約10~30日)とデータ量(約3~10TB)を要するため、IEDB/HLAtlas databaseを用いる上記の方法は、通常のマシンパワーでは実用化は難しいと考えられる。
 これに対して、実施例1では、まず、1次ライブラリを用いてサンプル中に含まれる既知のペプチド(親ペプチド)を同定し、その同定された親ペプチドのみについて、そこから生じ得るスプライシングペプチドのリスト(候補群)を追加して、2次ライブラリを作成した。このため、実施例1では、2次ライブラリのデータベースサイズを約300MB程度に圧縮でき、作業時間も大幅に(約30分)短縮することが可能であった。なお、2次ライブラリの作成作業は自動化が可能であると考えられるため、さらなる処理時間の短縮が見込める。このレベルであれば、十分実用化も可能であると考えられる。
 <実施例2> HLAに対する親和性予測解析
 実施例1におけるスプライシングペプチドの同定は、も質量分析データが、HLA結合ペプチドに由来する仮想的なスプライシングペプチドの構造にマッチした可能性を示しているが、同定されたスプライシングペプチドのHLAに対する親和性は明らかではない。このため、本実施例では、実施例1で同定されたスプライシングペプチドのリストを、NetMHCpanのアルゴリズムにかけ、A431細胞が発現するHLAアレル(HLA-A03:01, HLA-B07:02, HLA-C07:02)との親和性予測を計算した。
 計算結果から、実施例1で同定されたスプライシングペプチドの各々についてランキングをスコア化し、得られた「%Rank score」が0.5未満の場合に、強い結合性(表中の「S」)と評価し、「%Rank score」が0.5以上2未満である場合に、弱い結合性(表中の「W」)と評価した。表4に、評価結果(評価がSおよびWであったペプチドの総数)のリストを示す。
Figure JPOXMLDOC01-appb-T000004
 表4に示されるS(強い結合性)の評価結果から、約140のスプライシングペプチドが、A431細胞が発現するHLA(HLA-A03:01, HLA-B07:02, HLA-C07:02)に強く結合する可能性のあるペプチドとして同定された。
 このように、HLAとの親和性の解析データを取得することで、新たに同定されたスプライシングペプチド(ネオアンチゲン)を癌ワクチン療法に用いられるペプチドワクチンとして適用できると考えられる。
 また、上記のような各HLAアレルに対する親和性のデータを取得することで、上記の実施形態に記載の同定方法によって同定されたスプライシングペプチドについて、各個体が有するHLA型毎に、発現するHLAアレルに親和性が高いスプライシングペプチド(ネオアンチゲン)を選定することができると考えられる。これにより、例えば、癌ワクチン療法に用いられるペプチドワクチンの新規候補をスプライシングペプチドから選定する場合に、癌細胞等から同定されたスプライシングペプチドの情報と、患者のHLA型とに基づいて、患者毎に最適なペプチドワクチンを選定することができると考えられる。
 [態様]
 上述した複数の例示的な実施形態および実施例は、以下の態様の具体例であることが当業者により理解される。
 (第1項)
 一態様に係るスプライシングペプチドの同定方法は、生物学的なサンプル中に含まれる既知の親ペプチドに由来する未知のスプライシングペプチドを同定する方法であって、
 (1) 前記サンプルに対して質量分析を実施することで、前記サンプル中に含まれるペプチドの質量分析データを得る、第1ステップと、
 (2) 前記質量分析データにマッチするアミノ酸配列を既知のアミノ酸配列のデータベースである1次ライブラリから検索して、前記サンプル中に含まれる前記親ペプチドを同定する、第2ステップと、
 (3) 同定された前記親ペプチドから生じ得るスプライシングペプチドの候補群を含む2次ライブラリを作成する、第3ステップと、
 (4) 前記質量分析データにマッチするアミノ酸配列を前記2次ライブラリから検索して、前記サンプル中に含まれる前記スプライシングペプチドを同定する、第4ステップと、を含む方法。
 第1項に記載の同定方法によれば、親ペプチドから生じ得るスプライシングペプチドの候補群を含む2次ライブラリを用いることにより、プロテアソームによる分解実験や大量に発生する未同定MS/MSスペクトルの解析等を行うことなく、簡便かつ効率的に未知のスプライシングペプチドを同定することができる。
 (第2項)
 前記候補群は、前記親ペプチドから生じる可能性の高いスプライシングペプチドからなる、第1項に記載の方法。
 第2項に記載の同定方法によれば、親ペプチドからスプライシングによって生じ得る全ての組合せのバリアントペプチドを候補群として追加する場合に比べて、同定に関するコンピュータ処理等の時間を短縮することができ、効率的に同定を行うことができる。
 (第3項)
 前記候補群は、前記親ペプチドに対する、C末端およびN末端の少なくともいずれかの所定数以下のアミノ酸残基の削除と、C末端およびN末端への所定数以下のアミノ酸残基の付加と、の少なくともいずれかによって生じる、バリアントペプチドからなる、第1項または第2項に記載の方法。
 第3項に記載の同定方法によれば、候補群が親ペプチドから生じる可能性の高いスプライシングペプチドからなるものとなるため、第2項と同様に、親ペプチドからスプライシングによって生じ得る全ての組合せのバリアントペプチドを候補群として追加する場合に比べて、同定に関するコンピュータ処理等の時間を短縮することができ、効率的に同定を行うことができる。
 (第4項)
 前記所定数は、2残基である、第3項に記載の方法。
 第4項に記載の同定方法によれば、候補群が親ペプチドから生じる可能性のより高いスプライシングペプチドからなるものとなるため、さらに同定に関するコンピュータ処理等の時間を短縮することができ、効率的に同定を行うことができる。
 (第5項)
 前記質量分析データは、質量分析スペクトルであり、
 前記質量分析データにマッチするアミノ酸配列は、前記質量分析スペクトルにおける少なくとも1つのピークのm/z値に対して、同じm/z値、または、偏差が所定の範囲内であるm/z値の位置にピークを有する質量分析スペクトルに相当するアミノ酸配列である、第1項~第4項のいずれか1項に記載の方法。
 (第6項)
 前記親ペプチドは、既知のHLA結合ペプチドである、第1項~第5項のいずれか1項に記載の方法。
 (第7項)
 前記親ペプチドは、既知のHLA結合ペプチドである、第1項~第6項のいずれか1項に記載の方法。
 (第8項)
 前記親ペプチドは、癌細胞に由来する既知のHLA結合ペプチドである、第7項に記載の方法。
 上記の同定方法を実行するためのプログラム、および、該プログラムを収納する媒体(非一時的コンピュータ可読媒体)。
 今回開示された実施形態および実施例はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

Claims (8)

  1.  生物学的なサンプル中に含まれる既知の親ペプチドに由来する未知のスプライシングペプチドを同定する方法であって、
     (1) 前記サンプルに対して質量分析を実施することで、前記サンプル中に含まれるペプチドの質量分析データを得る、第1ステップと、
     (2) 前記質量分析データにマッチするアミノ酸配列を既知のアミノ酸配列のデータベースである1次ライブラリから検索して、前記サンプル中に含まれる前記親ペプチドを同定する、第2ステップと、
     (3) 同定された前記親ペプチドから生じ得るスプライシングペプチドの候補群を含む2次ライブラリを作成する、第3ステップと、
     (4) 前記質量分析データにマッチするアミノ酸配列を前記2次ライブラリから検索して、前記サンプル中に含まれる前記スプライシングペプチドを同定する、第4ステップと、を含む方法。
  2.  前記候補群は、前記親ペプチドから生じる可能性の高いスプライシングペプチドからなる、請求項1に記載の方法。
  3.  前記候補群は、前記親ペプチドに対する、C末端およびN末端の少なくともいずれかの所定数以下のアミノ酸残基の削除と、C末端およびN末端への所定数以下のアミノ酸残基の付加と、の少なくともいずれかによって生じる、バリアントペプチドからなる、請求項1に記載の方法。
  4.  前記所定数は、2残基である、請求項3に記載の方法。
  5.  前記質量分析データは、質量分析スペクトルであり、
     前記質量分析データにマッチするアミノ酸配列は、前記質量分析スペクトルにおける少なくとも1つのピークのm/z値に対して、同じm/z値、または、偏差が所定の範囲内であるm/z値の位置にピークを有する質量分析スペクトルに相当するアミノ酸配列である、請求項1に記載の方法。
  6.  前記親ペプチドは、既知のHLA結合ペプチドである、請求項1に記載の方法。
  7.  前記親ペプチドは、癌細胞に由来する既知のペプチドである、請求項1に記載の方法。
  8.  前記親ペプチドは、癌細胞に由来する既知のHLA結合ペプチドである、請求項1に記載の方法。
PCT/JP2022/028431 2021-07-28 2022-07-22 スプライシングペプチドの同定方法 WO2023008321A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US18/292,641 US20240345096A1 (en) 2021-07-28 2022-07-22 Method of identifying spliced peptide
EP22849383.9A EP4378947A1 (en) 2021-07-28 2022-07-22 Method for identifying splicing peptide
CN202280052457.XA CN117999271A (zh) 2021-07-28 2022-07-22 剪接肽的鉴定方法
JP2023538484A JPWO2023008321A1 (ja) 2021-07-28 2022-07-22

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202163226406P 2021-07-28 2021-07-28
US63/226,406 2021-07-28

Publications (1)

Publication Number Publication Date
WO2023008321A1 true WO2023008321A1 (ja) 2023-02-02

Family

ID=85086816

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/028431 WO2023008321A1 (ja) 2021-07-28 2022-07-22 スプライシングペプチドの同定方法

Country Status (5)

Country Link
US (1) US20240345096A1 (ja)
EP (1) EP4378947A1 (ja)
JP (1) JPWO2023008321A1 (ja)
CN (1) CN117999271A (ja)
WO (1) WO2023008321A1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2362225A1 (en) 2010-02-25 2011-08-31 Charité Universitätsmedizin Berlin Method for indentification of proteasome generated spliced peptides

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2362225A1 (en) 2010-02-25 2011-08-31 Charité Universitätsmedizin Berlin Method for indentification of proteasome generated spliced peptides

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
LICHTI CHERYL F., VIGNERON NATHALIE, CLAUSER KARL R., VAN DEN EYNDE BENOIT J., BASSANI-STERNBERG MICHAL: "Navigating Critical Challenges Associated with Immunopeptidomics-Based Detection of Proteasomal Spliced Peptide Candidates", CANCER IMMUNOLOGY RESEARCH, AMERICAN ASSOCIATION FOR CANCER RESEARCH, US, vol. 10, no. 3, 1 March 2022 (2022-03-01), US , pages 275 - 284, XP093029772, ISSN: 2326-6066, DOI: 10.1158/2326-6066.CIR-21-0727 *
MISHTO MICHELE, RODRIGUEZ-HERNANDEZ GUILLERMO, NEEFJES JACQUES, URLAUB HENNING, LIEPE JULIANE: "Response: Commentary: An In Silico–In Vitro Pipeline Identifying an HLA-A*02:01+ KRAS G12V+ Spliced Epitope Candidate for a Broad Tumor-Immune Response in Cancer Patients", FRONTIERS IN IMMUNOLOGY, vol. 12, XP093029771, DOI: 10.3389/fimmu.2021.679836 *
VERKERK TAMARA, KOOMEN SOFIE J. I., FUCHS KYRA J., GRIFFIOEN MARIEKE, SPAAPEN ROBBERT M.: "An unexplored angle: T cell antigen discoveries reveal a marginal contribution of proteasome splicing to the immunogenic MHC class I antigen pool", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES, NATIONAL ACADEMY OF SCIENCES, vol. 119, no. 29, 19 July 2022 (2022-07-19), XP093029775, ISSN: 0027-8424, DOI: 10.1073/pnas.2119736119 *
VIGNERON NATHALIE; STROOBANT VINCENT; FERRARI VIOLETTE; ABI HABIB JOANNA; VAN DEN EYNDE BENOIT J.: "Production of spliced peptides by the proteasome", MOLECULAR IMMUNOLOGY, PERGAMON, GB, vol. 113, 9 April 2018 (2018-04-09), GB , pages 93 - 102, XP085827286, ISSN: 0161-5890, DOI: 10.1016/j.molimm.2018.03.030 *
ZHANG XIAOMEI; QI YUE; ZHANG QI; LIU WEI: "Application of mass spectrometry-based MHC immunopeptidome profiling in neoantigen identification for tumor immunotherapy", BIOMEDICINE & PHARMACOTHERAPY, ELSEVIER, FR, vol. 120, 16 October 2019 (2019-10-16), FR , XP085902745, ISSN: 0753-3322, DOI: 10.1016/j.biopha.2019.109542 *

Also Published As

Publication number Publication date
US20240345096A1 (en) 2024-10-17
CN117999271A (zh) 2024-05-07
JPWO2023008321A1 (ja) 2023-02-02
EP4378947A1 (en) 2024-06-05

Similar Documents

Publication Publication Date Title
Freudenmann et al. Mapping the tumour human leukocyte antigen (HLA) ligandome by mass spectrometry
JP7175951B2 (ja) 免疫原性変異体ペプチドスクリーニングプラットフォーム
Bassani-Sternberg et al. Mass spectrometry of human leukocyte antigen class I peptidomes reveals strong effects of protein abundance and turnover on antigen presentation*[S]
Stauber et al. Proteomics of Chlamydomonas reinhardtii light-harvesting proteins
Johnson et al. Informatics for protein identification by mass spectrometry
Panigrahi et al. Mitochondrial complexes in Trypanosoma brucei: a novel complex and a unique oxidoreductase complex
Swaney et al. Value of using multiple proteases for large-scale mass spectrometry-based proteomics
Seward et al. Peptides presented by HLA-DR molecules in synovia of patients with rheumatoid arthritis or antibiotic-refractory Lyme arthritis
Chen et al. Identification of MHC peptides using mass spectrometry for neoantigen discovery and cancer vaccine development
Quarmby et al. MAPPs for the identification of immunogenic hotspots of biotherapeutics; an overview of the technology and its application to the biopharmaceutical arena
Pritchard et al. Exploration of peptides bound to MHC class I molecules in melanoma
Zhang et al. De novo sequencing of tryptic peptides derived from deinococcus radiodurans ribosomal proteins using 157 nm photodissociation MALDI TOF/TOF mass spectrometry
KR20030037272A (ko) 세포에 의해 제시되는 펩티드
Halgand et al. Defining intact protein primary structures from saliva: a step toward the human proteome project
Oseroff et al. Immunoproteomic analysis of house dust mite antigens reveals distinct classes of dominant T cell antigens according to function and serological reactivity
AU2019321536A1 (en) Single molecule sequencing peptides bound to the major histocompatibility complex
Wilson et al. Lost in the crowd: identifying targetable MHC class I neoepitopes for cancer immunotherapy
CN104034791A (zh) 一种基于cid与etd质谱谱图融合的多肽从头测序方法
Downard Contributions of mass spectrometry to structural immunology
Sricharoensuk et al. Unsupervised mining of HLA-I peptidomes reveals new binding motifs and potential false positives in the community database
Perez et al. Analysis of secondary structure biases in naturally presented HLA-I ligands
WO2023008321A1 (ja) スプライシングペプチドの同定方法
Gravel et al. timsTOF mass spectrometry-based immunopeptidomics refines tumor antigen identification
Marcilla et al. Proteasome-independent HLA-B27 ligands arise mainly from small basic proteins
CN113593649A (zh) 一种利用hla-i候选肽库鉴定组织中提取的天然抗原肽的方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22849383

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2023538484

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 202280052457.X

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2022849383

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2022849383

Country of ref document: EP

Effective date: 20240228

WWE Wipo information: entry into national phase

Ref document number: 18292641

Country of ref document: US