WO2023191063A1 - 遺伝子工学、細胞工学、および細胞医薬に適した細胞およびその製造方法 - Google Patents

遺伝子工学、細胞工学、および細胞医薬に適した細胞およびその製造方法 Download PDF

Info

Publication number
WO2023191063A1
WO2023191063A1 PCT/JP2023/013574 JP2023013574W WO2023191063A1 WO 2023191063 A1 WO2023191063 A1 WO 2023191063A1 JP 2023013574 W JP2023013574 W JP 2023013574W WO 2023191063 A1 WO2023191063 A1 WO 2023191063A1
Authority
WO
WIPO (PCT)
Prior art keywords
hla
sequence
region
cells
deletion
Prior art date
Application number
PCT/JP2023/013574
Other languages
English (en)
French (fr)
Inventor
康則 相澤
知幸 大野
Original Assignee
株式会社Logomix
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社Logomix filed Critical 株式会社Logomix
Publication of WO2023191063A1 publication Critical patent/WO2023191063A1/ja

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K35/00Medicinal preparations containing materials or reaction products thereof with undetermined constitution
    • A61K35/12Materials from mammals; Compositions comprising non-specified tissues or cells; Compositions comprising non-embryonic stem cells; Genetically modified cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material

Definitions

  • the present invention relates to cells suitable for genetic engineering, cell engineering, and cell medicine, and methods for producing the same.
  • Patent Document 2 discloses that a large-scale deletion of several hundred kb could be efficiently induced in two or more alleles simultaneously.
  • Patent Document 3 proposes knocking out ⁇ 2 microglobulin (B2M) in order to delete MHC class I expression and function.
  • B2M microglobulin
  • MHC-deficient cells are being developed as an effective means to deal with the problem of immune rejection, but these methods can be broadly divided into the following two types: MHC-deficient cells are destroyed by destroying molecules other than MHC. Techniques for loss of surface expression and techniques for destroying any molecules of MHC.
  • MHC locus is extremely rich in repetitive sequences, making it extremely difficult to decipher the locus using current sequencing techniques. Even if a specific part could be modified, it is difficult to analyze whether other parts of the repeat sequence are maintained or have been modified as well. Therefore, techniques that target specific genes at MHC loci cannot exclude the possibility that unpredictable modifications have occurred in the genome, making it difficult to use them for producing cells used in regenerative medicine and the like.
  • the present invention provides a cell in which a large region containing repetitive sequences that are difficult to sequence in a specific MHC region is deleted or replaced with a region that can be deciphered, and at the same time, a specific MHC gene is deleted. .
  • the present invention also provides a method for producing the cell using a genome modification method that allows for efficient modification of two or more alleles and modification of a relatively large region.
  • the cells obtained are suitable for transplantation applications or for further cell engineering applications.
  • a series of regions containing HLA-F, HLA-G, and HLA-A e.g., chr6:29,723,464-29,945,455 of the hg38 genomic sequence, preferably chr6:29,723,464) -30,010,618 (for example, a chromosomal region corresponding to the chromosomal region of chr6: 29,722,775-29,945,870, or chr6: 29,711,000-30,020,000),
  • a series of regions comprising HLA-C and HLA-B for example, chr6:31,269,169-31,357,158 of the hg38 genomic sequence, preferably chr6:31,2
  • [2A] The cell according to [1A] above, in which any or preferably all of (i) to (iv) having the deletion defined in claim 1 in the genomic DNA has an endogenous HLA and cells containing no or only one HLA-like sequence.
  • [3A] The cell according to [1A] or [2A] above, which has the deletion defined in claim 1 in the genomic DNA, or preferably all of (i) to (iv), Cells that are free of endogenous HLA and HLA-like sequences.
  • [4A] The cell according to any one of [1A] to [3A] above, (i) A series of regions containing HLA-F, HLA-G, and HLA-A (e.g., chr6:29,723,464-29,945,455 of the hg38 genomic sequence, preferably chr6:29,723,464) -30,010,618 (for example, the chromosomal region corresponding to chr6: 29,722,775-29,945,870, or chr6: 29,711,000-30,020,000) A cell having entirely deleted genomic DNA.
  • a series of regions containing HLA-F, HLA-G, and HLA-A e.g., chr6:29,723,464-29,945,455 of the hg38 genomic sequence, preferably chr6:29,723,464)
  • -30,010,618 for example, the chromosomal region corresponding to chr6: 29,722,77
  • [5A] The cell according to any one of [1A] to [4A] above, (ii) a series of regions comprising HLA-C and HLA-B (for example, chr6:31,269,169-31,357,158 of the hg38 genomic sequence, preferably chr6:31,269,169- of the hg38 genomic sequence) HLA-C and HLA-B a series of regions comprising (e.g., chr6:31,269,169-31,357,158 of the hg38 genomic sequence, preferably chr6:31,269,169-31,463,338 of the hg38 genomic sequence, e.g., chr6:31 , 268,749-31,357,179, or chr6: a chromosomal region corresponding to 31,176,000-31,534,000).
  • HLA-C and HLA-B for example, chr6:31,269,169-31,
  • [6A] The cell according to any one of [1A] to [5A] above, (iii) a series of regions comprising HLA-DRA, HLA-DRB5, and HLA-DRB1 (e.g., chr6:32,445,000-32,816,951, preferably chr6:32,439,951 of the hg38 genomic sequence) -32,817,002 chromosomal region), or genomic DNA in which the entire HLA-like sequence accumulation region in the chromosomal region corresponding to chr6: 32,445,000-32,821,000 has been deleted.
  • [7A] The cell according to any one of [1A] to [6A] above, (iv) a series of regions containing HLA-DOA, HLA-DPA1, and HLA-DPB1 (e.g., chr6:33,006,838-33,086,238 of the hg38 genomic sequence, preferably chr6:33,006, 838-33,131,199, e.g., chr6:32,934,636-33,089,696, or a chromosomal region corresponding to chr6:33,002,000-33,147,000) A cell having genomic DNA in which the entire similar sequence accumulation region has been deleted.
  • HLA-DOA HLA-DPA1
  • HLA-DPB1 e.g., chr6:33,006,838-33,086,238 of the hg38 genomic sequence, preferably chr6:33,006, 838-33,131,199, e.g., ch
  • [8A] The deletion is unique in the chromosomal region corresponding to chr6: 29,701,000-29,723,464 (e.g., Chr6: 29,709,000-29,711,000) of the hg38 genomic sequence.
  • Chr6: 29,945,455-30,030,000 of the hg38 genome sequence e.g., Chr6: 30,020,000-30,020,000 and chr6: 30,021,500-30,022,800
  • second sequence a deletion of a region having the other end in a unique sequence (second sequence) in a chromosomal region corresponding to [1A] to [7A]
  • the cell according to any one of [7A].
  • the genomic DNA contains an insertion of an endogenous or exogenous desired gene operably linked to a control sequence, the insertion is within any of the regions (i) to (iv) above, Or the cell according to any one of [1A] to [8A] above, which is located in a region other than the regions (i) to (iv) above.
  • the deletion is unique in the chromosomal region corresponding to chr6: 31,166,000 to 31,269,169 (e.g., Chr6: 31,174,000 to 31,177,000) of the hg38 genomic sequence.
  • Chr6: 31,357,158 to 31,544,000 of the hg38 genome sequence (e.g., Chr6: 31,534,000 to 31,538,000) )
  • the cell according to any one of [1A] to [9A] above, which has a deletion in a region having the other end in a unique sequence (fourth sequence) in a chromosomal region corresponding to .
  • the deletion is unique in a chromosomal region corresponding to chr6:32,416,000 to 33,445,000 (e.g., Chr6: 32,440,000 to 32,448,500) of the hg38 genomic sequence.
  • Chr6: 32,439,951-32,831,000 (e.g., Chr6: 32,820,500-32,822,500) of the hg38 genomic sequence.
  • the deletion is unique in a chromosomal region corresponding to chr6:32,924,000 to 33,006,838 (e.g., Chr6: 32,999,500 to 33,002,500) of the hg38 genomic sequence.
  • Chr6: 33,086,238-33,165,000 (e.g., Chr6: 33,147,500-33,150,500) of the hg38 genome sequence (seventh sequence) )
  • [13A] The cell according to any one of [1A] to [12A] above, wherein the cells (i) to (iv) having deletions do not have a repetitive sequence in their chromosomal region.
  • [14A] The cell according to any one of [1A] to [13A] above, which has either or both of functional ⁇ 2 microglobulin and functional CIITA.
  • [15A] The cell according to any one of [1A] to [14A] above, which does not substantially express HLA class I and/or HLA class II on the cell surface.
  • [16A] The cell according to any one of [1A] to [15A] above, wherein the deletion has a size of 100 kb to 400 kb.
  • [17A] A composition comprising the cell according to any one of [1A] to [16A] above.
  • [18A] Deletion of a region (e.g., deletion of a region of up to 1 Mb or up to 500 kb) in all alleles (two alleles in case of diploids) of the genome, which is a deletion of a region encoding an MHC molecule.
  • each MHC-similar sequence accumulation region contains only genes encoding one or less MHC molecules.
  • each MHC-similar sequence accumulation region contains only genes encoding four or less MHC molecules.
  • each MHC-similar sequence accumulation region does not contain a gene encoding an MHC molecule.
  • the deletion includes a region including the entire MHC-like sequence accumulation region of a gene locus encoding an MHC molecule.
  • the control sequence and the desired gene operably linked to the control sequence have a sequence that does not exist in nature as a whole.
  • the control sequence and the desired gene operably linked to the control sequence have naturally occurring (or endogenous) sequences.
  • (i) A series of regions containing HLA-F, HLA-G, and HLA-A e.g., chr6:29,723,464-29,945,455 of the hg38 genomic sequence, preferably chr6:29,723,464) -30,010,618 (for example, a chromosomal region corresponding to the chromosomal region of chr6: 29,722,775-29,945,870, or chr6: 29,711,000-30,020,000)
  • (ii) a series of regions comprising HLA-C and HLA-B for example, chr6:31,269,169-31,357,158 of the hg38 genomic sequence, preferably chr6:31,269,169- of the hg38 genomic sequence) 31,463,338, for example, a
  • [4B] The cell according to any one of [1B] to [3B] above, (i) A series of regions containing HLA-F, HLA-G, and HLA-A (e.g., chr6:29,723,464-29,945,455 of the hg38 genomic sequence, preferably chr6:29,723,464) -30,010,618 (for example, the chromosomal region corresponding to chr6: 29,722,775-29,945,870, or chr6: 29,711,000-30,020,000) A cell having entirely deleted genomic DNA.
  • a series of regions containing HLA-F, HLA-G, and HLA-A e.g., chr6:29,723,464-29,945,455 of the hg38 genomic sequence, preferably chr6:29,723,464)
  • -30,010,618 for example, the chromosomal region corresponding to chr6: 29,722,77
  • [5B] The cell according to any one of [1B] to [4B] above, (ii) a series of regions comprising HLA-C and HLA-B (for example, chr6:31,269,169-31,357,158 of the hg38 genomic sequence, preferably chr6:31,269,169- of the hg38 genomic sequence) HLA-C and HLA-B a series of regions comprising (e.g., chr6:31,269,169-31,357,158 of the hg38 genomic sequence, preferably chr6:31,269,169-31,463,338 of the hg38 genomic sequence, e.g., chr6:31 , 268,749-31,357,179, or chr6: a chromosomal region corresponding to 31,176,000-31,534,000).
  • HLA-C and HLA-B for example, chr6:31,269,169-31,
  • [6B] The cell according to any one of [1B] to [5B] above, (iii) a series of regions comprising HLA-DRA, HLA-DRB5, and HLA-DRB1 (e.g., chr6:32,445,000-32,816,951, preferably chr6:32,439,951 of the hg38 genomic sequence) -32,817,002 chromosomal region), or genomic DNA in which the entire HLA-like sequence accumulation region in the chromosomal region corresponding to chr6: 32,445,000-32,821,000 has been deleted.
  • [7B] The cell according to any one of [1B] to [6B] above, (iv) a series of regions containing HLA-DOA, HLA-DPA1, and HLA-DPB1 (e.g., chr6:33,006,838-33,086,238 of the hg38 genomic sequence, preferably chr6:33,006, 838-33,131,199, e.g., chr6:32,934,636-33,089,696, or a chromosomal region corresponding to chr6:33,002,000-33,147,000) A cell having genomic DNA in which the entire similar sequence accumulation region has been deleted.
  • chr6:33,006,838-33,086,238 of the hg38 genomic sequence preferably chr6:33,006, 838-33,131,199, e.g., chr6:32,934,636-33,089,696, or a chromosomal region corresponding
  • [8B] The deletion is unique in the chromosomal region corresponding to chr6: 29,701,000-29,723,464 (e.g., Chr6: 29,709,000-29,711,000) of the hg38 genomic sequence.
  • Chr6: 29,945,455-30,030,000 of the hg38 genome sequence e.g., Chr6: 30,020,000-30,020,000 and chr6: 30,021,500-30,022,800
  • second sequence a deletion of a region having the other end in a unique sequence (second sequence) in a chromosomal region corresponding to [1B] to The cell according to any one of [7B].
  • the genomic DNA contains a control sequence and an insertion of an endogenous or exogenous desired gene operably linked to the control sequence, and the insertion is any one of (i) to (iv) above.
  • the cell according to any one of [1B] to [8B] above, which is located within the region or in a region other than the regions (i) to (iv) above.
  • the deletion is unique in a chromosomal region corresponding to chr6: 31,166,000 to 31,269,169 (e.g., Chr6: 31,174,000 to 31,177,000) of the hg38 genomic sequence.
  • Chr6: 31,357,158 to 31,544,000 of the hg38 genome sequence (e.g., Chr6: 31,534,000 to 31,538,000) )
  • the cell according to any one of [1B] to [9B] above, which has a deletion in a region having the other end in a unique sequence (fourth sequence) in a chromosomal region corresponding to. [11B]
  • the deletion is unique in a chromosomal region corresponding to chr6:32,416,000 to 33,445,000 (e.g., Chr6: 32,440,000 to 32,448,500) of the hg38 genomic sequence.
  • Chr6: 32,439,951-32,831,000 (e.g., Chr6: 32,820,500-32,822,500) of the hg38 genomic sequence.
  • Chr6: 33,086,238-33,165,000 (e.g., Chr6: 33,147,500-33,150,500) of the hg38 genome sequence (seventh sequence) )
  • [13B] The cell according to any one of [1B] to [12B] above, which has a deletion (i) to (iv), has a repetitive sequence in its chromosomal region. No, cells.
  • [14B] The cell according to any one of [1B] to [13B] above, which has either or both of functional ⁇ 2 microglobulin and functional CIITA.
  • [15B] The cell according to any one of [1B] to [14B] above, which does not substantially express HLA class I and/or HLA class II on the cell surface.
  • [16B] The cell according to any one of [1B] to [15B] above, wherein the deletion has a size of 100 kb to 400 kb.
  • [17B] A composition comprising the cell according to any one of [1B] to [16B] above.
  • [1C] A cell containing genomic DNA having a deletion, the deletion being in a chromosomal region defined in (i) to (iv) below: (i) A series of regions containing HLA-F, HLA-G, and HLA-A (e.g., chr6:29,723,464-29,945,455 of the hg38 genomic sequence, preferably chr6:29,723,464) -30,010,618 (for example, a chromosomal region corresponding to the chromosomal region of chr6: 29,722,775-29,945,870, or chr6: 29,711,000-30,020,000), (ii) a series of regions comprising HLA-C and HLA-B (for example, chr6:31,269,169-31,357,158 of the hg38 genomic sequence, preferably chr6:31,269,169- of the hg38 genomic sequence) 31,463,338, for example,
  • the selection marker gene for negative selection contained in the first cassette and the one or more selection marker genes for negative selection contained in the second cassette are distinguishably different from each other. After the cassette or the second cassette is further modified to be removed or replaced with another sequence, the non-expression of the selection marker gene for negative selection contained in the first cassette or the second cassette is used as an indicator. Cells having modifications in the cassette or in the second cassette can be selected; cell.
  • [2C] A cell containing genomic DNA having a deletion, the deletion being in a chromosomal region defined in (i) to (iv) below: (i) A series of regions containing HLA-F, HLA-G, and HLA-A (e.g., chr6:29,723,464-29,945,455 of the hg38 genomic sequence, preferably chr6:29,723,464) -30,010,618 (for example, a chromosomal region corresponding to the chromosomal region of chr6: 29,722,775-29,945,870, or chr6: 29,711,000-30,020,000), (ii) a series of regions comprising HLA-C and HLA-B (for example, chr6:31,269,169-31,357,158 of the hg38 genomic sequence, preferably chr6:31,269,169- of the hg38 genomic sequence) 31,463,338, for example,
  • the first allele is a foreign allele encoding any one, two, three, or all selected from the group consisting of HLA-A, HLA-B, HLA-C, and HLA-E.
  • the foreign target gene is a foreign gene encoding any one, two, three, or all selected from the group consisting of HLA-A, HLA-B, HLA-C, and HLA-E.
  • the cell according to [3C] above, which contains the gene and the foreign target gene is contained in the first allele or the second allele, respectively.
  • each of the foreign genes further comprises a sequence upstream of the transcription start point of the coding region of the gene, an intron, and a sequence downstream of a stop codon.
  • 7C The cell according to [3C] or [5C] above, wherein each of the foreign genes further comprises a sequence upstream of the transcription start point of the coding region of the gene, an intron, and a sequence downstream of a stop codon.
  • 8C The cell according to [6C] above, wherein the upstream sequence has a length of 1 kbp or more.
  • [9C] The cell according to [7C] above, wherein the upstream sequence has a length of 1 kbp or more.
  • [10C] A composition comprising the cell according to any one of [1C] to [9C] above.
  • [11C] A composition for use in analyzing the expression and/or function of the foreign gene, which contains the cell according to any one of [2C] to [9C] above.
  • a genome modification method of modifying two or more alleles of a chromosomal genome at an MHC gene locus (particularly a method of modifying two or more alleles of a chromosomal genome to delete a specific gene group), (a) introducing the following (i) and (ii) into cells containing the chromosome; (i) a genome modification system comprising a sequence-specific nucleic acid cleaving molecule targeting a target region of the chromosomal genome or a polynucleotide encoding the sequence-specific nucleic acid cleaving molecule; (ii) between an upstream homology arm having a base sequence homologous to the base sequence adjacent to the upstream side of the target region and a downstream homology arm having a base sequence homologous to the base sequence adjacent to the downstream side of the target region; , two or more types of selection marker donor DNAs containing base sequences of selection marker genes, wherein the two or more types
  • step (b) is a step of selecting cells that express the same number of positive selection marker genes as the number of alleles.
  • Genome modification method [3] The genome modification method according to [2], wherein the selection marker donor DNA further has a negative selection marker gene between the upstream homology arm and the downstream homology arm.
  • step (c) After step (b), an upstream homology arm having a base sequence homologous to the base sequence adjacent to the upstream side of the target region, and a base sequence homologous to the base sequence adjacent to the downstream side of the target region.
  • a genome modification kit for modifying two or more alleles of a chromosomal genome including the following (i) and (ii).
  • a genome modification system comprising a sequence-specific nucleic acid cleaving molecule targeting the target region of the chromosomal genome or a polynucleotide encoding the sequence-specific nucleic acid cleaving molecule (ii) between an upstream homology arm having a base sequence homologous to the base sequence adjacent to the upstream side of the target region and a downstream homology arm having a base sequence homologous to the base sequence adjacent to the downstream side of the target region; , two or more types of selection marker donor DNAs containing base sequences of selection marker genes, wherein the two or more types of selection marker donor DNAs have mutually different selection marker genes; Two or more types of donor DNA for selection marker, wherein the number of types of donor DNA is the same or more than the number of alleles targeted for genome modification.
  • the selection marker donor DNA further has a negative selection marker gene between the upstream homology arm and the downstream homology arm.
  • the sequence-specific nucleic acid cleaving molecule is a sequence-specific endonuclease.
  • the genome modification system includes a Cas protein and a guide RNA having a base sequence homologous to the base sequence within the target region. modification kit.
  • a method for producing cells in which two or more alleles of the chromosomal genome have been modified (a) introducing the following (i) and (ii) into cells containing two or more alleles, and introducing a selection marker gene into each of the two or more alleles; (i) a sequence-specific nucleic acid cleaving molecule capable of targeting and cleaving a target region in two or more alleles of said chromosomal genome, or a polynucleotide encoding said sequence-specific nucleic acid cleaving molecule; genome modification systems, including; (ii) two or more types of donor DNA for selection markers, each of which has an upstream homology arm having a base sequence capable of homologous recombination with the base sequence upstream of the target region; and a base sequence downstream of the target region; and a downstream homology arm having a base sequence capable of homologous recombination with the sequence, and containing the
  • the DNAs each have selectable marker genes that are distinguishable from each other, and the selectable marker genes are unique for each type of selectable marker donor DNA, and the number of types of selectable marker donor DNA is determined by the number of types of selectable marker donor DNA.
  • Two or more selection marker donor DNAs the number of which is the same or more than the number of target alleles, (b) After the step (a), different types of selection marker donor DNAs undergo homologous recombination with the two or more alleles, thereby providing distinguishably different unique selection markers to the two or more alleles.
  • a step of introducing the gene and selecting cells that express all of the introduced distinguishably different selection marker genes (step for positive selection); including methods.
  • a method of modifying two or more alleles of a chromosomal genome comprising: (a) introducing the following (i) and (ii) into cells containing two or more alleles, and introducing a selection marker gene into each of the two or more alleles; (i) a sequence-specific nucleic acid cleaving molecule capable of targeting and cleaving a target region in two or more alleles of said chromosomal genome, or a polynucleotide encoding said sequence-specific nucleic acid cleaving molecule; genome modification systems, including; (ii) two or more types of donor DNA for selection markers, each of which has an upstream homology arm having a base sequence capable of homologous recombination with the base sequence upstream of the target region; and a base sequence downstream of the target region; and a downstream homology arm having a base sequence capable of homologous recombination with the sequence, and containing the base sequence of a selection marker gene between the up
  • the DNAs each have selectable marker genes that are distinguishable from each other, and the selectable marker genes are unique for each type of selectable marker donor DNA, and the number of types of selectable marker donor DNA is determined by the number of types of selectable marker donor DNA.
  • Two or more selection marker donor DNAs the number of which is the same or more than the number of target alleles, (b) After the step (a), different types of selection marker donor DNAs undergo homologous recombination with the two or more alleles, thereby providing distinguishably different unique selection markers to the two or more alleles.
  • a step of introducing the gene and selecting cells that express all of the introduced distinguishably different selection marker genes (step for positive selection); including methods.
  • Two or more types of selection marker donor DNA each have a selection marker gene for positive selection, a marker gene for negative selection, and a target sequence between the upstream homology arm and the downstream homology arm, Here, if the selection marker gene is used for both positive selection and negative selection, it is not necessary to have another selection marker gene for negative selection, (c) After the step (b), introducing the following (iii) and (iv) into the selected cells to introduce recombinant donor DNA into the two or more alleles; (iii) a genome modification system comprising a sequence-specific nucleic acid cleaving molecule that targets and can cleave the target sequence, or a polynucleotide encoding the sequence-specific nucleic acid cleaving molecule; (iv) An upstream homology arm having a donor DNA for recombination containing a desired base sequence and having a base sequence capable of homologous recombination with the base sequence upstream of the target region, and a base downstream of
  • a genome modification system comprising a sequence-specific nucleic acid cleaving molecule capable of targeting and cleaving the target region of the chromosomal genome, or a polynucleotide encoding the sequence-specific nucleic acid cleaving molecule;
  • two or more types of donor DNA for selection markers including an upstream homology arm having a base sequence capable of homologous recombination with the base sequence upstream of the target region; and a base sequence downstream of the target region; It has a downstream homology arm having a base sequence capable of homologous recombination, and includes a base sequence of a selection marker gene between the upstream homology arm and the downstream homology arm, and the two or more types of selection marker donor DNAs are mutually It has distinguishably different selection marker genes, the selection marker genes are unique for each type of selection marker donor DNA, and the number of types of selection marker donor DNA is determined by the number of types of the selection marker donor DNA that is the target of genome modification.
  • Two or more types of donor DNA for selection markers the number of which is the same or greater than the number.
  • the target region has a length of 8 kbp or more.
  • the kit according to any one of [12] to [15] above, wherein the region between the upstream homology arm and the downstream homology arm of the donor DNA for recombination has a length of 5 kbp or more.
  • the target region has a length of 5 kbp or more, and the region between the upstream homology arm and the downstream homology arm of the donor DNA for recombination has a length of 5 kbp or more. Kit as described.
  • the target region has a length of 8 kbp or more, and the region between the upstream homology arm and the downstream homology arm of the donor DNA for recombination has a length of 8 kbp or more.
  • the donor DNA for recombination does not have a base sequence in the region between the upstream homology arm and the downstream homology arm of the donor DNA for recombination, and in the two or more alleles of the chromosomal genome obtained after modification. , the method according to [5] above, wherein the sequences upstream and downstream of the target region are seamlessly linked without insertion, substitution, or deletion of bases.
  • the donor DNA for recombination does not have a base sequence in the region between the upstream homology arm and the downstream homology arm of the donor DNA for recombination, and in the two or more alleles of the chromosomal genome obtained after modification.
  • the method according to [6] or [7] above wherein the upstream and downstream sequences of the target region are seamlessly linked without insertion, substitution, or deletion of bases.
  • [22] The method according to [3] above, wherein the target sequence of the site-specific recombinase is not present in the two or more alleles of the chromosomal genome obtained after modification.
  • [23] The method according to [4] above, wherein the target sequence of the site-specific recombinase is not present in the two or more alleles of the chromosomal genome obtained after modification.
  • step (b) single cell cloning is not performed in the process up to selecting cells in which two or more alleles have been modified, the above [1] to [11] and [20] to [25] ] method described in any of the above.
  • the target region of each of the two or more alleles is deleted, and the sequences upstream and downstream of the target region are Cells that are seamlessly connected, without insertions, substitutions, or deletions.
  • Chr6 of hg38 genome sequence Chromosome region corresponding to chromosomal region 29,711,000-30,020,000
  • chr6 of hg38 genome sequence Corresponding to chromosomal region 31,176,000-31,534,000
  • chr6 of the hg38 genome sequence 33,002,000-33, Deletion of a region containing part or all of an HLA-like sequence accumulation region located in one or more chromosomal regions selected from the group consisting of chromosomal regions corresponding to 147,000 chromoso
  • a cell comprising 50% or more of genes selected from the group consisting of HLA-encoding genes and HLA-like sequences.
  • [2D] The cell according to [1D] above, in which any or preferably all of (i) to (iv) having the deletion defined in claim 1 in the genomic DNA has an endogenous HLA and cells containing no or only one HLA-like sequence.
  • [3D] The cell according to [1D] or [2D] above, which has the deletion defined in claim 1 in the genomic DNA, or preferably all of (i) to (iv), Cells that are free of endogenous HLA and HLA-like sequences.
  • [4D] The cell according to any one of [1D] to [3D] above, wherein (i) chr6: the entire HLA-like sequence accumulation region in the chromosomal region 29,711,000-30,020,000 A cell having genomic DNA deleted.
  • [5D] The cell according to any one of [1D] to [4D] above, wherein (ii) the entire HLA-like sequence accumulation region in the chromosomal region of chr6: 31,176,000-31,534,000 A cell having genomic DNA deleted.
  • [6D] The cell according to any one of [1D] to [5D] above, wherein (iii) chr6: the entire HLA-like sequence accumulation region in the chromosomal region 32,445,000-32,821,000 A cell having genomic DNA deleted.
  • [7D] The cell according to any one of [1D] to [6D] above, wherein (iv) chr6: the entire HLA-like sequence accumulation region in the chromosomal region 33,002,000-33,147,000 A cell having genomic DNA deleted.
  • [8D] The deletion has one end in a unique sequence (first sequence) in the chromosomal region of Chr6: 29,709,000-29,711,000, Chr6: 30,020, 000-30,020,000 chromosomal region and Chr6: Deletion of a region with the other end in a unique sequence (second sequence) in the 30,021,500-30,022,800 chromosomal region
  • the cell according to any one of [1D] to [7D] above.
  • the genomic DNA contains an insertion of an endogenous or exogenous desired gene operably linked to a control sequence, and the insertion is in any region of (i) to (iv) above.
  • the cell according to any one of [1D] to [8D] above which is located within or in a region other than the regions (i) to (iv) above.
  • the deletion has one end in a unique sequence (third sequence) in the chromosomal region of Chr6: 31,174,000 to 31,177,000, and Chr6: 31,534,
  • the deletion has one end in a unique sequence (fifth sequence) in the chromosomal region of Chr6: 32,446,000 to 32,448,500, and Chr6: 32,820,
  • the cell according to any one of [1D] to [10D] above, which is a deletion of a region having the other end in a unique sequence (sixth sequence) in a chromosomal region of 500 to 32,822,500. .
  • [12D] The deletion has one end in a unique sequence (seventh sequence) in the chromosomal region of Chr6: 32,999,500 to 33,002,500, and Chr6: 33,147,
  • [13D] The cell according to any one of [1D] to [12D] above, wherein the cells (i) to (iv) having deletions do not have a repetitive sequence in their chromosomal region.
  • [14D] The cell according to any one of [1D] to [13D] above, which has either or both of functional ⁇ 2 microglobulin and functional CIITA.
  • [15D] The cell according to any one of [1D] to [14D] above, which does not substantially express HLA class I and/or HLA class II on the cell surface.
  • [16D] The cell according to any one of [1D] to [15D] above, wherein the deletion has a size of 100 kb to 400 kb.
  • [17D] A composition comprising the cell according to any one of [1D] to [16D] above.
  • [18D] Deletion of a region (e.g., deletion of a region of up to 1 Mb or up to 500 kb) in all alleles (two alleles in the case of diploids) of the genome, which is a deletion of a region encoding an MHC molecule.
  • each MHC-similar sequence accumulation region contains only genes encoding one or less MHC molecules.
  • each MHC-similar sequence accumulation region contains only genes encoding four or less MHC molecules.
  • each MHC-similar sequence accumulation region does not contain a gene encoding an MHC molecule.
  • the deletion includes a region including the entire MHC-like sequence accumulation region of a gene locus encoding an MHC molecule.
  • the control sequence and the desired gene operably linked to the control sequence have a sequence that does not exist in nature as a whole.
  • the control sequence and the desired gene operably linked to the control sequence have naturally occurring (or endogenous) sequences.
  • genome modification can efficiently modify two or more alleles, and can modify a relatively large region (especially large-scale deletion of the HLA class I region and HLA class II region).
  • Methods and kits for modifying the genome, as well as cells having the modifications are provided.
  • FIG. 1 is a genetic map of the chromosome 6 region where the HLA class I region and HLA class II region are present. Clusters containing HLA genes are highlighted with arrows.
  • FIG. 2 shows the search results for similar sequences of the HLA-A gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 3 shows the search results for similar sequences of the HLA-B gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 4 shows the search results for similar sequences of the HLA-C gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 1 is a genetic map of the chromosome 6 region where the HLA class I region and HLA class II region are present. Clusters containing HLA genes are highlighted with arrows.
  • FIG. 2 shows the search results for similar sequences of the HLA-A gene in the chromosome 6 region
  • FIG. 5 shows the search results for similar sequences of the HLA-E gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 6 shows the search results for similar sequences of the HLA-F gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 7 shows the search results for similar sequences of the HLA-G gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 8 shows the search results for similar sequences of the HLA-H gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 9 shows the search results for similar sequences of the HLA-J gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 10 shows the search results for similar sequences of the HLA-W gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 11 shows the search results for similar sequences of the MICA gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 12 shows the search results for similar sequences of the MICB gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 13 shows the search results for similar sequences of the HLA-DRA gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 14 shows the search results for similar sequences of the HLA-DRB1 gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 15 shows the search results for similar sequences of the HLA-DRB5 gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 16 shows the search results for similar sequences of the HLA-DRB6 gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 17 shows the search results for similar sequences of the HLA-DRB9 gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 18 shows the search results for similar sequences of the HLA-DQA1 gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 19 shows the search results for similar sequences of the HLA-DQA2 gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 20 shows the search results for similar sequences of the HLA-DQB1 gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 21 shows the search results for similar sequences of the HLA-DPA1 gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 22 shows the search results for similar sequences of the HLA-DPB1 gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 23 shows the search results for similar sequences of the HLA-DMB gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 24 shows the search results for similar sequences of the HLA-DOA gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 25 shows the search results for similar sequences of the HLA-DOB gene in the chromosome 6 region where the HLA class I region and HLA class II region are present.
  • FIG. 26 shows the positions of four HLA similar sequence (sequence) accumulation regions (i) to (iv) in the HLA class I region and HLA class II region.
  • FIG. 27 shows an example of Blat search results for identifying telomere-side end candidates of the HLA-similar sequence accumulation region (i).
  • FIG. 28 shows an example of Blat search results for identifying centromere-side terminal candidates of the HLA-similar sequence accumulation region (i).
  • FIG. 29 shows an example of Blat search results for identifying telomere-side end candidates of the HLA-similar sequence accumulation region (ii).
  • FIG. 30 shows an example of Blat search results for identifying centromere-side terminal candidates of the HLA similar sequence accumulation region (ii).
  • FIG. 31 shows an example of Blat search results for identifying telomere-side end candidates of the HLA-similar sequence accumulation region (iii).
  • FIG. 32 shows an example of Blat search results for identifying centromere-side terminal candidates of the HLA-similar sequence accumulation region (iii).
  • FIG. 33 shows an example of Blat search results for identifying telomere-side end candidates of the HLA-similar sequence accumulation region (iv).
  • FIG. 34 shows an example of Blat search results for identifying centromere-side terminal candidates of the HLA-similar sequence accumulation region (iv).
  • FIG. 35 shows a summary of the results of FIGS. 27-34.
  • FIG. 36 shows a scheme of a method for removing the entire series of regions including HLA-F, HLA-G, and HLA-A by the method of the present disclosure, and the results thereof.
  • FIG. 37 shows a scheme of a method for removing the entire series of regions including HLA-C and HLA-B by the method of the present disclosure, and the results thereof.
  • the resulting cells are deficient in HLA-F, HLA-G, and HLA-A, as well as HLA-C and HLA-B.
  • FIG. 38 is a cytogram showing that the obtained cells are negative for all HLA-A, HLA-B, and HLA-C.
  • Figure 39 shows that the resulting cells exhibit expression of pluripotent stem cell markers comparable to unmodified iPS cells.
  • FIG. 37 shows a scheme of a method for removing the entire series of regions including HLA-F, HLA-G, and HLA-A by the method of the present disclosure, and the results thereof.
  • the resulting cells are
  • FIG. 40 shows a scheme of a method for further deleting the HLA-E region and its results.
  • FIG. 41 shows a scheme of a method for further deleting the HLA-E region and its results.
  • Figure 42 shows a scheme for introducing HLA-E to which a signal sequence has been added instead of HLA-E, and the results thereof.
  • FIG. 43 shows a scheme and results of how the entire series of regions including HLA-DRA, HLA-DRBs, HLA-DQAs, HLA-DQB1, and HLA-DOB are further removed by the method of the present disclosure.
  • FIG. 44 shows a scheme and results of how the entire series of regions including HLA-DRA, HLA-DRBs, HLA-DQAs, HLA-DQB1, and HLA-DOB are further removed by the method of the present disclosure.
  • FIG. 45 shows a scheme for introducing any desired gene into a region having an HLA-E deletion.
  • FIG. 46 shows a scheme for introducing foreign genes (eg, HLA-A, HLA-B, HLA-C, and HLA-E) into a defective site of HLA-E.
  • Figure 47 shows cells in which a series of regions containing HLA-F, HLA-G, and HLA-A and a series of regions containing HLA-C and HLA-B have been deleted, with HLA-E replaced with the UKiS marker.
  • a scheme for integrating HLA-A and B into the obtained cells and its results are shown.
  • Figure 48 shows HLA-E in cells in which a series of regions containing HLA-F, HLA-G, and HLA-A and a series of regions containing HLA-C and HLA-B have been deleted (see Figure 37).
  • a scheme for integrating HLA-C and E into cells obtained by replacing the UKiS marker with the UKiS marker and its results are shown.
  • Figure 49 shows cell surface expression of HLA in cells reintroduced with HLA-A and B (see Figure 47) and cells reintroduced with HLA-C and E (see Figure 48).
  • Figure 50 shows that HLA-deficient cells evade cytotoxicity by T cells.
  • polynucleotide and nucleic acid are used interchangeably and refer to a nucleotide polymer in which nucleotides are linked by phosphodiester bonds.
  • Polynucleotide and nucleic acid may be DNA, RNA, or a combination of DNA and RNA.
  • polynucleotide and nucleic acid may be polymers of natural nucleotides, and include natural nucleotides and non-natural nucleotides (analogs of natural nucleotides, at least one part of a base part, a sugar part, and a phosphate part). may be a polymer with a modified nucleotide (for example, a phosphorothioate skeleton), or a polymer with a non-natural nucleotide.
  • nucleic acid The base sequence of a "polynucleotide” or “nucleic acid” is described by a generally accepted one-letter code, unless otherwise specified. Unless otherwise specified, base sequences are written from the 5' side to the 3' side. Nucleotide residues constituting a "polynucleotide” or “nucleic acid” may be simply described as adenine, thymine, cytosine, guanine, or uracil, or their one-letter code.
  • gene refers to a polynucleotide that contains at least one open reading frame that encodes a specific protein. Genes can contain both exons and introns.
  • polypeptide refers to a polymer of amino acids linked by amide bonds.
  • a “polypeptide”, “peptide” or “protein” may be a polymer of natural amino acids or a polymer of natural amino acids and unnatural amino acids (chemical analogs, modified derivatives, etc. of natural amino acids). It may also be a polymer of unnatural amino acids. Unless otherwise specified, amino acid sequences are written from the N-terminus to the C-terminus.
  • allele refers to a set of base sequences that exist at the same locus on a chromosomal genome. In one embodiment, two alleles exist at the same locus in diploid cells, and three alleles exist at the same locus in triploid cells. Also, in some embodiments, additional alleles may be formed by aberrant copies of the chromosome or aberrant additional copies of the locus.
  • Genome modification can involve the use of sequence-specific nucleic acid cleaving molecules designed to cleave target region DNA.
  • genome modification may involve the use of a nuclease engineered to cut the DNA in the target region.
  • genome modification may involve the use of a nuclease (eg, TALEN or ZFN) engineered to cleave a target sequence having a specific base sequence in the target region.
  • genome modification is performed using a restriction enzyme that has only one cleavage site in the genome, such as a meganuclease (e.g., a 16-base sequence) to cleave a target sequence with a specific base sequence in the target region.
  • a restriction enzyme that has only one cleavage site in the genome, such as a meganuclease (e.g., a 16-base sequence) to cleave a target sequence with a specific base sequence in the target region.
  • Restriction enzymes with specificity (theoretically present in 1 in 4 16 bases)
  • restriction enzymes with sequence specificity of 17 bases theoretically present in 1 in 4 17 bases
  • 18 Sequence-specific endonucleases such as restriction enzymes with base sequence specificity (theoretically present in 1 in 4 18 bases), may be used.
  • DSBs double-strand breaks
  • HDR homologous directed repair
  • non-homologous end rejoining non-homologous end rejoining
  • Genomes are repaired by endogenous processes of the cell, such as homologous end-joining repair (NHEJ).
  • NHEJ is a repair method that joins the ends of double-strand breaks without using donor DNA, and insertions and/or deletions (indels) are frequently induced during repair.
  • HDR is a repair mechanism that uses donor DNA, and it is also possible to introduce desired mutations into target regions.
  • a preferred example of the genome modification technology is the CRISPR/Cas system.
  • meganucleases examples include I-SceI, I-SceII, I-SceIII, I-SceIV, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAIIP, I-CreI, and I-CrepsbIP.
  • a nuclease and its cleavage site preferably a meganuclease, which is a restriction enzyme with sequence specificity of 18 bases or more, and its cleavage site (or recognition site), especially one or more sites in the genome of a cell.
  • Non-cleaving meganucleases and their cleavage sites can be used.
  • target region refers to a genomic region that is targeted for genome modification.
  • “Deletion” includes deletion of one or more bases relative to the reference genome and deletion of one or more genes. Deletion includes deletion of 100bp or more, deletion of 200bp or more, deletion of 300bp or more, deletion of 400bp or more, deletion of 500bp or more, deletion of 600bp or more, deletion of 700bp or more, deletion of 800bp or more.
  • deletion deletion of 900 bp or more, deletion of 1 kbp or more, deletion of 10 kbp or more, deletion of 50 kbp or more, deletion of 100 kbp or more, deletion of 200 kbp or more, deletion of 300 kbp or more, deletion of 400 kbp or more, It can be a deletion of 500 kbp or more, or a deletion of 1 Mbp or more or less.
  • the deletion can be a deletion of 1 Mbp or less.
  • the deletion can be a deletion of 700 kbp or less.
  • the deletion may be a deletion of 600 kbp or less.
  • the deletion can be a deletion of 500 kbp or less.
  • the deletion may be a deletion of 10 kbp or more and 600 kbp or less.
  • the deletion may be a deletion of 100 kbp or more and 600 kbp or less.
  • the deletion may be a deletion of 100 kbp or more and 500 kbp or less.
  • the term "donor DNA” refers to DNA that is used to repair double-strand breaks in DNA and is capable of homologous recombination with DNA surrounding the target region.
  • the donor DNA includes a base sequence upstream of the target region and a base sequence downstream (for example, a base sequence adjacent to the target region) as homology arms.
  • a homology arm consisting of a base sequence on the upstream side of a target region e.g., a base sequence adjacent to the upstream side
  • an upstream homology arm a homology arm consisting of a base sequence on the downstream side of a target sequence
  • upstream homology arm a homology arm consisting of a base sequence on the downstream side of a target sequence
  • a homology arm consisting of adjacent base sequences may be referred to as a "downstream homology arm.”
  • the donor DNA can include a desired base sequence between the upstream homology arm and the downstream homology arm.
  • the length of each homology arm is preferably 300 bp or more, and usually about 500 to 3000 bp.
  • the lengths of the upstream homology arm and the downstream homology arm may be the same or different.
  • Upstream of the target region means a DNA region located on the 5' side of the reference nucleotide chain in the double-stranded DNA of the target region.
  • Downstream of the target region refers to DNA located on the 3' side of the reference nucleotide chain.
  • the reference nucleotide strand is usually the sense strand.
  • a promoter is located upstream of a protein coding sequence. Terminators are located downstream of protein coding sequences.
  • sequence-specific nucleic acid cleaving molecule refers to a molecule that recognizes a specific nucleic acid sequence and is capable of cleaving the nucleic acid at said specific nucleic acid sequence.
  • a sequence-specific nucleic acid cleaving molecule is a molecule having sequence-specific nucleic acid cleaving activity (sequence-specific nucleic acid cleaving activity).
  • target sequence refers to a DNA sequence in a genome that is targeted for cleavage by a sequence-specific nucleic acid cleavage molecule.
  • sequence-specific nucleic acid cleavage molecule is a Cas protein
  • the target sequence refers to a DNA sequence in the genome that is targeted for cleavage by the Cas protein.
  • Cas9 protein as the Cas protein
  • the target sequence needs to be a sequence adjacent to the 5' side of the protospacer adjacent motif (PAM).
  • PAM protospacer adjacent motif
  • a known design tool such as CRISPR DESIGN (crispr.mit.edu/) can be used to design the target sequence.
  • Cas protein refers to CRISPR-associated proteins.
  • the Cas protein forms a complex with the guide RNA and exhibits endonuclease or nickase activity.
  • Examples of the Cas protein include, but are not limited to, Cas9 protein, Cpf1 protein, C2c1 protein, C2c2 protein, and C2c3 protein.
  • Cas proteins include wild-type Cas proteins and their homologs (paralogs and orthologs), as well as variants thereof, as long as they exhibit endonuclease activity or nickase activity in cooperation with guide RNA.
  • the Cas protein is one that is involved in a class 2 CRISPR/Cas system, more preferably one that is involved in a type II CRISPR/Cas system.
  • a preferred example of Cas protein is Cas9 protein.
  • a preferred example of Cas protein is Cas3 protein.
  • Cas9 protein refers to the Cas protein involved in the type II CRISPR/Cas system. Cas9 protein forms a complex with a guide RNA and exhibits an activity of cleaving DNA in a target region in cooperation with the guide RNA. Cas9 proteins include wild-type Cas9 proteins, their homologs (paralogs and orthologs), and variants thereof, as long as they have the above-mentioned activity. Although the wild-type Cas9 protein has a RuvC domain and a HNH domain as nuclease domains, the Cas9 protein herein may be one in which either the RuvC domain or the HNH domain is inactivated.
  • Cas9 in which either the RuvC domain or the HNH domain is inactivated introduces a single-strand break (nick) into double-stranded DNA. Therefore, when using Cas9 in which either the RuvC domain or the HNH domain is inactivated to cleave double-stranded DNA, the target sequence of Cas9 is set for each of the sense strand and the antisense strand, and the sense The engineered system can be configured such that the strand and antisense differential nicks occur in close enough proximity to induce a double-strand break.
  • the biological species from which the Cas9 protein is derived is not particularly limited, but preferred examples include bacteria belonging to the genus Streptococcus, genus Staphylococcus, genus Neisseria, or genus Treponema. More specifically, S. pyogenes, S. thermophilus, S. aureus, N. meningitidis, or T. meningitidis.
  • a preferred example is Cas9 protein derived from P. denticola and the like.
  • the Cas9 protein is derived from S. It is a Cas9 protein derived from S. pyogenes.
  • guide RNA and "gRNA” are used interchangeably and refer to an RNA that can form a complex with a Cas protein and direct the Cas protein to a target region.
  • the guide RNA includes CRISPR RNA (crRNA) and transactivating CRISPR RNA (tracrRNA).
  • crRNA is involved in binding to a target region on the genome, and tracrRNA is involved in binding to Cas protein.
  • the crRNA includes a spacer sequence and a repeat sequence, and the spacer sequence binds to the complementary strand of the target sequence in the target region.
  • the tracrRNA includes an anti-repeat sequence and a 3' tail sequence.
  • the anti-repeat sequence has a complementary sequence to the repeat sequence of crRNA and forms base pairs with the repeat sequence, and the 3' tail sequence usually forms three stem loops.
  • the guide RNA may be a single guide RNA (sgRNA) in which the 5' end of tracrRNA is linked to the 3' end of crRNA, and crRNA and tracrRNA are separate RNA molecules, and base pairs are formed in a repeat sequence and an anti-repeat sequence. It may be formed by forming.
  • the guide RNA is sgRNA.
  • the repeat sequence of crRNA and the sequence of tracrRNA can be appropriately selected depending on the type of Cas protein, and those derived from the same bacterial species as the Cas protein can be used.
  • the length of the sgRNA can be about 50 to 220 nucleotides (nt), preferably about 60 to 180 nt, and more preferably about 80 to 120 nt.
  • the length of crRNA, including the spacer sequence can be about 25 to 70 bases, preferably about 25 to 50 nt.
  • the length of tracrRNA can be about 10 to 130 nt, preferably about 30 to 80 nt.
  • the repeat sequence of crRNA may be the same as that in the bacterial species from which the Cas protein is derived, or may have a portion of the 3' end deleted.
  • the tracrRNA may have the same sequence as the mature tracrRNA in the bacterial species from which the Cas protein is derived, or may be a truncated version of the mature tracrRNA obtained by truncating the 5' end and/or the 3' end.
  • tracrRNA can be a truncated version of mature tracrRNA, with about 1 to 40 nucleotide residues removed from the 3' end.
  • tracrRNA can be a truncated form in which about 1 to 80 nucleotide residues are removed from the 5' end of mature tracrRNA. Further, tracrRNA may be a truncated type in which, for example, about 1 to 20 nucleotide residues are removed from the 5' end and about 1 to 40 nucleotide residues are removed from the 3' end.
  • crRNA repeat sequences and tracrRNA sequences for sgRNA design have been proposed, and those skilled in the art can design sgRNA based on known techniques (for example, Jinek et al. (2012) Science, 337, 816-21; Mali et al.
  • PAM protospacer adjacent motif
  • the sequence and location of PAM differ depending on the type of Cas protein. For example, in the case of the Cas9 protein, the PAM needs to be immediately adjacent to the 3' side of the target sequence.
  • the sequence of PAM corresponding to Cas9 protein differs depending on the bacterial species from which the Cas9 protein is derived. For example, S.
  • the PAM corresponding to the S. pyogenes Cas9 protein is “NGG”
  • the PAM corresponding to the Cas9 protein of S. thermophilus is “NNAGAA”
  • NGRRT or “NNGRR(N)”
  • the PAM corresponding to the Cas9 protein of T. meningitidis is “NNNNNGATT”, and the PAM corresponding to the Cas9 protein of T. "NAAAAC” corresponds to Cas9 protein of S. denticola ("R” is A or G; “N” is A, T, G or C).
  • spacer sequence and "guide sequence” are used interchangeably and refer to a sequence contained in a guide RNA that is capable of binding to the complementary strand of a target sequence.
  • the spacer sequence is the same sequence as the target sequence (however, T in the target sequence becomes U in the spacer sequence).
  • the spacer sequence can include a single or multiple base mismatch to the target sequence. When multiple base mismatches are included, the mismatches may be at adjacent positions or may be at distant positions.
  • the spacer sequence may contain a 1-5 base mismatch to the target sequence. In particularly preferred embodiments, the spacer sequence may contain a single base mismatch to the target sequence.
  • a spacer sequence is placed on the 5' side of the crRNA.
  • operably linked means that a first base sequence is located sufficiently close to a second base sequence that the first base sequence is connected to the second base sequence or the second base sequence. means that it can affect areas under its control.
  • a polynucleotide operably linked to a promoter means that the polynucleotide is linked such that it is expressed under the control of the promoter.
  • the term “expressable state” refers to a state in which a polynucleotide is able to be transcribed within a cell into which the polynucleotide has been introduced.
  • expression vector refers to a vector that contains a polynucleotide of interest and is equipped with a system that allows the polynucleotide of interest to be expressed in cells into which the vector has been introduced.
  • expression vector for Cas protein means a vector capable of expressing Cas protein in cells into which the vector has been introduced.
  • guide RNA expression vector refers to a vector that can express guide RNA in cells into which the vector has been introduced.
  • HLA-like sequence refers to a nucleotide sequence that is connected to at least one HLA gene and has an Identity value of 80% or more derived from a BLAT search installed in the UCSC Genome Browser. In the HLA gene locus, there is a region where HLA and HLA-like sequences are accumulated, and this is called an HLA-like sequence accumulation region.
  • MHC-like sequence refers to a continuous base sequence that exhibits at least one MHC gene and an Identity value of 80% or more derived from a BLAT search installed in the UCSC Genome Browser. At the MHC gene locus, there is a region where MHC and MHC-like sequences are accumulated, and this is called an MHC-like sequence accumulation region.
  • unique sequence means a unique sequence for which there is no other similar sequence, and specifically, a sequence with an Identity value of 80% or more by BLAT search for its entire length is a unique sequence. means a sequence that exists only at one location on the genome. It is more preferable that the unique sequence has an Identity value of 75% or more by BLAT search, and is a sequence that exists only at one location on the genome having the unique sequence, and has an Identity value of 70% or more by BLAT search. It is more preferable that a sequence with a BLAT search identity value of 65% or more exists only at one location on the genome that has the unique sequence.
  • sequence is a non-existent sequence, and it is preferable that the sequence whose Identity value is 60% or more by BLAT search is a sequence that exists only at one location on the genome having the unique sequence. "Unique sequence” may be used interchangeably with “unique sequence.”
  • HLA class I (eg, HLA-A to HLA-C, etc.) embeds a peptide having about 9 endogenous amino acid residues in the groove to form a complex that is presented to killer T cells.
  • killer T cells destroy each cell that presents it.
  • HLA class II (HLA-DR, DQ, DP, etc.) embeds a foreign peptide having about 15 amino acid residues taken up by phagocytosis in its groove and presents it to helper T cells.
  • Immune checkpoint molecules are factors involved in immune checkpoints that suppress immunity. Immune checkpoint molecules include, for example, PD-L1, PD-L2, B7 (CD80/CD86), CD275, CD276, VISTA, galectin-9, HVEM, and HLA class II molecules.
  • the cells of the present disclosure may be iPS cells.
  • the cells of the present disclosure can be iPS cells derived from human cells (human iPS cells).
  • the cells of the present disclosure can be used, for example, after being differentiated into immune cells. Therefore, the cells of the present disclosure may be immune cells, particularly iPS cell-derived immune cells.
  • Immune cells include, for example, T cells (e.g., CD4-only positive T cells and CD8-only positive T cells), natural killer T cells (NKT cells), natural killer cells (NK cells), regulatory T cells (Treg), It can be one or more immune cells selected from the group consisting of ⁇ T cells, ⁇ T cells, and macrophages. Immune cells may have T cell receptors (TCRs) with antigen specificity.
  • TCRs T cell receptors
  • the immune cell may not express a T cell receptor with antigen specificity (eg, may have a TCR ⁇ chain deficiency).
  • the immune cells may express chimeric antiexpressing receptors (CARs).
  • CARs chimeric antiexpressing receptors
  • an immune cell can be a T cell, NKT cell, NK cell, or ⁇ T cell, which expresses a CAR but may not express a TCR with antigen specificity.
  • the cells can be, for example, primary cells (eg, primary immune cells).
  • the cell can be, for example, a cell line (eg, an immune cell line).
  • the cells can be non-cancerous cells.
  • Cells expressing CAR may, for example, express either or both endogenous or exogenous interleukin-7 (IL-7) and endogenous or exogenous CCL19.
  • IL-7 interleukin-7
  • Endogenous or exogenous IL-7 and endogenous or exogenous CCL19 are operably linked to regulatory sequences, and cells expressing CAR have either or preferably both of said IL-7 and CCL19.
  • Cells expressing CAR may express endogenous or exogenous endo- ⁇ -D-glucuronidase (HPSE). These immune cells can have an autologous or allogeneic relationship with the subject to which they are administered. Immune cells may also express endogenous or exogenous CD3. The cells also contain one or more endogenous or The exogenous factor may or may not be expressed.
  • the cell has one or more endogenous factors selected from the group consisting of HLA-E, HLA-G, CD16, 41BBL, CD3, CD4, CD8, CD47, CD137, CD80, PDL1, A2AR, CAR, and TCR.
  • a nucleic acid encoding a natural or exogenous agent the nucleic acid being operably linked to a control sequence.
  • cells expressing CAR can be used in combination with antibody therapy.
  • the target molecule (tumor antigen) of the antibody may be knocked out in cells expressing CAR.
  • tumor antigens include CD38, CD52, and the like.
  • anti-CD38 antibodies examples include daratumumab and isatuximab (the disease to be treated can be, for example, multiple myeloma).
  • anti-CD52 antibodies examples include alemtuzumab (the disease to be treated can be, for example, leukemia, lymphocytic leukemia, or chronic lymphocytic leukemia).
  • cells eg, immune cells or non-immune cells
  • GVHD graft-versus-host disease
  • the cells of certain embodiments express a factor selected from the group consisting of PD1, CD52, CTLA4, dCK, GGH, HPRT, and ⁇ 2 microglobulin and a CAR or TCR. It's okay.
  • the cells of the present disclosure have functional ⁇ 2 microglobulin and/or functional CIITA.
  • Cells of the present disclosure may, for example, express an IL-15:IL15R ⁇ fusion protein.
  • a "chimeric antigen receptor” is a chimeric molecule comprising an antigen-binding fragment of an antibody (particularly an scFv) and an activation domain of an immune cell.
  • CARs are generally molecules consisting of an scFv, an extracellular hinge domain, a transmembrane domain (eg, CD8 ⁇ or CD28), and an activation signaling domain (eg, CD3 ⁇ ) linked together.
  • CAR can be introduced into cells and expressed on the cell surface. Cells expressing CAR can be targeted to specific antigens.
  • CARs are introduced into immune cells, such as T cells or NK cells, and target the immune cells, such as T cells or NK cells, to cancer.
  • first-generation CARs linked an scFv, an extracellular hinge domain, a transmembrane domain (e.g., CD8 ⁇ or CD28), and an activation signaling domain (e.g., CD3 ⁇ )
  • second-generation CARs It further includes a costimulatory molecule signaling domain for induced immune cell activation.
  • costimulatory molecule signaling domains costimulatory factors such as CD28, 4-1BB, OX40, CD27, and ICOS are used.
  • Third generation CAR incorporates multiple costimulatory factors. As described above, improvements have been made to CAR in order to sustainably proliferate in vivo immune cells into which CAR has been introduced.
  • any domains other than the scFv portion are derived from human proteins.
  • the endogenous or exogenous gene includes one or more endogenous or exogenous HLA genes.
  • HLA genes include, but are not limited to, HLA-A, HLA-B, HLA-C, HLA-E, HLA-F, HLA-G, HLA-H, HLA-J, HLA-W, MICA, MICB, HLA-DRA, HLA-DRB1, HLA-DRB5, HLA-DRB6, HLA-DRB9, HLA-DQA1, HLA-DQA2, HLA-DQB1, HLA-DPA1, HLA-DPB1, HLA-DMB, HLA-DOA, and HLA -DOB is mentioned.
  • the HLA gene may be one or more selected from the group consisting of HLA-A, HLA-B, HLA-C, HLA-DR, HLA-DQ, and HLA-DP. In one embodiment, the HLA gene may be one or more selected from the group consisting of HLA-A, HLA-B, and HLA-C. In one embodiment, the HLA gene can be one or more selected from the group consisting of HLA-DR, HLA-DQ, and HLA-DP.
  • the HLA gene can be, for example, HLA-A.
  • HLA-A may be any allele of HLA-A.
  • HLA-A include, but are not limited to, A*01:01, A*02:01, A*02:03, A*02:05, A*02:06, A*02:07, A* 02:10, A*02:11, A*02:15N, A*02:18, A*02:28, A*02:42, A*02:53N, A*02:59, A*02: 72, A*03:01, A*03:02, A*11:01, A*11:02, A*11:13, A*23:01, A*24:02, A*24:03, A*24:04, A*24:05, A*24:07, A*24:08, A*24:10, A*24:20, A*24:25, A*24:28, A* 24:46, A*25:01, A*26:01, A
  • HLA gene may be, for example, HLA-B.
  • HLA-B may be any allele of HLA-B.
  • HLA-B include, but are not limited to, B*07:02, B*07:05, B*08:01, B*13:01, B*13:02, B*14:01, B* 14:02, B*15:01, B*15:02, B*15:03, B*15:05, B*15:07, B*15:11, B*15:12, B*15: 13, B*15:17, B*15:18, B*15:21, B*15:25, B*15:26N, B*15:27, B*15:28, B*15:35, B*15:38, B*15:46, B*18:01, B*18:02, B*27:04, B*27:05, B*27:06, B*27:11, B* 35:01, B*35:02, B*35:03, B*35:05
  • the HLA gene may be HLA-C.
  • HLA-C may be any allele of HLA-C. Examples of HLA-C include, but are not limited to, C*01:02, C*01:03, C*01:55, C*02:02, C*03:02, C*03:03, and C*.
  • the HLA gene may be HLA-DR.
  • HLA-DR may be of any allele.
  • HLA-DR include, but are not limited to, DRB1*01:01, DRB1*01:02, DRB1*01:03, DRB1*03:01, DRB1*04:01, DRB1*04:02, DRB1* 04:03, DRB1*04:04, DRB1*04:05, DRB1*04:06, DRB1*04:07, DRB1*04:08, DRB1*04:09, DRB1*04:10, DRB1*04: 11, DRB1*07:01, DRB1*08:01, DRB1*08:02, DRB1*08:03, DRB1*08:09, DRB1*08:23, DRB1*09:01, DRB1*10:01, DRB1*11:01, DRB1*11:04, DRB1*11:06, DRB1*11:08,
  • the HLA gene can be HLA-DQ.
  • HLA-DQ may be HLA-DQ of any allele.
  • HLA-DQ include, but are not limited to, DQB1*02:01, DQB1*02:02, DQB1*03:01, DQB1*03:02, DQB1*03:03, DQB1*04:01, DQB1* 04:02, DQB1*05:01, DQB1*05:02, DQB1*05:03, DQB1*06:01, DQB1*06:02, DQB1*06:03, DQB1*06:04, DQB1*06: 09, DQA1*01:01, DQA1*01:02, DQA1*01:03, DQA1*01:04, DQA1*01:05, DQA1*02:01, DQA1*03:01, DQA1*03:01, DQA1*03:02, D
  • the HLA gene may be HLA-DP.
  • HLA-DP may be of any allele.
  • Examples of HLA-DP include, but are not limited to, DPB1*02:01, DPB1*02:02, DPB1*03:01, DPB1*04:01, DPB1*04:02, DPB1*05:01, DPB1* 06:01, DPB1*09:01, DPB1*13:01, DPB1*14:01, DPB1*17:01, DPB1*19:01, DPB1*36:01, DPB1*38:01, DPB1*41: 01, DPA1*01:03, DPA1*02:01, DPA1*02:02, and DPA1*04:01.
  • the insertion comprises an endogenous or exogenous gene and sequences upstream of the gene, including the control sequences or putative control sequences.
  • the insertion includes an endogenous or exogenous gene and the gene's natural regulatory sequences or candidates thereof upstream of the gene.
  • the insertion includes an endogenous or exogenous gene, where the gene includes one or more introns or all of the introns.
  • the insertion includes sequences upstream of the gene, including control sequences or putative control sequences, and one or more introns, or all of the introns.
  • the insertion has the sequence of a contiguous region on the genome that includes the gene, sequences upstream of the gene including regulatory or putative regulatory sequences, and all introns. .
  • the gene may be an HLA gene.
  • the gene on the genome corresponding to the HLA gene included in the insertion is deleted. In a preferred embodiment, if the insertion includes an HLA gene, all functional HLA on the genome is deleted.
  • the HLA gene included in the insertion may be a null allele.
  • the inserted gene can be, for example, a chimeric antigen receptor (CAR).
  • a chimeric anti-expressing receptor can be, for example, a single chain antibody (e.g., scFv) containing a heavy chain and a light chain, an extracellular hinge domain (e.g., CD8), a transmembrane domain (e.g., CD8 ⁇ and CD28), a co-stimulatory It may include molecular signaling domains (4-1BB, CD28 and CD137), and activation signaling domains (CD3 ⁇ ).
  • the chimeric anti-expressing receptor thereby generates an activation signal to the cell upon binding to the target.
  • Chimeric anti-expressing receptors can bind antigens expressed on cancer cells.
  • antigens include, for example, CD16, CD19, CD20, CD22, CD123, CD171, epidermal growth factor receptor (EGFR), in particular EGFRvIII, EGFR type 3, de2-7EGFR and HER2, carcinoembryonic antigen (CEA).
  • EGFR epidermal growth factor receptor
  • CEA carcinoembryonic antigen
  • PSCA prostate stem cell antigen
  • BCMA B cell maturation antigen
  • CS1 NKG2D
  • NKp30 B7H6, MUC-16 (CA125)
  • ROR-1 receptor for receptor tyrosine kinase 1
  • GPC3 glypican-3
  • mesothelin IL13R
  • c-KIT c-MET
  • NY-ESO-1 WT1
  • MAGE-A3, MAGE-A4 MAGE-A10
  • HPV E6, HPV E7, CMV AFP, PRAME, SSX2, KRAS, HER2, and PD-L1.
  • Chimeric antigen receptors may also have binding properties, for example, proteinaceous tags.
  • the antigen of the scFv can be, for example, a fluorescent protein such as fluorescein isothiocyanate (FITC).
  • FITC fluorescein isothiocyanate
  • Cancer cells can also be killed by binding antibodies labeled with protein tags to cancer antigens on the surface of cancer cells, and further administering cells expressing chimeric anti-expressing receptors that target the tags. This is because it is possible.
  • the inserted gene can be, for example, T cell receptor (TCR).
  • TCR can have antigen specificity.
  • a TCR with antigen specificity can, for example, bind to a cancer antigen.
  • TCRs with antigenic specificity include, for example, CD16, CD19, CD20, CD22, CD123, CD171, epidermal growth factor receptor (EGFR), especially EGFRvIII, type 3 EGFR, de2-7EGFR and HER2, carcinoembryonic antigen ( CEA), prostate stem cell antigen (PSCA), B cell maturation antigen (BCMA), CS1, NKG2D, NKp30, B7H6, MUC-16 (CA125), orphan receptor for receptor tyrosine kinase 1 (ROR-1), GD3 , GM2, glypican-3 (GPC3), mesothelin, IL13R, c-KIT, c-MET, NY-ESO-1, WT1, MAGE-A3, MAGE-A4,
  • the inserted gene is an immunosuppressive factor, such as CD47, CD24, CD200, PD-L1, IDO1, CTLA4-Ig, C1-inhibitor, IL-10, IL-35, FASL, Serpmb9, It contains a gene encoding one or more selected from the group consisting of CC121 and Mfge8.
  • an immunosuppressive factor such as CD47, CD24, CD200, PD-L1, IDO1, CTLA4-Ig, C1-inhibitor, IL-10, IL-35, FASL, Serpmb9
  • the inserted gene may be a therapeutic gene.
  • a therapeutic gene can be a gene that produces a therapeutic benefit when expressed in the body.
  • the therapeutic gene can be a pro-inflammatory protein, such as a cytokine.
  • the therapeutic gene can be an anti-inflammatory protein, such as a cytokine.
  • the inserted gene may be a suicide gene.
  • Suicide genes include, for example, the thymidine kinase gene, particularly the herpesvirus-derived thymidine kinase gene (HSVtk), cytotoxic signal receptors (eg, diphtheria toxin receptor), and iCas9.
  • HSVtk herpesvirus-derived thymidine kinase gene
  • cytotoxic signal receptors eg, diphtheria toxin receptor
  • iCas9 phosphorylates ganciclovir to produce cytotoxic ganciclovir triphosphate.
  • iCas9 inducible caspase-9 is a protein whose CARD is replaced by FKBP12, and induces cell death in iCas9-expressing cells in the presence of a tacrolimus derivative (eg, AP1903).
  • Such suicide genes are useful when it is desired to remove cells from the body that evade the immune system, such as universal
  • sequence identity refers to insertions and deletions between two base sequences or amino acid sequences such that the corresponding bases or amino acids have the greatest number of matches. It is determined as the proportion of matched bases or amino acids to the entire base sequence or amino acid sequence, excluding the gaps in the resulting alignment, with gaps in the corresponding parts. Sequence identity between nucleotide sequences or amino acid sequences can be determined using various homology search software known in the technical field.
  • the sequence identity value (identity value) of a base sequence is not particularly limited, but can be obtained, for example, by BLAT search installed in the known homology search software UCSC Genome Browser.
  • the invention provides a genome modification method for modifying two or more alleles of a chromosomal genome.
  • the genome modification method includes the following steps (a) and (b): (a) A step of introducing the following (i) and (ii) into a cell containing the chromosome; and (i) a sequence-specific nucleic acid cleaving molecule targeting a target region of the chromosomal genome, or the sequence-specific nucleic acid.
  • a genome modification system comprising a polynucleotide encoding a cleavage molecule; (ii) between an upstream homology arm having a base sequence homologous to the base sequence adjacent to the upstream side of the target region and a downstream homology arm having a base sequence homologous to the base sequence adjacent to the downstream side of the target region; , two or more types of selection marker donor DNAs containing base sequences of selection marker genes, wherein the two or more types of selection marker donor DNAs have mutually different selection marker genes; Two or more types of donor DNA for selection marker, the number of types of donor DNA is the same or more than the number of alleles targeted for genome modification, (b) After the step (a), a step of selecting the cells based on all selection marker genes possessed by the two or more selection marker donor DNAs.
  • the selection marker gene may be unique for each type of selection marker donor DNA.
  • step (b) is performed by homologously recombining different types of selective marker donor DNAs with respect to the two or more alleles after the step (a), respectively. It may be a step in which distinctly different unique selectable marker genes are introduced and cells expressing all of the introduced distinguishably different selectable marker genes are selected (a step for positive selection).
  • the above method may be a method for producing cells in which two or more alleles of the chromosomal genome have been modified.
  • hg38 is a reference genome released in December 2013 by the University of California, Santa Cruz (UCSC).
  • a reference genome is a reference genome created by combining various genomes, and it does not mean that there are humans who have this genome.
  • the fragmentary sequence information decoded is linked to construct a continuous sequence on a computer, and this The sequence of an individual's genomic DNA can be estimated.
  • the genomic DNA of an individual such as a human individual is usually decoded by associating the sequence of the genomic DNA of the human individual with the reference genome.
  • the position or region corresponding to a specific position or region of the hg38 genome sequence means a position or region linked to the specific location or region in the genome of another individual with a different specific sequence.
  • a position or region having a sequence characteristic of the position or region is a position or region corresponding to a specific position or region of the hg38 genome sequence.
  • Corresponding positions can be determined by alignment of two genomic DNA partial sequences. Even if there is a difference in the specific sequences, it is possible to determine the correspondence between two genomic DNAs by aligning them if they have an orthologous relationship or sequence identity. .
  • deletion of a region in all alleles (two alleles in the case of diploid) of the genome, wherein the deletion of a region (e.g., deletion of a region of up to 1 Mb or up to 500 kb) in a gene encoding an MHC molecule
  • Cells are provided that have a genome having a deletion that includes a region that includes part, or preferably all, of the MHC-like sequence accumulation region of the locus.
  • the readability of the genome can be improved and/or the efficiency of targeting genes (eg, MHC genes) in the genome can be increased by deleting repetitive sequences with similar sequences.
  • Cells with such deletions may have endogenous or exogenous gene insertions.
  • the inserted gene is preferably operably linked to control sequences.
  • the cell is a human cell and the deletion comprises a portion, or preferably the entire region, of the MHC-like sequence enrichment region of the genetic locus encoding the HLA molecule.
  • a series of regions from HLA-F to HLA-A (first HLA similar sequence accumulation region), a series of regions from HLA-C to HLA-B (second HLA similar sequence accumulation region) , a series of regions from HLA-DRA to HLA-DOB (third HLA-like sequence accumulation region), a series of regions from HLA-DMB to HLADPB2 (fourth HLA-similar sequence accumulation region), and a part thereof.
  • Cells are provided that are deleted in one, two, three, or four regions selected from the group consisting of: In one embodiment, the cell may be deleted in the region containing HLA-E.
  • the first to fourth HLA-like sequence accumulation regions can be targeted to their own unique sequences. By doing so, unexpected modifications such as off-target cleavage can be prevented. Those skilled in the art will understand how to perform targeting to prevent off-target cleavage, and can perform targeting and modification as appropriate. Even if it is difficult to modify individual HLAs due to their sequence similarity with other HLAs, the large-scale deletion according to the present disclosure allows the region in which unique sequences exist to be freely set, allowing the desired size to be modified. Large scale deletions can be made. In one embodiment, each of the first to fourth HLA similar sequence accumulation regions is targeted to a sequence outside the first to fourth HLA similar sequence accumulation regions.
  • the first HLA-like sequence accumulation region may exist at chr6:29,706,837-29,956,199 of the hg38 genome sequence. In one embodiment, the first HLA-like sequence accumulation region may be present at chr6:29,711,000-30,020,000 of the hg38 genomic sequence. In one embodiment, the second HLA-like sequence accumulation region may be present at chr6:31,225,738-31,376,781 of the hg38 genomic sequence. In one embodiment, the second HLA-like sequence accumulation region may be present at chr6:31,176,000-31,534,000 of the hg38 genomic sequence.
  • the third HLA-like sequence accumulation region may be present at chr6:32,445,000-32,821,000 of the hg38 genomic sequence. In one embodiment, the third HLA-like sequence accumulation region may be present at chr6:32,445,000-32,821,000 of the hg38 genomic sequence. In one embodiment, the fourth HLA-like sequence accumulation region may be present at chr6:32,934,298-33,161,621 of the hg38 genomic sequence. In one embodiment, the fourth HLA-like sequence accumulation region may be present at chr6:33,002,000-33,147,000 of the hg38 genomic sequence.
  • the first HLA-like sequence accumulation region may exist at chr6:29,722,775-29,945,870 of the hg38 genome sequence.
  • the second HLA-like sequence accumulation region may be present at chr6:31,268,749-31,357,179 of the hg38 genomic sequence.
  • the third HLA-like sequence accumulation region may be present at chr6:32,439,887-32,817,002 of the hg38 genomic sequence.
  • the fourth HLA-like sequence accumulation region may be present at chr6:32,934,636-33,089,696 of the hg38 genomic sequence.
  • each of the first to fourth HLA-similar sequence accumulation regions identify the smallest region containing the HLA to be deleted, and then determine the region having a unique sequence on the genome on both sides of the region. . This determination can be made as appropriate by referring to a genome database or the like. Regions with such unique sequences can be used for genome editing and the design of homologous arms for homologous recombination. Homologous arms are typically designed to be capable of homologous recombination (eg, designed to have the same sequence) with the region having the unique sequence. In a preferred embodiment, a region containing all functional HLA-encoding genes is deleted in each of the first to fourth HLA-similar sequence accumulation regions.
  • a region containing all functional HLA-encoding genes is deleted, and other genes outside the region are deleted as much as possible. For example, it is deleted so that 5 or more, 4 or more, 3 or more, 2 or more, or 1 or more other genes that exist outside the region are not included.
  • the deleted region depends on the existence of a region with a unique sequence on the genome in which the homologous recombination arms are capable of homologous recombination. In the case of humans, it is desirable to conduct studies specific to humans, and in the case of non-humans, it is desirable to conduct studies specific to each non-human species.
  • the invention provides a cell comprising genomic DNA having a deletion, said deletion in a chromosomal region defined in (i) to (iv) below: (i) a chromosomal region corresponding to the chr6:29,723,464-29,945,455 chromosomal region of the hg38 genome sequence; (ii) a chromosomal region corresponding to the chr6:31,269,169-31,357,158 chromosomal region of the hg38 genome sequence; (iii) a chromosomal region corresponding to the chromosomal region of chr6:32,439,951-32,816,951 of the hg38 genome sequence, and (iv) chr6:33,006,838-33,086,238 of the hg38 genome sequence.
  • HLA-like sequence accumulation region located in one or more chromosomal regions selected from the group consisting of chromosomal regions corresponding to the chromosomal region of
  • the HLA-like sequence accumulation region includes all HLA-encoding genes and HLA-like sequences contained in each of the chromosomal regions
  • the part includes at least one continuous region, and the continuous region accounts for 50% or more, 60% or more of the genes selected from the group consisting of HLA-encoding genes and HLA-like sequences contained in each of the regions, Contains 70% or more, 80% or more, 90% or more, or 100% of the genes, Provide cells. Throughout this specification, deletions are deletions in both alleles.
  • the cell of the present disclosure includes, in addition to the above region, independently from each end thereof outwardly within 20 kbp, 15 kbp, 10 kbp, 9 kbp, 8 kbp, 7 kbp, 6 kbp, and 5 kbp.
  • a region within 4 kbp, 3 kbp, 2 kbp, or 1 kbp may be further deleted.
  • the cells of the present disclosure do not need to lack one or more (preferably one) HLA genes located at both ends of the above region.
  • the invention provides a cell comprising genomic DNA having a deletion, said deletion in a chromosomal region defined in (i) to (iv) below: (i) a chromosomal region corresponding to the chromosomal region of chr6:29,723,464-30,010,618) of the hg38 genome sequence; (ii) a chromosomal region corresponding to the chr6:31,269,169-31,463,338 chromosomal region of the hg38 genome sequence; (iii) a chromosomal region corresponding to chr6:32,439,887-32,817,002 of the hg38 genome sequence, and (iv) chr6:33,006,838-33,131,199 of the hg38 genome sequence.
  • HLA-like sequence accumulation region located in one or more chromosomal regions selected from the group consisting of chromosomal regions corresponding to the chromosomal region of
  • the HLA-like sequence accumulation region includes all HLA-encoding genes and HLA-like sequences contained in each of the chromosomal regions
  • the part includes at least one continuous region, and the continuous region accounts for 50% or more, 60% or more of the genes selected from the group consisting of HLA-encoding genes and HLA-like sequences contained in each of the regions, Contains 70% or more, 80% or more, 90% or more, or 100% of the genes, Provide cells. Throughout this specification, deletions are deletions in both alleles.
  • the cell of the present disclosure includes, in addition to the above region, independently from each end thereof outwardly within 20 kbp, 15 kbp, 10 kbp, 9 kbp, 8 kbp, 7 kbp, 6 kbp, and 5 kbp.
  • a region within 4 kbp, 3 kbp, 2 kbp, or 1 kbp may be further deleted.
  • the cells of the present disclosure do not need to lack one or more (preferably one) HLA genes located at both ends of the above region.
  • the invention provides a cell comprising genomic DNA having a deletion, said deletion in a chromosomal region defined in (i) to (iv) below: (i) a chromosomal region corresponding to chr6: 29,711,000-30,020,000 chromosomal region of the hg38 genome sequence; (ii) a chromosomal region corresponding to chr6: 31,176,000-31,534,000 chromosome region of the hg38 genome sequence; (iii) a chromosomal region corresponding to chr6: 32,445,000-32,821,000 chromosome region of the hg38 genome sequence, and (iv) chr6: 33,002,000-33,147,000 chromosome region of the hg38 genome sequence.
  • the HLA-like sequence accumulation region includes all HLA-encoding genes and HLA-like sequences contained in each of the chromosomal regions
  • the part includes at least one continuous region, and the continuous region accounts for 50% or more, 60% or more of the genes selected from the group consisting of HLA-encoding genes and HLA-like sequences contained in each of the regions, Contains 70% or more, 80% or more, 90% or more, or 100% of the genes, Provide cells. Throughout this specification, deletions are deletions in both alleles.
  • the cell of the present disclosure includes, in addition to the above region, independently from each end thereof outwardly within 20 kbp, 15 kbp, 10 kbp, 9 kbp, 8 kbp, 7 kbp, 6 kbp, and 5 kbp.
  • a region within 4 kbp, 3 kbp, 2 kbp, or 1 kbp may be further deleted.
  • the cells of the present disclosure do not need to lack one or more (preferably one) HLA genes located at both ends of the above region.
  • the invention provides a cell comprising genomic DNA having a deletion, said deletion in a chromosomal region defined in (i) to (iv) below: (i) a chromosomal region corresponding to the chr6:29,706,837-29,956,199 chromosomal region of the hg38 genome sequence; (ii) a chromosomal region corresponding to the chr6: 31,268,749-31,534,000 chromosome region of the hg38 genome sequence; (iii) a chromosomal region corresponding to chr6: 32,439,887-32,817,002 chromosome region of the hg38 genome sequence, and (iv) chr6: 32,934,636-33,089,696 chromosome of the hg38 genome sequence Deletion of a region containing part or all of an HLA-similar sequence accumulation region located in one or more chromosomal regions selected from the group consist
  • deletions are deletions in both alleles.
  • the cell of the present disclosure includes, in addition to the above region, independently from each end thereof outwardly within 20 kbp, 15 kbp, 10 kbp, 9 kbp, 8 kbp, 7 kbp, 6 kbp, and 5 kbp.
  • a region within 4 kbp, 3 kbp, 2 kbp, or 1 kbp may be further deleted.
  • the cells of the present disclosure do not need to lack one or more (preferably one) HLA genes located at both ends of the above region.
  • the chromosomal region defined in (i) above includes an HLA-like sequence accumulation region including HLA-F, HLA-G, and HLA-A.
  • the deletion is a deletion of a part, or preferably the whole, of the HLA-like sequence accumulation region.
  • a part is a region containing at least one HLA and an HLA-like sequence.
  • the deletion is in a region including one or more, preferably all, selected from the group consisting of HLA-F, HLA-G, and HLA-A.
  • the deletion is a deletion in a region that includes all of the HLA-like sequence accumulation region, and is a deletion in a region that includes HLA-F, HLA-G, and HLA-A.
  • cells deficient in part or all of the HLA may have the desired gene, endogenous or exogenous, operably linked to, for example, additionally introduced control sequences.
  • the endogenous or exogenous desired gene operably linked to the additionally introduced control sequences has, in some embodiments, a naturally occurring sequence, but in some embodiments is not a naturally occurring sequence. , or an artificially designed sequence.
  • Additional introduced desired genes may, for example, confer additional functions to the cell. Additional desired genes introduced include, for example, differentiation-promoting factors, differentiation-suppressing factors, reprogramming factors (including factors necessary for reprogramming into pluripotent cells, including Oct4), and activation of specific functions of cells.
  • signal transduction factors e.g., signal transduction inhibitors, receptors, membrane proteins, enzymes (e.g., metabolic enzymes, phosphorylating enzymes, nucleic acid synthases, telomerase, etc.), growth factors, Antiproliferative factors, immune activating or immunosuppressive molecules, degradative enzymes (e.g. proteolytic enzymes, nucleolytic enzymes, etc.), secreted factors (e.g.
  • microRNA may encode any one or more selected from the group consisting of a linked toxin (eg, diphtheria toxin), and a microRNA.
  • the control sequence can be a constitutive promoter or an inducible promoter.
  • the number of cells in which a part of HLA has been deleted in (i) is, for example, 1 to several (for example, 1 to 4, preferably 3, more preferably 2, More preferably, it may have (and may remain) one HLA.
  • the number of cells in which a part of HLA has been deleted in (ii) above is, for example, 1 to several (for example, 1 to 4, preferably 3, more preferably 2, More preferably, it may have (and may remain) one HLA.
  • the cells in which a part of HLA has been deleted are, for example, 1 to several (for example, 1 to 4, preferably 3, more preferably 2, More preferably, it may have (and may remain) one HLA.
  • the number of cells in which a part of HLA has been deleted in (iv) is, for example, 1 to several (for example, 1 to 4, preferably 3, more preferably 2, More preferably, it may have (and may remain) one HLA.
  • the deletion is a deletion of a region that includes part or preferably all of the HLA-like sequence accumulation region.
  • the desired gene is preferably introduced into the chromosomal region defined in (i) above. Accordingly, in this aspect, the chromosomal region defined in (i) lacks the entire HLA-like sequence accumulation region, but contains the desired gene (endogenous or preferably has a foreign gene) or its insertion.
  • the deletion is a deletion of a region that includes part or preferably all of the HLA-like sequence accumulation region.
  • the desired gene is preferably reintroduced into a region other than the chromosomal region defined in (i).
  • the genomic DNA has a deletion of a part or preferably the entire HLA-like sequence accumulation region in the chromosomal region specified in (i) above, but in a region other than the chromosomal region specified in (i). has the desired gene, endogenous or preferably exogenous, operably linked to control sequences.
  • Endogenous means that the cell with the deletion has or has had the same base sequence as an endogenous gene
  • exogenous means that the cell with the deletion has the same base sequence as an endogenous gene. This means that it has a different base sequence from that of the endogenous gene that it has or had.
  • the desired gene is a functional gene.
  • a functional gene means that the gene has its original function.
  • the deletion in (i) includes at least one or both of HLA-A and HLA-F.
  • the desired gene operably linked to the control sequence is such that the control sequence is exogenous or endogenous, and the desired gene is exogenous or endogenous.
  • the control sequences are endogenous and the desired gene is exogenous.
  • the control sequences are endogenous and the desired gene is endogenous.
  • the control sequences are exogenous and the desired gene is endogenous.
  • the control sequences are exogenous and the desired gene is exogenous.
  • the control sequences are endogenous and the desired gene is endogenous, but the entire set of sequences comprising the control sequences and the desired gene is endogenous or exogenous.
  • Control sequences include various known control sequences such as enhancers and promoters.
  • the chromosomal region defined in (ii) above includes an HLA-like sequence accumulation region including HLA-C, HLA-B, MICA, and MICB.
  • the deletion is a part or preferably all of the HLA-like sequence accumulation region.
  • a part is a region containing at least one HLA and an HLA-like sequence.
  • the deletion is in a region including one or more, preferably all, selected from the group consisting of HLA-C, HLA-B, MICA, and MICB.
  • the chromosomal region defined in (iii) above includes an HLA-like sequence accumulation region including HLA-DRB5, HLA-DRB1, HLA-DQA1, HLA-DQB1, HLA-DQA2, HLA-DQB2, and HLA-DOB.
  • the deletion is a part or preferably all of the HLA-like sequence accumulation region.
  • a part is a region containing at least one HLA and an HLA-like sequence.
  • it includes one or more, preferably all, selected from the group consisting of HLA-DRB5, HLA-DRB1, HLA-DQA1, HLA-DQB1, HLA-DQA2, HLA-DQB2, and HLA-DOB. This is a region deletion.
  • the chromosomal region defined in (iv) above includes an HLA-like sequence accumulation region including HLA-DOA, HLA-DPA1, and HLA-DPB1.
  • the deletion is a part or preferably all of the HLA-like sequence accumulation region.
  • a part is a region containing at least one HLA and an HLA-like sequence.
  • the deletion is a region including one or more, preferably all, selected from the group consisting of HLA-DOA, HLA-DPA1, and HLA-DPB1.
  • deletion of the region defined in (i) above means deletion of all other HLA-like sequence-accumulating regions except for the region containing only one of HLA and HLA-like sequences. It can be a deletion of a region.
  • the deletion of the region defined in (ii) above is the deletion of all other regions except for the region containing only one of HLA and HLA-like sequences in the HLA-like sequence accumulation region. It can be.
  • the deletion of the region defined in (iii) above is the deletion of all other regions except for the region containing only one of HLA and HLA-like sequences in the HLA-like sequence accumulation region. It can be.
  • the deletion of the region defined in (iv) above is the deletion of all other regions except for the region containing only one of HLA and HLA-like sequences in the HLA-like sequence accumulation region. It can be.
  • the deletion is a deletion in the region defined in (i), and there is no deletion of part or all of the HLA similar sequence accumulation region in other regions (i) to (iv). . In some embodiments, the deletion is a deletion in the region defined in (ii), and there is no deletion of part or all of the HLA similar sequence accumulation region in other regions (i) to (iv). . In one embodiment, the deletion is a deletion in the region defined in (iii), and the other regions (i) to (iv) do not have a deletion of part or all of the HLA similar sequence accumulation region. . In some embodiments, the deletion is a deletion in the region defined in (iv), and the other regions (i) to (iv) do not have deletions of part or all of the HLA similar sequence accumulation region. .
  • the deletion is in the regions defined in each of (i) to (iv).
  • one or more genes may be inserted (knocked in) into the region having the above deletion.
  • the inserted gene can be a selection marker (eg, a drug resistance marker and a visualization marker) and a gene of interest with a physiological function.
  • the inserted gene is preferably operably linked to a control sequence.
  • the position where the gene is inserted is any one of (i) to (iv) above. In a preferred embodiment, the position where the gene is inserted is not any of the above (i) to (iv). In a preferred embodiment, the position where the gene is inserted is within the region (ii) above.
  • the region (ii) above has a deletion (preferably a deletion as defined above) and an insertion of one or more of the genes described above.
  • the inserted gene does not have an upstream and/or downstream insulator.
  • Insulators are cis-regulatory elements that act, for example, to prevent distant enhancers from acting on promoters or to prevent euchromatin silencing due to expansion of adjacent heterochromatin.
  • Insulators include CTCF insulators, gypsy insulators, and ⁇ -globin insulators.
  • the insulator has a length of about 200 to 1000 bp. The insulator can inhibit PCR amplification that straddles the insulator.
  • the region (ii) above has a deletion (preferably a deletion as defined above) and has inserted one or more genes, and the one or more genes are: It does not have an insulator on either or both of its centromere side and telomere side (or upstream and downstream). In certain embodiments, the region with the deletion does not have an insertion of new sequence. In certain embodiments, the region having the deletion does not have recognition sequences for site-specific recombination enzymes such as loxP or FRT (flippase recognition target) and variants thereof.
  • said deletion, particularly deletion of the region defined in (i) above comprises a series of regions comprising HLA-F, HLA-G, and HLA-A (e.g., chr6:29 of the hg38 genomic sequence). , 723,464-29,945,455, preferably chr6:29,723,464-30,010,618.
  • Deletions, particularly deletions in the region defined in (i) above can occur in chromosomes of chr6: 29,701,000 to 29,723,464 (for example, Chr6: 29,709,000 to 29,711,000).
  • first sequence has one end in a unique sequence (first sequence) in the region, and chr6: 29,945,455-30,030,000 (for example, Chr6: 30,020,000-30,020,000 and chr6: 30,021,500-30,022,800) in a chromosomal region with the other end in a unique sequence (second sequence).
  • first sequence includes a sequence specific to the genome (unique sequence), and is therefore used as an upstream homology arm (e.g., a telomeric homology arm) and a downstream homology arm in genome modification by homologous recombination using donor DNA, which will be described later.
  • the deletion is approximately 300 kb, the following method can be preferably used to efficiently generate such a large deletion.
  • the deletion particularly the deletion of the region defined in (ii) above, comprises a series of regions comprising HLA-C and HLA-B (e.g. chr6:31,269,169- of the hg38 genomic sequence). 31,357,158, preferably chr6:31,269,169-31,463,338).
  • the deletion is chr6: 31,166,000-31,269,169 (e.g., Chr6: 31,174,000-31,177 ,000), and has one end in a unique sequence (third sequence) in the chromosomal region of chr6: 31,357,158 to 31,544,000 (for example, Chr6: 31,534,000 to 31,538,000) in a chromosomal region with the other end in a unique sequence (fourth sequence).
  • the third sequence and the fourth sequence contain unique sequences (unique sequences, in other words, unique sequences for which no other similar sequence exists) in the genome, and are therefore suitable for donor use as described below.
  • upstream homology arm e.g., telomere side homology arm
  • downstream homology arm e.g., centromere side homology arm
  • unique sequence unique sequence
  • said deletion particularly deletion of the region defined in (iii) above, comprises a series of regions comprising HLA-DRA, HLA-DRB5, and HLA-DRB1 (e.g., chr6:32 of the hg38 genomic sequence). , 445,000-32,816,951, preferably chr6:32,439,951-32,817,002).
  • the deletion is chr6:32,416,000-33,445,000, for example chr6:32,420,000-33,445 ,000, for example, in a unique sequence (fifth sequence) in the chromosomal region of chr6: 32,429,000 to 33,445,000 (for example, Chr6: 32,446,000 to 32,448,500) has one end in the chromosomal region of chr6:32,439,951-32,831,000 (e.g. deletion of the region with the other end in the sequence).
  • the fifth sequence and the sixth sequence contain unique sequences (unique sequences, in other words, unique sequences for which no other similar sequence exists) in the genome, and are therefore suitable for donor use as described below.
  • the deletion is about 380 kb, and the following method can be preferably used to efficiently generate such a huge deletion.
  • said deletion particularly deletion of the region defined in (iv) above, comprises a series of regions comprising HLA-DOA, HLA-DPA1, and HLA-DPB1 (e.g., chr6:33 of the hg38 genomic sequence). , 006,838-33,086,238, preferably a chromosomal region corresponding to chr6:33,006,838-33,131,199).
  • the deletion is chr6:32,924,000-33,006,838 (e.g., Chr6:32,999,500-33,002 , 500), and has one end in a unique sequence (seventh sequence) in the chromosomal region of chr6: 33,086,238-33,165,000 (for example, Chr6: 33,147,500 ⁇ 33,150,500) in a chromosomal region with the other end in a unique sequence (eighth sequence).
  • the seventh sequence and the eighth sequence contain unique sequences (unique sequences, in other words, unique sequences for which no other similar sequence exists) in the genome, and are therefore suitable for donor use as described below.
  • the deletion is about 150 kb, and the following method can be preferably used to efficiently generate such a huge deletion.
  • the cell having the deletion comprises genomic DNA having the deletion, and the deletion is in a chromosomal region defined in (i) to (iv) below: (i) A series of regions containing HLA-F, HLA-G, and HLA-A (e.g., chr6:29,723,464-29,945,455 of the hg38 genomic sequence, preferably chr6:29,723,464) -chromosomal region corresponding to 30,010,618), (ii) a series of regions containing HLA-C and HLA-B (for example, chr6:31,269,169-31,357,158 of the hg38 genomic sequence, preferably chr6:31,269,169-31,463, Chromosome region corresponding to 338 chromosome regions), (iii) a series of regions comprising HLA-DRA, HLA-DRB5, and HLA-DRB1 (e.g., chr6
  • the cell having the deletion comprises genomic DNA having the deletion, and the deletion is in a chromosomal region defined in (i) to (iv) below: (i) A series of regions containing HLA-F, HLA-G, and HLA-A (e.g., chr6:29,723,464-29,945,455 of the hg38 genomic sequence, preferably chr6:29,723,464) -chromosomal region corresponding to 30,010,618), (ii) a series of regions containing HLA-C and HLA-B (for example, chr6:31,269,169-31,357,158 of the hg38 genomic sequence, preferably chr6:31,269,169-31,463, Chromosome region corresponding to 338 chromosome regions), (iii) a series of regions comprising HLA-DRA, HLA-DRB5, and HLA-DRB1 (e.g., chr6
  • the above (i) when the above (i) has a deletion, the above (i) that has the deletion does not have a repetitive sequence within its chromosomal region. In one aspect, when the above (ii) has a deletion, the above (ii) having the deletion does not have a repetitive sequence within its chromosomal region. In one embodiment, when the above (iii) has a deletion, the above (iii) that has the deletion does not have a repetitive sequence within its chromosomal region. In one embodiment, when the above (iv) has a deletion, the above (iv) that has the deletion does not have a repetitive sequence within its chromosomal region.
  • a repeating sequence is, for example, a continuous sequence that makes sequencing difficult.
  • a repeating sequence is, for example, a continuous sequence that induces off-targeting to homology arms of donor DNA.
  • the repetitive sequence includes, for example, a repeating sequence of 0.5 kb to 2 kb.
  • the human cell having the deletion has a gene encoding functional ⁇ 2 microglobulin (B2M). In certain embodiments, the human cell having the deletion has a gene encoding a functional class II tumor histocompatibility complex transactivator (CIITA). In certain embodiments, the human cell having the deletion has a functional B2M-encoding gene and a functional CIITA-encoding gene. This can prevent unexpected functional changes that may occur in cells due to the deletion of B2M and CIITA. Nevertheless, in some embodiments, the human cell having the deletion does not substantially express HLA class I and/or HLA class II on the cell surface.
  • B2M functional ⁇ 2 microglobulin
  • CIITA tumor histocompatibility complex transactivator
  • the deletion can be 100 kb or more, 150 kb or more, 200 kb or more, 250 kb or more, 300 kb or more, 350 kb or more, or 400 kb or more. In some embodiments, the deletion can be 400 kb or less, 350 kb or less, 300 kb or less, 250 kb or less, 200 kb or less, 150 kb or less, or 100 kb or less in size. In certain embodiments, the deletion can be between 100 kb and 400 kb in size.
  • the cells may be complete somatic cells, but may also be precursor cells for the introduction of further modifications.
  • cell examples 1 to 4 examples of cells that can be used as useful cells themselves, but are also useful as precursor cells for introducing further modifications are listed.
  • cell Examples 1 to 4 since at least one of the HLA-like sequence accumulation regions is deleted, it is possible to solve the problem that genome sequencing or gene targeting is hindered by the presence of repetitive sequences. This facilitates modification and also facilitates sequence decoding after modification, making it possible to apply genetic engineering more reliably.
  • the cell has a deletion in (i) above.
  • the deletion may be the entire deletion of the HLA-like sequence accumulation region.
  • the deletion in (i) above may be a deletion by replacement with DNA containing one or more desired genes or insertions thereof.
  • the desired gene can be a selectable marker gene.
  • the selection marker gene preferably includes a positive selection marker gene, more preferably includes both a positive selection marker gene and a negative selection marker gene, or a marker gene that can be used for both positive selection and negative selection. including.
  • the cell has a deletion in (i) above and no deletions in (ii) to (iv) above.
  • Cell Example 1 lacks HLA-A and F and is a useful cell in itself, but can be used, for example, to generate Cell Examples 2-4.
  • the cell has a deletion in (i) above and has the desired gene or insertion thereof operably linked to a regulatory sequence.
  • the deletion in (i) above is a deletion that includes the entire HLA-like sequence accumulation region.
  • the deletion in (i) above may be a deletion by replacement with DNA containing one or more desired genes or insertions thereof.
  • the desired gene may be a molecule that suppresses immunity to cells having the deletion, eg, a gene encoding an immunosuppressive molecule.
  • the region having the deletion includes a selectable marker gene.
  • the selection marker gene preferably includes a positive selection marker gene, more preferably includes both a positive selection marker gene and a negative selection marker gene, or a marker gene that can be used for both positive selection and negative selection. including.
  • the cell having the deletion has the desired gene in a region other than (i) above.
  • Cell Example 2 is a useful cell in itself, but can be used, for example, to create Cell Examples 3-4.
  • the cell has a deletion in (i) above, and (iii) and/or (iv) above, and has the desired gene or insertion thereof operably linked to a regulatory sequence. .
  • the cell has a deletion in (i), (iii), and (iv) above and has the desired gene or insertion thereof operably linked to a regulatory sequence.
  • each of the deletions in (i), (iii), and (iv) above includes the entire HLA-similar sequence accumulation region within that region.
  • the deletion in (i) above may be a deletion by replacement with DNA containing one or more desired genes or insertions thereof.
  • the desired gene may be a molecule that suppresses immunity to cells having the deletion, eg, a gene encoding an immunosuppressive molecule.
  • the cell has a deletion in (i) above, and (iii) and/or (iv) above, and any one or more or all of the deleted regions contain a selectable marker gene.
  • the selection marker gene preferably includes a positive selection marker gene, more preferably includes both a positive selection marker gene and a negative selection marker gene, or a marker gene that can be used for both positive selection and negative selection. including.
  • none of (i), (iii) and (iv) above have the insertion of a desired gene, such as a marker gene or a new gene.
  • the cell does not have the deletion in (ii) above.
  • Cell Example 3 is a useful cell in itself, but can be used, for example, to create Cell Example 4.
  • the cell has a deletion in all of (i) to (iv) above and has the desired gene or insertion thereof operably linked to a regulatory sequence.
  • the deletion in (i) above may be a deletion by replacement by DNA containing one or more desired genes or insertions thereof.
  • the desired gene may be a molecule that suppresses immunity to cells having the deletion, eg, a gene encoding an immunosuppressive molecule.
  • the deletion in (ii) above may be a deletion caused by replacement with DNA containing one or more desired genes.
  • the desired gene may be a selectable marker gene.
  • the selection marker gene preferably includes a positive selection marker gene, more preferably includes both a positive selection marker gene and a negative selection marker gene, or a marker gene that can be used for both positive selection and negative selection. including.
  • neither (iii) above nor (iv) above has the insertion of a desired gene, such as a marker gene or a new gene.
  • Cell Example 4 is a useful cell in itself, it can be used, for example, to further replace the DNA portion containing one or more desired genes or insertion thereof in (ii) above with other DNA. For example, this allows the marker gene to be removed, or a marker gene to be removed and then another desired gene to be introduced.
  • the region (ii) above is a transcriptionally activated region, and it can be expected that by introducing a desired gene, the desired gene can be expressed favorably.
  • the desired gene is inserted into the region (ii) above, and no insulator is present on either or both the centromere side and telomere side of the gene.
  • the cell having the deletion does not have at least HLA-A. In certain embodiments, the cell having the deletion is free of at least HLA-A and F.
  • cells with the deletions include HLA-B, C, E, G, H, J, and W; MICA and MICB; and HLA-DRA, DRB1, DRB5, DRB6, DRB9, DQA1, DQA2, DQB1 , DPA1, DPB1, DMB, DOA, and DOB.
  • the HLA region may be replaced by a marker gene or a desired gene (target gene).
  • the marker gene and the gene of interest are operably linked to control sequences.
  • the deletion occurs in two alleles, resulting in a lack of expression of the deleted gene.
  • the cell having the deletion may be an isolated cell or a cell line.
  • cells with the deletion can evade the cytotoxic effects of T-cell natural killer cells (NK cells).
  • NK cells T-cell natural killer cells
  • cells having the deletion can be administered to allogeneic individuals without inducing immune rejection of the cells. This provides cells that can be preferably used in, for example, hematopoietic stem cell transplantation, organ transplantation, cell transplantation, or tissue transplantation.
  • the cells with the deletion can be frozen in a cell cryoprotectant solution.
  • the cell cryoprotectant containing cells with said deletion may be provided in an unfrozen or preferably frozen state.
  • Cell cryoprotectants also referred to as "freeze stocks" containing cells with said deletions in a frozen state can be used as research cell banks (RCBs), master cell banks (MCBs), or working cell banks (WCBs). Therefore, the present invention provides a research cell bank (RCB), a master cell bank (MCB), or a working cell bank (WCB) that includes the above-mentioned freeze stock.
  • Genomic DNA having the deletion can be subjected to whole genome sequencing. Further, in one embodiment, reference genome data is created from the whole genome sequence.
  • pluripotent cells e.g., pluripotent stem cells such as embryonic stem cells (ES cells) and induced pluripotent stem cells (iPS cells)
  • ES cells embryonic stem cells
  • iPS cells induced pluripotent stem cells
  • hematopoietic stem cells hematopoietic progenitor cells
  • bone marrow cells hematopoietic progenitor cells
  • spleen cells e.g., pluripotent stem cells such as embryonic stem cells (ES cells) and induced pluripotent stem cells (iPS cells)
  • hematopoietic stem cells hematopoietic progenitor cells
  • bone marrow cells hematopoietic progenitor cells
  • spleen cells hematopoietic progenitor cells
  • myeloid common progenitor cells immune cells (e.g., T cells, B cells, NK cells, NKT cells, macrophages, monocytes, neutrophils, eosinophils, basophils), red blood cells, megakaryocytes, cardiac cells , cardiomyocytes, cardiac fibroblasts, pancreatic ⁇ cells, corneal cells (e.g., corneal epithelial cells, and corneal endothelial cells), epidermal cells, dermal cells, adipocytes, chondrocytes, osteocytes, osteoclasts, osteoblasts , mesenchymal stem cells (e.g., adipose-derived, bone marrow-derived, placenta-derived, and umbilical cord-derived), dental pulp cells, tendon cells, ligament cells, nerve cells (e.g., cone cells, astrocytes, and granule cells), glial cells. , Purkinje cells, retinal ganglion cells, retinal, retina
  • the cells having the deletion may form cell aggregates such as organoids.
  • the cells having the deletion may form a cell sheet.
  • the cells having said deletion may form the whole or part of an organ or tissue.
  • a composition comprising a cell having the deletion.
  • the composition may be used for medical purposes.
  • the composition may further contain pharmaceutically acceptable carriers and/or additives.
  • Pharmaceutically acceptable carriers include, for example, water and saline.
  • Pharmaceutically acceptable additives include, for example, salts, pH buffers, and isotonic agents.
  • the composition may be serum free in preferred embodiments.
  • the method described below (for example, UKiS; see International Publication No. 2021/206054) is useful as a method for efficiently introducing the same modification into two or more alleles of a chromosomal genome at the same time. It is suitable for creating a deletion of approximately 100 kb to 500 kb in size in a sequence-specific manner in a region, and can be preferably used for creating the above-mentioned cells. This method can also be applied to the modification of haploid cells. This method can also be applied to cells whose genomic DNA has only one allele of the HLA gene region.
  • the present invention provides a method for producing a cell in which two or more alleles of a chromosomal genome are modified, comprising: (a) introducing the following (i) and (ii) into cells containing two or more alleles, and introducing a selection marker gene into each of the two or more alleles; (i) a sequence-specific nucleic acid cleaving molecule capable of targeting and cleaving a target region in two or more alleles of said chromosomal genome, or a polynucleotide encoding said sequence-specific nucleic acid cleaving molecule; genome modification systems, including; (ii) two or more types of donor DNA for selection markers, each of which has an upstream homology arm having a base sequence capable of homologous recombination with the base sequence upstream of the target region; and a base sequence downstream of the target region; and a downstream homology arm having a base sequence capable of homologous recombination with the sequence, and containing
  • the DNAs each have selectable marker genes that are distinguishable from each other, and the selectable marker genes are unique for each type of selectable marker donor DNA, and the number of types of selectable marker donor DNA is determined by the number of types of selectable marker donor DNA.
  • Two or more selection marker donor DNAs the number of which is the same or more than the number of target alleles, (b) After the step (a), different types of selection marker donor DNAs undergo homologous recombination with the two or more alleles, thereby providing distinguishably different unique selection markers to the two or more alleles.
  • a step of introducing the gene and selecting cells that express all of the introduced distinguishably different selection marker genes (step for positive selection);
  • the method may include:
  • step (a) In step (a), the above (i) and (ii) are introduced into cells containing chromosomes.
  • the cells used in the genome modification method of this embodiment are not particularly limited, as long as they have a haploid, diploid or higher chromosomal genome.
  • the cells may be diploid, triploid, tetraploid or more.
  • Examples of cells include, but are not limited to, eukaryotic cells.
  • the cells may be plant cells, animal cells, or fungal cells.
  • Animal cells include, but are not limited to, humans and non-human mammals (for example, non-human primates such as monkeys, non-human mammals such as dogs, cats, cows, horses, sheep, goats, llamas, and rodents). , birds, reptiles, amphibians, fish, and other vertebrates.
  • the target region for genome modification can be any region on the genome that has one or more alleles.
  • the size of the target area is not particularly limited. In the genome modification method of this embodiment, a region larger in size than conventional methods can be modified.
  • the target region may be, for example, 10 kbp or more.
  • the target region is, for example, 100 bp or more, 200 bp or more, 400 bp or more, 800 bp or more, 1 kbp or more, 2 kbp or more, 3 kbp or more, 4 kbp or more, 5 kbp or more, 8 kbp or more, 10 kbp or more, 20 kbp or more, 40 kbp or more, 80 kbp or more, 100 kbp or more.
  • the target region is deleted in the modified cell.
  • Genome modification system refers to a molecular mechanism capable of modifying a desired target region.
  • the genome modification system includes a sequence-specific nucleic acid cleaving molecule targeted to a target region of a chromosomal genome, or a polynucleotide encoding said sequence-specific nucleic acid cleaving molecule.
  • sequence-specific nucleic acid cleaving molecule is not particularly limited as long as it has sequence-specific nucleic acid cleaving activity, and may be a synthetic organic compound or a biopolymer compound such as a protein.
  • synthetic organic compound having sequence-specific nucleic acid cleaving activity include pyrrole-imidazole polyamide.
  • proteins having sequence-specific site cleavage activity include sequence-specific endonucleases.
  • Sequence-specific endonucleases are enzymes that can cut nucleic acids at predetermined sequences. Sequence-specific endonucleases can cleave double-stranded DNA at predetermined sequences. Examples of sequence-specific endonucleases include, but are not limited to, zinc finger nuclease (ZFN) and TALEN (transcription activator-like effector nuclease). , Cas protein, etc., but are not limited to these.
  • ZFNs are engineered nucleases that contain a nucleic acid cleavage domain conjugated to a binding domain that contains a zinc finger array.
  • the cleavage domain include the cleavage domain of type II restriction enzyme FokI.
  • a zinc finger nuclease capable of cleaving a target sequence can be designed by a known method.
  • TALENs are artificial nucleases that contain a DNA-binding domain of a transcription activator-like (TAL) effector in addition to a DNA-cleaving domain (eg, a FokI domain).
  • TAL transcription activator-like
  • a TALE construct capable of cleaving a target sequence can be designed by a known method (for example, Zhang, Feng et. al. (2011) Nature Biotechnology 29 (2)).
  • the genome modification system When using a Cas protein as a sequence-specific nucleic acid cleavage molecule, the genome modification system includes a CRISPR/Cas system. That is, the genome modification system preferably includes a Cas protein and a guide RNA having a base sequence homologous to the base sequence within the target region.
  • the guide RNA only needs to contain a sequence homologous to a sequence within the target region (target sequence) as a spacer sequence.
  • the guide RNA only needs to be able to bind to DNA within the target region, and does not need to have a sequence completely identical to the target sequence. This bond may be formed under physiological conditions within the cell nucleus.
  • the guide RNA can contain, for example, a mismatch of 0 to 3 bases with respect to the target sequence.
  • the number of mismatches is preferably 0 to 2 bases, more preferably 0 to 1, and even more preferably no mismatches.
  • Guide RNA can be designed based on known methods.
  • the genome modification system is preferably a CRISPR/Cas system and preferably includes a Cas protein and a guide RNA.
  • the Cas protein is a Cas9 protein.
  • a sequence-specific endonuclease may be introduced into cells as a protein, or as a polynucleotide encoding the sequence-specific endonuclease.
  • mRNA for a sequence-specific endonuclease may be introduced, or an expression vector for a sequence-specific endonuclease may be introduced.
  • a sequence-specific endonuclease coding sequence is operably linked to a promoter.
  • the promoter is not particularly limited, and various pol II promoters can be used, for example.
  • pol II promoters include, but are not limited to, CMV promoter, EF1 promoter (EF1 ⁇ promoter), SV40 promoter, MSCV promoter, hTERT promoter, ⁇ -actin promoter, CAG promoter, CBh promoter, and the like.
  • the promoter may be an inducible promoter.
  • An inducible promoter is a promoter that can induce expression of a polynucleotide operably linked to the promoter only in the presence of an inducing factor that drives the promoter. Examples of inducible promoters include promoters that induce gene expression by heating, such as heat shock promoters. Further, inducible promoters include promoters in which the inducer that drives the promoter is a drug. Examples of such drug-inducible promoters include Cumate operator sequences, ⁇ operator sequences (eg, 12 ⁇ Op), tetracycline-based inducible promoters, and the like.
  • Tetracycline-based inducible promoters include, for example, promoters that drive gene expression in the presence of tetracycline or its derivatives (eg, doxycycline), or reverse tetracycline-regulated transactivator (rtTA).
  • tetracycline-inducible promoters include TRE3G promoter.
  • any known expression vector can be used without any particular restriction.
  • expression vectors include plasmid vectors and viral vectors.
  • the expression vector may contain, in addition to the Cas protein coding sequence (Cas protein gene), a guide RNA coding sequence (guide RNA gene).
  • the guide RNA coding sequence (guide RNA gene) is preferably made functional by a pol III promoter.
  • pol III promoters include mouse and human U6-snRNA promoters, human H1-RNase P RNA promoters, human valine-tRNA promoters, and the like.
  • the selection marker donor DNA is donor DNA for knocking a selection marker into a target region.
  • the donor DNA for the selection marker has an upstream homology arm having a base sequence homologous to the base sequence adjacent to the upstream side of the target region, and a downstream homology arm having a base sequence homologous to the base sequence adjacent to the downstream side of the target region.
  • the nucleotide sequence of one or more selectable marker genes is included between the two.
  • the donor DNA for selection marker is not particularly limited, but for example, 1 kb or more, 2 kb or more, 3 kb or more, 4 kb or more, 5 kb or more, 6 kb or more, 7 kb or more, 8 kb or more, 9 kb or more, 9.5 kb or more, or 10 kb or more. It can have a length.
  • the donor DNA for the selection marker is not particularly limited, but includes, for example, 50 kb or less, 45 kb or less, 40 kb or less, 35 kb or less, 30 kb or less, 25 kb or less, 20 kb or less, 15 kb or less, 14 kb or less, 13 kb or less, 12 kb or less, 11 kb or less, It may have a length of 10 kb or less, 9 kb or less, 8 kb or less, 7 kb or less, 6 kb or less, 5 kb or less, or 4 kb or less.
  • Selection marker means a protein that allows cells to be selected based on the presence or absence of its expression.
  • a selectable marker gene is a gene encoding a selectable marker.
  • the selectable marker When selecting cells expressing a selectable marker in a cell population in which selectable marker-expressing cells and non-expressing cells coexist, the selectable marker is referred to as a "positive selection marker” or “selection marker for positive selection.”
  • the selectable marker is referred to as a "negative selection marker” or a “selection marker for negative selection.”
  • selectable markers are different from each other, it is meant that they are distinguishable from each other (e.g., different from each other in a distinguishable manner), e.g.
  • the selection markers being different from each other means that a plurality of different selection markers can be detected in a manner that is distinguishable from other selection markers, or that a drug can be selected in a manner that is distinguishable from other selection markers.
  • the selection marker gene being unique to each type of selection marker donor DNA means that the selection marker gene possessed by one type of selection marker donor DNA is not included in selection marker donor DNA of a type other than the above. If it is contained in multiple types of donor DNA, it means that it is configured so that it is not expressed from two or more types of donor DNA at the same time. At this time, the two or more types of donor DNA may be the same except for the selection marker, or may be different in sequence and/or structure other than the selection marker.
  • the positive selection marker is not particularly limited as long as it can select cells that express it.
  • positive selection marker genes include drug resistance genes, fluorescent protein genes, luminescent enzyme genes, and chromogenic enzyme genes.
  • the negative selection marker is not particularly limited as long as it can select cells that do not express it.
  • negative selection marker genes include suicide genes (such as thymidine kinase), fluorescent protein genes, luminescent enzyme genes, and chromogenic enzyme genes.
  • suicide genes such as thymidine kinase
  • fluorescent protein genes such as thymidine kinase
  • luminescent enzyme genes such as thymidine kinase
  • chromogenic enzyme genes e.g, a suicide gene
  • the negative selection marker gene may be operably linked to an inducible promoter. By operably linking to an inducible promoter, the negative selection marker gene can be expressed only when it is desired to eliminate cells that carry the negative selection marker gene. If the negative selection marker gene has little negative impact on cell survival, such as when it is an optically detectable marker gene (visible marker gene) such as fluorescence, luminescence, or color development, It may also be expressed in a specific manner.
  • visible marker gene visible marker gene
  • Examples of drug resistance genes include puromycin resistance gene, blasticidin resistance gene, geneticin resistance gene, neomycin resistance gene, tetracycline resistance gene, kanamycin resistance gene, zeocin resistance gene, hygromycin resistance gene, chloramphenicol resistance gene, etc. These include, but are not limited to.
  • Examples of the fluorescent protein gene include, but are not limited to, a green fluorescent protein (GFP) gene, a yellow fluorescent protein (YFP) gene, a red fluorescent protein (RFP) gene, and the like.
  • Examples of luminescent enzyme genes include, but are not limited to, luciferase genes.
  • chromogenic enzyme gene examples include, but are not limited to, a ⁇ -galactosidase gene, a ⁇ -glucuronidase gene, an alkaline phosphatase gene, and the like.
  • suicide genes include, but are not limited to, herpes simplex virus thymidine kinase (HSV-TK), inducible caspase 9, and the like.
  • the selection marker gene possessed by the selection marker donor DNA is preferably a positive selection marker gene. That is, cells expressing the selection marker can be selected as cells into which the selection marker gene has been knocked in.
  • the upstream homology arm has a base sequence capable of homologous recombination with the base sequence upstream of the target region in the genome to be modified, for example, has a base sequence homologous to the base sequence adjacent to the upstream side of the target sequence.
  • the downstream homology arm has a base sequence capable of homologous recombination with the base sequence upstream of the target region in the genome to be modified, for example, has a base sequence homologous to the base sequence adjacent to the downstream side of the target sequence.
  • the length and sequence of the upstream homology arm and the downstream homology arm are not particularly limited as long as they are capable of homologous recombination with the surrounding region of the target region.
  • the upstream homology arm and the downstream homology arm do not necessarily need to completely match the upstream or downstream sequence of the target region, as long as homologous recombination is possible.
  • the upstream homology arm can be a sequence that has 90% or more sequence identity (homology) with the base sequence adjacent to the upstream side of the target region, such as 92% or more, 93% or more, 94% or more, Preferably, the sequence identity is 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more.
  • the downstream homology arm can be a sequence that has 90% or more sequence identity (homology) with a base sequence adjacent to the downstream side of the target region, such as 92% or more, 93% or more, 94% or more, Preferably, the sequence identity is 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more.
  • sequence identity is 95% or more, 96% or more, 97% or more, 98% or more, or 99% or more.
  • the upstream homology arm and the downstream homology arm is closer to the cleavage site in the target region, the allele modification efficiency can be further enhanced.
  • “close” may mean that the distance between two sequences is 100 bp or less, 50 bp or less, 40 bp or less, 30 bp or less, 20 bp or less, or 10 bp or less.
  • the selection marker gene is located between the upstream homology arm and the downstream homology arm.
  • the selectable marker gene is introduced into the target region by HDR (if the gene is destroyed by this, the gene is knocked out).
  • a desired gene is introduced by this method, it is also possible to knock out a gene and knock in another gene (known as gene knock-in).
  • the selectable marker gene is preferably operably linked to a promoter so that it is expressed under the control of an appropriate promoter.
  • the promoter can be appropriately selected depending on the type of cells into which the donor DNA is introduced. Examples of promoters include SR ⁇ promoter, SV40 early promoter, retrovirus LTR, CMV (cytomegalovirus) promoter, RSV (Rous sarcoma virus) promoter, HSV-TK (herpes simplex virus thymidine kinase) promoter, EF1 ⁇ promoter, metallothionein. Examples include promoters, heat shock promoters, and the like.
  • the selection marker donor DNA may have any control sequences such as enhancers, polyA addition signals, and terminators.
  • the donor DNA for selection marker may have an insulator sequence.
  • Insulators refers to a sequence that blocks or alleviates the influence of the adjacent chromosomal environment and guarantees or enhances the independence of transcriptional regulation of the DNA sandwiched between the regions. Insulators have an enhancer blocking effect (by inserting between the enhancer and the promoter, the effect of blocking the influence of the enhancer on promoter activity) and a suppressing effect on the position effect (by inserting the introduced gene between both sides of the insulator). , the effect of making the expression of a transgene unaffected by the genomic location where it is inserted).
  • the selection marker donor DNA may have an insulator sequence between the upstream arm and the selection marker gene (or between the upstream arm and the promoter that controls the selection marker gene).
  • the selection marker donor DNA may have an insulator sequence between the downstream arm and the selection marker gene.
  • the donor DNA for selection marker may be linear or circular, but is preferably circular.
  • the donor DNA for the selectable marker is a plasmid.
  • the selection marker donor DNA may contain any sequence in addition to the above sequences.
  • a spacer sequence may be included in all or part of the sequences of the upstream homology arm, insulator, selection marker gene, and downstream homology arm.
  • donor DNA for selection markers of the same number or more types as the number of alleles targeted for genome modification are introduced into cells.
  • Different types of selection marker donor DNA have mutually different (distinguishable) types of selection marker genes.
  • donor DNA for different types of selectable markers do not have completely identical selectable marker genes or sets thereof. That is, the first type of selection marker donor DNA has the first type of selection marker gene, and the second type of selection marker donor DNA has the second type of selection marker gene.
  • the third type of selection marker donor DNA has the third type of selection marker gene, and the same applies to the subsequent types of selection marker donor DNA. When there are two alleles targeted for genome modification, there are two or more types of selection marker donor DNA.
  • one selection marker donor DNA may have two or more types of mutually different (distinguishable) selection markers (even in this case, different types of selection marker donor DNA must have mutually different (distinguishable) types (eg, unique) selection marker genes).
  • the donor DNA for a selectable marker does not have a recombination sequence of a site-specific recombinase (eg, a loxP sequence and its variants that are recombined by Cre recombinase).
  • the methods of the invention do not use site-specific recombination enzymes and recombination sequences thereof (eg, loxP sequences and variants thereof that are recombined by Cre recombinase).
  • site-specific recombinase usually one recombination sequence of the site-specific recombinase remains in the edited genome.
  • the modified genome of the cell obtained by the method of the invention does not have the recombination sequence (which is foreign) of the site-specific recombinase.
  • the number of types of donor DNA for selection markers may be at least the same as the number of alleles targeted for genome modification, and the upper limit is not particularly limited. By using donor DNA for selection markers of the same number or more types as the number of alleles targeted for genome modification, two or more alleles can be stably modified.
  • the number of types of donor DNA for selection markers is preferably the same as the number of alleles targeted for genome modification or 1 to 2 more than the number of alleles targeted for genome modification, from the viewpoint of the selection operation in step (b) described below. More preferably, the number is the same as the number of alleles.
  • the method for introducing the above (i) and (ii) into cells is not particularly limited, and known methods can be used without particular limitations.
  • Examples of methods for introducing (i) and (ii) into cells include virus infection method, lipofection method, microinjection method, calcium phosphate method, DEAE-dextran method, electroporation method, particle gun method, etc. but not limited to.
  • two or more selection marker donor DNAs can be randomly knocked into two or more alleles of the target region if their respective upstream homology arms and downstream homology arms are the same.
  • two or more donor DNAs for selection markers may be used as long as they each have a homology arm nucleotide sequence that is capable of homologous recombination with the upstream and downstream sequences of the target regions of two or more alleles. It is not necessary to have completely identical homology arm nucleotide sequences because each allele of the nucleotide sequence can be modified.
  • the base sequences of the upstream and downstream homology arms thereof have base sequences with higher identity to the upstream and downstream sequences of the target region of each allele. (e.g., may be optimized as such).
  • the donor DNA for selection marker has an upstream homology arm and a downstream homology arm, and has a selection marker gene between the upstream homology arm and the downstream homology arm, and preferably has a cleavage site for meganuclease or the like. It may further have a target sequence for an endonuclease (base sequence-specific nucleic acid cleaving molecule).
  • the selection marker includes a selection marker gene for positive selection and a marker gene for negative selection.
  • the selection marker includes a selection marker for positive selection, but may not include a negative selection marker gene.
  • a selectable marker gene for positive selection can also be used for negative selection, and such marker genes include visualization marker genes.
  • the set of two or more selection marker donor DNAs is a combination of the above-mentioned selection marker donor DNAs, and each has a selection marker gene for positive selection that is distinguishable from the other.
  • the above set may further have a target sequence for an endonuclease (base sequence-specific nucleic acid cleaving molecule) such as a meganuclease cleavage site, and the target sequences may be different from each other but are the same (or the same). (can be cleaved with a base sequence-specific nucleic acid cleavage molecule).
  • the length of the donor DNA for selection marker is as described above, and may be, for example, 5 kbp or more, 8 kbp or more, or 10 kbp or more.
  • step (b) After the step (a), step (b) is performed.
  • step (b) cells into which two or more alleles have been introduced with distinguishably different selectable marker genes or a combination thereof are selected based on the expression of the distinguishably different selectable marker genes. More specifically, in step (b), different types of selection marker donor DNAs undergo homologous recombination with the two or more alleles, thereby imparting distinguishably different unique selections to the two or more alleles. A marker gene is introduced, and cells expressing all of the introduced distinguishably different selection marker genes are selected.
  • step (b) different selection marker donors are selected based on the expression of all selection marker genes that are included in the two or more selection marker donor DNAs and have been integrated into the chromosomal genome. Cells in which each allele has been modified by introducing the DNA are selected. In one embodiment, in step (b), cells are selected based on all selection marker genes possessed by the two or more types of selection marker donor DNAs. In one aspect, in step (b), the expression of all selection marker genes (marker genes for positive selection) that are included in the two or more types of selection marker donor DNAs and that have been integrated into the chromosomal genome. Based on this, cells whose respective alleles have been modified by introducing a distinguishable selection marker donor DNA are selected.
  • the cells obtained in step (b) have marker genes for positive selection, each allele of which is different.
  • the cells obtained in step (b) have a marker gene for positive selection in common for each allele; in some embodiments, step (b) does not involve single cell cloning; The method may or may not include performing single cell cloning after selecting cells in which two or more alleles have been modified in step (b).
  • the selection of cells is based on the expression of multiple distinct positive selection marker genes introduced into each allele.
  • step (b) is not performed in a manner that estimates the number of modified alleles based on the expression intensity of a single selectable marker gene (eg, the expression intensity or fluorescence intensity of a fluorescent protein).
  • a single selectable marker gene eg, the expression intensity or fluorescence intensity of a fluorescent protein.
  • step (b) cells may be selected as appropriate depending on the type of selection marker gene used in step (a). At this time, cells are selected based on the expression of all the selection marker genes used in step (a).
  • the selectable marker gene is a positive selectable marker gene
  • cells expressing all selectable marker genes that are (or have been) integrated into the chromosomal genome to be modified can be selected, e.g. cells expressing a number of positive selection markers can be selected.
  • the positive selection marker gene is a drug resistance gene
  • cells expressing the positive selection marker can be selected by culturing the cells in a medium containing the drug.
  • the positive selection marker gene is a fluorescent protein gene, a luciferase gene, or a chromogenic enzyme gene
  • the positive selection marker Cells expressing the expression can be selected.
  • the number of alleles to be modified is n or less, and when donor DNA for selection markers of the number or more and n or less types is incorporated into the genome, at least the number of alleles to be modified is n or less.
  • the desired allele two or more alleles has been modified.
  • the number of alleles to be modified is n, and this number of types of selection marker donor DNAs are incorporated into the chromosomal genome, and all alleles are modified.
  • the number of selection marker donor DNAs equal to or greater than the number of alleles to be modified is used, so that the number of positive selection markers expressed by the cells is guaranteed to be the same as the number of alleles to be modified. means it has been modified.
  • the number of alleles to be modified is preferably the same as the number of types of selection marker donor DNA.
  • modified cells in step (b), can be selected from a pool comprising cells obtained in step (a) without cloning the cells. By omitting the cloning step, the time required for the process can be reduced.
  • the pool may contain 10 5 or more, 10 6 or more, 10 7 or more, or 10 8 or more cells.
  • the genome modification method of this embodiment may include any steps in addition to the above steps (a) and (b).
  • Examples of the optional steps include the following steps (c) and (d): (c) After the step (b), an upstream homology arm having a base sequence homologous to a base sequence adjacent to the upstream side of the target region, and a base sequence homologous to the base sequence adjacent to the downstream side of the target region; a step of introducing a recombinant donor DNA containing a desired base sequence into the cell between the downstream homology arm having the desired base sequence; and (d) a cell that does not express the negative selection marker after the step (c). The process of selecting.
  • the genome modification method of this embodiment may include any steps in addition to the above steps (a) and (b).
  • two or more types of selection marker donor DNAs are each positively linked between the upstream homology arm and the downstream homology arm.
  • the selection marker gene for selection, another marker gene for negative selection, and a target sequence, and if the selection marker gene is used for both positive selection and negative selection, It may not have a separate selectable marker gene for negative selection, and may have the following steps (c) and (d), for example: (c) After the step (b), introducing the following (iii) and (iv) into the selected cells to introduce recombinant donor DNA into the two or more alleles; (iii) a genome modification system comprising a sequence-specific nucleic acid cleaving molecule capable of targeting and cleaving said further target sequence, or a polynucleotide encoding said sequence-specific nucleic acid cleaving molecule; (iv) An upstream homology arm having a donor DNA for recombination containing a desired base sequence and having a base sequence capable of homologous recombination with the base sequence upstream of the target region, and a base downstream of the target region.
  • step (c) may be performed.
  • a recombinant donor DNA containing or not containing a desired base sequence between the upstream homology arm and the downstream homology arm is introduced into the cells selected in step (b).
  • step (c) includes an upstream homology arm having a base sequence homologous to a base sequence adjacent to the upstream side of the target region, and a downstream homology arm having a base sequence homologous to the base sequence adjacent to the downstream side of the target region.
  • a recombinant donor DNA containing the desired base sequence between the homology arm and the homology arm is introduced into the cells selected in step (b).
  • the donor DNA for recombination may include a desired knock-in base sequence.
  • the desired base sequence is not particularly limited.
  • a nucleotide sequence in which part or all of the nucleotide sequence in the target region is deleted is used as the desired nucleotide sequence. be able to.
  • a base sequence containing the gene can be used as the desired base sequence.
  • the size of the desired base sequence is not particularly limited and can be any size.
  • the desired base sequence is, for example, 10 bp or more, 20 bp or more, 40 bp or more, 80 bp or more, 200 bp or more, 400 bp or more, 800 bp or more, 1 kbp or more, 2 kbp or more, 3 kbp or more, 4 kbp or more, 5 kbp or more, 6 kbp or more, 7 kbp or more, It can be 8 kbp or more, 9 kbp or more, 10 kbp or more, 15 kbp or more, 20 kbp or more, 40 kbp or more, 80 kbp or more, 100 kbp or more, or 200 kbp or more.
  • cells in which a desired base sequence is knocked into two or more alleles can be efficiently selected. Therefore, it is possible to knock in even large-sized DNA, for example, 5 kbp or more, 8 kbp or more, or 10 kbp or more.
  • the recombinant donor DNA may be shorter in length than the selectable marker donor DNA, for example.
  • the upstream homology arm and downstream homology arm of the donor DNA for recombination may be the same as or different from those of the donor DNA for selection marker.
  • the upstream homology arm and the downstream homology arm included in the donor DNA for selection marker are referred to as “first upstream homology arm” and “first downstream homology arm”
  • the upstream homology arm and downstream homology arm included in the donor DNA for recombination are referred to as “first upstream homology arm” and "first downstream homology arm”.
  • second upstream homology arm and second downstream homology arm are, for example, capable of homologous recombination with the first upstream homology arm or a region upstream thereof, and are capable of homologous recombination with the first upstream homology arm or a region upstream thereof, and As long as homologous recombination with the downstream region is possible, the length and sequence are not particularly limited (in some embodiments, as long as homologous recombination is possible with the surrounding region of the target region, the length and sequence are not particularly limited) .
  • the base sequence of the donor DNA for selection marker it is preferable that the base sequence of the donor DNA for selection marker It is completely removed from the genome by recombination with donor DNA.
  • Various genes carried in the selection marker donor DNA are removed by recombination with the recombination donor DNA.
  • two or more alleles of a cell can each be replaced by donor DNA for recombination.
  • the donor DNA for recombination may have a desired base sequence, so that a cell in which two or more alleles have been modified has the desired base sequence in the modified alleles. That will happen.
  • the desired base sequence is located between the second upstream homology arm and the second downstream homology arm.
  • the donor DNA for recombination includes a foreign gene
  • the foreign gene is preferably functionally linked to a promoter.
  • the donor DNA for recombination may have arbitrary control sequences such as enhancers, polyA addition signals, and terminators.
  • the donor DNA for recombination may have insulator sequences upstream and downstream of the foreign gene.
  • the donor DNA for recombination includes a spacer sequence between the second upstream homology arm and the second downstream homology arm.
  • the donor DNA for recombination when removing cells having a negative selection marker gene possessed by the donor DNA for recombination, the donor DNA for recombination removes the same (or indistinguishable) gene from the gene under conditions under which its toxicity is exhibited. If the DNA is expressed under the conditions below, it is not possible to select cells in which homologous recombination has occurred using the donor DNA for recombination. Therefore, when the donor DNA for recombination removes cells having the negative selection marker gene that the donor DNA for selection marker has, the same (or indistinguishable) gene as the gene concerned is removed under conditions where its toxicity is exhibited. It is configured so that it does not occur. For example, in some embodiments, the donor DNA for recombination does not have a negative selection marker gene and a second target sequence between the second upstream homology arm and the second downstream homology arm.
  • the donor DNA for recombination is preferably introduced into cells together with (i) above.
  • the DNA in the target region is cleaved by the sequence-specific nucleic acid cleavage molecule of the above (i), and then the DNA in the donor DNA for recombination is cleaved by HDR.
  • the desired base sequence is knocked into the target region. Since the cells into which the recombinant donor DNA is introduced in this step are the cells selected in step (b), the base sequence of the selection marker donor DNA has been knocked into the target region.
  • the target sequence of the genome modification system (i) is a base sequence included in the target region after knock-in of donor DNA for selection marker.
  • the target sequence of the genome modification system in step (a) may be referred to as the "first target sequence” and the target sequence of the genome modification system in step (c) may be referred to as the "second target sequence.”
  • the second target sequence any sequence contained in the target region of the cells after step (b) can be used.
  • the second target sequence in the donor DNA for a selectable marker may be a sequence that does not exist on the genome of the cell.
  • the second target sequence in the donor DNA for a selectable marker is a sequence that does not exist on the genome of the cell, and is a sequence that is different from other sequences to the extent that other sequences on the genome are not cleaved by off-targeting. It is.
  • the second target sequence in the selectable marker donor DNA can be a meganuclease cleavage site that does not exist on the genome.
  • the second target sequence is a region other than the negative selection marker gene in step (d).
  • the donor DNA for recombination is configured so that homologous recombination by the donor DNA for recombination is not significantly inhibited. If the first target sequence remains in the target region of the cell after step (b) or if the first target sequence is reintroduced by the selectable marker donor DNA, the second target sequence It may be the same as or different from the target sequence.
  • the donor DNA for recombination does not need to contain a nucleotide sequence between the upstream homology arm and the downstream homology arm, but there is a nucleotide sequence of 10 bp or less, 20 bp or less, 30 bp or less, 40 bp or less between the upstream homology arm and the downstream homology arm. , 50bp or less, 60bp or less, 70bp or less, 80bp or less, 90bp or less, 100bp or less, 200bp or less, 300bp or less, 400bp or less, 500bp or less, 600bp or less, 700bp or less, 800bp or less, 900bp or less, or 1kbp or less May contain.
  • the donor DNA for recombination has a length of 1 kbp or more, 2 kbp or more, 3 kbp or more, 4 kbp or more, 5 kbp or more, 6 kbp or more, 7 kbp or more, 8 kbp or more, 9 kbp or more, or 10 kbp or more between the upstream homology arm and the downstream homology arm. It may also contain a base sequence.
  • the donor DNA for recombination contains, between the upstream homology arm and the downstream homology arm, a selection marker gene, a target sequence of a site-specific recombinase, a gene encoding a bioactive factor, and a cytotoxic factor. , and one or more genes selected from the group consisting of promoter sequences, or one or more genes selected from the group consisting of promoter sequences, or one or more genes selected from the group consisting of promoter sequences.
  • step (c) donor DNA for recombination is introduced into the cells selected in step (b).
  • the cells selected in step (b) have a selection marker gene knocked into the target region.
  • Step (c) can also be said to be a step of removing or replacing the selection marker gene knocked into the target region with a desired base sequence.
  • step (d) After step (c), step (d) may be performed. In step (d), cells that do not express the negative selection marker are selected.
  • donor DNA for selection markers in step (a) may each contain a positive selection marker gene and a negative selection marker gene. That is, the selection marker donor DNA used in step (a) may include a positive selection marker gene and a negative selection marker gene between the upstream homology arm and the downstream homology arm. The positional relationship between the positive selection marker gene and the negative selection marker gene is not particularly limited, and the positive selection marker gene may be upstream of the negative selection marker gene, or vice versa.
  • the selection marker donor DNA has a positive selection marker gene and a negative selection marker gene, a base sequence encoding a self-cleaving peptide or an IRES (internal A ribozyme entry site) arrangement or the like may be present.
  • IRES internal A ribozyme entry site
  • a positive selection marker gene and a negative selection marker gene can be expressed independently from one promoter.
  • the 2A peptide include 2A peptide (F2A) derived from foot-and-mouth disease virus (FMDV), 2A peptide (E2A) derived from equine rhinitis A virus (ERAV), 2A peptide (P2A) derived from Porcine teschovirus (PTV-1), and Examples include 2A peptide (T2A) derived from Thosea asigna virus (TaV).
  • the same selection marker gene may be used as a positive selection marker in step (a) and as a negative selection marker in step (d).
  • the selection marker gene is a marker gene (visualization marker gene) involved in fluorescence or color development such as a fluorescent protein gene, a luminescent enzyme gene, or a chromogenic enzyme gene
  • the step (a) cells exhibiting fluorescence, luminescence, or coloring due to expression of a chromogenic enzyme may be selected, and in step (c), cells in which these fluorescence, luminescence, or coloring have disappeared may be selected.
  • the same selection marker gene serves both as a positive selection marker and a negative selection marker is also included if the selection marker donor DNA further has a negative selection marker in addition to the positive selection marker.
  • the negative selection marker gene may be different or the same for each type of selection marker donor DNA. By using a common negative selection marker gene, the cell selection operation in step (d) becomes easier.
  • step (d) cells may be selected as appropriate depending on the type of negative selection marker gene used in step (a). At this time, cells that do not express any of the negative selection marker genes used in step (a) are selected.
  • the negative selection marker gene is a visualization marker gene such as a fluorescent protein gene, a luminescent enzyme gene, or a chromogenic enzyme gene
  • the negative selection marker gene is a suicide gene
  • cells that do not express the negative selection marker can be selected by culturing the cells in a medium containing a drug that exhibits toxicity due to expression of the suicide gene.
  • the thymidine kinase gene is used as the suicide gene, cells may be cultured in a medium containing ganciclovir.
  • Loss of expression of the negative selection marker gene means that the negative selection marker gene integrated into the target region in step (a) has been replaced with a polynucleotide containing the desired base sequence of the donor DNA for recombination. At this time, it is considered that the replacement of the polynucleotide occurs in the entire base sequence knocked in in step (a). Therefore, by selecting cells in which expression of the negative selection marker gene has disappeared, cells in which the nucleotide sequence knocked in in step (a) has been replaced with the desired nucleotide sequence of the donor DNA for recombination can be efficiently selected. can do.
  • a negative selection marker gene such as a suicide gene may be operably linked to an inducible promoter, and the inducible promoter is driven so that the negative selection marker gene is expressed under conditions where its toxicity is exhibited.
  • Cells that do not express the negative selection marker can be selected by culturing the cells in the presence of the drug.
  • the negative selection marker gene may be a gene encoding a cytotoxin (eg, ricin and diphtheria toxin) that causes toxicity to cells just by its expression.
  • step (d) cells in which two or more alleles have been modified (cells in which a negative selection marker gene is absent) are extracted from a pool containing cells obtained in step (c) without cloning cells. ) can be selected.
  • the pool may contain 10 5 or more, 10 6 or more, 10 7 or more, or 10 8 or more cells.
  • step (c) and step (d) it is possible to efficiently obtain cells in which all alleles possessed by the cells have been modified to the desired sequence. Furthermore, since it is possible to reliably obtain cells in which all alleles have been modified, even if the desired base sequence is large in size (for example, 10 kbp or more), cells in which the base sequence has been knocked into the target region can be obtained. can be acquired efficiently.
  • the target region is deleted in all alleles possessed by the cell, and the front and back (i.e., the upstream homology arm and the downstream homology arm, respectively) undergo homologous recombination.
  • the base sequences on the upstream and downstream sides of the deleted region are seamlessly linked.
  • step (e) can be performed after step (b).
  • step (e) narrows the target region and reduces the number of genes to be deleted from the genome. , including identifying genes that affect cell growth or survival. If the target region contains only one gene, this indicates that the gene is a gene that affects cell proliferation or survival. Then, if a gene that affects cell proliferation or survival is identified, step (f) can be performed. Step (f) involves knocking into another region of the genome (e.g., safe harbor region, etc.) that modifies the gene that affects proliferation or survival of the identified cells ⁇ the knock-in involves the use of donor DNA for recombination). may be used ⁇ .
  • another region of the genome e.g., safe harbor region, etc.
  • the area to be shaved by the method of the present invention can be expanded (the target area can be expanded upstream and/or downstream).
  • the small number of surviving cells can be confirmed by comparison with the number of cells obtained when steps (a) and (b) are performed on a region that does not affect cell survival or proliferation.
  • step (a) may not target a region where cell proliferation or survival is abolished.
  • the present invention can, for example, insert a desired gene into the chromosomal region (i) or a region other than (i) (for example, a safe harbor region, etc.) into the genomic DNA of a cell having a deletion in the chromosomal region (i). Including knocking into.
  • Such a cell has a deletion in the chromosomal region (i), and has a deletion in the chromosomal region (i) or a region other than (i) (e.g., the region (ii) above having the deletion and a safe harbor region, etc.) ) has a genome containing the gene encoding the desired gene.
  • the invention provides a genome modification kit for modifying two or more alleles of a chromosomal genome.
  • the genome modification kit includes the following (i) and (ii): (i) a genome modification system comprising a sequence-specific nucleic acid cleaving molecule targeting a target region of the chromosomal genome, or a polynucleotide encoding the sequence-specific nucleic acid cleaving molecule; and (ii) A base sequence of a selection marker gene is contained between a downstream homology arm having a base sequence homologous to the adjacent base sequence and a downstream homology arm having a base sequence homologous to the base sequence adjacent to the downstream side of the target region.
  • two or more types of donor DNA for selection markers have mutually different selection marker genes, and the number of types of the donor DNA for selection markers is the same as that of genome modification.
  • Two or more types of donor DNA for selection markers the number of which is the same or more than the number of target alleles.
  • the present invention is a genome modification kit for modifying two or more alleles of a chromosomal genome, including the following (i) and (ii).
  • a genome modification system comprising a sequence-specific nucleic acid cleaving molecule capable of targeting and cleaving the target region of the chromosomal genome, or a polynucleotide encoding the sequence-specific nucleic acid cleaving molecule;
  • two or more types of donor DNA for selection markers including an upstream homology arm having a base sequence capable of homologous recombination with the base sequence upstream of the target region; and a base sequence downstream of the target region; It has a downstream homology arm having a base sequence capable of homologous recombination, and includes a base sequence of a selection marker gene between the upstream homology arm and the downstream homology arm, and the two or more types of selection marker donor DNAs are mutually Two or more types of selectable marker donor DNA, each having a
  • the selection marker gene may be unique for each type of selection marker donor DNA.
  • the kit may be used in the method of the present invention. The above kit may be used in a method for producing cells in which two or more alleles of the chromosomal genome have been modified.
  • the present invention provides a cell in which two or more alleles of the chromosomal genome have been modified, and each of the two or more alleles has a mutually different (distinguishable) selection marker gene.
  • the cell can be a cell of a unicellular organism.
  • the cells can be isolated cells.
  • the cells can be cells selected from the group consisting of pluripotent cells and pluripotent stem cells (such as embryonic stem cells and induced pluripotent stem cells).
  • the cells can be tissue stem cells.
  • the cell can be a somatic cell.
  • the cell can be a germline cell (eg, a germ cell).
  • the cell can be a cell line. In certain embodiments, the cells can be immortalized cells. In certain embodiments, the cell can be a cancer cell. In certain embodiments, the cells can be non-cancerous cells. In certain embodiments, the cells can be cells from a diseased patient. In certain embodiments, the cells can be from healthy individuals. In certain embodiments, the cells are animal cells (e.g., human cells), e.g., insect cells (e.g., silkworm cells), HEK293 cells, HEK293T cells, Expi293FTM cells, FreeStyleTM 293F cells, Chinese hamster ovary cells.
  • animal cells e.g., human cells
  • insect cells e.g., silkworm cells
  • HEK293 cells HEK293T cells
  • Expi293FTM cells FreeStyleTM 293F cells
  • Chinese hamster ovary cells Chinese hamster ovary cells.
  • CHO cells CHO-S cells, CHO-K1 cells, and ExpiCHO cells, and cells derived from these cells.
  • all alleles of the target region of the chromosomal genome are modified, and the modified regions each have a mutually different (distinguishable) selection marker gene.
  • a method for culturing a cell in which two or more alleles of the chromosomal genome have been modified, and each of the two or more alleles has a mutually different (distinguishable) selection marker gene. be done. If the selectable marker gene is a drug resistance marker gene, the culture may be grown in the presence of a drug for the respective drug resistance marker gene. Culturing can be performed under conditions suitable for maintenance or proliferation of cells.
  • the present invention provides a non-human organism having a chromosomal genome in which two or more alleles have been modified, and each of the two or more alleles has a mutually different (distinguishable) selection marker gene.
  • a non-human organism is provided.
  • the cell can be a cell of a unicellular organism.
  • the non-human organism is yeast (e.g., fission yeast or budding yeast, e.g., Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces fragilis).
  • the non-human organism can be an organism selected from the group consisting of yeasts such as the genus Aspergillus, Trichoderma, Humicola, Acremonium, etc.
  • the non-human organism can be a multicellular organism.
  • the non-human organism can be a non-human animal.
  • the non-human organism can be a non-human animal.
  • the organism may be a plant.
  • all alleles of the target region of the chromosomal genome are modified, and the modified regions each contain mutually different (distinguishable) selection marker genes. has.
  • one or more desired genes may be contained or gathered in other regions of the chromosomal genome.
  • Other areas may be, for example, safe harbor areas (eg, AAVS1 areas, etc.).
  • the other region may be, for example, the region (ii) above having a deletion.
  • HLA includes HLA-A, B, C, E, F, G, H, J, and W; MICA and MICB; and HLA-DRA, DRB1, DRB5, DRB6, DRB9, DQA1, DQA2, DQB1, DPA1, DPB1, DMB, DOA, and DOB were searched as queries.
  • the results were as shown in Figures 1 to 25, respectively.
  • the multiple similar sequences include (i) a chromosomal region corresponding to the chromosomal region of chr6:29,723,464-29,945,455 of the hg38 genome sequence, (ii) chr6 of the hg38 genome sequence: 31,269,169-31,357,158, (iii) a chromosomal region corresponding to the chr6:32,439,951-32,816,951 chromosomal region of the hg38 genome sequence, and (iv) It was present in a chromosomal region corresponding to chr6:33,006,838-33,086,238 of the hg38 genome sequence.
  • the present invention provides cells deficient in at least one of (i) to (iv), preferably two, more preferably three, and still more preferably four. Such cells lack at least one HLA and are easy to sequence around the deleted region. Therefore, it is suitable for clarifying the success or failure of further editing by sequencing.
  • 2021/206054 discloses donor DNA having an upstream homology arm and a downstream homology arm adjacent to the region to be deleted, and a mutually distinguishable selection marker between the upstream homology arm and the downstream homology arm, the first genomic DNA portion to which the upstream homology arm hybridizes and the second genomic DNA portion to which the downstream homology arm hybridizes, or preferably by contacting with genomic DNA having a cleavage in both.
  • the genomic DNA region that existed between the genomic DNA part and the second genomic DNA part is deleted and replaced with a sequence (third sequence) between the upstream homology arm and the downstream homology arm.
  • the third sequence can also be removed from genomic DNA, resulting in genomic DNA in which the first genomic DNA portion and the second genomic DNA portion are seamlessly linked.
  • regions (i) to (iv) were considered to be difficult to sequence. Therefore, by deleting at least one region that is thought to be difficult to sequence, it becomes easier to sequence the deleted region. Furthermore, by deleting repetitive sequences, the risk of genome editing targets unexpectedly appearing in other repetitive sequences and causing off-target modifications can be reduced. Furthermore, since the modified genomic DNA can be easily sequenced, it is possible to confirm whether the modification has been made as intended.
  • cells deficient in at least one of (i) to (iv), preferably two, more preferably three, and even more preferably four of (i) to (iv) can be created using UKiS.
  • UKiS technology a unique sequence on the genome is required. By targeting the unique sequence, deletions can be introduced in a sequence-specific manner. In the case of deletions in small regions, accurate homologous recombination is difficult because the target sequences for homologous recombination constitute repeat sequences.
  • a unique sequence on the genome can be selected as a target sequence for homologous recombination and deletion can be carried out as appropriate.
  • Figures 27 to 34 show the results of searches performed to identify the telomere-side boundaries and centromere-side boundaries for (i) to (iv) above. According to FIG. 27, regions 1 and 2 cannot be targeted because they have similar sequences, whereas region 3 is a unique sequence with no similar sequences, so it cannot be targeted. This can be a candidate for an array that can be
  • Example 2 Preparation of cells with HLA deficiency
  • the technology of the present disclosure was applied to cells to induce HLA deficiency.
  • cells iPS cells having the ability to differentiate into various cells were used.
  • Marker insertion OptiMEM 50 ⁇ L, gRNA/Cas9 expression plasmid for cutting marker insertion sequence 300 ng, donor plasmid (GFP-Puro) 100 ng, donor plasmid (RFP-Blst) 100 ng, Lipofectamine Stem transfection reagent Mix 2 ⁇ L and bring to room temperature The transfection solution incubated for 5 minutes was added to the 24-well plate seeded with cells.
  • the donor plasmid (GFP-Puro) had a gene encoding green fluorescent protein (GFP) operably linked to the EF1 promoter and a drug resistance gene, the puromycin resistance gene (Puro). GFP and Puro were linked via the T2A sequence.
  • the donor plasmid had genes encoding red fluorescent protein (RFP) and the drug resistance gene blasticidin resistance gene (Blst) operably linked to the EF1 promoter. RFP and Blst were linked via the T2A sequence.
  • RFP and Blst were linked via the T2A sequence.
  • the details were as shown in Example 1 of WO2021/206054 and FIG. 1.
  • the marker carried on the donor plasmid is referred to as a UKiS marker, and the cells into which the UKiS marker has been introduced are referred to as UKiS marker-introduced cells.
  • UKiS marker-introduced cells are also referred to as UKiS first stage cells.
  • Drug selection and expansion culture The obtained cells were seeded in a 6-well plate, and drug selection of the cells was performed in the presence of puromycin and blasticidin. StemFitR AK02N (containing 1 ⁇ M puromycin and 10 ⁇ M blasticidin) was used as the drug selection medium. Thereby, the surviving cells after drug selection are those that are resistant to the two drugs, ie, those that have both the puromycin resistance gene and the blasticidin resistance gene. Such cells are theoretically generated when a puromycin resistance gene is introduced into one allele of a region targeted by gRNA and a blasticidin resistance gene is introduced into the other allele. The surviving cells were expanded and cultured to obtain cells having the UKiS marker. Cells with UKiS markers were cloned as needed. Cells were cloned by collecting surviving cells after drug selection one colony at a time and multiplying the cells.
  • Genome purification About 2 ⁇ 10 5 mutated cells were collected and the genome was purified. As primers for genotyping, those shown in Table 1 below were used. PCR was performed by a conventional method.
  • the UKiS marker-introduced cells serve as a platform for various further modifications.
  • the UKiS marker-introduced cells are subjected to further modification, and by cutting the region into which the UKiS marker has been inserted (UKiS marker insertion region) and bringing them into contact with additional donor DNA, the UKiS marker-introduced region can be further modified. It can be replaced with an array of For example, cells in which two different alleles have been introduced with distinguishably different UKiS markers (ie, UKiS marker-introduced cells) are prepared. By selectively cleaving one allele in the UKiS marker insertion region, one allele can be modified. The other allele can be similarly modified.
  • HLA-G and HLA-A in cells were targeted with gRNA and cleaved with Cas9, and the UKiS marker was incorporated into the region (see Figure 36).
  • the outside of the series of regions from HLA-F to HLA-A is targeted with gRNA and cleaved by Cas9, and from HLA-F to HLA-A.
  • Cells (clones 27 and 29) in which the entire series of regions were deleted were obtained (see Figure 36).
  • the region between HLA-C and HLA-B of clone 27 was targeted with gRNA and cleaved with Cas9, and the UKiS marker was incorporated into the region (see FIG. 37).
  • the outside of the series of regions from HLA-F to HLA-A of the clones obtained by drug selection in the presence of Puro and Blst was targeted with gRNA and cleaved with Cas9, and the region from HLA-F to HLA-A was cleaved by Cas9.
  • Cells (clone 6) in which the entire series of regions were deleted were obtained (see Figure 37).
  • HLA-A, HLA-B, and HLA-C were confirmed by flow cytometry. As shown in Figure 28, almost all of the cells before modification (iPS 771-3G WT) were positive for at least one of HLA-A, HLA-B, and HLA-C. On the other hand, in clone 6 obtained by modification, the expression was completely abolished.
  • the expression of pluripotent stem cell markers in the modified cells (clone 6) was confirmed.
  • the modified cells (clone 6) showed expression of pluripotent stem cell markers equivalent to the iPS cells before modification. Therefore, it was revealed that the large-scale deletion of the above HLA region had no significant effect on cell proliferation or pluripotency.
  • the region containing HLA-E from clone 6 was targeted with gRNA and cleaved with Cas9, and the UKiS marker was incorporated into the region (see FIG. 40).
  • the UKiS marker was incorporated into the region (see FIG. 40).
  • eight clones were obtained that had the UKiS marker instead of the region containing HLA-E (see Figure 40).
  • the UKiS marker was removed one by one from one of the eight clones obtained (see Figure 41). As a result, 13 clones were obtained in which the region containing HLA-E was completely deleted (see Figure 41).
  • the HLA class II region was further deleted from clone 6. Specifically, HLA-DQB1 of clone 6 was targeted with gRNA and cleaved with Cas9, and the UKiS marker was incorporated into the region (see Figure 42). Thereafter, the outside of the series of regions from HLA-DRA to HLA-DOB was targeted with gRNA and cleaved with Cas9 to obtain cells (clone 2) in which the series of regions was deleted (see FIG. 42).
  • HLA-DOA of clone 6 was targeted with gRNA and cleaved with Cas9, and the UKiS marker was incorporated into the region (see Figure 43). Thereafter, the outside of a series of regions including HLA-DMB to HLA-DPB2 was targeted with gRNA and cleaved with Cas9 to obtain cells (clones 9 and 13) in which the above series of regions were deleted ( Figure 43). . Further, in the clone obtained in FIG. 42, the HLA region was deleted according to the scheme in FIG. 44. As a result, clones 6 to 9 lacking additional HLA regions were obtained ( Figure 44).
  • HLA-E is deleted from cells (deleting HLA-A to C, F, and G), and a UKiS marker is introduced into that region instead.
  • a scheme for introducing foreign genes is shown. In FIG. 45, HLA-E is deleted from cells (deleting HLA-A to C, F, and G), and a UKiS marker is introduced into that region instead.
  • a scheme for introducing foreign genes is shown. In FIG. 45, HLA-E is deleted from cells (deleting HLA-A to C, F, and G), and a UKiS marker is introduced into that region instead.
  • HLA-E (MAVMAPRTLLLLLSGALALTQTWAGSHSLKYFHTSVSRPGRGEPRFISVGYVDDTQFVRFDNDAASPRMVPRAPWMEQEGSEYWDREETRSARDTAQIFRVNLRTLRGYYNQSEAGSHTLQWMHGCELGPDRRFLRGYEQFAYDGKDYLTLNEDLRSWTAVDTAAQISE Incorporated:
  • As the signal sequence a sequence (AVMAPRTLLLLSG) corresponding to the 2nd to 15th amino acids of HLA-A was used. The results are shown in Figure 45, and the foreign gene was successfully introduced in 6/7 clones.
  • HLA-A to C and E were introduced into arbitrary regions (for example, the HLA-E locus).
  • FIG. 46 for cells in which HLA-E is deleted from cells (deleting HLA-A to C, F, and G) and a UKiS marker is introduced in that region, A scheme for introducing foreign genes is shown.
  • HLA-A, HLA-B, HLA-C, and HLA-E were incorporated into the above gene locus as foreign electrons.
  • Each of these genes included the protein coding region upstream to downstream of the stop codon, and included all introns naturally present in each gene. Specifically, it was as follows.
  • HLA-A includes 2.3 kbp upstream to 1.1 kbp downstream of the coding region
  • HLA-B includes 2.1 kbp upstream to 1.1 kbp downstream of the coding region
  • HLA-C includes 2.2 kbp upstream to 1.1 kbp downstream of the coding region
  • HLA-E included 2.6 kbp upstream to 2.2 kbp downstream of the coding region.
  • HLA-like sequences and polymorphisms In the original iPS cells, expression of HLA was observed, but in the modified cells (LxUDC(1.0)), the genes encoding these HLA were deleted, and the cell surface expression of HLA was actually abolished. (See Figure 49). In contrast, cell surface expression of HLA was confirmed in cells that had integrated HLA-A and B (see Figure 49). Cell surface expression of HLA was also confirmed in cells that had integrated HLA-C and E (see Figure 49). In this way, according to the method of the present disclosure, a desired gene can be integrated for each allele. For example, as in this example, by introducing natural HLA, including regulatory sequences and introns, into cells lacking HLA, it becomes possible to evaluate the expression level and functionality of the introduced HLA. Therefore, it is considered to be useful for expression analysis and functional evaluation of HLA-like sequences and polymorphisms.
  • Sequence listing contents Sequence Number (ID): 1 cttcatctcc gtcggctacg 20 Sequence Number (ID): 2 atgatggaaa actcgatggg 20 Sequence Number (ID): 3 tggaatccgg tataggcgcc 20 Sequence Number (ID): 4 tgagtgaccc gataaaactc 20 Sequence Number (ID): 5 tcttaaaac ttctatatcg 20 Sequence Number (ID): 6 gtgcaactcc cgaataggct 20 Sequence Number (ID): 7 tgggccttat catccgtcaa 20 Sequence Number (ID): 8 tgggtctgtc gagcacaagg 20 Sequence Number (ID): 9 ggtcaaatgc cttgtactcg 20 Sequence Number (ID): 10 gggagggccg gtaccgttga 20

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Developmental Biology & Embryology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本発明は、遺伝子工学、細胞工学、および細胞医薬に適した細胞およびその製造方法を提供する。本発明は、2以上のアレルにおいて特定遺伝子領域に存在する繰り返し配列を除去し、これにより、当該領域の遺伝子ターゲティングまたは配列解読を容易にする技術を提供する。

Description

遺伝子工学、細胞工学、および細胞医薬に適した細胞およびその製造方法

 本発明は、遺伝子工学、細胞工学、および細胞医薬に適した細胞およびその製造方法に関する。

 新規ゲノム編集ツールとしてCRISPR/Casシステムが報告されてから、CRISPR/Casシステムを利用した様々な研究が行われている(例えば、特許文献1)。CRISPR/Casシステムを利用したゲノム編集では、ガイドRNAにより標的化された標的領域がCas9ヌクレアーゼにより二本鎖切断される。二本鎖切断されたDNAは、相同組み換え修復(Homologous Directed Repair:HDR)又は非相同末端再結合(Non-Homologous End-Joining Repair:NHEJ)により修復されることが知られている。HDRでは、標的領域の周辺領域と相同な配列を有するドナーDNAをCRISPR/Casシステムと共に細胞に導入することにより、任意の配列を標的領域に組み込むことができる。

 ゲノム改変技術を用いて、HDRにより2以上のアレルを同時に効率よく改変する技術が開発されている(例えば、特許文献2)。特許文献2では、数百kbの大規模欠失を2以上のアレルで同時に効率よく誘発することができたことが開示されている。

 主要組織適合遺伝子複合体の相違に起因するレシピエントによる移植細胞の拒絶反応の問題に対応するため、MHCクラスIの発現および機能が欠失した細胞を製造する技術が開発されている(例えば、特許文献3)。特許文献3では、MHCクラスIの発現および機能を欠失させるために、β2ミクログロブリン(B2M)をノックアウトすることが提案されている。

国際公開第2014/093661号 国際公開第2021/206054号 国際公開第2012/145384号

 MHCの欠損細胞は、免疫拒絶の問題に対応する有効な手段として開発が進められているが、その手法は、以下の2つに大別される:MHC以外の分子の破壊によって、MHCの細胞表面発現を喪失させる手法、およびMHCのいずれかの分子を破壊する手法。しかしながら、MHC遺伝子座は、繰り返し配列が極めて豊富であり、現在の配列解読技術では遺伝子座を解読することが非常に困難である。仮に特定部分の改変ができていたとしても、繰り返し配列の他の部分が維持されているのか、それも改変されてしまっているのかを分析することが困難である。そのため、MHC遺伝子座の特定遺伝子を標的化する技術では、ゲノムに予測不能な改変が生じている可能性を除外できず、再生医療等で用いる細胞の作製に利用することが困難である。これに対して、MHC以外の分子を破壊することによってMHCの細胞表面発現を喪失させる手法では、当該破壊される分子の働き(例えば、β2ミクログロブリン)が不明であり、破壊による予測不能な問題が生じるリスクも現時点では否定できない。

 そこで、本発明は、MHCの特定領域の配列解読が困難な繰り返し配列を含む大きな領域を欠失させ、または解読可能な領域に置き換えると同時に、MHCの特定遺伝子を欠失させた細胞を提供する。本発明ではまた、2個以上のアレルを効率よく改変することができ、且つ比較的大きな領域の改変が可能な、ゲノム改変方法を用いて、当該細胞を製造する方法を提供する。得られた細胞は、移植用途に適しているか、更なる細胞工学への応用に適している。

 本発明は一例として以下の態様を含む。

[1A] 細胞(特にヒト細胞)であって、欠失を有するゲノムDNA(特にヒトゲノムDNA)を含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:

 (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域(例えば、hg38ゲノム配列のchr6:29,723,464-29,945,455、好ましくはchr6:29,723,464-30,010,618例えば、chr6: 29,722,775-29,945,870、またはchr6: 29,711,000-30,020,000の染色体領域に対応する染色体領域)、

 (ii) HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはhg38ゲノム配列のchr6:31,269,169-31,463,338、例えば、chr6: 31,268,749-31,357,179、またはchr6: 31,176,000-31,534,000に対応する染色体領域)、

 (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:32,445,000-32,816,951、好ましくはchr6:32,439,951-32,817,002の染色体領域に対応する染色体領域)、および

 (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:33,006,838-33,086,238、好ましくは、chr6:33,006,838-33,131,199、例えば、chr6:32,934,636-33,089,696、またはchr6: 33,002,000-33,147,000の染色体領域に対応する染色体領域)

からなる群から選択される1以上(好ましくは全て)の染色体領域中にそれぞれ位置するHLA類似配列集積領域の一部もしくは全体を含む領域の欠失(好ましくは、全体を含む領域の欠失)であり、

 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列の全てを含み、

 前記一部は少なくとも一つながりの領域を含み、前記一つながりの領域は、上記領域にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列からなる群から選択される遺伝子の50%以上を含む、

細胞。

[2A]上記[1A]に記載の細胞であって、前記ゲノムDNAにおいて請求項1に規定された欠失を有する(i)~(iv)のいずれかまたは好ましくはすべては、内在性のHLAおよびHLA類似配列を含まないか、1つしか含まない、細胞。

[3A]上記[1A]または[2A]に記載の細胞であって、前記ゲノムDNAにおいて請求項1に規定された欠失を有する(i)~(iv)のいずれかまたは好ましくはすべては、内在性のHLAおよびHLA類似配列を含まない、細胞。

[4A]上記[1A]~[3A]のいずれかに記載の細胞であって、

 (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域(例えば、hg38ゲノム配列のchr6:29,723,464-29,945,455、好ましくはchr6:29,723,464-30,010,618例えば、chr6: 29,722,775-29,945,870、またはchr6: 29,711,000-30,020,000に対応する染色体領域)中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。

[5A]上記[1A]~[4A]のいずれかに記載の細胞であって、

 (ii) HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはhg38ゲノム配列のchr6:31,269,169-31,463,338、例えば、chr6: 31,268,749-31,357,179、またはchr6: 31,176,000-31,534,000に対応する染色体領域)HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはhg38ゲノム配列のchr6:31,269,169-31,463,338、例えば、chr6: 31,268,749-31,357,179、またはchr6: 31,176,000-31,534,000に対応する染色体領域)中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。

[6A]上記[1A]~[5A]のいずれかに記載の細胞であって、

 (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:32,445,000-32,816,951、好ましくはchr6:32,439,951-32,817,002の染色体領域に対応する染色体領域)、またはchr6: 32,445,000-32,821,000に対応する染色体領域中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。

[7A]上記[1A]~[6A]のいずれかに記載の細胞であって、

 (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:33,006,838-33,086,238、好ましくは、chr6:33,006,838-33,131,199、例えば、chr6:32,934,636-33,089,696、またはchr6: 33,002,000-33,147,000の染色体領域に対応する染色体領域)中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。

[8A]前記欠失が、hg38ゲノム配列のchr6: 29,701,000~29,723,464(例えば、Chr6: 29,709,000-29,711,000)に対応する染色体領域中の特有の配列(第1の配列)中に一方の端を有し、hg38ゲノム配列のchr6: 29,945,455-30,030,000(例えば、Chr6: 30,020,000-30,020,000およびchr6: 30,021,500-30,022,800)に対応する染色体領域中の特有の配列(第2の配列)中に他方の端を有する領域の欠失である、上記[1A]~[7A]のいずれかに記載の細胞。

[9A]前記ゲノムDNAが、制御配列に作動可能に連結された内因性または外来性の所望の遺伝子の挿入を含み、当該挿入は、上記(i)~(iv)のいずれかの領域内、または上記(i)~(iv)の領域以外の領域に位置する、上記[1A]~[8A]のいずれかに記載の細胞。

[10A]前記欠失が、hg38ゲノム配列のchr6: 31,166,000~31,269,169(例えば、Chr6: 31,174,000~31,177,000)に対応する染色体領域中の特有の配列(第3の配列)中に一方の端を有し、hg38ゲノム配列のchr6: 31,357,158~31,544,000(例えば、Chr6: 31,534,000~31,538,000)に対応する染色体領域中の特有の配列(第4の配列)中に他方の端を有する領域の欠失である、上記[1A]~[9A]のいずれかに記載の細胞。

[11A]前記欠失が、hg38ゲノム配列のchr6:32,416,000~33,445,000(例えば、Chr6: 32,440,000~32,448,500)に対応する染色体領域中の特有の配列(第5の配列)中に一方の端を有し、hg38ゲノム配列のchr6:32,439,951-32,831,000(例えば、Chr6: 32,820,500~32,822,500)に対応する染色体領域中の特有の配列(第6の配列)中に他方の端を有する領域の欠失である、上記[1A]~[10A]のいずれかに記載の細胞。

[12A]前記欠失が、hg38ゲノム配列のchr6:32,924,000~33,006,838(例えば、Chr6: 32,999,500~33,002,500)に対応する染色体領域中の特有の配列(第7の配列)中に一方の端を有し、hg38ゲノム配列のchr6: 33,086,238-33,165,000(例えば、Chr6: 33,147,500~33,150,500)に対応する染色体領域中の特有の配列(第8の配列)中に他方の端を有する領域の欠失である、上記[1A]~[11A]のいずれかに記載の細胞。

[13A]上記[1A]~[12A]のいずれかに記載の細胞であって、欠失を有する上記(i)~(iv)は、その染色体領域内に繰り返し配列を有しない、細胞。

[14A]上記[1A]~[13A]のいずれかに記載の細胞であって、機能的なβ2ミクログロブリンおよび機能的なCIITAのいずれかまたは両方を有する、細胞。

[15A]上記[1A]~[14A]のいずれかに記載の細胞であって、HLAクラスIおよび/またはHLAクラスIIを細胞表面に実質的に発現していない、細胞。

[16A]上記[1A]~[15A]のいずれかに記載の細胞であって、欠失が100kbから400kbの大きさである、細胞。

[17A]上記[1A]~[16A]のいずれかに記載の細胞を含む、組成物。

[18A]ゲノムの全アレル(2倍体の場合には2アレル)における領域の欠失(例えば、1Mbまで、または500kbまでの領域の欠失)であって、MHC分子をコードする遺伝子座のMHC類似配列集積領域の一部、または好ましくは全部を含む領域を含む欠失を有するゲノムを有する細胞。

[19A]各MHC類似配列集積領域には、1以下のMHC分子をコードする遺伝子しか含まれない、上記[18A]に記載の細胞。

[20A]各MHC類似配列集積領域には、4以下のMHC分子をコードする遺伝子しか含まれない、上記[18A]に記載の細胞。

[21A]各MHC類似配列集積領域には、MHC分子をコードする遺伝子を含まれない、上記[18A]に記載の細胞。

[22A]上記[18A]に記載の細胞であって、欠失が、MHC分子をコードする遺伝子座のMHC類似配列集積領域の全部を含む領域を含む欠失である、細胞。

[23A]上記[22A]に記載の細胞であって、制御配列と当該制御配列に作動可能に連結された所望の遺伝子をさらに含む、細胞。

[24A]制御配列と当該制御配列に作動可能に連結された所望の遺伝子が、全体として天然に存在しない配列を有する、上記[23A]に記載の細胞。

[25A]制御配列と当該制御配列に作動可能に連結された所望の遺伝子が、天然に存在する(または内在性の)配列を有する、上記[23A]に記載の細胞。

[1B]細胞であって、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:

 (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域(例えば、hg38ゲノム配列のchr6:29,723,464-29,945,455、好ましくはchr6:29,723,464-30,010,618例えば、chr6: 29,722,775-29,945,870、またはchr6: 29,711,000-30,020,000の染色体領域に対応する染色体領域)、

 (ii) HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはhg38ゲノム配列のchr6:31,269,169-31,463,338、例えば、chr6: 31,268,749-31,357,179、またはchr6: 31,176,000-31,534,000に対応する染色体領域)、

 (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:32,445,000-32,816,951、好ましくはchr6:32,439,951-32,817,002の染色体領域に対応する染色体領域)、および

 (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:33,006,838-33,086,238、好ましくは、chr6:33,006,838-33,131,199、例えば、chr6:32,934,636-33,089,696、またはchr6: 33,002,000-33,147,000の染色体領域に対応する染色体領域)

からなる群から選択される1以上(好ましくは全て)の染色体領域中にそれぞれ位置するHLA類似配列集積領域の一部もしくは全体を含む領域の欠失(好ましくは全体を含む領域の欠失)であり、

 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列の全てを含み、

 前記一部は少なくとも一つながりの領域を含み、前記一つながりの領域は、上記領域にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列からなる群から選択される遺伝子の50%以上を含む、

細胞。

[2B]上記[1B]に記載の細胞であって、前記ゲノムDNAにおいて請求項1に規定された欠失を有する(i)~(iv)のいずれかまたはすべては、内在性のHLAおよびHLA類似配列を含まないか、1つしか含まない、細胞。

[3B]上記[1B]または[2B]に記載の細胞であって、前記ゲノムDNAにおいて請求項1に規定された欠失を有する(i)~(iv)のいずれかまたはすべては、内在性のHLAおよびHLA類似配列を含まない、細胞。

[4B]上記[1B]~[3B]のいずれかに記載の細胞であって、

 (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域(例えば、hg38ゲノム配列のchr6:29,723,464-29,945,455、好ましくはchr6:29,723,464-30,010,618例えば、chr6: 29,722,775-29,945,870、またはchr6: 29,711,000-30,020,000に対応する染色体領域)中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。

[5B]上記[1B]~[4B]のいずれかに記載の細胞であって、

 (ii) HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはhg38ゲノム配列のchr6:31,269,169-31,463,338、例えば、chr6: 31,268,749-31,357,179、またはchr6: 31,176,000-31,534,000に対応する染色体領域)HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはhg38ゲノム配列のchr6:31,269,169-31,463,338、例えば、chr6: 31,268,749-31,357,179、またはchr6: 31,176,000-31,534,000に対応する染色体領域)中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。

[6B]上記[1B]~[5B]のいずれかに記載の細胞であって、

 (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:32,445,000-32,816,951、好ましくはchr6:32,439,951-32,817,002の染色体領域に対応する染色体領域)、またはchr6: 32,445,000-32,821,000に対応する染色体領域中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。

[7B]上記[1B]~[6B]のいずれかに記載の細胞であって、

 (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:33,006,838-33,086,238、好ましくは、chr6:33,006,838-33,131,199、例えば、chr6:32,934,636-33,089,696、またはchr6: 33,002,000-33,147,000の染色体領域に対応する染色体領域)中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。

[8B]前記欠失が、hg38ゲノム配列のchr6: 29,701,000~29,723,464(例えば、Chr6: 29,709,000-29,711,000)に対応する染色体領域中の特有の配列(第1の配列)中に一方の端を有し、hg38ゲノム配列のchr6: 29,945,455-30,030,000(例えば、Chr6: 30,020,000-30,020,000およびchr6: 30,021,500-30,022,800)に対応する染色体領域中の特有の配列(第2の配列)中に他方の端を有する領域の欠失である、上記[1B]~[7B]のいずれかに記載の細胞。

[9B]前記ゲノムDNAが、制御配列と当該制御配列に作動可能に連結された内因性または外来性の所望の遺伝子の挿入を含み、当該挿入は、上記(i)~(iv)のいずれかの領域内、または上記(i)~(iv)の領域以外の領域に位置する、上記[1B]~[8B]のいずれかに記載の細胞。

[10B]前記欠失が、hg38ゲノム配列のchr6: 31,166,000~31,269,169(例えば、Chr6: 31,174,000~31,177,000)に対応する染色体領域中の特有の配列(第3の配列)中に一方の端を有し、hg38ゲノム配列のchr6: 31,357,158~31,544,000(例えば、Chr6: 31,534,000~31,538,000)に対応する染色体領域中の特有の配列(第4の配列)中に他方の端を有する領域の欠失である、上記[1B]~[9B]のいずれかに記載の細胞。

[11B]前記欠失が、hg38ゲノム配列のchr6:32,416,000~33,445,000(例えば、Chr6: 32,440,000~32,448,500)に対応する染色体領域中の特有の配列(第5の配列)中に一方の端を有し、hg38ゲノム配列のchr6:32,439,951-32,831,000(例えば、Chr6: 32,820,500~32,822,500)に対応する染色体領域中の特有の配列(第6の配列)中に他方の端を有する領域の欠失である、上記[1B]~[10B]のいずれかに記載の細胞。

[12B]前記欠失が、hg38ゲノム配列のchr6:32,924,000~33,006,838(例えば、Chr6: 32,999,500~33,002,500)に対応する染色体領域中の特有の配列(第7の配列)中に一方の端を有し、hg38ゲノム配列のchr6: 33,086,238-33,165,000(例えば、Chr6: 33,147,500~33,150,500)に対応する染色体領域中の特有の配列(第8の配列)中に他方の端を有する領域の欠失である、上記[1B]~[11B]のいずれかに記載の細胞。

[13B]上記[1B]~[12B]のいずれかのいずれか一項に記載の細胞であって、欠失を有する上記(i)~(iv)は、その染色体領域内に繰り返し配列を有しない、細胞。

[14B]上記[1B]~[13B]のいずれかに記載の細胞であって、機能的なβ2ミクログロブリンおよび機能的なCIITAのいずれかまたは両方を有する、細胞。

[15B]上記[1B]~[14B]のいずれかに記載の細胞であって、HLAクラスIおよび/またはHLAクラスIIを細胞表面に実質的に発現していない、細胞。

[16B]上記[1B]~[15B]のいずれかに記載の細胞であって、欠失が100kbから400kbの大きさである、細胞。

[17B]上記[1B]~[16B]のいずれかに記載の細胞を含む、組成物。

[1C]細胞であって、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:

 (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域(例えば、hg38ゲノム配列のchr6:29,723,464-29,945,455、好ましくはchr6:29,723,464-30,010,618例えば、chr6: 29,722,775-29,945,870、またはchr6: 29,711,000-30,020,000の染色体領域に対応する染色体領域)、

 (ii) HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはhg38ゲノム配列のchr6:31,269,169-31,463,338、例えば、chr6: 31,268,749-31,357,179、またはchr6: 31,176,000-31,534,000に対応する染色体領域)、

 (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:32,445,000-32,816,951、好ましくはchr6:32,439,951-32,817,002の染色体領域に対応する染色体領域)、および

 (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:33,006,838-33,086,238、好ましくは、chr6:33,006,838-33,131,199、例えば、chr6:32,934,636-33,089,696、またはchr6: 33,002,000-33,147,000の染色体領域に対応する染色体領域)

からなる群から選択される1以上(好ましくは全て)の染色体領域中にそれぞれ位置するHLA類似配列集積領域の全体を含む領域の欠失であり、

 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAをコードする遺伝子およびHLA類似配列の全てを含み、

 ゲノムDNAは、HLA-Eをコードする遺伝子の欠失をさらに含んでいてもよく、

 欠失を有する領域のいずれか(例えば、HLA-Eをコードする遺伝子の欠失を有する領域)は、第1のアレルと第2のアレルを有し、前記第1のアレルと第2のアレルはそれぞれ、ネガティブ選択用選択マーカー遺伝子(および好ましくはポジティブ選択用マーカー遺伝子)を含む1以上の選択マーカー遺伝子の塩基配列を含むカセット(それぞれ第1のカセットおよび第2のカセットという)を当該欠失部位に有し、第1のカセットに含まれるネガティブ選択用選択マーカー遺伝子と第2のカセットに含まれる1以上のネガティブ選択用選択マーカー遺伝子は、相互に区別可能に異なり、これにより、第1のカセットまたは第2のカセットをさらに除去または他の配列と置き換える改変に供した後で前記第1のカセットまたは第2のカセットに含まれるネガティブ選択用選択マーカー遺伝子の非発現を指標として前記第1のカセットまたは第2のカセットにおいて改変を有する細胞を選択できる、

細胞。

[2C]細胞であって、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:

 (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域(例えば、hg38ゲノム配列のchr6:29,723,464-29,945,455、好ましくはchr6:29,723,464-30,010,618例えば、chr6: 29,722,775-29,945,870、またはchr6: 29,711,000-30,020,000の染色体領域に対応する染色体領域)、

 (ii) HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはhg38ゲノム配列のchr6:31,269,169-31,463,338、例えば、chr6: 31,268,749-31,357,179、またはchr6: 31,176,000-31,534,000に対応する染色体領域)、

 (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:32,445,000-32,816,951、好ましくはchr6:32,439,951-32,817,002の染色体領域に対応する染色体領域)、および

 (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:33,006,838-33,086,238、好ましくは、chr6:33,006,838-33,131,199、例えば、chr6:32,934,636-33,089,696、またはchr6: 33,002,000-33,147,000の染色体領域に対応する染色体領域)

からなる群から選択される1以上(好ましくは全て)の染色体領域中にそれぞれ位置するHLA類似配列集積領域の全体を含む領域の欠失であり、

 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAをコードする遺伝子およびHLA類似配列の全てを含み、

 ゲノムDNAは、HLA-Eをコードする遺伝子の欠失をさらに含み、

 欠失を有する領域のいずれか(例えば、HLA-Eをコードする遺伝子の欠失を有する領域)は、第1のアレルと第2のアレルを有し、前記第1のアレルは、外来の目的遺伝子を有し、第2のアレルは、ネガティブ選択用選択マーカー遺伝子(および好ましくはポジティブ選択用マーカー遺伝子)を含む1以上の選択マーカー遺伝子の塩基配列を含むカセット(第2のカセットという)を当該欠失部位に有し、これにより、第2のカセットをさらに除去または他の配列と置き換える改変に供した後で前記第2のカセットに含まれるネガティブ選択用選択マーカー遺伝子の非発現を指標として前記第2のカセットにおいて改変を有する細胞を選択できる、

細胞。

[3C]細胞であって、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:

 (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域(例えば、hg38ゲノム配列のchr6:29,723,464-29,945,455、好ましくはchr6:29,723,464-30,010,618例えば、chr6: 29,722,775-29,945,870、またはchr6: 29,711,000-30,020,000の染色体領域に対応する染色体領域)、

 (ii) HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはhg38ゲノム配列のchr6:31,269,169-31,463,338、例えば、chr6: 31,268,749-31,357,179、またはchr6: 31,176,000-31,534,000に対応する染色体領域)、

 (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:32,445,000-32,816,951、好ましくはchr6:32,439,951-32,817,002の染色体領域に対応する染色体領域)、および

 (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:33,006,838-33,086,238、好ましくは、chr6:33,006,838-33,131,199、例えば、chr6:32,934,636-33,089,696、またはchr6: 33,002,000-33,147,000の染色体領域に対応する染色体領域)

からなる群から選択される1以上(好ましくは全て)の染色体領域中にそれぞれ位置するHLA類似配列集積領域の全体を含む領域の欠失であり、

 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAをコードする遺伝子およびHLA類似配列の全てを含み、

 ゲノムDNAは、HLA-Eをコードする遺伝子の欠失をさらに含み、

 欠失を有する領域のいずれか(例えば、HLA-Eをコードする遺伝子の欠失を有する領域)は、第1のアレルと第2のアレルを有し、かつ、

 (1)前記第1のアレルおよび第2のアレルの欠失部位はそれぞれ、外来の目的遺伝子を有する、または、

 (2)第1のアレルおよび第2のアレルの欠失部位のいずれか一方が外来の目的遺伝子を有し、他方は欠失部位の両端が直接的または間接的に(例えば、スペーサーなどを介して間接的に)連結した構造を有する、

細胞。

[4C]第1のアレルは、HLA-A、HLA-B、HLA-C、およびHLA-Eからなる群から選択されるいずれか1つ、2つ、3つ、または全てをコードする外来の遺伝子を含む、上記[2C]に記載の細胞。

[5C]外来の目的遺伝子は、HLA-A、HLA-B、HLA-C、およびHLA-Eからなる群から選択されるいずれか1つ、2つ、3つ、または全てをコードする外来の遺伝子を含み、外来の目的遺伝子はそれぞれ、第1のアレルまたは第2のアレルに含まれる、上記[3C]に記載の細胞。

[6C]前記外来の遺伝子はそれぞれ、当該遺伝子のコード領域の転写開始点より上流の配列、イントロン、およびストップコドンの下流の配列をさらに含む、上記[2C]または[4C]に記載の細胞。

「7C」前記外来の遺伝子はそれぞれ、当該遺伝子のコード領域の転写開始点より上流の配列、イントロン、およびストップコドンの下流の配列をさらに含む、上記[3C]または[5C]に記載の細胞。

[8C]前記上流の配列が、1kbp以上の長さを有する、上記[6C]に記載の細胞。

[9C]前記上流の配列が、1kbp以上の長さを有する、上記[7C]に記載の細胞。

[10C]上記[1C]~[9C]のいずれかに記載の細胞を含む、組成物。

[11C]上記[2C]~[9C]のいずれかに記載の細胞を含む、前記外来の遺伝子の発現および/または機能を解析することに用いるための組成物。

 本発明は一例として以下の態様を含む。

[1]MHC遺伝子座において、染色体ゲノムの2つ以上のアレルを改変するゲノム改変方法(特に染色体ゲノムの2つ以上のアレルを改変して特定遺伝子群を欠失させる方法)であって、

(a)下記(i)及び(ii)を、前記染色体を含む細胞に導入する工程と、

(i)前記染色体ゲノムの標的領域を標的とする配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、

(ii)前記標的領域の上流側に隣接する塩基配列と相同な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側に隣接する塩基配列と相同な塩基配列を有する下流ホモロジーアームとの間に、選択マーカー遺伝子の塩基配列を含む、2種以上の選択マーカー用ドナーDNAであって、前記2種以上の選択マーカー用ドナーDNAは、相互に異なる選択マーカー遺伝子を有し、前記選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とする前記アレルの数と同数以上である、2種以上の選択マーカー用ドナーDNA、

(b)前記工程(a)の後、前記2種以上の選択マーカー用ドナーDNAが有する全ての選択マーカー遺伝子に基づいて、前記細胞を選択する工程と、を含む、ゲノム改変方法。

[2]前記選択マーカー遺伝子がポジティブ選択マーカー遺伝子であり、前記工程(b)が、前記アレルの数と同数の前記ポジティブ選択マーカー遺伝子を発現する細胞を選択する工程である、[1]に記載のゲノム改変方法。

[3]前記選択マーカー用ドナーDNAが、前記上流ホモロジーアームと前記下流ホモロジーアームとの間に、ネガティブ選択マーカー遺伝子をさらに有する、[2]に記載のゲノム改変方法。

[4](c)前記工程(b)の後、前記標的領域の上流側に隣接する塩基配列と相同な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側に隣接する塩基配列と相同な塩基配列を有する下流ホモロジーアームとの間に、所望の塩基配列を含む組換え用ドナーDNAを、前記細胞に導入する工程と、(d)前記工程(c)の後、前記ネガティブ選択マーカー遺伝子を発現しない細胞を選択する工程と、をさらに含む、[3]に記載のゲノム改変方法。

[5]前記ポジティブ選択マーカー遺伝子が薬剤耐性遺伝子であり、前記ネガティブ選択マーカー遺伝子が蛍光タンパク質遺伝子である、[3]又は[4]に記載のゲノム改変方法。

[6]前記配列特異的核酸切断分子が、配列特異的エンドヌクレアーゼである、[1]~[5]のいずれか一つに記載にゲノム改変方法。

[7]前記ゲノム改変システムが、Casタンパク質と、前記標的領域内の塩基配列に相同な塩基配列を有するガイドRNAと、を含む、[6]に記載にゲノム改変方法。

[8]下記(i)及び(ii)を含む、染色体ゲノムの2つ以上のアレルを改変するゲノム改変キット。

(i)前記染色体ゲノムの標的領域を標的とする配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム

(ii)前記標的領域の上流側に隣接する塩基配列と相同な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側に隣接する塩基配列と相同な塩基配列を有する下流ホモロジーアームとの間に、選択マーカー遺伝子の塩基配列を含む、2種以上の選択マーカー用ドナーDNAであって、前記2種以上の選択マーカー用ドナーDNAは、相互に異なる選択マーカー遺伝子を有し、前記選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とする前記アレルの数と同数以上である、2種以上の選択マーカー用ドナーDNA。

[9]前記選択マーカー遺伝子がポジティブ選択マーカー遺伝子である、[8]に記載のゲノム改変キット。

[10]前記選択マーカー用ドナーDNAが、前記上流ホモロジーアームと前記下流ホモロジーアームとの間に、ネガティブ選択マーカー遺伝子をさらに有する、[9]に記載のゲノム改変キット。

[11]前記配列特異的核酸切断分子が、配列特異的エンドヌクレアーゼである、[8]~[10]のいずれか一つに記載にゲノム改変キット。

[12]前記ゲノム改変システムが、Casタンパク質と、前記標的領域内の塩基配列に相同な塩基配列を有するガイドRNAと、を含む、[8]~[11]のいずれか一つに記載にゲノム改変キット。

 本発明は一例として以下の態様を含む。

〔1〕染色体ゲノムの2つ以上のアレルが改変された細胞を作製する方法であって、

(a)下記(i)及び(ii)を、2つ以上のアレルを含む細胞に導入して、前記2つ以上のアレルそれぞれに選択マーカー遺伝子を導入する工程と、

(i)前記染色体ゲノムの2つ以上のアレル中の標的領域を標的とし、当該標的領域を切断することができる配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、

(ii)2種以上の選択マーカー用ドナーDNAであって、それぞれが前記標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側の塩基配列と相同組換え可能な塩基配列を有する下流ホモロジーアームとを有し、かつ、上流ホモロジーアームと下流ホモロジーアームの間に、選択マーカー遺伝子の塩基配列を含み、前記2種以上の選択マーカー用ドナーDNAは、相互に区別可能に異なる選択マーカー遺伝子をそれぞれ有し、前記選択マーカー遺伝子は、選択マーカー用ドナーDNAの種類毎に固有であり、前記選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とする前記アレルの数と同数以上である、2種以上の選択マーカー用ドナーDNA、

(b)前記工程(a)の後、前記2以上のアレルに対して異なる種類の選択マーカー用ドナーDNAがそれぞれ相同組み換えすることによって、当該2以上のアレルにそれぞれ区別可能に異なる固有の選択マーカー遺伝子が導入され、導入された当該区別可能に異なる選択マーカー遺伝子のすべてを発現する細胞を選択する工程(ポジティブ選択のための工程)と、

を含む、方法。

〔2〕染色体ゲノムの2つ以上のアレルを改変する方法であって、

(a)下記(i)及び(ii)を、2つ以上のアレルを含む細胞に導入して、前記2つ以上のアレルそれぞれに選択マーカー遺伝子を導入する工程と、

(i)前記染色体ゲノムの2つ以上のアレル中の標的領域を標的とし、当該標的領域を切断することができる配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、

(ii)2種以上の選択マーカー用ドナーDNAであって、それぞれが前記標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側の塩基配列と相同組換え可能な塩基配列を有する下流ホモロジーアームとを有し、かつ、上流ホモロジーアームと下流ホモロジーアームの間に、選択マーカー遺伝子の塩基配列を含み、前記2種以上の選択マーカー用ドナーDNAは、相互に区別可能に異なる選択マーカー遺伝子をそれぞれ有し、前記選択マーカー遺伝子は、選択マーカー用ドナーDNAの種類毎に固有であり、前記選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とする前記アレルの数と同数以上である、2種以上の選択マーカー用ドナーDNA、

(b)前記工程(a)の後、前記2以上のアレルに対して異なる種類の選択マーカー用ドナーDNAがそれぞれ相同組み換えすることによって、当該2以上のアレルにそれぞれ区別可能に異なる固有の選択マーカー遺伝子が導入され、導入された当該区別可能に異なる選択マーカー遺伝子のすべてを発現する細胞を選択する工程(ポジティブ選択のための工程)と、

を含む、方法。

〔3〕標的領域が5kbp以上の長さを有する、上記〔1〕または〔2〕に記載の方法。

〔4〕標的領域が8kbp以上の長さを有する、上記〔3〕に記載の方法。

〔5〕2種以上の選択マーカー用ドナーDNAがそれぞれ、前記上流ホモロジーアームと前記下流ホモロジーアームの間に、ポジティブ選択用の選択マーカー遺伝子とネガティブ選択用のマーカー遺伝子と標的配列とを有し、ここで、当該選択マーカー遺伝子がポジティブ選択用にもネガティブ選択用にも用いられる場合には、別のネガティブ選択用の選択マーカー遺伝子を有していなくてよく、

(c)前記工程(b)の後、下記(iii)及び(iv)を選択された細胞に導入して前記2以上のアレルに組換え用ドナーDNAを導入する工程と、

(iii)前記標的配列を標的とし、当該標的配列を切断することができる配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、

(iv)所望の塩基配列を含む組換え用ドナーDNAであって、前記標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側の塩基配列と相同組換え可能な塩基配列を有する下流ホモロジーアームを有する、組換え用ドナーDNA、

(d)前記工程(c)の後、前記ネガティブ選択用のマーカー遺伝子を発現しない細胞を選択する工程(ネガティブ選択のための工程)と、

をさらに含む、上記〔1〕~〔4〕のいずれかに記載の方法。

〔6〕2種以上の選択マーカー用ドナーDNAがそれぞれ、前記上流ホモロジーアームと前記下流ホモロジーアームの間に、ポジティブ選択用の選択マーカー遺伝子とネガティブ選択用のマーカー遺伝子と標的配列とを有し、ここで、当該選択マーカー遺伝子がポジティブ選択用にもネガティブ選択用にも用いられる場合には、別のネガティブ選択用の選択マーカー遺伝子を有していなくてよく、

(c)前記工程(b)の後、下記(iii)及び(iv)を選択された細胞に導入して前記2以上のアレルに組換え用ドナーDNAを導入する工程と、

(iii)前記標的配列を標的とし、当該標的配列を切断することができる配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、

(iv)所望の塩基配列を含む組換え用ドナーDNAであって、前記標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側の塩基配列と相同組換え可能な塩基配列を有する下流ホモロジーアームを有する、組換え用ドナーDNA、

(d)前記工程(c)の後、前記ネガティブ選択用のマーカー遺伝子を発現しない細胞を選択する工程(ネガティブ選択のための工程)と、

をさらに含む、上記〔3〕に記載の方法。

〔7〕2種以上の選択マーカー用ドナーDNAがそれぞれ、前記上流ホモロジーアームと前記下流ホモロジーアームの間に、ポジティブ選択用の選択マーカー遺伝子とネガティブ選択用のマーカー遺伝子と標的配列とを有し、ここで、当該選択マーカー遺伝子がポジティブ選択用にもネガティブ選択用にも用いられる場合には、別のネガティブ選択用の選択マーカー遺伝子を有していなくてよく、

(c)前記工程(b)の後、下記(iii)及び(iv)を選択された細胞に導入して前記2以上のアレルに組換え用ドナーDNAを導入する工程と、

(iii)前記標的配列を標的とし、当該標的配列を切断することができる配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、

(iv)所望の塩基配列を含む組換え用ドナーDNAであって、前記標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側の塩基配列と相同組換え可能な塩基配列を有する下流ホモロジーアームを有する、組換え用ドナーDNA、

(d)前記工程(c)の後、前記ネガティブ選択用のマーカー遺伝子を発現しない細胞を選択する工程(ネガティブ選択のための工程)と、

をさらに含む、上記〔4〕に記載の方法。

〔8〕組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域が、5kbp以上の長さを有する、上記〔5〕~〔7〕のいずれかに記載の方法。

〔9〕組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域が、5kbp以上の長さを有する、上記〔6〕または〔7〕に記載の方法。

〔10〕組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域が、5kbp以上の長さを有する、上記〔7〕に記載の方法。

〔11〕組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域が、8kbp以上の長さを有する、上記〔8〕に記載の方法。

〔12〕下記(i)及び(ii)を含む、染色体ゲノムの2つ以上のアレルを改変するゲノム改変キット。

(i)前記染色体ゲノムの標的領域を標的とし、標的領域を切断することができる配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、

(ii)2種以上の選択マーカー用ドナーDNAであって、前記標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側の塩基配列と相同組換え可能な塩基配列を有する下流ホモロジーアームを有し、上流ホモロジーアームと下流ホモロジーアームの間に、選択マーカー遺伝子の塩基配列を含み、前記2種以上の選択マーカー用ドナーDNAは、相互に区別可能に異なる選択マーカー遺伝子を有し、前記選択マーカー遺伝子は、選択マーカー用ドナーDNAの種類毎に固有であり、前記選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とする前記アレルの数と同数以上である、2種以上の選択マーカー用ドナーDNA。

〔13〕標的領域が5kbp以上の長さを有する、上記〔12〕に記載のキット。

〔14〕標的領域が8kbp以上の長さを有する、上記〔13〕に記載のキット。

〔15〕組換え用ドナーDNAをさらに含む、上記〔12〕~〔14〕のいずれかに記載のキット。

〔16〕組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域が、5kbp以上の長さを有する、上記〔12〕~〔15〕のいずれかに記載のキット。

〔17〕組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域が、8kbp以上の長さを有する、上記〔12〕~〔16〕のいずれかに記載のキット。

〔18〕標的領域が5kbp以上の長さを有し、かつ、組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域が、5kbp以上の長さを有する、上記〔12〕に記載のキット。

〔19〕標的領域が8kbp以上の長さを有し、かつ、組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域が、8kbp以上の長さを有する、上記〔18〕に記載のキット。

〔20〕組換え用ドナーDNAが、組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域に塩基配列を有さず、改変後に得られる染色体ゲノムの前記2つ以上のアレルにおいて、標的領域の上流および下流の配列が、塩基の挿入、置換および欠失なく、シームレスに連結している、上記〔5〕に記載の方法。

〔21〕組換え用ドナーDNAが、組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域に塩基配列を有さず、改変後に得られる染色体ゲノムの前記2つ以上のアレルにおいて、標的領域の上流および下流の配列が、塩基の挿入、置換および欠失なく、シームレスに連結している、上記〔6〕または〔7〕に記載の方法。

〔22〕改変後に得られる染色体ゲノムの前記2つ以上のアレルにおいて、部位特異的組換え酵素の標的配列が存在しない、上記〔3〕に記載の方法。

〔23〕改変後に得られる染色体ゲノムの前記2つ以上のアレルにおいて、部位特異的組換え酵素の標的配列が存在しない、上記〔4〕に記載の方法。

〔24〕改変後に得られる染色体ゲノムの前記2つ以上のアレルにおいて、部位特異的組換え酵素の標的配列が存在しない、上記〔5〕に記載の方法。

〔25〕改変後に得られる染色体ゲノムの前記2つ以上のアレルにおいて、部位特異的組換え酵素の標的配列が存在しない、上記〔6〕または〔7〕に記載の方法。

〔26〕工程(b)において、2以上のアレルが改変された細胞を選択するまでの過程では単一細胞クローニングは行われない、上記〔1〕~〔11〕、および〔20〕~〔25〕のいずれかに記載の方法。

〔27〕標的領域に関して染色体ゲノム上に2つ以上のアレルを有する細胞において、前記2つ以上のアレルのそれぞれの標的領域が欠失し、かつ、標的領域の上流および下流の配列が、塩基の挿入、置換および欠失なく、シームレスに連結している、細胞。

〔28〕標的領域が5kbp以上の長さを有する、上記〔27〕に記載の細胞。

〔29〕そのゲノム中に部位特異的組換え酵素の標的配列を有しない、上記〔27〕または〔28〕に記載の細胞。

〔30〕組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域が、8kbp以上の長さを有する、上記〔6〕または〔7〕に記載の方法。

〔31〕組換え用ドナーDNAが、組換え用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームとの間の領域に塩基配列を有さない、上記〔15〕に記載のキット。
本発明は一例として以下の態様を含む。[1D]細胞(特にヒト細胞)であって、欠失を有するゲノムDNA(特にヒトゲノムDNA)を含み、前記欠失は、以下(i)~(iv)に規定される染色体領域: (i) hg38ゲノム配列のchr6: 29,711,000-30,020,000の染色体領域に対応する染色体領域、 (ii) hg38ゲノム配列のchr6: 31,176,000-31,534,000染色体領域に対応する染色体領域、 (iii) hg38ゲノム配列のchr6: 32,445,000-32,821,000染色体領域に対応する染色体領域、および (iv) hg38ゲノム配列のchr6: 33,002,000-33,147,000染色体領域に対応する染色体領域からなる群から選択される1以上の染色体領域中にそれぞれ位置するHLA類似配列集積領域の一部もしくは全体を含む領域の欠失であり、 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列の全てを含み、 前記一部は少なくとも一つながりの領域を含み、前記一つながりの領域は、上記領域にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列からなる群から選択される遺伝子の50%以上を含む、細胞。[2D]上記[1D]に記載の細胞であって、前記ゲノムDNAにおいて請求項1に規定された欠失を有する(i)~(iv)のいずれかまたは好ましくはすべては、内在性のHLAおよびHLA類似配列を含まないか、1つしか含まない、細胞。[3D]上記[1D]または[2D]に記載の細胞であって、前記ゲノムDNAにおいて請求項1に規定された欠失を有する(i)~(iv)のいずれかまたは好ましくはすべては、内在性のHLAおよびHLA類似配列を含まない、細胞。[4D]上記[1D]~[3D]のいずれかに記載の細胞であって、 (i) chr6: 29,711,000-30,020,000の染色体領域中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。[5D]上記[1D]~[4D]のいずれかに記載の細胞であって、 (ii) chr6: 31,176,000-31,534,000の染色体領域中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。[6D]上記[1D]~[5D]のいずれかに記載の細胞であって、 (iii) chr6: 32,445,000-32,821,000の染色体領域中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。[7D]上記[1D]~[6D]のいずれかに記載の細胞であって、 (iv) chr6: 33,002,000-33,147,000の染色体領域中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。[8D]前記欠失が、Chr6: 29,709,000-29,711,000の染色体領域中の特有の配列(第1の配列)中に一方の端を有し、Chr6: 30,020,000-30,020,000の染色体領域およびChr6: 30,021,500-30,022,800の染色体領域中の特有の配列(第2の配列)中に他方の端を有する領域の欠失である、上記[1D]~[7D]のいずれかに記載の細胞。[9D]前記ゲノムDNAが、制御配列に作動可能に連結された内因性または外来性の所望の所望の遺伝子の挿入を含み、当該挿入は、上記(i)~(iv)のいずれかの領域内、または上記(i)~(iv)の領域以外の領域に位置する、上記[1D]~[8D]のいずれかに記載の細胞。[10D]前記欠失が、Chr6: 31,174,000~31,177,000の染色体領域中の特有の配列(第3の配列)中に一方の端を有し、Chr6: 31,534,000~31,538,000の染色体領域中の特有の配列(第4の配列)中に他方の端を有する領域の欠失である、上記[1D]~[9D]のいずれかに記載の細胞。[11D]前記欠失が、Chr6: 32,446,000~32,448,500の染色体領域中の特有の配列(第5の配列)中に一方の端を有し、Chr6: 32,820,500~32,822,500の染色体領域中の特有の配列(第6の配列)中に他方の端を有する領域の欠失である、上記[1D]~[10D]のいずれかに記載の細胞。[12D]前記欠失が、Chr6: 32,999,500~33,002,500の染色体領域中の特有の配列(第7の配列)中に一方の端を有し、Chr6: 33,147,500~33,150,500の染色体領域中の特有の配列(第8の配列)中に他方の端を有する領域の欠失である、上記[1D]~[11D]のいずれかに記載の細胞。[13D]上記[1D]~[12D]のいずれかに記載の細胞であって、欠失を有する上記(i)~(iv)は、その染色体領域内に繰り返し配列を有しない、細胞。[14D]上記[1D]~[13D]のいずれかに記載の細胞であって、機能的なβ2ミクログロブリンおよび機能的なCIITAのいずれかまたは両方を有する、細胞。[15D]上記[1D]~[14D]のいずれかに記載の細胞であって、HLAクラスIおよび/またはHLAクラスIIを細胞表面に実質的に発現していない、細胞。[16D]上記[1D]~[15D]のいずれかに記載の細胞であって、欠失が100kbから400kbの大きさである、細胞。[17D]上記[1D]~[16D]のいずれかに記載の細胞を含む、組成物。[18D]ゲノムの全アレル(2倍体の場合には2アレル)における領域の欠失(例えば、1Mbまで、または500kbまでの領域の欠失)であって、MHC分子をコードする遺伝子座のMHC類似配列集積領域の一部、または好ましくは全部を含む領域を含む欠失を有するゲノムを有する細胞。[19D]各MHC類似配列集積領域には、1以下のMHC分子をコードする遺伝子しか含まれない、上記[18D]に記載の細胞。[20D]各MHC類似配列集積領域には、4以下のMHC分子をコードする遺伝子しか含まれない、上記[18D]に記載の細胞。[21D]各MHC類似配列集積領域には、MHC分子をコードする遺伝子を含まれない、上記[18D]に記載の細胞。[22D]上記[18D]に記載の細胞であって、欠失が、MHC分子をコードする遺伝子座のMHC類似配列集積領域の全部を含む領域を含む欠失である、細胞。[23D]上記[22D]に記載の細胞であって、制御配列と当該制御配列に作動可能に連結された所望の遺伝子をさらに含む、細胞。[24D]制御配列と当該制御配列に作動可能に連結された所望の遺伝子が、全体として天然に存在しない配列を有する、上記[23D]に記載の細胞。[25D]制御配列と当該制御配列に作動可能に連結された所望の遺伝子が、天然に存在する(または内在性の)配列を有する、上記[23D]に記載の細胞。
 本発明によれば、2つ以上のアレルを効率よく改変することができ、且つ比較的大きな領域の改変(特にHLAクラスI領域およびHLAクラスII領域の大規模欠失)が可能な、ゲノム改変方法及び前記ゲノム改変キット、並びに前記改変を有する細胞が提供される。
図1は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域の遺伝子マップである。HLA遺伝子の存在するクラスターが矢印で強調されている。 図2は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-A遺伝子の類似配列の検索結果を示す。 図3は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-B遺伝子の類似配列の検索結果を示す。 図4は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-C遺伝子の類似配列の検索結果を示す。 図5は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-E遺伝子の類似配列の検索結果を示す。 図6は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-F遺伝子の類似配列の検索結果を示す。 図7は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-G遺伝子の類似配列の検索結果を示す。 図8は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-H遺伝子の類似配列の検索結果を示す。 図9は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-J遺伝子の類似配列の検索結果を示す。 図10は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-W遺伝子の類似配列の検索結果を示す。 図11は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるMICA遺伝子の類似配列の検索結果を示す。 図12は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるMICB遺伝子の類似配列の検索結果を示す。 図13は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DRA遺伝子の類似配列の検索結果を示す。 図14は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DRB1遺伝子の類似配列の検索結果を示す。 図15は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DRB5遺伝子の類似配列の検索結果を示す。 図16は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DRB6遺伝子の類似配列の検索結果を示す。 図17は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DRB9遺伝子の類似配列の検索結果を示す。 図18は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DQA1遺伝子の類似配列の検索結果を示す。 図19は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DQA2遺伝子の類似配列の検索結果を示す。 図20は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DQB1遺伝子の類似配列の検索結果を示す。 図21は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DPA1遺伝子の類似配列の検索結果を示す。 図22は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DPB1遺伝子の類似配列の検索結果を示す。 図23は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DMB遺伝子の類似配列の検索結果を示す。 図24は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DOA遺伝子の類似配列の検索結果を示す。 図25は、HLAクラスI領域およびHLAクラスII領域が存在する6番染色体領域におけるHLA-DOB遺伝子の類似配列の検索結果を示す。 図26は、HLAクラスI領域およびHLAクラスII領域における4つのHLA類似配列(配列)集積領域(i)~(iv)の位置を示す。 図27は、HLA類似配列集積領域(i)のテロメア側の末端候補を同定するためのBlat検索結果の一例を示す。 図28は、HLA類似配列集積領域(i)のセントロメア側の末端候補を同定するためのBlat検索結果の一例を示す。 図29は、HLA類似配列集積領域(ii)のテロメア側の末端候補を同定するためのBlat検索結果の一例を示す。 図30は、HLA類似配列集積領域(ii)のセントロメア側の末端候補を同定するためのBlat検索結果の一例を示す。 図31は、HLA類似配列集積領域(iii)のテロメア側の末端候補を同定するためのBlat検索結果の一例を示す。 図32は、HLA類似配列集積領域(iii)のセントロメア側の末端候補を同定するためのBlat検索結果の一例を示す。 図33は、HLA類似配列集積領域(iv)のテロメア側の末端候補を同定するためのBlat検索結果の一例を示す。 図34は、HLA類似配列集積領域(iv)のセントロメア側の末端候補を同定するためのBlat検索結果の一例を示す。 図35は、図27~図34の結果のまとめを示す。 図36は、HLA-F、HLA-G、およびHLA-Aを含む一連の領域の全体を本開示の方法により除去する方法のスキームと、その結果を示す。 図37は、HLA-CとHLA-Bを含む一連の領域の全体を本開示の方法により除去する方法のスキームと、その結果を示す。得られた細胞では、HLA-F、HLA-G、およびHLA-A、並びに、HLA-C及びHLA-Bが欠失している。 図38は、得られた細胞が、HLA-A、HLA-B、およびHLA-Cのいずれに関しても陰性であることを示すサイトグラムである。 図39は、得られた細胞が、未改変のiPS細胞と同等の多能性幹細胞マーカーの発現を示すことを示す。 図40は、HLA-E領域をさらに欠失させる方法のスキームと、その結果を示す。 図41は、HLA-E領域をさらに欠失させる方法のスキームと、その結果を示す。 図42は、HLA-Eの代わりにシグナル配列を付加したHLA-Eを導入するスキームとその結果を示す。 図43は、HLA-DRA、HLA-DRBs、HLA-DQAs、HLA-DQB1、およびHLA-DOBを含む一連の領域の全体を本開示の方法によりさらに除去する方法のスキームと、その結果を示す。得られた細胞では、HLA-F、HLA-G、およびHLA-A;HLA-C及びHLA-B;並びにHLA-DRA、HLA-DRBs、HLA-DQAs、HLA-DQB1、およびHLA-DOBが欠失している。 図44は、HLA-DRA、HLA-DRBs、HLA-DQAs、HLA-DQB1、およびHLA-DOBを含む一連の領域の全体を本開示の方法によりさらに除去する方法のスキームと、その結果を示す。得られた細胞では、HLA-F、HLA-G、およびHLA-A;HLA-C及びHLA-B;並びにHLA-DRA、HLA-DRBs、HLA-DQAs、HLA-DQB1、およびHLA-DOBが欠失している。 図45は、HLA-Eの欠失を有する領域に任意の目的遺伝子を導入するスキームを示す。 図46は、HLA-Eの欠損部位に対して、外来遺伝子(例えば、HLA-A、HLA-B、HLA-C、およびHLA-E)を導入するスキームを示す。 図47は、HLA-F、HLA-G、およびHLA-Aを含む一連の領域とHLA-CとHLA-Bを含む一連の領域を欠失させた細胞のHLA-EをUKiSマーカーで置き換えて得られた細胞に対して、HLA-AとBを組込むスキームと、その結果を示す。 図48は、HLA-F、HLA-G、およびHLA-Aを含む一連の領域とHLA-CとHLA-Bを含む一連の領域を欠失させた細胞(図37参照)のHLA-EをUKiSマーカーで置き換えて得られた細胞に対して、HLA-CとEを組込むスキームと、その結果を示す。 図49は、HLA-AおよびBを再導入した細胞(図47参照)とHLA-CとEを再導入した細胞(図48参照)におけるHLAの細胞表面発現を示す。 図50は、HLA欠損細胞がT細胞による細胞傷害を回避することを示す。
[定義]
 「ポリヌクレオチド」及び「核酸」という用語は、相互に互換的に使用され、ヌクレオチドがホスホジエステル結合によって結合したヌクレオチドポリマーを指す。「ポリヌクレオチド」及び「核酸」は、DNAであってもよく、RNAであってもよく、DNAとRNAとの組み合わせから構成されてもよい。また、「ポリヌクレオチド」及び「核酸」は、天然ヌクレオチドのポリマーであってもよく、天然ヌクレオチドと非天然ヌクレオチド(天然ヌクレオチドの類似体、塩基部分、糖部分及びリン酸部分のうち少なくとも一つの部分が修飾されているヌクレオチド(例えば、ホスホロチオエート骨格)等)とのポリマーであってもよく、非天然ヌクレオチドのポリマーであってもよい。
 「ポリヌクレオチド」又は「核酸」の塩基配列は、特に明示しない限り、一般的に認められている1文字コードで記載される。特に明示しない限り、塩基配列は、5’側から3’側に向かって記載する。「ポリヌクレオチド」又は「核酸」を構成するヌクレオチド残基は、単に、アデニン、チミン、シトシン、グアニン、又はウラシル等、あるいはそれらの1文字コードで記載される場合がある。
 「遺伝子」という用語は、特定のタンパク質をコードする少なくとも1つのオープンリーディングフレームを含むポリヌクレオチドを指す。遺伝子は、エクソン及びイントロンの両方を含み得る。
 「ポリペプチド」、「ペプチド」及び「タンパク質」という用語は、相互に互換的に使用され、アミド結合によって結合したアミノ酸のポリマーを指す。「ポリペプチド」、「ペプチド」又は「タンパク質」は、天然アミノ酸のポリマーであってもよく、天然アミノ酸と非天然アミノ酸(天然アミノ酸の化学的類似体、修飾誘導体等)とのポリマーであってもよく、非天然アミノ酸のポリマーであってもよい。特に明示しない限り、アミノ酸配列は、N末端側からC末端側に向かって記載する。
 「アレル」という用語は、染色体ゲノム上の同一座位に存在する塩基配列のセットを指す。ある態様では、2倍体の細胞では同一座位に2アレル存在し、3倍体の細胞では同一座位に3アレル存在する。また、ある態様では、染色体の異常なコピーまたは当該座位の異常な追加のコピーによって追加のアレルが形成されている場合がある。
 「ゲノム改変」又は「ゲノム編集」という用語は、相互に互換的に用いられ、ゲノム上の所望の位置(標的領域)に変異を誘導することを指す。ゲノム改変は、標的領域DNAを切断するように設計された配列特異的核酸切断分子の使用を含み得る。好ましい実施形態において、ゲノム改変は、標的領域のDNAを切断するように操作されたヌクレアーゼの使用、を含み得る。好ましい実施形態において、ゲノム改変は、標的領域中の特定の塩基配列を有する標的配列を切断するように操作されたヌクレアーゼ(例えば、TALENやZFN)の使用を含み得る。好ましい実施形態において、ゲノム改変は、標的領域中の特定の塩基配列を有する標的配列を切断するように、メガヌクレアーゼなどのゲノムに1つしか切断部位を有しない制限酵素(例えば、16ベースの配列特異性を有する制限酵素(理論上は416塩基に1つの割合で存在する)、17ベースの配列特異性を有する制限酵素(理論上は417塩基に1つの割合で存在する)、および18ベースの配列特異性を有する制限酵素(理論上は418塩基に1つの割合で存在する))などの配列特異的エンドヌクレアーゼを用いることができる場合もある。典型的には、部位特異的ヌクレアーゼの使用により、標的領域のDNAに二本鎖切断(DSB)が誘導され、その後、相同組み換え修復(Homologous Directed Repair:HDR)及び非相同末端再結合(Non-Homologous End-Joining Repair:NHEJ)のような、細胞の内因性プロセスによってゲノムが修復される。NHEJは、ドナーDNAを用いずに二本鎖切断された末端を連結する修復方法であり、修復の際に挿入及び/又は欠失(indel)が高頻度で誘導される。HDRは、ドナーDNAを用いた修復機構であり、標的領域に所望の変異を導入することも可能である。ゲノム改変技術としては、例えば、CRISPR/Casシステムが好ましく例示される。メガヌクレアーゼとしては、例えば、I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAIIP、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-CrepsbIIIP、I-CrepsbIVP、I-TliI、I-PpoI、PI-PspI、F-SceI、F-SceII、F-SuvI、F-TevI、F-TevII、I-AmaI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-LlaI、I-MsoI、I-NaaI、I-NanI、I-NclIP、I-NgrIP、I-NitI、I-NjaI、I-Nsp236IP、I-PakI、I-PboIP、I-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-SpomIP、I-SpomIIP、I-SquIP、I-Ssp68031、I-SthPhiJP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I-TevI、I-TevII、I-TevIII、I-UarAP、I-UarHGPAIP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-Mtul、PI-MtuHIP PI-MtuHIIP、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TliI、およびPI-TliII、並びにこれらの機能的な誘導体制限酵素からなる群から選択されるメガヌクレアーゼおよびその切断部位(または認識部位)、好ましくは、18塩基以上の配列特異性を有する制限酵素であるメガヌクレアーゼおよびその切断部位(または認識部位)、特に細胞のゲノムを1箇所または複数箇所以上切断しないメガヌクレアーゼおよびその切断部位を用いることができる。
 「標的領域」という用語は、ゲノム改変の対象となるゲノム領域を指す。「欠失」は、リファレンスゲノムに対する1塩基以上の欠失、および1遺伝子以上の欠失を含む。欠失は、100bp以上の欠失、200bp以上の欠失、300bp以上の欠失、400bp以上の欠失、500bp以上の欠失、600bp以上の欠失、700bp以上の欠失、800bp以上の欠失、900bp以上の欠失、1kbp以上の欠失、10kbp以上の欠失、50kbp以上の欠失、100kbp以上の欠失、200kbp以上の欠失、300kbp以上の欠失、400kbp以上の欠失、500kbp以上の欠失、または1Mbp以上の欠失またはそれ以下の欠失であり得る。欠失は、1Mbp以下の欠失であり得る。欠失は、700kbp以下の欠失であり得る。欠失は、600kbp以下の欠失であり得る。欠失は、500kbp以下の欠失であり得る。欠失は、10kbp以上600kbp以下の欠失であり得る。欠失は、100kbp以上600kbp以下の欠失であり得る。欠失は、100kbp以上500kbp以下の欠失であり得る。
 「ドナーDNA」という用語は、DNAの二本鎖切断の修復に用いられるDNAであって、標的領域周辺のDNAと相同組換え可能なDNAを指す。ドナーDNAは、ホモロジーアームとして標的領域の上流の塩基配列および下流の塩基配列(例えば、標的領域に隣接する塩基配列)を含む。本明細書においては、標的領域の上流側の塩基配列(例えば、上流側に隣接する塩基配列)からなるホモロジーアームを「上流ホモロジーアーム」、標的配列の下流側の塩基配列(例えば、下流側に隣接する塩基配列)からなるホモロジーアームを「下流ホモロジーアーム」と記載する場合がある。ドナーDNAは、上流ホモロジーアームと下流ホモロジーアームとの間に、所望の塩基配列を含むことができる。各ホモロジーアームの長さは、300bp以上が好ましく、通常500~3000bp程度である。上流ホモロジーアーム及び下流ホモロジーアームの長さは、互いに同じであってもよく、異なっていてもよい。標的領域は、配列依存的な切断後にドナーDNAとの間で相同組換えの誘発に成功すると、標的領域の上流の塩基配列および下流の塩基配列の間の配列が、ドナーDNAの配列と置き換わることとなる。
 標的領域の「上流」とは、標的領域の2本鎖DNAにおいて、基準となるヌクレオチド鎖の5’側に位置するDNA領域を意味する。標的領域の「下流」とは、基準となるヌクレオチド鎖の3’側に位置するDNAを意味する。標的領域がタンパク質コード配列を含む場合、基準となるヌクレオチド鎖は、通常、センス鎖である。一般的に、プロモーターは、タンパク質コード配列の上流に位置する。ターミネーターは、タンパク質コード配列の下流に位置する。
 「配列特異的核酸切断分子」という用語は、特定の核酸配列を認識し、前記特定の核酸配列で核酸を切断することができる分子を指す。配列特異的核酸切断分子は、配列特異的に核酸切断する活性(配列特異的核酸切断活性)を有する分子である。
 「標的配列」という用語は、配列特異的核酸切断分子による切断の対象となるゲノム中のDNA配列を指す。配列特異的核酸切断分子がCasタンパク質である場合、標的配列は、Casタンパク質による切断の対象となるゲノム中のDNA配列を指す。Casタンパク質としてCas9タンパク質を用いる場合、標的配列は、プロトスペーサー隣接モチーフ(PAM)の5’側に隣接する配列である必要がある。標的配列は、通常、PAMの5’側直前に隣接する17~30塩基(好ましくは18~25塩基、より好ましくは19~22塩基、さらに好ましくは20塩基)の配列が選択される。標的配列の設計には、CRISPR DESIGN(crispr.mit.edu/)等の公知のデザインツールを利用することができる。
 「Casタンパク質」という用語は、CRISPR関連(CRISPR-associated)タンパク質を指す。好ましい態様において、Casタンパク質は、ガイドRNAと複合体を形成し、エンドヌクレアーゼ活性又はニッカーゼ活性を示す。Casタンパク質としては、特に限定されないが、例えば、Cas9タンパク質、Cpf1タンパク質、C2c1タンパク質、C2c2タンパク質、及びC2c3タンパク質等が挙げられる。Casタンパク質は、ガイドRNAと協働してエンドヌクレアーゼ活性又はニッカーゼ活性を示す限り、野生型Casタンパク質及びそのホモログ(パラログ及びオーソログ)、並びにそれらの変異体を包含する。
 好ましい態様において、Casタンパク質は、クラス2のCRISPR/Cas系に関与するものであり、より好ましくはII型のCRISPR/Cas系に関与するものである。Casタンパク質の好ましい例としては、Cas9タンパク質が例示される。Casタンパク質の好ましい例としては、Cas3タンパク質が例示される。
 「Cas9タンパク質」という用語は、II型のCRISPR/Cas系に関与するCasタンパク質を指す。Cas9タンパク質は、ガイドRNAと複合体を形成し、ガイドRNAと協働して標的領域のDNAを切断する活性を示す。Cas9タンパク質は、前記の活性を有する限り、野生型Cas9タンパク質及びそのホモログ(パラログ及びオーソログ)、並びにそれらの変異体を包含する。野生型Cas9タンパク質は、ヌクレアーゼドメインとしてRuvCドメイン及びHNHドメインを有するが、本明細書におけるCas9タンパク質は、RuvCドメイン及びHNHドメインのいずれか一方が不活性化されたものであってもよい。RuvCドメイン及びHNHドメインのいずれか一方が不活性化されたCas9は、二本鎖DNAに対して一本鎖切断(ニック)を導入する。そのため、RuvCドメイン及びHNHドメインのいずれか一方が不活性化されたCas9を二本鎖DNAの切断に用いる場合には、センス鎖とアンチセンス鎖それぞれに対してCas9の標的配列を設定し、センス鎖およびアンチセンス差のニックが十分に近い位置で生じ、それにより二本鎖切断が誘発されるように、改変システムを構成することができる。
 Cas9タンパク質が由来する生物種は特に限定されないが、ストレプトコッカス(Streptococcus)属、スタフィロコッカス(Staphylococcus)属、ナイセリア(Neisseria)属、又はトレポネーマ(Treponema)属に属する細菌等が好ましく例示される。より具体的には、S.pyogenes、S.thermophilus、S.aureus、N.meningitidis、又はT.denticola等に由来するCas9タンパク質が好ましく例示される。好ましい態様において、Cas9タンパク質は、S.pyogenes由来のCas9タンパク質である。
 各種Casタンパク質のアミノ酸配列、及びそのコード配列の情報は、GenBank、UniProt、Addgene等の各種データベース上で得ることができる。例えば、S.pyogenesのCas9タンパク質のアミノ酸配列は、プラスミド番号42230としてAddgeneに登録されたもの等を用いることができる。S.pyogenesのCas9タンパク質のアミノ酸配列の一例を配列番号1に示す。
 「ガイドRNA」及び「gRNA」という用語は、相互に互換的に使用され、Casタンパク質と複合体を形成し、Casタンパク質を標的領域に誘導することができるRNAを指す。好ましい態様において、ガイドRNAは、CRISPR RNA(crRNA)及びトランス活性化型CRISPR RNA(tracrRNA)を含む。crRNAは、ゲノム上の標的領域への結合に関与し、tracrRNAは、Casタンパク質との結合に関与する。好ましい態様において、crRNAは、スペーサー配列とリピート配列とを含み、スペーサー配列が標的領域において標的配列の相補鎖と結合する。好ましい態様において、tracrRNAは、アンチリピート配列と3’テイル配列とを含む。アンチリピート配列はcrRNAのリピート配列と相補的な配列を有し、リピート配列と塩基対を形成し、3’テイル配列は通常3つのステムループを形成する。
 ガイドRNAは、crRNAの3’末端にtracrRNAの5’末端を連結した単一ガイドRNA(sgRNA)であってもよく、crRNA及びtracrRNAを別々のRNA分子とし、リピート配列及びアンチリピート配列で塩基対を形成させたものであってもよい。好ましい態様において、ガイドRNAはsgRNAである。
 crRNAのリピート配列及びtracrRNAの配列は、Casタンパク質の種類に応じて適宜選択することができ、Casタンパク質と同じ細菌種に由来するものを用いることができる。
 例えば、S.pyogenes由来のCas9タンパク質を用いる場合、sgRNAの長さは、50~220ヌクレオチド(nt)程度とすることができ、60~180nt程度が好ましく、80~120nt程度がより好ましい。crRNAの長さは、スペーサー配列を含めて約25~70塩基長とすることができ、25~50nt程度が好ましい。tracrRNAの長さは10~130nt程度とすることができ、30~80nt程度が好ましい。
 crRNAのリピート配列は、Casタンパク質が由来する細菌種におけるものと同じであってもよく、3’末端の一部を削除したものであってもよい。tracrRNAは、Casタンパク質が由来する細菌種における成熟tracrRNAと同じで配列を有していてもよく、当該成熟tracrRNAの5’末端及び/又は3’末端を切断した末端切断型であってもよい。例えば、tracrRNAは、成熟tracrRNAの3’末端から1~40個程度のヌクレオチド残基を除去した末端切断型であり得る。また、tracrRNAは、成熟tracrRNAの5’末端から1~80個程度のヌクレオチド残基を除去した末端切断型であり得る。また、tracrRNAは、例えば、5’末端から1~20程度のヌクレオチド残基を除去し、かつ3’末端から1~40個程度のヌクレオチド残基を除去した末端切断型であり得る。
 sgRNA設計のためのcrRNAリピート配列及びtracrRNAの配列は、種々提案されており、当業者は、公知技術に基づいてsgRNAを設計することができる(例えば、Jinek et al. (2012) Science, 337, 816-21; Mali et al. (2013) Science, 339: 6121, 823-6; Cong et al. (2013) Science, 339: 6121, 819-23; Hwang et al. (2013) Nat. Biotechnol. 31: 3, 227-9; Jinek et al. (2013) eLife, 2, e00471)。
 「プロトスペーサー隣接モチーフ」及び「PAM」という用語は、相互に互換的に使用され、Casタンパク質によるDNA切断の際に、Casタンパク質に認識される配列を指す。PAMの配列及び位置は、Casタンパク質の種類によって異なる。例えば、Cas9タンパク質の場合、PAMは標的配列の3’側直後に隣接する必要がある。Cas9タンパク質に対応するPAMの配列は、Cas9タンパク質が由来する細菌種によって異なっている。例えば、S.pyogenesのCas9タンパク質に対応するPAMは「NGG」であり、S.thermophilusのCas9タンパク質に対応するPAMは「NNAGAA」であり、S.aureusのCas9タンパク質に対応するPAMは「NNGRRT」又は「NNGRR(N)」であり、N.meningitidisのCas9タンパク質に対応するPAMは「NNNNGATT」であり、T.denticolaのCas9タンパク質に対応する「NAAAAC」である(「R」はA又はG;「N」は、A、T、G又はC)。
 「スペーサー配列」及び「ガイド配列」という用語は、相互に互換的に使用され、ガイドRNAに含まれる配列であって、標的配列の相補鎖と結合し得る配列を指す。通常、スペーサー配列は、標的配列と同一の配列である(但し、標的配列中のTは、スペーサー配列ではUとなる)。本発明の実施態様において、スペーサー配列は、標的配列に対して1塩基又は複数塩基のミスマッチを含むことができる。複数塩基のミスマッチを含む場合、隣接した位置にミスマッチを有していてもよく、離れた位置にミスマッチを有していてもよい。好ましい態様において、スペーサー配列は、標的配列に対して1~5塩基のミスマッチを含み得る。特に好ましい態様において、スペーサー配列は、標的配列に対して1塩基のミスマッチを含み得る。
 ガイドRNAにおいて、スペーサー配列は、crRNAの5’側に配置される。
 ポリヌクレオチドに関して用いる「機能的に連結」という用語は、第一の塩基配列が第二の塩基配列に十分に近くに配置され、第一の塩基配列が第二の塩基配列又は第二の塩基配列の制御下の領域に影響を及ぼしうることを意味する。例えば、ポリヌクレオチドがプロモーターに機能的に連結するとは、当該ポリヌクレオチドが、当該プロモーターの制御下で発現するように連結されていることを意味する。
 「発現可能な状態」という用語は、ポリヌクレオチドが導入された細胞内で、該ポリヌクレオチドが転写され得る状態にあることを指す。
 「発現ベクター」という用語は、対象ポリヌクレオチドを含むベクターであって、該ベクターを導入した細胞内で、対象ポリヌクレオチドを発現可能な状態にするシステムを備えたベクターを指す。例えば、「Casタンパク質の発現ベクター」とは、該ベクターを導入した細胞内で、Casタンパク質を発現可能なベクターを意味する。また、例えば、「ガイドRNAの発現ベクター」とは、該ベクターを導入した細胞内で、ガイドRNAを発現可能なベクターを意味する。
 「HLA類似配列」という用語は、HLA遺伝子の少なくとも1つとUCSC Genome Browserに搭載されているBLAT検索から導かれるIdentity値で80%以上を示す一つながりの塩基配列を意味する。HLA遺伝子座には、HLAおよびHLA類似配列が集積している領域が存在し、これをHLA類似配列集積領域とよぶ。
 「MHC類似配列」という用語は、MHC遺伝子の少なくとも1つとUCSC Genome Browserに搭載されているBLAT検索から導かれるIdentity値で80%以上を示す一つながりの塩基配列を意味する。MHC遺伝子座には、MHCおよびMHC類似配列が集積している領域が存在し、これをMHC類似配列集積領域とよぶ。
 「固有の配列」という用語は、他に類似する配列が存在しない特有の配列を意味し、具体的には、その全長に対するBLAT検索によるIdentity値が80%以上である配列が、当該固有の配列を有するゲノム上に1箇所しか存在しない配列を意味する。固有の配列は、BLAT検索によるIdentity値が75%以上である配列が、当該固有の配列を有するゲノム上に1箇所しか存在しない配列であることがより好ましく、BLAT検索によるIdentity値が70%以上である配列が、当該固有の配列を有するゲノム上に1箇所しか存在しない配列がさらに好ましく、BLAT検索によるIdentity値が65%以上である配列が、当該固有の配列を有するゲノム上に1箇所しか存在しない配列であることがさらにまた好ましく、BLAT検索によるIdentity値が60%以上である配列が、当該固有の配列を有するゲノム上に1箇所しか存在しない配列であることが好ましい。「固有の配列」は、「特有の配列」と相互互換的に用いられ得る。
 HLAクラスI(例えば、HLA-A~Cなど)は、内在の約9個のアミノ酸残基を有するペプチドを溝に埋め込んでキラーT細胞に提示する複合体を形成する。感染細胞やがん細胞などにおいて非自己のペプチドが複合体に提示されるとキラーT細胞は、これを提示する細胞毎破壊する。HLAクラスII(HLA-DR、DQ、DPなど)は、食作用で取り込んだ外来の約15アミノ酸残基を有するペプチドを溝に埋め込んでヘルパーT細胞に提示する。免疫チェックポイント分子は、免疫を抑制する免疫チェックポイントに関与する因子である。免疫チェックポイント分子としては、例えば、PD-L1、PD-L2、B7(CD80/CD86)、CD275、CD276、VISTA、ガレクチン9、HVEM、およびHLAクラスII分子が挙げられる。
 本開示の細胞は、iPS細胞であり得る。本開示の細胞は、ヒト細胞由来のiPS細胞(ヒトiPS細胞)であり得る。本開示の細胞は、例えば、免疫細胞に分化させてから用いることができる。したがって、本開示の細胞は、免疫細胞(特にiPS細胞由来の免疫細胞)であり得る。免疫細胞は、例えば、T細胞(例えば、CD4単独陽性T細胞、およびCD8単独陽性T細胞)、ナチュラルキラーT細胞(NKT細胞)、ナチュラルキラー細胞(NK細胞)、制御性T細胞(Treg)、αβT細胞、γδT細胞、およびマクロファージからなる群から選択される1以上の免疫細胞であり得る。免疫細胞は、抗原特異性を有するT細胞受容体(TCR)を有していてもよい。免疫細胞は、抗原特異性を有するT細胞受容体を発現しなくてもよい(例えば、TCRα鎖欠損を有してもよい)。免疫細胞は、キメラ抗現受容体(CAR)を発現していてもよい。例えば、免疫細胞は、CARを発現するが、抗原特異性を有するTCRを発現しなくてもよい、T細胞、NKT細胞、NK細胞、またはγδT細胞であり得る。細胞は例えば初代細胞(例えば、初代免疫細胞)であり得る。細胞は例えば細胞株(例えば、免疫細胞株)であり得る。細胞は非がん細胞であり得る。CARを発現する細胞は、例えば、内因性または外来のインターロイキン-7(IL-7)および内因性または外来のCCL19のうちのいずれかまたは両方を発現していてもよい。内因性または外来のIL-7および内因性または外来のCCL19は、制御配列に作動可能に連結しており、CARを発現する細胞は、当該IL-7およびCCL19のいずれかまたは好ましくは両方を有する。CARを発現する細胞は、内因性または外来のエンドβ-D-グルクロニダーゼ(HPSE)を発現してもよい。これらの免疫細胞は、当該細胞が投与される対象と、自己または同種異系の関係を有していることができる。免疫細胞はまた、内因性または外来のCD3を発現してもよい。また、細胞は、HLA-E、HLA-G、HACD16、41BBL、CD3、CD4、CD8、CD47、CD137、CD80、PDL1、A2AR、CAR、およびTCRからなる群から選択される1以上の内因性または外来性の因子を発現していてもよく、発現していなくてもよい。ある態様では、細胞は、HLA-E、HLA-G、CD16、41BBL、CD3、CD4、CD8、CD47、CD137、CD80、PDL1、A2AR、CAR、およびTCRからなる群から選択される1以上の内因性または外来性の因子をコードする核酸を有し、当該核酸は、制御配列に作動可能に連結している。ある態様では、CARを発現する細胞は、抗体療法と併用されうる。この併用において、CARを発現する細胞では、抗体の標的分子(腫瘍抗原)がノックアウトされていてもよい。ある態様では、そのような腫瘍抗原としては、CD38、およびCD52などが挙げられる。抗CD38抗体としては、例えば、ダラツムマブ、およびイサツキシマブが挙げられる(治療対象疾患は、例えば、多発性骨髄腫であり得る)。また、抗CD52抗体としては、例えば、アレムツズマブが挙げられる(治療対象疾患は、例えば、白血病、リンパ性白血病、または慢性リンパ性白血病であり得る)。ある態様の細胞(例えば、免疫細胞、または非免疫細胞)では、また、NLRC5がノックアウトされていてもよく、これにより例えば、移植片対宿主病(GVHD)の発症を抑制できてもよい。ある態様の細胞(例えば、免疫細胞、または非免疫細胞)は、PD1、CD52、CTLA4、dCK、GGH、HPRT、およびβ2ミクログロブリンからなる群から選択される因子とCARまたはTCRとを発現していてもよい。ある好ましい態様では、本開示の細胞では、機能的なβ2ミクログロブリンおよび/または機能的なCIITAを有する。本開示の細胞は、例えば、IL-15:IL15Rα融合タンパク質を発現してもよい。
 本明細書では、「キメラ抗原受容体」(CAR)は、抗体の抗原結合性断片(特に、scFv)と免疫細胞の活性化ドメインとを有するキメラ分子である。CARは、一般的には、scFv、細胞外ヒンジドメイン、膜貫通ドメイン(例えば、CD8αまたはCD28)、および活性化シグナル伝達ドメイン(例えば、CD3ζ)が連結してなる分子である。CARは、細胞に導入し、細胞表面に発現させることができる。CARを発現した細胞は特定の抗原に対して標的化し得る。CARは、例えば、T細胞またはNK細胞などの免疫細胞に導入され、T細胞またはNK細胞などの免疫細胞をがんに標的化する。第1世代CARでは、scFv、細胞外ヒンジドメイン、膜貫通ドメイン(例えば、CD8αまたはCD28)、および活性化シグナル伝達ドメイン(例えば、CD3ζ)が連結していたが、第2世代CARは、CARが導入された免疫細胞活性化のために、共刺激分子シグナル伝達ドメインをさらに含む。共刺激分子シグナル伝達ドメインとしては、CD28、4-1BB、OX40、CD27、およびICOSなどの共刺激因子が用いられている。第3世代CARでは、共刺激因子が複数組込まれている。このように、CARにおいては、CARを導入した免疫細胞を生体内で持続的に増殖させるための改良が加えられてきている。scFv部分以外のいずれのドメインもヒトタンパク質由来であることが好ましい。
 1実施態様では、内在性または外来性の遺伝子は、内在性または外来性のHLA遺伝子のいずれか1以上を含む。HLA遺伝子は、特に限定されないが例えば、HLA-A、HLA-B、HLA-C、HLA-E、HLA-F、HLA-G、HLA-H、HLA-J、HLA-W、MICA、MICB、HLA-DRA、HLA-DRB1、HLA-DRB5、HLA-DRB6、HLA-DRB9、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DPA1、HLA-DPB1、HLA-DMB、HLA-DOA、およびHLA-DOBが挙げられる。1実施形態では、HLA遺伝子は、HLA-A、HLA-B、HLA-C、HLA-DR、HLA-DQ、およびHLA-DPからなる群から選択される1以上であり得る。1実施態様では、HLA遺伝子は、HLA-A、HLA-B、およびHLA-Cからなる群から選択される1以上であり得る。1実施態様では、HLA遺伝子は、HLA-DR、HLA-DQ、およびHLA-DPからなる群から選択される1以上であり得る。
 1実施態様では、HLA遺伝子は例えば、HLA-Aであり得る。HLA-Aは、いずれのアレルのHLA-Aであってもよい。HLA-Aとしては、特に限定されないが例えば、A*01:01、A*02:01、A*02:03、A*02:05、A*02:06、A*02:07、A*02:10、A*02:11、A*02:15N、A*02:18、A*02:28、A*02:42、A*02:53N、A*02:59、A*02:72、A*03:01、A*03:02、A*11:01、A*11:02、A*11:13、A*23:01、A*24:02、A*24:03、A*24:04、A*24:05、A*24:07、A*24:08、A*24:10、A*24:20、A*24:25、A*24:28、A*24:46、A*25:01、A*26:01、A*26:02、A*26:03、A*26:04、A*26:05、A*26:06、A*29:01、A*29:02、A*30:01、A*30:02、A*30:04、A*31:01、A*31:11、A*32:01、A*33:01、A*33:03、A*33:08、A*34:01、およびA*68:01が挙げられる。また、HLA遺伝子は、例えば、HLA-Bであり得る。HLA-Bは、いずれのアレルのHLA-Bであってもよい。HLA-Bとしては、特に限定されないが例えば、B*07:02、B*07:05、B*08:01、B*13:01、B*13:02、B*14:01、B*14:02、B*15:01、B*15:02、B*15:03、B*15:05、B*15:07、B*15:11、B*15:12、B*15:13、B*15:17、B*15:18、B*15:21、B*15:25、B*15:26N、B*15:27、B*15:28、B*15:35、B*15:38、B*15:46、B*18:01、B*18:02、B*27:04、B*27:05、B*27:06、B*27:11、B*35:01、B*35:02、B*35:03、B*35:05、B*35:08、B*35:11、B*35:51、B*35:64、B*37:01、B*38:01、B*38:02、B*39:01、B*39:02、B*39:04、B*39:05、B*39:23、B*40:01、B*40:02、B*40:03、B*40:06、B*40:07、B*40:11、B*40:50、B*40:52、B*41:01、B*44:02、B*44:03、B*45:01、B*46:01、B*48:01、B*48:03、B*49:01、B*50:01、B*51:01、B*51:02、B*51:03、B*51:06、B*52:01、B*53:01、B*54:01、B*54:21、B*55:01、B*55:02、B*55:04、B*55:10、B*55:12、B*56:01、B*56:03、B*56:04、B*56:05、B*57:01、B*58:01、B*59:01、およびB*67:01が挙げられる。
 1実施態様では、HLA遺伝子は、HLA-Cであり得る。HLA-Cは、いずれのアレルのHLA-Cであってもよい。HLA-Cとしては、特に限定されないが例えば、C*01:02、C*01:03、C*01:55、C*02:02、C*03:02、C*03:03、C*03:04、C*03:23N、C*03:28、C*03:29、C*03:43、C*04:01、C*04:03、C*05:01、C*06:02、C*07:01、C*07:02、C*07:02N、C*07:04、C*08:01、C*08:02、C*08:03、C*08:39、C*12:02、C*12:03、C*12:04、C*14:02、C*14:03、C*15:02、C*15:05、C*15:10、C*16:01、C*16:02、およびC*17:01が挙げられる。
 1実施態様では、HLA遺伝子は、HLA-DRであり得る。HLA-DRは、いずれのアレルのHLA-DRであってもよい。HLA-DRとしては、特に限定されないが例えば、DRB1*01:01、DRB1*01:02、DRB1*01:03、DRB1*03:01、DRB1*04:01、DRB1*04:02、DRB1*04:03、DRB1*04:04、DRB1*04:05、DRB1*04:06、DRB1*04:07、DRB1*04:08、DRB1*04:09、DRB1*04:10、DRB1*04:11、DRB1*07:01、DRB1*08:01、DRB1*08:02、DRB1*08:03、DRB1*08:09、DRB1*08:23、DRB1*09:01、DRB1*10:01、DRB1*11:01、DRB1*11:04、DRB1*11:06、DRB1*11:08、DRB1*11:19、DRB1*11:23、DRB1*12:01、DRB1*12:02、DRB1*12:05、DRB1*13:01、DRB1*13:02、DRB1*13:03、DRB1*13:07、DRB1*13:12、DRB1*14:02、DRB1*14:03、DRB1*14:04、DRB1*14:05、DRB1*14:06、DRB1*14:07、DRB1*14:12、DRB1*14:29、DRB1*14:45、DRB1*14:54、DRB1*15:01、DRB1*15:02、DRB1*15:04、DRB1*16:01、DRB1*16:02、DRB3*01:01、DRB3*02:02、DRB3*03:01、DRB4*01:01、DRB4*01:02、DRB4*01:03、DRB5*01:01、DRB5*01:02、およびDRB5*02:02が挙げられる。
 1実施態様では、HLA遺伝子は、HLA-DQであり得る。HLA-DQは、いずれのアレルのHLA-DQであってもよい。HLA-DQとしては、特に限定されないが例えば、DQB1*02:01、DQB1*02:02、DQB1*03:01、DQB1*03:02、DQB1*03:03、DQB1*04:01、DQB1*04:02、DQB1*05:01、DQB1*05:02、DQB1*05:03、DQB1*06:01、DQB1*06:02、DQB1*06:03、DQB1*06:04、DQB1*06:09、DQA1*01:01、DQA1*01:02、DQA1*01:03、DQA1*01:04、DQA1*01:05、DQA1*02:01、DQA1*03:01、DQA1*03:02、DQA1*03:03、DQA1*04:01、DQA1*05:01、DQA1*05:03、DQA1*05:05、DQA1*05:06、およびDQA1*05:08、DQA1*06:01が挙げられる。
 1実施態様では、HLA遺伝子は、HLA-DPであり得る。HLA-DPは、いずれのアレルのHLA-DPであってもよい。HLA-DPとしては、特に限定されないが例えば、DPB1*02:01、DPB1*02:02、DPB1*03:01、DPB1*04:01、DPB1*04:02、DPB1*05:01、DPB1*06:01、DPB1*09:01、DPB1*13:01、DPB1*14:01、DPB1*17:01、DPB1*19:01、DPB1*36:01、DPB1*38:01、DPB1*41:01、DPA1*01:03、DPA1*02:01、DPA1*02:02、およびDPA1*04:01が挙げられる。
 1実施態様では、挿入は、内在性または外来性の遺伝子と、前記制御配列または推定制御配列を含む当該遺伝子の上流の配列を含む。すなわち、この実施態様では、挿入は、内在性または外来性の遺伝子と、当該遺伝子の本来的な制御配列またはその候補を当該遺伝子の上流に含む。1実施態様では、挿入は、内在性または外来性の遺伝子を含み、当該遺伝子は、1以上のイントロンまたはイントロンの全てを含む。1実施態様では、挿入は、制御配列または推定制御配列を含む当該遺伝子の上流の配列と、1以上のイントロンまたはイントロンの全てを含む前記遺伝子を含む。1実施態様では、挿入は、ゲノム上の一つながりの領域の配列を有し、当該領域は、前記遺伝子と、制御配列または推定制御配列を含む当該遺伝子の上流の配列と、イントロンの全てを含む。このようにすることで、制御配列の遺伝子発現等に対する影響を解析したり、イントロンの遺伝子発現等に対する影響を解析することができる。好ましい態様では、上記遺伝子は、HLA遺伝子であり得る。
 好ましい態様では、挿入に含まれるHLA遺伝子に対応するゲノム上の遺伝子は欠失している。好ましい態様では、挿入がHLA遺伝子を含む場合には、ゲノム上の全ての機能的なHLAが欠失している。挿入に含まれるHLA遺伝子はヌルアリルであってもよい。
 1実施態様では、挿入される遺伝子は、例えば、キメラ抗原受容体(CAR)であり得る。キメラ抗現受容体は、例えば、重鎖および軽鎖を含む一本鎖抗体(例えば、scFv)と、細胞外ヒンジドメイン(例えば、CD8)、膜貫通ドメイン(例えば、CD8αおよびCD28)、協刺激分子シグナル伝達ドメイン(4-1BB、CD28およびCD137)、および活性化シグナル伝達ドメイン(CD3ζ)を含み得る。キメラ抗現受容体は、これにより、標的に結合すると、細胞に対して活性化シグナルを発生する。キメラ抗現受容体は、がん細胞に発現する抗原に結合し得る。そのような抗原としては、例えば、CD16、CD19、CD20、CD22、CD123、CD171、上皮成長因子受容体(EGFR)、特にEGFRvIII、3型EGFR、de2-7EGFRおよびHER2、がん胎児性抗原(CEA)、前立腺幹細胞抗原(PSCA)、B細胞成熟抗原(BCMA)、CS1、NKG2D、NKp30、B7H6、MUC-16(CA125)、受容体チロシンキナーゼ用オーファン受容体1(ROR-1)、GD3、GM2、グリピカン-3(GPC3)、メソテリン、IL13R、c-KIT、c-MET、NY-ESO-1、WT1、MAGE-A3、MAGE-A4、MAGE-A10、HPVのE6、HPVのE7、CMV、AFP、PRAME、SSX2、KRAS、HER2、およびPD-L1からなる群から選択される1以上であり得る。キメラ抗原受容体はまた、例えば、タンパク質性のタグに結合性を有してもよい。scFvの抗原は例えば、フルオレセインイソチオシアネート(FITC)などの蛍光タンパク質であり得る。がん細胞表面のがん抗原に対して、タンパク質性タグで標識した抗体を結合させ、当該タグを標的とするキメラ抗現受容体を発現する細胞をさらに投与することでも、がん細胞を殺傷し得るためである。
 1実施態様では、挿入される遺伝子は、例えば、T細胞受容体(TCR)であり得る。TCRは、抗原特異性を有し得る。抗原特異性を有するTCRは、例えば、がん抗原に結合し得る。抗原特異性を有するTCRは、例えば、CD16、CD19、CD20、CD22、CD123、CD171、上皮成長因子受容体(EGFR)、特にEGFRvIII、3型EGFR、de2-7EGFRおよびHER2、がん胎児性抗原(CEA)、前立腺幹細胞抗原(PSCA)、B細胞成熟抗原(BCMA)、CS1、NKG2D、NKp30、B7H6、MUC-16(CA125)、受容体チロシンキナーゼ用オーファン受容体1(ROR-1)、GD3、GM2、グリピカン-3(GPC3)、メソテリン、IL13R、c-KIT、c-MET、NY-ESO-1、WT1、MAGE-A3、MAGE-A4、MAGE-A10、HPVのE6、HPVのE7、CMV、AFP、PRAME、SSX2、KRAS、HER2、およびPD-L1からなる群から選択される1以上に結合し得る。TCRは、HLAに適合するように選択され得る。
 1実施態様では、挿入される遺伝子は、免疫抑制性因子、例えば、CD47、CD24、CD200、PD-L1、IDO1、CTLA4-Ig、C1-インヒビター、IL-10、IL-35、FASL、Serpmb9、CC121、およびMfge8からなる群から選択される1以上をコードする遺伝子を含む。
 1実施態様では、挿入される遺伝子は、治療遺伝子であり得る。治療遺伝子は、体内で発現させることにより、治療的利益を生じる遺伝子であり得る。治療遺伝子は、炎症誘発性タンパク質、例えば、サイトカインであり得る。治療遺伝子は、抗炎症性タンパク質、例えば、サイトカインであり得る。
 1実施態様では、挿入される遺伝子は、自殺遺伝子であり得る。自殺遺伝子としては、例えば、チミジンキナーゼ遺伝子、特に、ヘルペスウイルス由来チミジンキナーゼ遺伝子(HSVtk)、細胞傷害性シグナルレセプター(例えば、ジフテリアトキシンレセプター)およびiCas9が挙げられる。チミジンキナーゼ遺伝子は、ガンシクロビルをリン酸化して細胞傷害性のガンシクロビル三リン酸を生成する。また、iCas9(inducible caspase-9)は、そのCARDがFKBP12により置き換えられたタンパク質であり、タクロリムス誘導体(例えば、AP1903)存在下でiCas9発現細胞において細胞死を誘導する。このような自殺遺伝子は、ユニバーサルドナー細胞(UDC)などの免疫系を回避する細胞を体内から除去したい場合に有益である。
 本明細明細書において、塩基配列どうし又はアミノ酸配列どうしの配列同一性(又は相同性)は、2つの塩基配列又はアミノ酸配列を、対応する塩基又はアミノ酸が最も多く一致するように、挿入及び欠失に当たる部分にギャップを入れながら並置し、得られたアラインメント中のギャップを除く、塩基配列全体又はアミノ酸配列全体に対する一致した塩基又はアミノ酸の割合として求められる。塩基配列又はアミノ酸配列どうしの配列同一性は、当該技術分野で公知の各種相同性検索ソフトウェアを用いて求めることができる。塩基配列の配列同一性の値(Identity値)は、特に限定されないが例えば、公知の相同性検索ソフトウェアUCSC Genome Browserに搭載されているBLAT検索により得ることができる。
[ゲノム改変方法]
 1実施形態において、本発明は、染色体ゲノムの2つ以上のアレルを改変するゲノム改変方法を提供する。前記ゲノム改変方法は、下記(a)及び(b)の工程を含む:
 (a)下記(i)及び(ii)を、前記染色体を含む細胞に導入する工程;及び
  (i)前記染色体ゲノムの標的領域を標的とする配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、
  (ii)前記標的領域の上流側に隣接する塩基配列と相同な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側に隣接する塩基配列と相同な塩基配列を有する下流ホモロジーアームとの間に、選択マーカー遺伝子の塩基配列を含む、2種以上の選択マーカー用ドナーDNAであって、前記2種以上の選択マーカー用ドナーDNAは、相互に異なる選択マーカー遺伝子を有し、前記選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とする前記アレルの数と同数以上である、2種以上の選択マーカー用ドナーDNA、
 (b)前記工程(a)の後、前記2種以上の選択マーカー用ドナーDNAが有する全ての選択マーカー遺伝子に基づいて、前記細胞を選択する工程。この態様において、前記選択マーカー遺伝子は、選択マーカー用ドナーDNAの種類毎に固有であり得る。この態様においてはまた、工程(b)は、前記工程(a)の後、前記2以上のアレルに対して異なる種類の選択マーカー用ドナーDNAがそれぞれ相同組み換えすることによって、当該2以上のアレルにそれぞれ区別可能に異なる固有の選択マーカー遺伝子が導入され、導入された当該区別可能に異なる選択マーカー遺伝子のすべてを発現する細胞を選択する工程(ポジティブ選択のための工程)であり得る。上記方法は、染色体ゲノムの2つ以上のアレルが改変された細胞を作製する方法であってもよい。
 本明細書では、便宜的にヒトゲノムの位置を参照するときに、リファレンスゲノムとしてhg38ゲノム配列における位置を用いる。hg38は、カリフォルニア大学サンタクルーズ校(UCSC)により2013年12月にリリースされたリファレンスゲノムである。リファレンスゲノムは、様々なゲノムを組み合わせて作成された参照用のゲノムであり、このゲノムを有するヒトが存在するというわけではない。しかし、ヒト個体のゲノムDNAから解読された断片的な配列情報をリファレンスゲノムに照らすことによって解読された断片的な配列情報を連結してコンピュータ上で一つながりの配列を構築し、これにより当該ヒト個体のゲノムDNAの配列を推定することができる。このようにして、リファレンスゲノムにヒト個体のゲノムDNAの配列を対応付けることによって、ヒト個体等の個体のゲノムDNAを解読することが通常なされている。そして、hg38ゲノム配列の特定位置または特定領域に対応する位置または領域とは、具体的な配列の異なる別個体のゲノムにおいて、当該特定位置または特定領域に紐付けられる位置または領域を意味する。具体的には、配列の同一性に基づき、当該位置または領域に特徴的な配列を有する位置または領域が、hg38ゲノム配列の特定位置または特定領域に対応する位置または領域である。対応する位置は、2つのゲノムDNAの部分配列のアラインメントにより決定することができる。具体的な配列に相違がある場合であっても、オーソログの関係を有していたり、配列同一性を有していてアラインメントをすることによって、2つのゲノムDNAの対応関係を決定することができる。遺伝子重複により生じたパラログが豊富な領域では、単純な個別の配列に基づく配列の対応関係を決定するだけでは、2つのゲノム間の真の対応関係を決定するには十分でない場合がある。このことが類似配列が集積した領域の配列解読の難易度を増加させる。対応する配列の決定に際して、高い配列同一性を求めることで2つのゲノム間の対応関係を明らかにすることができる。また、特定領域が、複数遺伝子を含む大きな領域である場合には、シンテニーを考慮することができる。シンテニーとは、ゲノム上でのオーソログの物理的位置的関係が保存されていることをいう。個人間および生物間でシンテニーを有し得る。したがって、シンテニーを考慮して特定領域を決定することができる。
 1実施態様において、ゲノムの全アレル(2倍体の場合には2アレル)における領域の欠失(例えば、1Mbまで、または500kbまでの領域の欠失)であって、MHC分子をコードする遺伝子座のMHC類似配列集積領域の一部、または好ましくは全部を含む領域を含む欠失を有するゲノムを有する細胞が提供される。この態様では、類似配列による繰り返し配列が削除されることにより、ゲノムの可読性が向上し、および/または、ゲノムの遺伝子(例えば、MHC遺伝子)の標的化効率を高めることができる。当該欠失を有する細胞は、内在性または外来性の遺伝子の挿入を有していてもよい。挿入される遺伝子は、好ましくは制御配列に作動可能に連結されている。1実施態様では、細胞はヒト細胞であり、欠失は、HLA分子をコードする遺伝子座のMHC類似配列集積領域の一部、または好ましくは全部の領域を含む。
 1実施態様において、HLA-FからHLA-Aまでの一連の領域(第1のHLA類似配列集積領域)、HLA-CからHLA-Bまでの一連の領域(第2のHLA類似配列集積領域)、HLA-DRAからHLA-DOBまでの一連の領域(第3のHLA類似配列集積領域)、およびHLA-DMBからHLADPB2までの一連の領域(第4のHLA類似配列集積領域)並びにその一部からなる群から選択される1つ、2つ、3つ、または4つの領域を欠失した細胞が提供される。1実施形態において、上記細胞は、HLA-Eを含む領域を欠失していてもよい。
 第1から第4のHLA類似配列集積領域の標的化は、それぞれに固有の配列に対して行うことができる。このようにすることで、オフターゲットによる切断などの予期せぬ改変を防ぐことができる。当業者であれば、標的化をどのように行うとオフターゲットによる切断を防ぐことができるかを理解し、適宜標的化および改変を行うことができる。個々のHLAの改変は、他のHLAとの配列類似性により困難であっても、本開示による大規模欠失では、固有配列の存在する領域を自由に設定することができるので、所望の大規模欠失を作製することができる。1実施形態において、第1から第4のHLA類似配列集積領域の標的化はそれぞれ、第1から第4のHLA類似配列集積領域の外の配列に対するものである。
 1実施形態において、第1のHLA類似配列集積領域は、hg38ゲノム配列のchr6: 29,706,837-29,956,199に存在しうる。1実施形態において、第1のHLA類似配列集積領域は、hg38ゲノム配列のchr6: 29,711,000-30,020,000に存在しうる。1実施形態において、第2のHLA類似配列集積領域は、hg38ゲノム配列のchr6: 31,225,738-31,376,781に存在しうる。1実施形態において、第2のHLA類似配列集積領域は、hg38ゲノム配列のchr6: 31,176,000-31,534,000に存在しうる。1実施形態において、第3のHLA類似配列集積領域は、hg38ゲノム配列のchr6: 32,445,000-32,821,000に存在しうる。1実施形態において、第3のHLA類似配列集積領域は、hg38ゲノム配列のchr6: 32,445,000-32,821,000に存在しうる。1実施形態において、第4のHLA類似配列集積領域は、hg38ゲノム配列のchr6: 32,934,298-33,161,621に存在しうる。1実施形態において、第4のHLA類似配列集積領域は、hg38ゲノム配列のchr6: 33,002,000-33,147,000に存在しうる。
 1実施形態において、第1のHLA類似配列集積領域は、hg38ゲノム配列のchr6: 29,722,775-29,945,870に存在しうる。1実施形態において、第2のHLA類似配列集積領域は、hg38ゲノム配列のchr6: 31,268,749-31,357,179に存在しうる。1実施形態において、第3のHLA類似配列集積領域は、hg38ゲノム配列のchr6:32,439,887-32,817,002に存在しうる。1実施形態において、第4のHLA類似配列集積領域は、hg38ゲノム配列のchr6:32,934,636-33,089,696に存在しうる。
 第1~第4のHLA類似配列集積領域のそれぞれにおいて、欠失させるHLAを含む最小の領域を特定し、その上で、当該領域の両外側においてゲノム上で固有の配列を有する領域を決定する。この決定は、ゲノムデータベースなどを参照して適宜行うことができる。このような固有の配列を有する領域は、ゲノム編集および相同組換えのための相同アームの設計に用いることができる。相同アームは、典型的には、当該固有の配列を有する領域と相同組換え可能に設計される(例えば、同一の配列を有するように設計される)。ある好ましい実施形態では、第1~第4のHLA類似配列集積領域のそれぞれにおいて、全ての機能的なHLAをコードする遺伝子を含む領域を欠失させる。ある好ましい実施形態では、全ての機能的なHLAをコードする遺伝子を含む領域を欠失させ、かつ、当該領域の外側に存在する別の遺伝子をできるだけ含まないように欠失させる。例えば、当該領域の外側に存在する別の遺伝子を5以上、4以上、3以上、2以上、または1以上含まないように欠失させる。欠失領域は、相同組換えアームが相同組換え可能なゲノム上で固有の配列を有する領域の存在に依存する。ヒトの場合には、ヒトの固有の検討を行い、非ヒトの場合には、非ヒトの各生物種に固有の検討を行うことが望まれる。
 1実施態様において、本発明は、細胞であって、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:
 (i) hg38ゲノム配列のchr6:29,723,464-29,945,455の染色体領域に対応する染色体領域、
 (ii) hg38ゲノム配列のchr6:31,269,169-31,357,158の染色体領域に対応する染色体領域、
 (iii) hg38ゲノム配列のchr6:32,439,951-32,816,951の染色体領域に対応する染色体領域、および
 (iv) hg38ゲノム配列のchr6:33,006,838-33,086,238の染色体領域に対応する染色体領域
からなる群から選択される1以上の染色体領域中にそれぞれ位置するHLA類似配列集積領域の一部もしくは全体を含む領域の欠失であり、
 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列の全てを含み、
 前記一部は少なくとも一つながりの領域を含み、前記一つながりの領域は、上記領域にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列からなる群から選択される遺伝子の50%以上、60%以上、70%以上、80%以上、90%以上、または100%の遺伝子を含む、
細胞
を提供する。本明細書の全体にわたり、欠失は、両アレルにおける欠失である。ある態様では、本開示の細胞は、上記領域に加えて、その両端から外側に向けて、独立してそれぞれ20kbp以内、15kbp以内、10kbp以内、9kbp以内、8kbp以内、7kbp以内、6kbp以内、5kbp以内、4kbp以内、3kbp以内、2kbp以内、または1kbp以内の領域をさらに欠失していてもよい。また、ある態様では、本開示の細胞は、上記領域内の両端に位置する1以上(好ましくは1つ)のHLA遺伝子を欠失していなくてもよい。
 1実施態様において、本発明は、細胞であって、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:
 (i) hg38ゲノム配列のchr6:29,723,464-30,010,618)の染色体領域に対応する染色体領域、
 (ii) hg38ゲノム配列のchr6:31,269,169-31,463,338の染色体領域に対応する染色体領域、
 (iii) hg38ゲノム配列のchr6:32,439,887-32,817,002の染色体領域に対応する染色体領域、および
 (iv) hg38ゲノム配列のchr6:33,006,838-33,131,199の染色体領域に対応する染色体領域
からなる群から選択される1以上の染色体領域中にそれぞれ位置するHLA類似配列集積領域の一部もしくは全体を含む領域の欠失であり、
 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列の全てを含み、
 前記一部は少なくとも一つながりの領域を含み、前記一つながりの領域は、上記領域にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列からなる群から選択される遺伝子の50%以上、60%以上、70%以上、80%以上、90%以上、または100%の遺伝子を含む、
細胞
を提供する。本明細書の全体にわたり、欠失は、両アレルにおける欠失である。ある態様では、本開示の細胞は、上記領域に加えて、その両端から外側に向けて、独立してそれぞれ20kbp以内、15kbp以内、10kbp以内、9kbp以内、8kbp以内、7kbp以内、6kbp以内、5kbp以内、4kbp以内、3kbp以内、2kbp以内、または1kbp以内の領域をさらに欠失していてもよい。また、ある態様では、本開示の細胞は、上記領域内の両端に位置する1以上(好ましくは1つ)のHLA遺伝子を欠失していなくてもよい。
 1実施態様において、本発明は、細胞であって、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:
 (i) hg38ゲノム配列のchr6: 29,711,000-30,020,000の染色体領域に対応する染色体領域、
 (ii) hg38ゲノム配列のchr6: 31,176,000-31,534,000染色体領域に対応する染色体領域、
 (iii) hg38ゲノム配列のchr6: 32,445,000-32,821,000染色体領域に対応する染色体領域、および
 (iv) hg38ゲノム配列のchr6: 33,002,000-33,147,000染色体領域に対応する染色体領域
からなる群から選択される1以上の染色体領域中にそれぞれ位置するHLA類似配列集積領域の一部もしくは全体を含む領域の欠失であり、
 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列の全てを含み、
 前記一部は少なくとも一つながりの領域を含み、前記一つながりの領域は、上記領域にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列からなる群から選択される遺伝子の50%以上、60%以上、70%以上、80%以上、90%以上、または100%の遺伝子を含む、
細胞
を提供する。本明細書の全体にわたり、欠失は、両アレルにおける欠失である。ある態様では、本開示の細胞は、上記領域に加えて、その両端から外側に向けて、独立してそれぞれ20kbp以内、15kbp以内、10kbp以内、9kbp以内、8kbp以内、7kbp以内、6kbp以内、5kbp以内、4kbp以内、3kbp以内、2kbp以内、または1kbp以内の領域をさらに欠失していてもよい。また、ある態様では、本開示の細胞は、上記領域内の両端に位置する1以上(好ましくは1つ)のHLA遺伝子を欠失していなくてもよい。
 1実施態様において、本発明は、細胞であって、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:
 (i) hg38ゲノム配列のchr6: 29,706,837-29,956,199の染色体領域に対応する染色体領域、
 (ii) hg38ゲノム配列のchr6: 31,268,749-31,534,000染色体領域に対応する染色体領域、
 (iii) hg38ゲノム配列のchr6: 32,439,887-32,817,002染色体領域に対応する染色体領域、および
 (iv) hg38ゲノム配列のchr6: 32,934,636-33,089,696染色体領域に対応する染色体領域
からなる群から選択される1以上の染色体領域中にそれぞれ位置するHLA類似配列集積領域の一部もしくは全体を含む領域の欠失であり、
 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列の全てを含み、
 前記一部は少なくとも一つながりの領域を含み、前記一つながりの領域は、上記領域にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列からなる群から選択される遺伝子の50%以上、60%以上、70%以上、80%以上、90%以上、または100%の遺伝子を含む、
細胞
を提供する。本明細書の全体にわたり、欠失は、両アレルにおける欠失である。ある態様では、本開示の細胞は、上記領域に加えて、その両端から外側に向けて、独立してそれぞれ20kbp以内、15kbp以内、10kbp以内、9kbp以内、8kbp以内、7kbp以内、6kbp以内、5kbp以内、4kbp以内、3kbp以内、2kbp以内、または1kbp以内の領域をさらに欠失していてもよい。また、ある態様では、本開示の細胞は、上記領域内の両端に位置する1以上(好ましくは1つ)のHLA遺伝子を欠失していなくてもよい。
 上記(i)に規定された染色体領域は、HLA-F、HLA-G、およびHLA-Aを含むHLA類似配列集積領域を含む。そして、ある態様では、欠失は、HLA類似配列集積領域の一部、または好ましくは全部の欠失である。ここで一部とは、少なくとも1つのHLAおよびHLA類似配列を含む領域である。例えば、ある態様では、欠失は、HLA-F、HLA-G、およびHLA-Aからなる群から選択される1以上、好ましくは、すべてを含む領域の欠失である。ある態様では、欠失は、HLA類似配列集積領域の全部を含む領域の欠失であり、HLA-F、HLA-G、およびHLA-Aを含む領域の欠失である。
 ある態様では、HLAの一部又は全部を欠失した細胞は、例えば、追加的に導入された制御配列に作動可能に連結された内因性または外来性の所望の遺伝子を有していてもよい。追加的に導入された制御配列に作動可能に連結された内因性または外来性の所望の遺伝子は、ある態様では、天然に生じた配列を有するが、ある態様では、天然に生じた配列ではない、または人工的に設計された配列である。追加的に導入された所望の遺伝子は、例えば、細胞に付加的な機能を付与し得る。追加的に導入された所望の遺伝子は、例えば、分化促進因子、分化抑制因子、初期化因子(Oct4を含む多能性細胞への初期化に必要な因子を含む)、細胞の特定機能を活性化する因子、細胞の特定機能を抑制する因子、シグナル伝達因子、シグナル伝達抑制因子、受容体、膜タンパク質、酵素(例えば、代謝酵素、リン酸化酵素、核酸合成酵素、テロメラーゼなど)、増殖因子、増殖抑制因子、免疫活性化分子、または免疫抑制性分子、分解酵素(例えば、タンパク質分解酵素、核酸分解酵素など)、分泌因子(例えば、サイトカイン、ホルモンなど)、核内タンパク質、細胞質タンパク質、ミトコンドリアタンパク質、アンチセンスオリゴヌクレオチド、siRNA、shRNA、crRNA、およびtrcrRNA、一本鎖gRNA、マーカー遺伝子(例えば、薬剤耐性遺伝子、可視化マーカー遺伝子など)、誘導性の自殺遺伝子(例えば、誘導性プロモーターに作動可能に連結されたトキシン、例えば、ジフテリアトキシン)、並びにマイクロRNAからなる群から選択されるいずれか1以上をコードし得る。ある態様では、制御配列は、構成的プロモーターまたは誘導性プロモーターであり得る。
 ある態様では、上記(i)においてHLAの一部を欠失した細胞は、(i)において、例えば、1~数個(例えば、1~4個、好ましくは3個、より好ましくは2個、さらに好ましくは1個)のHLAを有していてもよい(残存させていてもよい)。ある態様では、上記(ii)においてHLAの一部を欠失した細胞は、(ii)において、例えば、1~数個(例えば、1~4個、好ましくは3個、より好ましくは2個、さらに好ましくは1個)のHLAを有していてもよい(残存させていてもよい)。ある態様では、上記(iii)においてHLAの一部を欠失した細胞は、(iii)において、例えば、1~数個(例えば、1~4個、好ましくは3個、より好ましくは2個、さらに好ましくは1個)のHLAを有していてもよい(残存させていてもよい)。ある態様では、上記(iv)においてHLAの一部を欠失した細胞は、(iv)において、例えば、1~数個(例えば、1~4個、好ましくは3個、より好ましくは2個、さらに好ましくは1個)のHLAを有していてもよい(残存させていてもよい)。
 ある態様では、欠失は、HLA類似配列集積領域の一部または好ましくは全部を含む領域の欠失である。この態様において、好ましくは、上記(i)に規定された染色体領域に所望の遺伝子が導入されている。これにより、この態様では、(i)に規定された染色体領域は、HLA類似配列集積領域の全部を欠失しているが、制御配列に作動可能に連結された所望の遺伝子(内因性または好ましくは外来性の遺伝子)またはその挿入を有する。ある態様では、欠失は、HLA類似配列集積領域の一部または好ましくは全部を含む領域の欠失である。この態様において、好ましくは、所望の遺伝子が、(i)に規定された染色体領域以外の領域に再導入されている。これにより、前記ゲノムDNAは、上記(i)に規定された染色体領域においてHLA類似配列集積領域の一部または好ましくは全体の欠失を有するが、(i)に規定された染色体領域以外の領域に制御配列に作動可能に連結された内因性または好ましくは外来性の所望の遺伝子を有する。内因性とは、欠失を有する細胞が有している、または有していた内在性の遺伝子と同一の塩基配列を有することを意味し、外来性とは、欠失を有する細胞が有している、または有していた内在性の遺伝子とは異なる塩基配列を有することを意味する。所望の遺伝子は、機能的な遺伝子である。機能的な遺伝子とは、当該遺伝子の本来的な機能を有することを意味する。(i)における欠失は、少なくともHLA-A、およびHLA-Fのいずれかまたは両方を含む。
 全ての態様において、制御配列に作動可能に連結された所望の遺伝子は、制御配列が外来性または内因性であり、かつ、所望の遺伝子が外来性または内因性である。ある態様において、制御配列は内因性であり、かつ所望の遺伝子は外来性である。ある態様において、制御配列は内因性であり、かつ、所望の遺伝子は内因性である。ある態様において、制御配列は外因性であり、かつ、所望の遺伝子は内因性である。ある態様において、制御配列は外因性であり、かつ所望の遺伝子は外因性である。ある態様において、制御配列は内因性であり、かつ、所望の遺伝子は内因性であるが、制御配列と所望の遺伝子を含む一連の配列は全体として、内因性または外因性である。制御配列としては、エンハンサー、プロモーターなどの様々な公知の制御配列が挙げられる。
 上記(ii)に規定された染色体領域は、HLA-C、HLA-B、MICA、およびMICBを含むHLA類似配列集積領域を含む。そして、ある態様では、欠失は、HLA類似配列集積領域の一部、または好ましくは全部である。ここで一部とは、少なくとも1つのHLAおよびHLA類似配列を含む領域である。例えば、ある態様では、欠失は、HLA-C、HLA-B、MICA、およびMICBからなる群から選択される1以上、好ましくは、すべてを含む領域の欠失である。
 上記(iii)に規定された染色体領域は、HLA-DRB5、HLA-DRB1、HLA-DQA1、HLA-DQB1、HLA-DQA2、HLA-DQB2、およびHLA-DOBを含むHLA類似配列集積領域を含む。そして、ある態様では、欠失は、HLA類似配列集積領域の一部、または好ましくは全部である。ここで一部とは、少なくとも1つのHLAおよびHLA類似配列を含む領域である。例えば、ある態様では、HLA-DRB5、HLA-DRB1、HLA-DQA1、HLA-DQB1、HLA-DQA2、HLA-DQB2、およびHLA-DOBからなる群から選択される1以上、好ましくは、すべてを含む領域の欠失である。
 上記(iv)に規定された染色体領域は、HLA-DOA、HLA-DPA1、およびHLA-DPB1を含むHLA類似配列集積領域を含む。そして、ある態様では、欠失は、HLA類似配列集積領域の一部、または好ましくは全部である。ここで一部とは、少なくとも1つのHLAおよびHLA類似配列を含む領域である。例えば、ある態様では、HLA-DOA、HLA-DPA1、およびHLA-DPB1からなる群から選択される1以上、好ましくは、すべてを含む領域の欠失である。
 本発明の趣旨に鑑みれば、上記(i)に規定される領域の欠失は、HLA類似配列集積領域のうちのHLAおよびHLA類似配列のいずれか1つのみを含む領域を除く他の全ての領域の欠失であり得る。
 ある態様では、上記(ii)に規定される領域の欠失は、HLA類似配列集積領域のうちのHLAおよびHLA類似配列のいずれか1つのみを含む領域を除く他の全ての領域の欠失であり得る。
 ある態様では、上記(iii)に規定される領域の欠失は、HLA類似配列集積領域のうちのHLAおよびHLA類似配列のいずれか1つのみを含む領域を除く他の全ての領域の欠失であり得る。
 ある態様では、上記(iv)に規定される領域の欠失は、HLA類似配列集積領域のうちのHLAおよびHLA類似配列のいずれか1つのみを含む領域を除く他の全ての領域の欠失であり得る。
 ある態様では、欠失は、(i)に規定される領域の欠失であり、(i)~(iv)の他の領域ではHLA類似配列集積領域の一部または全部の欠失を有しない。ある態様では、欠失は、(ii)に規定される領域の欠失であり、(i)~(iv)の他の領域ではHLA類似配列集積領域の一部または全部の欠失を有しない。ある態様では、欠失は、(iii)に規定される領域の欠失であり、(i)~(iv)の他の領域ではHLA類似配列集積領域の一部または全部の欠失を有しない。ある態様では、欠失は、(iv)に規定される領域の欠失であり、(i)~(iv)の他の領域ではHLA類似配列集積領域の一部または全部の欠失を有しない。
 ある態様では、欠失は、(i)~(iv)のそれぞれに規定される領域の欠失である。
 ある態様では、上記の欠失を有する領域には、1以上の遺伝子が挿入(ノックイン)されていてもよい。挿入される遺伝子は、選択マーカー(例えば、薬剤耐性マーカー、および可視化マーカー)および生理機能を有する目的遺伝子であり得る。上記挿入される遺伝子は、制御配列に作動可能に連結していることが好ましい。ある好ましい態様では、遺伝子が挿入される位置は、上記(i)~(iv)のいずれかである。ある好ましい態様では、遺伝子が挿入される位置は、上記上記(i)~(iv)のいずれでもない。ある好ましい態様では、遺伝子が挿入される位置は、上記(ii)の領域内である。ある好ましい領域では、上記(ii)の領域は、欠失(好ましくは上記に規定される欠失)を有し、かつ、上記1以上の遺伝子の挿入を有する。ある態様では、挿入される遺伝子は、上流および下流のいずれかまたは両方にインシュレーターを有しない。インシュレーターは、例えば、離れた位置にあるエンハンサーがプロモーターに作用するのを防いだり、隣接するヘテロクロマチンの拡大によるユークロマチンのサイレンシングを防ぐ作用を有するシス調節エレメントである。インシュレーターとしては、CTCFインシュレーター、gypsyインシュレーター、およびβグロビンインシュレーターが挙げられる。インシュレーターは、200~1000bpほどの長さを有する。インシュレーターは、インシュレーターを跨ぐPCR増幅などを阻害し得る。ある態様では、上記(ii)の領域は、欠失(好ましくは上記に規定される欠失)を有し、かつ、上記1以上の遺伝子の挿入をし、かつ、前記1以上の遺伝子は、そのセントロメア側およびテロメア側(または、上流および下流)のいずれかまたは両方にインシュレーターを有しない。ある態様では、上記欠失を有する領域は、新しい配列の挿入を有しない。ある態様では、上記欠失を有する領域は、loxPまたはFRT(フリッパーゼ認識標的)およびこれらの変種などの部位特異的組換え酵素の認識配列を有しない。
 ある態様では、前記欠失、特に上記(i)に規定される領域の欠失は、HLA-F、HLA-G、およびHLA-Aを含む一連の領域(例えば、hg38ゲノム配列のchr6:29,723,464-29,945,455、好ましくはchr6:29,723,464-30,010,618に対応する染色体領域の一部または好ましくは全部の欠失であり得る。ある態様では、前記欠失、特に上記(i)に規定される領域の欠失は、chr6: 29,701,000~29,723,464(例えば、Chr6: 29,709,000-29,711,000)の染色体領域中の特有の配列(第1の配列)中に一方の端を有し、chr6: 29,945,455-30,030,000(例えば、Chr6: 30,020,000-30,020,000の染色体領域およびchr6: 30,021,500-30,022,800)の染色体領域中の特有の配列(第2の配列)中に他方の端を有する領域の欠失である。第1の配列および第2の配列は、ゲノムにおける固有の配列(ユニークな配列)を含み、したがって、後述するドナー用DNAを用いた相同組換えによるゲノム改変における上流ホモロジーアーム(例えば、テロメア側ホモロジーアーム)および下流ホモロジーアーム(例えば、セントロメア側ホモロジーアーム)の標的し、上記固有の配列(ユニークな配列)に対して選択的に結合して狙ったとおりにゲノム改変を達成できるためである。前記欠失は、約300kbの欠失であるが、このような巨大欠失を効率よく生じさせる手法として、下記方法を好ましく用いることができる。
 ある態様では、前記欠失、特に上記(ii)に規定される領域の欠失は、HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはchr6:31,269,169-31,463,338の染色体領域に対応する染色体領域)の一部または好ましくは全部の欠失である。ある態様では、前記欠失、特に上記(ii)に規定される領域の欠失は、chr6: 31,166,000~31,269,169(例えば、Chr6: 31,174,000~31,177,000)の染色体領域中の特有の配列(第3の配列)中に一方の端を有し、chr6: 31,357,158~31,544,000(例えば、Chr6: 31,534,000~31,538,000)の染色体領域中の特有の配列(第4の配列)中に他方の端を有する領域の欠失である。第3の配列および第4の配列は、ゲノムにおける固有の配列固有の配列(ユニークな配列、別の言葉では、他に類似する配列が存在しない特有の配列)を含み、したがって、後述するドナー用DNAを用いた相同組換えによるゲノム改変における上流ホモロジーアーム(例えば、テロメア側ホモロジーアーム)および下流ホモロジーアーム(例えば、セントロメア側ホモロジーアーム)の標的し、上記固有の配列(ユニークな配列)に対して選択的に結合して狙ったとおりにゲノム改変を達成できるためである。前記欠失は、約360kbの欠失であるが、このような巨大欠失を効率よく生じさせる手法として、下記方法を好ましく用いることができる。
 ある態様では、前記欠失、特に上記(iii)に規定される領域の欠失は、HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:32,445,000-32,816,951、好ましくはchr6:32,439,951-32,817,002の染色体領域に対応する染色体領域)の一部または好ましくは全部の欠失である。ある態様では、前記欠失、特に上記(iii)に規定される領域の欠失は、chr6:32,416,000~33,445,000、例えば、chr6:32,420,000~33,445,000、例えば、chr6:32,429,000~33,445,000(例えば、Chr6: 32,446,000~32,448,500)の染色体領域中の特有の配列(第5の配列)中に一方の端を有し、chr6:32,439,951-32,831,000(例えば、Chr6: 32,820,500~32,822,500)の染色体領域中の特有の配列(第6の配列)中に他方の端を有する領域の欠失である。第5の配列および第6の配列は、ゲノムにおける固有の配列固有の配列(ユニークな配列、別の言葉では、他に類似する配列が存在しない特有の配列)を含み、したがって、後述するドナー用DNAを用いた相同組換えによるゲノム改変における上流ホモロジーアーム(例えば、テロメア側ホモロジーアーム)および下流ホモロジーアーム(例えば、セントロメア側ホモロジーアーム)の標的し、上記固有の配列(ユニークな配列)に対して選択的に結合して狙ったとおりにゲノム改変を達成できるためである。前記欠失は、約380kbの欠失であるが、このような巨大欠失を効率よく生じさせる手法として、下記方法を好ましく用いることができる。
 ある態様では、前記欠失、特に上記(iv)に規定される領域の欠失は、HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:33,006,838-33,086,238、好ましくは、chr6:33,006,838-33,131,199の染色体領域に対応する染色体領域)の一部または全部の欠失であり得る。ある態様では、前記欠失、特に上記(iv)に規定される領域の欠失は、chr6:32,924,000~33,006,838(例えば、Chr6: 32,999,500~33,002,500)の染色体領域中の特有の配列(第7の配列)中に一方の端を有し、chr6: 33,086,238-33,165,000(例えば、Chr6: 33,147,500~33,150,500)の染色体領域中の特有の配列(第8の配列)中に他方の端を有する領域の欠失である。第7の配列および第8の配列は、ゲノムにおける固有の配列固有の配列(ユニークな配列、別の言葉では、他に類似する配列が存在しない特有の配列)を含み、したがって、後述するドナー用DNAを用いた相同組換えによるゲノム改変における上流ホモロジーアーム(例えば、テロメア側ホモロジーアーム)および下流ホモロジーアーム(例えば、セントロメア側ホモロジーアーム)の標的し、上記固有の配列(ユニークな配列)に対して選択的に結合して狙ったとおりにゲノム改変を達成できるためである。前記欠失は、約150kbの欠失であるが、このような巨大欠失を効率よく生じさせる手法として、下記方法を好ましく用いることができる。
 ある態様では、前記欠失を有する細胞は、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:
 (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域(例えば、hg38ゲノム配列のchr6:29,723,464-29,945,455、好ましくはchr6:29,723,464-30,010,618に対応する染色体領域)、
 (ii) HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはchr6:31,269,169-31,463,338の染色体領域に対応する染色体領域)、
 (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:32,445,000-32,816,951、好ましくはchr6:32,439,951-32,817,002の染色体領域に対応する染色体領域)、および
 (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:33,006,838-33,086,238、好ましくは、chr6:33,006,838-33,131,199の染色体領域に対応する染色体領域)
からなる群から選択される全ての染色体領域中にそれぞれ位置するHLA類似配列集積領域の一部もしくは全体を含む領域の欠失であり、
 前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列の全てを含み、
 前記一部は少なくとも一つながりの領域を含み、前記一つながりの領域は、上記領域にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列からなる群から選択される遺伝子の50%以上、60%以上、70%以上、80%以上、90%以上、または100%の遺伝子を含む。
 ある態様では、前記欠失を有する細胞は、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:
 (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域(例えば、hg38ゲノム配列のchr6:29,723,464-29,945,455、好ましくはchr6:29,723,464-30,010,618に対応する染色体領域)、
 (ii) HLA-CおよびHLA-Bを含む一連の領域(例えば、hg38ゲノム配列のchr6:31,269,169-31,357,158、好ましくはchr6:31,269,169-31,463,338の染色体領域に対応する染色体領域)、
 (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:32,445,000-32,816,951、好ましくはchr6:32,439,951-32,817,002の染色体領域に対応する染色体領域)、および
 (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域(例えば、hg38ゲノム配列のchr6:33,006,838-33,086,238、好ましくは、chr6:33,006,838-33,131,199の染色体領域に対応する染色体領域)
からなる群から選択される全ての染色体領域の欠失であり、
 好ましくは、HLA-Eを含む一連の領域の更なる欠失、並びにHLA-DMBを含む一連の領域、MICAおよびMICBを含む一連の領域、およびHLA-DMAを含む一連の領域の更なる欠失をさらに有する。
 ある態様では、上記(i)が欠失を有する場合、欠失を有する上記(i)は、その染色体領域内に繰り返し配列を有しない。ある態様では、上記(ii)が欠失を有する場合、欠失を有する上記(ii)は、その染色体領域内に繰り返し配列を有しない。ある態様では、上記(iii)が欠失を有する場合、欠失を有する上記(iii)は、その染色体領域内に繰り返し配列を有しない。ある態様では、上記(iv)が欠失を有する場合、欠失を有する上記(iv)は、その染色体領域内に繰り返し配列を有しない。繰り返し配列は、例えば、シークエンシングを困難にする一つながりの配列である。繰り返し配列は、例えば、ドナー用DNAのホモロジーアームに対してオフターゲットを誘発する一つながりの配列である。繰り返し配列は、例えば、0.5kb~2kbの配列の繰り返しを含む。
 ある態様では、前記欠失を有するヒト細胞は、機能的なβ2ミクログロブリン(B2M)をコードする遺伝子を有する。ある態様では、前記欠失を有するヒト細胞は、機能的なクラスII腫瘍組織適合遺伝子複合体トランスアクチベーター(CIITA)をコードする遺伝子を有する。ある態様では、前記欠失を有するヒト細胞は、機能的なB2Mをコードする遺伝子および機能的なCIITAをコードする遺伝子を有する。これによりB2MおよびCIITAが欠失したことにより、細胞に生じ得る不測の機能改変を防ぐことができる。にも関わらず、ある態様では、前記欠失を有するヒト細胞は、HLAクラスIおよび/またはHLAクラスIIを細胞表面に実質的に発現していない。
 ある態様では、前記欠失は、100kb以上、150kb以上、200kb以上、250kb以上、300kb以上、350kb以上、または400kb以上の大きさであり得る。ある態様では、前記欠失は、400kb以下、350kb以下、300kb以下、250kb以下、200kb以下、150kb以下、または100kb以下の大きさであり得る。ある態様では、前記欠失は、100kb~400kbの大きさであり得る。
 ある態様では、細胞は、完成体細胞であり得るが、更なる改変導入のための前駆体細胞であってもよい。
 以下、細胞例1~4として、それ自身が有用な細胞として用いられ得るが、更なる改変導入のための前駆体細胞としても有用な細胞の例を挙げる。細胞例1~4では、HLA類似配列集積領域の少なくとも1つが欠失しているために、ゲノムの配列解読または遺伝子のターゲティングが繰り返し配列の存在により妨げられる問題を解消し得る。これにより、改変が容易になると共に、改変後の配列解読が容易になることで、より確かな遺伝子工学の適用を可能とする。
細胞例1
 ある態様では、細胞は、上記(i)において欠失を有する。ある好ましい態様では、欠失は、HLA類似配列集積領域の全体の欠失であり得る。ある態様では、上記(i)における欠失は、1以上の所望の遺伝子またはその挿入を含むDNAにより置き換えられることによる欠失であり得る。ある態様では、所望の遺伝子は、選択マーカー遺伝子であり得る。選択マーカー遺伝子は、好ましくは、ポジティブ選択マーカー遺伝子を含み、より好ましくは、ポジティブ選択マーカー遺伝子およびネガティブ選択マーカー遺伝子の両方を含むか、またはポジティブ選択用およびネガティブ選択用のいずれにも用い得るマーカー遺伝子を含む。ある態様では、細胞は、上記(i)において欠失を有し、上記(ii)~(iv)においては欠失を有しない。細胞例1は、HLA-AおよびFを欠失しており、それ自体有用な細胞であるが、例えば、細胞例2~4を作製するために用いられ得る。
細胞例2
 ある態様では、細胞は、上記(i)において欠失を有し、かつ、制御配列に作動可能に連結された所望の遺伝子またはその挿入を有する。ある好ましい態様では、上記(i)における欠失は、HLA類似配列集積領域の全体を含む欠失である。ある態様では、上記(i)における欠失は、1以上の所望の遺伝子またはその挿入を含むDNAにより置き換えられることによる欠失であり得る。ある対象では、所望の遺伝子は、当該欠失を有する細胞に対する免疫を抑制する分子であり得、例えば、免疫抑制性分子をコードする遺伝子であり得る。ある態様では、欠失を有する領域は、選択マーカー遺伝子を含む。選択マーカー遺伝子は、好ましくは、ポジティブ選択マーカー遺伝子を含み、より好ましくは、ポジティブ選択マーカー遺伝子およびネガティブ選択マーカー遺伝子の両方を含むか、またはポジティブ選択用およびネガティブ選択用のいずれにも用い得るマーカー遺伝子を含む。ある態様では、欠失を有する細胞は、上記(i)以外の領域に所望の遺伝子を有する。細胞例2は、それ自体有用な細胞であるが、例えば、細胞例3~4を作製するために用いられ得る。
細胞例3
 ある態様では、細胞は、上記(i)、ならびに上記(iii)および/または上記(iv)において欠失を有し、かつ、制御配列に作動可能に連結された所望の遺伝子またはその挿入を有する。ある好ましい態様では、細胞は、上記(i)、上記(iii)および上記(iv)において欠失を有し、かつ、制御配列に作動可能に連結された所望の遺伝子またはその挿入を有する。ある好ましい態様では、上記(i)、上記(iii)および上記(iv)における欠失はそれぞれ、その領域内のHLA類似配列集積領域の全体を含む欠失である。ある態様では、上記(i)における欠失は、1以上の所望の遺伝子またはその挿入を含むDNAにより置き換えられることによる欠失であり得る。ある対象では、所望の遺伝子は、当該欠失を有する細胞に対する免疫を抑制する分子であり得、例えば、免疫抑制性分子をコードする遺伝子であり得る。ある態様では、細胞は、上記(i)、ならびに上記(iii)および/または上記(iv)において欠失を有し、欠失した領域のいずれか1以上または全ては、選択マーカー遺伝子を含む。選択マーカー遺伝子は、好ましくは、ポジティブ選択マーカー遺伝子を含み、より好ましくは、ポジティブ選択マーカー遺伝子およびネガティブ選択マーカー遺伝子の両方を含むか、またはポジティブ選択用およびネガティブ選択用のいずれにも用い得るマーカー遺伝子を含む。ある好ましい態様では、上記(i)、上記(iii)および上記(iv)のいずれも、マーカー遺伝子または新しい遺伝子などの所望の遺伝子の挿入を有しない。ある態様では、細胞は、上記(ii)においては欠失を有しない。細胞例3は、それ自体有用な細胞であるが、例えば、細胞例4を作製するために用いられ得る。
細胞例4
 ある態様では、細胞は、上記(i)~上記(iv)のすべてにおいて欠失を有し、かつ、制御配列に作動可能に連結された所望の遺伝子またはその挿入を有する。ある好ましい態様では、上記(i)における欠失は、1以上の所望の遺伝子またはその挿入を含むDNAにより置き換えられることによる欠失であり得る。ある対象では、所望の遺伝子は、当該欠失を有する細胞に対する免疫を抑制する分子であり得、例えば、免疫抑制性分子をコードする遺伝子であり得る。ある好ましい態様では、上記(ii)における欠失は、1以上の所望の遺伝子を含むDNAにより置き換えられることによる欠失であり得る。ある好ましい態様では、所望の遺伝子は、選択マーカー遺伝子であり得る。選択マーカー遺伝子は、好ましくは、ポジティブ選択マーカー遺伝子を含み、より好ましくは、ポジティブ選択マーカー遺伝子およびネガティブ選択マーカー遺伝子の両方を含むか、またはポジティブ選択用およびネガティブ選択用のいずれにも用い得るマーカー遺伝子を含む。ある好ましい態様では、上記(iii)および上記(iv)のいずれも、マーカー遺伝子または新しい遺伝子などの所望の遺伝子の挿入を有しない。細胞例4は、それ自体有用な細胞であるが、例えば、上記(ii)における1以上の所望の遺伝子またはその挿入を含むDNA部分を更に他のDNAに置き換えることに用いられ得る。例えば、これにより、マーカー遺伝子を除去したり、マーカー遺伝子を除去した上で別の所望の遺伝子を導入することができる。ゲノム解析からは、上記(ii)の領域は、転写活性化された領域であり、所望の遺伝子を導入することによって、当該所望の遺伝子を良好に発現させることができると期待できる。ある好ましい態様では、所望の遺伝子は、上記(ii)の領域に挿入され、当該遺伝子のセントロメア側およびテロメア側のいずれかまたは両方にインシュレーターが存在しない。
 ある態様では、前記欠失を有する細胞は、少なくともHLA-Aを有しない。ある態様では、前記欠失を有する細胞は、少なくともHLA-AおよびFを有しない。一方で、前記欠失を有する細胞は、HLA-B、C、E、G、H、J、およびW;MICAおよびMICB;並びにHLA-DRA、DRB1、DRB5、DRB6、DRB9、DQA1、DQA2、DQB1、DPA1、DPB1、DMB、DOA、およびDOBからなる群から選択される1以上または全てを有していてもよい。
 以上が細胞例1~4の説明である。このように、HLA欠失を有する細胞において、HLA領域は、マーカー遺伝子に置き換わっていてもよいし、所望の遺伝子(目的遺伝子)に置き換わっていてもよい。マーカー遺伝子および目的遺伝子は、制御配列に作動可能に連結している。
 全ての態様において、前記欠失を有する細胞では、欠失は2つのアレルにおいて生じており、これにより、欠失させた遺伝子の発現が欠失している。
 ある態様では、前記欠失を有する細胞は、単離された細胞または細胞株であり得る。
 ある態様では、前記欠失を有する細胞は、T細胞ナチュラルキラー細胞(NK細胞)による細胞傷害作用を回避し得る。ある態様では、前記欠失を有する細胞は、同種異系の個体に投与されても、当該細胞に対する免疫拒絶を誘発しないことができる。これにより、例えば、造血幹細胞移植、臓器移植、細胞移植、または組織移植に好ましく用い得る細胞が提供されるのである。
 ある態様では、前記欠失を有する細胞は、細胞凍結保護液中で凍結されうる。ある態様では、前記欠失を有する細胞を含む細胞凍結保護液は、非凍結状態または好ましくは凍結状態で提供され得る。凍結状態の前記欠失を有する細胞を含む細胞凍結保護液(「フリーズストック」ともいう)は、リサーチセルバンク(RCB)、マスターセルバンク(MCB)、またはワーキングセルバンク(WCB)として用いることができる。したがって、本発明では、上記フリーズストックを含む、リサーチセルバンク(RCB)、マスターセルバンク(MCB)、またはワーキングセルバンク(WCB)が提供される。前記欠失を有するゲノムDNAは、全ゲノムシークエンスがなされ得る。また、ある態様では、前記全ゲノムシークエンスからリファレンスゲノムデータが作成される。上記において(i)~(iv)における繰り返し配列が除去されている場合には、このリファレンスゲノムデータの作成は、より容易になる。前記欠失を有するゲノムDNAを有する細胞をさらにゲノム改変した後には、当該リファレンスゲノムに基づいて改変部位の改変状況を確認することができる。これにより、前記欠失を有する細胞は、さらなるゲノム改変を容易にし、または確実にし、かつ、得られた改変ゲノムの配列を容易に確定し得ることとなる。
 前記細胞としては、例えば、多能性細胞(例えば、胚性幹細胞(ES細胞)および誘導多能性幹細胞(iPS細胞)などの多能性幹細胞)、造血幹細胞、造血前駆細胞、骨髄細胞、脾臓細胞、骨髄系共通前駆細胞、免疫細胞(例えば、T細胞、B細胞、NK細胞、NKT細胞、マクロファージ、単球、好中球、好酸球、好塩基球)、赤血球、巨核球、心臓細胞、心筋細胞、心臓線維芽細胞、膵β細胞、角膜細胞(例えば、角膜上皮細胞、および角膜内皮細胞)、表皮細胞、真皮細胞、脂肪細胞、軟骨細胞、骨細胞、破骨細胞、骨芽細胞、間葉系幹細胞(例えば、脂肪由来、骨髄由来、胎盤由来および臍帯由来)、歯髄細胞、腱細胞、靭帯細胞、神経細胞(例えば、錐体細胞、星状細胞、および顆粒細胞)、グリア細胞、プルキンエ細胞、網膜神経節細胞、網膜細胞、視神経細胞、および神経幹細胞が挙げられる。ある好ましい態様では、細胞は初代細胞であり得る。ある好ましい態様では、細胞は不死化された細胞、または細胞株であり得る。
 前記欠失を有する細胞は、オルガノイドなどの細胞集塊を形成していてもよい。前記欠失を有する細胞は、細胞シートを形成していてもよい。前記欠失を有する細胞は、臓器もしくは組織の全体または部分構造を形成していてもよい。
 ある態様では、前記欠失を有する細胞を含む組成物(例えば、医薬組成物、または細胞製剤)が提供される。前記組成物は、医療用途に用いられ得る。前記組成物は、細胞に加えて、薬学的に許容可能な担体および/または添加剤をさらに含んでいてもよい。薬学的に許容可能な担体としては、例えば、水、および生理食塩水が挙げられる。薬学的に許容可能な添加剤としては、例えば、塩、pH緩衝剤、および等張剤が挙げられる。前記組成物は、好ましい態様では、血清フリーであり得る。
 以下に記載する方法(例えば、UKiS;国際公開第2021/206054号参照)は、染色体ゲノムの2つ以上のアレルに同時に同じ改変を効率よく導入する方法として有益であり、例えば、標的となる染色体領域に配列特異的様式で100kb~500kb程度の大きさの欠失を作製することに適しており、上記細胞の作製に好ましく用いることができる。この方法は、1倍体の細胞の改変に対しても適用することができる。この方法はまた、ゲノムDNA上で、HLA遺伝子領域のアレルが1つのみである細胞に対しても適用することができる。
 1実施態様において、本発明は、染色体ゲノムの2つ以上のアレルが改変された細胞を作製する方法であって、
(a)下記(i)及び(ii)を、2つ以上のアレルを含む細胞に導入して、前記2つ以上のアレルそれぞれに選択マーカー遺伝子を導入する工程と、
(i)前記染色体ゲノムの2つ以上のアレル中の標的領域を標的とし、当該標的領域を切断することができる配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、
(ii)2種以上の選択マーカー用ドナーDNAであって、それぞれが前記標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側の塩基配列と相同組換え可能な塩基配列を有する下流ホモロジーアームとを有し、かつ、上流ホモロジーアームと下流ホモロジーアームの間に、選択マーカー遺伝子の塩基配列を含み、前記2種以上の選択マーカー用ドナーDNAは、相互に区別可能に異なる選択マーカー遺伝子をそれぞれ有し、前記選択マーカー遺伝子は、選択マーカー用ドナーDNAの種類毎に固有であり、前記選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とする前記アレルの数と同数以上である、2種以上の選択マーカー用ドナーDNA、
(b)前記工程(a)の後、前記2以上のアレルに対して異なる種類の選択マーカー用ドナーDNAがそれぞれ相同組み換えすることによって、当該2以上のアレルにそれぞれ区別可能に異なる固有の選択マーカー遺伝子が導入され、導入された当該区別可能に異なる選択マーカー遺伝子のすべてを発現する細胞を選択する工程(ポジティブ選択のための工程)と、
を含む、方法であり得る。
(工程(a))
 工程(a)では、前記(i)及び(ii)を、染色体を含む細胞に導入する。
 本実施形態のゲノム改変方法に用いる細胞は、特に限定されず、1倍体または2倍体以上の染色体ゲノムを有する細胞であればよい。細胞は、2倍体であってもよく、3倍体であってもよく、4倍体以上であってもよい。細胞としては、特に限定されないが、真核生物の細胞が挙げられる。細胞は、植物細胞であってもよく、動物細胞であってもよく、真菌細胞であってもよい。動物細胞は、特に限定されないが、ヒト、ヒト以外の哺乳動物(例えば、サルなどの非ヒト霊長類、イヌ、ネコ、ウシ、ウマ、ヒツジ、ヤギ、ラマ、齧歯類などの非ヒト哺乳類)、鳥類、爬虫類、両生類、魚類、その他の脊椎動物のいずれの細胞であってもよい。
 ゲノム改変の対象となる標的領域は、1以上のアレルを有するゲノム上の任意の領域とすることができる。標的領域のサイズは、特に限定されない。本実施形態のゲノム改変方法では、従来よりも大きなサイズの領域を改変することができる。標的領域は、例えば、10kbp以上であってもよい。標的領域は、例えば、100bp以上、200bp以上、400bp以上、800bp以上、1kbp以上、2kbp以上、3kbp以上、4kbp以上、5kbp以上、8kbp以上、10kbp以上、20kbp以上、40kbp以上、80kbp以上、100kbp以上、200kbp以上、300kbp、400kbp以上、500kbp以上、600kbp以上、700kbp以上、800kbp以上、900kbp以上、もしくは1Mbp以上、または上記のいずれかの数値以下であってもよい。ある態様では、改変された細胞において、上記標的領域が欠失している。
<(i)ゲノム改変システム>
 「ゲノム改変システム」とは、所望の標的領域を改変することが可能な分子機構を意味する。ゲノム改変システムは、染色体ゲノムの標的領域を標的とする配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含む。
 配列特異的核酸切断分子は、配列特異的核酸切断活性を有する分子であれば、特に限定されず、合成有機化合物であってもよく、タンパク質等の生体高分子化合物であってもよい。配列特異的核酸切断活性を有する合成有機化合物としては、例えば、ピロール・イミダゾールポリアミド等が挙げられる。配列特異的部位切断活性を有するタンパク質としては、例えば、配列特異的エンドヌクレアーゼが挙げられる。
 配列特異的エンドヌクレアーゼは、所定の配列で核酸を切断することができる酵素である。配列特異的エンドヌクレアーゼは、所定の配列で、2本鎖DNAを切断することができる。配列特異的エンドヌクレアーゼとしては、特に限定されないが、例えば、ジンクフィンガーヌクレアーゼ(Zinc finger nuclease(ZFN))、TALEN(Transcription activator-like effector nuclease)、Casタンパク質等が挙げられるが、これらに限定されない。
 ZFNは、ジンクフィンガーアレイを含む結合ドメインにコンジュゲートした核酸切断ドメインを含む人工ヌクレアーゼである。切断ドメインとしては、II型制限酵素FokIの切断ドメインが挙げられる。標的配列を切断可能なジンクフィンガーヌクレアーゼの設計は、公知の方法で行うことができる。
 TALENは、DNA切断ドメイン(例えば、FokIドメイン)に加えて転写活性化因子様(TAL)エフェクターのDNA結合ドメインを含む人工ヌクレアーゼである。標的配列を切断可能なTALE構築物の設計は、公知の方法で行うことができる(例えば、Zhang, Feng et. al. (2011) Nature Biotechnology 29 (2))。
 配列特異的核酸切断分子として、Casタンパク質を用いる場合、ゲノム改変システムは、CRISPR/Casシステムを含む。すなわち、ゲノム改変システムは、Casタンパク質と、標的領域内の塩基配列に相同な塩基配列を有するガイドRNAを含むことが好ましい。ガイドRNAは、スペーサー配列として、標的領域内の配列(標的配列)と相同な配列を含んでいればよい。ガイドRNAは、標的領域内のDNAに結合できるものでればよく、標的配列と完全に同一の配列を有している必要はない。この結合は、細胞核内の生理的条件下で形成されればよい。ガイドRNAは、例えば、標的配列に対して、例えば、0~3塩基のミスマッチを含むことができる。前記ミスマッチの数は、0~2塩基が好ましく、0~1がより好ましく、ミスマッチを有しないことがさらに好ましい。ガイドRNAの設計は、公知の方法に基づいて行うことができる。ゲノム改変システムは、CRISPR/Casシステムであることが好ましく、Casタンパク質とガイドRNAを含むことが好ましい。Casタンパク質は、Cas9タンパク質であることが好ましい。
 配列特異的エンドヌクレアーゼは、タンパク質として細胞に導入してもよく、配列特異的エンドヌクレアーゼをコードするポリヌクレオチドとして細胞に導入してもよい。例えば、配列特異的エンドヌクレアーゼのmRNAを導入してもよく、配列特異的エンドヌクレアーゼの発現ベクターを導入してもよい。発現ベクターにおいて、配列特異的エンドヌクレアーゼのコード配列(配列特異的エンドヌクレアーゼ遺伝子)は、プロモーターに機能的に連結されている。プロモーターは、特に限定されず、例えば、pol II系プロモーターを各種使用することができる。pol II系プロモーターとしては、特に制限されないが、例えばCMVプロモーター、EF1プロモーター(EF1αプロモーター)、SV40プロモーター、MSCVプロモーター、hTERTプロモーター、βアクチンプロモーター、CAGプロモーター、CBhプロモーター等が挙げられる。
 プロモーターは、誘導性プロモーターであってもよい。誘導性プロモーターは、プロモーターを駆動する誘導因子の存在下でのみ、当該プロモーターに機能的に連結されたポリヌクレオチドの発現を誘導することができるプロモーターである。誘導性プロモーターとしては、ヒートショックプロモーターなどの加熱により遺伝子発現を誘導するプロモーターが挙げられる。また、誘導性プロモーターには、プロモーターを駆動する誘導因子が薬剤であるプロモーターが挙げられる。このような薬剤誘導性プロモーターとしては、例えば、Cumateオペレーター配列、λオペレーター配列(例えば、12×λOp)、テトラサイクリン系誘導性プロモーター等が挙げられる。テトラサイクリン系誘導性プロモーターとしては、例えば、テトラサイクリンもしくはその誘導体(例えば、ドキシサイクリン)、またはリバーステトラサイクリン制御性トランス活性化因子(rtTA)の存在下で遺伝子発現を駆動するプロモーターが挙げられる。テトラサイクリン系誘導性プロモーターとしては、例えば、TRE3Gプロモーターが挙げられる。
 発現ベクターは、公知のものを特に制限なく用いることができる。発現ベクターとしては、例えば、プラスミドベクター、ウイルスベクターが挙げられる。配列特異的エンドヌクレアーゼがCasタンパク質である場合、発現ベクターは、Casタンパク質のコード配列(Casタンパク質遺伝子)に加えて、ガイドRNAコード配列(ガイドRNA遺伝子)及びを含んでいてもよい。この場合、ガイドRNAコード配列(ガイドRNA遺伝子)は、pol III系プロモーターに機能的にされていることが好ましい。pol III系プロモーターとしては、例えば、マウス及びヒトのU6-snRNAプロモーター、ヒトH1-RNase P RNAプロモーター、ヒトバリン-tRNAプロモーター等が挙げられる。
<(ii)選択マーカー用ドナーDNA>
 選択マーカー用ドナーDNAは、選択マーカーを標的領域にノックインするためのドナーDNAである。選択マーカー用ドナーDNAは、標的領域の上流側に隣接する塩基配列と相同な塩基配列を有する上流ホモロジーアームと、標的領域の下流側に隣接する塩基配列と相同な塩基配列を有する下流ホモロジーアームとの間に、1以上の選択マーカー遺伝子の塩基配列を含む。
 選択マーカー用ドナーDNAは、特に限定されないが、例えば、1kb以上、2kb以上、3kb以上、4kb以上、5kb以上、6kb以上、7kb以上、8kb以上、9kb以上、9.5kb以上、または10kb以上の長さを有し得る。選択マーカー用ドナーDNAは、特に限定されないが、例えば、50kb以下、45kb以下、40kb以下、35kb以下、30kb以下、25kb以下、20kb以下、15kb以下、14kb以下、13kb以下、12kb以下、11kb以下、10kb以下、9kb以下、8kb以下、7kb以下、6kb以下、5kb以下、または4kb以下の長さを有し得る。
 「選択マーカー」とは、その発現の有無に基づいて、細胞を選択することができるタンパク質を意味する。選択マーカー遺伝子は、選択マーカーをコードする遺伝子である。選択マーカー発現細胞及び非発現細胞が混在する細胞集団において、選択マーカー発現細胞を選択する場合、当該選択マーカーを「ポジティブ選択マーカー」または「ポジティブ選択用の選択マーカー」という。選択マーカー発現細胞及び非発現細胞が混在する細胞集団において、選択マーカー非発現細胞を選択する場合、当該選択マーカーを「ネガティブ選択マーカー」または「ネガティブ選択用の選択マーカー」という。選択マーカーが相互に異なるとは、相互に区別できること(例えば、区別可能に異なること)を意味し、例えば、選択マーカーが導入された細胞に付与する薬剤耐性の性質などの生理学的性質またはその他の物理化学的性質において少なくとも相互に区別できることを意味する。すなわち、選択マーカーが相互に異なるとは、異なる複数の選択マーカーが他の選択マーカーと区別可能に検出できること、または他の選択マーカーとは区別可能に薬剤選択できることを意味する。また、前記選択マーカー遺伝子が選択マーカー用ドナーDNAの種類毎に固有であるとは、選択マーカー用ドナーDNAの1種が有する選択マーカー遺伝子が、上記以外の種類の選択マーカー用ドナーDNAには含まれないこと、または、複数種類のドナーDNAに含まれている場合には、同時に2種類以上のドナーDNAから発現しないように構成されていることを意味する。このとき、2種類以上のドナーDNAは、選択マーカー以外は同一であってもよく、選択マーカー以外の配列および/または構成において相違があってもよい。
 ポジティブ選択マーカーは、それを発現する細胞を選択可能なものであれば、特に限定されない。ポジティブ選択マーカー遺伝子としては、例えば、薬剤耐性遺伝子、蛍光タンパク質遺伝子、発光酵素遺伝子、発色酵素遺伝子等が挙げられる。
 ネガティブ選択マーカーは、それを発現しない細胞を選択可能なものであれば、特に限定されない。ネガティブ選択マーカー遺伝子としては、例えば、自殺遺伝子(チミジンカイネース等)、蛍光タンパク質遺伝子、発光酵素遺伝子、発色酵素遺伝子等が挙げられる。ネガティブ選択マーカー遺伝子が、細胞の生存に負の影響を与える遺伝子(例えば、自殺遺伝子)である場合、当該ネガティブ選択マーカー遺伝子は、誘導性プロモーターに機能的に連結され得る。誘導性プロモーターに機能的に連結することで、ネガティブ選択マーカー遺伝子を有する細胞を除去したいときにのみ、ネガティブ選択マーカー遺伝子を発現させることができる。ネガティブ選択マーカー遺伝子が、蛍光、発光、および発色等の光学的に検出可能なマーカー遺伝子(可視化マーカー遺伝子;visible marker gene)である場合など、細胞の生存に負の影響が少ない場合には、恒常的に発現させてもよい。
 薬剤耐性遺伝子としては、例えば、ピューロマイシン耐性遺伝子、ブラスティサイディン耐性遺伝子、ジェネティシン耐性遺伝子、ネオマイシン耐性遺伝子、テトラサイクリン耐性遺伝子、カナマイシン耐性遺伝子、ゼオシン耐性遺伝子、ハイグロマイシン耐性遺伝子、クロラムフェニコール耐性遺伝子等が挙げられるが、これらに限定されない。
 蛍光タンパク質遺伝子としては、例えば、緑色蛍光タンパク質(GFP)遺伝子、黄色蛍光タンパク質(YFP)遺伝子、赤色蛍光タンパク質(RFP)遺伝子等が挙げられるが、これらに限定されない。
 発光酵素遺伝子としては、例えば、ルシフェラーゼ遺伝子などが挙げられるが、これらに限定されない。
 発色酵素遺伝子としては、例えば、βガラクトシターゼ遺伝子、βグルクロニダーゼ遺伝子、アルカリフォスファターゼ遺伝子等が挙げられるが、これらに限定されない。
 自殺遺伝子としては、例えば、単純ヘルペスウイルスのチミジンキナーゼ(HSV-TK)、誘導性カスパーゼ9(inducible caspase 9)等が挙げられるが、これらに限定されない。
 選択マーカー用ドナーDNAが有する選択マーカー遺伝子は、ポジティブ選択マーカー遺伝子であることが好ましい。すなわち、選択マーカーを発現する細胞を、選択マーカー遺伝子がノックインされた細胞として、選択することができる。
 上流ホモロジーアームは、改変対象のゲノムにおいて、標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有し、例えば、標的配列の上流側に隣接する塩基配列と相同な塩基配列を有する。下流ホモロジーアームは、改変対象のゲノムにおいて、標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有し、例えば、標的配列の下流側に隣接する塩基配列と相同な塩基配列を有する。上流ホモロジーアーム及び下流ホモロジーアームは、標的領域の周辺領域と相同組換可能であれば、その長さ及び配列は特に限定されない。上流ホモロジーアーム及び下流ホモロジーアームは、相同組換え可能な限り、標的領域の上流側配列若しくは下流側配列と必ずしも完全一致する必要はない。例えば、上流ホモロジーアームは、標的領域の上流側に隣接する塩基配列と90%以上の配列同一性(相同性)を有する配列であることができ、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、又は99%以上の配列同一性を有することが好ましい。例えば、下流ホモロジーアームは、標的領域の下流側に隣接する塩基配列と90%以上の配列同一性(相同性)を有する配列であることができ、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、又は99%以上の配列同一性を有することが好ましい。また、上流ホモロジーアームと下流ホモロジーアームとは、少なくともそのいずれかが標的領域中の切断箇所により近いとアレルの改変効率をより高め得る。ここで、「近い」とは、2つの配列の距離が100bp以下、50bp以下、40bp以下、30bp以下、20bp以下、または10bp以下であることを意味し得る。
 選択マーカー用ドナーDNAにおいて、選択マーカー遺伝子は、上流ホモロジーアームと下流ホモロジーアームとの間に位置する。これにより、上記(i)のゲノム改変システムと共に選択マーカー用ドナーDNAを細胞に導入した場合に、HDRにより、選択マーカー遺伝子が標的領域に導入される(これにより遺伝子が破壊される場合、遺伝子ノックアウトといい、これにより所望の遺伝子が導入される場合、遺伝子ノックインという、遺伝子をノックアウトしつつ、別の遺伝子をノックインすることもできる)。
 選択マーカー遺伝子は、適切なプロモーターの制御下で発現されるように、プロモーターに機能的に連結されていることが好ましい。プロモーターは、ドナーDNAを導入する細胞の種類に応じて適宜選択することができる。プロモーターとしては、例えば、SRαプロモーター、SV40初期プロモーター、レトロウイルスのLTR、CMV(サイトメガロウイルス)プロモーター、RSV(ラウス肉腫ウイルス)プロモーター、HSV-TK(単純ヘルペスウイルスチミジンキナーゼ)プロモーター、EF1αプロモーター、メタロチオネインプロモーター、ヒートショックプロモーター等が挙げられる。選択マーカー用ドナーDNAは、エンハンサー、ポリA付加シグナル、ターミネーター等の任意の制御配列等を有していてもよい。
 選択マーカー用ドナーDNAは、インスレーター配列を有していてもよい。「インスレーター」とは、隣接する染色体環境の影響を遮断または緩和し、その領域に挟まれたDNAの転写調節の独立性を保証するまたは高める配列をいう。インスレーターは、エンハンサー遮断効果(エンハンサーとプロモーターの間に挿入することにより、エンハンサーによるプロモーター活性への影響を遮断する効果)、及び位置効果の抑制作用(導入遺伝子の両側をインスレーターで挟むことにより、導入遺伝子の発現を挿入されたゲノム上の位置に影響されないようにする作用)により定義される。選択マーカー用ドナーDNAは、上流アームと選択マーカー遺伝子との間(又は上流アームと選択マーカー遺伝子を制御するプロモーターとの間)に、インスレーター配列を有していてもよい。選択マーカー用ドナーDNAは、下流アームと選択マーカー遺伝子との間に、インスレーター配列を有していてもよい。
 選択マーカー用ドナーDNAは、直鎖状であってもよく、環状であってもよいが、環状であることが好ましい。好ましくは、選択マーカー用ドナーDNAは、プラスミドである。選択マーカー用ドナーDNAは、上記の配列に加えて、任意の配列を含み得る。例えば、上流ホモロジーアーム、インスレーター、選択マーカー遺伝子、及び下流ホモロジーアームの各配列間の全て又は一部に、スペーサー配列を含んでいてもよい。
 工程(a)では、ゲノム改変の対象とするアレルの数と同数以上の種類の選択マーカー用ドナーDNAを細胞に導入する。異なる種類の選択マーカー用ドナーDNAは、相互に異なる(区別可能な)種類の選択マーカー遺伝子を有する。ある態様では、異なる種類の選択マーカー用ドナーDNAは、完全に同一の選択マーカー遺伝子またはそのセットを有しない。つまり、第1の種類の選択マーカー用ドナーDNAは、第1の種類の選択マーカー遺伝子を有し、第2の種類の選択マーカー用ドナーDNAは、第2の種類の選択マーカー遺伝子を有する。第3の種類の選択マーカー用ドナーDNAは、第3の種類の選択マーカー遺伝子を有し、それ以降の種類の選択マーカー用ドナーDNAについても同様である。ゲノム改変の対象とするアレルが2個である場合、選択マーカー用ドナーDNAの種類は2種類以上である。ゲノム改変の対象とするアレルが3個である場合、選択マーカー用ドナーDNAの種類は3種類以上である。ある態様では、1つの選択マーカー用ドナーDNAが、2種類以上の相互に異なる(区別可能な)選択マーカーを有していてもよい(この場合であっても、異なる種類の選択マーカー用ドナーDNAは、相互に異なる(区別可能な)種類(例えば、固有)の選択マーカー遺伝子を有していなければならない)。ある態様では、選択マーカー用ドナーDNAは、部位特異的組換え酵素の組換え配列(例えば、Creリコンビナーゼにより組換えられるloxP配列およびその変種)を有しない。また、ある態様では、本発明の方法は、部位特異的組換え酵素及びその組換え配列(例えば、Creリコンビナーゼにより組換えられるloxP配列およびその変種)を用いない。部位特異的組換え酵素を用いると、通常は、編集後のゲノムに部位特異的組換え酵素の組換え配列が1つ残存する。これに対して、ある態様では、本発明の方法で得られる細胞の改変ゲノムは、部位特異的組換え酵素の組換え配列(外来である)を有しない。
 選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とするアレルの数と同数以上であればよく、上限は特に限定されない。ゲノム改変の対象とするアレルの数と同数以上の種類の選択マーカー用ドナーDNAを用いることで、2つ以上のアレルを安定的に改変することができる。選択マーカー用ドナーDNAの種類数は、後述の工程(b)での選択操作の観点から、ゲノム改変の対象とするアレルの数と同数又は1~2多い程度が好ましく、ゲノム改変の対象とするアレルの数と同数であることがより好ましい。
 上記(i)と(ii)を細胞に導入する方法は特に限定されず、公知の方法を特に制限なく用いることができる。(i)及び(ii)を細胞に導入する方法としては、例えば、ウイルス感染法、リポフェクション法、マイクロインジェクション法、カルシウムリン酸法、DEAE-デキストラン法、エレクトロポーレーション法、パーティクルガン法等が挙げられるが、これらに限定されない。上記(i)と(ii)とを細胞に導入することにより、上記(i)の配列特異的核酸切断分子により、標的領域のDNAが切断された後、HDRにより(ii)の選択マーカー用ドナーDNA中の選択マーカーが標的領域にノックインされる。この際、2種以上の選択マーカー用ドナーDNAは、それぞれの上流ホモロジーアームおよび下流ホモロジーアームが同一である場合には、ランダムに標的領域の2つ以上のアレルにノックインされ得る。但し、2種以上の選択マーカー用ドナーDNAは、2以上のアレルそれぞれの標的領域の上流配列および下流配列と相同組換え可能な塩基配列をホモロジーアームの塩基配列をそれぞれ有している限り2以上のアレルそれぞれを改変できるので、完全に同一のホモロジーアームの塩基配列を有する必要はない。ある態様では、2種以上の選択マーカー用ドナーDNAにおいては、その上流および下流ホモロジーアームの塩基配列が、それぞれのアレルの標的領域の上流配列および下流配列とより同一性の高い塩基配列を有していてもよい(例えば、そのように最適化されていてもよい)。
 選択マーカー用ドナーDNAは、ある態様では、上流ホモロジーアームおよび下流ホモロジーアームを有し、上流ホモロジーアームおよび下流ホモロジーアームの間に、選択マーカー遺伝子を有し、好ましくは、メガヌクレアーゼの切断部位などのエンドヌクレアーゼ(塩基配列特異的核酸切断分子)の標的配列をさらに有し得る。この態様において、ある好ましい態様では、選択マーカーは、ポジティブ選択用の選択マーカー遺伝子およびネガティブ選択用のマーカー遺伝子を含む。別の好ましい態様では、選択マーカーは、ポジティブ選択用の選択マーカーを含むが、これとは別にネガティブ選択マーカー遺伝子を含まなくてもよい。ある好ましい態様では、ポジティブ選択用の選択マーカー遺伝子は、ネガティブ選択用にも用いられ得、そのようなマーカー遺伝子としては、可視化マーカー遺伝子が挙げられる。
 2以上の選択マーカー用ドナーDNAのセットは、上記の選択マーカー用ドナーDNAの組合せであり、かつ、それぞれが互いに区別可能なポジティブ選択用の選択マーカー遺伝子を有している。上記セットにおいては、メガヌクレアーゼの切断部位などのエンドヌクレアーゼ(塩基配列特異的核酸切断分子)の標的配列をさらに有し得、当該標的配列は互いに異なっていてもよいが、同一である(または同一の塩基配列特異的核酸切断分子で切断できる)ことが好ましい。選択マーカー用ドナーDNAの長さは上記の通りであるが、例えば、5kbp以上、8kbp以上、または10kbp以上であり得る。
(工程(b))
 前記工程(a)の後、工程(b)を行う。工程(b)では、2以上のアレルにそれぞれ区別可能に異なる選択マーカー遺伝子またはその組合せが導入された細胞を、当該区別可能に異なる選択マーカー遺伝子の発現に基づいて、選択する。より具体的には、工程(b)では、前記2以上のアレルに対して異なる種類の選択マーカー用ドナーDNAがそれぞれ相同組み換えすることによって、当該2以上のアレルにそれぞれ区別可能に異なる固有の選択マーカー遺伝子が導入され、導入された当該区別可能に異なる選択マーカー遺伝子のすべてを発現する細胞を選択する。ある態様では、工程(b)では、前記2種以上の選択マーカー用ドナーDNAが有する選択マーカー遺伝子であって染色体ゲノムに組込まれたすべての選択マーカー遺伝子の発現に基づいて、異なる選択マーカー用ドナーDNAが導入されたことによりそれぞれのアレルが改変された細胞を選択する。ある態様では、工程(b)では、前記2種以上の選択マーカー用ドナーDNAが有する全ての選択マーカー遺伝子に基づいて、細胞を選択する。ある態様では、工程(b)では、前記2種以上の選択マーカー用ドナーDNAが有する選択マーカー遺伝子であって染色体ゲノムに組込まれたすべての選択マーカー遺伝子(ポジティブ選択用のマーカー遺伝子)の発現に基づいて、区別可能な選択マーカー用ドナーDNAが導入されたことによりそれぞれのアレルが改変された細胞を選択する。ある態様では、工程(b)で得られる細胞は、各アレルが異なるポジティブ選択用のマーカー遺伝子を有する。ある態様では、工程(b)で得られる細胞は、各アレルが、共通したポジティブ選択用のマーカー遺伝子をここで、ある態様では、工程(b)では、単一細胞クローニングを行わない{但し、工程(b)で2つ以上のアレルが改変された細胞を選択した後に単一細胞クローニングを行うことを含んでいても、含まなくてもよい}。ある態様では、工程(b)では、細胞の選択は、各アレルに導入された区別可能なポジティブ選択用のマーカー遺伝子の複数の発現に基づいて行われる。ある態様では、工程(b)は、単一の選択マーカー遺伝子の発現強度(例えば、蛍光タンパク質の発現強度または蛍光強度)に基づいて改変アレル数の多さを推定する方式では行われない。単一の選択マーカー遺伝子の発現強度の強弱に基づいて改変アレル数の多さを推定する方式で細胞を選択する場合、細胞毎の遺伝子発現量に変動が生じ、2以上のアレルが改変された細胞を1つのアレルが改変された細胞から完全に分離することが困難となり、したがって、工程(b)において単一細胞クローニングが必要となるためである。
 工程(b)は、工程(a)で用いた選択マーカー遺伝子の種類に応じて、適宜、細胞の選択を行えばよい。この際、工程(a)で用いた選択マーカー遺伝子の全ての発現に基づいて細胞を選択する。
 例えば、選択マーカー遺伝子がポジティブ選択マーカー遺伝子である場合、改変対象の染色体ゲノムに組込まれる(または組込まれた)すべての選択マーカー遺伝子を発現する細胞を選択することができ、例えば、改変対象のアレルの数と同数のポジティブ選択マーカーを発現する細胞を選択することができる。ポジティブ選択マーカー遺伝子が薬剤耐性遺伝子である場合、当該薬剤を含む培地で細胞を培養することにより、前記ポジティブ選択マーカーを発現する細胞を選択することができる。ポジティブ選択マーカー遺伝子が蛍光タンパク質遺伝子、発光酵素遺伝子、又は発色酵素遺伝子である場合、蛍光タンパク質、発光酵素、又は発色酵素による蛍光、発光、又は発色を呈する細胞を選択することにより、前記ポジティブ選択マーカーを発現する細胞を選択することができる。本工程では、改変されるべきアレルの数と同数の選択マーカー用ドナーDNAがゲノムに取り込まれた場合、当該数のアレルが改変されている。n倍体の細胞においては、改変されるべきアレルの数はnまたはそれ以下であり、当該数以上n以下の種類の選択マーカー用ドナーDNAがゲノムに取り込まれた場合には、少なくとも改変されるべきアレル(2以上のアレルである)が改変されている。ある態様では、改変されるべきアレルの数がnであり、当該数の種類の選択マーカー用ドナーDNAが染色体ゲノムに取り込まれ、すべてのアレルが改変されている。ある態様では、本工程では、改変対象とするアレルの数と同数以上の種類の選択マーカー用ドナーDNAを用いているため、細胞が発現するポジティブ選択マーカーの数は、当該数のアレルが確実に改変されていることを意味する。工程(b)における細胞の選択効率を高める観点では、改変対象とするアレルの数は、選択マーカー用ドナーDNAの種類数と同一であることが好ましい。
 上記の通り、本実施形態のゲノム改変方法では、n倍体の細胞においてn個のアレルを改変するためにn種類の選択マーカー用ドナーDNAを用いてHDRを誘発させることによって、細胞が有する全てのアレルが改変された細胞を効率よく取得することができる。また、全てのアレルが改変された細胞を確実に取得することができるため、標的領域が大きいサイズ(例えば、10kbp以上)であっても、標的領域が改変された細胞を効率よく取得することができる。そのため、大規模なゲノム改変も可能となる。
 ある態様では、工程(b)では、工程(a)によって得られた細胞を含むプールから、細胞をクローニングすることなく、改変された細胞を選択することができる。クローニングの工程を省くことによって工程に必要な時間が短縮され得る。上記プールはある態様では、10以上、10以上、10以上、または10以上の細胞を含んでいてもよい。
(任意工程)
 本実施形態のゲノム改変方法は、上記工程(a)及び工程(b)に加えて、任意の工程を有していてもよい。任意の工程としては、例えば、下記(c)及び(d)の工程が挙げられる:
 (c)前記工程(b)の後、前記標的領域の上流側に隣接する塩基配列と相同な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側に隣接する塩基配列と相同な塩基配列を有する下流ホモロジーアームとの間に、所望の塩基配列を含む組換え用ドナーDNAを、前記細胞に導入する工程;及び
 (d)前記工程(c)の後、前記ネガティブ選択マーカーを発現しない細胞を選択する工程。
 ある態様では、本実施形態のゲノム改変方法は、上記工程(a)及び工程(b)に加えて、任意の工程を有していてもよい。ある態様では、本実施形態のゲノム改変方法または、ゲノムが改変された細胞を得る方法では、2種以上の選択マーカー用ドナーDNAがそれぞれ、前記上流ホモロジーアームと前記下流ホモロジーアームの間に、ポジティブ選択用の選択マーカー遺伝子とそれとは別のネガティブ選択用のマーカー遺伝子と標的配列とを有し、ここで、当該選択マーカー遺伝子がポジティブ選択用にもネガティブ選択用にも用いられる場合には、当該別のネガティブ選択用の選択マーカー遺伝子を有していなくてよく、例えば、下記(c)及び(d)の工程を有し得る:
 (c)前記工程(b)の後、下記(iii)及び(iv)を選択された細胞に導入して前記2以上のアレルに組換え用ドナーDNAを導入する工程と、
(iii)前記さらなる標的配列を標的とし、当該さらなる標的配列を切断することができる配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、
(iv)所望の塩基配列を含む組換え用ドナーDNAであって、前記標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側の塩基配列と相同組換え可能な塩基配列を有する下流ホモロジーアームを有する組換え用ドナーDNA{当該組換え用ドナーDNAは、上流ホモロジーアームと下流ホモロジーアームの間に、所望の塩基配列を含んでいても、何らの塩基配列を含まなくてもよい}、
 (d)前記工程(c)の後、前記ネガティブ選択用のマーカー遺伝子を発現しない細胞を選択する工程(ネガティブ選択のための工程)。
<工程(c)>
 工程(b)の後、工程(c)を行ってもよい。ある態様において、工程(c)では、上流ホモロジーアームと下流ホモロジーアームの間に、所望の塩基配列を含む、または含まない組換え用ドナーDNAを、工程(b)で選択した細胞に導入する。ある態様において、工程(c)では、標的領域の上流側に隣接する塩基配列と相同な塩基配列を有する上流ホモロジーアームと、標的領域の下流側に隣接する塩基配列と相同な塩基配列を有する下流ホモロジーアームとの間に、所望の塩基配列を含む組換え用ドナーDNAを、工程(b)で選択した細胞に導入する。
≪組換え用ドナーDNA≫
 組換え用ドナーDNAは、ノックインする所望の塩基配列を含んでいてもよい。前記所望の塩基配列は、特に限定されない。例えば、ゲノム改変の目的が、標的領域に含まれる遺伝子の機能をノックアウトすることにある場合には、標的領域の一部または全部の塩基配列を欠失させた塩基配列を所望の塩基配列として用いることができる。また、標的領域に、外来遺伝子を組み込む場合には、当該遺伝子を含む塩基配列を所望の塩基配列として用いることができる。所望の塩基配列のサイズは、特に限定されず、任意のサイズとすることができる。所望の塩基配列は、例えば、10bp以上、20bp以上、40bp以上、80bp以上、200bp以上、400bp以上、800bp以上、1kbp以上、2kbp以上、3kbp以上、4kbp以上、5kbp以上、6kbp以上、7kbp以上、8kbp以上、9kbp以上、10kbp以上、15kbp以上、20kbp以上、40kbp以上、80kbp以上、100kbp以上、又は200kbp以上等とすることができる。本実施形態の方法では、所望の塩基配列が2以上のアレルにノックインされた細胞を効率よく選択することができる。そのため、例えば、5kbp以上、8kbp以上、又は10kbp以上の大きなサイズのDNAであってもノックインすることが可能である。組換え用ドナーDNAは、例えば、選択マーカー用ドナーDNAよりも長さにおいて短くてもよい。
 組換え用ドナーDNAが有する上流ホモロジーアーム及び下流ホモロジーアームは、前記選択マーカー用ドナーDNAが有するものと、同じであってもよく、異なっていてもよい。便宜上、選択マーカー用ドナーDNAが含む上流ホモロジーアーム及び下流ホモロジーアームを「第1の上流ホモロジーアーム」及び「第1の下流ホモロジーアーム」、組換え用ドナーDNAが含む上流ホモロジーアーム及び下流ホモロジーアームを「第2の上流ホモロジーアーム」及び「第2の下流ホモロジーアーム」という場合がある。第2の上流ホモロジーアーム及び第2の下流ホモロジーアームは、例えば、第1の上流ホモロジーアームまたはそれよりも上流の領域と相同組換え可能であり、かつ、第1の下流ホモロジーアームまたはそれよりも下流の領域と相同組換え可能であれば、その長さ及び配列は特に限定されない(ある態様では、標的領域の周辺領域と相同組換可能であれば、その長さ及び配列は特に限定されない)。組換え用ドナーDNAによる組換え後に、選択マーカー用ドナーDNAの塩基配列の一部がゲノム上に残存することは許容されるが、好ましくは、選択マーカー用ドナーDNAの塩基配列は、組換え用ドナーDNAとの組換えにより、ゲノム上から完全に除去される。選択マーカー用ドナーDNAに搭載されている様々な遺伝子は、組換え用ドナーDNAによる組換えにより除去される。これによって、ある態様では、細胞の2つ以上のアレルは、それぞれ組換え用ドナーDNAによって置き換わり得る。ある態様では、組換え用ドナーDNAは、所望の塩基配列を有していてよく、これにより、2つ以上のアレルが改変された細胞は、当該改変されたアレルに当該所望の塩基配列を有することとなる。
 組換え用ドナーDNAにおいて、所望の塩基配列は、第2の上流ホモロジーアームと第2の下流ホモロジーアームとの間に位置する。組換え用ドナーDNAが外来遺伝子を含む場合、当該外来遺伝子は、プロモーターに機能的に連結されていることが好ましい。組換え用ドナーDNAは、エンハンサー、ポリA付加シグナル、ターミネーター等の任意の制御配列等を有していてもよい。また、組換え用ドナーDNAが外来遺伝子を含む場合、組換え用ドナーDNAは当該外来遺伝子の上流及び下流にインスレーター配列を有していてもよい。ある態様では、組換え用ドナーDNAは、第2の上流ホモロジーアームと第2の下流ホモロジーアームとの間にスペーサー配列を含む。ある態様では、組換え用ドナーDNAは、選択マーカー用ドナーDNAが有するネガティブ選択マーカー遺伝子を有する細胞を除去するときに、当該当該遺伝子と同じ(または区別できない)遺伝子をその毒性が発揮される条件下で発現させると、組換え用ドナーDNAで相同組換えが生じた細胞を選択することができない。したがって、組換え用ドナーDNAは、選択マーカー用ドナーDNAが有するネガティブ選択マーカー遺伝子を有する細胞を除去するときに、当該当該遺伝子と同じ(または区別できない)遺伝子をその毒性が発揮される条件下で発現しないように構成されている。例えば、ある態様では、組換え用ドナーDNAは、第2の上流ホモロジーアームと第2の下流ホモロジーアームとの間にネガティブ選択マーカー遺伝子および第2の標的配列を有しない。
 組換え用ドナーDNAは、上記(i)と共に細胞に導入されることが好ましい。組換え用ドナーDNAを上記(i)と共に細胞に導入することにより、上記(i)の配列特異的核酸切断分子により、標的領域のDNAが切断された後、HDRにより組換え用ドナーDNA中の所望の塩基配列が標的領域にノックインされる。本工程で組換え用ドナーDNAを導入する細胞は、工程(b)で選択された細胞であるため、標的領域に選択マーカー用ドナーDNAの塩基配列がノックインされている。そのため、(i)のゲノム改変システムの標的配列は、選択マーカー用ドナーDNAノックイン後の標的領域に含まれる塩基配列である。便宜上、工程(a)におけるゲノム改変システムの標的配列を「第1の標的配列」、工程(c)におけるゲノム改変システムの標的配列を「第2の標的配列」という場合がある。第2の標的配列は、工程(b)後の細胞の標的領域に含まれる任意の配列を用いることができる。ある態様では、選択マーカー用ドナーDNA中の第2の標的配列は、当該細胞のゲノム上に存在しない配列であり得る。ある態様では、選択マーカー用ドナーDNA中の第2の標的配列は、当該細胞のゲノム上に存在しない配列であり、オフターゲットによるゲノム上の他の配列を切断しない程度に他の配列と異なる配列である。ある態様では、選択マーカー用ドナーDNA中の第2の標的配列は、ゲノム上に存在しないメガヌクレアーゼの切断部位であり得る。ある態様では、第2の標的配列は、工程(d)におけるネガティブ選択マーカー遺伝子以外の領域である。当然ながら、組換え用ドナーDNAは、組換え用ドナーDNAによる相同組換えが著しく阻害されないように構成されている。第1の標的配列が、工程(b)後の細胞の標的領域に残っている場合または第1の標的配列が選択マーカー用ドナーDNAにより再導入された場合、第2の標的配列は第1の標的配列と同じであってもよく、異なっていてもよい。
 組換え用ドナーDNAは、上流ホモロジーアームと下流ホモロジーアームとの間に塩基配列を含まなくてもよいが、上流ホモロジーアームと下流ホモロジーアームとの間に10bp以下、20bp以下、30bp以下、40bp以下、50bp以下、60bp以下、70bp以下、80bp以下、90bp以下、100bp以下、200bp以下、300bp以下、400bp以下、500bp以下、600bp以下、700bp以下、800bp以下、900bp以下、または1kbp以下の塩基配列を含んでいてもよい。組換え用ドナーDNAは、上流ホモロジーアームと下流ホモロジーアームとの間に、1kbp以上、2kbp以上、3kbp以上、4kbp以上、5kbp以上、6kbp以上、7kbp以上、8kbp以上、9kbp以上、または10kbp以上の塩基配列を含んでいてもよい。
 組換え用ドナーDNAは、上流ホモロジーアームと下流ホモロジーアームとの間に、選択マーカー遺伝子、部位特異的組換え酵素の標的配列、生理活性を有する因子をコードする遺伝子、細胞毒性を有する因子をコードする遺伝子、およびプロモーター配列からなる群から選択される1以上またはすべてを含む、もしくは前記群から選択される1以上またはすべてを含まない。
 工程(c)では、工程(b)で選択細胞に対して、組換え用ドナーDNAを導入する。工程(b)で選択した細胞は、標的領域に選択マーカー遺伝子がノックインされている。工程(c)は、前記標的領域にノックインされた選択マーカー遺伝子を、除去するまたは所望の塩基配列に置き換える工程であるともいえる。
(工程(d))
 工程(c)の後、工程(d)を行ってもよい。工程(d)では、ネガティブ選択マーカーを発現しない細胞を選択する。
 工程(d)を行う場合、工程(a)において、選択マーカー用ドナーDNAはそれぞれ、ポジティブ選択マーカー遺伝子とネガティブ選択マーカー遺伝子と、を含むものを用い得る。すなわち、工程(a)で用いる選択マーカー用ドナーDNAは、上流ホモロジーアームと、下流ホモロジーアームとの間に、ポジティブ選択マーカー遺伝子及びネガティブ選択マーカー遺伝子を含み得る。ポジティブ選択マーカー遺伝子とネガティブ選択マーカー遺伝子との位置関係は、特に限定されず、ポジティブ選択マーカー遺伝子がネガティブ選択マーカー遺伝子の上流にあってもよいし、その逆であってもよい。選択マーカー用ドナーDNAが、ポジティブ選択マーカー遺伝子とネガティブ選択マーカー遺伝子とを有する場合、ポジティブ選択マーカー遺伝子とネガティブ選択マーカー遺伝子との間には、自己切断型ペプチドをコードする塩基配列、又はIRES(internal ribozyme entry site)配列等が介在していてもよい。これらの配列を介在させることで、1つのプロモーターから、ポジティブ選択マーカー遺伝子とネガティブ選択マーカー遺伝子とを独立して発現させることができる。2Aペプチドとしては、例えば、口蹄疫ウイルス(FMDV)由来の2Aペプチド(F2A)、ウマ鼻炎Aウイルス(ERAV)由来の2Aペプチド(E2A)、Porcine teschovirus(PTV-1)由来の2Aペプチド(P2A)及びThosea asigna virus(TaV)由来の2Aペプチド(T2A)等が挙げられる。
 あるいは、同じ選択マーカー遺伝子を、工程(a)ではポジティブ選択マーカーとして用い、工程(d)ではネガティブ選択マーカーとして用いてもよい。例えば、選択マーカー遺伝子が蛍光タンパク質遺伝子、発光酵素遺伝子、もしくは発色酵素遺伝子などの蛍光又は色素等の発色に関わるマーカー遺伝子(可視化マーカー遺伝子)である場合、工程(a)では、蛍光タンパク質、発光酵素、又は発色酵素の発現による蛍光、発光又は発色を呈する細胞を選択し、工程(c)では、これらの蛍光、発光又は発色が消失した細胞を選択してもよい。同じ選択マーカー遺伝子がポジティブ選択マーカーとネガティブ選択マーカーを兼ねる場合も、選択マーカー用ドナーDNAが、ポジティブ選択マーカーに加えて、ネガティブ選択マーカーをさらに有する場合に包含される。
 ネガティブ選択マーカー遺伝子は、選択マーカー用ドナーDNAの種類毎に、異なっていてもよいし、同じであってもよい。ネガティブ選択マーカー遺伝子に共通のものを用いることにより、工程(d)における細胞の選択作業が簡易となる。
 工程(d)は、工程(a)で用いたネガティブ選択マーカー遺伝子の種類に応じて、適宜細胞の選択を行えばよい。この際、工程(a)で用いたネガティブ選択マーカー遺伝子を全ての発現しない細胞を選択する。
 例えば、ネガティブ選択マーカー遺伝子が蛍光タンパク質遺伝子、発光酵素遺伝子、又は発色酵素遺伝子などの可視化マーカー遺伝子である場合、蛍光、発光又は発色等の可視化マーカーが消失した細胞を選択すればよい。また、ネガティブ選択マーカー遺伝子が自殺遺伝子である場合、当該自殺遺伝子の発現により毒性を発現する薬剤を含む培地で細胞を培養することにより、前記ネガティブ選択マーカーを発現しない細胞を選択することができる。例えば、自殺遺伝子としてチミジンカイネース遺伝子を用いた場合、ガンシクロビルを含む培地で細胞を培養すればよい。ネガティブ選択マーカー遺伝子の発現の消失は、工程(a)で標的領域に組み込まれたネガティブ選択マーカー遺伝子が、組換え用ドナーDNAの所望の塩基配列を含むポリヌクレオチドに置き換えられたことを意味する。このとき、ポリヌクレオチドの置き換えは、工程(a)でノックインされた塩基配列全体で起きていると考えられる。そのため、ネガティブ選択マーカー遺伝子の発現が消失した細胞を選択することにより、工程(a)でノックインされた塩基配列が、組換え用ドナーDNAの所望の塩基配列で置き換えられた細胞を、効率よく選択することができる。自殺遺伝子等のネガティブ選択マーカー遺伝子は、誘導性プロモーターに機能的に連結されていてもよく、その毒性が発揮される条件下で当該ネガティブ選択マーカー遺伝子が発現されるように誘導性プロモーターを駆動させる薬剤の存在下で、細胞を培養することによって前記ネガティブ選択マーカーを発現しない細胞を選択することができる。この場合、ネガティブ選択マーカー遺伝子は、発現するだけで細胞に毒性を生じる細胞毒素(例えば、リシンおよびジフテリアトキシン)をコードする遺伝子であってもよい。
 ある態様では、工程(d)では、工程(c)によって得られた細胞を含むプールから、細胞をクローニングすることなく、2以上のアレルが改変された細胞(ネガティブ選択マーカー遺伝子が非存在の細胞)を選択することができる。上記プールはある態様では、10以上、10以上、10以上、または10以上の細胞を含んでいてもよい。
 上記の通り、工程(c)及び工程(d)を行うことにより、細胞が有する全てのアレルが所望の配列に改変された細胞を効率よく取得することができる。また、全てのアレルが改変された細胞を確実に取得することができるため、所望の塩基配列が大きいサイズ(例えば、10kbp以上)であっても、当該塩基配列が標的領域にノックインされた細胞を効率よく取得することができる。ある態様では、工程(c)及び工程(d)を行うことにより、細胞が有する全てのアレルにおいて標的領域が欠失し、その前後(すなわち、上流ホモロジーアームおよび下流ホモロジーアームがそれぞれ相同組換えを起こす配列)が、塩基の挿入、置換、および欠失からなる群から選択される1以上なしに(例えば、塩基の挿入、置換および欠失なく)、シームレスに連結している。ある態様では、得られる細胞では、欠損させた領域を挟む上流側と下流側の塩基配列がシームレスに連結している。
 なお、工程(b)によって、生存する細胞の数が少ない場合、または生存する細胞が得られない場合には、上流ホモロジーアームおよび下流ホモロジーアームと相同組換えによりゲノムから除去された標的領域中に、細胞の増殖または生存に影響する遺伝子が含まれていることが示される。したがって、標的領域に細胞の増殖または生存に影響する遺伝子が含まれているか否かを調べることができる。また、この場合には、上流ホモロジーアームおよび下流ホモロジーアームの設計位置を変化させて、ゲノム上から相同組換えにより消失させる遺伝子を変化させて、細胞の増殖または生存に影響する遺伝子を特定することができる。したがって、本発明は、工程(b)の後に、工程(e)を行うことができる。すなわち、工程(e)は、工程(b)において、生存する細胞の数が少ない場合、または生存する細胞が得られない場合には、標的領域を狭め、ゲノム上から消失させる遺伝子を減らすことによって、細胞の増殖または生存に影響する遺伝子を特定することを含む。標的領域には、1つの遺伝子しか含まれていない場合には、当該遺伝子が、細胞の増殖または生存に影響する遺伝子であることが示される。そして、細胞の増殖または生存に影響する遺伝子が特定された場合、工程(f)を行うことができる。工程(f)は、特定された細胞の増殖または生存に影響する遺伝子を改変するゲノムの他の領域(例えば、セーフハーバー領域等)にノックインすることを含む{ノックインには組換え用ドナーDNAを用いてもよい}。これによって、本発明の方法によって削る領域を拡大する(標的領域を上流および/または下流に広げる)ことができる。生存する細胞の数が少ないことは、細胞の生存や増殖に影響しない領域に対して工程(a)および(b)を実施したときに得られる細胞の数との比較によって確認することができる。ある態様では、工程(a)は、細胞の増殖や生存を消失させる領域を標的領域としないことができる。本発明は、例えば、(i)の染色体領域において欠失を有する細胞のゲノムDNAに対して、所望の遺伝子を(i)の染色体領域または(i)以外の領域(例えば、セーフハーバー領域等)にノックインすることを含む。そのような細胞は、(i)の染色体領域において欠失を有し、(i)の染色体領域または(i)以外の領域(例えば、欠失を有する上記(ii)の領域およびセーフハーバー領域等)所望の遺伝子をコードする遺伝子を有するゲノムを有する。
[ゲノム改変キット]
 1実施形態において、本発明は、染色体ゲノムの2つ以上のアレルを改変するゲノム改変キットを提供する。前記ゲノム改変キットは、下記(i)及び(ii)を含む:
 (i)前記染色体ゲノムの標的領域を標的とする配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム;及び
 (ii)前記標的領域の上流側に隣接する塩基配列と相同な塩基配列を有する下流ホモロジーアームと、前記標的領域の下流側に隣接する塩基配列と相同な塩基配列を有する下流ホモロジーアームとの間に、選択マーカー遺伝子の塩基配列を含む、2種以上の選択マーカー用ドナーDNAであって、前記2種以上の選択マーカー用ドナーDNAは、相互に異なる選択マーカー遺伝子を有し、前記選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とする前記アレルの数と同数以上である、2種以上の選択マーカー用ドナーDNA。
 1実施形態において、本発明は、下記(i)及び(ii)を含む、染色体ゲノムの2つ以上のアレルを改変するゲノム改変キット。
(i)前記染色体ゲノムの標的領域を標的とし、標的領域を切断することができる配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、
(ii)2種以上の選択マーカー用ドナーDNAであって、前記標的領域の上流側の塩基配列と相同組換え可能な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側の塩基配列と相同組換え可能な塩基配列を有する下流ホモロジーアームを有し、上流ホモロジーアームと下流ホモロジーアームの間に、選択マーカー遺伝子の塩基配列を含み、前記2種以上の選択マーカー用ドナーDNAは、相互に区別可能な選択マーカー遺伝子を有し、前記選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とする前記アレルの数と同数以上である、2種以上の選択マーカー用ドナーDNA。この態様において、前記選択マーカー遺伝子は、選択マーカー用ドナーDNAの種類毎に固有であり得る。上記キットは、上記キットは本発明の方法に用いられるものであり得る。上記キットは、染色体ゲノムの2つ以上のアレルが改変された細胞を作製する方法に用いられてもよい。
 本実施形態のキットが含む(i)及び(ii)は、上記[ゲノム改変方法]の項で説明した(i)及び(ii)と同様である。本実施形態のキットを用いることにより、上記のゲノム改変方法を容易に行うことができる。
 1実施形態において、本発明は、染色体ゲノムの2つ以上のアレルが改変された細胞であって、当該2つ以上のアレルそれぞれにおいて相互に異なる(区別可能な)選択マーカー遺伝子を有する、細胞を提供する。ある態様では、細胞は、単細胞生物の細胞であり得る。ある態様では、細胞は、単離された細胞であり得る。ある態様では、細胞は、多能性細胞、および多能性幹細胞(胚性幹細胞および誘導多能性幹細胞など)からなる群から選択される細胞であり得る。ある態様では、細胞は、組織幹細胞であり得る。ある態様では、細胞は、体細胞であり得る。ある態様では、細胞は、生殖系列細胞(例えば、生殖細胞)であり得る。ある態様では、細胞は、細胞株であり得る。ある態様では、細胞は不死化細胞であり得る。ある態様では、細胞はがん細胞であり得る。ある態様では、細胞は、非がん細胞であり得る。ある態様では、細胞は、疾患患者の細胞であり得る。ある態様では、細胞は健常者の細胞であり得る。ある態様では、細胞は、動物細胞(例えば、ヒト細胞)、例えば、昆虫細胞(例えば、カイコ細胞)、HEK293細胞、HEK293T細胞、Expi293F(商標)細胞、FreeStyle(商標)293F細胞、チャイニーズハムスター卵巣細胞(CHO細胞)、CHO-S細胞、CHO-K1細胞、およびExpiCHO細胞、ならびにこれらの細胞からの派生細胞からなる群から選択される細胞であり得る。ある好ましい態様では、上記細胞においては、染色体ゲノムの標的領域のすべてのアレルが改変され、改変後の領域は、それぞれ相互に異なる(区別可能な)選択マーカー遺伝子を有する。
 1実施形態において、染色体ゲノムの2つ以上のアレルが改変された細胞であって、当該2つ以上のアレルそれぞれにおいて相互に異なる(区別可能な)選択マーカー遺伝子を有する、細胞の培養方法が提供される。選択マーカー遺伝子が、薬剤耐性マーカー遺伝子である場合には、培養はそれぞれの薬剤耐性マーカー遺伝子に対する薬剤の存在下で培養され得る。培養は、細胞の維持または増殖に適した条件下で行われ得る。
 1実施形態において、本発明は、2つ以上のアレルが改変された染色体ゲノムを有する非ヒト生物であって、当該2つ以上のアレルそれぞれにおいて相互に異なる(区別可能な)選択マーカー遺伝子を有する、非ヒト生物が提供される。ある態様では、細胞は、単細胞生物の細胞であり得る。ある態様では、非ヒト生物は、酵母(例えば、分裂酵母または出芽酵母、例えば、サッカロミセス・セレビシエ(Saccharomyces cerevisiae)、サッカロミセス・カールスベルゲンシス(Saccharomyces carlsbergensis)、サッカロミセス・フラギリス(Saccharomyces fragilis)、サッカロミセス・ルーキシー(Saccharomyces rouxii)などのサッカロミセス属、キャンディダ・ユーティリス(Candida utilis)、キャンディダ・トロピカリス(Candida tropicalis)などのキャンディダ属、ピキア(Pichia)属、クリベロマイセス(Kluyveromyces)属、ヤロイワ(Yarrowia)属、ハンゼニュラ(Hansenula)属、エンドマイセス(Endomyces)属などの酵母からなる群から選択される生物であり得る。ある態様では、非ヒト生物は、糸状菌(例えば、Aspergillus,Trichoderma,Humicola,Acremonium,Fusarium,及びPenicillium種)であり得る。ある態様では、非ヒト生物は、は、多細胞生物であり得る。ある態様では、非ヒト生物は、非ヒト動物であり得る。ある態様では、非ヒト生物は、植物であり得る。ある好ましい態様では、上記非ヒト生物では、染色体ゲノムの標的領域のすべてのアレルが改変され、改変後の領域は、それぞれ相互に異なる(区別可能な)選択マーカー遺伝子を有する。
 上記細胞では、細胞の生存や増殖に必要な遺伝子などの所望の遺伝子の1以上が、染色体ゲノムの他の領域に含まれ、または集められていてもよい。他の領域は、例えば、セーフハーバー領域(例えば、AAVS1領域など)であり得る。他の領域は、例えば、欠失を有する上記(ii)の領域であり得る。
実施例1:相同配列の検索結果
 各HLAをクエリーとしてヒトゲノム配列(hg38ゲノム配列)をBlat検索した。HLAとしては、HLA-A、B、C、E、F、G、H、J、およびW;MICAおよびMICB;並びにHLA-DRA、DRB1、DRB5、DRB6、DRB9、DQA1、DQA2、DQB1、DPA1、DPB1、DMB、DOA、およびDOBをクエリーとして検索した。結果は、それぞれ図1~25に示される通りであった。
 図1~25に示されるように、複数の類似配列が、(i)chr6:29,711,000~30,020,000の領域、(ii)chr6:31,176,000~31,534,000bの領域、(iii)chr6:32,445,000~32,821,000の領域、および(iv)chr6:33,020,000~33,147,000の領域に集積していた。図26に結果の概要をまとめた。図26中の (i)~(iv)は、上記領域にそれぞれ対応する。より具体的には、複数の類似配列は、(i)hg38ゲノム配列のchr6:29,723,464-29,945,455の染色体領域に対応する染色体領域、(ii)hg38ゲノム配列のchr6:31,269,169-31,357,158の染色体領域に対応する染色体領域、(iii)hg38ゲノム配列のchr6:32,439,951-32,816,951の染色体領域に対応する染色体領域、および(iv)hg38ゲノム配列のchr6:33,006,838-33,086,238の染色体領域に対応する染色体領域に存在していた。
 HLA遺伝子座の配列解読が難しい理由の一つは、複数の類似配列が集積しているためである。このため、(i)~(iv)のいずれかの領域で1つの遺伝子を選択的に破壊しようとしても、CRISPR/Cas9を含むゲノム編集方法では、標的化した遺伝子に加えて、その他の類似配列に対しても改変が加わるおそれがある。また、重複する類似配列の存在によって破壊した領域の配列解読が困難であるために、周辺の類似配列への影響を調べることもまた困難である。したがって、本発明では、(i)~(iv)の少なくとも1つ、好ましくは2つ、より好ましくは3つ、さらに好ましくは4つを欠損した細胞を提供する。このような細胞はHLAの少なくとも1つを欠失していると共に、欠失した領域の周辺に関して配列解読が容易である。したがって、さらなる編集の成否を配列解読により明らかにすることに適している。
 国際公開第2021/206054号によれば、2倍体細胞において2つのアレル上で効率よく同時に特定の数百kbの領域を欠失させる技術(UKiS)が開示されている。通常のゲノム編集では、2倍体細胞において片側アレルを効率よく編集することができるが、両アレルを同時に編集する効率は極めて低い。両アレルを同時に編集する効率を劇的に改善したのがUKiS技術であり、今回のようなノックアウト用途に適する。国際公開第2021/206054号では、欠失させる領域に隣接する上流ホモロジーアームと下流ホモロジーアームを有し、上流ホモロジーアームと下流ホモロジーアームの間に相互に区別可能な選択マーカーを有するドナーDNAを、上流ホモロジーアームがハイブリダイスする第1のゲノムDNA部分と下流ホモロジーアームがハイブリダイスする第2のゲノムDNA部分のいずれか、または好ましくは両方に切断を有するゲノムDNAと接触させることによって、第1のゲノムDNA部分と第2のゲノムDNA部分の間に存在していたゲノムDNA領域が欠失し、上流ホモロジーアームと下流ホモロジーアームの間の配列(第3の配列)に置き換わる。国際公開第2021/206054号では、第3の配列も、ゲノムDNAから除去することができ、第1のゲノムDNA部分と第2のゲノムDNA部分とがシームレスに連結したゲノムDNAが得られる。しかも、国際公開第2021/206054号では、両アレル上で同様の改変を同時に達成できる。このようにして、国際公開第2021/206054号に開示された技術などのゲノム改変技術を用いることによって、反復配列の多いHLA領域をまるごとゲノムDNAから欠失させることは可能である。
 本実施例によれば、(i)~(iv)の領域は、配列解読が困難な領域であると考えられた。したがって、この配列解読が困難と考えられる領域を少なくとも1つ欠失させることによって、欠失を有する領域に関しては、配列解読が容易となる。また、反復配列を欠失させることによって、ゲノム編集の標的が予期せぬ他の繰り返し配列中に現れてオフターゲットの改変を生じさせるリスクも低減できる。その上で、改変後のゲノムDNAは配列解読が容易であるために、狙った通りに改変されているかを確認することができる。
 したがって、本発明によれば、UKiSを用いて、(i)~(iv)の少なくとも1つ、好ましくは2つ、より好ましくは3つ、さらに好ましくは4つを欠損した細胞を作成することが原理的に可能であることが理解できる。UKiS技術を適用するためには、ゲノム上のユニークな配列が必要である。当該ユニークな配列を標的化することによって、配列特異的に欠失を導入することができる。小さな領域の欠失の場合は、繰り返し配列のために相同組換えの標的となる配列が繰り返し配列を構成していることにより、正確な相同組換えは困難である。上記大きな領域の欠失の際には、ゲノム上のユニークな配列を相同組換えの標的配列として選択して適宜行うことができる。
 図27~34には、上記(i)~(iv)についてテロメア側の境界およびセントロメア側の境界を特定するために行われた検索の結果を示す。図27によれば、領域1および領域2は、類似配列を有するために、ここを標的化することができないが、これに対して領域3は類似配列を有しないユニーク配列であるために、標的化できる配列の候補となり得る。
実施例2:HLA欠損を有する細胞の作製
 本実施例では、細胞に対して本開示の技術を適用して、HLAの欠損を誘発させた。細胞としては、様々な細胞への分化能を有するiPS細胞を用いた。
(1)UKiSマーカーの導入
 細胞の調製:DPBSで150倍希釈したiMatrix-511で事前にコーティングした24ウェルプレートに、iPS細胞を1.25×10細胞ずつ播種した。培地はStemFit AK02N(10μM Y-27632)を用いた。
 マーカーの挿入:OptiMEM 50μL、マーカー挿入配列切断用gRNA/Cas9発現プラスミド 300 ng、ドナープラスミド(GFP-Puro) 100 ng、ドナープラスミド(RFP-Blst) 100 ng, Lipofectamine Stem transfection reagent 2μLを混合し、室温で5分間インキュベートしたトランスフェクション溶液を、細胞をまいた24ウェルプレートに加えた。ドナープラスミド(GFP-Puro)は、EF1プロモーターに作動可能に連結した緑色蛍光タンパク質(GFP)と薬剤耐性遺伝子であるピューロマイシン耐性遺伝子(Puro)をコードする遺伝子を有した。GFPとPuroは、T2A配列を介して連結させた。ドナープラスミド(RFP-Blst)は、EF1プロモーターに作動可能に連結した赤色蛍光タンパク質(RFP)と薬剤耐性遺伝子であるブラスチサイジン耐性遺伝子(Blst)をコードする遺伝子を有した。RFPとBlstは、T2A配列を介して連結させた。詳細は、WO2021/206054の実施例1および図1に示される通りであった。本明細書では、上記ドナープラスミドに搭載されたマーカーをUKiSマーカーといい、UKiSマーカーが導入された細胞をUKiSマーカー導入細胞という。また、UKiSマーカー導入細胞をUKiS第1段階の細胞ともいう。
 薬剤選択と拡大培養:得られた細胞を6ウェルプレートに播種し、ピューロマイシンとブラスチサイジンの存在下で細胞の薬剤選択を行った。薬剤選択用培地としては、StemFitR AK02N(1μM ピューロマイシン、10μM ブラスチサイジンを含む)を用いた。これにより薬剤選択後の生存細胞は、2つの薬剤に耐性であり、すなわち、ピューロマイシン耐性遺伝子とブラスチサイジン耐性遺伝子の両方を有する細胞である。このような細胞は、理論的には、gRNAで標的化した領域の片アレルにピューロマイシン耐性遺伝子が導入され、他方のアレルにブラスチサイジン耐性遺伝子が導入された場合に生じる。生き残ってきた細胞の拡大培養を行い、UKiSマーカーを有する細胞を得た。UKiSマーカーを有する細胞は、必要に応じてクローニングされた。細胞は、薬剤選択後の生存細胞を1コロニーずつ回収し、細胞を増殖させることによりクローニングした。
(2)ゲノム上の2箇所の切断とフローサイトメトリ
 細胞の調製:DPBSで150倍希釈したiMatrix-511で事前にコーティングした24ウェルプレートに、iPS細胞を1.25×10細胞ずつ播種した。培地はStemFit AK02N(10μM Y-27632)を用いた。
 gRNA/Cas9の導入:gRNAは、欠失させる領域の両端をそれぞれ標的化するように2つ作製した。溶液1(OptiMEM 25μL、CRISPRMAX 1.5μL)と溶液2(OptiMEM 25μL、gRNA(左側) 62.5 ng、gRNA(右側) 62.5 ng、Cas9タンパク質 750μg、Cas9 plus 1.2μL)を混合し、室温で5分間インキュベートしたトランスフェクション溶液を、細胞をまいた24ウェルプレートに加えた。24時間後、培地を交換した。
 フローサイトメトリ:培養の後に、フローサイトメーターを用いてGFPネガティブかつRFPネガティブの細胞を選択し、1細胞ずつ、96ウェルプレートに播種し、細胞を増殖させた。このようにすると、UKiSマーカー導入領域を含む領域を両アレルにおいて欠失した細胞を得ることができる。
(3)ジェノタイピングPCR
 ゲノム精製:2×10程度の変異導入細胞を回収し、ゲノムを精製した。
 ジェノタイピング用のプライマーとしては以下表1に示されるものを用いた。PCRは常法により実施した。
Figure JPOXMLDOC01-appb-T000001
Figure JPOXMLDOC01-appb-T000002
(4)クローニングされたUKiSマーカー導入細胞の更なる改変
 UKiSマーカー導入細胞は、様々な更なる改変のプラットフォームとなる。UKiSマーカー導入細胞は、更なる改変に供され、UKiSマーカーが挿入された領域(UKiSマーカー挿入領域)を切断し、更なるドナーDNAを接触させることにより、UKiSマーカー導入領域を当該更なるドナーDNAの配列に置き換えることができる。例えば、2つのアレルそれぞれに区別可能に異なるUKiSマーカーが導入されている細胞(すなわち、UKiSマーカー導入細胞)を用意する。UKiSマーカー挿入領域中の一方のアレルを選択的に切断することで、当該一方のアレルを改変することができる。他方のアレルも同様に改変することができる。
 具体的には、OptiMEM 50μL、UKiSマーカー挿入領域切断用gRNA/Cas9発現プラスミド(GFPアレル用またはRFPアレル用) 400 ng、変異導入用ドナープラスミド100 ng、 Lipofectamine Stem transfection reagent 2μLを混合し、室温で5分間インキュベートしたトランスフェクション溶液を、細胞をまいた24ウェルプレートに加えた。フローサイトメトリにより、GFP陰性細胞またはRFP陰性細胞を回収し、細胞を増殖させた。
 このようにして得られた細胞は、確かに、chr6:29,706,837-29,956,199、chr6:31,225,738-31,376,781、chr6:32,421,257-32,820,167、およびchr6:32,934,298-33,161,621の4つの領域を欠失していた。
(5)HLAの発現の評価
 細胞をTrypLEで1細胞に解離させた。0.5%BSAを含むPBSで細胞を洗浄し、抗HLA-A抗体、抗HLA-B抗体、抗HLA-C抗体(BioLegend 311413;200倍希釈)を細胞に接触させた。洗浄後、フローサイトメーターにより細胞を解析した。
(6)多能性幹細胞マーカーの発現の評価
 細胞を4%パラホルムアルデヒドを含むPBSで固定した。細胞をPBSで洗浄した後、PBSTを加え、室温で30分間静置した。1%ウシ血清アルブミン(BSA)を含むPBST中で室温で1時間静置した。一次抗体(抗OCT4抗体、抗NANOG抗体、抗SSEA4抗体)を細胞に反応させた。洗浄し、二次抗体と細胞を反応させた。その後、DAPIにより核を染色した。染色された細胞を共焦点顕微鏡下で観察した。
結果
 細胞のHLA-GとHLA-Aの間の領域をgRNAにより標的化してCas9により切断し、UKiSマーカーを当該領域に組込んだ(図36参照)。PuroおよびBlst存在下で薬剤選択を行って得られた細胞の、HLA-FからHLA-Aまでの一連の領域の外側をgRNAにより標的化してCas9により切断し、HLA-FからHLA-Aまでの一連の領域の全体を欠失させた細胞(クローン27および29)を得た(図36参照)。
 次に、上記クローン27のHLA-CからHLA-Bの間の領域をgRNAにより標的化してCas9により切断し、UKiSマーカーを当該領域に組込んだ(図37参照)。PuroおよびBlst存在下で薬剤選択を行って得られたクローンの、HLA-FからHLA-Aまでの一連の領域の外側をgRNAにより標的化してCas9により切断し、HLA-FからHLA-Aまでの一連の領域の全体を欠失させた細胞(クローン6)を得た(図37参照)。
 クローン6について、HLA-A、HLA-B、およびHLA-Cの発現をフローサイトメトリにより確認した。結果は、図28に示されるように、改変前の細胞(iPS 771-3G WT)では、ほぼ全ての細胞がHLA-A、HLA-B、およびHLA-Cの少なくとも1以上が陽性であったのに対して、改変により得られたクローン6では、その発現は完全に消失した。
 次に、改変後の細胞(クローン6)における多能性幹細胞マーカーの発現を確認した。図39に示されるように、改変後の細胞(クローン6)は改変前のiPS細胞と同等の多能性幹細胞マーカーの発現を示した。したがって、上記HLA領域の大型欠損は、細胞の増殖や多能性に対して有意な影響を示さないことが明らかになった。
 さらに、クローン6からHLA-Eを含む領域をgRNAにより標的化してCas9により切断し、UKiSマーカーを当該領域に組込んだ(図40参照)。その結果、HLA-Eを含む領域の代わりにUKiSマーカーを有する8つのクローンが得られた(図40参照)。
 得られた8つのクローンのうちの1つからUKiSマーカーを1つずつ除去した(図41参照)。その結果、HLA-Eを含む領域が完全に欠失した13クローンが得られた(図41参照)。
 クローン6からさらにHLAクラスII領域を欠失させた。具体的には、クローン6のHLA-DQB1をgRNAにより標的化してCas9により切断し、UKiSマーカーを当該領域に組込んだ(図42参照)。その後、HLA-DRAからHLA-DOBまでの一連の領域の外側をgRNAにより標的化してCas9により切断し、上記一連の領域を欠失した細胞(クローン2)を得た(図42参照)。
 クローン6からさらにHLAクラスIIの別の領域を欠失させた。具体的には、クローン6のHLA-DOAをgRNAにより標的化してCas9により切断し、UKiSマーカーを当該領域に組込んだ(図43参照)。その後、HLA-DMBからHLA-DPB2までを含む一連の領域の外側をgRNAにより標的化してCas9により切断し、上記一連の領域を欠失した細胞(クローン9および13)を得た(図43)。さらに図42で得られたクローンにおいて、図44のスキームにしたがってHLA領域を欠失させた。結果、さらなるHLA領域を欠失するクローン6~9が得られた(図44)。
 このように、本開示の発明によれば、HLA集積領域を編集し、または欠失させることができ、複数のHLA集積領域を欠失させることもできることが明らかであった。
 さらに任意の領域(例えば、HLA-Eの遺伝子座)に様々な外来遺伝子を導入することができる。例えば、図45では、細胞(HLA-A~C、F、およびGを欠失している)からHLA-Eを欠失させ、代わりにその領域にUKiSマーカーが導入された細胞に対して、外来遺伝子を導入するスキームが示されている。図45では、外来遺伝子として、上記遺伝子座に、シグナル配列を人工的に連結したHLA-E(MAVMAPRTLLLLLSGALALTQTWAGSHSLKYFHTSVSRPGRGEPRFISVGYVDDTQFVRFDNDAASPRMVPRAPWMEQEGSEYWDRETRSARDTAQIFRVNLRTLRGYYNQSEAGSHTLQWMHGCELGPDRRFLRGYEQFAYDGKDYLTLNEDLRSWTAVDTAAQISEQKSNDASEAEHQRAYLEDTCVEWLHKYLEKGKETLLHLEPPKTHVTHHPISDHEATLRCWALGFYPAEITLTWQQDGEGHTQDTELVETRPAGDGTFQKWAAVVVPSGEEQRYTCHVQHEGLPEPVTLRWKPASQPTIPIVGIIAGLVLLGSVVSGAVVAAVIWRKKSSGGKGGSYSKAEWSDSAQGSESHSL)を組込んだ。シグナル配列は、HLA-Aの2番目から15番目のアミノ酸に相当する配列(AVMAPRTLLLLLSG)を用いた。結果は、図45に示される通りであり、6/7クローンで外来遺伝子の導入に成功した。
 さらに外来遺伝子として、HLA-A~CおよびEを任意の領域(例えば、HLA-Eの遺伝子座)に導入した。例えば、図46では、細胞(HLA-A~C、F、およびGを欠失している)からHLA-Eを欠失させ、代わりにその領域にUKiSマーカーが導入された細胞に対して、外来遺伝子を導入するスキームが示されている。図46では、外来電子として、上記遺伝子座に、HLA-A、HLA-B、HLA-C、およびHLA-Eを組込んだ。これらの遺伝子はそれぞれ、タンパク質のコード領域の上流から終止コドンの下流までを含むものであり、各遺伝子に天然に含まれる全イントロンも含んだ。具体的には以下の通りであった。HLA-Aはコード領域の上流2.3kbpから下流1.1kbpを含み、HLA-Bはコード領域の上流2.1kbpから下流1.1kbpを含み、HLA-Cはコード領域の上流2.2kbpから下流1.1kbpを含み、HLA-Eはコード領域の上流2.6kbpから下流2.2kbpを含んだ。結果は、図47および48にそれぞれ示される通りであり、所望のアレルに対して所望の外来遺伝子を組込むことに成功した。得られた細胞における導入外来遺伝子の発現をフローサイトメトリにより確認した。細胞検出用の抗体としてHLA-A、BおよびCに結合する抗体(Biolegend社、製造番号:311413)を用いた。元のiPS細胞では、HLAの発現が認められたが、改変細胞(LxUDC(1.0))では、これらのHLAをコードする遺伝子が欠損しており、実際にHLAの細胞表面発現が消失した(図49参照)。これに対して、HLA-AおよびBを組込んだ細胞では、HLAの細胞表面発現が確認された(図49参照)。HLA-CおよびEを組込んだ細胞でも、HLAの細胞表面発現が確認された(図49参照)。このように、本開示の方法によれば、片アレル毎に所望の遺伝子を組込むことができる。例えば、本実施例のように、HLAを欠失した細胞に対して、天然のHLAを制御配列およびイントロン含め導入することで、導入したHLAの発現量の評価および機能性評価が可能となる。したがって、HLA類似配列、および多型のそれぞれの発現解析や機能性評価に有用であると考えられる。
 T細胞による細胞傷害を上記UDCが回避することを確認した。iPS細胞(野生型)、LxUDC(1.0)_E-Del、またはβ2-ミクログロブリン(B2M)ノックアウト細胞とT細胞とを1:1、1:3、1:5、または1:10の比率で混合し、T細胞による細胞傷害性を確認した。その結果、図50に示されるように、LxUDC(1.0)_E-Delは、B2Mノックアウトよりも強く細胞傷害を回避した。
配列表の内容
Sequence Number (ID): 1   cttcatctcc  gtcggctacg     20
Sequence Number (ID): 2   atgatggaaa  actcgatggg     20
Sequence Number (ID): 3   tggaatccgg  tataggcgcc     20
Sequence Number (ID): 4   tgagtgaccc  gataaaactc     20
Sequence Number (ID): 5   tcttaaaaac  ttctatatcg     20
Sequence Number (ID): 6   gtgcaactcc  cgaataggct     20
Sequence Number (ID): 7   tgggccttat  catccgtcaa     20
Sequence Number (ID): 8   tgggtctgtc  gagcacaagg     20
Sequence Number (ID): 9   ggtcaaatgc  cttgtactcg     20
Sequence Number (ID): 10   gggagggccg  gtaccgttga     20
Sequence Number (ID): 11   atagctaacg  tcactattgc     20
Sequence Number (ID): 12   cgttctcagc  gcgggcacta     20
Sequence Number (ID): 13   gccgctgccg  ctctacgctt     20
Sequence Number (ID): 14   cagaaagggt  aagcgcacag     20
Sequence Number (ID): 15   ggcgcaacgc  gatcgcgtaa     20
Sequence Number (ID): 16   gacgccagtg  cattcgacga     20
Sequence Number (ID): 17   ggcgcaacgc  gatcgcgtaa     20
Sequence Number (ID): 18   cctcaccttc  ccctcttttc     20
Sequence Number (ID): 19   accttcccct  gtgacttgtg     20
Sequence Number (ID): 20   ctcaccttcc  cttcctttcc     20
Sequence Number (ID): 21   accttcccct  gtgatttgtg     20
Sequence Number (ID): 22   ccaccaccct  gtctttgact     20
Sequence Number (ID): 23   tgtcacccct  tccttacctg     20
Sequence Number (ID): 24   gaggcagaaa  ggcacacata     20
Sequence Number (ID): 25   agcctctcct  tcccattctt     20
Sequence Number (ID): 26   tccatcaacc  tctcatagca  aa 22
Sequence Number (ID): 27   acttctggaa  attccttttg  g  21
Sequence Number (ID): 28   gatggcccat  gtgtggat       18
Sequence Number (ID): 29   ttatcccagg  tgcctgtgtc     20
Sequence Number (ID): 30   ttcccactta  cagccagacc     20
Sequence Number (ID): 31   tacgggaggt  agccagtgtt     20
Sequence Number (ID): 32   tgggaagtgg  tcaggagata  a  21
Sequence Number (ID): 33   ggccttccat  ctgttgct       18
Sequence Number (ID): 34   gacatcggca  aggtgtgg       18
Sequence Number (ID): 35   gtggtggagt  gaacggaga      19
Sequence Number (ID): 36   tgggaagtgg  tcaggagata  a  21
Sequence Number (ID): 37   tgtaatcttc  tctgtcgcta  cttc    24
Sequence Number (ID): 38   tgcaccagat  tgttttgtgt     20
Sequence Number (ID): 39   gtggtggagt  gaacggaga      19
Sequence Number (ID): 40   ccaccttagc  ctcctcctct     20
Sequence Number (ID): 41   aaagcatatt  tgggcactct  g  21
Sequence Number (ID): 42   agacaagttc  accccaccag     20
Sequence Number (ID): 43   tcacctccat  gtgccttaca     20
Sequence Number (ID): 44   acagagagaa  gggcacagga     20
Sequence Number (ID): 45   catcagcaga  agggaggaag     20
Sequence Number (ID): 46   aacatgcaaa  ggggattctg     20
Sequence Number (ID): 47   tggaagtggc  ttttggtttc     20
Sequence Number (ID): 48   tggatttcat  gcctcacaaa     20
Sequence Number (ID): 49   ttcctcttgt  ctccccagaa     20
Sequence Number (ID): 50   caccatcacc  cttcttccac     20
Sequence Number (ID): 51   tgcttcctct  tcccagctaa     20
Sequence Number (ID): 52   caccatcacc  cttcttccac     20
Sequence Number (ID): 53   tgcttcctct  tcccagctaa     20
Sequence Number (ID): 54   gcagagagtg  ggaccaagag     20
Sequence Number (ID): 55   tgctaattct  ggggagatgg     20
Sequence Number (ID): 56   tccatcaggg  tcttctggtc     20
Sequence Number (ID): 57   tttttaaccg  gctctggatg     20
Sequence Number (ID): 58   gagagccctt  agctggtgtg     20
Sequence Number (ID): 59   gtgcagtttg  tccacccttt     20
Sequence Number (ID): 60   tgggaagtgg  tcaggagata  a  21
Sequence Number (ID): 61   gtctgggtaa  gggccagggc  ccccgagagt  agcaggagga   40
Sequence Number (ID): 62   acgtagggtc  cttcatcctg     20
Sequence Number (ID): 63   gtggtggagt  gaacggaga      19
Sequence Number (ID): 64   tgggaagtgg  tcaggagata  a  21
Sequence Number (ID): 65   agacaactgc  caaggacacc     20
Sequence Number (ID): 66   gtggtggagt  gaacggaga      19
Sequence Number (ID): 67   ccctgtgtga  gtccagaaca     20
Sequence Number (ID): 68   tgggaagtgg  tcaggagata  a  21
Sequence Number (ID): 69   ccctgtgtga  gtccagaaca     20
Sequence Number (ID): 70   gtggtggagt  gaacggaga      19
Sequence Number (ID): 71   ccctgtgtga  gtccagaaca     20
Sequence Number (ID): 72   
MAVMAPRTLL  LLLSGALALT  QTWAGSHSLK  YFHTSVSRPG  RGEPRFISVG  YVDDTQFVRF  60
WMHGCELGPD  RRFLRGYEQF  AYDGKDYLTL  NEDLRSWTAV  DTAAQISEQK  SNDASEAEHQ  180
WQQDGEGHTQ  DTELVETRPA  GDGTFQKWAA  VVVPSGEEQR  YTCHVQHEGL  PEPVTLRWKP  300
L                          361
Sequence Number (ID): 73   AVMAPRTLLL  LLSG           14

Claims (25)

  1.  細胞であって、欠失を有するゲノムDNAを含み、前記欠失は、以下(i)~(iv)に規定される染色体領域:
     (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域、
     (ii) HLA-CおよびHLA-Bを含む一連の領域、
     (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域、および
     (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域
    からなる群から選択される1以上の染色体領域中にそれぞれ位置するHLA類似配列集積領域の一部もしくは全体を含む領域の欠失であり、
     前記HLA類似配列集積領域は、前記染色体領域中にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列の全てを含み、
     前記一部は少なくとも一つながりの領域を含み、前記一つながりの領域は、上記領域にそれぞれ含まれるHLAコードする遺伝子およびHLA類似配列からなる群から選択される遺伝子の50%以上を含む、
    細胞。
  2.  請求項1に記載の細胞であって、前記ゲノムDNAにおいて請求項1に規定された欠失を有する(i)~(iv)のいずれかまたは好ましくはすべては、内在性のHLAおよびHLA類似配列を含まないか、1つしか含まない、細胞。
  3.  請求項1または2に記載の細胞であって、前記ゲノムDNAにおいて請求項1に規定された欠失を有する(i)~(iv)のいずれかまたは好ましくはすべては、内在性のHLAおよびHLA類似配列を含まない、細胞。
  4.  請求項1~3のいずれかに記載の細胞であって、
     (i) HLA-F、HLA-G、およびHLA-Aを含む一連の領域中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。
  5.  請求項1~4のいずれかに記載の細胞であって、
     (ii) HLA-CおよびHLA-Bを含む一連の領域中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。
  6.  請求項1~5のいずれかに記載の細胞であって、
     (iii) HLA-DRA、HLA-DRB5、およびHLA-DRB1を含む一連の領域、またはchr6: 32,445,000-32,821,000に対応する染色体領域中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。
  7.  請求項1~6のいずれかに記載の細胞であって、
     (iv) HLA-DOA、HLA-DPA1、およびHLA-DPB1を含む一連の領域中のHLA類似配列集積領域の全体を欠失したゲノムDNAを有する、細胞。
  8.  前記欠失が、hg38ゲノム配列のchr6: 29,701,000~29,723,464に対応する染色体領域中の特有の配列(第2の配列)中に他方の端を有する領域の欠失である、請求項1~7のいずれかに記載の細胞。
  9.  前記ゲノムDNAが、制御配列に作動可能に連結された内因性または外来性の所望の遺伝子の挿入を含み、当該挿入は、上記(i)~(iv)のいずれかの領域内、または上記(i)~(iv)の領域以外の領域に位置する、請求項1~8のいずれかに記載の細胞。
  10.  前記欠失が、hg38ゲノム配列のchr6: 31,166,000~31,269,169に対応する染色体領域中の特有の配列(第3の配列)中に一方の端を有し、hg38ゲノム配列のchr6: 31,357,158~31,544,000に対応する染色体領域中の特有の配列(第4の配列)中に他方の端を有する領域の欠失である、請求項1~9のいずれかに記載の細胞。
  11.  前記欠失が、hg38ゲノム配列のchr6:32,416,000~33,445,000に対応する染色体領域中の特有の配列(第5の配列)中に一方の端を有し、hg38ゲノム配列のchr6:32,439,951-32,831,000に対応する染色体領域中の特有の配列(第6の配列)中に他方の端を有する領域の欠失である、請求項1~10のいずれかに記載の細胞。
  12.  前記欠失が、hg38ゲノム配列のchr6:32,924,000~33,006,838に対応する染色体領域中の特有の配列(第7の配列)中に一方の端を有し、hg38ゲノム配列のchr6: 33,086,238-33,165,000に対応する染色体領域中の特有の配列(第8の配列)中に他方の端を有する領域の欠失である、請求項1~11のいずれかに記載の細胞。
  13.  請求項1~12のいずれかに記載の細胞であって、欠失を有する上記(i)~(iv)は、その染色体領域内に繰り返し配列を有しない、細胞。
  14.  請求項1~13のいずれかに記載の細胞であって、機能的なβ2ミクログロブリンおよび機能的なCIITAのいずれかまたは両方を有する、細胞。
  15.  請求項1~14のいずれかに記載の細胞であって、HLAクラスIおよび/またはHLAクラスIIを細胞表面に実質的に発現していない、細胞。
  16.  請求項1~15のいずれかに記載の細胞であって、欠失が100kbから400kbの大きさである、細胞。
  17.  請求項1~16のいずれかに記載の細胞を含む、組成物。
  18.  ゲノムの全アレルにおける領域の欠失であって、MHC分子をコードする遺伝子座のMHC類似配列集積領域の一部、または好ましくは全部を含む領域を含む欠失を有するゲノムを有する細胞。
  19.  各MHC類似配列集積領域には、1以下のMHC分子をコードする遺伝子しか含まれない、請求項18に記載の細胞。
  20.  各MHC類似配列集積領域には、4以下のMHC分子をコードする遺伝子しか含まれない、請求項18に記載の細胞。
  21.  各MHC類似配列集積領域には、MHC分子をコードする遺伝子を含まれない、請求項18に記載の細胞。
  22.  請求項18に記載の細胞であって、欠失が、MHC分子をコードする遺伝子座のMHC類似配列集積領域の全部を含む領域を含む欠失である、細胞。
  23.  請求項22に記載の細胞であって、制御配列と当該制御配列に作動可能に連結された所望の遺伝子をさらに含む、細胞。
  24.  制御配列と当該制御配列に作動可能に連結された所望の遺伝子が、全体として天然に存在しない配列を有する、請求項23に記載の細胞。
  25.  制御配列と当該制御配列に作動可能に連結された所望の遺伝子が、天然に存在する配列を有する、請求項23に記載の細胞。
PCT/JP2023/013574 2022-04-01 2023-03-31 遺伝子工学、細胞工学、および細胞医薬に適した細胞およびその製造方法 WO2023191063A1 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2022061625 2022-04-01
JP2022-061625 2022-04-01
JP2023011278 2023-01-27
JP2023-011278 2023-01-27

Publications (1)

Publication Number Publication Date
WO2023191063A1 true WO2023191063A1 (ja) 2023-10-05

Family

ID=88202369

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/013574 WO2023191063A1 (ja) 2022-04-01 2023-03-31 遺伝子工学、細胞工学、および細胞医薬に適した細胞およびその製造方法

Country Status (1)

Country Link
WO (1) WO2023191063A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018523977A (ja) * 2015-06-09 2018-08-30 エディタス・メディシン、インコーポレイテッド 移植を改善するためのcrispr/cas関連方法および組成物
WO2019160077A1 (ja) * 2018-02-16 2019-08-22 国立大学法人京都大学 低抗原性細胞の製造方法
WO2020168317A2 (en) * 2019-02-15 2020-08-20 President And Fellows Of Harvard College Universal donor stem cells and related methods
WO2021102324A1 (en) * 2019-11-20 2021-05-27 Vita Therapeutics, Inc. Method of engineering hypoimmunogenic muscle precursor cells
JP2021164443A (ja) * 2020-04-06 2021-10-14 株式会社Logomix ゲノム改変方法及びゲノム改変キット
WO2021241658A1 (ja) * 2020-05-26 2021-12-02 株式会社ヘリオス 低免疫原性細胞

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018523977A (ja) * 2015-06-09 2018-08-30 エディタス・メディシン、インコーポレイテッド 移植を改善するためのcrispr/cas関連方法および組成物
WO2019160077A1 (ja) * 2018-02-16 2019-08-22 国立大学法人京都大学 低抗原性細胞の製造方法
WO2020168317A2 (en) * 2019-02-15 2020-08-20 President And Fellows Of Harvard College Universal donor stem cells and related methods
WO2021102324A1 (en) * 2019-11-20 2021-05-27 Vita Therapeutics, Inc. Method of engineering hypoimmunogenic muscle precursor cells
JP2021164443A (ja) * 2020-04-06 2021-10-14 株式会社Logomix ゲノム改変方法及びゲノム改変キット
WO2021241658A1 (ja) * 2020-05-26 2021-12-02 株式会社ヘリオス 低免疫原性細胞

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"Pipeline", LOGOMIX [ONLINE], Retrieved from the Internet <URL:https://logomix.bio/en-pipeline> [retrieved on 20230606] *
OHNO TOMOYUKI, AKASE TAICHI, KONO SHUNYA, KURASAWA HIKARU, TAKASHIMA TAKUTO, AIZAWA YASUNORI: "Biallelic and gene-wide genomic substitution for endogenous intron and retroelement mutagenesis in human cells", BIORXIV, 11 March 2022 (2022-03-11), pages 1 - 55, XP093094456, DOI: 10.1101/2022.03.09.482138 *
OHNO TOMOYUKI, AKASE TAICHI, KONO SHUNYA, KURASAWA HIKARU, TAKASHIMA TAKUTO, KANEKO SHINYA, AIZAWA YASUNORI: "Biallelic and gene-wide genomic substitution for endogenous intron and retroelement mutagenesis in human cells", NATURE COMMUNICATIONS, vol. 13, no. 1, XP093094460, DOI: 10.1038/s41467-022-31982-1 *
RIEMERSMA SIETSKE A., JORDANOVA EKATERINA S., SCHOP ROELANDT, PHILIPPO KATJA, LOOIJENGA LEENDERT, SCHUURING ED, KLUIN PHILIP M.: "Extensive genetic alterations of the HLA region, including homozygous deletions of HLA class II genes in B-cell lymphomas arising in immune-privileged sites", BLOOD, AMERICAN SOCIETY OF HEMATOLOGY, US, vol. 96, no. 10, 15 November 2000 (2000-11-15), US , pages 3569 - 3577, XP093094447, ISSN: 0006-4971, DOI: 10.1182/blood.V96.10.3569.h8003569_3569_3577 *

Similar Documents

Publication Publication Date Title
JP7154248B2 (ja) 標的遺伝子座を修飾するための方法及び組成物
US10280402B2 (en) Immune-compatible cells created by nuclease-mediated editing of genes encoding HLA
KR101773782B1 (ko) 게놈의 표적화된 변형을 위한 방법 및 조성물
KR102243243B1 (ko) 신규한 cho 통합 부위 및 이의 용도
JP7385281B2 (ja) 低抗原性細胞の製造方法
JP2021121220A (ja) Cas9タンパク質のマルチサイクルエレクトロポレーションによる遺伝子修飾非ヒト哺乳動物
WO2017079428A1 (en) Site specific germline modification
JP2021534806A (ja) ユニバーサルドナー細胞
TR201816074T4 (tr) Hedeflenen genetik modifikasyonlara yönelik yöntemler ve bileşimler ve kullanım yöntemleri.
KR102151065B1 (ko) 동물 배아의 염기 교정용 조성물 및 염기 교정 방법
JP2016523084A (ja) 標的組込み
KR20150105475A (ko) 유각의 가축
US20200149063A1 (en) Methods for gender determination and selection of avian embryos in unhatched eggs
WO2023191063A1 (ja) 遺伝子工学、細胞工学、および細胞医薬に適した細胞およびその製造方法
WO2021206054A1 (ja) ゲノム改変方法及びゲノム改変キット
JP2021164447A (ja) ゲノム改変方法及びゲノム改変キット
TWI704224B (zh) 編輯核酸序列之組成物及方法
CN116033910A (zh) 编辑b细胞中b2m基因座的方法和组合物
US20210230637A1 (en) Method for producing homozygous cells
JP7212982B1 (ja) 細胞ライブラリおよびその製造方法
WO2024075756A1 (ja) 細胞ライブラリおよびその製造方法
WO2023176982A1 (ja) Mhc遺伝子群ヒト化動物
Simone Expanding Targeting and Manipulation of the Human Genome towards Regenerative Medicine Applications
WO2022101641A1 (en) Influenza a-resistant animals having edited anp32 genes
Puro Genomic DNA Genomic DNA

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23781071

Country of ref document: EP

Kind code of ref document: A1