KR102566777B1 - 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법 - Google Patents

줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법 Download PDF

Info

Publication number
KR102566777B1
KR102566777B1 KR1020220187476A KR20220187476A KR102566777B1 KR 102566777 B1 KR102566777 B1 KR 102566777B1 KR 1020220187476 A KR1020220187476 A KR 1020220187476A KR 20220187476 A KR20220187476 A KR 20220187476A KR 102566777 B1 KR102566777 B1 KR 102566777B1
Authority
KR
South Korea
Prior art keywords
stem cells
mutation
genes
gene
genetic stability
Prior art date
Application number
KR1020220187476A
Other languages
English (en)
Inventor
황태순
백순명
홍창표
오세진
권솔비
Original Assignee
주식회사 테라젠바이오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 테라젠바이오 filed Critical 주식회사 테라젠바이오
Priority to KR1020220187476A priority Critical patent/KR102566777B1/ko
Application granted granted Critical
Publication of KR102566777B1 publication Critical patent/KR102566777B1/ko

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Oncology (AREA)
  • Physiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명의 줄기세포의 유전성 안정성 예측을 위한 정보 제공 방법에 따르면, 계대배양된 줄기세포의 유전적 안정성, 특히 종양원성 여부를 미리 탐색할 수 있어, 줄기세포의 품질을 효과적으로 평가할 수 있다.

Description

줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법{A METHOD FOR PROVIDING INFORMATION FOR PREDICTING GENOME STABILITY OF STEM CELLS}
본 발명은 줄기세포의 배양적응성 예측을 위한 정보를 제공하는 방법에 관한 것이다.
줄기세포(stem cell)란, 미분화 상태를 유지하면서 무한히 증식할 수 있으며 일정한 환경과 조건이 주어질 경우 특정 기능과 형태를 갖도록 분화할 수 있는 세포를 말한다. 줄기세포의 자가재생산능과 전분화능으로 인해 세포 치료제 개발 및 다양한 신약후보물질의 약효 검색, 질환의 원인 규명, 치료법 개발 등 다양한 측면에서 이를 대상으로 한 연구성과의 활용범위가 확대되고 있다. 줄기세포의 수요가 급증함에 따라, 줄기세포의 높은 공급량도 요구되며, 일반적으로 이를 위해 줄기세포의 계대배양이 이용된다.
줄기세포의 계대배양은 세포증식 방법의 하나로, 약 5 일마다 주기적으로 새로운 배지에 이식시켜 배양함으로써 세포를 보존하고 세포를 대량생산할 수 있는 방법이다. 줄기세포가 반복적으로 계대배양될 경우, 줄기세포의 유전적 안정성이 감소되거나 DNA 손상이 유발될 수 있음이 공지되어 있다. 이러한 배양적응으로 인해 줄기세포의 부작용이 발생하고 줄기세포의 임상 및 사용이 제한되고 있는 실정이다.
따라서, 이를 극복하기 위한 시도들이 존재하였으나(미국등록특허 US 9249392 B2), 이미 계대배양된 줄기세포의 품질을 평가하는 접근은 부진하였다. 이에, 계대배양된 줄기세포의 배양적응을 판단하여 부작용을 예방하고 줄기세포 생산의 품질을 향상시키는 것의 중요성이 대두되고 있다.
본 발명자들은 줄기세포의 배양적응성 발생 여부를 빠르게 판단할 수 있는 평가 방법을 개발하였다. 따라서, 본 발명의 줄기세포의 배양적응성 판단 방법에 의하면, 줄기세포의 유전성 안정성을 효과적으로 평가할 수 있다.
본 발명의 일 양상은 대상 줄기세포의 유전체 정보를 준비하는 단계; 상기 유전체 정보에서, TP53과 관련성이 있는 유전자의 변이를 검출하는 단계를 포함하는 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법을 제공한다.
본 발명의 또 다른 양상은 하드웨어와 결합되어 상기 방법을 컴퓨터에서 실행시키기 위해 매체에 저장된 컴퓨터 프로그램을 제공한다.
본 발명의 일 양상은 대상 줄기세포의 유전체 정보를 준비하는 단계; 상기 유전체 정보에서, TP53과 관련성이 있는 유전자의 변이를 검출하는 단계를 포함하는 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법을 제공한다.
본 명세서에서 사용된 용어 "줄기세포의 유전성 안정성(Genome stability)"은 계대배양 등으로 인해, 줄기세포의 유전체에 돌연변이가 축적되어 줄기세포의 유효성을 전부 또는 일부 상실하거나, 줄기세포가 종양원성을 가지게 되었음을 의미한다. 줄기세포의 유전성 안정성을 전부 또는 일부 상실한 줄기세포는 줄기세포의 배양적응성이 생겼다고 지칭할 수 있다. 본원에서, 줄기세포의 유전성 안정성, 배양적응성과 유효성은 편의를 위해 혼용할 수 있다.
본 명세서에서 사용된 용어 "줄기세포 배양적응성"은 줄기세포의 계대배양 중 줄기세포 유전체 내에 변이가 발생하여 배양환경의 미세변화에 따른 생존 및 적응성이 높아져, 그 결과 줄기세포의 유전체 불안정성이 발생되는 것을 의미한다.
본 명세서에서 사용된 용어 "줄기세포 유효성(Stemness)"은 줄기세포능이라고도 명명하며, 줄기세포의 유효성 판단은 대상 줄기세포가, 줄기세포의 정의 안에 포함되는지를 의미한다. 줄기세포의 유효성은 다능성, 자가재생성 또는 탈분화능 등을 포함할 수 있으며, 이에 대한 정의는 Melton, D. A., & Cowen, C. (2009). "Stemness": Definitions, Criteria, and Standards. Essentials of Stem Cell Biology를 참조한다. 또한, 상기 줄기세포 유효성은 도 3의 유전자 각각을 바이오마커로 할 수 있다.
본 명세서에서 사용된 용어 "계대배양(subculture, passaging)"은 세포증식 방법의 하나로, 상기 계대배양은 원래 배양에서 일부 세포를 새로운 배지에 옮겨 새롭게 배양하는 것을 의미한다. 일반적으로, 줄기세포의 계대배양은 약 5일마다 주기적으로 새로운 배지에 이식시켜 배양함으로써 세포의 노화를 막고 세포의 밀도를 연장하여 결과적으로 세포를 대량 생산하는 방법이다.
본 발명에서 배양적응성이 생긴 줄기세포는 줄기세포 유효성(Stemness)을 유지하면서도, 계대배양으로 인해 유의미한 유전적 안정성(Genome stability)이 떨어지는 것일 수 있다. 상기 줄기세포 유효성은 지속적 배양에도 불구하고 줄기세포가 줄기세포 고유의 특성인 자가재생산(self-renewal) 등이 유지되는 것일 수 있다. 또한, 상기 유전적 안정성의 변화는 계대배양으로 인한 변이의 축적으로 인해, 줄기세포에 세포 이질성(Cell heterogeneity) 또는 종양원성(Tumorigenicity)이 발생하였음을 의미한다.
따라서, 계대배양으로 인해 줄기세포에 변이가 축적되는 경우, 배양적응성이 생겨 유전적 안정성이 떨어질 수 있다. 배양적응성이 생긴 줄기세포는 종양원성 등으로 인해 실험 진행에 부적절한 줄기세포일 수 있다. 따라서, 본 발명은 계대배양된 줄기세포의 배양적응성 여부 또는 줄기세포 유전성 안정성을 판단하는 방법 또는 정보를 제공하는 방법을 제공한다. 편의를 위해, 본 명세서에서 "예측"과 "판단"은 일부 혼용될 수 있다.
따라서, 상기 줄기세포의 유전성 안정성은 배양으로 인한 줄기세포의 유전적 불안정성 정보를 제공하는 것일 수 있다. 또한, 상기 유전적 불안정성은 종양원성일 수 있다.
본 명세서에서 사용된 용어 "종양원성(Tumorigenicity)"은 특정 세포가 암세포의 특성을 가져, 종양을 형성할 수 있는 능력이 있음을 의미한다. 종양원성이 생긴 줄기세포는 치료제 등에 사용할 경우, 암세포로 변화할 수 있다.
따라서, 상기 방법은 대상 줄기세포의 유전체 정보에서, TP53과 관련성이 있는 유전자의 변이를 검출하는 단계를 포함할 수 있다.
상기 TP53과 관련성이 있는 유전자는 TP53와 기능적으로 관련성이 있는 유전자 중, 줄기세포의 배양적응성과 관련성이 높은 선별된 유전자를 총칭한다. TP53과 관련성이 있는 유전자는 ABL1, AGO1, AK6, APEX1, AR, ARID3A, ATF3, ATM, ATR, ATRX, AURKA, AURKB, AXIN1, BAG2, BAK1, BANP, BARD1, BAX, BBC3, BCL2, BCL2L1, BLM, BRCA1, BRCA2, BRD1, BRD7, BTRC, CARM1, CCNG1, CDK1, CDK2, CDK4, CDK5, CDK7, CDKN1A, CDKN2A, CHEK1, CHEK2, CHUK, COPS2, COPS4, COPS5, CREB1, CREBBP, CSNK1A1, CSNK1D, CSNK2A1, CSNK2A2, CSNK2B, CUL7, CUL9, DAXX, DDX5, DNAJA1, DNAJB1, DNMT1, DROSHA, DVL2, E2F1, E4F1, EEF2, EGR1, EHMT1, EIF2AK2, ELL, EP300, ERCC2, ERCC3, ESR1, ETS1, ETS2, FBXW7, FOXO3, GNL3, GSK3B, GTF2H1, HDAC1, HDAC2, HDAC3, HIF1A, HIPK2, HMGB1, HNF4A, HNRNPK, HSP90AA1, HSPA1A, HSPA1B, HSPA4, HSPA8, HSPA9, HSPB1, HUWE1, IFI16, IKBKB, ING1, ING4, ING5, KAT2A, KAT2B, KAT5, KAT6A, KAT8, KDM1A, L3MBTL1, LRRK2, MAPK1, MAPK14, MAPK3, MAPK8, MAPK9, MDM2, MDM4, MED1, MNAT1, MSH2, MTA1, MTA2, MTOR, NCL, NCOR1, NCOR2, NDN, NEDD8, NFKBIA, NFYA, NFYB, NPM1, NQO1, NR3C1, NR4A1, NUMB, OBSL1, OTUB1, OTUD5, PARP1, PBK, PCNA, PER2, PHB, PHF1, PIAS1, PIAS2, PIN1, PLK1, PLK3, PML, PPM1D, PPP1R13L, PPP2CA, PPP2R1A, PPP2R5C, PRKCD, PRKDC, PSMC3, PSMC5, PSMD4, PTEN, PTGS2, PTTG1, RAD23A, RAD51, RANBP2, RB1, RB1CC1, RBBP5, RCHY1, RELA, REV1, RFWD2, RNF20, RPA1, RPL11, RPL5, RPS27A, RPS3, RPS7, RRM2B, S100A2, S100A4, S100A6, S100B, SETD1A, SETD7, SFN, SIN3A, SIRT1, SMAD2, SMAD3, SMARCA4, SMARCC1, SMYD2, SNAI1, SOCS1, SP1, SQSTM1, STK11, STUB1, SUMO1, SYVN1, TADA3, TAF1, TAF6, TBP, TDG, TFDP1, TNFAIP3, TOP1, TOPBP1, TOPORS, TP53, TP53BP1, TP53BP2, TP53I3, TP53RK, TP63, TP73, TPT1, TRIM25, TRIM28, TRRAP, TWIST1, UBB, UBC, UBE2A, UBE2D1, UBE2I, UBE2K, UBE2N, UBE3A, UBE4B, UBR5, UCHL1, USP28, USP7, VCP, VRK1, WDR5, WRN, WT1, WWOX, XPO1, XRCC6, YBX1, YWHAE, YWHAZ, YY1 및 ZBTB17으로 이루어진 군으로부터 선택된 하나 이상의 것일 수 있다.
일 구체예에 있어서, 본 발명의 정보 제공 방법은 TP53과 관련성이 있는 유전자의 변이를 가지고 있는 대상 줄기세포의 경우 유전성 안정성이 낮다고 판단하는 단계를 추가적으로 포함할 수 있다.
또한, 상기 변이를 검출하는 단계는 TP53의 변이 및 한 개 이상의 TP53과 관련성이 있는 유전자의 변이를 검출하는 것일 수 있다.
따라서, 일 구체예에 있어서, 본 발명의 정보 제공 방법은 TP53 변이 및 TP53과 관련성이 있는 유전자의 변이를 모두 가지고 있는 대상 줄기세포의 경우 유전성 안정성이 낮다고 판단하는 단계를 추가적으로 포함할 수 있다. 본 발명의 유전자 변이와 종양원성과 관련성이 높은 TP53의 변이를 같이 확인할 경우, 줄기세포의 안정성 여부를 더 신빙성 높게 판단할 수 있다.
또한, 상기 변이를 검출하는 단계는 상기 TP53과 관련성이 있는 유전자의 변이 및 COSMIC 데이터베이스 Tier 1 리스트 유전자의 변이를 같이 검출할 수 있다.
본 명세서에서 사용된 용어 "COSMIC(Catalogue of Somatic Mutations in Cancer)"은 종양에서 발생하는 체세포 변이 유전자를 의미한다. COSMIC 데이터베이스 Tier 1 리스트는 COSMIC 유전자 종류 리스트를 의미한다. 해당 목록에 있는 유전자에서 돌연변이가 발생하면 암이 생기거나 영향을 준다고 예상한다. COSMIC Tier1 유전자들은 (i) 유전자의 돌연변이가 암 발생을 촉진시키는 문헌적 근거에 뒷받침되고, (ii) 유전자에서 발생하는 돌연변이의 패턴이 종양유발 유전자에서 흔히 발견되는 패턴을 따르는 유전자를 총칭한다. 본 발명은 COSMIC Tier1 유전자 중 줄기세포의 안정성과 관련성이 높은 유전자를 선별해 이용하여 줄기세포의 안정성 및 종양원성을 판단하였다.
이때, COSMIC 데이터베이스 Tier 1 리스트 유전자의 변이는 ABI1, ABL1, ABL2, ACKR3, ACSL3, ACVR1, ACVR2A, AFDN, AFF1, AFF3, AFF4, AKT1, AKT2, ALK, AMER1, APC, AR, ARHGAP26, ARHGEF12, ARID1A, ARID1B, ARID2, ARNT, ASPSCR1, ASXL1, ATF1, ATIC, ATM, ATP1A1, ATP2B3, ATR, ATRX, AXIN1, AXIN2, B2M, BAP1, BARD1, BAX, BCL10, BCL11A, BCL11B, BCL2, BCL3, BCL6, BCL7A, BCL9, BCL9L, BCOR, BCORL1, BCR, BIRC3, BRAF, BRCA1, BRCA2, BRD3, BRD4, BTG1, BTK, CACNA1D, CALR, CAMTA1, CANT1, CARD11, CARS, CASP8, CBFA2T3, CBFB, CBL, CBLB, CBLC, CCDC6, CCNB1IP1, CCND1, CCND2, CCND3, CCNE1, CD274, CD74, CD79A, CD79B, CDC73, CDH1, CDH11, CDK12, CDK6, CDKN1B, CDKN2A, CDKN2C, CDX2, CEBPA, CHCHD7, CHD4, CIC, CIITA, CLIP1, CLTC, CLTCL1, CNBP, CNOT3, CNTRL, COL1A1, COL2A1, CREB1, CREB3L1, CREB3L2, CREBBP, CRLF2, CRTC1, CRTC3, CSF3R, CTCF, CTNNB1, CUX1, CXCR4, CYLD, DAXX, DCTN1, DDIT3, DDR2, DDX10, DDX3X, DDX5, DDX6, DEK, DICER1, DNAJB1, DNM2, DNMT3A, DROSHA, EBF1, EGFR, EIF3E, EIF4A2, ELF4, ELK4, ELL, EML4, EP300, EPAS1, EPS15, ERBB2, ERBB3, ERBB4, ERC1, ERG, ESR1, ETNK1, ETV1, ETV4, ETV5, ETV6, EWSR1, EZH2, EZR, FAS, FAT1, FAT4, FBXO11, FBXW7, FCGR2B, FCRL4, FES, FEV, FGFR1, FGFR1OP, FGFR2, FGFR3, FGFR4, FHIT, FIP1L1, FLI1, FLT3, FLT4, FOXA1, FOXL2, FOXO1, FOXO3, FOXO4, FOXP1, FSTL3, FUBP1, FUS, GAS7, GATA1, GATA2, GATA3, GNA11, GNAQ, GNAS, GOLGA5, GOPC, GPHN, GRIN2A, H3F3A, H3F3B, HERPUD1, HEY1, HIF1A, HIP1, HIST1H3B, HIST1H4I, HLA-A, HLF, HMGA1, HMGA2, HNF1A, HNRNPA2B1, HOOK3, HOXA11, HOXA13, HOXA9, HOXC11, HOXC13, HOXD11, HOXD13, HRAS, HSP90AA1, HSP90AB1, IDH1, IDH2, IGH, IGK, IGL, IKBKB, IKZF1, IL2, IL21R, IL6ST, IL7R, IRF4, IRS4, ITK, JAK1, JAK2, JAK3, JUN, KAT6A, KAT6B, KCNJ5, KDM5A, KDM5C, KDM6A, KDR, KDSR, KEAP1, KIF5B, KIT, KLF4, KLF6, KLK2, KMT2A, KMT2C, KMT2D, KNL1, KRAS, KTN1, LASP1, LATS1, LATS2, LCK, LEF1, LIFR, LMNA, LMO1, LMO2, LPP, LRIG3, LRP1B, LYL1, LZTR1, MAF, MAFB, MALT1, MAML2, MAP2K1, MAP2K2, MAP2K4, MAP3K1, MAP3K13, MAPK1, MAX, MDM2, MDM4, MECOM, MED12, MEN1, MET, MITF, MLF1, MLH1, MLLT1, MLLT10, MLLT11, MLLT3, MLLT6, MN1, MPL, MRTFA, MSH2, MSH6, MSI2, MSN, MTCP1, MTOR, MUC1, MYB, MYC, MYCL, MYCN, MYD88, MYH11, MYH9, MYO5A, MYOD1, NAB2, NCOA1, NCOA2, NCOA4, NCOR1, NCOR2, NDRG1, NF1, NF2, NFATC2, NFE2L2, NFIB, NFKB2, NFKBIE, NIN, NKX2-1, NONO, NOTCH1, NOTCH2, NPM1, NR4A3, NRAS, NRG1, NSD1, NSD2, NSD3, NT5C2, NTRK1, NTRK3, NUMA1, NUP214, NUP98, NUTM1, NUTM2B, NUTM2D, OLIG2, P2RY8, PAFAH1B2, PATZ1, PAX3, PAX5, PAX7, PAX8, PBRM1, PBX1, PCM1, PDCD1LG2, PDE4DIP, PDGFB, PDGFRA, PDGFRB, PER1, PHF6, PHOX2B, PICALM, PIK3CA, PIK3CB, PIK3R1, PIM1, PLAG1, PLCG1, PML, POLD1, POLE, POLQ, POT1, POU2AF1, POU5F1, PPARG, PPFIBP1, PPM1D, PPP2R1A, PPP6C, PRCC, PRDM1, PRDM16, PREX2, PRKACA, PRKAR1A, PRRX1, PSIP1, PTCH1, PTEN, PTK6, PTPN11, PTPN13, PTPRB, PTPRC, PTPRK, PTPRT, QKI, RABEP1, RAC1, RAD21, RAD51B, RAF1, RANBP2, RAP1GDS1, RARA, RB1, RBM10, RBM15, REL, RET, RHOA, RHOH, RMI2, RNF213, RNF43, ROS1, RPL10, RPL22, RPL5, RPN1, RSPO2, RSPO3, RUNX1, RUNX1T1, SALL4, SDC4, SDHA, SET, SETBP1, SETD2, SF3B1, SFPQ, SFRP4, SH2B3, SH3GL1, SIX1, SLC34A2, SLC45A3, SMAD2, SMAD3, SMAD4, SMARCA4, SMARCB1, SMARCD1, SMO, SND1, SOCS1, SOX2, SPEN, SPOP, SRC, SRSF2, SRSF3, SS18, SS18L1, SSX1, SSX2, SSX4, STAG2, STAT3, STAT5B, STAT6, STIL, STK11, STRN, SUFU, SUZ12, SYK, TAF15, TAL1, TAL2, TBL1XR1, TBX3, TCEA1, TCF12, TCF3, TCF7L2, TCL1A, TENT5C, TERT, TET1, TET2, TFE3, TFEB, TFG, TGFBR2, TLX1, TLX3, TMPRSS2, TNFAIP3, TNFRSF14, TNFRSF17, TOP1, TP53, TP63, TPM3, TPM4, TPR, TRA, TRAF7, TRB, TRD, TRIM24, TRIM27, TRIM33, TRIP11, TRRAP, TSC1, TSC2, TSHR, U2AF1, UBR5, USP6, USP8, VHL, WDCP, WIF1, WT1, WWTR1, XPO1, YWHAE, ZBTB16, ZFHX3, ZMYM2, ZNF331, ZNF384, ZNF521, 및 ZRSR2으로 이루어진 군으로부터 선택된 하나 이상의 것일 수 있다.
일 구체예에 있어서, 본 발명의 정보 제공 방법은 TP53과 관련성이 있는 유전자의 변이 및 COSMIC 데이터베이스 Tier 1 리스트 유전자의 변이를 모두 가지고 있는 대상 줄기세포의 경우 유전성 안정성이 낮다고 판단하는 단계를 추가적으로 포함할 수 있다.
일 구체예에 있어서, 본 발명의 정보 제공 방법은 TP53의 변이, TP53과 관련성이 있는 유전자의 변이 및 COSMIC 데이터베이스 Tier 1 리스트 유전자의 변이 중 두 개 이상을 가지고 있는 대상 줄기세포의 경우 유전성 안정성이 낮다고 판단하는 단계를 추가적으로 포함할 수 있다. 구체적으로, 상기 변이를 모두 가지는 경우 대상 줄기세포의 유전성 안정성이 낮다고 판단할 수 있다.
또한, 상기 변이를 검출하는 단계는 세포 분화와 관련된 유전자에서 변이를 검출하는 것일 수 있다. 상기 세포분화와 관련된 유전자는 하기 기능적 경로와 관련된 유전자일 수 있다. 기능적 경로는 세포자살(Apoptosis), 노화 개시(Senescence Initiators), 세포 주기 조절(Regulation of Cell Cycle), TGFβ 수퍼패밀리 신호 전달 경로(TGFβ Superfamily Signaling Pathway), 세포 주기(Cell Cycle), 폴리콥 인자(Polycomb Cofactors), 발달 및 분화(Development & Differentiation), 세포 주기 사이클 체크포인트 및 세포 주기 정지(Cell Cycle Checkpoint and Cell Cycle Arrest), WNT 신호 경로(WNT Signaling Pathways), 헷지도그 신호 경로(Hedgehog Signaling Pathway), 전사 인자(Transcription Factors), 세포 접착 분자(Cell Adhesion Molecules), 줄기 세포 유지에 중요한 신호 경로(Signaling Pathways Important for Stem Cell Maintenance), 세포 기전(Cellular Mechanisms), 줄기세포 특이 표지자(Stem Cell Specific Markers), 세포 분화(Cell Differentiation), 지방생성조절(Adipogenesis Regulation), Cell Polarity(28), JAK/STAT 신호전달(JAK/STAT Signaling), 배자 발달(Embryonic Development), 다분화능(Pluripotency), 스트레스 반응(Stress Response), PI3K/AKT 경로(PI3K/AKT Signaling), 세포골격조절제(Cytoskeleton Regulators), 신호전달(Signal Transduction), 골격발달(Skeletal Development), 삼흉복합체(Trithorax Complexes), 세포부착(Cell Adhesion), SMAD표적유전자(SMAD Target Genes), 유도만능줄기세포(Induced Pluripotent Stem Cells), 줄기세포분화마커(Stem Cell Differentiation Markers)으로 구성된 군으로부터 선택된 하나 이상의 것일 수 있다.
구체적으로, 각 기능적 경로(카테고리)는 각각 독립적으로 하기 표 1의 유전자를 포함한다.
Functional.category Pathway.Gene.List
세포자살(Apoptosis) AKT1, BCL2L1, BCL-X, CDKN1A, F2, F2R, FAS, TNFRSF6, IL2RA, MCL1, NFKB1, PRLR, STAT1, BAX, CCNB1, GNL3, NPM1, TP53, ADORA1, ADORA2A, ALK, APOE, BCL2, EP300, GDNF, NOTCH2, NTN1, PAX3, RTN4, S100B, VEGFA, AGT, BIRC2, c-IAP2, EGFR, FASLG, TNFSF6, GADD45B, IFNB1, IFNG, IL12B, CD25, IL4, INS, LTA, TNFB, MAP2K6, MEK6, MMP9, GelatinaseB, NQO1, NR4A2, NUR77, PTGS2, COX-2, TNFRSF1B, TNFSF10, TRAIL, TRAF2, ABL1, BDNF, FOXC1, ID3, IGFBP3, JUN, KALRN, NOTCH1, PTCRA, COX2, SGPL1, SOCS3, SOX9, ACVR1, ALK2, AIPL1, CDKN1B, p27KIP1, CREB1, CTNNB1, FURIN, HERPUD1, KLF10, MAP3K7, TAK1, MAPK8, JNK1, MSX2, PLG, RAD21, RHOA, RHOB, RYBP, S100A8, SHH, SOX4 및 TGFB2 및 TXNIP으로 구성된 군으로부터 선택된 하나 이상
노화 개시(Senescence Initiators) ATM, GADD45A, NBN, PCNA, TERF2, TERT, TP53BP1, IGF1, IGF1R, IGFBP3, IGFBP5, IGFBP7, ALDH1A3, CDKN1A, CDKN1B, p27KIP1, EGR1, IFNG, IRF3, IRF5, IRF7, NFKB1, RB1, SERPINB2, PAI-2, HRAS, MAP2K1, MAP2K3, MAP2K6, MAPK14, NOX4, PRKCD, SOD1, SOD2, ABL1, AKT1, CCNA2, CCNB1, CDC25C, CDKN1C, CDKN2B, p15INK4b, CDKN2C, CITED2, CREG1, GSK3B, ID1, ING1, MORC3, MYC, PIK3CA, PLAU, RBL1, SERPINE1, PAI-1, SIRT1, SPARC 및 TGFB1으로 구성된 군으로부터 선택된 하나 이상
세포 주기 조절(Regulation of Cell Cycle) ABL1, ANAPC2, ATR, AURKA, BCCIP, BCL2, BRCA2, CCNB1, CCNB2, CCNC, CCND1, CCND2, CCND3, CCNE1, CCNF, CCNH, CCNT1, CDC16, CDC20, CDC25C, CDC6, CDK1, CDC2, CDK2, CDK4, CDK5R1, CDK6, CDK7, CDK8, CDKN1A, p21CIP1/WAF1, CDKN1B, p27KIP1, CKS1B, E2F1, E2F4, GADD45A, KNTC1, MKI67, RAD9A, RB1, SKP2, TFDP1, TFDP2 및 WEE1으로 구성된 군으로부터 선택된 하나 이상
TGFβ 수퍼패밀리 신호 전달 경로(TGFβSuperfamily Signaling Pathway) ACVRL1, ACVR1, ACVR1B, ACVR1C, ACVR2A, ACVR2B, AMHR2, BMPR1A, BMPR1B, BMPR2, ENG, LTBP1, LTBP2, LTBP3, LTBP4, RGMA, TGFBR1, TGFBR2, TGFBR3, TGFBRAP1, EP300, SMAD1, SMAD2, SMAD3, SMAD4, SMAD5, SMAD6, SMAD7, SMAD9, CREBBP, E2F5, RBL1, RBL2, SP1 및 ZEB2으로 구성된 군으로부터 선택된 하나 이상
세포 주기(Cell Cycle) ATM, BCL2, BIRC5, CCND1, CDKN1C, p57KIP2, CDKN2B, p15INK4B, CDKN2C, p18INK4C, ID4, IFNG, MKI67, MLH1, MYC, RASSF1, TGFB1, TP53, CCNB1, CCND2, CDC25A, CDK4, CDKN1B, GNL3, PA2G4, PCNA, APBB1, EP300, HDAC4, MDK, KMT2A, NDN, PARD3, PTN, CDC6, p27KIP1, GADD45B, PTGS2, COX-2, RHOB, TGFB2, ACVR1, ALK2, RAD21, APC, BTRC, bTrCP, CTNNB1, FOSL1, JUN, RHOA, RUVBL1, TCF7L1., AHR, CDKN2A, p16INK4, EGFR, FRA-1, ID2, IGF1, IGF2 및 SOX2으로 구성된 군으로부터 선택된 하나 이상
폴리콥 인자(Polycomb Cofactors) AEBP2, RBP2, SNAI1, ZBTB16, ARID1B, ASXL1, ASXL2, ASXL3, BAP1, CBX1, CBX2, CBX3, CBX4, CBX7, CTBP2, DNMT3L, EPC1, EPC2, HTT, INO80, INOC1, INO80B, INO80C, INO80D, JARID2, L3MBTL2, LARP7, MBTD1, KMT2B, KMT2E, MOV10, MTF2, PCGF5, PHF19, PPP1CC, PPP1R8, SCML2, SIRT1, SMARCA4, SMARCC1, TRIM27, USP11, USP7, YAF2, YY1AP1, YY2으로 구성된 군으로부터 선택된 하나 이상
발달 및 분화(Development & Differentiation) CD80, CD83, IL12B, IL15, IL2, IL2RA, CD25, IL4, IRF1, STAT5B, TP53, VCAM1, CCL5, RANTES, CSF1, MCSF, CSF2, GM-CSF, CSF2RB, CSF3, GCSF, MMP9, GelatinaseB, NFKBIA, IkBa/MAD3, TNF, AGT, ALDH3A2, CXCL1, EGFR, EGR2, IFNG, NR4A2, NUR77, SNAP25, SOD2, STAT3, ANGPTL4, BMP4, CTGF, FGF20, FGF4, FGF9, GDF5, CDMP-1, GDNF, IGF1, IGF2, IL6, JAG1, TGFB3, VEGFA, ANTXR1, CCND1, CCND2, CDH1, E-cadherin, CDON, DAB2, DLK1, EFNB1, FN1, FST, GJA1, ID2, MET, NRCAM, NRP1, NTRK2, PDGFRA, SMO, TWIST1, CDKN2A, p16INK4, EGR1, NANOG, POU5F1, OCT4, PPARD, RUNX2, SIX1, SOX2, SOX9, T, Brachyury으로 구성된 군으로부터 선택된 하나 이상
세포 주기 사이클 체크포인트 및 세포 주기 정지(Cell Cycle Checkpoint and Cell Cycle Arrest) ATM, ATR, BRCA1, BRCA2, CASP3, CCNA2, CCNG2, CDC25A, CDC25C, CDC34, CDK1, CDC2, CDK2, CDKN1A, p21CIP1/WAF1, CDKN1B, p27KIP1, CDKN2A, p16INK4, CDKN2B, p15INK4B, CDKN3, CHEK1, CHEK2, RAD53, CUL1, CUL2, CUL3, GADD45A, HUS1, KNTC1, MAD2L1, MAD2L2, MDM2, NBN, NBS1, RAD1, RAD17, RAD9A, RB1, RBBP8, TP53, WEE1으로 구성된 군으로부터 선택된 하나 이상
WNT 신호 경로(WNT Signaling Pathways) APC, AXIN1, AXIN2, CSNK1A1, CTBP1, CTNNB1, CTNNBIP1, ICAT, DKK1, DKK3, DVL1, DVL2, EP300, FRAT1, FZD1, FZD2, FZD3, FZD4, FZD5, FZD6, FZD7, FZD8, FZD9, GSK3B, LEF1, LRP5, LRP6, NKD1, PORCN, RUVBL1, SFRP1, SFRP4, SKP2, SOX17, TCF7, TCF7L1, WIF1, WNT1, WNT10A, WNT2, WNT2B, WNT3, WNT3A, WNT4, WNT6, WNT7A, WNT7B, WNT8A., DAAM1, MAPK8, JNK1, PRICKLE1, RHOA, VANGL2, WNT9A., NFATC1, WNT11, WNT5A, WNT5B 및 WNT8A으로 구성된 군으로부터 선택된 하나 이상
헷지도그 신호 경로(Hedgehog Signaling Pathway) BOC, CDON, DHH, GAS1, HHIP, IHH, SHH, LRP2, PTCH1, PTCH2, PTCHD1, PTCHD2, PTCHD3, RAB23, SMO, DISP1, DISP2, FGF9, FKBP8, HHAT, IFT52, KCTD11, OTX2, NPC1, BCL2, BMP2, BMP4, BMP5, BMP6, BMP7, BMP8B, MTSS1, WNT1, WNT10A, WNT10B, WNT11, WNT16, WNT2, WNT2B, WNT3, WNT3A, WNT4, WNT5A, WNT5B, WNT6, WNT7A, WNT7B, WNT8A, WNT8B, WNT9A, WNT9B, VEGFA, BTRC, CSNK1A1, CSNK1E, FBXW11, GLI1, GLI2, GLI3, GSK3B, PRKACA, PRKACB, STK36, SUFU, ZIC1, ZIC2 및 HPE5으로 구성된 군으로부터 선택된 하나 이상
전사 인자(Transcription Factors) CTNNB1, ESR1, ERa, FOXC2, GSC, NOTCH1, GEMIN2, SMAD2, SNAI2, SNAI3, SOX10, STAT3, TCF3, TCF4, TWIST1, ZEB1, ZEB2, NFKB1, NFKB2, REL, RELA, RELB, CBFA2T3, CLOCK, CREBBP, CBP, EGR3, FOXC1, FOXD3, FOXF1, HEY1, HEY2, HEYL, JUN, MSC, MYF5, PAX6, PBX1, RBPJ, RBPJL, RUNX1, AML1, RUNX2, SOX9, TCF15, GLI1, SMAD1, SMAD3, SMAD4, SMAD5, CEBPB, FOSL, FRA-11, FOXP3, GATA3, GATA4, HOXA10, HOXA3, ID2, IRF4, IRF8, MAF, NFATC1, NFATC2, NR4A1, NR4A3, POU2F2, RORA, RORC, RUNX3, STAT1, STAT4, STAT6, TOX, ZBTB7B., AR, ATF3, ATF4, BACH1, BHLHE40, CREB1, FOS, GTF2I, KLF10, MBD1, MSX2, MYC, MYOD1, NFIB, PPARA, RARA, SOX4, SREBF2, E2F4, EP300, ID1, ID3, RBL1, SMAD6, SP1, AHR, CDKN2A, p16INK4, CEBPD, EGR1, ETS2, FOSL1, FRA-1, KLF5, GCBoxBP, NANOG, PITX2, POU5F1, OCT4, PPARD, SIX1, SOX2, T, Brachyury, LEF1, TCF7, TCF7L1 및 TCF7L2으로 구성된 군으로부터 선택된 하나 이상
세포 접착 분자(Cell Adhesion Molecules) CD44, CDH1, COL11A1, COL14A1, COL6A2, CTNND1, ICAM1, ITGA8, VCAM1, ADAMTS13, ITGA1, ITGA2, ITGA3, ITGA4, ITGA5, ITGA6, ITGA7, ITGAL, ITGAM, ITGAV, ITGB1, ITGB2, ITGB3, ITGB4, ITGB5, SGCE, SPP1, THBS3, CNTN1, COL12A1, COL15A1, COL16A1, COL5A1, COL6A1, COL7A1, COL8A1, VCAN, CTGF, CTNNA1, CTNNB1, CTNND2, FN1, KAL1, LAMA1, LAMA2, LAMA3, LAMB1, LAMB3, LAMC1, THBS1, THBS2, CLEC3B, TNC, VTN, HAS1, MMP14, MMP15, MMP16, NCAM1, PECAM1, SELE, SELL, SELP, SPG7, BMP1, BMPR1B, CDH11, COL2A1, EGFR, IHH, SOX9, TGFB1, TNF, TNFSF11, CD36, COL3A1, CSF1, MCSF, SMAD3, BGLAP, Osteocalcin 및 COMP으로 구성된 군으로부터 선택된 하나 이상
줄기 세포 유지에 중요한 신호 경로(Signaling Pathways Important for Stem Cell Maintenance) DLL1, DLL3, DTX1, DTX2, DVL1, EP300, KAT2A, HDAC2, JAG1, NOTCH1, NOTCH2, NUMB, ADAR, APC, AXIN1, BTRC, CCND1, FRAT1, FZD1, MYC, PPARD 및 WNT1으로 구성된 군으로부터 선택된 하나 이상
세포 기전(Cellular Mechanisms) CADM1, TSLC1, CDKN1A, p21CIP1/WAF1, CHST11, GATA6, IL6R, JUN, RARB, RYBP, SERPINB2, PAI-2, TNFRSF19, BMP2, CCND2, DHH, ESX1, G0S2, RASSF1, BMI1, PCGF4, CBX8, HMGN2, RBBP7, DKK1, EFNB1, EPHA4, EPHB3, FOXA2, HNF3B, GATA2, HAND1, HES1, IRX3, KLF4, OTX2, PDGFRA, PMP22, SALL1, SOX17, THPO, TRIM10, TRIM15, UCP1, WNT5A, CTSA, LOX, TIMP3, CDH11, CYP1B1, DGAT2, FAM65A, HS3ST1, HS6ST2, MGLL, MYO5B, NID2, NPTX1, THBD, TMEM66, USP3, VSNL1, CDC42EP1, CXCL16, ACKR3, DKK2, GAS6, HEY1, IGFBP1, IRS4, PRKCH, PRKG2, PTPRA, RASD1, SMOC2, TACSTD2 및 TCF7으로 구성된 군으로부터 선택된 하나 이상
줄기세포 특이 표지자(Stem Cell Specific Markers) APC, BGLAP, CD4, CD44, CDH1, CDH2, COL9A1, CTNNA1, CXCL12, NCAM1, AXIN1, CCNA2, CCND1, CCND2, CCNE1, CDK1, CDC42, EP300, FGF1, FGF2, FGF3, FGF4, MYC, NOTCH2, PARD6A, RB1, KAT2A, HDAC2, KAT8, KAT7, TERT, BMP1, BMP2, BMP3, GDF2, GDF3, IGF1, JAG1, DHH, DLL1, GJA1, GJB1, GJB2, NOTCH1, NUMB, ABCG2, ALDH1A1, ALDH2, FGFR1, HSPA9, NEUROG2, SOX1 및 SOX2으로 구성된 군으로부터 선택된 하나 이상
세포 분화(Cell Differentiation) ASCL1, NTF3, OLIG2, SOX2, BDNF, BMP2, BMP4, CDK5R1, CDK5RAP2, HES1, HEYL, MEF2C, NEUROD1, NEUROG1, NEUROG2, NOG, NRCAM, PAFAH1B1, PAX3, POU4F1, RTN4, HDAC4, MDK, NRG1, HGL, TENM1, PAX5, PAX6으로 구성된 군으로부터 선택된 하나 이상
지방생성조절(Adipogenesis Regulation) ADRB2, CDKN1A, CDKN1B, DDIT3, DLK1, FOXO1, HES1, LRP5, NCOR2, RUNX1T1, SHH, SIRT1, SIRT2, TAZ, TCF7L2, TSC22D3, VDR, WNT1, WNT3A, NCOA2, NR0B2, NR1H3, RB1, TWIST1, WNT10B, GATA2, GATA3, KLF2, KLF3, ACACB, AXIN1, CCND1, CDK4, CEBPB, CEBPD, DKK1, E2F1, FABP4, FASN, FGF1, FGF2, IRS2, JUN, LMNA, LPL, PPARG, RXRA, SFRP1, SFRP5, SLC2A4, GLUT4, WNT5B, BMP7, CREB1, DIO2, FOXC2, INSR, IRS1, MAPK14, NRF1, PPARA, PPARD, PPARGC1A, PGC-1a, PPARGC1B, PGC-1ß, PRDM16, SIRT3, SRC, UCP1, WNT5A, BMP2, BMP4, CEBPA, EGR2, FGF10, KLF15, KLF4 및 SREBF1으로 구성된 군으로부터 선택된 하나 이상
세포 극성(Cell Polarity) CRB1, CRB2, CRB3, DCHS1, DCHS2, FAT1, FAT2, FAT3, FAT4, LATS1, LATS2, MST1, SCRIB, STK3, STK4, GPC5, HMCN1, POTEF, TAOK1, TAOK2, TAOK3, TJP1, TJP2, MPDZ, MPP5, NPHP4, PARD3 및 PARD6G으로 구성된 군으로부터 선택된 하나 이상
JAK/STAT 신호전달(JAK/STAT Signaling) JAK1, JAK2, JAK3, TYK2, CSF1R, EGFR, EPOR, F2R, GHR, IFNAR1, IFNGR1, IL10RA, IL2RA, IL2RG, IL4R, IL6ST, INSR, MPL, PDGFRA, SH2B1, PIAS1, PIAS2, PIAS3, PRL, PTPN1, PTPRC, SOCS1, SOCS2, SOCS3, SOCS4, SOCS5, CRK, GRB2, SRC, STAM, STAT1, STAT2, STAT3, STAT4, STAT5A, STAT5B 및 STAT6으로 구성된 군으로부터 선택된 하나 이상
배자 발달(Embryonic Development) CDX2, DLX1, DLX2, FOXA2, GATA6, GLI2, HAND1, HOXA11, HOXA2, HOXA3, HOXA7, HOXA9, HOXA10, HOXB1, HOXB3, HOXB5, HOXB8, HOXC10, HOXC4, HOXC5, HOXC6, HOXC9, HOXD1, HOXD10, HOXD4, KLF4, LMX1B, MSX2, NANOG, NEUROD1, NOTCH2, PAX1, SIX2, SMAD2, SOX2, SP1, TBX5, TDGF1, ZFPM2 및 ZIC1으로 구성된 군으로부터 선택된 하나 이상
다분화능(Pluripotency) KLF4, LIN28A, MYC, NANOG, POU5F1, SOX2, AICDA, CCNA2, CDC42, CDK1, CDC2, DPPA2, DPPA3, DPPA4, DPPA5, FGF2, bFGF, HSPA9, MYBL2, NR5A2, NR6A1, OTX2, RIF1, SCN1A, SOX15 및 TCL1A, ZFP42으로 구성된 군으로부터 선택된 하나 이상
스트레스 반응(Stress Response) ADM, AKT1, BCL2L1, BCL-X, BIRC2, c-IAP2, CCND1, CDKN1A, p21CIP1/WAF1, GADD45B, IFNG, IL1A, IL1B, MAP2K6, MEK6, NQO1, PDGFB, PLAU, uPA, SOD2, TNF, TP53 및 XIAP으로 구성된 군으로부터 선택된 하나 이상
PI3K/AKT 경로(PI3K/AKT Signaling) ALK, BCL2, BTK, CCND1, CCR1, CD2, CD4, CD40, TNFRSF5, CD40LG, TNFSF5, CSF3, GCSF, CXCR4, HSP90AA1, IL2, IL6, MTOR, PTK2, SYK, TGFB1, TIMP2, TIMP3, TNFRSF1B, TNFSF13B 및 TP53으로 구성된 군으로부터 선택된 하나 이상
세포골격조절제(Cytoskeleton Regulators) ACTN1, ACTN2, ACTN3, ACTN4, ANAPC1, BAIAP2, CDC27, EXOC2, FARP2, FLNA, FLNB, LMO7, MAPRE1, MAPRE2, NME1, PARD3, SORBS1, SSX2IP, TLN1, TLN2, VCL, WAS, WASF1, WASL 및 ZYX으로 구성된 군으로부터 선택된 하나 이상
신호전달(Signal Transduction) ILK, NPM1, PDK1, PPP2R4, PTEN, ADORA1, ADORA2A, CHRM2, CXCL1, DRD2, APP, ASCL1, DLL1, HES1, HEY1, HEY2, HEYL, NOTCH1, NOTCH2, NRG1, HGL, BMP2, BMP4, BMP8B, TGFB1, DVL3, NDP, SHH, CREBBP, CBP, DTX1, FOXC1, HES7, JAG1, LFNG, NOTCH3, RBPJ, RBPJL, SNW1, SKIIP, CCND1, DKK1, FRZB, FRP-3, FZD5, WISP1, WNT4, WNT5A, WNT6, CD38, DCX, EFNB1, EPO, FGF8, KLF4, LEFTY1, PLAT, RARRES3, RET, TGFB2, WNT8A, GLI2, HMOX1, IL10, MAP3K7, TAK1, NFKBIA, IkBa/MAD3, RHOA, TNFSF10, TRAIL, ACVR1, ALK2, ACVRL1, ALK1, E2F4, ENG, EVI-1, EP300, ID1, ID2, ID3, MSX2, RBL1, SMAD1, SMAD3, SMAD5, SMAD6, SP1, TGFBR2, THBS1, CTNNB1, SMO, PTCH1, FST, GDF5, CDMP-1, TGFB3, AXIN2, BTRC, b-TrCP, FGF9, FZD7, LEF1, LRP1, PPAP2B, SFRP2, TLE1, WISP2, WNT3A 및 WNT9A으로 구성된 군으로부터 선택된 하나 이상
골격발달(Skeletal Development) ALX4, DLX3, DLX5, DLX6, EN1, HOXD13, MSX1, MSX2, PITX1, SHOX, SHOX2, BMP1, BMPR1B, COL2A1, SOX9, ACVR1, AHSG, BGLAP, Osteocalcin, BMP2, BMP3, BMP4, BMP5, BMP6, BMP7, BMPR1A, BMPR2, CDH11, CHRD, COL1A1, CSF1, MCSF, CTSK, EGFR, FGF2, bFGF, FGFR2, GDF10, BMP3B, GLI1, IGF1, IGF1R, IGF2, IHH, MMP2, MMP8, MMP9, NOG, RUNX2, SMAD1, SMAD3, SP7, SPP1, Osteopontin, TGFB1, TGFB2, TGFB3, TNFSF11, TWIST1, TNF, ALPL, COMP, FGFR1, TGFBR1 및 TGFBR2으로 구성된 군으로부터 선택된 하나 이상
삼흉복합체(Trithorax Complexes) ARID1B, KMT2B, SMARCA4, SMARCA5, SMARCC1, ARID1A, ASH2L, CXXC1, HLTF, KMT2D, KMT2C, PBRM1, RBBP4, RBBP5, RBBP7, SMARCA1, SMARCA2, SMARCB1, SMARCC2 및 WDR5으로 구성된 군으로부터 선택된 하나 이상
세포부착(Cell Adhesion) BCL2, CADM1, TSLC1, CCR1, CD2, CD22, CD34, CD4, CD40LG, TNFSF5, CD47, CD8A, CDH1, E-Cadherin, CDH13, DLC1, F8, IL2, NCAM1, PTPRC, SRC, SYK, TNF, DLL1, EFNB1, NRCAM, NRP1, NRP2, RAC1, ROBO1, SLIT2 및 TNR으로 구성된 군으로부터 선택된 하나 이상
SMAD표적유전자(SMAD Target Genes) BGLAP, Osteocalcin, ID1, ID2, JUNB, SOX4, STAT1, BAMBI, BMPER, CDKN2B, p15INK2B, CHRD, ENG, Evi-1, NOG, PLAU, uPA, SMURF1, ATF4, CDKN1A, p21WAF1/p21CIP1, CDKN1B, p27KIP1, COL1A1, COL1A2, DCN, EMP1, GADD45B, GSC, HERPUD1, IFRD1, IGF1, IGFBP3, IL6, MYC, PDGFB, SERPINE1, PAI-1, TGFB1I1, TNFSF10, TGFBI 및 TGIF1으로 구성된 군으로부터 선택된 하나 이상
유도만능줄기세포(Induced Pluripotent Stem Cells)
또는
DNMT3B, PODXL, ZFP42, ACTC1, ALDH1A1, ALDH2, APC, BGLAP, BMP2, BRIX1, BXDC2, CCNE1, CD9, CDH2, COL2A1, COL9A1, EP300, FGF4, FGFR1, FOXD3, GABRB3, GJA1, GRB7, HDAC2, KAT2A, KAT7, KAT8, LEFTY1, LEFTY2, NODAL, PARD6A, REST, RUNX2, TERT, ESRRB, LIN28A, NANOG, MYCN, NR5A2, AICDA, TP53, UTF1, KLF4, MYC, POU5F1 및 Oct3/4, SOX2으로 구성된 군으로부터 선택된 하나 이상
줄기세포분화마커(Stem Cell Differentiation Markers) ACTC1, ASCL2, FOXA2, PDX1, IPF1, ISL1, KRT15, MSX1, MYOD1, T, CD3D, CD4, CD8A, CD8B, MME, ACAN, AGC1, ALPI, BGLAP, COL1A1, COL2A1, COL9A1, PPARG, CD44, NCAM1, SIGMAR1 및 S100B, TUBB3으로 구성된 군으로부터 선택된 하나 이상의 유전자
상기 유전자의 변이는 체세포 변이(somatic variation)일 수 있다. 구체적으로, 상기 유전자의 변이는 체세포 미스센스 SNVs(Somatic missense Single Nucleotide Variants)일 수 있다.
본 명세서에서 사용된 용어 "체세포 변이(somatic variation)"는 생식 세포가 있는 다세포 유기체의 체세포 DNA 서열의 변화로서, 생식 세포 이외의 세포에서 발생하는 모든 돌연변이를 의미한다. 유기체의 후손에게 유전될 수 있는 생식계열 돌연변이와 달리, 체세포 돌연변이는 일반적으로 후손에게 전달되지 않는다. 이때, 체세포 돌연변이는 암을 유발하는 것일 수 있다.
상기 체세포 변이는 체세포 SNVs(Somatic Single Nucleotide Variants)일 수 있다. 본 명세서에서 사용된 용어 "체세포 SNVs(Somatic Single Nucleotide Variants)"는, 체세포에서 발생된 단일 뉴클레오티드 변이체로서, 핵산 서열에서 하나의 뉴클레오티드의 차이를 보이는 유전적 변화 또는 변이를 말한다. 집단에서 1% 이상의 빈도를 요구하는 단일 염기 다형성(single nucleotide polymorphism, SNP)과는 달리, 특정 빈도가 요구되지 않는다.
SNV는 단일염기다형성(single nucleotide polymorphism, SNP)과 점돌연변이(point mutation)을 포함한다. 빈도에 제한이 없으며 체세포에서 발생할 수 있다. 단일염기다형성은 여러 사람의 유전체의 같은 위치에서 특정 염기서열 하나가 다른 염기로 변화되어 다른 형질로 표현되는 것을 의미하며, 인간 유전체 상에 가장 많이 존재하는 형태의 유전자 변이이다. 단일염기다형성은 일반적으로 집단의 1% 이상의 빈도로 나타나며, 1% 이하일 경우는 돌연변이라고 분류한다. 점돌연변이는 하나의 염기서열이 치환, 삽입 또는 결실되어 나타나며 특정 단백질의 생성을 막거나 변형시킬 수 있다.
SNV는 아미노산 서열 변이의 유무에 따라 아미노산의 서열 변이를 일으키지 않는 synonymous SNV(sSNV)와 아미노산의 서열 변이를 일으키는 nonsynonymous SNV(nsSNV)로 분류된다. 단일염기변이 중 Indel의 경우 치환보다 더 심각한 변이를 유발할 수 있다. indel의 경우 아미노산 염기서열 배열의 격자이동(frame shift)이 유발되어 SNV 뒤에 번역되는 아미노산이 바뀌게 된다.
유전체상에 존재하는 위치에 따라 암호화하는 exon 부위에 존재하는 SNV를 coding SNV(cSNV)라 하고, intron, 5'과 3' 말단 비전사지역(5' and 3' untranslated region; UTR)과 같은 비암호화 부위에 존재하는 SNV를 non-coding SNV(ncSNV)라 한다.
일 구체예에 있어서, 상기 유전자 변이는 nonsynonymous SNV일 수 있다. 구체적으로, nonsynonymous SNV의 일종인 체세포 미스센스 SNVs(Somatic missense Single Nucleotide Variants)일 수 있다.
일 구체예에 있어서, 상기 변이를 검출하는 단계는 대상 줄기세포의 유전체 정보에서 유전자 복제수 변이의 발생 여부를 판단하는 단계를 추가적으로 포함하는 것일 수 있다. 이때, 대상 줄기세포의 유전자가, 계대배양되지 않은 줄기세포의 유전자와 비교하여 유전자 복제수 변이(Copy number variation, CNV)가 증가하였다면, 대상 줄기세포의 유전적 안정성이 떨어지는 것일 수 있다.
일 구체예에 있어서, 상기 변이를 검출하는 단계는 상기 유전체 정보에서 한 개 이상의 유전자의 변이가 검출되고, 유전자 복제수 변이가 발생하였다면, 대상 줄기세포의 유전적 불안정성을 판단하는 단계를 포함하는 것일 수 있다.
본 명세서에서 용어, "유전자 복제수 변이(Copy number variation, CNV)"는 유전자의 일정 섹션의 반복이 개체마다 다른 현상을 의미한다. 상기 반복은 0배 내지 n배로 반복될 수 있다. 0배로 반복되는 경우, 해당 유전자의 기능이 상실되며, 2배 초과로 반복되는 경우 해당 유전자의 기능이 증폭되는 것이 일반적이다.
상기 유전자 복제수 변이는, 계대배양되지 않은 정상 줄기세포와 비교하여 유전자의 증폭이 존재하는 것일 수 있다. 유전자 복제수 변이 또는 유전자 증폭이 존재하면, 대상 줄기세포의 불안정성이 높다고 판단할 수 있다.
본 발명의 일 실시예에서, 계대배양이 다수 이루어진 실험군(P3 내지 P4)이 계대배양되지 않거나, 계대배양이 덜 된 실험군보다 체세포 변이의 발생 정도가 적었으며, 특히 계대배양이 다수 이루어진 실험군(P3 내지 P4)은 체세포 미스센스 SNV 또는 유전자 복제수 변이가 많이 일어나는 것을 확인하였다. 특히, 상기 유전자 복제수 변이는 계대배양된 줄기세포의 17번 또는 20번 염색체에서 다수 발견되었다(도 4 및 5). 특히, 도 5에 따르면 17번 염색체에서 발견되었다.
이때, 상기 유전자 복제수 변이 또는 유전자 증폭은 COSMIC 데이터베이스 Tier 1 리스트 중 하나 이상의 유전자에서 발생한 것일 수 있다. COSMIC 데이터베이스 Tier 1 리스트 유전자는 상기와 동일하다. COSMIC 데이터베이스 Tier 1 리스트 유전자 중 유전자 복제수 변이 또는 유전자 증폭이 존재하면, 대상 불안정성이 높을 뿐 아니라, 줄기세포의 종양원성이 높다고 판단할 수 있다.
따라서, 상기 유전자 변이 또는 유전자 복제수 변이는 대상 줄기세포의 체세포의 DNA 시퀀싱 분석을 통해 검출할 수 있다. 일 구체예에 있어서, 상기 DNA 시퀀싱 분석은 차세대 염기서열 분석(Next generation sequencing, NGS)일 수 있다.
본 명세서에서 사용된 용어 "차세대 염기서열 분석(Next generation sequencing, NGS)"은 유전체의 염기서열의 고속 분석 방법으로, 기존의 생어 염기서열 분석(Sanger sequencing)과 달리 많은 수백만 개 이상의 DNA 조각을 병렬로 처리하는 데 특징이 있다. 예를 들어, 상기 NGS는 패널 시퀀싱(panel sequencing), 엑솜 시퀀싱(exome sequencing) 또는 전장 게놈 시퀀싱(whole genome sequencing, WGS)일 수 있다. 구체적으로, 전장 게놈 시퀀싱(whole genome sequencing, WGS)일 수 있다.
본 명세서에서 사용된 용어 "전장 게놈 시퀀싱(whole genome sequencing, WGS)"은 유기체 게놈의 DNA 서열 전체를 분석하는 DNA 시퀀싱의 일종이다. 예를 들어, 상기 전장 게놈 시퀀싱은 Illumina NovaSeq 6000 플랫폼을 이용하는 것일 수 있으며, 150-bp paired-end 시퀀싱일 수 있다.
상술하였듯, 상기 정보 제공 방법은 대상 줄기세포의 유전체 정보에서 특정 유전자의 변이가 검출되는 경우, 대상 줄기세포의 유전성 안정성이 떨어지는 상태라고 판단하는 단계를 추가적으로 포함할 수 있다.
일 구체예에 있어서, 상기 방법은 TP53의 변이, TP53과 관련성이 있는 유전자의 변이, 세포분화와 관련된 유전자 변이 또는 COSMIC 데이터베이스 Tier 1 리스트 유전자의 변이를 한 개 이상 가지고 있는 대상 줄기세포의 경우 유전성 안정성이 낮다고 판단하는 단계를 추가적으로 포함할 수 있다.
이때, 상기 판단하는 단계는 각 유전자 변이 발생 여부에 따라 점수화를 진행하는 단계일 수도 있다. 구체적으로, 상기 유전체 정보에 각 변이가 존재할 경우, '1'로, 발생하지 않을 경우 '0'으로 코드화를 진행하고, 특정 수학식으로 이용해 0 내지 1의 값으로 점수화를 진행하는 것일 수 있다.
구체적으로, 상기 점수화는 하기 수학식 1 내지 7에 의한 것일 수 있다.
수학식 1에서 Ref와 Alt는 각각 정상 유전자 아미노산과 missense 돌연변이로 변환된 아미노산을 의미한다. BLOSUM100은 정규 아미노산에 대한 자연계 내의 치환비율을 Log-odds로 나타낸 20-by-20 테이블로, 여기에서 Ref와 Alt에 따른 Log-odds값을 수득할 수 있었다. 한편, I(x)는 지시함수(indicator function)를 의미하며 BLOSUM100에서 Ref와 Alt가 기대치보다 빈번하게 발생하는 값인 0 이상일 때는 해당 값을 0으로 바꾸게 하였다. 이를 통해 B는 음수값들의 합산으로 산출된다.
한편, 앞의 가설을 따르지 않는 돌연변이로는 TP53-R135H 등이 있었다. 따라서, 이의 R과 H는 전하적으로 중성이며 약 41%의 확률로 일어날 수 있음을 확인하였다. 따라서, 이를 보완하기 위해 해당 돌연변이가 hotspot mutation일 가능성을 추가했다. 따라서, 추가적으로 점수체계는 Genome Medicine에 Gao et al., 2017가 발표한 논문에서 계산된 p-value값을 사용하였다. 이를 log2-scale로 변환하여 Gao가 정의한 리스트에 해당 돌연변이가 있을 경우 log2(p-value)값을 합산하여 Hotspot score(H-score)로 도출하였다. 이러한 수식은 수학식 2로 나타내었다. 수식에서 변수 K는 Gao논문에서 정의한 hotspot 단백질 위치를 의미하며 는 K의 p-value값을 의미한다.
도 8a 및 b에 나타낸 것과 같이, 샘플 a의 TP53-linked gene의 돌연변이 점수는 B-score(Ba)와 H-score(Ha)를 합산한 후 절대값을 hyperbolic tangent 함수(tanh)에 넣어 0에서 1까지의 값으로 표준화된 점수로 산출되게 만들었다. 최종적으로 산출되는 식은 수학식 3으로 나타내었다.
상기의 결과를 통해 CNV가 증가한 유전자들과 COSMIC tier1 유전자와의 관련성을 평가하기 위해, COSMIC tier1 500여개 유전자를 선별하였다. 다음으로, TP53 관련 유전자를 산출할 때와 동일한 수학식 1에 넣어 샘플 별로 값을 얻었다. 배양 중인 줄기세포에서 발생한 CNV에 위치한 유전자들이 얼만큼 COSMIC 유전자(CG)들과 밀접한 관련이 있는지 정량하기 위해 STRING DB v11.5에서 confidence score 0.4이상인 네트워크를 사용하였다. 구체적으로, 도 9a 및 b에 나타낸 것과 같이, 이 네트워크에서 CNV 발생 지점의 개별 유전자(CNV-gene)들과 직접적인 상호작용을 하는 first-neighbor gene(FNG)들을 찾아낸 후 얼만큼 COSMIC tier1 유전자가 겹치는지 Recall값을 산출하였다. 이때, 산출된 결과는 수학식 4에 나타내었다. 수식에서 는 FNG와 CG간의 교집합 유전자의 수를 의미하며, 는 CG의 전체수를 의미한다.
이후, 수학식 5와 같이 샘플 별로 CNV-증가 유전자들의 Recall값을 합산하였다(CS). 수학식 5의 변수 i는 샘플 a에서 유전자 복제 변이 (CNV)가 발생한 유전자들을 의미한다. 는 수학식 4를 통해 계산된 유전자 i의 Recall값을 의미한다. 산출된 샘플의 CS값은 CCLE에서 산출된 중앙값(median, MCCLE)과 중앙절대편차값(median-absolute deviation, MADCCLE)을 통해 robust Z-score로 산출되었다. 산출된 결과는 수학식 6로 나타내었다. 수학식 6에서 변수 는 샘플 a의 CS값을 의미하며 는 샘플 a의 robust-Z score를 의미한다.
다음으로, 해당 값을 정규분포 (ZtoP)에 넣어 0 내지 1의 값(CNVscore)으로 변환하였다. 이때, 변환된 결과는 수학식 7으로 나타내었다. MCCLE와 MADCCLE는 각각 수학식 5를 통해 찾아낸 CCLE데이터의 중앙값과 중앙값 절대 편차(median absolute deviation)를 의미한다.
수학식 7은 수학식 6을 통해 산출된 로버스트 Z-점수(robust Z-score)값을 확률(probability)로 변환하는 것을 의미한다. 여기서, 확률분포는 정규분포를 따른다고 가정하였다. 이를 통해 개별 샘플의 CNV점수를 0 내지 1로 표준화했다. 는 샘플 a의 CNV점수를 의미하며 는 샘플 a의 로버스트 Z-점수를 의미한다.
상기 판단하는 단계는 상기 수학식 1 내지 7로 구성된 군으로부터 선택된 수학식, 바람직하게는 수학식 1 내지 7을 이용함으로서, 효과적으로 대상 줄기세포의 유전적 안정성 정도를 점수화할 수 있다.
본 발명의 방법은 TP53, TP53 관련 유전자, COSMIC Tier 1 유전자, 세포 기능 관련 유전자 또는 이의 조합 변이가 어느 정도 발견되었는지 그 정도를 점수화하여, 효과적으로 줄기세포의 유전적 안정성에 대한 정보를 제공하는 것일 수 있다.
따라서, 본 발명의 방법에 따라 제공된 줄기세포의 안정성 정보는 기존 종래기술보다 정확도가 높아 안정성이 높고 종양원성이 낮은 줄기세포를 판단할 수 있다. 뿐만 아니라, 모든 결과 또는 점수를 전체적으로 판단할 경우, 사용자가 줄기세포의 안정성을 판단하는 데 도움을 줄 수 있다.
상기 방법은, 상기 유전자 변이 확인 및 유전체 내 CNV 발생 확인 정보를 일시에 제공하는 단계를 추가적으로 포함하는 것일 수 있다. 일 구체예에 있어서, 상기 방법은 정보를 일시에 제공하여, 사용자로부터 한번에 대상 줄기세포의 유전성 안정성을 판단할 수 있도록 한다. 이때, 정보는 막대 그래프 또는 방사형 그래프로 나타낼 수 있다.
본 발명의 일 양상은 TP53과 관련성이 있는 유전자의 변이, COSMIC 데이터베이스 Tier 1 리스트 유전자 변이 또는 이의 조합; 및 TP53 변이를 검출할 수 있는 제제를 포함하는 줄기세포 유전성 안정성 예측용 조성물을 제공한다.
상기 조성물은 대상 줄기세포의 유전체 정보에서 유전자 복제수 변이의 증폭 여부를 검출할 수 있는 조성물을 추가적으로 포함할 수 있다. 이때, TP53과 관련성이 있는 유전자의 변이, COSMIC 데이터베이스 Tier 1 리스트 유전자 변이 및 유전자 복제수 변이는 상술한 바와 같다.
일 구체예에 있어서, 상기 조성물은 ALPP, CD133, EPCAM, FOXD3, FUT4, KLF2, KLF5, LIN28A, NANOG, POU5F1, STAT3, UTF1, ZFP42, INHBA, BMP4, LIF, TGFB1, MYC, KLF4, SOX2, CREBBP, ING1, SMARCA4, VCP, AFF1, BRD4, PREX2, ERBB3 및 PTCH1으로 구성된 군으로부터 선택된 하나 이상의 유전자의 변이를 검출할 수 있는 제제를 포함할 수 있다.
상기 검출하는 제제는, 유전자를 증폭할 수 있는 제제를 포함하고, 상기 검출하는 제제는 유전자의 변이에 특이적으로 결합하는 프라이머, 프로브 또는 올리고뉴클레오티드일 수 있다.
본 명세서에서 사용된 용어, "프라이머(primer)"는 올리고뉴클레오타이드를 의미하는 것으로, 중합효소에 의한 뉴클레오티드의 중합반응에서 개시점이 되는 짧은 유전자 서열이다. 바람직하게는, 프라이머는 디옥시리보뉴클레오타이드이며 단일쇄이다. 프라이머는 자연 dNMP, 변형 뉴클레오타이드 또는 비-자연 뉴클레오타이드 또는 리보뉴클레오타이드를 포함할 수 있다. 상기 프라이머는 길이가 15 내지 30, 10 내지 약 30 또는 10 내지 약 20 연속 뉴클레오티드인 것일 수 있다.
본 명세서에서 사용된 용어, "프로브(probe)"는 특정 뉴클레오타이드 서열에 혼성화될 수 있는 디옥시리보뉴클레오타이드 및 리보뉴클레오타이드를 포함하는 모노머 또는 선형의 올리고머를 의미한다. 바람직하게는, 프로브는 혼성화에서의 최대 효율을 위하여 단일 가닥이다. 프로브는 바람직하게는 디옥시리보뉴클레오타이드이고, 표지 물질에 결합된 것일 수 있다. 상기 프로브는 길이가 약 50 내지 약 400, 약 100 내지 약 350, 약 150 내지 약 300 또는 약 200 내지 약 250 연속 뉴클레오티드일 수 있다.
본 명세서에서 사용된 용어, "올리고뉴클레오티드(oligonucleotide)"는 유전자 검사 또는 연구에 사용되는 짧은 DNA, RNA 분자 또는 올리고머이다. 상기 올리고뉴클레오티드는 사용자가 지정한 서열을 갖는 단일 가닥 분자일 수 있다.
상기 프라이머, 프로브, 또는 올리고뉴클레오티드는 상기 유전자 또는 유전자의 변이를 포함하는 서열에 완전하게 상보적인 서열을 포함할 수 있으나, 특이적 혼성화를 방해하지 않는 범위 내에서 실질적으로 상보적인 서열이 이용될 수도 있다.
본 발명의 다른 양상은 상기 조성물을 포함하는 줄기세포 유전성 안정성 예측용 키트를 제공한다.
상기 키트는 RT-PCR 키트 또는 DNA 칩 키트일 수 있고, 상기 키트는 중합 반응에 필요한 시약, 예를 들면 dNTP, 중합효소 및 발색제 등을 더 포함할 수 있다.
상기 키트는 해당 유전자를 증폭을 통해 확인하거나, 유전자의 변이 여부를 확인함으로써 줄기세포 배양적응성을 예측할 수 있다. 일 구체예에 있어서, 상기 유전자의 변이 여부를 확인하는 것일 수 있다. 또한 예를 들어, 유전자의 변이 여부를 확인하기 위한 키트는 RT-PCR을 수행하기 위해 필요한 필수 요소를 포함하는 키트일 수 있다. RT-PCR 키트는, 마커의 유전자에 대한 특이적인 각각의 프라이머 쌍 외에도 RT-PCR 키트는 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액(pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드(dNTPs), Taq-폴리머라아제 및 역전사효소와 같은 효소, DNase, RNAse 억제제, DEPC-수(DEPC-water), 멸균수 등을 포함할 수 있다. 또한 정량 대조군으로 사용되는 유전자에 특이적인 프라이머 쌍을 포함할 수 있다. 또한 바람직하게는, 상기 키트는 DNA 칩 키트일 수 있다.
본 발명의 다른 양상은 상기 조성물을 포함하는 줄기세포 유전성 안정성 예측용 마이크로어레이를 제공한다.
상기 마이크로어레이(microarray)는 기판 표면의 구분된 영역에 상기 폴리뉴클레오티드가 높은 밀도로 고정화되어 있는 것을 말한다. 상기 마이크로어레이는, 상기 영역이 예를 들면 400개/㎠ 이상, 103개/㎠ 이상, 또는 104개/㎠ 이상의 밀도로 기판 상에 배열되어 있는 것일 수 있다.
상기 마이크로어레이에 고정된 폴리뉴클레오티드는 DNA 또는 RNA일 수 있다. 상기 폴리뉴클레오티드는 단일 가닥 또는 이중 가닥일 수 있다. 상기 폴리뉴클레오티드는 천연 뉴클레오티드, 천연 뉴클레오티드의 유사체, 천연 뉴클레오티드의 당, 염기 또는 인산 부위가 변형되어 있는 뉴클레오티드, PNA(peptide nucleic acid), 및 이들의 조합을 포함할 수 있다. 또한, 형광성 물질과 같이, 검출가능한 표지가 3'-말단, 중간, 또는 5'-말단에 부착된 것일 수 있다.
상기 마이크로어레이에 고정되는 폴리뉴클레오티드는 길이가 약 5 내지 약 100, 약 10 내지 약 80, 약 10 내지 약 60, 약 10 내지 약 50, 약 10 내지 약 40, 약 10 내지 약 30, 또는 약 10 내지 약 20 개의 연속 뉴클레오티드일 수 있다.
상기 마이크로어레이 키트는, 유전자 또는 그의 단편에 해당하는 cDNA가 프로브로 부착되어 있는 기판을 포함하고 기판은 정량 대조구 유전자 또는 그의 단편에 해당하는 cDNA를 포함할 수 있으며, 본 발명의 마커를 이용하여 당업계에 서 통상적으로 사용되는 제조 방법에 의하여 용이하게 제조될 수 있다. 마이크로어레이를 제작하기 위해서, 상기 탐색된 마커를 탐침 DNA 분자로 이용하여 DNA 칩의 기판상에 고정화시키기 위해 파이조일렉트릭(piezoelectric) 방식을 이용한 마이크로피펫팅(micropipetting)법 또는 핀(pin) 형태의 스폿터(spotter)를 이용한 방법 등을 사용할 수 있다. 상기 마이크로어레이 칩의 기판은 아미노-실란(amino-silane), 폴리-L-라이신(poly-Llysine) 및 알데히드(aldehyde)로 이루어진 군에서 선택되는 활성기가 코팅될 수 있다. 또한, 상기 기판은 슬라이드 글래스, 플라스틱, 금속, 실리콘, 나일론 막 및 니트로셀룰로스 막(nitrocellulose membrane)으로 이루어진 군에서 선택되는 것일 수 있다.
본 발명의 다른 양상은, 계대배양된 대상 줄기세포의 유전체 분석 데이터를 수신하는 데이터 수신부(100);
상기 데이터 수신부를 통해 입력된 줄기세포의 유전체 데이터에서 특정 유전자의 변이, 유전자 복제수 변이 또는 이의 조합을 분석하는 데이터 분석부(200); 및
상기 데이터 분석부를 통해 분석된 변이 데이터로부터 대상 줄기세포의 유전적 안정성을 판단하는 판단부(300)를 포함하는 줄기세포 유전성 안정성 예측을 위한 정보를 제공하는 시스템을 제공한다.
상기 시스템은 상기 줄기세포의 안정성 예측을 위한 정보를 제공하는 방법을 구동하는 것으로, 상기에 설명된 용어 및 단계가 적용된다.
줄기세포의 배양적응성 예측 시스템은 데이터 수신부(100), 데이터 분석부(200), 배양적응성 판단부(300)를 포함한다(도 12).
데이터 수신부는 줄기세포의 체세포 변이 분석 데이터를 수신한다. 상기 데이터는 전장 게놈 시퀀싱 데이터 및 어레이 CGH 데이터를 포함한다.
상기 수신부는 유전성 안정성의 판단이 필요한 대상 줄기세포 및 계대배양되지 않은 대조군 줄기세포의 유전체 데이터를 모두 수신한다. 이때, 대상 줄기세포는 계대배양되거나 계대배양되었다고 예상되어 유전적 안정성의 판단이 필요한 줄기세포일 수 있다.
상기 수신부는 줄기세포의 체세포 미스센스 SNV 데이터 수신부를 포함할 수 있으며, 추가적으로 CNV 정보 수신부를 포함할 수 있다.
이때, 데이터 수신부는 유전체 분석 기기(110)를 추가적으로 포함할 수 있다. 상기 유전체 분석 기기는 줄기세포의 유전체를 분석한 전장 유전체 시퀀싱 데이터를 수득하며, 체세포 변이 검사부(120) 및 검사 결과 전송부(130)를 포함할 수 있다. 구체적으로, 상기 분석은 WGS에 의한 것일 수 있다.
따라서, 상기 수신된 체세포 변이 데이터는 줄기세포의 유전성 안정성과 관련성이 있는지를 판단하기 위해, 데이터 분석부(200)로 송부될 수 있다.
데이터 분석부(200)는 데이터 수신부에서 수신한 데이터에서 체세포 변이 데이터를 선별한다. 구체적으로, 상기 수신된 데이터인 체세포 변이 정보에서, 특정 유전자의 변이가 포함되는지 여부를 분석한다. 또한, 상기 선별은 계대배양되지 않은 대조군 줄기세포의 유전체 데이터와 비교하여 이루어질 수 있고, 수신된 데이터에서 관련성이 떨어지는 데이터를 제외하는 과정을 포함한다.
구체적으로 상기 선별은 도 13과 같이 이루어질 수 있다. 구체적으로, 수신된 유전체 데이터에서 TP53과 관련성이 있는 유전자의 변이, COSMIC 데이터베이스 Tier 1 리스트 유전자 변이 또는 이의 조합; 및 TP53 변이로 구성된 군으로부터 하나 이상의 유전자 변이가 있는지 확인한다. 또한, 수신된 유전체 데이터에서 유전체 내 CNV 증폭이 존재하는지 확인한다. 또한, 증폭이 일어난 유전자가 COSMIC 데이터베이스 Tier 1 리스트 유전자 인지 확인한다. 다음으로, 세포 분화 관련 유전자 변이 발생 빈도를 확인한다.
상기 선별된 체세포 변이 데이터는 판단부(300)로 송부된다.
배양적응성 판단부(300)는 상기 선별된 체세포 변이 데이터를 기반으로, 대상 줄기세포의 유전성 안정성 여부 또는 계대배양성 여부를 판단한다.
구체적으로, 상기 유전자 변이를 하나라도 포함하고, CNV의 증폭은 없다면 유전적 안정성이 낮다고 판단할 수 있다.
구체적으로, 상기 유전자 변이를 하나라도 포함하고, CNV 증폭이 존재한다면, 줄기세포의 유전적 안정성이 낮다고 판단할 수 있다.
구체적으로, 상기 유전자 변이를 하나라도 포함하고, COSMIC 데이터베이스 Tier 1 리스트 유전자 내 CNV 증폭이 존재한다면, 대상 줄기세포의 불안정성이 낮을 뿐 아니라, 줄기세포의 종양원성이 높다고 판단할 수 있다.
구체적으로, 상기 유전자 변이를 하나라도 포함하고, COSMIC 데이터베이스 Tier 1 리스트 유전자 내 CNV 증폭이 존재하고, 세포 분화 관련 유전자 변이 발생 빈도도 대조군(계대배양되지 않은 줄기세포보다) 높다면, 줄기세포의 유전적 안정성이 매우 낮을 뿐 아니라, 줄기세포의 종양원성이 높다고 판단할 수 있다.
상기 시스템은 추가적으로, 배양적응성 판단부(300)가 판단한 결과를 시각적 이미지로 나타내는 표시부(400)를 추가적으로 포함할 수 있다. 이때, 상기 표시부는 상기 결과를 일시에 나타내는 것일 수 있다. 일 구체예에 있어서, 상기 표시부는 결과를 막대 그래프 또는 방사형 그래프로 나타낼 수 있다.
상기 시스템은 추가적으로, 유전성 안정성이 있거나, 계대배양성이 적다고 판단된 대상 줄기세포를 제공하는 줄기세포 제공부(500)를 추가적으로 포함할 수 있다.
본 발명의 또 다른 양상은, 상기 방법 또는 시스템을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
본 명세서에 사용된 바와 같은 "부(Unit)", "...모듈(system)" 및 "...시스템(system)" 등의 용어는 마찬가지로 컴퓨터 관련 엔티티(Entity), 즉 하드웨어, 하드웨어 및 소프트웨어의 조합, 소프트웨어 또는 실행 시의 소프트웨어와 등가로 취급할 수 있다.
상기 방법, 시스템 또는 하기의 실시예는 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상기 방법에서 사용된 데이터의 구조는 컴퓨터로 읽을 수 있는 기록매체에 여러 수단을 통하여 기록될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.
본 발명의 줄기세포의 유전성 안정성 예측을 위한 정보 제공 방법에 따르면, 계대배양된 줄기세포의 유전적 안정성, 특히 종양원성 여부를 미리 탐색할 수 있어, 줄기세포의 품질을 효과적으로 평가할 수 있다.
도 1은 장기간 계대배양된 인간 배아 줄기세포의 실험군을 나타낸 도이다.
도 2은 전장 게놈 시퀀싱을 통한 배양적응 관련 줄기세포의 체세포 변이 및 유전자 복제수 변이 분석 과정을 나타낸 도이다.
도 3는 배양적응 배아줄기세포에서 체세포 미스센스 SNV 확인을 위한 대상 유전자 목록을 나타낸 이미지이다.
도 4는 전장 게놈 시퀀싱 및 어레이 CGH를 이용하여, H9-P3 및 H9-P4 실험군에서 유전자 복제수 변이를 나타낸 이미지이다.
도 5은 H9-P3 및 H9-P4 실험군의 TP53 유전자에서 체세포 미스센스 SNV를 나타낸 이미지이다.
도 6은 TP53 관련 유전자들(TP53-directly interacted, neighboring genes, 246개)를 나타낸 이미지이다.
도 7은 TP53 관련 유전자들에서 발생한 돌연변이의 정도를 평가하기 위한 점수화 체계를 나타낸 이미지이다.
도 8a은 TP53 관련 유전자들의 돌연변이 점수를 표준화한 수식을 나타낸 이미지이다.
도 8b는 TP53 관련 유전자들의 돌연변이 점수를 표준화하여 나타낸 이미지이다.
도 9a는 CNV가 증폭된 부분에 위치한 유전자들의 COSMIC 유전자들과의 연관성을 나타낸 도이다.
도 9b는 CNV가 증폭된 부분에 위치한 유전자들의 COSMIC 유전자들과의 연관성을 나타낸 그래프이다.
도 10은 세포분화와 관련된 기능 경로(functional pathways)에서 체세포 미스센스 SNV가 발생된 유전자들의 분포를 나타낸 도이다.
도 11은 줄기세포 유효성(Stemness) 마커에서 변이 확인, 유전체 내 CNV 발생 확인, 및 종양발생 가능성 평가 결과를 방사형 그래프로 시각화하여 나타낸 그래프이다.
도 12는 일 양상의 시스템의 모식도를 나타낸 도이다.
도 13은 일 양상의 시스템의 분석부의 선별 과정을 나타낸 도이다.
이하, 실시예를 통해 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 1. 계대배양된 줄기세포 DNA 시료 확보
1-1 계대배양된 줄기세포 시료 확보
본 발명의 계대배양 줄기세포는 서울대학교 약학대학 연구실에서 수득한 계대배양된 인간배아줄기세포 H9 4종(H9-P1, H9-P2, H9-P3 및 H9-P4)을 사용하였다. 상기 실험군 줄기세포의 배양 방법 및 특성은 문헌 Cho et al. (2018), Stem Cell Reports, 11(5):1244-1256; Selective Elimination of Culture-Adapted Human Embryonic Stem Cells with BH3 Mimetics을 참조한다.
구체적으로, 도 1에 나타낸 것과 같이, 44번 계대배양한 줄기세포를 H9-P1군으로(Passage no.44), 112번 계대배양한 줄기세포를 H9-P2군으로(Passage no.112), 230번 계대배양한 줄기세포를 H9-P3군으로(Passage no.230), 417번 계대배양한 줄기세포를 H9-P4군으로(Passage no.417)로 설정하여 계대배양 횟수별로 분류하여 실험군을 설정하였다. 상기 H9-P1, H9-P2, H9-P3, H9-P4 실험군은 계대배양 횟수가 증가함에 따라 유전체 구조의 이상, 테라토마 형성, 세포사멸 등의 표현형적 변화가 나타났다.
실시예 2. 전장 게놈 시퀀싱 수행
2-1 모델 시료의 전장 게놈 시퀀싱 수행
상기 실험군 별로 전장 게놈 시퀀싱(Whole-genome sequencing)을 수행하였다.
구체적으로, Illumina TruSeq DNA PCR-Free Sample Prep Kit을 이용하여 DNA를 분리, 정제 및 Validation하여 시퀀싱 라이브러리를 제작하였다. 이후, Illumina NovaSeq 6000 platform 상에서 150-bp paired-end sequencing을 수행하여 각 실험군 당 약 105.8 Gb의 시퀀싱 데이터를 생성하였다. 도 2에 나타낸 것과 같이, 전장 게놈 시퀀싱 데이터로부터 체세포 변이 분석 및 유전자 복제수 변이 분석을 수행하였다.
실시예 3. 체세포 변이 분석
도 2에 나타낸 것과 같이, 상기 실시예 2 시퀀싱 데이터로부터, 체세포 SNV(somatic single nucleotide variants, SNVs)와 관련된 데이터를 하기와 같은 단계로 선별하였다.
3-1 시퀀싱 데이터의 품질 체크
Fast QC(버전 0.11.7)를 이용하여 원시데이터의 품질을 체크하였다. Trimmomatic(버전 0.36)의 paired end 모드를 이용하여 원시데이터로부터 adaptor 및 low-quality sequences를 제거하여 high-quality reads(clean FASTQ 포맷으로 생성)을 도출하였다.
2-1 Read alignment
BWA(버전 0.7.17)를 이용하여 high-quality reads를 human reference genome(버전 GRCH37, GCA_000001405.1)에 맵핑하였다(raw BAM 파일 생성). 리드맵핑 후, GATK MarkDuplicates를 이용하여 PCR을 통해 생긴 duplication read를 제거하였다(deduplicated BAM을 생성). 또한 GATK BaseRecalibrator를 이용하여 PCR deduplicated reads로부터 misalignment된 bases의 quality score를 보정하였다(BQSR Applied BAM 생성).
3-1 Somatic SNV calling
GATK(버전 4.0.11.0)를 이용하여 변이에 대한 정보를 담고 있는 VCF(variant calling format) 파일을 도출하였고, Mutect2를 이용하여 최종 선별된 체세포 SNVs(somatic single nucleotide variants)를 calling하였다(pair sample VCF 생성; 이때, H9-P1 vs. H9-P2, H9-P1 vs. H9-P3, H9-P1 vs. H9-P4를 대조한 3 pairs의 VCF 파일 생성함). Gatk4CalculateContamination을 이용하여 오염된 변이의 비율 계산 및 제거를 하였다(filtered Mutect2 call 데이터 생성). SnpEff를 이용하여 상기 도출된 변이에 대해 주석을 추가하였다(annotated pair sample VCF 생성).
4-1 배양적응 somatic SNV 선별
‘특허 제10-2427600호 (줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법)'에 제시된 방법 전문을 적용하여, 줄기세포의 배양적응과 관련된 유효한 체세포 변이를 식별하기 위한 필터링을 진행하였다. 구체적인 필터링은 하기와 같은 방법으로 수행하였다.
가. Mapping quality control
변이들의 read mapping depth가 20X 이상(66% 이상의 맵핑율)으로 적용되었다. 이 단계는 전장 유전체 서열데이터에서 낮은 빈도로 발생하는 체세포 변이 발생의 선별의 정확도를 높이기 위해 처리되었다.
나. 체세포 변이의 에러가능성 제거
체세포 돌연변이의 genetic heterogeneity의 특성을 반영하고 변이의 정확도를 확보하기 위해, 변이들 중에서 이중대립염기를 가지는 biallelic SNVs이 선발되었다. 특히 선발된 SNVs은 heterogeneous reads이 최소 3개 이상으로 구성된 것으로 허용되었다 이것은, 낮은 빈도로 발생하는 체세포 변이 calling의 정확도를 높일 수 있었다. 만일, 변이 사이트에서 heterogeneous reads가 70% 이상으로 구성되었을 때 체세포 변이가 아닌 생식세포 변이(germline mutation)일 가능성이 있기 때문에, 이러한 경우는 제거되었다. Biallelic SNVs을 제외하고, 드노보 변이(de novo variants), 삽입 및 결실 변이(Insertion and Deletion, InDels), 성염색체인 X 및 Y 염색체에서 발생된 변이들은 제거되었다.
다. 대조군(H9-P1 샘플)에 내재된 체세포 변이로 인한 실험군(H9-P2, H9-P3, H9-P4)에서의 체세포 변이 결정의 혼동 가능성 배제
H9-P1은 대조군으로 설정되었다 할지라도 이미 44번의 계대배양 과정을 거쳤기 때문에 primary H9 줄기세포와 비교하여 H9-P1도 배양적응 관련 체세포 변이가 발생되었을 가능성이 높다고 볼 수 있고, 이로 인하여 실험군(H9-P2, H9-P3, H9-P4)에서 체세포 변이를 결정하는데 혼란을 줄 수 있다. 이를 위해, human reference genome(버전 GRCH37)과 H9-P1(대조군) 사이에서 확인된 heterogenous variants들을 제거하는 것이 필요하다. Heterogenous variants은 H9-P1이 가지고 있는 생식세포변이(germline mutation) 또는 44번의 계대배양에 따른 배양적응 체세포 변이일 수 있다.
다음으로, H9-P1과 human reference genome 사이의 비교에서 H9-P1에서 VAF(variant allele frequency)가 0이거나 동형접합성 형태의 변이를 보인 사이트들이 분석을 위해 허용되었고, 이들을 토대로 H9-P2, H9-P3, H9-P4에서 발생한 변이들은 허용 정보로서 선별되었다. 이때, VAF가 0인 것뿐만 아니라 heterogeneous read가 전혀 없는 변이들이 허용 정보로 간주되었다. 구체적으로, human reference genome 대비 H9-P1에서 변이 에러 발생 가능성을 추가로 제거하여 줄기세포의 배양적응 관련 체세포 SNVs를 최종 선별한 것이다.
이 분석을 위해, dbSNP 검색을 통한 비교 분석 단계를 수행할 경우, 주로 신규 SNVs의 확인은 가능하지만 배양적응에 따라 발생된 SNVs의 확인을 방해할 수 있다. 따라서, 시간 및 공간의 변화에 따른 배양적응의 결과로 생성된 변이를 예측하기 위하여, 선발된 체세포 SNVs은 dbSNP 검색을 통한 비교 분석은 배제되었다. 이 과정들은 in-house script에 의해 처리되었다.
그 결과, 도 3에 나타낸 것과 같이, 배양적응성이 생겨 유전적 안정성이 낮아진 배양적응 줄기세포와 관련된 체세포 변이를 도출할 수 있었다. 구체적으로, 줄기세포의 다능성(Pluripotency), 자가-재생성(self-renewal), 탈분화능(de-differentiation)에 관련된 마커를 도출하였다.
실시예 4. 유전자 복제수 변이 분석
도 2에 나타낸 것과 같이, 상기 실시예 3에서 생성된 각 샘플의 BQSR Applied BAM 파일(GATK BaseRecalibrator로부터 생성된 결과)과 함께 CNVkit(버전 1.1.0)를 이용하여 대조군과 실험군 사이의 CNVs(copy number variations, CNVs)를 예측하였다(H9-P1 vs H9-P2, H9-P1 vs H9-P3, H9-P1 vs H9-P4; 3 pairs의 'cns' 파일 생성).
실시예 5. 배양적응 배아줄기세포의 유전체 불안정성 분석 및 정량화
5-1 Stemness 마커에서 변이 확인
배양적응 배아줄기세포의 유전체 불안정성을 분석하기 위해, 상기 실시예 3에서 도출한 유전자들(도 3)에서 somatic missense SNVs 발생 유무를 확인하였다.
줄기세포의 다능성과 관련된 유전자로서, ALPP, CD133, EPCAM, FOXD3, FUT4, KLF2, KLF5, LIN28A, NANOG, POU5F1, STAT3, UTF1 및 ZFP42에서 체세포 미스센스 SNVs 발생 유무를 확인하였다. 줄기세포의 자가재생성을 위해 INHBA, BMP4, LIF 및 TGFB1에서 체세포 미스센스 SNVs 발생 유무를 확인하였다. 줄기세포의 탈분화능을 위해 MYC, KLF4, LIN28A, NANOG, POU5F1 및 SOX2에서 체세포 미스센스 SNVs 발생 유무를 확인하였다. 상기 유전자들의 1개 이상에 미스센스 SNV가 확인될 경우, 줄기세포의 유전체 불안정성 발생 가능성이 있는 것으로 판단하였다. 코드화를 위해, 체세포 미스센스 SNV 발생 시 '1'로, 미발생 시 '0'으로 평가하였다.
5-2 유전체 내 CNV 발생 확인
CNVkit를 이용하여 전장 게놈 시퀀싱 데이터로부터 CNV를 예측 시, 증폭(amplification) 수준이 배경(backgrounds, 대조군)와 비교하여 2배 이상인 유전체 지역(genomic regions)에 한하여 CNV의 증가가 있는 것으로 판단하였다. 만일, 증폭 수준이 1.5배 수준인 경우라 하더라도 array CGH 데이터와 교차분석을 통해 중복된 CNV signal을 확인할 경우는 positive CNV로 판단하였다.1개 이상의 CNV가 확인될 경우, 줄기세포의 유전체 불안정성 발생 가능성이 있는 것으로 판단하였다.
그 결과, 도 4에 나타낸 것과 같이, H9-P3 및 H9-P4에서 유전자 복제수(CNV) 증가가 있으며, 특히 P4군의 증가가 확인되었다. 코드화를 위해, Genome-wide CNV 발생 시 '1'로, 미발생 시 '0'으로 평가하였다.
실시예 6. 종양발생 가능성 평가
6-1 TP53 유전자의 체세포 미스센스 SNV 발생 확인
도 5에 나타낸 것과 같이, 장기 계대배양한 줄기세포의 유전자 중, TP53 유전자에 체세포 미스센스 SNVs 발생 유무를 확인하였다. 미스센스 SNV가 확인될 경우, 줄기세포의 유전체 불안정성 발생 가능성이 있는 것으로 판단할 수 있었다. 코드화를 위해, 체세포 미스센스 SNV 발생 시 '1'로, 미발생 시 '0'으로 평가하였다.
6-2. TP53 관련 유전자에서 체세포 미스센스 SNV 발생 확인
장기 계대배양한 줄기세포의 유전자 중, TP53과 직접적으로 상호작용하는 유전자들에서 체세포 미스센스 SNVs 발생 유무를 확인하였다. TP53과 직접적으로 상호작용하는 유전자들은 STRING 데이터베이스(버전 11.5)로부터 추출하였다. 유전자 추출 시, 유전자들의 상호작용이 실험적으로 증명된 경우를 파라미터로 적용하였고 0.4 이상의 confidence value를 cutoff 값으로 적용하였다. 그 결과, 도 6에 나타낸 것과 같이, TP53과 직접적으로 상호작용하는 246개의 유전자들을 선발하였다(TP53-directly interacted genes에 해당).
TP53 관련 유전자에서 발생한 돌연변이의 정도를 평가하기 위해 2가지 가설에 기반해 점수화 체계를 만들었다. 먼저, 도 7에 나타낸 것과 같이, 아미노산이 어떻게 바뀌는지가 돌연변이의 영향력과 관련되어 있다고 가정하였다. 예를 들어, 종양을 발생시키는 KRAS-G12D 돌연변이는 전하적으로 중성인 glycine이 음성인 aspartic acid로 변하는 돌연변이이며 BLOSUM100 수치에 따르면 이것은 자연계에서 대략 20% 정도의 확률로 일어난다. 따라서, 시퀀스 유사도가 100%인 것을 대상으로 하는게 맞기 때문에, BLOSUM100 매트릭스에서 missense mutation이 발생한 아미노산의 변화별 점수를 가져왔다. 빈번한 발생빈도를 갖는 경우 해당 유전자의 기능에 영향이 없을 것으로 가정하여 음수(negative)값을 갖는 아미노산 변화만 합산을 취하도록 하여 BLOSUM score(B-score)를 만들었다. 이러한 BLOSUM score는 상기 수학식 1과 같다.
수식 1에서 Ref와 Alt는 각각 정상 유전자 아미노산과 missense 돌연변이로 변환된 아미노산을 의미한다. BLOSUM100은 정규 아미노산에 대한 자연계 내의 치환비율을 Log-odds로 나타낸 20-by-20 테이블로, 여기에서 Ref와 Alt에 따른 Log-odds값을 수득할 수 있었다. 한편, I(x)는 지시함수(indicator function)를 의미하며 BLOSUM100에서 Ref와 Alt가 기대치보다 빈번하게 발생하는 값인 0 이상일 때는 해당 값을 0으로 바꾸게 하였다. 이를 통해 B는 음수값들의 합산으로 산출된다.
한편, 앞의 가설을 따르지 않는 돌연변이로는 TP53-R135H 등이 있었다. 따라서, 이의 R과 H는 전하적으로 중성이며 약 41%의 확률로 일어날 수 있음을 확인하였다. 따라서, 이를 보완하기 위해 해당 돌연변이가 hotspot mutation일 가능성을 추가했다. 따라서, 추가적으로 점수체계는 Genome Medicine에 Gao et al., 2017가 발표한 논문에서 계산된 p-value값을 사용하였다. 이를 log2-scale로 변환하여 Gao가 정의한 리스트에 해당 돌연변이가 있을 경우 log2(p-value)값을 합산하여 Hotspot score(H-score)로 도출하였다. 이러한 수식은 상기 수학식 2로 나타내었다.
최종적으로 도 8a 및 b에 나타낸 것과 같이, 샘플 a의 TP53-linked gene의 돌연변이 점수는 B-score(Ba)와 H-score(Ha)를 합산한 후 절대값을 hyperbolic tangent 함수(tanh)에 넣어 0에서 1까지의 값으로 표준화된 점수로 산출되게 만들었다. 최종적으로 산출되는 식은 상기 수학식 3으로 나타내었다. 수식에서 변수 K는 Gao논문에서 정의한 hotspot 단백질 위치를 의미하며 는 K의 p-value값을 의미한다.
6-3. CNV가 증가한 유전자들과 COSMIC tier1 유전자와의 관련성 확인
COSMIC tier1 500여개 유전자를 선별한 후 TP53 관련 유전자를 산출할 때와 동일한 수식 1에 넣어 샘플 별로 값을 얻었다.
배양 중인 줄기세포에서 발생한 CNV에 위치한 유전자들이 얼만큼 COSMIC 유전자(CG)들과 밀접한 관련이 있는지 정량하기 위해 STRING DB v11.5에서 confidence score 0.4이상인 네트워크를 사용하였다.
구체적으로, 도 9a 및 b에 나타낸 것과 같이, 상기에서 (4)의 결과를 통해 CNV가 증가한 유전자들과 COSMIC tier1 유전자와의 관련성을 평가하기 위해, COSMIC tier1 500여개 유전자를 선별하였다. 다음으로, TP53 관련 유전자를 산출할 때와 동일한 수학식 1에 넣어 샘플 별로 값을 얻었다. 배양 중인 줄기세포에서 발생한 CNV에 위치한 유전자들이 얼만큼 COSMIC 유전자(CG)들과 밀접한 관련이 있는지 정량하기 위해 STRING DB v11.5에서 confidence score 0.4이상인 네트워크를 사용하였다. 구체적으로, 도 9a 및 b에 나타낸 것과 같이, 이 네트워크에서 CNV 발생 지점의 개별 유전자(CNV-gene)들과 직접적인 상호작용을 하는 first-neighbor gene(FNG)들을 찾아낸 후 얼만큼 COSMIC tier1 유전자가 겹치는지 Recall값을 산출하였다.
이때, 산출된 결과는 상기 수학식 4에 나타내었다. 수학식에서 는 FNG와 CG간의 교집합 유전자의 수를 의미하며, 는 CG의 전체수를 의미한다.
이후, 상기수학식 5와 같이 샘플 별로 CNV-증가 유전자들의 Recall값을 합산하였다(CS). 수학식 5의 변수 i는 샘플 a에서 유전자 복제 변이 (CNV)가 발생한 유전자들을 의미한다. 는 상기수학식 4를 통해 계산된 유전자 i의 Recall값을 의미한다. 산출된 샘플의 CS값은 CCLE에서 산출된 중앙값(median, MCCLE)과 중앙절대편차값(median-absolute deviation, MADCCLE)을 통해 robust Z-score로 산출되었다.
산출된 결과는 상기수학식 6로 나타내었다. 상기수학식 6에서 변수 는 샘플 a의 CS값을 의미하며 는 샘플 a의 robust-Z score를 의미한다.
다음으로, 해당 값을 정규분포 (ZtoP)에 넣어 0~1의 값 (CNVscore)으로 변환하였다. 이때, 변환된 결과는 상기 수학식 7으로 나타내었다. MCCLE와 MADCCLE는 각각 수학식 5를 통해 찾아낸 CCLE데이터의 중앙값과 중앙값 절대 편차(median absolute deviation)를 의미한다.
상기 수학식 7은 상기 수학식 6을 통해 산출된 로버스트 Z-점수(robust Z-score)값을 확률(probability)로 변환하는 것을 의미한다. 여기서, 확률분포는 정규분포를 따른다고 가정하였다. 이를 통해 개별 샘플의 CNV점수를 0 내지 1로 표준화했다. 는 샘플 a의 CNV점수를 의미하며 는 샘플 a의 로버스트 Z-점수를 의미한다.
6-4 세포분화와 관련된 유전자들 대상으로 변이 검색
세포분화와 관련된 총 31개로 설정된 functional pathways(SABiosciences 데이터베이스를 참조하여 선발된 pathways임, 아래에 표기) 안에 존재하는 유전자들을 대상으로 체세포 미스센스 SNVs 발생 유무를 확인하였다. 변이가 발생된 유전자들의 개수를 조사하고 발생정도를 플롯으로 표현하였다.
도 10에 나타낸 것과 같이, 세포분화와 관련된 총 31개로 설정된 기능적 경로였고, 이 기능적 경로는 세포자살(Apoptosis), 노화 개시(Senescence Initiators), 세포 주기 조절(Regulation of Cell Cycle), TGFβ 수퍼패밀리 신호 전달 경로(TGFβ Superfamily Signaling Pathway), 세포 주기(Cell Cycle), 폴리콥 인자(Polycomb Cofactors), 발달 및 분화(Development & Differentiation), 세포 주기 사이클 체크포인트 및 세포 주기 정지(Cell Cycle Checkpoint and Cell Cycle Arrest), WNT 신호 경로(WNT Signaling Pathways), 헷지도그 신호 경로(Hedgehog Signaling Pathway), 전사 인자(Transcription Factors), 세포 접착 분자(Cell Adhesion Molecules), 줄기 세포 유지에 중요한 신호 경로(Signaling Pathways Important for Stem Cell Maintenance), 세포 기전(Cellular Mechanisms), 줄기세포 특이 표지자(Stem Cell Specific Markers), 세포 분화(Cell Differentiation), 지방생성조절(Adipogenesis Regulation), 세포 극성(Cell Polarity), JAK/STAT 신호전달(JAK/STAT Signaling), 배자 발달(Embryonic Development), 다분화능(Pluripotency), 스트레스 반응(Stress Response), PI3K/AKT 경로(PI3K/AKT Signaling), 세포골격조절제(Cytoskeleton Regulators), 신호전달(Signal Transduction), 골격발달(Skeletal Development), 삼흉복합체(Trithorax Complexes), 세포부착(Cell Adhesion), SMAD표적유전자(SMAD Target Genes), 유도만능줄기세포(Induced Pluripotent Stem Cells), 줄기세포분화마커(Stem Cell Differentiation Markers) 관련으로, 해당 카테고리의 유전자들을 포함하였다.
각 카테고리의 유전자 리스트는 상기 표 1에 나타낸 것과 같다.
6-5 유전체 불안정성 수준 시각화
본 발명의 줄기세포 배양적응성 판단 마커 및 이를 이용한 평가 방법은, 도 11 및 13에 나타낸 것과 같이, 위에서 언급된 '줄기세포 유효성(Stemness) 마커에서 변이 확인, 유전체 내 CNV 발생 확인, 및 종양발생 가능성 평가 결과를 방사형 그래프로 시각화하여, 효과적으로 판단대상 줄기세포의 유전체 불안정성 수준을 판단할 수 있었다.
100: 데이터 수신부
110: 유전체 분석 기기
120: 체세포 변이 검사부
130: 검사 결과 전송부
200: 데이터 분석부 300: 판단부
400: 표시부
500: 줄기세포 제공부

Claims (13)

  1. 대상 줄기세포의 유전체 정보를 준비하는 단계;
    상기 유전체 정보에서, TP53의 변이 및 TP53과 관련성이 있는 유전자의 변이를 검출하는 단계를 포함하는 줄기세포의 유전성 예측을 위한 정보를 제공하는 방법으로서,
    상기 TP53과 관련성이 있는 유전자는 ABL1, AGO1, AK6, APEX1, AR, ARID3A, ATF3, ATM, ATR, ATRX, AURKA, AURKB, AXIN1, BAG2, BAK1, BANP, BARD1, BAX, BBC3, BCL2, BCL2L1, BLM, BRCA1, BRCA2, BRD1, BRD7, BTRC, CARM1, CCNG1, CDK1, CDK2, CDK4, CDK5, CDK7, CDKN1A, CDKN2A, CHEK1, CHEK2, CHUK, COPS2, COPS4, COPS5, CREB1, CREBBP, CSNK1A1, CSNK1D, CSNK2A1, CSNK2A2, CSNK2B, CUL7, CUL9, DAXX, DDX5, DNAJA1, DNAJB1, DNMT1, DROSHA, DVL2, E2F1, E4F1, EEF2, EGR1, EHMT1, EIF2AK2, ELL, EP300, ERCC2, ERCC3, ESR1, ETS1, ETS2, FBXW7, FOXO3, GNL3, GSK3B, GTF2H1, HDAC1, HDAC2, HDAC3, HIF1A, HIPK2, HMGB1, HNF4A, HNRNPK, HSP90AA1, HSPA1A, HSPA1B, HSPA4, HSPA8, HSPA9, HSPB1, HUWE1, IFI16, IKBKB, ING1, ING4, ING5, KAT2A, KAT2B, KAT5, KAT6A, KAT8, KDM1A, L3MBTL1, LRRK2, MAPK1, MAPK14, MAPK3, MAPK8, MAPK9, MDM2, MDM4, MED1, MNAT1, MSH2, MTA1, MTA2, MTOR, NCL, NCOR1, NCOR2, NDN, NEDD8, NFKBIA, NFYA, NFYB, NPM1, NQO1, NR3C1, NR4A1, NUMB, OBSL1, OTUB1, OTUD5, PARP1, PBK, PCNA, PER2, PHB, PHF1, PIAS1, PIAS2, PIN1, PLK1, PLK3, PML, PPM1D, PPP1R13L, PPP2CA, PPP2R1A, PPP2R5C, PRKCD, PRKDC, PSMC3, PSMC5, PSMD4, PTEN, PTGS2, PTTG1, RAD23A, RAD51, RANBP2, RB1, RB1CC1, RBBP5, RCHY1, RELA, REV1, RFWD2, RNF20, RPA1, RPL11, RPL5, RPS27A, RPS3, RPS7, RRM2B, S100A2, S100A4, S100A6, S100B, SETD1A, SETD7, SFN, SIN3A, SIRT1, SMAD2, SMAD3, SMARCA4, SMARCC1, SMYD2, SNAI1, SOCS1, SP1, SQSTM1, STK11, STUB1, SUMO1, SYVN1, TADA3, TAF1, TAF6, TBP, TDG, TFDP1, TNFAIP3, TOP1, TOPBP1, TOPORS, TP53, TP53BP1, TP53BP2, TP53I3, TP53RK, TP63, TP73, TPT1, TRIM25, TRIM28, TRRAP, TWIST1, UBB, UBC, UBE2A, UBE2D1, UBE2I, UBE2K, UBE2N, UBE3A, UBE4B, UBR5, UCHL1, USP28, USP7, VCP, VRK1, WDR5, WRN, WT1, WWOX, XPO1, XRCC6, YBX1, YWHAE, YWHAZ, YY1 및 ZBTB17으로 이루어진 군으로부터 선택된 하나 이상의 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  2. 제1항에 있어서,
    상기 줄기세포의 유전성 안정성은 배양으로 인한 유전적 불안정성을 판단하는 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  3. 제2항에 있어서,
    상기 유전적 불안정성은 종양원성인 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  4. 삭제
  5. 제1항에 있어서,
    상기 변이를 검출하는 단계는 TP53의 변이, TP53과 관련성이 있는 유전자의 변이 및 하기 유전자 리스트 중 하나 이상의 유전자의 변이를 검출하는 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법으로서,
    상기 유전자 리스트는 ABI1, ABL1, ABL2, ACKR3, ACSL3, ACVR1, ACVR2A, AFDN, AFF1, AFF3, AFF4, AKT1, AKT2, ALK, AMER1, APC, AR, ARHGAP26, ARHGEF12, ARID1A, ARID1B, ARID2, ARNT, ASPSCR1, ASXL1, ATF1, ATIC, ATM, ATP1A1, ATP2B3, ATR, ATRX, AXIN1, AXIN2, B2M, BAP1, BARD1, BAX, BCL10, BCL11A, BCL11B, BCL2, BCL3, BCL6, BCL7A, BCL9, BCL9L, BCOR, BCORL1, BCR, BIRC3, BRAF, BRCA1, BRCA2, BRD3, BRD4, BTG1, BTK, CACNA1D, CALR, CAMTA1, CANT1, CARD11, CARS, CASP8, CBFA2T3, CBFB, CBL, CBLB, CBLC, CCDC6, CCNB1IP1, CCND1, CCND2, CCND3, CCNE1, CD274, CD74, CD79A, CD79B, CDC73, CDH1, CDH11, CDK12, CDK6, CDKN1B, CDKN2A, CDKN2C, CDX2, CEBPA, CHCHD7, CHD4, CIC, CIITA, CLIP1, CLTC, CLTCL1, CNBP, CNOT3, CNTRL, COL1A1, COL2A1, CREB1, CREB3L1, CREB3L2, CREBBP, CRLF2, CRTC1, CRTC3, CSF3R, CTCF, CTNNB1, CUX1, CXCR4, CYLD, DAXX, DCTN1, DDIT3, DDR2, DDX10, DDX3X, DDX5, DDX6, DEK, DICER1, DNAJB1, DNM2, DNMT3A, DROSHA, EBF1, EGFR, EIF3E, EIF4A2, ELF4, ELK4, ELL, EML4, EP300, EPAS1, EPS15, ERBB2, ERBB3, ERBB4, ERC1, ERG, ESR1, ETNK1, ETV1, ETV4, ETV5, ETV6, EWSR1, EZH2, EZR, FAS, FAT1, FAT4, FBXO11, FBXW7, FCGR2B, FCRL4, FES, FEV, FGFR1, FGFR1OP, FGFR2, FGFR3, FGFR4, FHIT, FIP1L1, FLI1, FLT3, FLT4, FOXA1, FOXL2, FOXO1, FOXO3, FOXO4, FOXP1, FSTL3, FUBP1, FUS, GAS7, GATA1, GATA2, GATA3, GNA11, GNAQ, GNAS, GOLGA5, GOPC, GPHN, GRIN2A, H3F3A, H3F3B, HERPUD1, HEY1, HIF1A, HIP1, HIST1H3B, HIST1H4I, HLA-A, HLF, HMGA1, HMGA2, HNF1A, HNRNPA2B1, HOOK3, HOXA11, HOXA13, HOXA9, HOXC11, HOXC13, HOXD11, HOXD13, HRAS, HSP90AA1, HSP90AB1, IDH1, IDH2, IGH, IGK, IGL, IKBKB, IKZF1, IL2, IL21R, IL6ST, IL7R, IRF4, IRS4, ITK, JAK1, JAK2, JAK3, JUN, KAT6A, KAT6B, KCNJ5, KDM5A, KDM5C, KDM6A, KDR, KDSR, KEAP1, KIF5B, KIT, KLF4, KLF6, KLK2, KMT2A, KMT2C, KMT2D, KNL1, KRAS, KTN1, LASP1, LATS1, LATS2, LCK, LEF1, LIFR, LMNA, LMO1, LMO2, LPP, LRIG3, LRP1B, LYL1, LZTR1, MAF, MAFB, MALT1, MAML2, MAP2K1, MAP2K2, MAP2K4, MAP3K1, MAP3K13, MAPK1, MAX, MDM4, MECOM, MED12, MEN1, MET, MITF, MLF1, MLH1, MLLT1, MLLT10, MLLT11, MLLT3, MLLT6, MN1, MPL, MRTFA, MSH2, MSH6, MSI2, MSN, MTCP1, MTOR, MUC1, MYB, MYC, MYCL, MYCN, MYD88, MYH11, MYH9, MYO5A, MYOD1, NAB2, NCOA1, NCOA2, NCOA4, NCOR1, NCOR2, NDRG1, NF1, NF2, NFATC2, NFE2L2, NFIB, NFKB2, NFKBIE, NIN, NKX2-1, NONO, NOTCH1, NOTCH2, NPM1, NR4A3, NRAS, NRG1, NSD1, NSD2, NSD3, NT5C2, NTRK1, NTRK3, NUMA1, NUP214, NUP98, NUTM1, NUTM2B, NUTM2D, OLIG2, P2RY8, PAFAH1B2, PATZ1, PAX3, PAX5, PAX7, PAX8, PBRM1, PBX1, PCM1, PDCD1LG2, PDE4DIP, PDGFB, PDGFRA, PDGFRB, PER1, PHF6, PHOX2B, PICALM, PIK3CA, PIK3CB, PIK3R1, PIM1, PLAG1, PLCG1, PML, POLD1, POLE, POLQ, POT1, POU2AF1, POU5F1, PPARG, PPFIBP1, PPM1D, PPP2R1A, PPP6C, PRCC, PRDM1, PRDM16, PREX2, PRKACA, PRKAR1A, PRRX1, PSIP1, PTCH1, PTEN, PTK6, PTPN11, PTPN13, PTPRB, PTPRC, PTPRK, PTPRT, QKI, RABEP1, RAC1, RAD21, RAD51B, RAF1, RANBP2, RAP1GDS1, RARA, RB1, RBM10, RBM15, REL, RET, RHOA, RHOH, RMI2, RNF213, RNF43, ROS1, RPL10, RPL22, RPL5, RPN1, RSPO2, RSPO3, RUNX1, RUNX1T1, SALL4, SDC4, SDHA, SET, SETBP1, SETD2, SF3B1, SFPQ, SFRP4, SH2B3, SH3GL1, SIX1, SLC34A2, SLC45A3, SMAD2, SMAD3, SMAD4, SMARCA4, SMARCB1, SMARCD1, SMO, SND1, SOCS1, SOX2, SPEN, SPOP, SRC, SRSF2, SRSF3, SS18, SS18L1, SSX1, SSX2, SSX4, STAG2, STAT3, STAT5B, STAT6, STIL, STK11, STRN, SUFU, SUZ12, SYK, TAF15, TAL1, TAL2, TBL1XR1, TBX3, TCEA1, TCF12, TCF3, TCF7L2, TCL1A, TENT5C, TERT, TET1, TET2, TFE3, TFEB, TFG, TGFBR2, TLX1, TLX3, TMPRSS2, TNFAIP3, TNFRSF14, TNFRSF17, TOP1, TP53, TP63, TPM3, TPM4, TPR, TRA, TRAF7, TRB, TRD, TRIM24, TRIM27, TRIM33, TRIP11, TRRAP, TSC1, TSC2, TSHR, U2AF1, UBR5, USP6, USP8, VHL, WDCP, WIF1, WT1, WWTR1, XPO1, YWHAE, ZBTB16, ZFHX3, ZMYM2, ZNF331, ZNF384, ZNF521, 및 ZRSR2으로 이루어진 군으로부터 선택된 하나 이상의 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  6. 제1항에 있어서,
    상기 유전자의 변이는 체세포 미스센스 SNVs(Somatic missense Single Nucleotide Variants)인 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  7. 제1항에 있어서,
    한 개 이상의 유전자의 변이가 검출되는 경우, 대상 줄기세포의 유전적 불안정성을 판단하는 단계를 추가적으로 포함하는 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  8. 제1항에 있어서,
    상기 방법은 상기 유전체 정보에서, 유전자 복제수 변이의 발생 여부를 판단하는 단계를 추가적으로 포함하는 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  9. 제8항에 있어서,
    상기 유전자 복제수 변이는 하기 유전자 리스트 중 하나 이상의 유전자에서 발생한 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법으로서,
    상기 유전자 리스트는 ABI1, ABL1, ABL2, ACKR3, ACSL3, ACVR1, ACVR2A, AFDN, AFF1, AFF3, AFF4, AKT1, AKT2, ALK, AMER1, APC, AR, ARHGAP26, ARHGEF12, ARID1A, ARID1B, ARID2, ARNT, ASPSCR1, ASXL1, ATF1, ATIC, ATM, ATP1A1, ATP2B3, ATR, ATRX, AXIN1, AXIN2, B2M, BAP1, BARD1, BAX, BCL10, BCL11A, BCL11B, BCL2, BCL3, BCL6, BCL7A, BCL9, BCL9L, BCOR, BCORL1, BCR, BIRC3, BRAF, BRCA1, BRCA2, BRD3, BRD4, BTG1, BTK, CACNA1D, CALR, CAMTA1, CANT1, CARD11, CARS, CASP8, CBFA2T3, CBFB, CBL, CBLB, CBLC, CCDC6, CCNB1IP1, CCND1, CCND2, CCND3, CCNE1, CD274, CD74, CD79A, CD79B, CDC73, CDH1, CDH11, CDK12, CDK6, CDKN1B, CDKN2A, CDKN2C, CDX2, CEBPA, CHCHD7, CHD4, CIC, CIITA, CLIP1, CLTC, CLTCL1, CNBP, CNOT3, CNTRL, COL1A1, COL2A1, CREB1, CREB3L1, CREB3L2, CREBBP, CRLF2, CRTC1, CRTC3, CSF3R, CTCF, CTNNB1, CUX1, CXCR4, CYLD, DAXX, DCTN1, DDIT3, DDR2, DDX10, DDX3X, DDX5, DDX6, DEK, DICER1, DNAJB1, DNM2, DNMT3A, DROSHA, EBF1, EGFR, EIF3E, EIF4A2, ELF4, ELK4, ELL, EML4, EP300, EPAS1, EPS15, ERBB2, ERBB3, ERBB4, ERC1, ERG, ESR1, ETNK1, ETV1, ETV4, ETV5, ETV6, EWSR1, EZH2, EZR, FAS, FAT1, FAT4, FBXO11, FBXW7, FCGR2B, FCRL4, FES, FEV, FGFR1, FGFR1OP, FGFR2, FGFR3, FGFR4, FHIT, FIP1L1, FLI1, FLT3, FLT4, FOXA1, FOXL2, FOXO1, FOXO3, FOXO4, FOXP1, FSTL3, FUBP1, FUS, GAS7, GATA1, GATA2, GATA3, GNA11, GNAQ, GNAS, GOLGA5, GOPC, GPHN, GRIN2A, H3F3A, H3F3B, HERPUD1, HEY1, HIF1A, HIP1, HIST1H3B, HIST1H4I, HLA-A, HLF, HMGA1, HMGA2, HNF1A, HNRNPA2B1, HOOK3, HOXA11, HOXA13, HOXA9, HOXC11, HOXC13, HOXD11, HOXD13, HRAS, HSP90AA1, HSP90AB1, IDH1, IDH2, IGH, IGK, IGL, IKBKB, IKZF1, IL2, IL21R, IL6ST, IL7R, IRF4, IRS4, ITK, JAK1, JAK2, JAK3, JUN, KAT6A, KAT6B, KCNJ5, KDM5A, KDM5C, KDM6A, KDR, KDSR, KEAP1, KIF5B, KIT, KLF4, KLF6, KLK2, KMT2A, KMT2C, KMT2D, KNL1, KRAS, KTN1, LASP1, LATS1, LATS2, LCK, LEF1, LIFR, LMNA, LMO1, LMO2, LPP, LRIG3, LRP1B, LYL1, LZTR1, MAF, MAFB, MALT1, MAML2, MAP2K1, MAP2K2, MAP2K4, MAP3K1, MAP3K13, MAPK1, MAX, MDM2, MDM4, MECOM, MED12, MEN1, MET, MITF, MLF1, MLH1, MLLT1, MLLT10, MLLT11, MLLT3, MLLT6, MN1, MPL, MRTFA, MSH2, MSH6, MSI2, MSN, MTCP1, MTOR, MUC1, MYB, MYC, MYCL, MYCN, MYD88, MYH11, MYH9, MYO5A, MYOD1, NAB2, NCOA1, NCOA2, NCOA4, NCOR1, NCOR2, NDRG1, NF1, NF2, NFATC2, NFE2L2, NFIB, NFKB2, NFKBIE, NIN, NKX2-1, NONO, NOTCH1, NOTCH2, NPM1, NR4A3, NRAS, NRG1, NSD1, NSD2, NSD3, NT5C2, NTRK1, NTRK3, NUMA1, NUP214, NUP98, NUTM1, NUTM2B, NUTM2D, OLIG2, P2RY8, PAFAH1B2, PATZ1, PAX3, PAX5, PAX7, PAX8, PBRM1, PBX1, PCM1, PDCD1LG2, PDE4DIP, PDGFB, PDGFRA, PDGFRB, PER1, PHF6, PHOX2B, PICALM, PIK3CA, PIK3CB, PIK3R1, PIM1, PLAG1, PLCG1, PML, POLD1, POLE, POLQ, POT1, POU2AF1, POU5F1, PPARG, PPFIBP1, PPM1D, PPP2R1A, PPP6C, PRCC, PRDM1, PRDM16, PREX2, PRKACA, PRKAR1A, PRRX1, PSIP1, PTCH1, PTEN, PTK6, PTPN11, PTPN13, PTPRB, PTPRC, PTPRK, PTPRT, QKI, RABEP1, RAC1, RAD21, RAD51B, RAF1, RANBP2, RAP1GDS1, RARA, RB1, RBM10, RBM15, REL, RET, RHOA, RHOH, RMI2, RNF213, RNF43, ROS1, RPL10, RPL22, RPL5, RPN1, RSPO2, RSPO3, RUNX1, RUNX1T1, SALL4, SDC4, SDHA, SET, SETBP1, SETD2, SF3B1, SFPQ, SFRP4, SH2B3, SH3GL1, SIX1, SLC34A2, SLC45A3, SMAD2, SMAD3, SMAD4, SMARCA4, SMARCB1, SMARCD1, SMO, SND1, SOCS1, SOX2, SPEN, SPOP, SRC, SRSF2, SRSF3, SS18, SS18L1, SSX1, SSX2, SSX4, STAG2, STAT3, STAT5B, STAT6, STIL, STK11, STRN, SUFU, SUZ12, SYK, TAF15, TAL1, TAL2, TBL1XR1, TBX3, TCEA1, TCF12, TCF3, TCF7L2, TCL1A, TENT5C, TERT, TET1, TET2, TFE3, TFEB, TFG, TGFBR2, TLX1, TLX3, TMPRSS2, TNFAIP3, TNFRSF14, TNFRSF17, TOP1, TP53, TP63, TPM3, TPM4, TPR, TRA, TRAF7, TRB, TRD, TRIM24, TRIM27, TRIM33, TRIP11, TRRAP, TSC1, TSC2, TSHR, U2AF1, UBR5, USP6, USP8, VHL, WDCP, WIF1, WT1, WWTR1, XPO1, YWHAE, ZBTB16, ZFHX3, ZMYM2, ZNF331, ZNF384, ZNF521, 및 ZRSR2으로 이루어진 군으로부터 선택된 하나 이상의 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  10. 제8항에 있어서,
    상기 유전체 정보에서 한 개 이상의 유전자의 변이가 검출되고, 유전자 복제수 변이가 발생하였다면, 대상 줄기세포의 유전적 불안정성을 판단하는 단계를 포함하는 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  11. 제1항에 있어서,
    상기 유전체 정보를 준비하는 단계는 대상 줄기세포의 체세포의 차세대 염기서열 분석(Next generation sequencing, NGS)을 통한 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  12. 제11항에 있어서,
    상기 차세대 염기서열 분석은 전장 게놈 시퀀싱(whole genome sequencing, WGS)인 것인, 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법.
  13. 하드웨어와 결합되어 제1항의 방법을 컴퓨터에서 실행시키기 위하여 매체에 저장된 컴퓨터 프로그램.
KR1020220187476A 2022-12-28 2022-12-28 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법 KR102566777B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220187476A KR102566777B1 (ko) 2022-12-28 2022-12-28 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220187476A KR102566777B1 (ko) 2022-12-28 2022-12-28 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법

Publications (1)

Publication Number Publication Date
KR102566777B1 true KR102566777B1 (ko) 2023-08-14

Family

ID=87565719

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220187476A KR102566777B1 (ko) 2022-12-28 2022-12-28 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법

Country Status (1)

Country Link
KR (1) KR102566777B1 (ko)

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
E. Kuijk 외, "The mutational impact of culturing human pluripotent and adult stem cells", Nature Communications, 11:2493, 2020.* *
X. Fu 외, "Functions of p53 in pluriotent stem cells", Protein Cell 11(1), pp.71-78, 2020.* *

Similar Documents

Publication Publication Date Title
US20230349073A1 (en) Methods and systems for detecting tissue conditions
Filigheddu et al. Differential expression of microRNAs between eutopic and ectopic endometrium in ovarian endometriosis
US11781183B2 (en) Diagnostic use of cell free DNA chromatin immunoprecipitation
Van Zelm et al. Ig gene rearrangement steps are initiated in early human precursor B cell subsets and correlate with specific transcription factor expression
US20210340631A1 (en) Methods for subtyping of lung squamous cell carcinoma
US20180179593A1 (en) Markers for mature beta-cells and methods of using the same
WO2018057888A1 (en) Integrated systems and methods for automated processing and analysis of biological samples, clinical information processing and clinical trial matching
US20210115519A1 (en) Methods and kits for diagnosis and triage of patients with colorectal liver metastases
US20230095582A1 (en) Hydroxymethylation analysis of cell-free nucleic acid samples for assigning tissue of origin, and related methods of use
US11697852B2 (en) Systems and methods for determining a treatment course of action
WO2004108899A2 (en) Pni microarray and uses
Cheung et al. Single-cell technologies—studying rheumatic diseases one cell at a time
WO2009105154A2 (en) Diagnostic and prognostic methods for cancer
US20200370132A1 (en) Robust genomic predictor of breast and lung cancer metastasis
Kiuru et al. High-plex spatial RNA profiling reveals cell type‒specific biomarker expression during melanoma development
Xu et al. Translational opportunities for microfluidic technologies to enable precision epigenomics
KR102566777B1 (ko) 줄기세포의 유전성 안정성 예측을 위한 정보를 제공하는 방법
Yang et al. Development of a focused microarray to assess human embryonic stem cell differentiation
WO2011046635A1 (en) Differentially methylated regions of reprogrammed induced pluripotent stem cells, method and compositions thereof
Fabyanic et al. Quantitative single cell 5hmC sequencing reveals non-canonical gene regulation by non-CG hydroxymethylation
US11815509B2 (en) Cell line and uses thereof
Hagos et al. Expression profiling and pathway analysis of Krüppel-like factor 4 in mouse embryonic fibroblasts
KR20240049800A (ko) 비정상적으로 메틸화된 단편을 갖는 체세포 변이 동시 발생
US20230086611A1 (en) Compositions and Methods for Targeted NGS Sequencing of cfRNA and cfTNA
US20240009172A1 (en) Compostions and methods for treating prostate cancer

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant