KR102427600B1 - 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법 - Google Patents

줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법 Download PDF

Info

Publication number
KR102427600B1
KR102427600B1 KR1020210178182A KR20210178182A KR102427600B1 KR 102427600 B1 KR102427600 B1 KR 102427600B1 KR 1020210178182 A KR1020210178182 A KR 1020210178182A KR 20210178182 A KR20210178182 A KR 20210178182A KR 102427600 B1 KR102427600 B1 KR 102427600B1
Authority
KR
South Korea
Prior art keywords
mutations
somatic
group
stem cells
mutation
Prior art date
Application number
KR1020210178182A
Other languages
English (en)
Inventor
황태순
백순명
홍창표
권솔비
유승일
이진아
Original Assignee
주식회사 테라젠바이오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 테라젠바이오 filed Critical 주식회사 테라젠바이오
Priority to KR1020210178182A priority Critical patent/KR102427600B1/ko
Application granted granted Critical
Publication of KR102427600B1 publication Critical patent/KR102427600B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명의 줄기세포 배양적응성 관련 체세포 변이 선별 방법에 따르면, 계대배양시 줄기세포 유전체에 발생할 수 있는 체세포적 변이를 효과적으로 선별할 수 있다. 또한, 상기 변이를 이용하여 줄기세포의 계대배양시 발암유전자 발현이 높아지는 것과 같은 위험성을 미리 탐색할 수 있어, 줄기세포의 품질을 효과적으로 평가할 수 있다.

Description

줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법{METHOD FOR SCREENING FOR SOMATIC MUTATIONS TO DETERMINE CULTURE ADAPTATION OF STEM CELLS}
본 발명은 계대배양한 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법 및 이의 이용에 관한 것이다.
줄기세포(stem cell)란, 미분화 상태를 유지하면서 무한히 증식할 수 있으며 일정한 환경과 조건이 주어질 경우 특정 기능과 형태를 갖도록 분화할 수 있는 세포를 말한다. 줄기세포의 자가재생산능과 전분화능으로 인해 세포 치료제 개발 및 다양한 신약 후보 물질의 약효 검색, 질환의 원인 규명, 치료법 개발 등 다양한 측면에서 이를 대상으로 한 연구성과의 활용범위가 확대되고 있다. 줄기세포의 수요가 급증함에 따라, 줄기세포의 높은 공급량도 요구되며, 일반적으로 이를 위해 줄기세포의 계대배양이 이용된다.
줄기세포의 계대배양은 세포증식 방법의 하나로, 약 5일마다 주기적으로 새로운 배지에 이식시켜 배양함으로써 세포를 보존하고 세포를 대량생산할 수 있는 방법이다. 줄기세포가 반복적으로 계대배양될 경우, 줄기세포의 유전적 안정성이 감소되거나 DNA 손상이 유발될 수 있음이 공지되어 있다. 이러한 배양적응으로 인해 줄기세포의 부작용이 발생하고 줄기세포의 임상 및 사용이 제한되고 있는 실정이다.
따라서, 이를 극복하기 위한 시도들이 존재하였으나(미국등록특허 US 9249392 B2), 이미 계대배양된 줄기세포의 품질을 평가하는 접근은 부진하였다. 이에, 계대배양된 줄기세포의 배양적응을 판단하여 부작용을 예방하고 줄기세포 생산의 품질을 향상시키는 것의 중요성이 대두되고 있다.
현재 세계적으로 의료현장에서 체세포 변이의 판단을 위해 차세대 염기서열 분석(NGS)이 이루어지고 있다. 차세대 염기서열 분석은 유전체의 염기서열의 고속 분석 방법으로, 기존의 생어 염기서열 분석(Sanger sequencing)과 달리 많은 수(백만 개 이상)의 DNA 조각을 병렬로 처리하는 데 특징이 있다. NGS의 예시로는, 패널 시퀀싱(panel sequencing), 엑솜 시퀀싱(exome sequencing), 전장 게놈 시퀀싱 (whole genome sequencing) 등이 있다.
본 발명자들은 시간에 따른 배양적응성의 발생을 고려하기 위해, NGS와 같은 DNA 시퀀싱을 이용해 시간에 따른 줄기세포의 체세포 변이를 분석하여 줄기세포의 배양적응과 관련된 체세포 변이를 선별하는 방법을 개발하였다. 따라서, 본 발명에 의해 선별된 체세포 변이에 의하면, 배양적응을 손쉽게 판단하고 줄기세포의 배양적응에 관련된 정보를 제공하여 줄기세포의 품질을 평가할 수 있다.
본 발명의 일 양상은 줄기세포 배양적응성 관련 체세포 변이를 선별하는 방법을 제공한다.
본 발명의 다른 양상은 DNA 시퀀싱 분석 데이터에 기초하여 줄기세포 배양적응성 관련 체세포 변이를 선별하는 시스템을 제공한다.
본 발명의 또 다른 양상은 상기 시스템을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
본 발명의 일 양상은 줄기세포를 계대배양하는 단계;
DNA 시퀀싱 분석을 이용하여 줄기세포의 유전체 정보를 획득하는 단계;
상기 유전체 정보로부터 체세포 변이(Somatic mutation)에 관한 정보를 선별하는 단계; 및
상기 정보를 계대배양 횟수가 상이하거나 계대배양되지 않은 줄기세포의 체세포 변이 정보와 비교하여, 줄기세포의 배양적응과 관련된 체세포 변이를 선별하는 단계를 포함하는, 줄기세포 배양적응성(Culture adaptation) 관련 체세포 변이를 선별하는 방법을 제공한다.
본 명세서에서 사용된 용어 "줄기세포 배양적응성"은 계대 배양 중 줄기세포 유전체 내에 변이가 발생하여 배양환경의 미세변화에 따른 생존 및 적응성을 높이는 것을 말하고, 그 결과 줄기세포의 유전체 불안정성을 초래하는 것을 의미한다. 배양적응된 줄기세포의 특징은 예를 들어, 줄기세포가 (i) 줄기세포 유효성(Stemness)을 유지하고 (ii) 계대배양으로 인해 유의미한 유전적 안정성(Genome stability)에 변화가 발생하고 유지되는 것이다.
상기 줄기세포 유효성은 지속적 배양에도 불구하고 줄기세포가 줄기세포 고유의 특성인 자가재생산(self-renewal) 등이 유지되고 있는 것을 의미한다.
상기 유전적 안정성의 변화는 계대배양으로 인한 변이의 축적으로 인해, 줄기세포에 세포 이질성(Cell heterogeneity) 또는 암 유발성(tumorigenesis)이 발생하였음을 의미한다.
계대배양으로 인해 줄기세포에 변이가 축적되는 경우, 배양적응성이 생길 수 있다. 배양적응성이 생긴 줄기세포(이하, 배양적응 줄기세포)는 세포 이질성(Cell feterogeneity) 또는 암 유발성(tumorigenesis)이 존재하여 치료제 등의 개발에 부적합할 수 있다. 따라서, 상기 방법은 계대배양된 줄기세포의 계대배양 여부를 판단할 수 있는 체세포 변이를 선별하는 방법을 제공한다.
본 명세서에서 사용된 용어 "체세포 변이(somatic variation)"는 생식 세포가 있는 다세포 유기체의 체세포 DNA 서열의 변화로서, 생식 세포 이외의 세포에서 발생하는 모든 돌연변이를 의미한다. 유기체의 후손에게 유전될 수 있는 생식계열 돌연변이와 달리, 체세포 돌연변이는 일반적으로 후손에게 전달되지 않는다. 체세포 돌연변이는 암을 유발하는 것일 수 있다.
본 발명에 따른 체세포 변이 선별 방법은 도 4의 단계에 따라 진행된다.
상기 줄기세포 배양적응성 관련 체세포 변이를 선별하는 방법은 줄기세포를 계대배양하는 단계를 포함한다.
상기 계대배양은 원래 배양에서 일부 세포를 새로운 배지에 옮겨 새롭게 배양하는 것을 말한다. 본 명세서에서 사용된 용어 "계대배양(subculture, passaging)"은 세포증식 방법의 하나로, 약 5일마다 주기적으로 새로운 배지에 이식시켜 배양함으로써 세포의 노화를 막고 세포의 밀도를 연장하여 결과적으로 세포를 대량 생산하는 것이다.
상기 계대배양은 1회 이상 수행되는 것일 수 있다. 구체적으로, 1회 내지 700회, 1회 내지 600회, 10회 내지 550회, 20회 내지 500회, 30회 내지 480회, 40회 내지 450회일 수 있다. 구체적으로, 44회, 112회, 210회 또는 417회 수행하는 것일 수 있다.
일 구체예에 있어서, 상기 줄기세포를 계대배양하는 단계는, 동일한 유전적 특징을 가지는 줄기세포로서, 0회 내지 45회 미만 계대배양된 제1 그룹 줄기세포, 45회 이상 내지 120회 미만 계대배양된 제2 그룹 줄기세포, 120회 이상 내지 400회 미만 계대배양된 제3 그룹 줄기세포 줄기세포 및 400회 이상 내지 700회 계대배양된 제4 그룹 줄기세포를 수득하는 것일 수 있다.
상기 제1 그룹 줄기세포는, 계대배양을 위한 시재료(starting material)로서, 계대배양되지 않았거나 저회차 계대배양된 것일 수 있다.
일 구체예에 있어서, 동일한 유전적 특징을 가지는 줄기세포로서, 40회 내지 50회 계대배양된 제1 그룹 줄기세포, 100회 내지 120회 계대배양된 제2 그룹 줄기세포, 200회 내지 250회 계대배양된 제3 그룹 줄기세포 및 400회 내지 450회 계대배양된 제4 그룹 줄기세포를 수득하는 것일 수 있다.
또한, 44회 계대배양된 제1 그룹 줄기세포, 112회 계대배양된 제2 그룹 줄기세포, 230회 계대배양된 제3 그룹 줄기세포 및 417회 계대배양된 제4 그룹 줄기세포를 수득하는 것일 수 있다.
상기 줄기세포 배양적응성 관련 체세포 변이를 선별하는 방법은 DNA 시퀀싱 분석을 이용하여 줄기세포의 유전체 정보를 획득하는 단계를 포함한다.
상기 정보를 획득하는 단계는 계대배양된 줄기세포의 DNA를 수득하는 단계; 및 상기 DNA를 DNA 시퀀싱을 이용하여 분석하는 단계를 포함한다. 상기 유전체 정보 획득 단계는, 계대배양된 줄기세포의 전장 유전체 정보를 획득하는 것일 수 있다.
상기 정보를 획득하는 단계는 DNA를 분리하는 단계; 분리된 DNA를 정제하는 단계; 및 정제된 DNA의 유효성을 판단(Validation)하는 단계를 선행하는 것일 수 있다. 예를 들어, 상기 선행 단계는 Illumina TruSeq DNA PCR-Free 샘플 프랩 키트로 수행되는 것일 수 있다.
또한, 상기 줄기세포의 유전체 정보를 획득하는 단계는 동일한 유전적 특징을 가지고 계대배양 횟수가 상이한 제1 그룹 줄기세포, 제2 그룹 줄기세포, 제3 그룹 줄기세포 및 제4 그룹 줄기세포의 유전체 정보를 획득하는 것일 수 있다.
상기 제1 그룹 줄기세포는, 계대배양을 위한 시재료(starting material)로서, 계대배양되지 않았거나 저회차 계대배양된 것일 수 있다. 구체적으로, 50회 이하 계대배양되어 배양적응성이 일어나지 않거나 배양적응성의 위험이 적은 것일 수 있다. 예를 들어, 약 44회 계대배양된 것일 수 있다.
상기 제2 그룹 줄기세포는 100회 이상 계대배양된 배양적응성이 일어났거나 배양적응성이 일어났을 위험이 높은 줄기세포를 의미한다. 구체적으로, 상기 제2 그룹 줄기세포는 45회 내지 120회, 100회 내지 120회, 110회 내지 115회 계대배양된 것일 수 있고, 약 112회 계대배양된 것일 수 있다.
상기 제3 그룹 줄기세포는 200회 이상 계대배양되어 배양적응성이 일어났고, 유전체 불안정성 및 암 유발성 가능성이 높은 줄기세포를 의미한다. 구체적으로, 상기 제3 그룹 줄기세포는 200회 내지 400회 미만, 200회 내지 250회, 220회 내지 240회 계대배양된 것일 수 있고, 약 230회 계대배양된 것일 수 있다.
상기 제4 그룹 줄기세포는 400회 이상 극단적으로 계대배양되어 제3 그룹 줄기세포 보다 유전체 불안정성 및 암 유발성이 매우 높은 줄기세포를 의미한다. 구체적으로, 상기 제4 그룹 줄기세포는 400회 내지 700회, 400회 내지 450회, 410회 내지 430회 계대배양된 것일 수 있고, 약 417회 계대배양된 것일 수 있다.
일 구체예에 있어서, 상기 줄기세포의 유전체 정보를 획득하는 단계는 동일한 유전적 특징을 가지는 줄기세포로서, 0회 내지 45회 미만 계대배양된 제1 그룹 줄기세포, 45회 이상 내지 120회 미만 계대배양된 제2 그룹 줄기세포, 120회 이상 내지 400회 미만 계대배양된 제3 그룹 줄기세포 줄기세포 및 400회 이상 내지 700회 계대배양된 제4 그룹 줄기세포의 유전체 정보를 모두 획득하는 것일 수 있다.
일 구체예에 있어서, 상기 줄기세포의 유전체 정보를 획득하는 단계는 동일한 유전적 특징을 가지는 줄기세포로서, 40회 내지 50회 계대배양된 제1 그룹 줄기세포, 100회 내지 120회 계대배양된 제2 그룹 줄기세포, 200회 내지 250회 계대배양된 제3 그룹 줄기세포 및 400회 내지 450회 계대배양된 제4 그룹 줄기세포의 유전체 정보를 모두 획득하는 것일 수 있다.
일 구체예에 있어서, 상기 줄기세포의 유전체 정보를 획득하는 단계는 동일한 유전적 특징을 가지는 줄기세포로서, 42회 내지 47회 계대배양된 제1 그룹 줄기세포, 110회 내지 120회 계대배양된 제2 그룹 줄기세포, 220회 내지 240회 계대배양된 제3 그룹 줄기세포 및 410회 내지 420회 계대배양된 제4 그룹 줄기세포의 유전체 정보를 모두 획득하는 것일 수 있다.
또한, 44회 계대배양된 제1 그룹 줄기세포, 112회 계대배양된 제2 그룹 줄기세포, 230회 계대배양된 제3 그룹 줄기세포 및 417회 계대배양된 제4 그룹 줄기세포의 유전체 정보를 모두 획득하는 것일 수 있다.
상기 DNA 시퀀싱 분석은 차세대 염기서열 분석(Next generation sequencing, NGS)일 수 있다.
본 명세서에서 사용된 용어 "차세대 염기서열 분석(Next generation sequencing, NGS)"은 유전체의 염기서열의 고속 분석 방법으로, 기존의 생어 염기서열 분석(Sanger sequencing)과 달리 많은 수백만 개 이상의 DNA 조각을 병렬로 처리한다. 예를 들어, 상기 NGS는 패널 시퀀싱(panel sequencing), 엑솜 시퀀싱(exome sequencing) 또는 전장 게놈 시퀀싱(whole genome sequencing, WGS)일 수 있다. 구체적으로, 전장 게놈 시퀀싱(whole genome sequencing, WGS)일 수 있다.
본 명세서에서 사용된 용어 "전장 게놈 시퀀싱"은 유기체 게놈의 DNA 서열 전체를 분석하는 DNA 시퀀싱의 일종이다. 예를 들어, 상기 전장 게놈 시퀀싱은 Illumina NovaSeq 6000 플랫폼을 이용하는 것일 수 있으며, 150-bp paired-end 시퀀싱일 수 있다.
DNA 시퀀싱 분석 이후, Raw 데이터를 도출하기 위한 필터링 단계를 추가적으로 포함할 수 있다.
상기 필터링 단계는 시퀀스의 품질 체크(Quality check) 단계; 및 시퀀싱 데이터의 Read를 Reference genome에 맵핑하는 단계를 포함할 수 있다.
상기 Reference genome은 휴먼 참조 유전체인 Genome Reference Consortium Human Build 37(GRCH37)일 수 있다. Reference genome은 시퀀싱 데이터의 맵핑시 기준이 되며, 하기에서 Ref genome이라고도 명명한다.
상기 품질 체크 단계는, Reads의 전반적인 품질을 체크하고, adaptor sequences와 low-quality sequences, 또는 PCR 중복으로 인한 서열들을 제거하는 것일 수 있다.
일 구체예에 있어서, 상기 Reads 품질 체크 단계는 Fast QC 프로그램, adaptor sequences와 low-quality sequences를 제거하는 단계는 Trimmomatic 프로그램, 또는 PCR 중복으로 인한 서열들을 제거하는 단계는 Picard 프로그램, 상기 맵핑 단계는 BWA 프로그램을 이용하는 것일 수 있다.
일 구체예에 있어서, 시퀀싱 Raw FASTQ 파일(1)은 Trimmomatic 프로그램에 의해 Clean FASTQ 파일로 도출되며(2), BWA 프로그램에 의해 Raw BAM 파일로 도출되는 것(3)일 수 있다.
상기 줄기세포 배양적응성 관련 체세포 변이를 선별하는 방법은 상기 유전체 정보로부터 체세포 변이(Somatic mutation)에 관한 정보를 선별하는 단계를 포함한다.
상기 체세포 변이는 체세포 SNVs(Somatic Single Nucleotide Variants)일 수 있다. 본 명세서에서 사용된 용어 "체세포 SNVs(Somatic Single Nucleotide Variants)"는, 체세포에서 발생된 단일 뉴클레오티드 변이체로서, 핵산 서열에서 하나의 뉴클레오티드의 차이를 보이는 유전적 변화 또는 변이를 말한다. 집단에서 1% 이상의 빈도를 요구하는 단일 염기 다형성(single nucleotide polymorphism, SNP)과는 달리, 특정 빈도가 요구되지 않는다.
본 발명의 전장 유전체 정보로부터 변이 정보를 선별하는 단계는 도 6의 단계에 따라 진행될 수 있다.
구체적으로, 상기 선별하는 단계는 상기 줄기세포의 전장 유전체 정보로부터, 유전체의 변이 정보를 선별하는 단계; 및 상기 변이 정보에서 체세포 변이 정보를 선별하는 단계를 포함할 수 있다.
일 구체예에 있어서, 줄기세포의 전장 유전체 정보로부터 변이 정보를 선별하는 단계는 Mutect 2 프로그램에 의한 것일 수 있다.
구체적으로, 상기 시퀀싱 데이터는 Variant calling에 의해, VCF 파일(Variant call format)이 도출되는 것(9)일 수 있다 상기 VCF는 SNV로부터의 모든 변이 데이터를 포함한다.
일 구체예에 있어서, 상기 체세포 변이 정보를 선별하는 단계는 하기 (1) 내지 (7)으로 구성된 군으로부터 선택된 하나 이상의 조건을 만족하는 체세포 변이 정보를 선별하는 것일 수 있다.
(1) Biallelic somatic SNVs인 돌연변이;
(2) Mapping read depth가 20 이상인 돌연변이;
(3) 성염색체(X와 Y 염색체)에 존재하지 않는 돌연변이;
(4) 생식세포 돌연변이(Germline mutation)를 제외한 돌연변이;
(5) Heterozygous reads가 3 이상인 돌연변이;
(6) Heterozygous read의 비율이 70% 이하인 돌연변이; 및
(7) 드노보 변이(de novo mutation) 또는 삽입 및 결실 돌연변이(Insertions and Deletions, InDels)를 제외한 돌연변이.
상기 조건 (1)은 돌연변이 중에서 체세포 돌연변이로서 heterozygous allele로서 명확한 형태를 가지는 변이를 선별하기 위한 것이다.
상기 조건 (2)는 맵핑된 변이들 중에서 정확도가 높은 변이를 선별하기 위한 것이다. Mapping read depth가 20 내지 40 또는 20 내지 30인 것일 수 있다.
상기 조건 (3) 및 (4)는 체세포 돌연변이가 아닌 돌연변이를 제외하기 위한 것이다.
상기 조건 (5)는 최소의 체세포 돌연변이를 결정하기 위한 설정 값으로 돌연변이 여부가 불명확한 경우를 제외하기 위한 것이다. Heterozygous reads가 3 내지 10, 3 내지 8, 3 내지 7 또는 3 내지 5일 수 있다.
상기 조건 (6)은 heterozygous read의 비율이 70% 이상인 돌연변이의 경우 생식세포 돌연변이일 가능성이 있어 제외하기 위한 것이다. Heterozygous reads거 0% 내지 70%, 10% 내지 70%, 20% 내지 70% 30 내지 70%, 40% 내지 70% 또는 50% 내지 70%일 수 있다.
상기 조건 (7)은 분석 샘플의 개수가 적고 시퀀싱 데이터 생산량이 다소 낮을 경우 데이터 정확도 확보를 위해, 드노보 변이, 삽입 및 결실 변이를 제외시킬 수 있다.
일 구체예에 있어서, 상기 체세포 변이 정보를 선별하는 단계는 하기 (1) 내지 (7) 조건을 모두 적용하여 체세포 변이를 선별함으로써, 타 종류의 변이를 정확도 높게 제외시킨 것일 수 있다.
상기 방법은 상기 정보를 계대배양 횟수가 상이하거나 계대배양되지 않은 줄기세포의 체세포 변이 정보와 비교하여, 줄기세포의 배양적응과 관련된 체세포 변이를 선별하는 단계를 포함한다.
본 발명에 따른 배양적응과 관련된 체세포 변이를 선별하는 단계는 도 7의 단계에 따라 진행될 수 있다.
상기 선별하는 단계는, 휴먼 참조 유전체(Reference genome; GRCH37)와 제1 그룹 줄기세포(Control; H9-P1) 사이에서 확인된 변이들을 제거하는 단계가 선행될 수 있다. 구체적으로, 휴먼 참조 유전체(Reference genome; GRCH37)를 토대로 제1 그룹 줄기세포(Control; H9-P1)의 돌연변이를 calling하여, 동형접합성 변이는 허용하고, 생식세포에 따른 이형접합성 변이들 또는 체세포 변이를 제거하였다.
이후, 상기 선별하는 단계는, 상기 단계에서 필터링된 제1 그룹 줄기세포(H9-P1) 대비 제2 그룹 줄기세포(H9-P2), 제3 그룹 줄기세포(H9-P3) 또는/및 제4 그룹 줄기세포 (H9-P4)에서 발생한 체세포 변이를 선별하는 단계를 포함할 수 있다. 구체적으로, 상기 단계는 H9-P1에서 VAF(Variant Allele Frequency)가 0이지만, H9-P2, H9-P3, H9-P4에서는 발생된 변이를 선별하는 것이다.
일 구체예에 있어서, 상기 선별하는 단계는 하기 i) 내지 iv)로 구성된 군에서 선택된 하나 이상의 조건을 만족하는 체세포 변이를 선별하는 것일 수 있다:
i) 상기 제1 그룹과 비교하여 상기 제2 그룹에서 발생한 체세포 변이;
ii) 상기 제1 그룹과 비교하여 상기 제3 그룹에서 발생한 체세포 변이;
iii) 상기 제1 그룹과 비교하여 상기 제4 그룹에서 발생한 체세포 변이;
iv) 상기 제1 그룹과 비교하여 상기 제2 그룹, 상기 제3 그룹 및 상기 제4 그룹에서 발생한 체세포 변이; 및
v) 상기 제1 그룹과 비교하여 상기 제3 그룹 및 상기 제4 그룹에서 발생한 체세포 변이.
일 구체예에 있어서, 상기 i) 내지 v)로 구성된 군으로부터 선택된 두개, 세개, 네개 또는 다섯개 이상의 조건을 만족하는 것일 수 있다. 바람직하게는, 상기 조건을 모두 만족하는 것일 수 있다.
본 발명의 줄기세포 배양적응성 관련 체세포 변이를 선별하는 방법 중에서, DNA 시퀀싱을 이용한 체세포 변이 선별 방법에서 일반적으로 사용되는 dbSNP 데이터베이스(Single Nucleotide Polymorphism Database), ExAC 데이터베이스(Exome Aggregation Consortium database) 또는 GnomAD(The Genome Aggregation Database)를 이용한 검색을 수행하지 않는 것일 수 있다.
해당 데이터베이스를 이용한 변이 필터 단계를 적용시키게 될 경우, 기존에 알려진 변이들을 제거하게 될 수 있다. 본 발명은 계대배양 횟수의 증가에 따라 배양적응 과정에서 발생될 수 있는 모든 변이를 찾는 것으로, 상기 변이 필터를 적용시키지 않은 특징이 있다.
이후, 상기 선별하는 단계는, 선별된 체세포 변이를 검증하는 단계를 추가적으로 포함할 수 있다.
상기 검증된 체세포 변이는, 줄기세포 유전자의 엑손 또는 코딩지역에 위치한 체세포 변이일 수 있으며, 미스센스 돌연변이일 수 있다.
상기 검증된 체세포 변이는 APC, CD4, CDH1, CHD7, COL9A1, COL9A1, CTNNA1, DNMT3B, EP300, FGF1, FGFR1, NANOG, NOTCH2, NR5A2, NR6A1, NUMB, PRDM14, RB1, SCN1A, SMAD1, TP53 및 TRIM28으로 이루어지는 군으로부터 선택된 하나 이상일 수 있다.
구체적으로, CHD1, CHD7, COL9A1, CTNNA1, DNMT3B, EP300, FGF1, FGFR1, NOTCH2, NR6A1, NUMB, SCN1A, SMAD1, TP53 및 TRIM28으로 이루어지는 군으로부터 선택된 하나 이상일 수 있다. 바람직하게는, TP53, NOTCH2 및 NR6A1을 포함하는 것일 수 있다.
본 발명의 다른 양상은, 상기 방법에 의해 선별된 체세포 변이를 제공한다.
본 발명의 다른 양상은, 상기 체세포 변이로 줄기세포의 배양적응성 및 유전체 안정성 평가 여부를 판단하는 방법을 제공한다.
상기 판단하는 방법은, 배양적응이 의심되는 줄기세포의 DNA를 수득하는 단계; 상기 수득된 DNA에 상기 선별된 체세포 변이가 존재할 경우, 배양적응이 있는 줄기세포로 판단하는 단계를 포함할 수 있다. 상기 판단하는 방법을 이용하면, 줄기세포의 배양적응성 및 유전체 안정성 평가를 간편하게 판단하여 생산량을 높일 수 있다.
본 발명의 다른 양상은, DNA 시퀀싱 분석에 기초하여 줄기세포 배양적응성 관련 체세포 변이를 선별하는 시스템에 있어서, DNA 시퀀싱 분석을 이용한 줄기세포의 유전체 분석 데이터를 수신하는 데이터 수신부; 상기 데이터 수신부를 통해 입력된 줄기세포의 유전체 데이터에서 체세포 변이를 선별하는 데이터 분석부; 상기 데이터 분석부를 통해 입력된 데이터에서 줄기세포의 배양적응과 관련된 체세포 변이를 선별하는 배양적응성 관련 분석부; 및 상기 배양적응성 관련 분석부를 통해 입력된 데이터를 검증하여 제공하는 체세포 변이 제공부를 포함하는 시스템을 제공한다.
상기 시스템은 상기 배양적응성 관련 체세포 변이 선별하는 방법을 구동하는 것으로, 상기에 설명된 용어 및 단계가 적용된다.
체세포 변이를 선별하는 시스템은 데이터 수신부(100), 데이터 분석부(200), 배양적응성 관련 분석부(300), 및 체세포 변이 제공부(400)를 포함한다(도 8).
데이터 수신부(100)는 줄기세포의 체세포 변이 분석 데이터를 수신한다. 상기 정보 수신부(100)은 제1 그룹 줄기세포 데이터 수신부(130), 제2 그룹 줄기세포 데이터 수신부(160), 제3 그룹 줄기세포 데이터 수신부(190)를 포함할 수 있다(도 9).
DNA 분석 기기(132)는 줄기세포의 유전체를 분석한 전장 유전체 시퀀싱 데이터를 수득하며, 체세포 변이 검사부 및 검사 결과 전송부를 포함할 수 있다. 구체적으로, 상기 분석은 WGS에 의한 것일 수 있다.
데이터 분석부(200)는 상기 줄기세포의 체세포 변이 분석 데이터에서 체세포 변이 데이터를 선별한다. 선별된 체세포 변이 데이터는 배양적응성 관련 분석부(300)로 송부될 수 있다.
체세포 변이 데이터의 선별은 전체 체세포 변이 분석 데이터에서 하기 (1) 내지 (7)으로 구성된 군으로부터 선택된 모든 하나 이상의 조건을 만족하는 것인, 체세포 변이를 선별하는 방법:
(1) Biallelic Somatic SNV인 돌연변이;
(2) Mapping read depth가 20 이상인 돌연변이;
(3) 성염색체에 존재하지 않는 돌연변이;
(4) 생식세포 돌연변이(Germline mutation)를 제외한 돌연변이;
(5) heterozygous reads가 3 이상인 돌연변이;
(6) heterozygous read의 비율이 70% 이하인 돌연변이; 및
(7) 드노보 변이(de novo mutation) 또는 삽입 및 결실 돌연변이(Insertions and Deletions, InDels)를 제외한 돌연변이.
배양적응성 관련 분석부(300)는 상기 선별된 체세포 변이 데이터에서 배양적응과 관련된 체세포 변이 데이터를 선별한다. 체세포 변이 제공부(400)로 송부된다.
상기 선별된 체세포 변이 데이터에서 하기 i) 내지 iv)로 구성된 군에서 선택된 하나 이상의 조건을 만족하는 체세포 변이를 선별하는 것일 수 있다:
i) 상기 제1 그룹과 비교하여 상기 제2 그룹에서 발생한 체세포 변이;
ii) 상기 제1 그룹과 비교하여 상기 제3 그룹에서 발생한 체세포 변이;
iii) 상기 제1 그룹과 비교하여 상기 제4 그룹에서 발생한 체세포 변이;
iv) 상기 제1 그룹과 비교하여 상기 제2 그룹, 상기 제3 그룹 및 상기 제4 그룹에서 발생한 체세포 변이; 및
v) 상기 제1 그룹과 비교하여 상기 제3 그룹 및 상기 제4 그룹에서 발생한 체세포 변이.
일 구체예에 있어서, 상기 체세포 변이는 i) 내지 v)로 구성된 군으로부터 선택된 하나, 두개, 세개, 네가 또는 다섯개 이상의 조건을 만족하는 것일 수 있다. 바람직하게는, 상기 조건을 모두 만족하는 것일 수 있다.
또한, dbSNP 데이터베이스(Single Nucleotide Polymorphism Database), ExAC 데이터베이스(Exome Aggregation Consortium database) 또는 GnomAD(The Genome Aggregation Database)에 의한 검색을 수행하지 않는 것일 수 있다.
체세포 변이 제공부(400)는 상기 선별된 배양적응성 관련 체세포 변이를 검증하여 제공한다.
본 발명의 또 다른 양상은, 상기 방법 또는 시스템을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.
본 명세서에 사용된 바와 같은 "부 (Unit)", "...모듈 (system)" 및 "...시스템 (system)" 등의 용어는 마찬가지로 컴퓨터 관련 엔티티 (Entity), 즉 하드웨어, 하드웨어 및 소프트웨어의 조합, 소프트웨어 또는 실행 시의 소프트웨어와 등가로 취급할 수 있다.
상기 방법, 시스템 또는 하기의 실시예는 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상기 방법에서 사용된 데이터의 구조는 컴퓨터로 읽을 수 있는 기록매체에 여러 수단을 통하여 기록될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체 (예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체 (예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.
본 발명의 줄기세포 배양적응성 관련 체세포 변이 선별 방법에 따르면, 계대배양시 줄기세포에 발생할 수 있는 체세포 변이를 효과적으로 선별할 수 있다. 또한, 상기 변이를 이용하여 줄기세포의 계대배양시 발암유전자 발현이 높아지는 것과 같은 위험성을 미리 탐색할 수 있어, 줄기세포의 품질을 효과적으로 평가할 수 있다.
도 1은 줄기세포의 계대배양을 통한 배양적응 특성이 발생하는 과정을 나타낸 도이다.
도 2은 전장 게놈 시퀀싱 분석을 위한 계대배양된 줄기세포의 실험군을 나타낸 도이다.
도 3는 고횟수 계대배양된 줄기세포 실험군인 230번째 계대배양을 수행한 실험군(H9-P3) 및 417번째 계대배양을 수행한 실험군(H9-P4)에서 발생한 유전체 불안정성의 특성을 나타낸 이미지이다. 그림에서 X축은 염색체 20q11.21 부위에 존재하는 유전자 복제수 변이(copy number variation)를 측정한 수치를 나타낸 것이고, Y축은 해당 유전자들의 발현 변화량을 측정한 수치를 나타낸 것이다.
도 4는 줄기세포 배양적응성 관련 체세포 변이를 선별하는 방법을 나타낸 도이다.
도 5은 정장 게놈 시퀀싱으로 줄기세포의 유전체 정보를 획득하는 단계를 나타낸 도이다.
도 6은 줄기세포의 유전체 정보로부터 체세포 돌연변이를 선별하는 단계를 나타낸 도이다.
도 7은 체세포 돌연변이 중 배양적응성과 관련된 체세포 변이를 도출하는 단계를 나타낸 도이다.
도 8은 줄기세포 배양적응성 관련 체세포 변이를 선별하는 시스템의 구조를 나타낸 도이다.
도 9는 데이터 수신부의 구조를 나타낸 도이다.
도 10은 계대배양된 줄기세포의 배양적응성 관련 체세포 변이의 functional annotation을 나타낸 도이다.
도 11은 계대배양된 줄기세포의 배양적응성 관련 체세포 변이의 존재를 나타낸 도이다.
이하, 실시예를 통해 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되는 것으로 해석되지 않는 것은 당업계에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 1. 계대배양된 줄기세포 DNA 시료 확보
실시예 1.1 계대배양된 줄기세포 시료 확보
본 발명의 계대배양 줄기세포는 서울대학교 약학대학 연구실에서 수득한 계대배양된 인간배아줄기세포 H9 4종(H9-P1, H9-P2, H9-P3 및 H9-P4)을 사용하였다. 상기 실험군 줄기세포의 배양 방법 및 특성은 문헌 Cho et al. (2018), Stem Cell Reports, 11(5):1244-1256; Selective Elimination of Culture-Adapted Human Embryonic Stem Cells with BH3 Mimetics을 참조한다.
구체적으로, 도 2에 나타낸 것과 같이, 44번 계대배양한 줄기세포를 H9-P1군으로(Passage no.44), 112번 계대배양한 줄기세포를 H9-P2군으로(Passage no.112), 230번 계대배양한 줄기세포를 H9-P3군으로(Passage no.230), 417번 계대배양한 줄기세포를 H9-P4군으로(Passage no.417)로 설정하여 계대배양 횟수별로 분류하여 실험군을 설정하였다. 상기 H9-P1, H9-P2, H9-P3, H9-P4 실험군은 계대배양 횟수가 증가함에 따라 유전체 구조의 이상, 테라토마 형성, 세포사멸 등의 표현형적 변화가 나타났다.
실시예 2. Whole-genome sequencing 수행
실시예 2.1 Whole-genome sequencing 수행
상기 실험군 별로 전장 게놈 시퀀싱(Whole-genome sequencing)을 수행하였다.
구체적으로, Illumina TruSeq DNA PCR-Free Sample Prep Kit을 이용하여 DNA를 분리, 정제 및 Validation하여 시퀀싱 라이브러리를 제작하였다. 이후, Illumina NovaSeq 6000 platform 상에서 150-bp paired-end sequencing을 수행하여 각 실험군 당 약 105.8 Gb의 시퀀싱 데이터를 생성하였다.
실시예 3. Whole-genome sequencing의 raw data 선별
상기 실시예 2 시퀀싱 데이터로부터, 체세포 SNV(somatic SNVs)와 관련된 데이터를 선별하기 위하여, 도 5에 나타낸 단계와 같이 필터링을 수행하였다.
먼저, Fast QC(0.11.7 ver)를 이용하여 전반적인 시퀀싱 데이터의 품질을 체크하여 Raw FASTQ(1) 파일을 도출하였다. 다음으로, Trimmomatic(0.36 ver)의 paired end 모드를 이용하여 Raw FASTQ(1)로부터 adaptor sequences와 low-quality sequences를 제거하여, Clean FASTQ(2) 파일을 도출하였다.
이후, BWA(0.7.17 ver)를 이용하여 high-quality reads를 Human reference genome(GRCH37, GCA_000001405.1)에 맵핑하여, Raq BAM(3) 파일을 도출하였다. 또한, PCR을 통해 생긴 duplication Read를 제거하기 위해 GATK MarkDuplicates를 이용하였고 Deduplicated BAM(4)를 생성하였다(MarkDuplicates). Duplication Read 제거된 서열에 misalignment된 Base Quality Score를 보정하기 위하여, GATK BaseRecalibrator 프로그램을 사용하였고 BQSR Applied BAM(5)를 생성하였다.
다음으로, 필터링된 변이(variant)를 GATK(4.0.11.0)으로 calling하여 변이에 대한 정보를 담고 있는 VCF(Variant Calling Format) 파일을 도출하였다. 마지막으로, Mutect2(Variant calling tool)를 이용해 최종 선별된 체세포 SNVs를 calling하여 Pair Sample VCF(6)를 도출하였다.
다음으로, Gatk4CalculateContamination을 사용하여 오염된 read의 비율을 계산하고 제거하여 Filtered Mutack Call(7)을 생성하여 변이를 도출하였다.
상기 도출된 변이에 대해, 주석을 추가하기 위해 SnpEff 프로그램을 사용하여 Annotated Pair Sample VCF(8)를 생성하였다.
실시예 4. Somatic SNVs 선별
상기 실시예 3에서 최종 선별된 체세포 SNVs 데이터(Annotated Pair Sample VCF, 8)로부터 줄기세포의 배양적응과 관련된 유효한 체세포 변이를 식별하기 위해, 도 6에 나타낸 단계와 같이 필터링을 진행하였다.
실시예 4.1 Mapping Quality control
체세포 돌연변이의 heterozygous allele로서의 특성을 반영하기 위해, 돌연변이 중에서도 이중대립염기를 가지는 biallelic SNVs(Single Nucleotide Variant)를 선택하였다(도 6의 단계 2). 이때, 분석 샘플의 개수가 적고 30X 전장 유전체 서열 데이터처럼 시퀀싱 데이터 생산량이 다소 낮을 경우, calling된 변이의 정확성을 확보하기 위해 드노보 변이(de novo variations) 및 삽입 및 결실 돌연변이(Insertion and Deletion, InDels)는 배제하였다.
더불어, 변이의 정확도를 확보하기 위해, read depth가 20X 이상(66% 이상의 맵핑율)인 biallelic SNVs 만을 선별하였다(도 6의 단계 3). 이 단계는 전장 유전체 서열데이터에서 낮은 빈도로 발생하는 체세포 변이 발생의 선별의 정확도를 높이기 위해 처리된다. 또한, 체세포 변이 데이터를 선별하기 위해 성염색체인 X 및 Y 염색체는 분석에서 제외하였다(도 6의 단계 4).
실시예 4.2 체세포 변이 데이터의 에러가능성 제거
돌연변이 중 돌연변이가 존재하는 read인 heterozygous read도 3개 이상으로 cutoff를 줌으로써 낮은 빈도로 발생하는 체세포 변이 calling의 정확도를 높였다(도 6의 단계 5)).
선별된 데이터에서 heterozygous reads가 70% 이상 alignment되었을 경우, 체세포 돌연변이가 아닌 생식세포 돌연변이(germline mutation)으로 간주하여 제거하였다(도 6의 단계 6).
실시예 5. 줄기세포의 배양적응 관련 Somatic SNVs 선별
상기 실시예 4의 체세포 변이 데이터로부터, 줄기세포의 배양적응 관련 체세포 변이를 선별하고 정확도를 높이기 위하여, 휴먼 참조 유전체(Reference genome GRCH37 버전; https://www.ncbi.nlm.nih.gov/assembly/GCF_000001405.13/)와 H9-P1(대조군) 사이에서 확인된 변이들은 제거하였다.
상기 변이들은 H9-P1이 가지고 있는 이형접합성 변이 또는 체세포 변이일 수 있고, H9-P2, H9-P3, H9-P4 줄기세포를 H9-P1 줄기세포와 비교하여 배양적응 관련하여 체세포 변이들을 선별할 때 이 변이들의 구성 및 참조는 배양적응 관련하여 발생된 변이인지 원래 가지고 있던 변이인지 식별하기 어렵기 때문이다.
다음으로, H9-P1에서 VAF(Variant Allele Frequency)가 0이거나 H9-P1과 Reference genome 사이에 발생한 동형접합성 형태의 변이이고, H9-P2, H9-P3 및/또는 H9-P4에서 발생한 변이들은 허용 정보로서 선별하였다(도 6의 7단계).
이때, 상기 단계 7)에도 불구하고 VAF가 0일 경우에도 heterozygous read가 0이 아닌 돌연변이들이 일부 존재하였기 때문에, heterozygous read가 단 1개도 존재하지 않는 site를 선별하였다(도 6의 8단계). 구체적으로, Ref genome(GRCH37) 대비 H9-P1에서 발생할 수 있는 가능성을 가진 돌연변이를 추가로 제거하여 줄기세포의 배양적응 관련 체세포 SNVs를 최종 선별한 것이다(도 5의 단계 8)).
이때, dbSNP 서치를 통한 비교 분석 단계를 수행할 경우, 주로 신규 SNVs의 확인은 가능하지만 배양적응에 따라 발생된 SNVs의 확인을 방해할 수 있다. 따라서, 시간 및 공간의 변화에 따른 배양적응의 결과로 생성된 변이를 예측하기 위하여, 선발된 체세포 SNVs은 dbSNP 서치를 통한 비교 분석을 수행하지 않았다. 이 과정들은 in-house script에 의해 처리되었다.
본 발명의 스크리닝 방법에 따르면, 계대배양 횟수의 증가에 따라 배양적응 과정에서 발생될 수 있는 모든 변이를 찾을 수 있어. 배양적응 줄기세포를 분석하는 방법에 유용하게 적용될 수 있다.
그 결과, 도 6에 나타낸 것과 같이, 변이와 관련된 줄기세포-관련 유전자를 도출하였다. 상기 유전자를 이용하여 계대배양된 줄기세포를 평가하면, 줄기세포가 Stemness를 유지하면서도 시간에 따른 배양적응성이 발생하였는지 효과적으로 평가할 수 있다.
최종 선발된 somatic SNVs은 SnpEff를 이용하여 annotation이 수행되었다. 또한 GeneCards 데이터베이스로부터 수집된 stem cell-related markers(i.e. pluripotency, stemness, cell cycle 등의 기능 관련)을 상대로 effect mutations(high 또는 moderate impact mutations)을 조사하였다. Mutation(s)을 가지고 있는 protein-coding genes에 대한 functional annotation이 수행되었다.
그 결과, 도 10에 나타낸 것과 같이, 도출된 변이의 관련 경로를 분석해, 기능적 요소를 식별하는 functional annotation 결과를 도출하였다.
그리고 나서, H9-P1 대비 H9-P2, H9-P3, H9-P4에서 공통적으로 발생한 체세포 변이 정보를 1차적으로 단기 및 장기 계대배양에 따라 공통적으로 발생 가능한 배양적응형 체세포 변이로 간주하고 선별한다. 또한 H9-P3, H9-P4에서 공통적으로 발생한 체세포 변이 정보를 2차적으로 추출하였다(장기 계대배양에 따라 공통적으로 발생 가능한 변이 그룹). 그리고 나서 H9-P1 대비 H9-P2, H9-P3, 또는 H9-P4에서 특이적으로 발생한 체세포 변이를 선별하였다.
그 결과, 도 11에 나타낸 것과 같이, 줄기세포 계대배양 관련-변이가 선별되었으며, 인트론 및 미스센스에 존재하는 변이가 모두 선별 가능하였다. 특히 계대배양의 축척에 따라, CHD1, CHD7, COL9A1, CTNNA1, DNMT3B, EP300, FGF1, FGFR1, NOTCH2, NR6A1, NUMB, SCN1A, SMAD1, TP53, TRIM28 등의 체세포 변이가 발생함을 확인하였다.
이후, 선별된 체세포 변이를 검증하는 단계를 추가적으로 수행하였다.
1: Raw FASTQ 2: Clean FASTQ
3: Raw BAM 4: Deduplicated BAM
5: BQSR Applied BAM 6: Pair Simple VCF
7: Filtered Mutack call 8: Annotated Pair Sample VCF
9: GATK somatic pipeline 100: 데이터 수신부
110: DNA 분석 기기
130: 제1 그룹 줄기세포 데이터 수신부
160: 제2 그룹 줄기세포 데이터 수신부
190: 제3 그룹 줄기세포 데이터 수신부
200: 데이터 분석부 300: 배양적응성 관련 분석부
400: 체세포 변이 제공부

Claims (12)

  1. 전장 게놈 시퀀싱(Whole genome sequencing, WGS) 분석을 이용하여 줄기세포의 유전체 정보를 획득하는 단계;
    상기 유전체 정보로부터 체세포 변이(Somatic mutation)에 관한 정보를 선별하는 단계; 및
    상기 정보를 계대배양 횟수가 상이하거나 계대배양되지 않은 줄기세포의 체세포 변이 정보와 비교하여, 줄기세포의 배양적응과 관련된 체세포 변이를 선별하는 단계를 포함하는, 줄기세포 배양적응성(Culture adaptation) 관련 체세포 변이를 선별하는 방법으로서,
    상기 체세포 변이에 관한 정보를 선별하는 단계는
    하기 (1) 내지 (7)으로 구성된 군으로부터 선택된 하나 이상의 조건을 만족하는 체세포 변이를 선별하는 것인, 체세포 변이를 선별하는 방법:
    (1) Biallelic Somatic SNV인 돌연변이;
    (2) Mapping read depth가 20 이상인 돌연변이;
    (3) 성염색체에 존재하지 않는 돌연변이;
    (4) 생식세포 돌연변이(Germline mutation)를 제외한 돌연변이;
    (5) Heterozygous reads가 3 이상인 돌연변이;
    (6) Heterozygous read의 비율이 70% 이하인 돌연변이; 및
    (7) 드노보 변이(de novo mutation) 또는 삽입 및 결실 돌연변이(Insertions and Deletions, InDels)를 제외한 돌연변이.
  2. 제1항에 있어서,
    상기 줄기세포 배양적응성은 (i) 줄기세포 유효성(Stemness) 여부 또는 (ii) 배양으로 인한 유전적 안정성(Genome stability)의 변화 여부를 판단하는 것인, 체세포 변이를 선별하는 방법.
  3. 제1항에 있어서,
    줄기세포의 유전체 정보를 획득하는 단계는
    동일한 유전적 특징을 가지는 줄기세포로서, 0회 내지 45회 미만 계대배양된 제1 그룹 줄기세포, 45회 내지 120회 미만 계대배양된 제2 그룹 줄기세포, 120회 내지 400회 미만 계대배양된 제3 그룹 줄기세포 및 400회 내지 700회 계대배양된 제4 그룹 줄기세포의 유전체 정보를 획득하는 단계인 것인, 체세포 변이를 선별하는 방법.
  4. 제1항에 있어서,
    줄기세포의 유전체 정보를 획득하는 단계는
    동일한 유전적 특징을 가지는 줄기세포로서, 40회 내지 50회 계대배양된 제1 그룹 줄기세포, 100회 내지 120회 계대배양된 제2 그룹 줄기세포, 200회 내지 250회 계대배양된 제3 그룹 줄기세포 및 400회 내지 450회 계대배양된 제4 그룹 줄기세포의 유전체 정보를 획득하는 단계인 것인, 체세포 변이를 선별하는 방법.
  5. 삭제
  6. 제1항에 있어서,
    상기 체세포 변이는 체세포 SNV(Single-Nucleotide Variation, SNV)인 것인, 체세포 변이를 선별하는 방법.
  7. 삭제
  8. 제3항 또는 제4항에 있어서,
    줄기세포의 배양적응과 관련된 체세포 변이를 선별하는 단계는 하기 i) 내지 iv)로 구성된 군에서 선택된 하나 이상의 조건을 만족하는 체세포 변이를 선별하는 것인, 체세포 변이를 선별하는 방법:
    i) 상기 제1 그룹과 비교하여 상기 제2 그룹에서 발생한 체세포 변이;
    ii) 상기 제1 그룹과 비교하여 상기 제3 그룹에서 발생한 체세포 변이;
    iii) 상기 제1 그룹과 비교하여 상기 제4 그룹에서 발생한 체세포 변이;
    iv) 상기 제1 그룹과 비교하여 상기 제2 그룹, 상기 제3 그룹 및 상기 제4 그룹에서 발생한 체세포 변이; 및
    v) 상기 제1 그룹과 비교하여 상기 제3 그룹 및 상기 제4 그룹에서 발생한 체세포 변이.
  9. 제1항에 있어서,
    상기 줄기세포의 배양적응과 관련된 체세포 변이를 선별하는 단계는 dbSNP 데이터베이스(Single Nucleotide Polymorphism Database), ExAC 데이터베이스(Exome Aggregation Consortium database) 또는 GnomAD(The Genome Aggregation Database)를 기반으로 검색을 수행하지 않은 것인, 체세포 변이를 선별하는 방법.
  10. 제1항에 있어서,
    선별된 배양적응성 관련 체세포 변이를 검증하는 단계를 추가적으로 포함하는 것인, 체세포 변이를 선별하는 방법.
  11. 전장 게놈 시퀀싱에 기초하여 줄기세포 배양적응성 관련 체세포 변이를 선별하는 시스템에 있어서,
    전장 게놈 시퀀싱을 이용한 줄기세포의 유전체 분석 데이터를 수신하는 데이터 수신부;
    상기 데이터 수신부를 통해 입력된 줄기세포의 유전체 데이터에서 체세포 변이를 선별하는 데이터 분석부;
    상기 데이터 분석부를 통해 입력된 데이터에서 줄기세포의 배양적응과 관련된 체세포 변이를 선별하는 배양적응성 관련 분석부; 및
    상기 배양적응성 관련 분석부를 통해 입력된 데이터를 검증하여 제공하는 체세포 변이 제공부를 포함하는 시스템으로서,
    상기 배양적응성 관련 분석부는
    하기 (1) 내지 (7)으로 구성된 군으로부터 선택된 하나 이상의 조건을 만족하는 체세포 변이를 선별하는 것인, 시스템:
    (1) Biallelic Somatic SNV인 돌연변이;
    (2) Mapping read depth가 20 이상인 돌연변이;
    (3) 성염색체에 존재하지 않는 돌연변이;
    (4) 생식세포 돌연변이(Germline mutation)를 제외한 돌연변이;
    (5) Heterozygous reads가 3 이상인 돌연변이;
    (6) Heterozygous read의 비율이 70% 이하인 돌연변이; 및
    (7) 드노보 변이(de novo mutation) 또는 삽입 및 결실 돌연변이(Insertions and Deletions, InDels)를 제외한 돌연변이.
  12. 제11항의 시스템의 기능을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
KR1020210178182A 2021-12-14 2021-12-14 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법 KR102427600B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210178182A KR102427600B1 (ko) 2021-12-14 2021-12-14 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210178182A KR102427600B1 (ko) 2021-12-14 2021-12-14 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법

Publications (1)

Publication Number Publication Date
KR102427600B1 true KR102427600B1 (ko) 2022-08-01

Family

ID=82844244

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210178182A KR102427600B1 (ko) 2021-12-14 2021-12-14 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법

Country Status (1)

Country Link
KR (1) KR102427600B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116189765A (zh) * 2023-02-23 2023-05-30 上海捷易生物科技有限公司 一种iPS细胞遗传学风险评估系统及应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180060764A (ko) * 2016-11-29 2018-06-07 연세대학교 산학협력단 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
KR20190136733A (ko) * 2018-05-31 2019-12-10 한국과학기술원 유전체 변이 정보를 이용한 질병 진단 바이오마커 추출 방법
KR20200012530A (ko) * 2018-07-27 2020-02-05 주식회사 녹십자지놈 전장유전체 시퀀싱 기반의 염색체 이상 검출 방법 및 그 용도
KR20210083208A (ko) * 2018-11-01 2021-07-06 일루미나, 인코포레이티드 체세포 변이 검출을 위한 방법 및 조성물
KR20210089240A (ko) * 2018-11-13 2021-07-15 미리어드 제네틱스, 인크. 체세포성 돌연변이를 위한 방법 및 시스템 그리고 그 용도
KR20210120782A (ko) * 2020-03-27 2021-10-07 울산과학기술원 피검 대상 맞춤형 변이체 기반 레퍼런스 데이터 세트의 구축 방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180060764A (ko) * 2016-11-29 2018-06-07 연세대학교 산학협력단 염기서열의 변이 검출방법 및 이를 이용한 염기서열의 변이 검출 디바이스
KR20190136733A (ko) * 2018-05-31 2019-12-10 한국과학기술원 유전체 변이 정보를 이용한 질병 진단 바이오마커 추출 방법
KR20200012530A (ko) * 2018-07-27 2020-02-05 주식회사 녹십자지놈 전장유전체 시퀀싱 기반의 염색체 이상 검출 방법 및 그 용도
KR20210083208A (ko) * 2018-11-01 2021-07-06 일루미나, 인코포레이티드 체세포 변이 검출을 위한 방법 및 조성물
KR20210089240A (ko) * 2018-11-13 2021-07-15 미리어드 제네틱스, 인크. 체세포성 돌연변이를 위한 방법 및 시스템 그리고 그 용도
KR20210120782A (ko) * 2020-03-27 2021-10-07 울산과학기술원 피검 대상 맞춤형 변이체 기반 레퍼런스 데이터 세트의 구축 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Theragen Etex Bio Research Institute, "Study to establish a quantitative analysis method for culture-adapted undifferentiated pluripotent stem cells", ScienceON. (2019.07.13.) *
테라젠이텍스 바이오연구소, "배양적응 미분화 만능줄기세포 정량 분석법 확립 연구", ScienceON. (2019.07.13.)*

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116189765A (zh) * 2023-02-23 2023-05-30 上海捷易生物科技有限公司 一种iPS细胞遗传学风险评估系统及应用
CN116189765B (zh) * 2023-02-23 2023-08-15 上海捷易生物科技有限公司 一种iPS细胞遗传学风险评估系统及应用

Similar Documents

Publication Publication Date Title
Miga et al. Telomere-to-telomere assembly of a complete human X chromosome
Mc Cartney et al. Chasing perfection: validation and polishing strategies for telomere-to-telomere genome assemblies
Carlson et al. Extremely rare variants reveal patterns of germline mutation rate heterogeneity in humans
Yépez et al. Clinical implementation of RNA sequencing for Mendelian disease diagnostics
Lindsay et al. Similarities and differences in patterns of germline mutation between mice and humans
Jain et al. Nanopore sequencing and assembly of a human genome with ultra-long reads
Seo et al. De novo assembly and phasing of a Korean human genome
García-García et al. Assessment of the latest NGS enrichment capture methods in clinical context
Yao et al. Exploring the rice dispensable genome using a metagenome-like assembly strategy
Guo et al. Three-stage quality control strategies for DNA re-sequencing data
Hermsen et al. Genomic landscape of rat strain and substrain variation
CN107849612B (zh) 比对和变体测序分析管线
Harringmeyer et al. Chromosomal inversion polymorphisms shape the genomic landscape of deer mice
Tatsumoto et al. Direct estimation of de novo mutation rates in a chimpanzee parent-offspring trio by ultra-deep whole genome sequencing
He et al. Genome structural evolution in Brassica crops
Adetunji et al. Variant analysis pipeline for accurate detection of genomic variants from transcriptome sequencing data
Johnsen et al. Massively parallel sequencing: the new frontier of hematologic genomics
Wood et al. Recommendations for accurate resolution of gene and isoform allele-specific expression in RNA-Seq data
Contino et al. Whole-genome sequencing of nine esophageal adenocarcinoma cell lines
Marin et al. High-throughput interpretation of killer-cell immunoglobulin-like receptor short-read sequencing data with PING
Mahamdallie et al. The ICR96 exon CNV validation series: a resource for orthogonal assessment of exon CNV calling in NGS data
KR102427600B1 (ko) 줄기세포의 배양적응성을 판단하기 위한 체세포 변이를 선별하는 방법
Shomroni et al. A novel single-cell RNA-sequencing approach and its applicability connecting genotype to phenotype in ageing disease
Niehus et al. PopDel identifies medium-size deletions simultaneously in tens of thousands of genomes
Gong et al. Evolution of the sex-determining region in Ginkgo biloba

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant