KR101920795B1 - 조직 간 유사성 및 분화 수준에 대한 정보 제공 방법 - Google Patents
조직 간 유사성 및 분화 수준에 대한 정보 제공 방법 Download PDFInfo
- Publication number
- KR101920795B1 KR101920795B1 KR1020170079882A KR20170079882A KR101920795B1 KR 101920795 B1 KR101920795 B1 KR 101920795B1 KR 1020170079882 A KR1020170079882 A KR 1020170079882A KR 20170079882 A KR20170079882 A KR 20170079882A KR 101920795 B1 KR101920795 B1 KR 101920795B1
- Authority
- KR
- South Korea
- Prior art keywords
- dna
- artificial sequence
- liver
- gene
- liver tissue
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56966—Animal cells
-
- G06F19/20—
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Organic Chemistry (AREA)
- Cell Biology (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Biomedical Technology (AREA)
- Urology & Nephrology (AREA)
- Hematology (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Tropical Medicine & Parasitology (AREA)
- Food Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Virology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보 제공 방법, 상기 정보를 제공하기 위한 컴퓨터 프로그램, 및 분화 유도 인자의 분화 유도능을 검정하는 방법에 관한 발명이다. 본 발명의 정보 제공 방법은 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준을 정량적 수치로 표현하여, 장기 유사체의 분화 및 발달 상태를 정량적으로 검증하고, 보다 개체에 적합한 유사체를 제작할 수 있는 정보를 제공한다.
Description
본 발명은 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보 제공 방법, 및 이를 위한 컴퓨터 프로그램에 관한 것이다. 또한, 본 발명은 분화 유도 인자의 분화 유도능을 검정하는 방법에 관한 것이다.
3차원 구조 모델은 인간 장기의 배양 환경과 구조적 복잡성을 근접하게 모방하기 때문에, 2D 조직-특이적 세포뿐만 아니라 3D 조직-유사 구조는 약리학적 및 독성학적 산업에서 질병 모델링과 약물 스크리닝을 위한 성공적인 미래 모델이 될 것으로 연구자들은 내다보고 있다.
이에, 3차원 구조를 만들기 위한 기술이 개발되어 왔으며, 이는 세포 응집, 공동-배양 체계와 세포외 기질, 또는 배아 줄기 세포(ESCs) 또는 유도된 다분화능 줄기 세포(iPSC)와 같은 인간 다분화능 줄기 세포(hPSC)로부터 얻어지는 분화 체계로 이루어지는 회전타원체의 배양 체계 등을 포함한다.
일례로, iPSC로부터 얻어진 간세포의 쥐로의 이식을 통해 혈관형성은 쥐의 조직에서 발생되고, 이식 되어진 간세포에서 알부민의 분비가 일어남을 확인되었다. 그러므로, 간 오르가노이드는 대상요법을 위한 적당한 자원이고 간 질환의 치료를 위한 유용한 재료이다.
그러나, iPSC로부터 세포 분화 및 간세포의 3D 배양에 의한 간 오르가노이드 모델은 완전히 간 장기의 구조를 완전히 설명할 수 없다. 일반적으로, 간세포 3D 배양 또는 iPSC로부터 유래한 간세포의 분화 상태를 평가하기 위해, 간-특이적 계통 마커가 PCR, 웨스턴 블랏 분석 및 면역세포화학 분석을 통해 확인 하였으며, 간 오르가노이드와 간을 비교하는 마이크로어레이 분석을 통한 유전자 발현 패턴의 비교 분석을 통해 제작된 간 오르가노이드의 수준을 평가 하였다. 그러나, 단순히 유전자 발현 패턴 및 간-특이적 계통 마커의 발현 수준의 비교는 간세포 3D 배양 또는 iPSC에서 유래된 간세포의 성숙(maturation) 또는 분화 정도를 정량적으로 판단하기에는 한계점이 존재한다. 즉 상기와 같은 발현 패턴 및 마커의 수준은 조직 간 유사성이나 분화 정도에 대한 정량적인 정보를 제공하지 않는 문제점이 있다.
이처럼, 실제 장기와 유사한 오르가노이드의 개발의 필요성에도 불구하고, 얼마나 유사한지, 분화 수준이 어느 정도인지에 대한 정량적 평가는 이루어지지 않고 있는 실정이다.
한편, 한국 공개 특허 제10-2013-0138729호에는 간 오르가노이드, 그의 용도 및 이를 수득하기 위한 배양 방법에 대해 개시하고 있으나, 이 역시 오르가노이드를 제조하는 방법에 그칠 뿐, 상기 제조된 오르가노이드와 실제 간이 얼마나 유사한지 여부에 대해서는 정보를 제공하지 못하는 문제점이 있다.
이러한 배경 하에서, 본 발명자들은 특정 조직과의 유사성 및, 분화 상태를 정량적으로 나타낼 수 있는 방법을 개발하고자 연구한 결과, 연구자들에게 다양한 조직-특이적 세포 또는 오르가노이드의 분화 정보를 제시할 수 있는, 특정 조직과의 유사성의 정도를 전사체 분석을 통해 정량적 수치 (%)로 나타낼 수 있음을 확인하여, 본 발명을 완성하였다.
본 발명의 하나의 목적은 분리된 검체 세포에서 측정된 목적 조직 특이적 유전자의 발현량을 하기 수학식 1에 적용하는 단계를 포함하는, 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보 제공 방법을 제공하는 것이다.
[수학식 1]
상기 수학식 1에서 A i , B i , C i 는 각기 다른 경우의 수이다. 지시함수 I(u i - U i > 0) = I (z i > 0) =1과 I(u i - U i ≤ 0) = I (z i ≤ 0) = 0을 이용하여, 각각 I(y i - U i > 0)·I(z i > 0), I(y i - U i ≤ 0)·I(z i > 0), I(y i - U i > 0)·I(z i ≤ 0)의 세 가지 경우의 수를 세어 A i , B i , C i 를 구성한다. y i 는 목적 조직 시료의 i번째 유전자 FPKM (fragments per kilobase of exon model per million mapped reads) 값, U i 는 윌콕슨 부호-순위 검정 (Wilcoxon signed-rank test)의 100 × (1-α) % 신뢰구간의 상한값, z i 는 검체 세포의 FPKM 값(u i )과 U i 의 차 (u i - U i )이다.
본 발명의 다른 하나의 목적은 (a) 분화 유도 인자를 검체 세포에 처리하는 단계; 및 (b) 상기 분화 인자가 처리된 검체 세포에서 측정된 목적 조직 특이적 유전자의 발현량을 상기 수학식 1에 적용하는 단계를 포함하는 분화 유도 인자의 분화 유도능을 검정하는 방법을 제공하는 것이다.
본 발명의 또 다른 하나의 목적은 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보를 제공하기 위한, 매체에 저장된 컴퓨터 프로그램으로서, 상기 프로그램은 입력된 검체 세포에서 측정된 목적 조직 특이적 유전자의 발현량을 상기 수학식 1에 적용하는 단계를 포함하는, 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보를 제공하기 위한 컴퓨터 프로그램을 제공하는 것이다.
상기 목적을 달성하기 위한, 본 발명의 하나의 양태는 분리된 검체 세포에서 측정된 목적 조직 특이적 유전자의 발현량을 하기 수학식 1에 적용하는 단계를 포함하는, 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보 제공 방법을 제공하는 것이다.
[수학식 1]
상기 수학식 1에서 A i , B i , C i 는 각기 다른 경우의 수이다. 지시함수 I(u i - U i > 0) = I (z i > 0) =1과 I(u i - U i ≤ 0) = I (z i ≤ 0) = 0을 이용하여, 각각 I(y i - U i > 0)·I(z i > 0), I(y i - U i ≤ 0)·I(z i > 0), I(y i - U i > 0)·I(z i ≤ 0)의 세 가지 경우의 수를 세어 A i , B i , C i 를 구성한다. y i 는 목적 조직 시료의 i번째 유전자 FPKM (fragments per kilobase of exon model per million mapped reads) 값, U i 는 윌콕슨 부호-순위 검정 (Wilcoxon signed-rank test)의 100 × (1-α) % 신뢰구간의 상한값, z i 는 검체 세포의 FPKM 값(u i )과 U i 의 차 (u i - U i )이다.
구체적으로, A i 는 목적 조직 시료의 i번째 유전자가 목적 조직 특이적 발현 유전자이며, 검체 세포에서 상기 유전자가 과발현되는 경우를 나타내고, B i 및 C i 는 목적 조직 시료의 i번째 유전자가 목적 조직에 비특이적이거나, 특이적이라도 검체 세포에서 발현되지 않는 경우를 나타낸다.
본 발명에서는, 상기와 같은 경우의 수를 계산하여, 목적 조직에서 특이적으로 발현하는 유전자의 발현량을 이용하여 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보 제공 방법을 제공할 수 있다.
본 발명의 구체적인 일 양태는 상기 분화 수준이 정량적 수치인 정보 제공 방법을 제공하는 것이다.
본 발명자들은 특정 목적 조직 (예를 들어, 뼈, 뇌, 결장, 간, 심장, 신장, 폐, 태반, 전립선, 골격근, 소장, 척추, 비장, 위, 고환, 흉선, 자궁 등)에서 특이적으로 발현되는 유전자를 이용하여, 목적 조직 특이적 발현 패널 구축 및 분화/발달 상태를 검증할 수 있는 알고리즘을 구현한 후, 검증하고자 하는 검체 세포의 유전자 발현량을 상기 알고리즘에 대입하여, 상기 검체 세포와 목적 조직과의 유사성, 또는 목적 조직으로의 분화 수준에 대한 정량적 정보를 제공할 수 있음을 확인하였다.
본 발명의 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보 제공 방법은 정량화된 수치(%)로 유사성 또는 분화 수준의 정보를 제공할 수 있고, 이는 보다 정확한 조직 간 유사성 및 분화 정도에 대한 정보를 제공할 수 있는 장점이 있다.
본 발명의 상기 알고리즘은 목적 조직의 분화 및 발달 상태를 검증할 수 있는 알고리즘으로서,
(ⅰ) 목적 조직과 목적 조직이 아닌 다른 조직 (비 목적 조직)에서 발현되는 유전자의 발현량을 측정, 및 비교하는 단계;
(ⅱ) 목적 조직에서 특이적으로 발현되는 유전자를 선별하는 단계;
(ⅲ) 상기 선별된 유전자를 검증하여 최종 목적 조직 특이적 유전자를 선별하는 단계; 및
(ⅳ) 상기 선별된 최종 목적 조직 특이적 유전자의 발현 정보로부터 목적 조직인지 여부를 결정하는 참조값을 설정하는 단계로부터 구축되는 알고리즘이다.
상기 알고리즘은 목적 조직의 분화 및 발달 상태를 검증하기 위해, 상기 단계에서 결정된 목적 조직 특이적 유전자와 참조값을 이용하여 목적 조직과 검체 세포의 유사 정도를 수치화하는 단계를 추가적으로 포함할 수 있다.
구체적으로, 상기 수치화하는 단계는, 이에 제한되지 않으나,
(a) 검체 세포의 각 유전자 발현량을 상기에서 설정된 참조값과 비교하여, 상기 참조값을 초과하는지 여부를 확인하는 단계로서, 구체적으로, 지시함수인 과 에 발현량 및 참조값을 대입하여 해당하는 경우의 수를 결정하는 단계;
(b) 상기 (a)의 과정을 목적 조직 특이적 유전자 전체에 대해 반복하는 단계;
(c) 지시함수를 통해 경우의 수가 결정된, 각 경우의 수에 속하는 유전자를 계수하는 단계; 및
(d) 목적 특이적 유전자 중 목적 조직 시료와 검체 세포에서 모두 높게 발현된 유전자의 수를 세어 백분율로 계산하는 단계를 포함할 수 있다.
상기 지시함수를 통해 구분되는 경우의 수는, 목적 조직과 시료에서의 발현량의 관계를 구분한 경우의 수로서, 구체적으로, 목적 조직에서는 높게 발현하였으나 검체 세포에서 높게 발현하지 않은 경우 (); 검체 세포에서는 높게 발현하였으나 목적 조직에서는 높게 발현하지 않은 경우() 및; 목적 조직과 검체 세포 모두 높게 발현된 경우 ()로 구별된다.
본 발명에서는 상기와 같이 구별된 경우의 수로부터 목적 조직 특이적 유전자로서, 검체 세포에서 과발현 되는 유전자의 수를 계산하여, 목적 조직과의 유사성을 정량화된 수치로 분석하는 것을 특징으로 한다.
본 발명자들은 목적 조직으로서, 간을 선정하여 간과 간이 아닌 조직에서 발현량의 차이가 현저한 93개 유전자를 선별하여, 이를 목적 조직 (간) 특이적 유전자로 선별하였으며, "LiGEP (Liver-specific Gene Expression Panel) 유전자"로 명명하였다 (표 3). 목적 조직이 간이 아닌, 다른 조직일 경우, 목적 조직 특이적 유전자는 상이할 수 있음은 당업자에게 자명하다. 또한, 간을 목적 조직으로 하는 경우라도, 선별된 유전자나 유전자의 개수는 본 발명에서 선별한 유전자와 상이할 수 있다.
특정 조직에서 발현되는 유전자는 실제 조직에서 발현되는 유전자의 발현량을 측정하여 선별할 수 있고, 또는 공지된 데이터베이스, 문헌 등 당업계에서 알려진 유전자로부터 선별할 수도 있다.
본 발명자들에 의해 구축된 알고리즘은 하기 수학식 1로 표현된다.
[수학식 1]
상기 수학식 1에서 A i , B i , C i 는 각기 다른 경우의 수이다. 지시함수 I(u i - U i > 0) = I (z i > 0) =1과 I(u i - U i ≤ 0) = I (z i ≤ 0) = 0을 이용하여, 각각 I(y i - U i > 0)·I(z i > 0), I(y i - U i ≤ 0)·I(z i > 0), I(y i - U i > 0)·I(z i ≤ 0)의 세 가지 경우의 수를 세어 A i , B i , C i 를 구성한다. y i 는 목적 조직 시료의 i번째 유전자 FPKM (fragments per kilobase of exon model per million mapped reads) 값, U i 는 윌콕슨 부호-순위 검정 (Wilcoxon signed-rank test)의 100 × (1-α) % 신뢰구간의 상한값, z i 는 검체 세포의 FPKM 값(u i )과 U i 의 차 (u i - U i )이다.
본 발명의 구체적인 일 실시 양태는 다음과 같을 수 있으나, 이에 제한되는 것은 아니다. 특히, 목적 조직이나 목적 조직 특이적 유전자는 당업계의 알려진 방법을 통해 다양하게 선정될 수 있다.
구체적으로, 선별된 목적 조직 특이적 유전자, 즉 LiGEP 유전자와 참조값 를 이용하여, 검체 세포와 목적 조직, 예를 들어, 간과의 유사성을 확인한다. 참조값을 검체 세포에서 발현되는 유전자의 발현량과 비교하여, 가능한 경우의 수를 구분하였다. 즉, 간에서는 높게 발현하였으나 검체 세포에서 높게 발현하지 않은 경우, 검체 세포에서는 높게 발현하였으나 간에서 높게 발현하지 않은 경우를 제외하고, 간 및 검체 세포에서 동시에 높게 발현하는 유전자를 세어 백분율 수치를 구함으로써, 간 (목적 조직)과 검체 세포의 유사성을 계산하였다.
본 발명에서는 시험관내에서 분화된 간세포 또는 3D 배양된 세포의 분화 상태를 평가하고 분화 검증을 위한 기술적 한계를 극복하기 위해 RNA-seq 분석을 기반으로 한 새로운 알고리즘을 개발하였다.
구체적으로, 본 발명의 실시예에서는 20개 장기-유래 조직의 RNA-seq를 통한 93개의 간-특이적 유전자(LiGEP)를 스크리닝하고 (표 3), 인간 ATLAS 데이터베이스의 32개 조직의 RNA-seq결과 비교 분석 및 인간의 필수 장기(뇌, 심장, 신장, 폐, 결장, 소장 및 위) cDNA의 real-time PCR 분석 및 정량적 실시간 PCR 분석을 사용하여 이를 검증하였다. 또한, hPSC 유래 간세포 또는 간세포 3D 배양 세포와 사람 간과의 간 유사성 (%)을 계산하기 위한, 상기 수학식 1과 같은 분석 알고리즘 (LiGEP 알고리즘)을 개발하고, 730개의 정상 샘플을 이용하여 LiGEP 알고리즘에 대한 정확도 시험을 수행했다 (도 1 내지 3). 그 결과, 본 발명자가 제안하는 LiGEP 알고리즘이 간에 대한 유사성을 % 수치로 나타낼 수 있음을 확인하였다.
또한, LiGEP 알고리즘의 활용을 위해, 마우스 발달단계 별 간에 대한 유사도 분석을 통해 간의 발달이 증가할수록 간 유사성 %가 증가됨을 확인함으로써 간의 분화 단계에서 "분화 지표"의 가능성을 제시하하였으며, HepaRG 3D 배양물 및 hPSC-유래 간세포에 대한 유사도 분석을 통해 59% 및 32%의 간 유사성 점수를 얻었다. 따라서, LiGEP 알고리즘의 적용은 연구자들에게 정략적 분화 퍼센트를 제공 할 수 있음을 확인하였다.
본 발명에 의해 제공되는 조직 유사성 및 분화 수준에 대한 정보는 오르가노이드 같은 고품질의 세포 또는 조직의 생성을 위한 매우 중요한 정보로의 이용이 될 것이며, 상기 알고리즘은 간 이외의 다양한 인간 조직-특이적 분화 세포 및 오르가노이드의 제작에 사용될수 있다.
본 발명자들에 의해 구축된 상기 알고리즘은 특정 조직의 특성, 선별된 유전자, 또는 상기 선별된 유전자의 수에 의존하지 않고 적용될 수 있으므로, 본 발명의 실시예에서 사용된 간, 및 간 특이적 93개 유전자뿐만 아니라, 다른 목적 조직이나 유전자를 상기 알고리즘에 적용하여 조직간 유사성 및 분화 정도를 판단할 수 있다.
본 발명의 용어, “검체”는 목적 조직과의 유사성을 확인하고자 하는 대상을 의미하며, 이에 제한되지 않으나, 조직 세포, 줄기 세포 로부터 분화된 세포, 세포 3차원 배양, 장기 유사체, 또는 오가노이드 등을 의미할 수 있고, 본 발명의 “목적 조직”은 상기 검체 세포와 비교되는 대상으로서, 개체로부터 적출된 장기 등이 될 수 있으나, 이에 제한되지 않는다. 상기 목적 조직은 상기 검체 세포가 획득하고자 하는 특성을 가지거나, 특정 유전자 발현 양상을 나타낼 수 있으며, 또한, 검체 세포와 발달 상태가 상이한, 동일한 조직의 세포일 수 있고, 발달 상태에 따라 다른 유전자의 발현 양상을 나타낼 수 있다.
본 발명의 구체적인 일 양태는 상기 목적 조직은 뼈, 뇌, 결장, 간, 심장, 신장, 폐, 태반, 전립선, 골격근, 소장, 척추, 비장, 위, 고환, 흉선, 또는 자궁일 수 있고, 보다 구체적으로는 간일 수 있으나, 이에 제한되지 않는다.
본 발명의 구체적인 다른 양태는 상기 목적 조직은 개체로부터 적출된 장기, 줄기세포로부터 분화된 세포, 또는 장기 유사체일 수 있으나, 이에 제한되지 않는다.
본 발명의 구체적인 또 다른 양태는 상기 줄기세포는 배아 유래 줄기세포, 또는 유도 만능 줄기세포 (induced pluripotent stem cells, iPSC)일 수 있으나, 장기 유사체로 배양될 수 있는 한, 이에 제한되지 않는다.
본 발명의 용어, “장기 유사체”는 3차 구조를 가지는, 시험관 내에서 소형화, 단순화된 세포의 3차원 응집을 의미하며, “오르가노이드(organoid)”, 또는 “오가노이드”라고도 한다. 조직 세포, 배아 줄기 세포, 유도 만능 줄기 세포 등에서 유래된 세포가 자가 재생 및 분화능을 이용하여 3차원 배양물에서 자가 구조화(self-organize)하여 생성된다. 서스펜션 세포 배양물로부터 형성된 세포 클러스터를 포함한다. 간, 뇌, 흉선, 장 등 다양한 장기의 세포와 유사한 특성을 가지므로, 다양한 연구에서 활용된다.
본 발명의 용어, “목적 조직 특이적 유전자”는 목적 조직과 비 목적 조직에서 발현량 차이가 현저하여, 조직간의 구별을 가능케 하는 유전자로, 목적 조직이나 선별 방법에 따라, 목적 조직 특이적 유전자는 달라질 수 있다.
그 예로, 목적 조직이 간일 경우, 표 3에 개시된 93개 유전자일 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 용어, “목적 조직과의 유사성”은 검체 세포가 목적 조직과 유사한 정도를 의미하며, 본 발명의 목적 조직과의 유사성에 대한 정보 제공 방법은 상기 유사성을 정량화된 % 수치로 제공된다. 유사한 정도에 따라 0% 에서 100%의 수치로 표현된다.
본 발명의 용어, “목적 조직으로의 분화 수준”은 검체 세포가 목적 조직의 발달 또는 분화 상태와 얼마나 가까운지를 의미하며, 본 발명의 목적 조직과의 유사성에 대한 정보 제공 방법은 검체 세포와 목적 조직이 동일한 조직의 세포라 하더라도 그 발달 상태에 따라 목적 조직에 대한 유사성 점수가 증가 또는 감소하는 것을 통해, 검체 세포의 분화 정도를 정량화된 % (0 내지 100) 수치로 제공된다.
본 발명의 일 실시예에서는 성인 및 태아의 간의 RNA-seq 결과를 본 발명의 알고리즘에 적용한 결과, 태아 간의 간 유사성 점수가 성인 간 유사성의 점수보다 낮은 것을 확인하였으며(도 4), 또한, 쥐의 간이 발달 단계에 따라 간 유사성의 점수가 점차 증가하는 것을 확인하였다 (도 5).
본 발명의 다른 실시예에서는 다양한 방법으로 제조된 간 유사체의 간 유사성을 추정하였으며, 그 결과, 간세포 3D 배양으로 제조된 세포가 간세포 2D 배양한 간 유사성 점수보다 높은 것을 확인하였다 (도 6).
본 발명의 또 다른 실시예에서는 hPSC (human pluripotent stem cell) 유래 간 세포 유사체 (유사 세포) 및 신경 전구 세포 (neural progenitor cell, NPC)를 배양하고, 간 유사성 점수를 확인하였다. 그 결과, hPSC 유래 간 세포 유사체는 hiPSC 유래 간 세포 유사체와 간 유사성 점수가 유사한 반면, hPSC 유래의 신경 전구 세포는 미분화 hPSC의 간 유사성 점수와 유사한 것을 확인하였다 (도 6).
이를 통해, 본 발명자들은 본 발명의 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보 제공 방법이 목적 조직과 비 목적 조직 간의 구별뿐만 아니라, 동일한 목적 조직의 발달 상태에 대한 정보도 제공할 수 있음을 확인하였다.
본 발명의 용어, "FPKM (fragments per kilobase of exon model per million mapped reads)"은 RNA-Seq의 결과 분석에 사용되는 한 단위로서, 맵핑된 백만 분획당 천염기 엑손당 분획을 나타내며, 유전자의 발현량을 나타내기 위해 다음과 같은 식으로 계산된다.
본 발명의 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보 제공 방법은 임의의 장기 유사체(검체 세포)가 얼마나 목적 조직과 유사한지, 목적 조직으로의 분화가 어느 정도 수준으로 이루어 졌는지 등에 대한 정보를 제공함으로써, 제조된 장기 유사체의 검증, 적합성 판단 등에 활용될 수 있다.
본 발명의 구체적인 또 다른 양태는 상기 목적 조직 특이적 유전자는 목적 조직에서의 발현량이 목적 조직이 아닌 다른 조직에서의 발현량과 비교하여 2배 이상 높은 발현량을 나타내는 유전자인 정보 제공 방법을 제공하는 것이다.
본 발명의 구체적인 또 다른 양태는 상기 목적 조직 특이적 유전자의 발현량 측정은 상기 유전자의 mRNA 발현 수준 또는 상기 유전자가 코딩하는 단백질의 발현 수준을 측정하는 것인 정보 제공 방법을 제공하는 것이다.
본 발명의 구체적인 또 다른 양태는 상기 목적 조직 특이적 유전자의 mRNA 발현수준을 측정하는 것은 상기 유전자의 mRNA에 특이적으로 결합하는 안티센스 올리고뉴클레오티드, 프라이머 쌍, 프로브 또는 이들의 조합을 이용하는 것인 정보 제공 방법을 제공하는 것이다.
구체적으로, 본 발명에서 목적 조직 특이적 유전자의 mRNA 발현수준을 측정하는 것은 상기 유전자의 mRNA에 특이적으로 결합하는 안티센스 올리고뉴클레오티드, 프라이머 쌍, 프로브 또는 이들의 조합을 이용할 수 있고, 이는 역전사효소 중합효소반응, 경쟁적 역전사효소 중합효소반응, 실시간 역전사효소 중합효소반응, RNase 보호 분석법, 노던 블랏팅 및 DNA 마이크로어레이 칩으로 구성된 군으로부터 선택되는 분석법을 이용하여 수행될 수 있으나, 이에 제한되지 않는다.
본 발명의 구체적인 또 다른 양태는 상기 유전자가 코딩하는 단백질의 발현 수준을 측정하는 것은 상기 단백질에 특이적으로 결합하는 항체, 앱타머 또는 이들의 조합을 이용하는 것인 정보 제공 방법을 제공하는 것이다.
구체적으로, 본 발명에서 상기 유전자가 코딩하는 단백질의 발현수준을 측정하는 것은 상기 단백질에 특이적으로 결합하는 항체, 앱타머 또는 이들의 조합을 이용할 수 있고, 이는 웨스턴 블랏팅, ELISA, 방사선면역분석법, 방사면역확산법, 오우크레로니(Ouchterlony) 면역확산법, 로케트 면역전기영동, 면역조직화학염색, 면역침전분석, 보체고정분석, FACS 및 단백질 칩으로 구성된 군으로부터 선택되는 분석법을 이용하여 수행될 수 있으나, 이에 제한되지 않는다.
본 발명의 다른 양태는 (a) 분화 유도 인자를 검체 세포에 처리하는 단계;
(b) 상기 분화 인자가 처리된 검체 세포에서 측정된 목적 조직 특이적 유전자의 발현량을 하기 수학식 1에 적용하는 단계를 포함하는,
분화 유도 인자에 따른 분화 유도능을 검정하는 방법을 제공하는 것이다.
[수학식 1]
상기 수학식 1에서 A i , B i , C i 는 각기 다른 경우의 수이다. 지시함수 I(u i - U i > 0) = I (z i > 0) =1과 I(u i - U i ≤ 0) = I (z i ≤ 0) = 0을 이용하여, 각각 I(y i - U i > 0)·I(z i > 0), I(y i - U i ≤ 0)·I(z i > 0), I(y i - U i > 0)·I(z i ≤ 0)의 세 가지 경우의 수를 세어 A i , B i , C i 를 구성한다. y i 는 목적 조직 시료의 i번째 유전자 FPKM (fragments per kilobase of exon model per million mapped reads) 값, U i 는 윌콕슨 부호-순위 검정 (Wilcoxon signed-rank test)의 100 × (1-α) % 신뢰구간의 상한값, z i 는 검체 세포의 FPKM 값(u i )과 U i 의 차 (u i - U i )이다.
검체 세포가 목적 조직에 대해 높은 유사성을 나타낼수록, 유사한 수준의 분화가 이루어 졌음을 의미하는 것이므로, 본 발명의 알고리즘을 이용하여 분화 유도 인자의 분화 유도능을 검정할 수 있다.
구체적으로, 본 발명의 분화 유도 인자 분화능을 검정하는 방법은, 특정 분화 유도 인자를 처리한 줄기 세포가 분화된 정도를, 상기 분화된 세포에서 발현되는 유전자를 상기 수학식 1에 대입하여, 목적 조직과의 유사성 점수를 계산하여, 높은 점수를 얻을수록 목적 조직으로의 분화를 효과적으로 유도하는 것으로 판단하는 것일 수 있다.
본 발명의 또 다른 양태는 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보를 제공하기 위한, 매체에 저장된 컴퓨터 프로그램으로서,
입력된 검체 세포에서 측정된 목적 조직 특이적 유전자의 발현량을 하기 수학식 1에 적용하는 단계를 포함하는,
검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준에 대한 정보를 제공하기 위한 컴퓨터 프로그램을 제공하는 것이다.
[수학식 1]
상기 수학식 1에서 A i , B i , C i 는 각기 다른 경우의 수이다. 지시함수 I(u i - U i > 0) = I(z i > 0) =1과 I(u i - U i ≤ 0) = I(z i ≤ 0) =0을 이용하여, 각각 I(y i - U i > 0)·I(z i > 0), I(y i - U i ≤ 0)·I(z i > 0), I(y i - U i > 0)·I(z i ≤ 0)의 세 가지 경우의 수를 세어 A i , B i , C i 를 구성한다. y i 는 목적 조직 시료의 i번째 유전자 FPKM (fragments per kilobase of exon model per million mapped reads) 값, U i 는 윌콕슨 부호-순위 검정 (Wilcoxon signed-rank test)의 100 × (1-α) % 신뢰구간의 상한값, z i 는 검체 세포의 FPKM 값(u i )과 U i 의 차 (u i - U i )이다.
상기 프로그램은 구체적으로, 앞서 기술한 방법들이 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현된 프로그램일 수 있다. 그 예로 입력된 검체 세포에서 측정된 목적 조직 특이적 유전자의 발현량을 본 발명의 알고리즘에 적용하는 단계를 포함하는 것일 수 있다. 상기 목적 조직 특이적 유전자의 발현량 측정 및 입력은 자동 또는 수동으로 이루어 질 수 있다.
또한, 상기 컴퓨터 프로그램은 기록매체 또는 컴퓨터 장치에 기록된 것일 수 있다.
본 발명의 정보 제공 방법은 검체 세포의 목적 조직과의 유사성 또는 목적 조직으로의 분화 수준을 정량적 수치로 표현하여, 장기 유사체의 분화 및 발달 상태를 정량적으로 검증하고, 보다 개체에 적합한 유사체를 제작할 수 있는 정보를 제공한다.
도 1은 간 특이적 유전자 발현 패널 (LiGEP) 개발 과정을 나타낸 개략도이다. (1) 표준 RNA-seq 분석 및 간 특이적 유전자의 선택; TopHat-cufflinks pipeline을 통해 18 개의 비 간 조직과 비교하여 Clontech에서 구입한 20 개 조직의 총 RNA 및 간 특이적인 유전자를 스크리닝하여 RNA-seq 분석. (2) PubMed & 실험 검증; 인간 단백질 ATLAS 공개 데이터베이스 이용 및 정량적 RT-PCR (qRT-PCR) 분석을 통한 후보 유전자의 확인; (3) LiGEP 알고리즘; 간 유기체 및 3D 배양의 간 유사성을 측정하기 위한 LiGEP 알고리즘의 구축 및 정상 조직 (정상 조직 730 개)을 이용한 LiGEP 알고리즘의 검증.
도 2a 내지 2d는 LiGEP의 검증을 위해, 인간의 8개 조직 (뇌, 심장, 신장, 폐, 결장, 소장, 및 위) 유래 cDNA를 이용하여 qRT-PCR 분석을 수행한 결과이다.
도 3은 LiGEP의 구성 및 특성을 나타낸 도이다. (A) MDS (Multidimensional scaling) 플롯 분석은 20 개의 인간 조직에서 LiGEP의 RNA-seq 결과로 수행하였다. 간과 다른 조직은 크게 두 부분으로 나뉜다. (B, C) 열지도는 20 개 (내부의) 및 32 개 조직 (인간 ATLAS)에서 LiGEP의 유전자 발현 수준을 나타낸다. 조직은 유사한 FPKM 값 (log10 (FPKM + 1))으로 분류된다. (D) 인간 단백질 ATLAS 데이터에서 LiGEP의 상관 관계 플롯. (E) Ingenuity Pathway Knowledge Base로부터 LiGEP의 기능적 풍부 분석. (E-i) 표준경로 분석. 대표적인 표준경로는 히스토그램으로 묘사하였다. 경로와 관련된 (p-값)은 가져온 데이터 세트의 경로와 주어진 경로에 관련된 분자의 참조 세트에 대한 중요성의 척도이다. 주황색 선은 유의수준 (p <0.05)을 나타낸다. FXR; 파르네소이드 X 수용체, RXR; 레티노이드 X 수용체, LXR; 간 X 수용체. (E-ii) 질병 및 생체기능 분석. 최고 조절 질병 및 생체기능을 선택하고 중요도를 히트맵과 함께 표시한다. (E-iii) 유전자 네트워크 분석. 각 유전자는 인간 상동체 단백질과 일치하고 인간 유전자는 네트워킹지도에 표시한다. 집중 유전자의 발현 강도는 적색으로 표시한다. 예측된 질병과 기능은 각각 파란색과 보라색으로 표시한다.
도 4는 간의 발달 단계를 보여주는 LiGEP 알고리즘의 적용 결과를 나타낸 도이다.
(A) TCGA 정상 데이터에서 LiGEP 알고리즘 점수 분포. 건강한 사람의 기관 RNA-seq 데이터는 TCGA cohort에서 다운로드하였다. 박스 플롯은 15 가지 조직 유형에서 LiGEP 알고리즘 점수의 사분범위를 나타낸다. 간 시료 (n = 50)과 기타 조직 시료 (n = 680)은 LiGEP 알고리즘의 정확성을 평가하는데 이용한다. (B) 간 및 태아 간의 LiGEP 알고리즘 분석. 빨간색 점은 태아 간의 LiGEP 발현을 나타내고, 빨간색 선은 간과 비 간을 구별하는 기준입니다. (C) RNA-seq 결과의 박스 플롯 분석. Y 축은 LiGEP의 총 발현 수준을 나타낸다. (D) 임상 간 시료 (간 1-3), ATLAS 간 및 태아 간의 LiGEP 알고리즘에 의한 간 유사성. (E 및 F) 마우스의 각 간 발달 단계에 따른 LiGEP 알고리즘의 분석 결과. 박스 플롯 분석 (E)과 점은 간(F)을 구별하기 위해 LiGEP 기준을 통과 한 유전자를 의미한다. (G) 생쥐의 각 간 발달 단계에 대한 LiGEP 알고리즘을 이용한 간 유사성.
도 5는 쥐의 간 발달 과정에서 발달 단계 및 LiGEP 알고리즘의 점수 간의 상관 관계를 나타내는 도이다.
도 6은 간세포 3D 배양과 hPSC-유도 HLC의 간 유사성을 보여주는 LiGEP 알고리즘의 적용 결과를 나타낸 도이다.
(A) 2D 및 3D HepaRG 세포와 회전타원체의 형태. HepaRG 세포를 배양판 위에 떨어뜨린후, 현적법으로 48 시간 동안 회전타원체를 형성한 다음 현탁배양관에 옮겨 회전타원체를 광학현미경으로 관찰하였다. 스케일 바 (Scale bar), 200 μm. (B) CYP3A4 효소 활성. 2D (n = 3, pooled) 및 3D (n = 6, pooled) 배양에서 CYP3A4 효소 활성. 상대 밝기 단위 (RLU)로 보고된 데이터는 간세포의 DNA 함량으로 표준화하였다. (C) 2D과 3D 배양 간 알부민 발현. 알부민 유전자의 mRNA 수준을 실시간 PCR로 측정하였다. 유전자 발현은 GAPDH의 유전자발현으로 표준화하였고, 대조군 (2D 단층 배양)과 비교하였다. (D) 2D 및 3D 배양 LiGEP 알고리즘의 결과. 점들은 2D 및 3D RNA-seq 결과의 원시 FPKM 값을 나타낸다. 붉은 점들은 유전자가 간을 구별하기 위해 LiGEP 기준을 통과하였다는 것을 가리킨다. (E) LiGEP 알고리즘에 의한 2D 및 3D 배양 세포의 간 유사성. (F) AAT, CYP3A4, GSTA1 및 GSTA2를 포함한 간 성숙 마커의 발현에 대한 qRT-PCR 분석은 미분화된 hPSC 및 hPSC-유래 HLC에서 수행하였다. (G) hESC와 hiPSC에서 파생된 HLC의 간세포 특이적인 마커 (HNF4 알파 (HNF4A), 알파-1 항 트립신 (AAT) 및 cytokeratin (CK) -18)의 면역 세포 화학 분석. (H와 I) hPSC-유래 HLC의 LiGEP 알고리즘. LiGEP 알고리즘 분석을 통해 발현된 유전자 (H) 및 간 유사성 (I). Undiff.; 미분화
도 7은 hPSC 유래 분화 프로토콜을 나타낸 도이다.
(A)는 hPSC 유래 간 유사 세포 (hepatocyte-like cell, HLC)을 수득하기 위한 프로토콜을 나타낸 도이고, (B)는 신경 전구 세포 (neural progenitor cell, NPC)를 수득하기 위한 프로토콜을 나타낸 도이다.
도 8은 hPSC에서 분화된 신경 전구 세포 (NPC)를 나타낸 도이다.
(A)는 미분화 hESC, hiPSC, 및 분화된 NPC에서의 신경 마커 (NESTIN, NCAM, PAX6 및 OTX2)의 qRT-PCR 분석 결과이고, (B) 신경 줄기 세포 마커 (NESTIN), 신경 마커 (MAP2 and TUJ1) 및 신경교 마커 (glial marker, S100)의 면역세포화학 분석 결과를 나타낸 도이다. 스케일 바는 100 μm이다.
도 9는 hPSC 유래 HLC를 이용한 LiGEP 알고리즘의 적용 결과이다.
도 10은 3D 배양 및 hPSC 파생 HLC의 분화를 평가하는 LiGEP 알고리즘의 요약도이다. 각 생성 단계에 따른 LiGEP 알고리즘의 점수는 고품질의 간 조직체를 생성하는 중요한 정보로 활용 될 수 있다. LiGEP 알고리즘의 낮은 백분율 점수는 3D 배양/ hPSC-유래 HLC의 품질이 높지 않음을 의미한다. 간 유기체의 품질을 높이려면 pipeline (유기 생성-LiGEP 알고리즘) 분석을 통해 보다 고품질의 간 특이적 세포 및 오르가노이드 획득이 가능하다.
도 2a 내지 2d는 LiGEP의 검증을 위해, 인간의 8개 조직 (뇌, 심장, 신장, 폐, 결장, 소장, 및 위) 유래 cDNA를 이용하여 qRT-PCR 분석을 수행한 결과이다.
도 3은 LiGEP의 구성 및 특성을 나타낸 도이다. (A) MDS (Multidimensional scaling) 플롯 분석은 20 개의 인간 조직에서 LiGEP의 RNA-seq 결과로 수행하였다. 간과 다른 조직은 크게 두 부분으로 나뉜다. (B, C) 열지도는 20 개 (내부의) 및 32 개 조직 (인간 ATLAS)에서 LiGEP의 유전자 발현 수준을 나타낸다. 조직은 유사한 FPKM 값 (log10 (FPKM + 1))으로 분류된다. (D) 인간 단백질 ATLAS 데이터에서 LiGEP의 상관 관계 플롯. (E) Ingenuity Pathway Knowledge Base로부터 LiGEP의 기능적 풍부 분석. (E-i) 표준경로 분석. 대표적인 표준경로는 히스토그램으로 묘사하였다. 경로와 관련된 (p-값)은 가져온 데이터 세트의 경로와 주어진 경로에 관련된 분자의 참조 세트에 대한 중요성의 척도이다. 주황색 선은 유의수준 (p <0.05)을 나타낸다. FXR; 파르네소이드 X 수용체, RXR; 레티노이드 X 수용체, LXR; 간 X 수용체. (E-ii) 질병 및 생체기능 분석. 최고 조절 질병 및 생체기능을 선택하고 중요도를 히트맵과 함께 표시한다. (E-iii) 유전자 네트워크 분석. 각 유전자는 인간 상동체 단백질과 일치하고 인간 유전자는 네트워킹지도에 표시한다. 집중 유전자의 발현 강도는 적색으로 표시한다. 예측된 질병과 기능은 각각 파란색과 보라색으로 표시한다.
도 4는 간의 발달 단계를 보여주는 LiGEP 알고리즘의 적용 결과를 나타낸 도이다.
(A) TCGA 정상 데이터에서 LiGEP 알고리즘 점수 분포. 건강한 사람의 기관 RNA-seq 데이터는 TCGA cohort에서 다운로드하였다. 박스 플롯은 15 가지 조직 유형에서 LiGEP 알고리즘 점수의 사분범위를 나타낸다. 간 시료 (n = 50)과 기타 조직 시료 (n = 680)은 LiGEP 알고리즘의 정확성을 평가하는데 이용한다. (B) 간 및 태아 간의 LiGEP 알고리즘 분석. 빨간색 점은 태아 간의 LiGEP 발현을 나타내고, 빨간색 선은 간과 비 간을 구별하는 기준입니다. (C) RNA-seq 결과의 박스 플롯 분석. Y 축은 LiGEP의 총 발현 수준을 나타낸다. (D) 임상 간 시료 (간 1-3), ATLAS 간 및 태아 간의 LiGEP 알고리즘에 의한 간 유사성. (E 및 F) 마우스의 각 간 발달 단계에 따른 LiGEP 알고리즘의 분석 결과. 박스 플롯 분석 (E)과 점은 간(F)을 구별하기 위해 LiGEP 기준을 통과 한 유전자를 의미한다. (G) 생쥐의 각 간 발달 단계에 대한 LiGEP 알고리즘을 이용한 간 유사성.
도 5는 쥐의 간 발달 과정에서 발달 단계 및 LiGEP 알고리즘의 점수 간의 상관 관계를 나타내는 도이다.
도 6은 간세포 3D 배양과 hPSC-유도 HLC의 간 유사성을 보여주는 LiGEP 알고리즘의 적용 결과를 나타낸 도이다.
(A) 2D 및 3D HepaRG 세포와 회전타원체의 형태. HepaRG 세포를 배양판 위에 떨어뜨린후, 현적법으로 48 시간 동안 회전타원체를 형성한 다음 현탁배양관에 옮겨 회전타원체를 광학현미경으로 관찰하였다. 스케일 바 (Scale bar), 200 μm. (B) CYP3A4 효소 활성. 2D (n = 3, pooled) 및 3D (n = 6, pooled) 배양에서 CYP3A4 효소 활성. 상대 밝기 단위 (RLU)로 보고된 데이터는 간세포의 DNA 함량으로 표준화하였다. (C) 2D과 3D 배양 간 알부민 발현. 알부민 유전자의 mRNA 수준을 실시간 PCR로 측정하였다. 유전자 발현은 GAPDH의 유전자발현으로 표준화하였고, 대조군 (2D 단층 배양)과 비교하였다. (D) 2D 및 3D 배양 LiGEP 알고리즘의 결과. 점들은 2D 및 3D RNA-seq 결과의 원시 FPKM 값을 나타낸다. 붉은 점들은 유전자가 간을 구별하기 위해 LiGEP 기준을 통과하였다는 것을 가리킨다. (E) LiGEP 알고리즘에 의한 2D 및 3D 배양 세포의 간 유사성. (F) AAT, CYP3A4, GSTA1 및 GSTA2를 포함한 간 성숙 마커의 발현에 대한 qRT-PCR 분석은 미분화된 hPSC 및 hPSC-유래 HLC에서 수행하였다. (G) hESC와 hiPSC에서 파생된 HLC의 간세포 특이적인 마커 (HNF4 알파 (HNF4A), 알파-1 항 트립신 (AAT) 및 cytokeratin (CK) -18)의 면역 세포 화학 분석. (H와 I) hPSC-유래 HLC의 LiGEP 알고리즘. LiGEP 알고리즘 분석을 통해 발현된 유전자 (H) 및 간 유사성 (I). Undiff.; 미분화
도 7은 hPSC 유래 분화 프로토콜을 나타낸 도이다.
(A)는 hPSC 유래 간 유사 세포 (hepatocyte-like cell, HLC)을 수득하기 위한 프로토콜을 나타낸 도이고, (B)는 신경 전구 세포 (neural progenitor cell, NPC)를 수득하기 위한 프로토콜을 나타낸 도이다.
도 8은 hPSC에서 분화된 신경 전구 세포 (NPC)를 나타낸 도이다.
(A)는 미분화 hESC, hiPSC, 및 분화된 NPC에서의 신경 마커 (NESTIN, NCAM, PAX6 및 OTX2)의 qRT-PCR 분석 결과이고, (B) 신경 줄기 세포 마커 (NESTIN), 신경 마커 (MAP2 and TUJ1) 및 신경교 마커 (glial marker, S100)의 면역세포화학 분석 결과를 나타낸 도이다. 스케일 바는 100 μm이다.
도 9는 hPSC 유래 HLC를 이용한 LiGEP 알고리즘의 적용 결과이다.
도 10은 3D 배양 및 hPSC 파생 HLC의 분화를 평가하는 LiGEP 알고리즘의 요약도이다. 각 생성 단계에 따른 LiGEP 알고리즘의 점수는 고품질의 간 조직체를 생성하는 중요한 정보로 활용 될 수 있다. LiGEP 알고리즘의 낮은 백분율 점수는 3D 배양/ hPSC-유래 HLC의 품질이 높지 않음을 의미한다. 간 유기체의 품질을 높이려면 pipeline (유기 생성-LiGEP 알고리즘) 분석을 통해 보다 고품질의 간 특이적 세포 및 오르가노이드 획득이 가능하다.
이하 본 발명을 하기 실시예에 의하여 좀 더 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들만으로 한정되는 것은 아니다.
실시예 1: 간 유사성 예측 시스템 개발
본 발명자들은, RNA-seq 분석을 사용하여 간세포 및 조직에 대한 분석 파이프 라인 및 알고리즘을 구축하고자 하였다.
도 1은 간 특이적 유전자 발현 패널 개발을 위한 전체 순서도를 보여준다. 본 발명자들은 다음의 단계를 통해 간 특이적으로 발현하는 유전자를 선별하고, 간의 발달 상태를 분석할 수 있는 시스템을 구축하였다: 1) 클론테크 (Clontech)로부터 구입한 20개 조직의 전체 RNA에 대한 RNA-seq 분석 및 18개의 비-간 조직과 비교하여 간 특이적 유전자를 스크리닝 하였다; 2) 인간 단백질 ATLAS의 공개 데이터베이스의 비교 분석 및 정량적 RT-PCR(qRT-PCR) 분석을 통한 후보 유전자를 확인하였다; 3) 간 3D 배양물과 간 분화세포의 간 유사성을 측정하기 위한 LiGEP (Liver-specific Gene Expression Panel) 알고리즘을 개발하였다; 4) 일반 조직(730개의 일반 조직)을 사용하여 LiGEP 알고리즘을 검정하였다.
상기와 같은 단계를 통해 구축된 LiGEP 알고리즘을 이용하여, 인간 간과 오르가노이드를 비교하여 간 유사성을 계산할 수 있고, 간 오르가노이드와 3D 배양물의 발달 상태를 제시할 수 있음을 확인하였다.
실시예 2: 간-특이적 유전자 발현 패널(Liver-specific Gene Expression Panel, LiGEP)의 구축
실시예 2-1: RNA-seq 라이브러리 서열분석
인간 총 RNA (Human Total RNA master Panel)은 클론테크 (Clontech, Cat. No.636643) 에서 구입하였다. RNA 시료는 Agilent 2100 Bioanalyzer 시스템 (Agilent Biotechnologies, Palo Alto, USA)의 RNA 6000 나노 랩칩 키트 (Nano Labchip Kit)를 이용하여 분석하였다. 고품질 RNA 시료 (RNA Integrity Number ≥7.5) 만을 서열 분석을 위한 이후의 mRNA 시료 준비에 이용하였다. 각각의 RNA-seq 라이브러리의 제작에는 약 0.5 내지 4 ㎍의 총 RNA를 이용하였다.
라이브러리 구축 및 정제는 TruSeq RNA Sample Preparation Kit V2에 따라 수행하였다. 상기 라이브러리는 유세포 (flow cell) V2 및 HiSeq rapid SBS V2가 있는 HiSeq Rapid Cluster Kit V2를 이용하여 분류하였다. 시료의 서열분석은 2 × 100 염기의 판독 길이를 갖는 표준 Illumina RNA-seq 프로토콜을 이용하여 Illumina HiSeq2500 기기 (Illumina, San Diego, CA, USA)에서 수행하였다. 시료는 레인 당 10 개씩 다중 염기 서열 분석을 실시하여 시료 당 평균 19,000,000개의 판독 가능한 쌍을 생산하였다 (표 1).
실시예 2-2: 판독 지도 (Read mapping) 및 정량
서열분석 시스템으로부터 얻은 원시 판독물의 품질을 FastQC 패키지를 이용하여 검사하였다. 어댑터를 포함하는 판독물은 프레드 품질 역치 (phred quality threshold) 점수가 20점 일 때 품질이 낮은 말단을 위해 컷어뎁트 (cutadapt)와 시클(sickle)을 이용하여 트리밍하였다. 만일 트리밍 된 길이가 50bp 미만인 경우, 이는 포기하였다. 서열분석 오류를 필터링 한 후, 판독과정은 TopHat v2.1.0 (Bowtie2 v2.1.0 기반)을 이용하여 기본 매개 변수 설정하여 표준유전체에 지도화하였다. 인간 표준전사체 주석과 hg19의 표준유전체를 이용하였으며, 이는 iGenome에서 다운로드 받은 25,370 개의 고유 (unique) 유전자를 포함한다.
그 결과, 모든 시료에서 판독의 평균 94 %가 표준유전체의 적어도 하나의 영역과 일치하였다 (표 2).
모든 인간 유전자와 전사물의 정량화된 점수를 얻기 위해, 전사 길이와 라이브러리로부터 판독된 총 수를 보정하는 Cufflinks v2.2.1을 이용하여 FPKM (fragments per kilobase of exon model per million mapped reads) 값을 계산하여 서로 다른 시료에 대해 서로 다른 판독 정도를 보정하였다.
실시예 2-3: 간-특이적 유전자의 확인
본 발명자들은 상술한 바에 따라, 간-특이적 유전자를 발굴하였다.
구체적으로, 간-특이적 발현 유전자를 분리하기 위해, 20개의 인간 조직(뼈, 뇌 소뇌, 전뇌, 결장, 태아 뇌, 태아 간, 심장, 신장, 폐, 간, 태반, 전립선, 골격근, 소장, 척추, 비장, 위, 고환, 흉선 및 자궁) RNA들의 RNA-seq 데이터를 만들었고, 20개 조직의 간-특이적 유전자 발현 프로필의 구축을 위해 RNA-seq 데이터 분석 파이프라인(TopHat-Cufflinks)을 수행했다.
간 대표 유전자 후보를 좁히기 위해, 다른 조직과 비교하여 간 조직에서 상위 2.5%에서 과발현된 유전자를 조사했다. 약 630개의 유전자를 대상으로, 각 유전자의 통계 분석을 수행하여 다른 조직보다 상당히 높은 발현 여부를 평가했다 (단일 표본 윌콕슨 부호-순위 검정 (One sample Wilcoxon signed rank test), p-value <0.05; Cui et al., 2011).
시료의 윌콕슨 부호-순위 검정을 실시하여 간과 다른 조직 간의 유전자 발현량을 비교하였다. 비 간 조직의 FPKM 값()은 간 조직의 FPKM 값()보다 작다 가정하고, 유의수준 α에서 귀무가설 에 대한 검정을 실시하였다. 이 때, 는 의 중앙값(median)을 나타낸다. 만일, 결과의 유의확률이 α보다 작으면 귀무가설을 기각하였다.
간-특이적 유전자 및 비 간-특이적 유전자의 두 그룹간에 명확한 차이가 요구되므로, 간이 아닌 다른 조직과 비교하여 2배 이상의 발현 변화를 가진 유전자를 선별하였다.
그 결과, 본 발명자들은 모든 스크리닝 기준을 통과한 118개의 유전자를 선별하였다.
또한, RNA-seq에 기초한 32개의 조직 (122개의 개체)의 전사체를 제공하는 공개 데이터베이스(인간 단백질 ATLAS)를 이용하여, 118개의 유전자의 간-특이적 발현을 검증하였다.
그 결과, 인간 단백질 ATLAS의 간-특이적 유전자와의 비교 분석에서, 114 개의 유전자가 중첩되었다.
그 다음으로, 8개 조직(뇌, 심장, 신장, 간, 폐, 결장, 소장 및 위)의 cDNA를 qRT-PCR를 사용하여 상기에서 선별된 114개의 유전자를 실험적으로 검증하였고, 마지막으로, “간-특이적 유전자 발현 패널(Liver-specific Gene Expression Panel, LiGEP)”를 구성하는 93개의 간-특이적 유전자(도 2)를 확인하였다(표 3). qRT-PCR은 제조사의 지침에 따라 RNeasy Mini Kit (Qiagen, Hilden, Germany)을 이용하여 조직 시료에서 총 RNA를 추출하여 수행하였다. 표준 프로토콜 (Cho et al., 2015)에 따라 1 μl의 RNA 분취량을 iScript ™ cDNA 합성 키트 (Bio-Rad, Hercules, CA)를 이용하여 역전사 시켰다. 모든 프라이머 서열은 표 4에 기술하였다.
Oligo NAME | SEQUENCE (5' --> 3') | 서열번호 |
ADH1A_F | TGAAGTCATCGGTCGGCTTG | 1 |
ADH1A_R | AGCCACAAGTTTTGGGACAC | 2 |
ADH4_F | AGGGAGGTGTGGATTTTGCC | 3 |
ADH4_R | AGTCAGTGACCAGCTTTGGG | 4 |
ADH6_F | CTTCTGCTTTGAGGCCATTGG | 5 |
ADH6_R | TAGGGATGTGCTGTCTGCTC | 6 |
AFM_F | GGCCCTGCTTTGAGAGTTTG | 7 |
AFM_R | GCAGACTTCAGGACTCTCTGC | 8 |
AGXT_F | GTACAGCCTGAGAGAGAGCC | 9 |
AGXT_R | CCAAGGCCACCCATGATCTC | 10 |
AHSG_F | AATGAAGCAGTCCCCACACC | 11 |
AHSG_R | CGACACTTCTCCTGAGGGTG | 12 |
AKR1C4_F | TGTTCTGGTTGCCCACAGTG | 13 |
AKR1C4_R | TGGATGTTCTCTCTGATCCGC | 14 |
ALB_F | CAGGCGACCATGCTTTTCAG | 15 |
ALB_R | TCAGCCTTGCAGCACTTCTC | 16 |
AMBP_F | GAGACTTTCCAGTACGGCGG | 17 |
AMBP_R | GGACACCGCAGTACTCTCTG | 18 |
ANGPTL3_F | GCGATTACTGGCAATGTCCC | 19 |
ANGPTL3_R | ATCCTCTTCTCCTCTCTGGC | 20 |
APCS_F | AAAAAGGGTCTGCGACAGGG | 21 |
APCS_R | TGCCAGTCCAGGATATTGGC | 22 |
APOA2_F | ACCATCTGCAGCCTTGAAGG | 23 |
APOA2_R | TAACCAGTTCCGTTCCAGCC | 24 |
APOB_F | AGAGCTTTCTGCCACTGCTC | 25 |
APOB_R | TGACTGTGGTTGATTGCAGC | 26 |
APOC4_F | CCTCAGAAACAGGCTCCAGG | 27 |
APOC4_R | GTAGGTCTGCATGAAGCCCC | 28 |
APOF_F | GGGTCTAGCGATCAGTGCTG | 29 |
APOF_R | CTTGATTATGGCCCACCCCC | 30 |
APOH_F | AACTGGGAAACTGGTCTGCC | 31 |
APOH_R | TGAAGCATTTGGGGACTTCG | 32 |
AQP9_F | CTCCAGAAACTTGGGAGCCC | 33 |
AQP9_R | ATGAGGCCTCCAATGACAGC | 34 |
BAAT_F | CTATTGAAGAGGCCCAGGGG | 35 |
BAAT_R | TGTGGGATCACCTCTCCTCC | 36 |
C4BPB_F | GGGACTGTGACCCTCCTGG | 37 |
C4BPB_R | TGGCTTCGCAGAGGTTCTTAC | 38 |
C5orf27_F | AGCTGGCCTGAACTTGAAGG | 39 |
C5orf27_R | CCAGGTGAGAGGGGGAATTG | 40 |
C6_F | ACCCGCTTGTAAGTTTTTGGC | 41 |
C6_R | TCCACCCTTGAAGCACTGTG | 42 |
C8A_F | GATGCAGCCTATCCACGAGG | 43 |
C8A_R | TCCAGCTCCCATCTGCTTTG | 44 |
C8B_F | TAGTTCCTGCCACTGTGCTC | 45 |
C8B_R | CCCCCATTTTGAGGAGGTGG | 46 |
C8G_F | ACCTTCCGAAAGCTGGATGG | 47 |
C8G_R | TGCTCAAACCCACTCAGGAC | 48 |
C9_F | TTGTCAACTGGGCCTCTTCC | 49 |
C9_R | GAATGGGCAGGCACACAAAC | 50 |
CFHR1_F | GCCCCCTCCACCTATTGAC | 51 |
CFHR1_R | AAGCTTCTGTTTGGCTGTCC | 52 |
CFHR2_F | GCCAGAACTTGTATCAACTTGAGG | 53 |
CFHR2_R | CCCATTCTGACACATTGCTCG | 54 |
CFHR3_F | TGCCAGCCCTACTATGAACTTC | 55 |
CFHR3_R | CCCGACACACTGCTTGAAATG | 56 |
CP_F | TGCACGTGGGAGATGAAGTC | 57 |
CP_R | TCCAGCATGAATGTGGTCGG | 58 |
CPB2_F | GCAAAGACCATGAGGAACTGTC | 59 |
CPB2_R | GTTTGATGTAACGCTCCGGC | 60 |
CRP_F | CAGGGATCGTGGAGTTCTGG | 61 |
CRP_R | CATTAGGACTGAAGGGCCCG | 62 |
CXCL2_F | AGCAATCCCCGGCTCCTG | 63 |
CXCL2_R | CGGGGTTGAGACAAGCTTTC | 64 |
CYP1A2_F | TCGTAAACCAGTGGCAGGTC | 65 |
CYP1A2_R | GTAGCAGGATGGCCAGGAAG | 66 |
CYP2A6_F | AAGTGTTCCCTATGCTGGGC | 67 |
CYP2A6_R | TCTGCATGACGGTGGTGAAG | 68 |
CYP2C8_F | TCCGTGCTACATGATGACAAAG | 69 |
CYP2C8_R | TCCCTTTGGTAACTGCAGTAG | 70 |
CYP2C9_F | TCCCTGACTTCTGTGCTACATG | 71 |
CYP2C9_R | ACTGGAGTGGTGTCAAGGTTC | 72 |
CYP2D6_F | TCACCAACCTGTCATCGGTG | 73 |
CYP2D6_R | ACCGAGAAGCTGAAGTGCTG | 74 |
CYP2E1_F | TCGTAGTGCCAACTCTGGAC | 75 |
CYP2E1_R | TTGGGTCAACGAGAGGCTTC | 76 |
CYP4F2_F | TCACCCAGGACATTGTGCTC | 77 |
CYP4F2_R | GCCAGGACCACCTTCATCTC | 78 |
CYP8B1_F | TGCACATGGACCCTGACATC | 79 |
CYP8B1_R | GTGTCAGGGTCCACCAACTC | 80 |
F12_F | TACCGTTCCTCTCCCTGGAG | 81 |
F12_R | GGTAGTAGGCCACATCGGTG | 82 |
F2_F | TGAACCTGCCCATTGTGGAG | 83 |
F2_R | TTCACCCCATGAGACGATGC | 84 |
F9_F | GTGGCTGGGGAAGAGTCTTC | 85 |
F9_R | TTGCACACTCTTCACCCCAG | 86 |
FGA_F | CTAGGGGCTCAGAATCTGGC | 87 |
FGA_R | ATGATCGGCTTCACTTCCGG | 88 |
FGB_F | AGAGGAACAGCCGGTAATGC | 89 |
FGB_R | TTGCCATGTCCCAGGTGTAC | 90 |
FGG_F | TGCAGTTCAGTACCTGGGAC | 91 |
FGG_R | CCACCGGGTTTTCCAAGTG | 92 |
FGL1_F | TTCATCCTGAGGTGCAGTGG | 93 |
FGL1_R | AATACCACCACCCATGCCAG | 94 |
FMO3_F | CTCTCCTCCTTCATTGGGGC | 95 |
FMO3_R | GCTTCTGAAGTCTCCCGACC | 96 |
FMO5_F | CCTCCTAACCTGGAAAGGCC | 97 |
FMO5_R | TCTTCAACTTGGGTTTGTCTGATG | 98 |
GC_F | AAGCCTTGGTGAATGCTGTG | 99 |
GC_R | TGGAGGCAAAGTCTGAGTGC | 100 |
GNMT_F | TCGCAACTACGACCACATCC | 101 |
GNMT_R | AAGGATGCCAGACAGTGTGG | 102 |
HABP2_F | CTCTGGCTGGGGTGTTACAG | 103 |
HABP2_R | CGTAGTAGGTGCCGTCCTTC | 104 |
HAMP_F | GACCAGTGGCTCTGTTTTCC | 105 |
HAMP_R | CACATCCCACACTTTGATCG | 106 |
HAO1_F | ATTGTGGAGGCTGTGGAAGG | 107 |
HAO1_R | TCACATTCTGGCACCCACTC | 108 |
HGFAC_F | GACACAAGTGCCAGATTGCG | 109 |
HGFAC_R | ATGCCGTAGAGGTAAGCCAC | 110 |
HPR_F | GCACATGCCCCAAATGGAAG | 111 |
HPR_R | ACCATACTCAGCCACAGCAC | 112 |
HPX_F | CTGGAGAAGGAAGTCGGGAC | 113 |
HPX_R | TGGCGGAACATGAGTTAGGG | 114 |
HRG_F | TCCCCACTGCCATGATTTCC | 115 |
HRG_R | ATGTTTGTGGTGCGGCAATG | 116 |
HSD11B1_F | CTCTCTGGCTGGGAAAGTGG | 117 |
HSD11B1_R | GCAGAGCTCCCCCTTTGATG | 118 |
HSD17B13_F | TCAGAACTTCAGGCCTTGGG | 119 |
HSD17B13_R | GGCGCGTTCAGGAAGAAAC | 120 |
ITIH1_F | ATGTGCTGGACAGTCATCGG | 121 |
ITIH1_R | TGAGTCCAGCCCCATTGTTG | 122 |
ITIH2_F | TTCTCACCTAAAGCCCACGG | 123 |
ITIH2_R | TGTTGTGCACAAACCAGCAG | 124 |
ITIH3_F | GGACAGTCACCGGATGTCAG | 125 |
ITIH3_R | TCAGCCCTTCTCCGTTGTTG | 126 |
ITIH4_F | TATTCTCAGTGATGCCCGGC | 127 |
ITIH4_R | TCTGCCGTCATCTGATGCTG | 128 |
KLKB1_F | GATGGGGCTTCTCGAAGGAG | 129 |
KLKB1_R | GTGATGCCCACCAAACGC | 130 |
LEAP2_F | TAGATGGCTCCCCAATACCA | 131 |
LEAP2_R | GGAACAGCGTCTTTTTCTGC | 132 |
LECT2_F | GTGGACATCTTGTGCTCTGC | 133 |
LECT2_R | TGCACATGCGATTGTATGCC | 134 |
MASP2_F | TGGAACTGCATCTGGATGGG | 135 |
MASP2_R | TCCCACAAACCACCTCTCTG | 136 |
MAT1A_F | CACCAAGGTAGACCGCTCAG | 137 |
MAT1A_R | AATCCCTGACAATGACGCCC | 138 |
PON1_F | ACTCCATTGAAGTCCCTTGAC | 139 |
PON1_R | GTACTGCCTTGCAACACTGTG | 140 |
PON3_F | GAAGGTGATACAGTTGGGCAC | 141 |
PON3_R | ACACAGAAGCCACAGAGGTG | 142 |
PROC_F | AAGGAGGCCAAGAGAAACCG | 143 |
PROC_R | AGTTGTGAAGGAGCCCACAG | 144 |
RDH16_F | CTGGAGATTTGGGACCGGTC | 145 |
RDH16_R | CCAGGAAGGTGGGCATGTAG | 146 |
SAA4_F | GCTGGCGTTCGTTTTTCAAG | 147 |
SAA4_R | AGTCCTCCAATACAGTGCTGC | 148 |
SDS_F | GTCTCCCTGCCCAAGATCAC | 149 |
SDS_R | TGGAGCTTCTGGATCACGTG | 150 |
SERPINA11_F | GCCCAGTCTGTTGGATTTGC | 151 |
SERPINA11_R | GTGTTCAGAGATGGGGGCTG | 152 |
SERPINA4_F | TGGGCTTCACGGATCTGTTC | 153 |
SERPINA4_R | TCTGGGTGCTGGTGGAAAAG | 154 |
SERPINA6_F | GGAGGAAATGGGCATTGCAG | 155 |
SERPINA6_R | AAAGGCTGCTCCAGGTGAAG | 156 |
SERPINC1_F | TGGGCCTTGTCGATCTGTTC | 157 |
SERPINC1_R | TGGCCTTGAAAGTCACCCTG | 158 |
SERPIND1_F | AGTTGATGGGGATCAGGATGC | 159 |
SERPIND1_R | TTCCCATGAAGAGCAGGCAG | 160 |
SLC10A1_F | TCAGCATGGAGACTGGATGC | 161 |
SLC10A1_R | CTTCAGTTGTGGCAGCTGTG | 162 |
SLC13A5_F | CATCGTGCTGCTACTAGGGG | 163 |
SLC13A5_R | ACCATGGAGGCAAAGATGGG | 164 |
SLC22A1_F | AATGCTGAGCTGTACCCCAC | 165 |
SLC22A1_R | TTTCTCCCAAGGTTCTCGGC | 166 |
SLC25A47_F | CTTTCCTACGCGGTCCTCTG | 167 |
SLC25A47_R | ACGCTGGTCACCATACAGTG | 168 |
SLC2A2_F | ACCACGTCCTGCTGCTTTAG | 169 |
SLC2A2_R | CAGCAGCTTTTGGCCTGTG | 170 |
SLC38A4_F | CGACCCTTCAGCTGGATACG | 171 |
SLC38A4_R | TAAAGCCCCGACCTTTTGGG | 172 |
SLCO1B1_F | TGGTCCACCAACAACTGTGG | 173 |
SLCO1B1_R | TGCTTCATCCATGACACTTCC | 174 |
SULT2A1_F | TGAGGAGCTGAAACAGGACAC | 175 |
SULT2A1_R | AAGTCTTCAGCTTGGGCCAC | 176 |
TAT_F | CCCCGGGAGAGTTTTACCAC | 177 |
TAT_R | GGGTACTCAAAGCACGTTGC | 178 |
TDO2_F | CCAGGTGCCTTTTCAGTTGC | 179 |
TDO2_R | CTTCGGTATCCAGTGTCGGG | 180 |
UGT2B10_F | ATGAAGGCCAAGGGAACAGC | 181 |
UGT2B10_R | TGGAACCAGGTGAGGTCATG | 182 |
UGT2B15_F | CCCTCAGTGTGGACATCAGG | 183 |
UGT2B15_R | TGGATCCAGGTGAGGTTGTG | 184 |
UGT2B4_F | ACACATGAAGGCCAAGGGAG | 185 |
UGT2B4_R | GAACCAGGTGAGGTCGTGG | 186 |
VTN_F | AGGTTTAGGCATCGCAACCG | 187 |
VTN_R | CGTGTGCGAAGATTGACTCG | 188 |
Oligo NAME | SEQUENCE (5' --> 3') | |
AAT_F | AGACCCTTTGAAGTCAAGCGACC | 189 |
AAT_R | CCATTGCTGAAGACCTTAGTGATGC | 190 |
CYP3A4_F | TGTGCCTGAGAACACCAGAG | 191 |
CYP3A4_R | GTGGTGGAAATAGTCCCGTG | 192 |
GSTA1_F | GACTCCAGTCTTATCTCCAGCTTCC | 193 |
GSTA1_R | TGCTTCTTCTAAAGATTTCTCATCCAT | 194 |
GSTA2_F | TGGAAGAGCTTGACTCTAGCCTTATT | 195 |
GSTA2_R | GGCTGCCAGGCTGTAGAAAC | 196 |
NESTIN_F | CAGGAGAAACAGGGCCTACA | 197 |
NESTIN_R | TGGGAGCAAAGATCCAAGAC | 198 |
PAX6_F | GTCCATCTTTGCTTGGGAAA | 199 |
PAX6_R | TAGCCAGGTTGCGAAGAACT | 200 |
NCAM_F | AGGAGACAGAAACGAAGCCA | 201 |
NCAM_R | GGTGTTGGAAATGCTCTGGT | 202 |
OTX2_F | CGAGGGTGCAGGTATGGTTT | 203 |
OTX2_R | AGCTGGGCTCCAGATAGACA | 204 |
ALB_F | AGAATGCGCTATTAGTTCGT | 205 |
ALB_R | ACTTACTGGCGTTTTCTCAT | 206 |
실시예 3: 간-특이적 유전자 발현 패널(Liver-specific Gene Expression Panel, LiGEP)의 검증
상기 실시예에서 발굴한 LiGEP이 간-특이적 유전자 패널을 대표하는지 아닌지 평가하기 위해, 본 발명자들은 MDS 플롯 분석을 수행하였다.
그 결과, LiGEP의 발현 패턴은 태아 간을 제외하고는, 다른 모든 18개의 조직과 확실히 구별되는 것이 확인하였다 (도 3A). 더욱이, LiGEP의 열-지도 (heat-map)로부터 상기 발굴된 LiGEP 및 인간 단백질 ATLAS에서 간 특이성을 확인하였으며 (도 3B 및 C), 간에서의 LiGEP의 발현 패턴은 인간 ATLAS로부터 제공된 32개의 조직의 RNA-seq 결과 사이에 낮은 연관성을 나타내는 것을 확인하였다 (도 3D).
그 다음으로, LiGEP의 생물학적 기능을 분석하기 위해, IPA를 사용하여 기능적 농축 분석을 수행하였다 (도 3E).
구체적으로, LiGEP의 기능적 강화를 Ingenuity Pathways Analysis (IPA) 소프트웨어 v 9.0 (Ingenuity Systems, Redwood City, CA)을 이용하여 분석하였다. 많은 표준경로와 유전자 네트워크는 Ingenuity Pathways Knowledge Base를 통해 생성되었으며, 통계적 유의성은 Fisher의 exact test에 의해 계산하였다.
그 결과, 표준 경로 분석 결과로부터 지질 대사 (FXR/RXR 활성화, LXR/RXR 활성화) 및 조기 상해 반응(급성 단계 반응, 응고 체계, 프로트롬빈 활성화, 및 보체 체계)과 관련된 유전자가 유의하게 조절되었음을 확인하였다 (도 3E-i 및 표 5).
또한, 관계 질환 및 기능을 분석한 결과, 집중 유전자가 간 병변(30개 유전자), 스테로이드 대사(22개 유전자), 및 이종 생물 대사(9개 유전자)와 같은 간 기능과 관련이 있음을 확인하였으며(도 3E-ii), 간 기능과 관련된 유전자 네트워크를 분석한 결과는 도 3E-iii에 나타내었다.
구체적으로, CYP2E1, CYP2C9, SLCO1B1 및 APOA/B와 같은 유전자는 간 병변, 스테로이드 대사 및 이종 생물 대사 사이에서 상호작용할 수 있도록 조절되는 것을 확인하였다.
이러한 결과로부터, 본 발명자들은 LiGEP의 93개의 유전자가 간 기능을 반영 할 수 있음을 확인하였다.
실시예 4: LiGEP 알고리즘의 설계
ALB, AAT, GSTA1/2 및 CYP3A4와 같은 대중적으로 알려진 간-특이적 마커는 qRT-PCR 또는 웨스턴 블랏 분석을 통해 분화된 간 세포를 검증하기 위해 일상적으로 사용된다. 그러나, 이러한 간-특이적 마커는 또한 다른 조직에서 발현되기 때문에, 이 생화학적 결과는 분화 상태를 평가하는데 제한이 있다. 또한, 이들 마커의 발현 수준만으로 간 유사성을 수치로 설명 할 수는 없다.
이러한 문제들을 극복하기 위해, 본 발명자들은 간 장기와 유사성을 예측하기 위한 LiGEP 알고리즘을 설계했다. 본 발명자들이 개발한 알고리즘을 이용하여, hPSC-유래 분화 세포 또는 3D 배양 세포의 분화 상태를 계산할 수 있다.
본 발명의 LiGEP 알고리즘은 인간 성인 간과 비교하여, hPSC-유래 분화 세포 또는 3D 배양 세포의 간 유사성 점수(“퍼센트”)를 제공할 수 있도록 한다. 즉, LiGEP 알고리즘을 이용하여 RNA-seq 분석 후 hPSC-유래 분화 세포 또는 3D 배양 세포의 LiGEP 알고리즘을 통해 간 유사성을 평가할 수 있다. 본 발명의 LiGEP 알고리즘의 결과로 얻어지는 간 유사성 점수는 0 내지 1(0% 내지 100%)의 범위에 있다. 알려지지 않은 샘플에 대해 본 발명의 LiGEP 알고리즘을 적용한 결과가 100 %이라면, "간"이라고 특정할 수 있다. 그러나, 개체간의 차이가 있으므로, 간의 상태를 조정하기 위해, p-값(p < 0.05)을 계산하여 오류 가능성을 인정한다.
본 발명의 LiGEP 알고리즘은 다음과 같은 방법으로 설계하였다.
먼저, 검체 세포의 검정을 위해, 간 시료와 간이 아닌 시료를 구별하는 기준이 필요하였다. 그룹간의 통계적으로 유의미한 차이를 나타낼 수 있도록 기준을 정의하였다.
구체적으로, 본 발명자들은 다음과 같이 비 간 조직 (18개 시료)에서 LiGEP의 발현을 이용하여 간접적으로 기준을 선택하였다.
대립가설 에 대해 윌콕슨 부호-순위 검정(Wilcoxon signed-rank test)을 실시한 결과로 도출되는 100 × (1-α)% 신뢰구간의 상한값을 판별기준 U i 로 두었다. 미지의 시료(검체)를 이용하여 테스트를 진행했을 때 간이 아닌 시료의 유전자 발현량이 해당 경계 U i 내에 위치할 확률이 100 × (1-α)% 이므로, 상기 시료의 유전자 발현량 u i 가 U i 를 초과하는 경우에 미지 시료가 간과 유사하다고 간주하였다. 상기 시료와 판별기준의 발현량 차(u i- U i )를 z i 로 두어 판별의 편의를 도모하였다. z i 가 양수일 때, 0 이하일 때로 구분하여 아래와 같은 지시함수로 나타내었다.
다음으로, 본 발명자들은 각 유전자 판별시 발생할 수 있는 모든 경우의 수를 계산하여 백분율로 환산하였다. LiGEP 유전자에 대하여 각기 다른 세 가지 경우의 수 A i =I(y i - U i > 0)·I(z i > 0), B i =I(y i - U i ≤ 0)·I(z i > 0), C i =I(y i - U i > 0)·I(z i ≤ 0) 로 나눈 후, 각 경우의 수에 해당하는 유전자의 수를세어 아래와 같은 백분율 수치를 구하였다.
실시예 5: LiGEP 알고리즘의 정확도 시험
상기 실시예에서 설계된 LiGEP 알고리즘의 정확도를 조사하기 위해, 본 발명자들은 TCGA 공개 데이터베이스(암 유전자 Atlas, cancer genome atlas; http://cancergenome.nih.gov/)에서 제공된 15개의 정상적인 고체 조직의 730개 샘플의 RNA-seq 데이터로 LiGEP 알고리즘의 민감도와 특이도를 평가했다(표 6).
구체적으로, 본 발명자들은 TCGA (cancer genome atlas, http://cancergenome.nih.gov/)에 접속하여 15개의 일반 고형 조직의 RNA-seq 프로파일 (HTSeq-FPKM)을 다운로드 하였다. 상기 15개의 일반 고형 조직은 간, 신장, 유방, 폐, 갑상선, 전립선, 결장 직장, 두경부, 자궁, 위, 방광, 식도, 담관, 뇌 및 췌장을 포함하며, 상기 데이터를 TCGA 스탠다드 파이프라인 (standard pipeline)을 이용하여 처리하였다.
그 결과, 본 발명의 LiGEP 알고리즘이 간과 간이 아닌 조직을 명확하게 구별할 수 있음을 확인하였다 (도 4). 특히, 50개의 정상 간 샘플에서 LiGEP 알고리즘의 점수는 98% 이상의 간 유사성을 나타내지만, 비-간 조직(680개의 샘플)에서 낮은 퍼센트를 관찰했다 (도 4A 및 표 6).
이러한 결과로부터, 본 발명자들은 LiGEP 알고리즘이 간 및 비-간을 구별하는 데 높은 정확도를 가지며, 상기 LiGEP 알고리즘을 이용할 경우, 시험관내 분화된 간세포 또는 3D 배양물의 간 유사성을 계산할 수 있음을 확인하였다.
실시예 6: LiGEP 알고리즘을 이용한 간의 발달 단계 분석
실시예 6-1: 성인 및 태아 간의 LiGEP 발현 수준 비교
간의 전사 프로그램 (transcriptional program)은 발달과 노화 과정에서 변화하는 것으로 알려져 있다. 유전자 발현 프로필의 변화는 태아 간에서 중요한 역할을 하지만 성년기에 하향 조절되는 생산물의 유전자를 포함한다. 따라서, 본 발명자들은 LiGEP 알고리즘이 연구자에게 간의 발달 상태에 대한 정보를 제공할 수 있는지에 대해 확인하고자 하였다.
이를 위해, 성인 및 태아 간의 RNA-seq 결과를 사용하여 LiGEP 알고리즘을 수행하였다. 본 발명자들은 LiGEP 알고리즘을 사용하여 간과 다른 조직을 구분하기 위해 컷-오프값(표준, 적색선)을 계산했다. 그 값은 각 유전자마다 다르기 때문에, 유전자 당 "중심 한계 FPKM" 컷-오프 라인을 나타내는 한 라인을 중심에 두었다. 이 컷-오프 값은 LiGEP에서 93개 유전자의 발현 위치를 더 잘 이해하는 데 도움이 된다(도 4B).
그 결과, 태아 간에서의 LiGEP의 총 발현 수준의 분포는 상자-플롯 분석에서 성인 간 임상 샘플에 비해 낮았으며(도 4C), 간 유사성 점수는 92.4 %를 나타내었다(도 4D). 결과적으로, LiGEP의 86개의 유전자가 간 영역(빨간선을 통과한)에서 발견되었지만, AKR1C4, C5orf27, CXCL2, CYP2C8, HSD11B1, HSD17B13 및 SLC22A1은 포함되지 않았다. 특히, 약물 및 생체 이물 대사-관련 유전자(AKR1C4, CYP2C8, HSD11B1, HSD17B13)는 성인 간에서 유의하게 발현되었고, SIC22A1은 성인 간에서 풍부하게 생체 이물 화합물 전달체로 작용 하였다.
이는, 태아 간의 발달 과정이 아직 완벽하지 않고, LiGEP 알고리즘이 간-특이적 세포의 “발달 지표”로서 사용될 수 있음을 확인한 것이다.
실시예 6-2: 간의 발달 과정에 따른 간 유사성의 변화
한편, 본 발명자들은 LiGEP이 발달하는 간 조직의 발달 단계를 나타냄을 확인하고자, 간 유사성의 퍼센트가 간 발달 단계에 따라 점차적으로 증가하는지 여부를 확인하였다. 이에, 쥐의 간 발달 과정을 이용하여, 간 발달 과정에 따른 LiGEP 에 의해 계산된 간 유사성의 퍼센트가 발달 단계에 따라 점차적으로 증가 하는지 확인하였다 (도 5).
먼저, 본 발명자들은 이종상동성을 확인하기 위해 Inparanoid를 사용하였다. 이 방법은 이종상동 그룹을 구성하기 위해 두 개의 완전한 단백질체 사이에서 NCBI-Blast를 이용하여 계산 된 pairwise 유사성 점수를 이용한다. Inparanoid 8을 이용하여 (0.05 이하의 inparalogs를 제외한다), LiGEP의 Mus musculus에서 이종상동성 유전자를 발견하였다.
LiGEP의 93개 유전자를 쌍방향의 이종상동성 관계에 중점을 둔 InParanoid를 사용하여 85개의 쥐 이종상동성 유전자에 매치하였다 (표 7).
배아 일(E) 16.5/18.5, 출생 후(P) 1/8 및 16주(W)에서 마우스 간의 RNA - seq 분석에서, 발달 단계에 따라 상자 플롯에서 LiGEP의 전체 발현이 점차적으로 증가하는 것을 확인하였다(도 4E).
또한, LiGEP 알고리즘의 결과에 따르면 배아일 16일차 (E16)의 태아 간이 인간 간과 비교하여 84.7 %와 83.5 %의 점수를 나타내었고, 16주차 (16W)의 간은 97.6 %의 점수를 나타냈다(도 4F 및 G).
상기와 같은 결과는 각 단계에서 LiGEP 알고리즘의 퍼센트는 쥐의 간 발달 단계와 관련이 있으며, LiGEP 알고리즘을 사용하여 간 발달 단계를 예측할 수 있음을 확인한 것이다.
실시예 7: LiGEP을 이용한 3D 배양물 및 hPSC-유래 간세포의 간 유사성 확인
인간 iPSC 및 ESCs와 같은 PSCs로부터 간 오르가노이드를 3D 조직 분화 방법을 통해 제조할 수 있다.
본 발명자들은 간 오르가노이드 또는 3D 배양된 샘플에서 LiGEP의 이용을 평가하고자, HepaRG 세포 및 hPSC-유래 간세포 유사 세포(HLC)의 3D 배양 세포와의 간 유사성을 추정하기 위한 LiGEP 알고리즘 분석을 수행하였다.
실시예 7-1: 2D 및 3D에서 배양한 HepaRG
먼저, 3차원 회전 타원체는 실험 조건에서 HepaRG에 의해 효율적으로 생산되었다(도 6A).
구체적으로, 분화 된 인간 HepaRG 세포 (Biopredic International, France)는 공급자의 권고에 따라 유지하였다. 세포를 해동하고 윌리엄스 E (Williams E) 배지에 시딩하였다; GlutaMAX (Invitrogen Life Technologies, Sweden)를 해동, 시딩 및 범용 첨가제로 보충하였다. 배양은 37 ℃, 95 % 공기 및 5 % CO2의 멸균 환경에서 유지하였다. HepaRG 단층 배양은 콜라겐 (5 μg/cm2; BD Biosciences)-코팅된 플레이트에서 배양하였다. 제조사가 추천한대로 융합 단일층을 형성하기 위해 세포를 (96- 또는 24- 웰 플레이트에 1.5 × 105 세포 또는 6 × 105 세포로) 접종하였다. 배양량은 96- 또는 24- 웰 플레이트에서 100 μl 또는 500 μl 였고 배양 배지는 매일 보충하였다.
3D HepaRG 배양을 위해 배양 플레이트 위에 HepaRG 세포 (회전 타원체 당 1.5 x 105 세포)를 떨어뜨렸다. 현적 기술로 48 시간 동안 회전 타원체를 형성하고, 현탁 배양 튜브로 옮기면서, 배양액의 50 %를 매일 보충하고 7 일 동안 유지하였다.
실시예 7-2: CYP3A4 효소 활성
CYP3A4 효소 활성 분석은 2D 및 3D 배양 모두에서 7 일간 수행하였다. 대조군으로 간세포암종 HepG2 세포를 이용하였다. 리팜피신은 메탄올에서 10 mM 스톡으로 준비하였으며 필요한 농도로 간세포 배지에서 추가로 희석하였다. 간세포는 20 mM의 리팜피신으로 24 시간 동안 배양하였다. 대조군 세포 (0 μM)는 동일한 부피의 메탄올 및 간세포를 함유하였다.
CYP3A4 효소 분석은 P450-Glo ™ Assay kit의 지침을 이용하여 수행하였다. 기질을 각 웰에 첨가하고, 반응물을 24 ℃에서 45 분 동안 항온처리하고, 50 ㎕의 루시페린 검출시약 (Promega)을 첨가하여 중단하였다. 반응물을 24 ℃에서 추가로 20 분 동안 배양하고, Victor X 광 (Perkin Elmer)을 이용하여 발광을 정량하고 상대 광량 단위 (RLU)로 기록하였다. 단백질원을 제외한 모든 분석 성분을 포함하는 3 개의 웰로부터의 평균 상대 발광 단위 (RLU) 값을 배경값으로 이용하였다. 데이터는 간세포의 DNA 함량으로 표준화하였다.
실시예 7-3: LiGEP을 이용한 3D 배양물 및 hPSC-유래 간세포의 간 유사성 확인
본 발명자들은 간 특성 감별 시험에서, CYP3A4 활성 및 알부민 발현을 분석 하였다.
그 결과, 2D 배양과 비교해서, 3D 회전 타원체 세포가 더 높은 CYP3A4 활성 및 알부민 발현을 나타내었다 (도 6B 및 C). 이러한 결과는 3D 배양의 조건이 HepaRG의 생물학적 특성을 향상 시키며, 3D 배양 세포가 생체 내-유사 간의 컨텍스트에서 조성 및 구조와 점차 유사함을 시사한다.
그러나. LiGEP 알고리즘을 이용하여 상기에서 제조한 2D 및 3D 배양 세포의 간 유사성을 측정한 결과, 2D 배양 세포에서는 40.86 %, 3D 배양 세포에서는 59.14 %의 점수를 얻었다(도 6D 및 E).
실시예 8: LiGEP을 이용한 간의 분화 상태 평가
다음으로, 본 발명자들은 hPSC의 간의 분화 상태를 LiGEP 알고리즘을 사용하여 평가하였다.
구체적으로, 종래의 방법으로 hPSCs를 간세포-유사 세포로 분화시켰다 (도 7A). 이 후, 상기 분화된 간세포-유사 세포에서 qRT-PCR에 의한 간-특이적 유전자의 mRNA을 확인하였다.
그 결과, 상기 분화된 간세포-유사 세포에서 qRT-PCR에 의한 간-특이적 유전자의 mRNA 발현 수준은 알파-1-안티트립신(AAT), 글루타티온 S-트랜스퍼레이즈 A1(GSTA1), 글루타티온 S-트랜스퍼레이즈 A2(GSTA2), 및 대사-관련 사이토크롬 P450 효소(CYP3A4)이 간으로의 분화 유도 후 높게 상향 조절된 것을 확인하였다 (도 6F).
또한, 면역세포화학 분석을 통해, 간 핵 인자 4 알파(HNF4A), AAT, 및 사이토케라틴18(CK18) 발현이 간 분화 유도 후 3주에 명백히 증가된 것을 확인하였다 (도 6G).
다른 계통 세포 유형에 대한 음성 대조군으로서, 본 발명자들은 신경구의 형성을 통한 hPSCs로부터 분화된 신경 전구 세포(NPCs)를 사용했다(도 7B).
hPSC의 배양 및 간세포와 신경 전구 세포 (NPC)로의 분화는 다음과 같은 방법으로 수행되었다.
먼저, hESC 세포주인 H9 (WiCell Research Institute, Madison, WI) 및 섬유아 세포로부터 생성된 hiPSC를 mTeSR ™ 1 배지 (STEMCELL Technologies, Temecula, CA, USA) 내 Matrigel (BD Biosciences, San Jose, CA, USA)-코팅된 접시에 유지하였다.
간세포로의 분화는 기존의 방법을 약간 수정하여 수행하였다 (Choi et al., 2013). 최종 내배엽 (DE) 단계 세포를 유도하기 위해, hESC와 iPSC 같은 hPSC를 GlutaMAX (Invitrogen, Carlsbad, CA, USA), 1X B27 (Invitrogen) 및 100 ng/ml Activin A (R&D Systems, Minneapolis, MN, USA)가 보충된 RPMI 배지에서 5 일간 배양하였다. DE 단계 세포는 GlutaMAX, 10 ng/ml FGF4 (R&D Systems), 10 ng/ml HGF (R&D Systems)가 보충된 RPMI 배지에서 4 일 동안 간 전구세포 (HP) 로 더 분화하였다.
간 성숙을 위해 HP는 1 % ITS (Sigma, St. Louis, MO, USA), 10 ng/ml FGF-4, 10 ng/ml HGF, 10 ng/ml 온코스타틴 (oncostatin) M 및 0.1 μM 덱사메타손 (dexamethasone, Sigma)가 함유 된 완전한 간세포 배양 배지 (Invitrogen)에서 트립신 처리하고 콜라겐 I (Advanced BioMatrix, San Diego, CA, USA)-코팅된 접시에 올려 10 일간 배양하였다.
NPC의 분화 유도 방법을 간략히 설명하면, 5 일 동안 EB 배지 (10 % 혈청 대체물이 보충된 DMEM/F12)에서 hPSC를 배양함으로써 생성된 EB를 DMEM/F12, 1X N2/B27 (Invitrogen), 20 ng/ml bFGF (R&D Systems), 20 ng/ml EGF (Invitrogen), 및 10 ng/ml 백혈병 억제 인자 (Sigma)로 구성된 NPC 배지에 배양하였다. NPC는 McIlwainTM 조직 절단기 (Mickle Engineering)를 이용하여 계대배양하고, 배지는 2 일마다 교체하였다.
qRT-PCR을 이용하여, 상기에서 유도된 NPCs에서 NESTIN, PAX6, NCAM, 및 OTX를 포함하는, 신경 마커가 발현이 높은 것을 확인하였다 (도 8A). 이들 hPSC-유래 NPCs는 더 분화된 NPC의 면역세포화학 분석에 의해 알 수 있듯이, 신경 세포 및 신경 교세포로 최종적으로 분화하였다(도 8B).
점-플롯은 hESC-유래 HLCs에서 LiGEP의 분포와 hiPSC-유래 HLCs의 그것이 유사하다는 것을 보여줬다(도 9). 또한, 본 발명자들은 분화 동안 컷-오프 유전자 목록을 확인했고(도 6H, 표 8) 각각, 32.26% 및 30.11% 간 유사성 점수를 얻었다(도 6I).
그러나, 미분화된 hPSCs에서 LiGEP 알고리즘 점수는 hPSC 유래 HLC와 비교하여 현저히 다르고 유의하게 낮았으며, 대부분의 유전자는 0.0 FPKM 값 미만이었고 간 유사성은 14 %미만이었다. hPSC-유래 NPCs에서 LiGEP의 분포는 미분화 hPSCs에서 관찰된 것과 매우 유사했다(도 6H 및 6I).
종합하면, 본 발명의 LiGEP 알고리즘은 간 유사성을 점수화하여 제공함으로써, 간 유사성의 정도를 정량적으로 나타낼 수 있을 뿐만 아니라, 간의 발달 단계 역시 정량적으로 표현할 수 있다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> KOREA RESEARCH INSTITUTE OF BIOSCIENCE AND BIOTECHNOLOGY
<120> Method for providing information of differentiation status and
tissue similarity
<130> KPA170134-KR
<160> 206
<170> KoPatentIn 3.0
<210> 1
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ADH1A_F
<400> 1
tgaagtcatc ggtcggcttg 20
<210> 2
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ADH1A_R
<400> 2
agccacaagt tttgggacac 20
<210> 3
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ADH4_F
<400> 3
agggaggtgt ggattttgcc 20
<210> 4
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ADH4_R
<400> 4
agtcagtgac cagctttggg 20
<210> 5
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> ADH6_F
<400> 5
cttctgcttt gaggccattg g 21
<210> 6
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ADH6_R
<400> 6
tagggatgtg ctgtctgctc 20
<210> 7
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> AFM_F
<400> 7
ggccctgctt tgagagtttg 20
<210> 8
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> AFM_R
<400> 8
gcagacttca ggactctctg c 21
<210> 9
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> AGXT_F
<400> 9
gtacagcctg agagagagcc 20
<210> 10
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> AGXT_R
<400> 10
ccaaggccac ccatgatctc 20
<210> 11
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> AHSG_F
<400> 11
aatgaagcag tccccacacc 20
<210> 12
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> AHSG_R
<400> 12
cgacacttct cctgagggtg 20
<210> 13
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> AKR1C4_F
<400> 13
tgttctggtt gcccacagtg 20
<210> 14
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> AKR1C4_R
<400> 14
tggatgttct ctctgatccg c 21
<210> 15
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ALB_F
<400> 15
caggcgacca tgcttttcag 20
<210> 16
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ALB_R
<400> 16
tcagccttgc agcacttctc 20
<210> 17
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> AMBP_F
<400> 17
gagactttcc agtacggcgg 20
<210> 18
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> AMBP_R
<400> 18
ggacaccgca gtactctctg 20
<210> 19
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ANGPTL3_F
<400> 19
gcgattactg gcaatgtccc 20
<210> 20
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ANGPTL3_R
<400> 20
atcctcttct cctctctggc 20
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APCS_F
<400> 21
aaaaagggtc tgcgacaggg 20
<210> 22
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APCS_R
<400> 22
tgccagtcca ggatattggc 20
<210> 23
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APOA2_F
<400> 23
accatctgca gccttgaagg 20
<210> 24
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APOA2_R
<400> 24
taaccagttc cgttccagcc 20
<210> 25
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APOB_F
<400> 25
agagctttct gccactgctc 20
<210> 26
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APOB_R
<400> 26
tgactgtggt tgattgcagc 20
<210> 27
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APOC4_F
<400> 27
cctcagaaac aggctccagg 20
<210> 28
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APOC4_R
<400> 28
gtaggtctgc atgaagcccc 20
<210> 29
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APOF_F
<400> 29
gggtctagcg atcagtgctg 20
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APOF_R
<400> 30
cttgattatg gcccaccccc 20
<210> 31
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APOH_F
<400> 31
aactgggaaa ctggtctgcc 20
<210> 32
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> APOH_R
<400> 32
tgaagcattt ggggacttcg 20
<210> 33
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> AQP9_F
<400> 33
ctccagaaac ttgggagccc 20
<210> 34
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> AQP9_R
<400> 34
atgaggcctc caatgacagc 20
<210> 35
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> BAAT_F
<400> 35
ctattgaaga ggcccagggg 20
<210> 36
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> BAAT_R
<400> 36
tgtgggatca cctctcctcc 20
<210> 37
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> C4BPB_F
<400> 37
gggactgtga ccctcctgg 19
<210> 38
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> C4BPB_R
<400> 38
tggcttcgca gaggttctta c 21
<210> 39
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C5orf27_F
<400> 39
agctggcctg aacttgaagg 20
<210> 40
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C5orf27_R
<400> 40
ccaggtgaga gggggaattg 20
<210> 41
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> C6_F
<400> 41
acccgcttgt aagtttttgg c 21
<210> 42
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C6_R
<400> 42
tccacccttg aagcactgtg 20
<210> 43
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C8A_F
<400> 43
gatgcagcct atccacgagg 20
<210> 44
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C8A_R
<400> 44
tccagctccc atctgctttg 20
<210> 45
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C8B_F
<400> 45
tagttcctgc cactgtgctc 20
<210> 46
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C8B_R
<400> 46
cccccatttt gaggaggtgg 20
<210> 47
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C8G_F
<400> 47
accttccgaa agctggatgg 20
<210> 48
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C8G_R
<400> 48
tgctcaaacc cactcaggac 20
<210> 49
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C9_F
<400> 49
ttgtcaactg ggcctcttcc 20
<210> 50
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> C9_R
<400> 50
gaatgggcag gcacacaaac 20
<210> 51
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> CFHR1_F
<400> 51
gccccctcca cctattgac 19
<210> 52
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CFHR1_R
<400> 52
aagcttctgt ttggctgtcc 20
<210> 53
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> CFHR2_F
<400> 53
gccagaactt gtatcaactt gagg 24
<210> 54
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> CFHR2_R
<400> 54
cccattctga cacattgctc g 21
<210> 55
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> CFHR3_F
<400> 55
tgccagccct actatgaact tc 22
<210> 56
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> CFHR3_R
<400> 56
cccgacacac tgcttgaaat g 21
<210> 57
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CP_F
<400> 57
tgcacgtggg agatgaagtc 20
<210> 58
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CP_R
<400> 58
tccagcatga atgtggtcgg 20
<210> 59
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> CPB2_F
<400> 59
gcaaagacca tgaggaactg tc 22
<210> 60
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CPB2_R
<400> 60
gtttgatgta acgctccggc 20
<210> 61
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CRP_F
<400> 61
cagggatcgt ggagttctgg 20
<210> 62
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CRP_R
<400> 62
cattaggact gaagggcccg 20
<210> 63
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> CXCL2_F
<400> 63
agcaatcccc ggctcctg 18
<210> 64
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CXCL2_R
<400> 64
cggggttgag acaagctttc 20
<210> 65
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP1A2_F
<400> 65
tcgtaaacca gtggcaggtc 20
<210> 66
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP1A2_R
<400> 66
gtagcaggat ggccaggaag 20
<210> 67
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP2A6_F
<400> 67
aagtgttccc tatgctgggc 20
<210> 68
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP2A6_R
<400> 68
tctgcatgac ggtggtgaag 20
<210> 69
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP2C8_F
<400> 69
tccgtgctac atgatgacaa ag 22
<210> 70
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP2C8_R
<400> 70
tccctttggt aactgcagta g 21
<210> 71
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP2C9_F
<400> 71
tccctgactt ctgtgctaca tg 22
<210> 72
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP2C9_R
<400> 72
actggagtgg tgtcaaggtt c 21
<210> 73
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP2D6_F
<400> 73
tcaccaacct gtcatcggtg 20
<210> 74
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP2D6_R
<400> 74
accgagaagc tgaagtgctg 20
<210> 75
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP2E1_F
<400> 75
tcgtagtgcc aactctggac 20
<210> 76
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP2E1_R
<400> 76
ttgggtcaac gagaggcttc 20
<210> 77
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP4F2_F
<400> 77
tcacccagga cattgtgctc 20
<210> 78
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP4F2_R
<400> 78
gccaggacca ccttcatctc 20
<210> 79
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP8B1_F
<400> 79
tgcacatgga ccctgacatc 20
<210> 80
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP8B1_R
<400> 80
gtgtcagggt ccaccaactc 20
<210> 81
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> F12_F
<400> 81
taccgttcct ctccctggag 20
<210> 82
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> F12_R
<400> 82
ggtagtaggc cacatcggtg 20
<210> 83
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> F2_F
<400> 83
tgaacctgcc cattgtggag 20
<210> 84
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> F2_R
<400> 84
ttcaccccat gagacgatgc 20
<210> 85
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> F9_F
<400> 85
gtggctgggg aagagtcttc 20
<210> 86
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> F9_R
<400> 86
ttgcacactc ttcaccccag 20
<210> 87
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FGA_F
<400> 87
ctaggggctc agaatctggc 20
<210> 88
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FGA_R
<400> 88
atgatcggct tcacttccgg 20
<210> 89
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FGB_F
<400> 89
agaggaacag ccggtaatgc 20
<210> 90
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FGB_R
<400> 90
ttgccatgtc ccaggtgtac 20
<210> 91
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FGG_F
<400> 91
tgcagttcag tacctgggac 20
<210> 92
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> FGG_R
<400> 92
ccaccgggtt ttccaagtg 19
<210> 93
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FGL1_F
<400> 93
ttcatcctga ggtgcagtgg 20
<210> 94
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FGL1_R
<400> 94
aataccacca cccatgccag 20
<210> 95
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FMO3_F
<400> 95
ctctcctcct tcattggggc 20
<210> 96
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FMO3_R
<400> 96
gcttctgaag tctcccgacc 20
<210> 97
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> FMO5_F
<400> 97
cctcctaacc tggaaaggcc 20
<210> 98
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> FMO5_R
<400> 98
tcttcaactt gggtttgtct gatg 24
<210> 99
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> GC_F
<400> 99
aagccttggt gaatgctgtg 20
<210> 100
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> GC_R
<400> 100
tggaggcaaa gtctgagtgc 20
<210> 101
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> GNMT_F
<400> 101
tcgcaactac gaccacatcc 20
<210> 102
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> GNMT_R
<400> 102
aaggatgcca gacagtgtgg 20
<210> 103
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HABP2_F
<400> 103
ctctggctgg ggtgttacag 20
<210> 104
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HABP2_R
<400> 104
cgtagtaggt gccgtccttc 20
<210> 105
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HAMP_F
<400> 105
gaccagtggc tctgttttcc 20
<210> 106
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HAMP_R
<400> 106
cacatcccac actttgatcg 20
<210> 107
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HAO1_F
<400> 107
attgtggagg ctgtggaagg 20
<210> 108
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HAO1_R
<400> 108
tcacattctg gcacccactc 20
<210> 109
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HGFAC_F
<400> 109
gacacaagtg ccagattgcg 20
<210> 110
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HGFAC_R
<400> 110
atgccgtaga ggtaagccac 20
<210> 111
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HPR_F
<400> 111
gcacatgccc caaatggaag 20
<210> 112
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HPR_R
<400> 112
accatactca gccacagcac 20
<210> 113
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HPX_F
<400> 113
ctggagaagg aagtcgggac 20
<210> 114
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HPX_R
<400> 114
tggcggaaca tgagttaggg 20
<210> 115
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HRG_F
<400> 115
tccccactgc catgatttcc 20
<210> 116
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HRG_R
<400> 116
atgtttgtgg tgcggcaatg 20
<210> 117
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HSD11B1_F
<400> 117
ctctctggct gggaaagtgg 20
<210> 118
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HSD11B1_R
<400> 118
gcagagctcc ccctttgatg 20
<210> 119
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> HSD17B13_F
<400> 119
tcagaacttc aggccttggg 20
<210> 120
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> HSD17B13_R
<400> 120
ggcgcgttca ggaagaaac 19
<210> 121
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ITIH1_F
<400> 121
atgtgctgga cagtcatcgg 20
<210> 122
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ITIH1_R
<400> 122
tgagtccagc cccattgttg 20
<210> 123
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ITIH2_F
<400> 123
ttctcaccta aagcccacgg 20
<210> 124
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ITIH2_R
<400> 124
tgttgtgcac aaaccagcag 20
<210> 125
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ITIH3_F
<400> 125
ggacagtcac cggatgtcag 20
<210> 126
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ITIH3_R
<400> 126
tcagcccttc tccgttgttg 20
<210> 127
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ITIH4_F
<400> 127
tattctcagt gatgcccggc 20
<210> 128
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ITIH4_R
<400> 128
tctgccgtca tctgatgctg 20
<210> 129
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> KLKB1_F
<400> 129
gatggggctt ctcgaaggag 20
<210> 130
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> KLKB1_R
<400> 130
gtgatgccca ccaaacgc 18
<210> 131
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> LEAP2_F
<400> 131
tagatggctc cccaatacca 20
<210> 132
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> LEAP2_R
<400> 132
ggaacagcgt ctttttctgc 20
<210> 133
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> LECT2_F
<400> 133
gtggacatct tgtgctctgc 20
<210> 134
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> LECT2_R
<400> 134
tgcacatgcg attgtatgcc 20
<210> 135
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> MASP2_F
<400> 135
tggaactgca tctggatggg 20
<210> 136
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> MASP2_R
<400> 136
tcccacaaac cacctctctg 20
<210> 137
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> MAT1A_F
<400> 137
caccaaggta gaccgctcag 20
<210> 138
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> MAT1A_R
<400> 138
aatccctgac aatgacgccc 20
<210> 139
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> PON1_F
<400> 139
actccattga agtcccttga c 21
<210> 140
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> PON1_R
<400> 140
gtactgcctt gcaacactgt g 21
<210> 141
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> PON3_F
<400> 141
gaaggtgata cagttgggca c 21
<210> 142
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> PON3_R
<400> 142
acacagaagc cacagaggtg 20
<210> 143
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> PROC_F
<400> 143
aaggaggcca agagaaaccg 20
<210> 144
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> PROC_R
<400> 144
agttgtgaag gagcccacag 20
<210> 145
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> RDH16_F
<400> 145
ctggagattt gggaccggtc 20
<210> 146
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> RDH16_R
<400> 146
ccaggaaggt gggcatgtag 20
<210> 147
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SAA4_F
<400> 147
gctggcgttc gtttttcaag 20
<210> 148
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> SAA4_R
<400> 148
agtcctccaa tacagtgctg c 21
<210> 149
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SDS_F
<400> 149
gtctccctgc ccaagatcac 20
<210> 150
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SDS_R
<400> 150
tggagcttct ggatcacgtg 20
<210> 151
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SERPINA11_F
<400> 151
gcccagtctg ttggatttgc 20
<210> 152
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SERPINA11_R
<400> 152
gtgttcagag atgggggctg 20
<210> 153
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SERPINA4_F
<400> 153
tgggcttcac ggatctgttc 20
<210> 154
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SERPINA4_R
<400> 154
tctgggtgct ggtggaaaag 20
<210> 155
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SERPINA6_F
<400> 155
ggaggaaatg ggcattgcag 20
<210> 156
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SERPINA6_R
<400> 156
aaaggctgct ccaggtgaag 20
<210> 157
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SERPINC1_F
<400> 157
tgggccttgt cgatctgttc 20
<210> 158
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SERPINC1_R
<400> 158
tggccttgaa agtcaccctg 20
<210> 159
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> SERPIND1_F
<400> 159
agttgatggg gatcaggatg c 21
<210> 160
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SERPIND1_R
<400> 160
ttcccatgaa gagcaggcag 20
<210> 161
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC10A1_F
<400> 161
tcagcatgga gactggatgc 20
<210> 162
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC10A1_R
<400> 162
cttcagttgt ggcagctgtg 20
<210> 163
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC13A5_F
<400> 163
catcgtgctg ctactagggg 20
<210> 164
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC13A5_R
<400> 164
accatggagg caaagatggg 20
<210> 165
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC22A1_F
<400> 165
aatgctgagc tgtaccccac 20
<210> 166
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC22A1_R
<400> 166
tttctcccaa ggttctcggc 20
<210> 167
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC25A47_F
<400> 167
ctttcctacg cggtcctctg 20
<210> 168
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC25A47_R
<400> 168
acgctggtca ccatacagtg 20
<210> 169
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC2A2_F
<400> 169
accacgtcct gctgctttag 20
<210> 170
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC2A2_R
<400> 170
cagcagcttt tggcctgtg 19
<210> 171
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC38A4_F
<400> 171
cgacccttca gctggatacg 20
<210> 172
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLC38A4_R
<400> 172
taaagccccg accttttggg 20
<210> 173
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SLCO1B1_F
<400> 173
tggtccacca acaactgtgg 20
<210> 174
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> SLCO1B1_R
<400> 174
tgcttcatcc atgacacttc c 21
<210> 175
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> SULT2A1_F
<400> 175
tgaggagctg aaacaggaca c 21
<210> 176
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> SULT2A1_R
<400> 176
aagtcttcag cttgggccac 20
<210> 177
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> TAT_F
<400> 177
ccccgggaga gttttaccac 20
<210> 178
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> TAT_R
<400> 178
gggtactcaa agcacgttgc 20
<210> 179
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> TDO2_F
<400> 179
ccaggtgcct tttcagttgc 20
<210> 180
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> TDO2_R
<400> 180
cttcggtatc cagtgtcggg 20
<210> 181
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> UGT2B10_F
<400> 181
atgaaggcca agggaacagc 20
<210> 182
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> UGT2B10_R
<400> 182
tggaaccagg tgaggtcatg 20
<210> 183
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> UGT2B15_F
<400> 183
ccctcagtgt ggacatcagg 20
<210> 184
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> UGT2B15_R
<400> 184
tggatccagg tgaggttgtg 20
<210> 185
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> UGT2B4_F
<400> 185
acacatgaag gccaagggag 20
<210> 186
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> UGT2B4_R
<400> 186
gaaccaggtg aggtcgtgg 19
<210> 187
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> VTN_F
<400> 187
aggtttaggc atcgcaaccg 20
<210> 188
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> VTN_R
<400> 188
cgtgtgcgaa gattgactcg 20
<210> 189
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> AAT_F
<400> 189
agaccctttg aagtcaagcg acc 23
<210> 190
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> AAT_R
<400> 190
ccattgctga agaccttagt gatgc 25
<210> 191
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP3A4_F
<400> 191
tgtgcctgag aacaccagag 20
<210> 192
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> CYP3A4_R
<400> 192
gtggtggaaa tagtcccgtg 20
<210> 193
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> GSTA1_F
<400> 193
gactccagtc ttatctccag cttcc 25
<210> 194
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> GSTA1_R
<400> 194
tgcttcttct aaagatttct catccat 27
<210> 195
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> GSTA2_F
<400> 195
tggaagagct tgactctagc cttatt 26
<210> 196
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> GSTA2_R
<400> 196
ggctgccagg ctgtagaaac 20
<210> 197
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> NESTIN_F
<400> 197
caggagaaac agggcctaca 20
<210> 198
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> NESTIN_R
<400> 198
tgggagcaaa gatccaagac 20
<210> 199
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> PAX6_F
<400> 199
gtccatcttt gcttgggaaa 20
<210> 200
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> PAX6_R
<400> 200
tagccaggtt gcgaagaact 20
<210> 201
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> NCAM_F
<400> 201
aggagacaga aacgaagcca 20
<210> 202
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> NCAM_R
<400> 202
ggtgttggaa atgctctggt 20
<210> 203
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> OTX2_F
<400> 203
cgagggtgca ggtatggttt 20
<210> 204
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> OTX2_R
<400> 204
agctgggctc cagatagaca 20
<210> 205
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ALB_F
<400> 205
agaatgcgct attagttcgt 20
<210> 206
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> ALB_R
<400> 206
acttactggc gttttctcat 20
Claims (13)
- 분리된 검체 세포에서 측정된 간 조직 특이적 유전자의 발현량을 하기 수학식 1에 적용하는 단계를 포함하는,
검체 세포의 간 조직과의 유사성 또는 간 조직으로의 분화 수준에 대한 정보 제공 방법.
[수학식 1]
상기 수학식 1에서 Ai, Bi, 및 Ci 는 각각 I(yi - Ui > 0)·I(zi > 0), I(yi - Ui ≤ 0)·I(zi > 0), I(yi - Ui > 0)·I(zi ≤ 0)임. yi 는 간 조직 시료의 i번째 유전자 FPKM (fragments per kilobase of exon model per million mapped reads) 값, Ui 는 윌콕슨 부호-순위 검정 (Wilcoxon signed-rank test)의 100 × (1-α) % 신뢰구간의 상한값, zi는 검체 세포의 FPKM 값(ui )과 Ui 의 차 (ui - Ui ).
- 제1항에 있어서, 상기 분화 수준이 정량적 수치인 것인, 정보 제공 방법.
- 제1항에 있어서, 상기 검체 세포는 조직 세포, 줄기 세포로부터 분화된 세포, 또는 장기 유사체인 것인, 정보 제공 방법.
- 삭제
- 제1항에 있어서,
상기 간 조직은 개체로부터 적출된 장기, 줄기세포로부터 분화된 세포, 또는 장기 유사체인 것인, 정보 제공 방법.
- 제5항에 있어서,
상기 줄기세포는 배아 유래 줄기세포, 또는 유도 만능 줄기세포 (induced pluripotent stem cells, iPSC) 인 것인, 정보 제공 방법.
- 제1항에 있어서, 상기 간 조직 특이적 유전자는 표 3에 개시된 유전자인 것인, 정보 제공 방법.
- 제1항에 있어서,
상기 간 조직 특이적 유전자는 간 조직에서의 발현량이 간 조직이 아닌 다른 조직에서의 발현량과 비교하여 2배 이상 높은 발현량을 나타내는 유전자인 것인, 정보 제공 방법.
- 제1항에 있어서,
상기 간 조직 특이적 유전자의 발현량 측정은 상기 유전자의 mRNA 발현 수준 또는 상기 유전자가 코딩하는 단백질의 발현 수준을 측정하는 것인, 정보 제공 방법.
- 제9항에 있어서, 상기 간 조직 특이적 유전자의 mRNA 발현수준을 측정하는 것은 상기 유전자의 mRNA에 특이적으로 결합하는 안티센스 올리고뉴클레오티드, 프라이머 쌍, 프로브 또는 이들의 조합을 이용하는 것인, 정보 제공 방법.
- 제9항에 있어서, 상기 유전자가 코딩하는 단백질의 발현 수준을 측정하는 것은 상기 단백질에 특이적으로 결합하는 항체, 앱타머 또는 이들의 조합을 이용하는 것인, 정보 제공 방법.
- (a) 분화 유도 인자를 분리된 검체 세포에 처리하는 단계;
(b) 상기 분화 유도 인자가 처리된 검체 세포에서 측정된 간 조직 특이적 유전자의 발현량을 하기 수학식 1에 적용하는 단계를 포함하는,
분화 유도 인자의 분화 유도능을 검정하는 방법.
[수학식 1]
상기 수학식 1에서 Ai, Bi, 및 Ci 는 각각 I(yi - Ui > 0)·I(zi > 0), I(yi - Ui ≤ 0)·I(zi > 0), I(yi - Ui > 0)·I(zi ≤ 0)임. yi 는 간 조직 시료의 i번째 유전자 FPKM (fragments per kilobase of exon model per million mapped reads) 값, Ui 는 윌콕슨 부호-순위 검정 (Wilcoxon signed-rank test)의 100 × (1-α) % 신뢰구간의 상한값, zi는 검체 세포의 FPKM 값(ui )과 Ui 의 차 (ui - Ui ).
- 검체 세포의 간 조직과의 유사성 또는 간 조직으로의 분화 수준에 대한 정보를 제공하기 위한, 매체에 저장된 컴퓨터 프로그램으로서,
상기 프로그램은
입력된 검체 세포에서 측정된 간 조직 특이적 유전자의 발현량을 하기 수학식 1에 적용하는 단계를 포함하는,
검체 세포의 간 조직과의 유사성 또는 간 조직으로의 분화 수준에 대한 정보를 제공하기 위한 컴퓨터 프로그램.
[수학식 1]
상기 수학식 1에서 Ai, Bi, 및 Ci 는 각각 I(yi - Ui > 0)·I(zi > 0), I(yi - Ui ≤ 0)·I(zi > 0), I(yi - Ui > 0)·I(zi ≤ 0)임. yi 는 간 조직 시료의 i번째 유전자 FPKM (fragments per kilobase of exon model per million mapped reads) 값, Ui 는 윌콕슨 부호-순위 검정 (Wilcoxon signed-rank test)의 100 × (1-α) % 신뢰구간의 상한값, zi는 검체 세포의 FPKM 값(ui )과 Ui 의 차 (ui - Ui ).
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170079882A KR101920795B1 (ko) | 2017-06-23 | 2017-06-23 | 조직 간 유사성 및 분화 수준에 대한 정보 제공 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020170079882A KR101920795B1 (ko) | 2017-06-23 | 2017-06-23 | 조직 간 유사성 및 분화 수준에 대한 정보 제공 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101920795B1 true KR101920795B1 (ko) | 2018-11-21 |
Family
ID=64602801
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020170079882A KR101920795B1 (ko) | 2017-06-23 | 2017-06-23 | 조직 간 유사성 및 분화 수준에 대한 정보 제공 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101920795B1 (ko) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160312191A1 (en) | 2015-04-22 | 2016-10-27 | The Regents Of The University Of Michigan | Compositions and methods for obtaining stem cell derived lung tissue, and related uses therof |
US20160319240A1 (en) | 2013-10-25 | 2016-11-03 | Agency For Science, Technology And Research | Culturing pluripotent stem cells |
-
2017
- 2017-06-23 KR KR1020170079882A patent/KR101920795B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160319240A1 (en) | 2013-10-25 | 2016-11-03 | Agency For Science, Technology And Research | Culturing pluripotent stem cells |
US20160312191A1 (en) | 2015-04-22 | 2016-10-27 | The Regents Of The University Of Michigan | Compositions and methods for obtaining stem cell derived lung tissue, and related uses therof |
Non-Patent Citations (1)
Title |
---|
Investigative Ophthalmology & Visual Science, 44(9):3732-3741 (2003) |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Andersen et al. | Precardiac organoids form two heart fields via Bmp/Wnt signaling | |
Posfai et al. | Evaluating totipotency using criteria of increasing stringency | |
Oldak et al. | Complete human day 14 post-implantation embryo models from naive ES cells | |
Byrnes et al. | Lineage dynamics of murine pancreatic development at single-cell resolution | |
Bergmann et al. | Spatial profiling of early primate gastrulation in utero | |
Sivitilli et al. | Robust production of uniform human cerebral organoids from pluripotent stem cells | |
Gao et al. | Comparative transcriptome analysis of fetal skin reveals key genes related to hair follicle morphogenesis in cashmere goats | |
Beckervordersandforth et al. | In vivo fate mapping and expression analysis reveals molecular hallmarks of prospectively isolated adult neural stem cells | |
Bochmann et al. | Revealing new mouse epicardial cell markers through transcriptomics | |
US20020146678A1 (en) | Directed differentiation of embryonic cells | |
US20220254448A1 (en) | Methods of identifying dopaminergic neurons and progenitor cells | |
Jindal et al. | Single-cell lineage capture across genomic modalities with CellTag-multi reveals fate-specific gene regulatory changes | |
KR102087294B1 (ko) | 3차원 장관 오가노이드 및 3차원 신경외배엽 구체를 포함하는 다장기 파킨슨병 모델 및 이의 용도 | |
Lee et al. | Development of a quantitative prediction algorithm for target organ-specific similarity of human pluripotent stem cell-derived organoids and cells | |
KR101920795B1 (ko) | 조직 간 유사성 및 분화 수준에 대한 정보 제공 방법 | |
US20210340499A1 (en) | Production and Enrichment of Pancreatic Endocrine Progenitor Cells | |
Zhou et al. | Dual lineage origins of neocortical astrocytes | |
Thowfeequ et al. | An integrated approach identifies the molecular underpinnings of murine anterior visceral endoderm migration | |
CN113106160A (zh) | 评估肝谱系细胞成熟度的标志物、双组学试剂盒及构建方法 | |
Sonam et al. | Single-cell analyses of the corneal epithelium: Unique cell types and gene expression profiles | |
Capo-Chichi et al. | Alteration of differentiation potentials by modulating GATA transcription factors in murine embryonic stem cells | |
Kiyokawa et al. | Airway tissue stem cells reutilize the embryonic proliferation regulator, Tgfß-Id2 axis, for tissue regeneration | |
CN115624616B (zh) | 接头蛋白pinch在诊断血管发育异常相关疾病中的应用 | |
Kwon et al. | Chemically-defined and scalable culture system for intestinal stem cells derived from human intestinal organoids | |
JP2019150018A (ja) | 細胞判定装置、細胞判定方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |