KR20180052985A - 유방암 예후 예측 유전자의 차세대염기서열분석을 이용한 유방암의 예후 예측 도구 - Google Patents

유방암 예후 예측 유전자의 차세대염기서열분석을 이용한 유방암의 예후 예측 도구 Download PDF

Info

Publication number
KR20180052985A
KR20180052985A KR1020160150228A KR20160150228A KR20180052985A KR 20180052985 A KR20180052985 A KR 20180052985A KR 1020160150228 A KR1020160150228 A KR 1020160150228A KR 20160150228 A KR20160150228 A KR 20160150228A KR 20180052985 A KR20180052985 A KR 20180052985A
Authority
KR
South Korea
Prior art keywords
breast cancer
sequencing
prognosis
rna
genes
Prior art date
Application number
KR1020160150228A
Other languages
English (en)
Inventor
한원식
이한별
박인애
유한석
안세현
이종원
이새별
이희진
김애리
김정렬
윤성로
김선
권선영
김민수
조정희
Original Assignee
서울대학교병원
재단법인 아산사회복지재단
울산대학교 산학협력단
고려대학교 산학협력단
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교병원, 재단법인 아산사회복지재단, 울산대학교 산학협력단, 고려대학교 산학협력단, 서울대학교산학협력단 filed Critical 서울대학교병원
Priority to KR1020160150228A priority Critical patent/KR20180052985A/ko
Publication of KR20180052985A publication Critical patent/KR20180052985A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • G06F19/22
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

유방암 환자 조직으로부터 RNA 추출 단계; Targeted RNA-sequencing 단계; Targeted RNA-sequencing 결과 후처치 단계; Targeted RNA-sequencing 발현정보 정규화 (normalization) 단계; 및 유방암 예후 예측 및 항암화학요법의 치료효과 예측 알고리즘 적용 단계를 포함하는 유방암 예후 예측 유전자의 차세대염기서열분석을 이용한 유방암의 예후 예측 도구.

Description

유방암 예후 예측 유전자의 차세대염기서열분석을 이용한 유방암의 예후 예측 도구{Breast cancer prognosis prediction tool using next-generation sequencing of breast cancer prognostic genes}
본 발명은 분자유전 진단기기를 이용하여 혈액/종양학 분야 중 유방암의 예후 및 항암화학용법의 치료효과를 예측하는 기술에 관한 것이다.
현재 호르몬수용체 양성 유방암의 조직을 이용하여 예후 예측을 하고 항암치료의 필요성을 판단해주는 도구들은 RT-PCR 기반이며, 제한된 숫자의 유전자를 사용하고 있다. 유방암 예후 진단 검사를 수행하는 방식은 현재 real-time PCR을 통한 증폭 방식이 상용화되어 있으며, 현재 혼성화를 통한 예후 진단 방식 서비스를 제공하는 업체는 국내/국외에 상용화되지 않고 있다.
'Genome Health' 사의 Oncotype DX 서비스는 early-stage 유방암 환자들을 대상으로 하여21개 유전자에 대한 정보를 혼성화를 통해 분석해 진단하는 서비스이다. 하지만 해외 업체에서 서비스 하기 때문에 상대적으로 비싼 가격 (400만원 가량)과 진단에 걸리는 시간이 상대적으로 오래 걸린다는 단점이 있다. Real-time PCR을 통한 증폭 방식을 이용하여 유방암 예후 진단 서비스를 제공하는 국내 업체는 젠큐릭스가 있다. 젠큐릭스 사의 'GenesWellTM BCT' 서비스는 9개의 유전자를 대상으로 하고 있으나 real-time PCR에 기반한 방식이기 때문에 더 많은 수의 유전자의 진단을 통한 정밀한 진단이 어렵다는 단점이 있으며. 또한 가격도 상대적으로 고가 (250만원 가량)이다.
현재 유방암 예후예측 도구의 표준으로 사용되고 있는 Oncotype DX®와 Mammaprint®, 국내에서 개발된 GenesWell BCT 등은 모두 RT-PCR 기반의 검사이기 때문에 비용과 효율성의 측면에서 많은 유전자를 동시에 분석하기 어렵다. 단일 마커에 의한 예측이나 임상병리학적 요인에 의한 분석에 비해 다유전자 마커의 분석에 의한 유방암 예후 예측이 우월하다. NGS는 이전의 기술에 비해 효율성이 월등한 high throughput sequencing 기술로, 급격한 검사가격의 하락으로 현재 모든 유전체 연구의 표준 플랫폼으로 빠르게 자리잡고 있다. 임상에 적용할 경우 치료를 결정하기 위한 정보를 기존 PCR 방식보다 빠르고 민감하고 재현성 높게 얻을 수 있어 유용성이 높다.
또한 Oncotype DX®와 Mammaprint®은 국내 유방암 환자에서 예후 예측력이 검증된 적 없다. 우리나라를 포함하여 동아시아에서 발생하는 유방암의 특징은 서양의 유방암과 원인과 임상상에서 차이가 있다. 서양에서 개발한 진단 도구를 사용하는 것 보다는 한국인 환자의 정보를 이용하여 개발한 진단 도구를 적용하는 것이 보다 정확한 정보를 얻을 수 있다.
본 발명은 수술 후 유방암 조직의 유전자 발현분석으로 환자의 예후를 정확히 예측하고 항암치료의 필요성을 판정해 줄 수 있는 차세대 염기서열분석 (next-generation sequencing, NGS) 기반, 다유전자 구성의 한국형 예후 예측 도구이다. 유방암 조직에서 유방암의 예후 관련 유전자들의 targeted RNA-sequencing (NGS)을 통해 발현량을 측정하고, 이 정보를 이용하여 같은 조직에서 얻은 Oncotype DX (현재 유방암 예후예측 도구로 사용 중인 RT-PCR 기반의 검사로, NCCN과 St. Gallen, ASCO 등의 가이드라인에 호르몬수용체 양성 임파선전이 음성 유방암에 사용하도록 명시되어 있음)의 Recurrence Score(RS)를 기준으로 유사한 예측력을 보이는 유전자 구성과 알고리즘을 개발하였다.
도 1은 본 발명의 일 실시예에 따른 유방암의 예후 예측 방법이다.
도 2는 본 발명의 일 실시예에 따른 Total RNA로부터 ribosomal RNA를 제거하는 과정이다.
도 3은 본 발명의 일 실시예에 따른 Targeted RNA-sequencing 데이터 후처리 파이프라인 작동 과정이다.
도 4는 본 발명의 일 실시예에 따른 표적 RNA 시퀀싱 데이터 정규화 파이프라인 작동 과정이다.
도 5는 본 발명의 일 실시예에 따른 유방암 예후 예측 및 항암화학요법의 치료효과 예측 알고리즘이다.
본 발명은 NGS 기반의 다유전자 예후예측 도구로, 기존 검사보다 많은 유전자를 보다 빠르고 민감하며 재현성 높게 분석함으로써 예후를 예측하고 항암치료의 필요성을 판단하는데 이용될 수 있다.
본 발명에 따른 유방암 예후 진단 검사 방법은 혼성화를 통한 방식으로 약 150개의 유전자를 대상으로 분석 가능하다. 다수 유전자에 대한 예후 진단은 검사의 정밀도를 높이는데 기여할 수 있다. 또한, 유방암 예후 진단 검사 서비스의 가격을 약 100만원 수준으로 예상하고 있으며 기존 검사 플랫폼에 비해 낮은 가격은 본 발명의 이용 가능성에서 경쟁력이 있다고 판단된다. 또한 세계 시장에서 유방암 예후 진단 검사를 선점하고 있는 선도 업체 (Genome Health) 에 비해 많은 수의 유전자에 대한 검사/진단을 수행함으로써 검사 정밀성을 개선하였고 가격 경쟁력 또한 확보하였기 때문에 제품화 이후 세계 시장으로의 진출 가능성도 상당히 높다.
본 발명은 포르말린고정파라핀포매 (formalin-fixed paraffin-embedded, FFPE) 유방암 조직으로부터 RNA 추출하는 기술, 차세대 염기서열분석 (NGS) 기반으로 RNA 염기서열을 분석하여 유방암 조직에서 유방암 예후예측 유전자들의 발현량을 측정하는 기술, 유방암 예후예측 유전자의 발현량을 이용하여 기존의 Oncotype DX RS와 유사한 예측력을 나타낼 수 있는 scoring 시스템 알고리즘을 포함할 수 있다. 본 발명은 생물학적 신경망에 착안하여 데이터에 숨겨진 특징을 자동으로 찾고 학습할 수 있는 인공 신경망 (ANN: Artificial Neural Network) 기술을 포함할 수 있으며. 이는 대표적으로 컴퓨터 비전, 자연어처리, 음성/신호처리 등에 최첨단의 결과를 보여주고 있고, 비선형적 (non-linear operation) 특징을 잡아 낼 수 있으며, 자동으로 특징 추출 (feature detector) 이 가능하다. 본 발명은 클래스 불균형 (class imbalanced) 상태를 해결하기 위한 방법 중 하나인 과다추출 (oversampling) 기술을 포함할 수 있으며, 소수 클래스에 속한 데이터를 과다 추출하여 합성 데이터 (synthetic data)를 생성하는 기법, SMOTE (Synthetic Minority Over-sampling Technique) 방법(Chawla, Nitesh V., et al. "SMOTE: synthetic minority over-sampling technique." Journal of artificial intelligence research 16 (2002): 321-357.)을 사용할 수 있다.
본 발명에 따르면 NGS는 RT-PCR에 비해 많은 유전자의 보다 넓은 타겟 염기서열을 같은 비용으로 보다 빠르고 민감하고 재현성 높게 분석할 수 있으며, 유방암 예후 예측 도구를 개발하는데 이용할 유방암 예후 예측 유전자들의 발현량 데이터의 효과적인 생성을 위해 이용될 수 있으며, 유전자 선정과정 및 프로브 디자인 최적화 과정을 다른 암종과 유전자 세트에 응용 적용할 수 있다.
추가 치료효과를 예측하는 다유전자 예후예측 도구 중 Oncotype DX®는 침윤성 유방암뿐만 아니라 대장암과 전립선암, 유방 관상피내암을 위해서도 개발되어 있다. 본 발명을 위해 사용한 발굴과정과 같이 특정 암종의 예후예측 유전자 세트를의 targeted RNA-sequencing을 이용하여 Oncotype DX® 결과와 비교 분석함으로써 NGS 기반의 다유전자 구성의 한국형 예후예측 도구를 개발할 수 있다.
본 발명의 구체적인 실시예는 아래와 같다.
1. 대상 유방암 환자 선정 및 검사 조직 준비
1) 호르몬 수용체 양성, 임파선 전이 음성인 1-2기 유방암의 수술 조직 중 대표 포르말린고정파라핀포매 (formalin-fixed paraffin-embedded, FFPE) 블록 선정
- 병리전문의의 H&E 염색 슬라이드 확인 하 블록을 선정함. 이때 대상이 되는 종양이 확실히 존재하는 블록을 선택하여야 하며 가급적 한 단면 내 종양의 면적이 가장 넓은 것, 종양조직 내 괴사부가 적거나 존재하지 않는 것이 좋음.
2) 10㎛ 두께의 비염색 슬라이드 10장
2. FFPE 조직으로부터 RNA 추출 프로토콜
1) RNA 추출 키트: 상용화된 두 키트 중 한 가지를 사용 함.
① Ambion RecoverAllTM Total Nucleic Acid Isolation Kit for FFPE
② QIAGEN RNeasy FFPE Kit
2) Wash 용액 준비
- Wash 1에 42mL의 100mL 에탄올을 섞는다 -> Wash 1
- Wash 2/3에 48mL의 100mL 에탄올을 섞는다 -> Wash 2/3
3) 탈파라핀 (준비 : 조직, 100% 자일렌, 100% 에탄올, 가열 블록 50ㅊC, 피펫, 볼텍스 믹서, 원심분리기)
① 조직 준비 : 파라핀 블록에서 깎아낸 10um 두께의 파라핀 절편 4~8장, 총 40-80um을 준비한다. 이 때 절편 내 종양의 크기가 40㎟보다 작다면 8장의 절편 모두를 사용한다. 가급적 절편 중 종양부만 들어가도록 유의하며 준비된 절편을 1.5mL tube에 담는다.
② 1mL의 100% 자일렌을 조직에 넣고 볼텍스 믹서로 섞고 짧게 원심분리한다. 이후 3분동안 50ㅊC에 두어 파라핀이 녹도록 한다. (녹지 않으면 이 과정을 다시 반복한다)
③ 2분동안 최대속도로 원심분리 하여 덩어리가 만들어지도록 한다. 단단히 뭉쳐지지 않으면 2분의 원심분리를 추가한다. 덩어리를 망가트리지 않고 자일렌을 버린다.
④ 자일렌 씻어내기
a. 1mL의 100% 에탄올을 검체에 넣고 볼텍스 믹서로 섞는다. (뿌옇게 된다.)
b. 1분간 상온에서 최대속도로 원심분리하여 덩어리가 만들어지도록 한다.
c. 덩어리가 망가지지 않도록 하면서 에탄올을 제거한다.
d. a-c과정을 한 번 반복한다.
e. 짧게 원심분리 후 가능한 한 덩어리를 건드리지 않으면서 남아있는 에탄올을 최대한 제거한다.
⑤ 상온에서 15-45분간 건조시킨다.
4) 단백질 분해 (준비 : 가열 블록 50℃ & 80℃, Protease(단백분해효소)는 냉동실에서 꺼내서 상온에서 녹여둔다)
① Digestion Buffer 200㎕와 Protease 4㎕를 각 검체에 넣는다. 이때 잘 섞이도록 부드럽게 흔들어준다.
② 검체를 50℃(protease 활성화 온도) 가열 블록에 15분 이상, 완전히 투명해 질 때까지 둔다
③ 이후 80℃(protease 비활성화 온도) 가열 블록에 15분동안 둔다. 이 때 시간을 정확히 지킨다.
④ 녹지 않으면 protease만 4㎕ 추가하여 위 과정(2 & 3)을 반복한다.
5) 핵산 분리 (준비 : Isolation Additive/에탄올 혼합물, 기타 시약 모두)
① Isolation Additive/에탄올 혼합물 제조
- Isolation Additive 240㎕ + 100% 에탄올 500㎕ = 총 790㎕
- 제조 후 50mL 튜브에 보관한다.
(다수의 검체를 대상으로 할 때는 정량보다 5% 정도 많게 준비하도록 한다.)
② 제조한 Isolation Additive/에탄올 혼합물을 790㎕씩 각 검체가 담긴 튜브에 분주하면서 피펫을 이용해 섞는다.
③ 혼합물 거르기
a. 필터 카트리지를 키트에서 제공된 튜브에 넣는다.
b. 2번 과정에서 만든 혼합물 700㎕를 필터 위에 올리고 뚜껑을 닫는다.
c. 10,000rpm에서 30초간 원심분리한다.
d. 걸러져 나온 용액은 버리고 필터를 같은 튜브에 넣는다.
e. 필요한 경우(혼합물이 충분히 걸러지지 않은 경우) 원심분리를 한 번 더 실시해 혼합물이 필터에 걸러지도록 한다.
④ Wash 1
a. 700㎕의 Wash 1을 필터 카트리지에 더한다
b. 10,000rpm에서 30초간 원심분리한다.
c. 걸러져 나온 용액은 버리고 필터를 같은 튜브에 넣는다.
⑤ Wash 2/3
a. 500㎕의 Wash 1을 필터 카트리지에 더한다
b. 10,000rpm에서 30초간 원심분리한다.
c. 걸러져 나온 용액은 버리고 필터를 같은 튜브에 넣는다.
d. 10,000rpm으로 한번 더 원심분리하여 남은 용액을 제거한다.
6) RNA 분리 및 정제 (준비 : DNase(DNA 분해효소)와 Nuclease(핵산분해효소)는 냉동실에서 꺼내서 녹여둔다)
① RNA 분리
a. DNase 혼합물 제조: 10X DNase Buffer 6㎕ + DNase 4㎕ + Nuclease free water 50㎕ = 총 60㎕
b. DNase 혼합물 60㎕를 각각의 필터 카트리지 중앙에 더한다.
c. 뚜껑을 닫고 22-25ㅊC의 상온에서 30분간 둔다
② Wash 1
a. Wash 1 700㎕를 필터 카트리지에 넣고 30-60초간 상온에 둔다
b. 10,000rpm에서 30초간 원심분리한다.
c. 걸러져 나온 용액은 버리고 필터를 같은 튜브에 넣는다.
③ Wash 2/3
a. Wash 2/3 500㎕를 필터 카트리지에 넣는다.
b. 10,000rpm에서 30초간 원심분리한다.
c. 걸러져 나온 용액은 버리고 필터를 같은 튜브에 넣는다.
d. a-c를 한번 더 반복한다.
e. 10,000rpm에서 1분간 원심분리한다.
④ Elution solution 더하기 및 보관
a. 필터 카트리지를 새 튜브에 넣는다.
b. 60㎕ Elution Solution을 필터의 중앙에 더한다
c. 뚜껑을 닫고 1분간 둔다
d. 1분간 최대속도로 원심분리 한 후 필터는 버리고, 걸러져 나온 용액을 -20℃ 이하에서 보관한다.
3. Targeted RNA-sequencing
1) Total RNA 의 quality (TapeStation, Agilent) 및 정량 분석 (Qubit, ThermoFisher) 을 진행함. KAPA Stranded RNA-Seq kit with RiboErase (KK8483, KAPABIOSYSTEMS) kit 를 사용하여, Total RNA 로부터 ribosomal RNA를 제거 (도 2)
2) mRNA 로 부터 cDNA를 제작하고 추가적인 과정을 통해 cDNA NGS Library를 완성함. cDNA Library 및 Hybridization solution, Target Capture Probe 를 이용하여, 액상 혼성화 유전자 포획 기법 (Solution-based hybridization capture)을 진행
3) Capture 된 산물을 일정 부분 증폭하여 Library amplification 진행
4) 최종 산물을 Sequencing (Illumina) 하여 생성된 타겟 영역의 시퀀싱 depth 데이터를 기반으로 RNA 의 발현량을 예측
4. Targeted RNA-sequencing 결과 후처치
1) Total RNA QC & Trimming of Sequenced reads
A. Filter out reads with low base quality
- Read quality 기준을 만족하지 않는 read 들을 제거. (mean quality 20 이상, quality 2 이하 base 가 5% 미만)
B. Trim out index sequence
- Trimmomatic (0.33) 프로그램을 사용하여 sequencing 과정에서 삽입된 index sequence를 제거
2) Align sequenced reads to the reference genome
A. Sequence alignment with STAR
- STAR aligner 프로그램을 사용하여 sequencing 된 read 들의 reference genome(hg19)을 기준으로 한 위치를 찾고 SortedByCoordinate 옵션을 주어 동시에 sorting을 수행.
3) Calculate expression by gene and by transcript
A. Calculate expression with cufflinks
- cufflinks 프로그램을 사용하여 align 된 read 정보들로부터 유전자별 발현량과 transcipt 별 발현량을 계산. 유전자별로 계산된 발현량은 genes.fpkm_tracking 파일로, transcript 별로 계산된 발현량은 isoforms.fpkm_tracking 파일로 생성됨.
- 정확한 Seqeunce Alignment 및 발현량 측정을 위해 분석 전 처리 과정으로 Sequencing 결과로 나온 read 들 중 Base quality 가 좋지 않은 read 들을 제거. 그리고 각 read 들의 말단부에 남아있을 수 있는 sequencing 과정에서 삽입된 index sequence를 제거.
- 전 처리 과정을 거친 read 들에 대해서 STAR 프로그램을 사용하여 각각의 read 들의 reference genome 상의 위치를 확인. 확인된 위치정보는 BAM 파일 포맷으로 생성되고 이 BAM 파일을 Cufflinks 프로그램을 이용하여 유전자 및 transcript 별 발현량을 계산함.
- 발현량은 FPKM(Fragments Per Kilobase of exon per Million fragments mapped)값으로 계산되며 유전자별 발현량은 genes.fpkm_tracking 파일로, transcript 별 발현량은 isoforms.fpkm_tracking 파일로 생성됨.
5. Targeted RNA-sequencing 발현정보 정규화 (normalization)
1) 현재까지는 기존에 통용되던 정규화 기법들 중 R package edgeR (Robinson et al. Bioinformatics 2010)에서 사용되는 "Trimmed Mean of M-value (TMM)" 기법이 가장 안정성이 높은 것으로 알려져 있음 (Dillies et al. Briefings in bioinformatics 2013). 본 발명에서는 edgeR package를 탑재하여 생산된 표적 RNA시퀀싱 데이터로부터 자동적으로 정규화된 유전자 발현정보를 추출하는 파이프라인을 설계함. (도 3)
2) NGS 기술을 이용해 생성된 시퀀싱 데이터는 통용되는 alignment software (RNA-STAR) (Dobin et al. Bioinformatics 2013)를 이용하여 참조 유전체에 맵핑됨. 맵핑 결과를 통해 각각의 유전자로부터 나온 서열의 개수를 집계할 수 있고, 이는 유전자의 발현량에 대한 직접적인 추정치가 됨. 본 연구팀이 개발한 정규화 파이프라인은 맵핑이 완료되어 BAM 파일 형식으로 가공된 데이터를 입력받으며, 맵핑된 데이터는 파이프라인에 내장된 일련의 소프트웨어 패키지들 (htseq-count (Anders et al. Bioinformatics 2014), edgeR (Robinson et al. Bioinformatics 2010))에 의해 샘플간 비교가 가능한 정규화된 발현량 값으로 계산됨. (도 4)
6. 유방암 예후 예측 및 항암화학요법의 치료효과 예측 알고리즘
1) ANN fully connected network을 구조로 하여, normalized 된 149개 유전자에 대한 발현량을 입력(input signals)으로하고, 각 샘플의 Oncotype DXㄾ recurrent score (RS) 를 기준으로 25이상 (1:high), 25미만 (0:low)을 출력(output signals)으로 하는 바이너리 분류 (binary classification) 수행
- 3 계층의 fully connected neural network를 기본 구조로 단계별 hidden node 를 사용
- 학습데이터에 대한 over-fitting을 막기 위하여 각 계층별 batch normalization 적용
- 클래서 불균형 상태를 보완하기 위한 low, high 비율 조정 적용 (도 5)
2) 사용되는 샘플은 low 데이터가 high 데이터 대비 다섯배 이상 많은 클래스 분균형 상태로, SMOTE 기법을 이용하여 high 데이터를 low대비 반정도로 과다추출하여 학습에 이용
3) 유방암 재발 고위험군 또는 저위험군으로 구별하여 보고
하기 표 1은 위에서 사용한 149개 유전자의 목록을 나타낸다.
ACTB CACNA1D CDKN3 DDX39 FANCI KIF13B LRRC59 NEK2 RAI2 STIL
APOBEC3B CCNA2 CENPA DLGAP5 FBXO5 KIF14 MAD2L1 NUP93 RFC4 STMN1
ASF1B CCNB1 CENPE DNMT3B FEN1 KIF15 MARCH8 NUSAP1 RPLP0 SYNC
ASPM CCNB2 CENPF DONSON FOXM1 KIF18A MCM10 OIP5 RRM2 TACC3
AURKA CCNE1 CENPM DTL GAPDH KIF18B MCM2 PBK SCUBE2 TFRC
AURKB CCNE2 CENPN E2F1 GINS1 KIF20A MCM6 PDSS1 SETBP1 TK1
BAG1 CCT5 CEP55 E2F8 GRB7 KIF23 MELK PGR SF3B3 TOP2A
BCL2 CD68 CHEK1 ECHDC2 GSTM1 KIF2C MKI67 PKMYT1 SHCBP1 TPX2
BIRC5 CDC20 CIRBP ERBB2 GTSE1 KIF4A MLF1IP PLK1 SHMT2 TRIP13
BLM CDC25A CKS2 ERCC6L GUSB KIFC1 MMP11 PLK4 SLC25A12 TROAP
BUB1 CDC45 CRIM1 ESPL1 HJURP KPNA2 MYBL2 PRC1 SLC7A5 TTK
BUB1B CDC6 CTSL2 ESR1 HMMR LMNB1 NCAPG PTTG1 SPAG5 UBE2C
C14orf45 CDCA3 CX3CR1 EXO1 HN1 LMNB2 NCAPG2 RACGAP1 SPC25 UBE2S
C16orf61 CDCA8 CYBRD1 EZH2 IFT46 LRIG1 NCAPH RAD51 SQLE ZWINT
C7orf63 CDK1 DBF4 FAM64A KIF11 LRRC48 NDC80 RAD51AP1 STARD13

Claims (2)

  1. 유방암 예후 예측 유전자의 차세대염기서열분석을 이용한 유방암의 예후 예측 도구.
  2. 유방암 환자 조직으로부터 RNA 추출 단계;
    Targeted RNA-sequencing 단계;
    Targeted RNA-sequencing 결과 후처치 단계;
    Targeted RNA-sequencing 발현정보 정규화 (normalization) 단계; 및
    유방암 예후 예측 및 항암화학요법의 치료효과 예측 알고리즘 적용 단계
    를 포함하는 유방암의 예후 예측 방법.
KR1020160150228A 2016-11-11 2016-11-11 유방암 예후 예측 유전자의 차세대염기서열분석을 이용한 유방암의 예후 예측 도구 KR20180052985A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160150228A KR20180052985A (ko) 2016-11-11 2016-11-11 유방암 예후 예측 유전자의 차세대염기서열분석을 이용한 유방암의 예후 예측 도구

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160150228A KR20180052985A (ko) 2016-11-11 2016-11-11 유방암 예후 예측 유전자의 차세대염기서열분석을 이용한 유방암의 예후 예측 도구

Publications (1)

Publication Number Publication Date
KR20180052985A true KR20180052985A (ko) 2018-05-21

Family

ID=62453296

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160150228A KR20180052985A (ko) 2016-11-11 2016-11-11 유방암 예후 예측 유전자의 차세대염기서열분석을 이용한 유방암의 예후 예측 도구

Country Status (1)

Country Link
KR (1) KR20180052985A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200127878A (ko) * 2019-05-03 2020-11-11 주식회사 디시젠 암 예후 예측방법 및 이의 조성물
KR20210118718A (ko) * 2020-03-23 2021-10-01 단국대학교 산학협력단 유방암 호르몬 수용체의 상태 예측을 위한 바이오 마커

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200127878A (ko) * 2019-05-03 2020-11-11 주식회사 디시젠 암 예후 예측방법 및 이의 조성물
WO2020226333A1 (ko) * 2019-05-03 2020-11-12 주식회사 디시젠 암 예후 예측방법 및 이의 조성물
CN113785076A (zh) * 2019-05-03 2021-12-10 株式会社递希真 预测癌症预后的方法及其组合物
KR20220137577A (ko) * 2019-05-03 2022-10-12 주식회사 디시젠 암 예후 예측방법 및 이의 조성물
KR20220137578A (ko) * 2019-05-03 2022-10-12 주식회사 디시젠 암 예후 예측방법 및 이의 조성물
KR20230004398A (ko) * 2019-05-03 2023-01-06 주식회사 디시젠 암 예후 예측용 조성물
KR20230004397A (ko) * 2019-05-03 2023-01-06 주식회사 디시젠 암 예후 예측용 조성물
EP3964590A4 (en) * 2019-05-03 2023-06-21 DCGEN Co., Ltd. CANCER PREDICTION AND PROGNOSTIC METHOD AND COMPOSITION THEREOF
CN113785076B (zh) * 2019-05-03 2024-06-11 株式会社递希真 预测癌症预后的方法及其组合物
KR20210118718A (ko) * 2020-03-23 2021-10-01 단국대학교 산학협력단 유방암 호르몬 수용체의 상태 예측을 위한 바이오 마커

Similar Documents

Publication Publication Date Title
KR102071491B1 (ko) 차세대 염기서열분석을 이용한 기계학습 기반 유방암 예후 예측 방법 및 예측 시스템
KR102648636B1 (ko) 암 예후 예측용 조성물
AU2017204086B2 (en) Predicting gastroenteropancreatic neuroendocrine neoplasms (GEP-NENs)
US20200263257A1 (en) Method of predicting breast cancer prognosis
JP6246845B2 (ja) 遺伝子発現を用いた前立腺癌の予後を定量化する方法
US9670549B2 (en) Gene expression signatures of neoplasm responsiveness to therapy
EP3556867A1 (en) Methods to predict clinical outcome of cancer
WO2015138769A1 (en) Methods and compositions for assessing patients with non-small cell lung cancer
US20110165566A1 (en) Methods of optimizing treatment of breast cancer
WO2013082440A2 (en) Methods of treating breast cancer with taxane therapy
EP2163649A1 (en) Molecular classifier for evaluating the risk of metastasic relapse in breast cancer
US20160222461A1 (en) Methods and kits for diagnosing the prognosis of cancer patients
KR20180052985A (ko) 유방암 예후 예측 유전자의 차세대염기서열분석을 이용한 유방암의 예후 예측 도구
TW201512404A (zh) 預測乳癌復發之基因標記及方法
KR20180057097A (ko) 유방암 환자의 예후 예측 방법
EP3230466A1 (en) Breast cancer treatment with taxane therapy
KR101825369B1 (ko) 암의 예후 판단용 유전자 바이오 마커 및 이의 용도

Legal Events

Date Code Title Description
N231 Notification of change of applicant