KR102271315B1 - 인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법 - Google Patents

인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법 Download PDF

Info

Publication number
KR102271315B1
KR102271315B1 KR1020200169943A KR20200169943A KR102271315B1 KR 102271315 B1 KR102271315 B1 KR 102271315B1 KR 1020200169943 A KR1020200169943 A KR 1020200169943A KR 20200169943 A KR20200169943 A KR 20200169943A KR 102271315 B1 KR102271315 B1 KR 102271315B1
Authority
KR
South Korea
Prior art keywords
lys
arg
gly
val
leu
Prior art date
Application number
KR1020200169943A
Other languages
English (en)
Inventor
김이랑
이용흔
심우광
구창대
조준희
Original Assignee
주식회사 온코크로스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 온코크로스 filed Critical 주식회사 온코크로스
Priority to KR1020200169943A priority Critical patent/KR102271315B1/ko
Application granted granted Critical
Publication of KR102271315B1 publication Critical patent/KR102271315B1/ko
Priority to PCT/KR2021/018306 priority patent/WO2022124717A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pathology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Genetics & Genomics (AREA)
  • Oncology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Hospice & Palliative Care (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Hematology (AREA)
  • Medicinal Chemistry (AREA)
  • Epidemiology (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Food Science & Technology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)

Abstract

본 발명은 AI를 이용하여 도출한 유방암의 예후 예측용 마커에 관한 것으로, 본 발명에 따르면, 학습 및 검증을 통한 머신러닝을 이용하여 구현한 AI를 통해 유방암의 예후와 관련된 바이오 마커들을 도출하였으며, 이들의 예후 예측을 위한 컷오프 값을 도출하였으므로, 이를 유방암의 예후 예측용 마커로서 이용할 수 있다.

Description

인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법{METHOD FOR PROGNOSIS OF BREAST CANCER USING RIBOSOMAL PROTEIN FROM ARTIFICIAL INTELLIGENCE}
본 발명은 AI를 이용하여 도출한 리보좀 유전자 세트를 이용한 유방암의 예후 예측용 마커에 관한 것이다.
현재 유방암의 발병 원인으로 여성 호르몬, 가족력, 과거력, 출산력, 식생활 습관 등의 다양한 인자들이 거론되고 있고, BRCA 같은 유전자 돌연변이가 유방암의 위험성을 현저히 높힌다고 알려져 있으며, 여러 다양한 연구들을 통해 유방암 특이적인 발명 원인이 제시되고 있으나, 여전히 많은 부분이 베일에 쌓여 있다. 2005년 통계청 조사에 의하면, 한국 여성의 유방암 발생은 최근 급격히 증가하여 1998년 자궁경부암을 추월한 이래 2001년 발생한 한국 여성암 환자의 16.1%를 차지하면서 유방암을 제치고 여성암 1위가 되었다. 특히, 2002년에는 2001년에 비해 유방암(11.1%)이 가장 급증한 암으로 나타나 저출산, 짧은 수유기간, 이른 초경, 늦은 폐경 등 생리적으로 왕성한 신체적 변화를 겪는 시기의 여성들에서는 여성호르몬의 자극을 받는 횟수의 급격한 증가로 인한 유선조직의 민감도 증가, 식생활의 서구화, 생활환경의 오염 등의 이유로 유방암 발생이 급격하게 증가하고 있다. 유방암의 발생빈도 및 유방암으로 인한 사망률의 증가는 현재의 서구화 실태로 보아 앞으로도 상당기간 지속될 것으로 예상된다. 유방암은 암세포의 성장으로 인한 주변 조직의 침범 또는 림프절 전이 등의 증상을 초래하는 것이 보통이지만, 대부분이 아무런 증상 없이도 자가검진으로 진단될 수 있다. 따라서, 유방암으로 인한 사망률을 줄이기 위해서는 유방암을 효과적으로 조기에 진단하는 것이 매우 중요하다(Tuli R. et al., Breast J., 12: 343-348, 2006).
유방암을 진단하기 위해서 여러 가지 방법이 복합적으로 사용되고 있는데, 현재까지는 유방암 환자의 70%가 자가진단에 의해서 내원하고 있다. 그러나, 이러한 자가진단 방법은 악성종양과 양성 혹을 구분하는 것이 매우 어렵다는 단점이 있다. 그 밖에, 유방암의 진단방법으로 X-선 유방촬영법, 초음파검사법, 세침흡입세포검사법, 자기공명촬영법 등이 있는데, 최종적으로는 조직검사를 통해 확인하는 것이 중요하다. X-선 유방촬영법은 X-선으로 유방을 찍어 검사하는 방법으로 혹이 양성인지 악성인지를 감별하는데 우수할 뿐만 아니라, 숨어 있는 혹을 발견하는 방법으로서 자가진단으로 혹이 만져지기 이전에 초기의 유방암을 진단하는데 가장 효과적인 방법이다. 그러나, 유방촬영법은 젊은 여성같이 유선이 많이 발달되어 있다거나 유방이 작고 섬유질이 많은 우리나라 여성에게서는 진단율이 떨어지는 단점이 있으며, 자주 찍으면 오히려 유방암이 유발될 수도 있다는 논란이 있다. 이러한 유방촬영법의 대안으로 초음파검사법이 사용되고 있는데, 초음파검사법은 물혹과 단단한 혹을 구별하는데 효과적이긴 하지만, 악성종양과 양성 혹을 감별하는 능력은 떨어진다.
인간 유전체정보가 활발하게 활용되면서 암연구는 유전체 수준에서 메카니즘을 밝히는 방향으로 나아가고 있다. 특히 마이크로어레이를 이용하여 수만 개의 유전자의 발현패턴이나 유전자 개수의 증가 혹은 감소에 대한 정보를 바탕으로 거시적인 관점에서 암세포의 특성을 규명할 수 있게 되었다. 이러한 유전체수준의 정보를 분석하는 것은 유기적이고 복잡한 생명현상을 이해하는데 매우 획기적인 방법으로, 앞으로 더욱더 활성화될 것이다. 특히 암과 같은 복합질병(complex disease)의 경우, 소수의 특정유전자에 대한 분석으로는 편협한 결과를 얻기 쉬우며, 암의 발생 및 발달에 대한 큰 행동패턴을 포착하는 것이 중요하기 때문에 유전체 정보 분석이 반드시 필요하다. 이처럼 암 연구에 기본이 되는 대부분의 유전체 정보는 마이크로어레이와 같은 유전체 칩을 이용하여 생성되는데, 수만 개의 유전자에 대한 정보를 한꺼번에 얻을 수 있는 기술은 날로 진화하고 있으며, 고비용의 단점에도 불구하고 마이크로어레이를 이용한 연구 활동이 활발하게 전개되면서 관련정보의 양도 폭발적으로 증가하고 있다. 2000년도 중반부터 이러한 유전체 정보가 수집되어 데이터베이스화되기 시작하였고, 이렇게 수집된 정보를 이용하여 2차 및 3차 분석을 수행하는 일은 생명현상 연구의 구심점이 되어가고 있다.
일반적인 발현(expression) 유전자 칩의 경우, 약 2만-3만개의 유전자를 나타내는 수만 개의 probe가 심어져 있고, SNP와 같은 정밀한 정보를 측정하는 마이크로어레이는 백만 개 이상의 probe를 가지고 있는 경우도 있다. 이러한 마이크로어레이는 실험법이 비교적 간단하고 표준화가 되어있으며, 대량의 정보를 짧은 시간에 한꺼번에 얻어 매우 효율적이나, 얻어진 결과를 분석하는 일이 핵심이자 어려운 병목지점이 되었다. 기존의 소수의 유전자를 분석하는 것과는 비교가 되지 않는 수만 개의 유전자에 대한 종합적 분석은, 통계적 분석기술뿐 만 아니라 유전체에 대한 해박한 지식이 뒷받침되어야 비로소 유용한 정보를 캐낼 수 있는 것이다. 뿐만 아니라 대량의 정보를 저장하고 분석을 수행할 수 있는 고성능 전산장비도 필요하며, 관련 전산기술 역시 필수이다. 전통적인 생물학적 연구범위와 실험방법에만 익숙한 연구자가 수행하기 어렵기 때문에, 유전체정보가 엄청난 속도로 증가하더라도 이를 유용하게 활용하지 못하고 있는 것이 국내의 현실이다. 북미나 유럽에 비해 부족한 자본과 연구기술력에 대한 국내 사정을 감안한다면, 공개된 유전체 정보를 적극 활용하는 것이야말로 생물정보학에서 선두 지휘해야 할 부분이다. 특히 암에 대한 연구는 가장 활발하게 유전체 분석을 도입해 왔으며, 관련 정보가 상당한 양으로 축적되어 있다.
본 발명에서는 유방암의 예후를 예측할 수 있는 특이성과 민감도가 향상된 새로운 진단 마커들을 AI를 통해 개발하는 것을 목적으로 한다.
상기 목적의 달성을 위해, 본 발명은 유방암의 예후 예측용 마커를 제공한다.
또한, 본 발명은 유방암의 예후 예측용 조성물을 제공한다.
또한, 본 발명은 유방암의 예후 예측용 키트를 제공한다.
또한, 본 발명은 유방암의 예후 예측을 위한 정보제공방법을 제공한다.
또한, 본 발명은 전자기기 상에서 수행되는 유방암 예후 예측 방법을 제공한다.
본 발명에 따르면, 학습 및 검증을 통한 딥러닝을 이용하여 구현한 AI를 통해 유방암의 예후와 관련된 바이오 마커들을 도출하였으며, 이들의 예후 예측을 위한 컷오프 값을 도출하였으므로, 이를 유방암의 예후 예측용 마커로서 이용할 수 있다.
도 1은 딥러닝을 위한 데이터 전처리 과정을 나타낸 모식도이다.
도 2는 유방암 환자의 예후에 따른 고위험/저위험 군 선별 과정 및 선별 기준을 나타낸 도이다.
도 3은 유방암 환자의 예후에 따라 고위험/저위험 군을 선별한 데이터를 나타낸 도이다:
OS: 전체생존율(Overall Survival); 및
RFS: 무병생존기간(Replase Free Survival).
도 4는 최종 선별한 모델 구성에 사용될 학습 및 검증용 환자 데이터를 나타낸 도이다.
도 5는 Python 3.7, Scikit-learn 0.21.2을 이용하여 모델을 구성하는 과정을 나타낸 모식도이다.
도 6은 유방암 전체 생존율에 대한 리보좀 유전자세트의 결과를 나타낸 도이다.
이하, 첨부된 도면을 참조하여 본 발명의 구현예로 본 발명을 상세히 설명하기로 한다. 다만, 하기 구현예는 본 발명에 대한 예시로 제시되는 것으로, 당업자에게 주지 저명한 기술 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 수 있고, 이에 의해 본 발명이 제한되지는 않는다. 본 발명은 후술하는 특허청구범위의 기재 및 그로부터 해석되는 균등 범주 내에서 다양한 변형 및 응용이 가능하다.
또한, 본 명세서에서 사용되는 용어(terminology)들은 본 발명의 바람직한 실시예를 적절히 표현하기 위해 사용된 용어들로서, 이는 사용자, 운용자의 의도 또는 본 발명이 속하는 분야의 관례 등에 따라 달라질 수 있다. 따라서, 본 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
달리 정의되지 않는 한, 본원에서 사용된 모든 기술적 및 과학적 용어는 본 발명이 속하는 분야의 당업자가 통상적으로 이해하는 것과 동일한 의미를 갖는다. 본원에 기술된 것들과 유사하거나 등가인 임의의 방법 및 재료가 본 발명을 테스트하기 위한 실행에서 사용될 수 있지만, 바람직한 재료 및 방법이 본원에서 기술된다.
본 발명에서 용어, "대상체" 또는 "환자"는 인간, 유인원, 원숭이, 소, 개, 기니아 피그, 토끼, 닭, 곤충 등을 포함하여 치료가 요구되는 임의의 단일 개체를 의미한다. 또한, 임의의 질병 임상 소견을 보이지 않는 임상 연구 시험에 참여한 임의의 대상 또는 역학 연구에 참여한 대상 또는 대조군으로 사용된 대상이 대상에 포함된다.
본 발명에서 용어, "시료(샘플)"는 대상 또는 환자로부터 얻은 생물학적 시료를 의미한다. 생물학적 시료의 공급원은 신선한, 동결된 및/또는 보존된 장기 또는 조직 샘플 또는 생검 또는 흡인물로부터의 고형 조직; 혈액 또는 임의의 혈액 구성분; 대상의 임신 또는 발생의 임의의 시점의 세포일 수 있다.
본 명세서 전반을 통하여, 천연적으로 존재하는 아미노산에 대한 통상의 1문자 및 3문자 코드가 사용될 뿐만 아니라 Aib(α-아미노이소부티르산), Sar(N-methylglycine) 등과 같은 다른 아미노산에 대해 일반적으로 허용되는 3문자 코드가 사용된다. 또한 본 발명에서 약어로 언급된 아미노산은 하기와 같이 IUPAC-IUB 명명법에 따라 기재되었다:
알라닌: A, 아르기닌: R, 아스파라긴: N, 아스파르트산: D, 시스테인: C, 글루탐산: E, 글루타민: Q, 글리신: G, 히스티딘: H, 이소류신: I, 류신: L, 리신: K, 메티오닌: M, 페닐알라닌: F, 프롤린: P, 세린: S, 트레오닌: T, 트립토판: W, 티로신: Y 및 발린: V.
일 측면에서, 본 발명은 RPL36, RPS27L, RPL10, RPL22, RPS14, RPS19, RPS20, RPS23, RPS24 및 UBA52 유전자로 이루어진 군으로부터 선택되는 하나 이상의 유전자를 포함하는 유방암의 예후 예측용 마커에 관한 것이다.
일 구현예에서, 예후는 전체생존율(Overall Survival, OS) 또는 무병생존기간(Replase Free Survival, RFS)일 수 있으나, 바람직하게는 전체생존율일 수 있다.
일 측면에서, 본 발명은 본 발명의 유방암의 예후 예측용 마커의 mRNA 또는 단백질의 발현 수준을 측정하는 제제를 포함하는 유방암의 예후 예측용 조성물에 관한 것이다.
일 구현예에서, 마커의 mRNA의 발현 수준을 측정하는 제제는 상기 마커의 핵산서열, 상기 핵산서열에 상보적인 핵산서열, 상기 핵산서열 및 상보적인 서열의 단편을 특이적으로 인식하는 프라미어 쌍, 프로브, 또는 프라이머 쌍 및 프로브를 포함할 수 있으며, 이의 측정은 중합효소연쇄반응, 실시간 RT-PCR (Real-time RT-PCR), 역전사 중합효소연쇄반응, 경쟁적 중합효소연쇄반응(Competitive RT-PCR), Nuclease 보호 분석(RNase, S1 nuclease assay), in situ 교잡법, 핵산 마이크로어레이, 노던블랏 또는 DNA 칩으로 이루어진 군으로부터 선택되는 방법으로 수행될 수 있다.
일 구현예에서, 마커의 단백질의 발현 수준을 측정하는 제제는 상기 마커의 단백질 전장 또는 그 단편을 특이적으로 인식하는 항체, 항체단편, 앱타머(aptamer), 아비머(avidity multimer) 또는 펩티도모방체(peptidomimetics)를 포함할 수 있으며, 이의 측정은 웨스턴블랏, ELISA(enzyme linked immunosorbent assay), 방사선면역분석(RIA: Radioimmunoassay), 방사면역확산법(radioimmunodiffusion), 면역 전기영동, 조직면역염색, 면역침전 분석법(Immunoprecipitation assay), 보체 고정 분석법(Complement Fixation Assay), FACS, 질량분석 또는 단백질 마이크로어레이로 이루어진 군으로부터 선택되는 방법으로 수행될 수 있다.
일 구현예에서, 예후는 전체생존율(Overall Survival, OS) 또는 무병생존기간(Replase Free Survival, RFS)일 수 있으며, 유방암의 전체생존율 예측용 조성물은 RPL36, RPS27L, RPL10, RPL22, RPS14, RPS19, RPS20, RPS23, RPS24 및 UBA52 유전자로 이루어진 군으로부터 선택되는 하나 이상의 유전자의 mRNA의 발현 수준 또는 단백질의 발현 수준을 측정하는 제제를 포함할 수 있다.
일 구현예에서, 상기 RPL36, RPS27L, RPL10, RPL22, RPS14, RPS19, RPS20, RPS23, RPS24 및 UBA52 유전자에서 발현된 단백질은 각각 서열번호 1 내지 10으로 표시되는 아미노산 서열을 포함할 수 있다.
본 발명에서 사용된 용어 "검출" 또는 "측정"은 검출 또는 측정된 대상의 농도를 정량하는 것을 의미한다.
본 발명에서 용어, "프라이머"는 짧은 자유 3말단 수산화기 (free 3 hydroxyl group)를 가지는 핵산 서열로 상보적인 템플레이트(template)와 염기쌍 (base pair)를 형성할 수 있고 템플레이트 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 핵산 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응 (즉, DNA 폴리머레이트 또는 역전사효소)을 위한 시약 및 상이한 4가지 뉴클레오사이드 트리포스페이트의 존재하에서 DNA 합성이 개시할 수 있다.
본 발명에서 용어, "프로브"란 mRNA와 특이적 결합을 이룰 수 있는 짧게는 수 염기 내지 길게는 수백 염기에 해당하는 RNA 또는 DNA 등의 핵산 단편을 의미하며 라벨링 되어 있어서 특정 mRNA의 존재 유무를 확인할 수 있다. 프로브는 올리고 뉴클레오타이드(oligonucleotide) 프로브, 단쇄 DNA(single stranded DNA) 프로브, 이중쇄 DNA(double stranded DNA) 프로브, RNA 프로브 등의 형태로 제작될 수 있다. 본 발명에서는 상기 RPL36, RPS27L, RPL10, RPL22, RPS14, RPS19, RPS20, RPS23, RPS24 및 UBA52 유전자와 상보적인 각각의 프로브를 이용하여 혼성화를 실시하여, 혼성화 여부를 통해 상기 유전자 발현 정도를 진단할 수 있다. 적당한 프로브의 선택 및 혼성화 조건은 통상의 기술분야에 공지된 것을 기초로 변형할 수 있으므로 본 발명에서는 이에 대해 특별히 한정하지 않는다.
본 발명의 프라이머 또는 프로브는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비-제한적인 예로는 메틸화, 캡화, 천연 뉴클레오타이드 하나 이상의 동족체로의 치환및 뉴클레오타이드 간의 변형, 예를 들면, 하전되지 않은 연결체 (예: 메틸 포스포네이트, 포스소트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체 (예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다.
본 발명에서, 프로브를 cDNA 분자와 혼성화시키는 적합한 조건은 최적화 절차에 의하여 일련의 과정으로 결정될 수 있다. 이런 절차는 연구실에서 사용을 위한 프로토콜을 수립하기 위하여 당업자에 의하여 일련의 과정으로 실시된다. 예를 들어, 온도, 성분의 농도, 혼성화 및 세척 시간, 완충액 성분 및 이들의 pH 및 이온세기 등의 조건은 프로브의 길이 및 GC 양 및 타깃 뉴클레오타이드 서열 등의 다양한 인자에 의존한다. 혼성화를 위한 상세한 조건은 Joseph Sambrook, et al., Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.(2001); 및 M.L.M. Anderson, NucleicAcidHybridization, Springer-Verlag New York Inc. N.Y.(1999)에서 확인할 수 있다. 예를 들어, 상기 엄격조건 중에서 고 엄격조건은 0.5 M NaHPO4, 7% SDS(sodium dodecyl sulfate),1mM EDTA에서 65℃ 조건으로 혼성화하고, 0.1 x SSC(standard saline citrate)/0.1% SDS에서 68℃ 조건으로 세척하는 것을 의미한다. 또는, 고 엄격조건은 6 x SSC/0.05% 소듐 파이로포스페이트에서 48℃ 조건으로 세척하는 것을 의미한다. 저 엄격조건은 예를 들어, 0.2 x SSC/0.1% SDS에서 42℃ 조건으로 세척하는 것을 의미한다.
본 발명에서 용어, "항체"란 당해 분야에서 공지된 용어로서 항원성 부위에 대해서 지시되는 특이적인 단백질 분자를 의미한다. 본 발명의 목적상, 항체는 본 발명의 마커인 RPL36, RPS27L, RPL10, RPL22, RPS14, RPS19, RPS20, RPS23, RPS24, 유전자에서 발현되는 단백질에 대해 특이적으로 결합하는 항체를 의미하며, 상기 항체의 제조방법은 널리 공지된 방법을 사용하여 제조할 수 있다. 여기에는 상기 단백질에서 만들어질 수 있는 부분 펩티드도 포함된다. 본발명의 항체의 형태는 특별히 제한되지 않으며 폴리클로날 항체, 모노클로날 항체 또는 항원 결합성을 갖는 것이면 그것의 일부도 본 발명의 항체에 포함되고 모든 면역 글로불린 항체가 포함된다. 나아가, 본 발명의 항체에는 인간화 항체 등의 특수 항체도 포함된다.
일 측면에서, 본 발명은 본 발명의 조성물을 포함하는, 유방암의 예후 예측용 키트에 관한 것이다.
일 구현예에서, 상기 키트는 대상체 또는 환자로부터 생체 시료를 수집하기 위한 도구 및/또는 시약 뿐 아니라 그 시료로부터 게놈 DNA, cDNA, RNA 또는 단백질을 준비하기 위한 도구 및/또는 시약을 더 포함할 수 있다. 예를 들면, 게놈 DNA의 관련 영역을 증폭하기 위한 PCR 프라이머를 포함할 수 있다. 상기 키트는 약리게놈학적 프로파일링에 유용한 유전 인자의 프로브를 포함할 수 있다. 또한, 이러한 키트의 사용에 있어서, 표지화된 올리고뉴클레오티드를 사용하여 분석 중 용이하게 동정할 수 있다.
일 구현예에서, 상기 키트는 DNA 중합효소 및 dNTP(dGTP, dCTP, dATP 및 dTTP), 형광물질 등의 표지 물질을 추가로 더 함유할 수 있다.
일 측면에서, 본 발명은 검사 대상체로부터 분리된 시료에서 본 발명의 유방암의 예후 예측용 마커의 mRNA 또는 단백질의 발현 수준을 확인하는 단계를 포함하는 유방암의 예후 예측을 위한 정보제공방법에 관한 것이다.
일 구현예에서, 유방암의 예후 예측용 마커의 mRNA 또는 단백질의 발현 수준이 하기 수학식 1에서 Pr(Y=y)≥0.5이면 예후가 좋은 것으로 판단하는 단계를 추가로 포함할 수 있다.
[수학식 1]
Pr(Y=y│X1, X2.....,X10)=exp(Z)/(1+exp(Z));
Z=α1X12X2 + ........+ α10X10
X는 유전자의 발현양을 나타냄;
Figure 112020132563949-pat00001
일 구현예에서, 예후는 전체생존율 또는 무병생존기간일 수 있다.
일 구현예에서, RPL36, RPS27L, RPL10, RPL22, RPS14, RPS19, RPS20, RPS23, RPS24 및 UBA52 유전자로 이루어진 군으로부터 선택되는 하나 이상의 유전자의 mRNA 또는 단백질의 발현 수준이 수학식 1에 따라 Pr(Y=y)≥0.5 면 전체생존율이 높은 것으로 판단할 수 있다.
일 측면에서, 본 발명은 유방암 조직 또는 세포에 후보 물질을 투여하고 RPL36, RPS27L, RPL10, RPL22, RPS14, RPS19, RPS20, RPS23, RPS24 및 UBA52 유전자로 이루어진 군으로부터 선택되는 하나 이상의 유전자의 mRNA 또는 단백질의 발현 수준을 측정하는 단계를 포함하는, 유방암 전체생존율을 향상시키는 물질의 스크리닝 방법에 관한 것이다.
일 구현예에서, 상기 유전자의 mRNA 또는 단백질의 발현 수준이 수학식 1에 따라 Pr(Y=y)≥0.5인 경우 인 경우 상기 후보 물질을 유방암 전체생존율을 향상시키는 물질로 판단하는 단계를 추가로 포함할 수 있다.
본 발명의 다른 측면에서는,
전자기기 상에서 수행되는 위암 예후 예측 방법에 있어서,
수학식 1을 기반으로 위암 환자의 조직의 유전자 발현 데이터로부터 유방암 예후를 판단하는 단계;를 포함하는 유방암 예후 예측 방법에 관한 것이다.
또한, 본 발명의 다른 측면에서는, 유방암 환자의 조직의 유전자 발현 데이터를 입력하는 입력부;
수학식 1을 기반으로 위암 환자의 예후를 예측하는 프로세서;를 포함하는 위암 예후 진단 장치에 관한 것이다.
본 개시에 따른 장치는 프로세서, 프로그램 데이터를 저장하고 실행하는 메모리, 디스크 드라이브와 같은 영구 저장부(permanent storage), 외부 장치와 통신하는 통신 포트, 터치 패널, 키(key), 버튼 등과 같은 사용자 인터페이스 장치 등을 포함할 수 있다. 소프트웨어 모듈 또는 알고리즘으로 구현되는 방법들은 상기 프로세서상에서 실행 가능한 컴퓨터가 읽을 수 있는 코드들 또는 프로그램 명령들로서 컴퓨터가 읽을 수 있는 기록 매체 상에 저장될 수 있다. 여기서 컴퓨터가 읽을 수 있는 기록 매체로 마그네틱 저장 매체(예컨대, ROM(read-only memory), RAM(random-access memory), 플로피 디스크, 하드 디스크 등) 및 광학적 판독 매체(예컨대, 시디롬(CD-ROM), 디브이디(DVD: Digital Versatile Disc)) 등이 있다. 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템들에 분산되어, 분산 방식으로 컴퓨터가 판독 가능한 코드가 저장되고 실행될 수 있다. 매체는 컴퓨터에 의해 판독가능하며, 메모리에 저장되고, 프로세서에서 실행될 수 있다.
본 개시에서 인용하는 공개 문헌, 특허 출원, 특허 등을 포함하는 모든 문헌들은 각 인용 문헌이 개별적으로 및 구체적으로 병합하여 나타내는 것 또는 본 개시에서 전체적으로 병합하여 나타낸 것과 동일하게 본 개시에 병합될 수 있다.
본 개시의 이해를 위하여, 도면에 도시된 바람직한 실시 예들에서 참조 부호를 기재하였으며, 본 개시의 실시 예들을 설명하기 위하여 특정 용어들을 사용하였으나, 특정 용어에 의해 본 개시가 한정되는 것은 아니며, 본 개시는 당업자에 있어서 통상적으로 생각할 수 있는 모든 구성 요소들을 포함할 수 있다.
본 개시는 기능적인 블록 구성들 및 다양한 처리 단계들로 나타내어질 수 있다. 이러한 기능 블록들은 특정 기능들을 실행하는 다양한 개수의 하드웨어 또는/및 소프트웨어 구성들로 구현될 수 있다. 예를 들어, 본 개시는 하나 이상의 마이크로프로세서들의 제어 또는 다른 제어 장치들에 의해서 다양한 기능들을 실행할 수 있는, 메모리, 프로세싱, 로직(logic), 룩업 테이블(look-up table) 등과 같은 직접 회로 구성들을 채용할 수 있다. 본 개시에의 구성 요소들이 소프트웨어 프로그래밍 또는 소프트웨어 요소들로 실행될 수 있는 것과 유사하게, 본 개시는 데이터 구조, 프로세스들, 루틴들 또는 다른 프로그래밍 구성들의 조합으로 구현되는 다양한 알고리즘을 포함하여, C, C++, 자바(Java), 어셈블러(assembler), R, Python 등과 같은 프로그래밍 또는 스크립팅 언어로 구현될 수 있다. 기능적인 측면들은 하나 이상의 프로세서들에서 실행되는 알고리즘으로 구현될 수 있다. 또한, 본 개시는 전자적인 환경 설정, 신호 처리, 및/또는 데이터 처리 등을 위하여 종래 기술을 채용할 수 있다. "매커니즘", "요소", "수단", "구성"과 같은 용어는 넓게 사용될 수 있으며, 기계적이고 물리적인 구성들로서 한정되는 것은 아니다. 상기 용어는 프로세서 등과 연계하여 소프트웨어의 일련의 처리들(routines)의 의미를 포함할 수 있다.
본 개시에서 설명하는 특정 실행들은 일 실시 예들로서, 어떠한 방법으로도 본 개시의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다. 또한, "필수적인", "중요하게" 등과 같이 구체적인 언급이 없다면 본 개시의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다.
본 개시의 명세서(특히 특허청구범위에서)에서 "상기"의 용어 및 이와 유사한 지시 용어의 사용은 단수 및 복수 모두에 해당하는 것일 수 있다. 또한, 본 개시에서 범위(range)를 기재한 경우 상기 범위에 속하는 개별적인 값을 적용한 개시를 포함하는 것으로서(이에 반하는 기재가 없다면), 개시의 상세한 설명에 상기 범위를 구성하는 각 개별적인 값을 기재한 것과 같다. 마지막으로, 본 개시에 따른 방법을 구성하는 단계들에 대하여 명백하게 순서를 기재하거나 반하는 기재가 없다면, 상기 단계들은 적당한 순서로 행해질 수 있다. 반드시 상기 단계들의 기재 순서에 따라 본 개시가 한정되는 것은 아니다. 본 개시에서 모든 예들 또는 예시적인 용어(예들 들어, 등등)의 사용은 단순히 본 개시를 상세히 설명하기 위한 것으로서 특허청구범위에 의해 한정되지 않는 이상 상기 예들 또는 예시적인 용어로 인해 본 개시의 범위가 한정되는 것은 아니다. 또한, 당업자는 다양한 수정, 조합 및 변경이 부가된 특허청구범위 또는 그 균등물의 범주 내에서 설계 조건 및 팩터에 따라 구성될 수 있음을 알 수 있다.
실시예 1. 유방암 환자 조직의 발현 프로파일 수집
유방암 환자의 냉동 암 조직을 이용하여 얻은 발현 프로파일과 임상정보를 공공데이터베이스인 (Gene Expression Omnibus (https://www.ncbi.nlm.nih.gov/geo/) (해당 플랫폼: GPL570, GPL571, GPL4685, GPL96, GPL 97, GPL13667, GPL19832, GPL5175, GPL11028 및 GPL8300) 및 ArrayExpress (https://www.ebi.ac.uk/arrayexpress/))에서 확보하였다.
Figure 112020132563949-pat00002
실시예 2. 데이터 전처리
2-1. 유전자 발현 데이터 전처리
예후 관찰된 유방암 환자들의 각 조직의 마이크로어레이 데이터에서 유전자별 발현량을 표준화하기(normalize) 위해, 동일한 플랫폼으로 제작된 각 데이터셋 별로 해당하는 모든 환자의 발현 프로파일의 원본데이터 (.CEL)를 SCAN.UPC(Single-channel array normalization (SCAN) and Universal exPression Codes (UPC)) 방법을 통해 표준화 한 뒤, GPL 별 Probe set 중 각 유전자에 해당하는 Probe 값들의 평균으로 계산하고, 최소값 1.0, 최대값 2.0 범위로 추가변환하여 개별 유전자의 발현값들을 생성하였다.
2-2. 환자 특성 데이터 변환
각 데이터셋 별로 유방암 환자 특성데이터에서 전체생존기간 및 무병생존기간에 해당하는 값을 "일" 단위로 변환한 뒤, 유방암 환자의 암 조직 샘플만을 선별하였다. 그 후, 도 2에 나타난 바와 같이, 유방암 전체 환자를 사건 발생 유무 (전체생존기간-사망/무병생존기간-재발)에 따른 시간 값 분포 차이를 고려하여 전체생존기간 혹은 무병생존기간에 따라 고위험군/저위험군/이외로 분류한 뒤 예후에 따른 고위험군 (예후 나쁜 군)과 저위험군 (예후 좋은 군)을 구분하는 모델 구성에 활용하였다 (이외로 분류된 환자들은 배제함) (도 3).
2-3. 모델 구성에 사용될 학습 및 검증용 환자 데이터 최종 선별
하기 표 2에 기재된 수의 각 기능군 (리보좀, 미토콘드리아리보좀, 면역세포 표면 마커, 스플라이소좀 및 tRNA 합성효소)에 속하는 유전자를 선행 연구 조사를 통해 선별하고, 각 데이터셋의 플랫폼 차이로 인해 포함하는 유전자의 종류가 다르므로, 포함되는 유전자의 개수 및 고위험군/저위험군에 포함되는 환자 수를 모두 고려하여, 유전자수 30개 이상 포함하고, 고위험군/저위험군 모두 100명 이상의 환자를 포함하도록 모델 구성에 사용될 학습 및 검증용 환자 데이터를 최종 선별하였다 (도 4). 그 결과, 실제 모델 구성에 활용된 데이터셋의 갯수는 하기 표 3과 같이 나타났다.
Figure 112020132563949-pat00003
Figure 112020132563949-pat00004
실시예 3. 유방암 예후 예측 모델 구성
상기 실시예 2에서 선별한 학습 및 검증용 환자 데이터와 Python 3.7, Scikit-learn 0.21.2을 이용하여 최적 모델을 도출하고 이를 검증하였다. 학습용 데이터와 검증용 데이터 각각을 1:5 의 비율로 랜덤하게 구분한 후, 학습용 데이터를 기반으로 각 기능군에 해당하는 유전자 중 최종으로 최대 10개 유전자를 선별하였다. 일차적으로 분산이 0.005 보다 작은 것, 그리고 ANOVA F 분별값의 우위 순서에 기준하였다. 모델 학습을 위한 파라미터 도출을 위해 학습용 데이터의 환자를 랜덤하게 5등분하여 (StratifiedKFold) 교차검증 (cross-validation)을 통해 주어진 파라미터 후보 중 최적의 파라미터를 도출하였고 검증용 데이터를 사용하여 도출된 파라미터로 구축된 모델을 최종 검증하였다 (도 5).
실시예 4. AI를 이용한 유방암 예후 판단용 마커 유전자 도출
상기 실시예 3의 유방암 예후 예측 모델을 이용하여 유방암의 예후 예측에 신뢰성이 높은 각 기능군 (리보좀, 미토콘드리아리보좀, 면역세포 표면 마커, 스플라이소좀 및 tRNA 합성효소)에 속하는 유전자들을 최종 선별하였다.
그 결과, 유방암의 전체생존기간(Overall Survival: OS)에 대한 가장 유의성 높은 리보좀 유전자 종류는 하기와 같으며, 하기 유전자의 발현양이 하기 수학식과 같을때, 저위험군과 고위험군을 분류할 수 있음을 확인하였다.
[수학식 1]
Pr(Y=y│X1, X2.....,X10)=exp(Z)/(1+exp(Z));
Z=α1X12X2 + ........+ α10X10
X는 유전자의 발현양을 나타냄;
Figure 112020132563949-pat00005
Figure 112020132563949-pat00006
<110> ONCOCROSS <120> METHOD FOR PROGNOSIS OF BREAST CANCER USING RIBOSOMAL PROTEIN FROM ARTIFICIAL INTELLIGENCE <130> P-RIBOSOME <160> 10 <170> KoPatentIn 3.0 <210> 1 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> RPL36 <400> 1 Met Ala Leu Arg Tyr Pro Met Ala Val Gly Leu Asn Lys Gly His Lys 1 5 10 15 Val Thr Lys Asn Val Ser Lys Pro Arg His Ser Arg Arg Arg Gly Arg 20 25 30 Leu Thr Lys His Thr Lys Phe Val Arg Asp Met Ile Arg Glu Val Cys 35 40 45 Gly Phe Ala Pro Tyr Glu Arg Arg Ala Met Glu Leu Leu Lys Val Ser 50 55 60 Lys Asp Lys Arg Ala Leu Lys Phe Ile Lys Lys Arg Val Gly Thr His 65 70 75 80 Ile Arg Ala Lys Arg Lys Arg Glu Glu Leu Ser Asn Val Leu Ala Ala 85 90 95 Met Arg Lys Ala Ala Ala Lys Lys Asp 100 105 <210> 2 <211> 84 <212> PRT <213> Artificial Sequence <220> <223> RPS27L <400> 2 Met Pro Leu Ala Arg Asp Leu Leu His Pro Ser Leu Glu Glu Glu Lys 1 5 10 15 Lys Lys His Lys Lys Lys Arg Leu Val Gln Ser Pro Asn Ser Tyr Phe 20 25 30 Met Asp Val Lys Cys Pro Gly Cys Tyr Lys Ile Thr Thr Val Phe Ser 35 40 45 His Ala Gln Thr Val Val Leu Cys Val Gly Cys Ser Thr Val Leu Cys 50 55 60 Gln Pro Thr Gly Gly Lys Ala Arg Leu Thr Glu Gly Cys Ser Phe Arg 65 70 75 80 Arg Lys Gln His <210> 3 <211> 214 <212> PRT <213> Artificial Sequence <220> <223> RPL10 <400> 3 Met Gly Arg Arg Pro Ala Arg Cys Tyr Arg Tyr Cys Lys Asn Lys Pro 1 5 10 15 Tyr Pro Lys Ser Arg Phe Cys Arg Gly Val Pro Asp Ala Lys Ile Arg 20 25 30 Ile Phe Asp Leu Gly Arg Lys Lys Ala Lys Val Asp Glu Phe Pro Leu 35 40 45 Cys Gly His Met Val Ser Asp Glu Tyr Glu Gln Leu Ser Ser Glu Ala 50 55 60 Leu Glu Ala Ala Arg Ile Cys Ala Asn Lys Tyr Met Val Lys Ser Cys 65 70 75 80 Gly Lys Asp Gly Phe His Ile Arg Val Arg Leu His Pro Phe His Val 85 90 95 Ile Arg Ile Asn Lys Met Leu Ser Cys Ala Gly Ala Asp Arg Leu Gln 100 105 110 Thr Gly Met Arg Gly Ala Phe Gly Lys Pro Gln Gly Thr Val Ala Arg 115 120 125 Val His Ile Gly Gln Val Ile Met Ser Ile Arg Thr Lys Leu Gln Asn 130 135 140 Lys Glu His Val Ile Glu Ala Leu Arg Arg Ala Lys Phe Lys Phe Pro 145 150 155 160 Gly Arg Gln Lys Ile His Ile Ser Lys Lys Trp Gly Phe Thr Lys Phe 165 170 175 Asn Ala Asp Glu Phe Glu Asp Met Val Ala Glu Lys Arg Leu Ile Pro 180 185 190 Asp Gly Cys Gly Val Lys Tyr Ile Pro Asn Arg Gly Pro Leu Asp Lys 195 200 205 Trp Arg Ala Leu His Ser 210 <210> 4 <211> 128 <212> PRT <213> Artificial Sequence <220> <223> RPL22 <400> 4 Met Ala Pro Val Lys Lys Leu Val Val Lys Gly Gly Lys Lys Lys Lys 1 5 10 15 Gln Val Leu Lys Phe Thr Leu Asp Cys Thr His Pro Val Glu Asp Gly 20 25 30 Ile Met Asp Ala Ala Asn Phe Glu Gln Phe Leu Gln Glu Arg Ile Lys 35 40 45 Val Asn Gly Lys Ala Gly Asn Leu Gly Gly Gly Val Val Thr Ile Glu 50 55 60 Arg Ser Lys Ser Lys Ile Thr Val Thr Ser Glu Val Pro Phe Ser Lys 65 70 75 80 Arg Tyr Leu Lys Tyr Leu Thr Lys Lys Tyr Leu Lys Lys Asn Asn Leu 85 90 95 Arg Asp Trp Leu Arg Val Val Ala Asn Ser Lys Glu Ser Tyr Glu Leu 100 105 110 Arg Tyr Phe Gln Ile Asn Gln Asp Glu Glu Glu Glu Glu Asp Glu Asp 115 120 125 <210> 5 <211> 151 <212> PRT <213> Artificial Sequence <220> <223> RPS14 <400> 5 Met Ala Pro Arg Lys Gly Lys Glu Lys Lys Glu Glu Gln Val Ile Ser 1 5 10 15 Leu Gly Pro Gln Val Ala Glu Gly Glu Asn Val Phe Gly Val Cys His 20 25 30 Ile Phe Ala Ser Phe Asn Asp Thr Phe Val His Val Thr Asp Leu Ser 35 40 45 Gly Lys Glu Thr Ile Cys Arg Val Thr Gly Gly Met Lys Val Lys Ala 50 55 60 Asp Arg Asp Glu Ser Ser Pro Tyr Ala Ala Met Leu Ala Ala Gln Asp 65 70 75 80 Val Ala Gln Arg Cys Lys Glu Leu Gly Ile Thr Ala Leu His Ile Lys 85 90 95 Leu Arg Ala Thr Gly Gly Asn Arg Thr Lys Thr Pro Gly Pro Gly Ala 100 105 110 Gln Ser Ala Leu Arg Ala Leu Ala Arg Ser Gly Met Lys Ile Gly Arg 115 120 125 Ile Glu Asp Val Thr Pro Ile Pro Ser Asp Ser Thr Arg Arg Lys Gly 130 135 140 Gly Arg Arg Gly Arg Arg Leu 145 150 <210> 6 <211> 145 <212> PRT <213> Artificial Sequence <220> <223> RPS19 <400> 6 Met Pro Gly Val Thr Val Lys Asp Val Asn Gln Gln Glu Phe Val Arg 1 5 10 15 Ala Leu Ala Ala Phe Leu Lys Lys Ser Gly Lys Leu Lys Val Pro Glu 20 25 30 Trp Val Asp Thr Val Lys Leu Ala Lys His Lys Glu Leu Ala Pro Tyr 35 40 45 Asp Glu Asn Trp Phe Tyr Thr Arg Ala Ala Ser Thr Ala Arg His Leu 50 55 60 Tyr Leu Arg Gly Gly Ala Gly Val Gly Ser Met Thr Lys Ile Tyr Gly 65 70 75 80 Gly Arg Gln Arg Asn Gly Val Met Pro Ser His Phe Ser Arg Gly Ser 85 90 95 Lys Ser Val Ala Arg Arg Val Leu Gln Ala Leu Glu Gly Leu Lys Met 100 105 110 Val Glu Lys Asp Gln Asp Gly Gly Arg Lys Leu Thr Pro Gln Gly Gln 115 120 125 Arg Asp Leu Asp Arg Ile Ala Gly Gln Val Ala Ala Ala Asn Lys Lys 130 135 140 His 145 <210> 7 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> RPS20 <400> 7 Met Ala Phe Lys Asp Thr Gly Lys Thr Pro Val Glu Pro Glu Val Ala 1 5 10 15 Ile His Arg Ile Arg Ile Thr Leu Thr Ser Arg Asn Val Lys Ser Leu 20 25 30 Glu Lys Val Cys Ala Asp Leu Ile Arg Gly Ala Lys Glu Lys Asn Leu 35 40 45 Lys Val Lys Gly Pro Val Arg Met Pro Thr Lys Thr Leu Arg Ile Thr 50 55 60 Thr Arg Lys Thr Pro Cys Gly Glu Gly Ser Lys Thr Trp Asp Arg Phe 65 70 75 80 Gln Met Arg Ile His Lys Arg Leu Ile Asp Leu His Ser Pro Ser Glu 85 90 95 Ile Val Lys Gln Ile Thr Ser Ile Ser Ile Glu Pro Gly Val Glu Val 100 105 110 Glu Val Thr Ile Ala Asp Ala 115 <210> 8 <211> 143 <212> PRT <213> Artificial Sequence <220> <223> RPS23 <400> 8 Met Gly Lys Cys Arg Gly Leu Arg Thr Ala Arg Lys Leu Arg Ser His 1 5 10 15 Arg Arg Asp Gln Lys Trp His Asp Lys Gln Tyr Lys Lys Ala His Leu 20 25 30 Gly Thr Ala Leu Lys Ala Asn Pro Phe Gly Gly Ala Ser His Ala Lys 35 40 45 Gly Ile Val Leu Glu Lys Val Gly Val Glu Ala Lys Gln Pro Asn Ser 50 55 60 Ala Ile Arg Lys Cys Val Arg Val Gln Leu Ile Lys Asn Gly Lys Lys 65 70 75 80 Ile Thr Ala Phe Val Pro Asn Asp Gly Cys Leu Asn Phe Ile Glu Glu 85 90 95 Asn Asp Glu Val Leu Val Ala Gly Phe Gly Arg Lys Gly His Ala Val 100 105 110 Gly Asp Ile Pro Gly Val Arg Phe Lys Val Val Lys Val Ala Asn Val 115 120 125 Ser Leu Leu Ala Leu Tyr Lys Gly Lys Lys Glu Arg Pro Arg Ser 130 135 140 <210> 9 <211> 133 <212> PRT <213> Artificial Sequence <220> <223> RPS24 <400> 9 Met Asn Asp Thr Val Thr Ile Arg Thr Arg Lys Phe Met Thr Asn Arg 1 5 10 15 Leu Leu Gln Arg Lys Gln Met Val Ile Asp Val Leu His Pro Gly Lys 20 25 30 Ala Thr Val Pro Lys Thr Glu Ile Arg Glu Lys Leu Ala Lys Met Tyr 35 40 45 Lys Thr Thr Pro Asp Val Ile Phe Val Phe Gly Phe Arg Thr His Phe 50 55 60 Gly Gly Gly Lys Thr Thr Gly Phe Gly Met Ile Tyr Asp Ser Leu Asp 65 70 75 80 Tyr Ala Lys Lys Asn Glu Pro Lys His Arg Leu Ala Arg His Gly Leu 85 90 95 Tyr Glu Lys Lys Lys Thr Ser Arg Lys Gln Arg Lys Glu Arg Lys Asn 100 105 110 Arg Met Lys Lys Val Arg Gly Thr Ala Lys Ala Asn Val Gly Ala Gly 115 120 125 Lys Lys Pro Lys Glu 130 <210> 10 <211> 128 <212> PRT <213> Artificial Sequence <220> <223> UBA52 <400> 10 Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu 1 5 10 15 Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp 20 25 30 Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys 35 40 45 Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu 50 55 60 Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly Ile Ile Glu Pro 65 70 75 80 Ser Leu Arg Gln Leu Ala Gln Lys Tyr Asn Cys Asp Lys Met Ile Cys 85 90 95 Arg Lys Cys Tyr Ala Arg Leu His Pro Arg Ala Val Asn Cys Arg Lys 100 105 110 Lys Lys Cys Gly His Thr Asn Asn Leu Arg Pro Lys Lys Lys Val Lys 115 120 125

Claims (7)

  1. 프로세서가 하기 수학식 1을 기반으로 유방암 환자의 조직의 유전자 발현 데이터로부터 유방암 예후를 판단하는 단계;를 포함하는 전자기기상에서 수행되는 유방암 예후 예측에 대한 정보를 제공하는 방법으로서, 상기 프로세서는 수학식 1에 따라 Pr(Y=y)≥0.5면 예후가 좋은 것으로 판단하는 것인, 방법.
    [수학식 1]
    Pr(Y=y│X1, X2.....,X10)=exp(Z)/(1+exp(Z));
    Z=α1X12X2 + ........+ α10X10
    X는 유전자의 발현양을 나타냄;
    Figure 112021022387605-pat00007
  2. 제1항에 있어서, 상기 예후는 전체생존율(Overall Survival, OS)인 것인, 방법.
  3. 하기 수학식 1을 기반으로 유방암 환자의 조직의 유전자 발현 데이터로부터 유방암 예후를 예측하는 프로세서가 내부에 저장된 유방암 예후 예측 정보를 제공하는 장치.
    [수학식 1]
    Pr(Y=y│X1, X2.....,X10)=exp(Z)/(1+exp(Z));
    Z=α1X12X2 + ........+ α10X10
    X는 유전자의 발현양을 나타냄;
    Figure 112021022387605-pat00020
  4. 제 3항에 있어서, 상기 예후는 전체생존율(Overall Survival, OS)인 것인, 장치.
  5. 삭제
  6. 삭제
  7. 삭제
KR1020200169943A 2020-12-07 2020-12-07 인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법 KR102271315B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020200169943A KR102271315B1 (ko) 2020-12-07 2020-12-07 인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법
PCT/KR2021/018306 WO2022124717A1 (ko) 2020-12-07 2021-12-06 인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200169943A KR102271315B1 (ko) 2020-12-07 2020-12-07 인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법

Publications (1)

Publication Number Publication Date
KR102271315B1 true KR102271315B1 (ko) 2021-06-30

Family

ID=76601908

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200169943A KR102271315B1 (ko) 2020-12-07 2020-12-07 인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법

Country Status (2)

Country Link
KR (1) KR102271315B1 (ko)
WO (1) WO2022124717A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022124717A1 (ko) * 2020-12-07 2022-06-16 주식회사 온코크로스 인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116843986B (zh) * 2023-09-04 2023-12-08 四川省医学科学院·四川省人民医院 一种基于图像识别的免疫固定电泳检测数据自动审核方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102164052B1 (ko) * 2018-12-17 2020-10-12 연세대학교 산학협력단 암의 진단을 위한 정보를 제공하는 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010002367A1 (en) * 2008-07-03 2010-01-07 Prediction Sciences Llc Diagnostic markers of breast cancer treatment and progression and methods of use thereof
KR102071491B1 (ko) * 2017-11-10 2020-01-30 주식회사 디시젠 차세대 염기서열분석을 이용한 기계학습 기반 유방암 예후 예측 방법 및 예측 시스템
KR102271315B1 (ko) * 2020-12-07 2021-06-30 주식회사 온코크로스 인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102164052B1 (ko) * 2018-12-17 2020-10-12 연세대학교 산학협력단 암의 진단을 위한 정보를 제공하는 방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022124717A1 (ko) * 2020-12-07 2022-06-16 주식회사 온코크로스 인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법

Also Published As

Publication number Publication date
WO2022124717A1 (ko) 2022-06-16

Similar Documents

Publication Publication Date Title
EP2138848B1 (en) Method for the diagnosis and/or prognosis of cancer of the bladder
Vachani et al. A 10-gene classifier for distinguishing head and neck squamous cell carcinoma and lung squamous cell carcinoma
BRPI0708534A2 (pt) ensaio molecular para prognosticar a recorrência de cáncer do cólon dukes b
BRPI0616211A2 (pt) mÉtodos para o diagnàstico de cÂncer pancreÁtico
CN107326066A (zh) 用于膀胱癌检测的尿标记物
KR102271315B1 (ko) 인공지능을 이용하여 도출된 리보좀 유전자 세트를 이용한 유방암 예후 예측방법
CN111876478A (zh) 肺结节诊断标志物及应用
WO2010088688A2 (en) Diagnosis of in situ and invasive breast cancer
US9102706B2 (en) Newly identified colon cancer marker and diagnostic kit using the same
KR101914348B1 (ko) 암 리스크를 검출하는 방법
US20090215058A1 (en) Methods for screening, predicting and monitoring prostate cancer
US20090215024A1 (en) Biomarkers upregulated in prostate cancer
KR102271313B1 (ko) 인공지능을 이용하여 도출된 미토콘드리아 리보좀 유전자 세트를 이용한 유방암 예후 예측방법
CN109402252A (zh) 急性髓系白血病风险评估基因标志物及其应用
KR102061891B1 (ko) 폐암 질환의 진단용 마커
WO2011146937A1 (en) Methods and kits useful in diagnosing nsclc
KR102293109B1 (ko) 인공지능을 이용하여 도출된 유전자 세트를 이용한 유방암 예후 예측방법
KR102293110B1 (ko) Ai를 이용한 유방암 예후 예측 방법
KR102246584B1 (ko) 인공지능을 이용한 위암의 예후를 예측하는 방법
KR101174369B1 (ko) 유방암 진단용 바이오마커 및 유방암 진단제
EP1682679B1 (en) Molecular marker
CN106636351B (zh) 一种与乳腺癌相关的snp标记及其应用
KR102133432B1 (ko) 폐암 질환의 진단용 마커
CN113278697B (zh) 一种基于外周血内基因甲基化的肺癌诊断试剂盒
EP2389450B1 (en) Methods for determining a prognosis for survival for a patient with breast cancer

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant