KR20240035609A - 종양을 특성화하기 위한 방법 - Google Patents

종양을 특성화하기 위한 방법 Download PDF

Info

Publication number
KR20240035609A
KR20240035609A KR1020247006194A KR20247006194A KR20240035609A KR 20240035609 A KR20240035609 A KR 20240035609A KR 1020247006194 A KR1020247006194 A KR 1020247006194A KR 20247006194 A KR20247006194 A KR 20247006194A KR 20240035609 A KR20240035609 A KR 20240035609A
Authority
KR
South Korea
Prior art keywords
tumor
nucleosides
grade
nucleoside
biological sample
Prior art date
Application number
KR1020247006194A
Other languages
English (en)
Inventor
에릭 라이벌즈
크리스토프 히르츠
알렉상드르 데이비드
세바스티앙 렐리에
뤽 바쉐
Original Assignee
상트르 하스피탈리에 유니베르시테르 드 몽펠리에
유니베르시테 드 몽펠리에
상뜨르 나쇼날 드 라 러쉐르쉬 샹띠피끄
엥스띠뛰 나쇼날 드 라 쌍떼 에 드 라 러쉐르쉬 메디칼레
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 상트르 하스피탈리에 유니베르시테르 드 몽펠리에, 유니베르시테 드 몽펠리에, 상뜨르 나쇼날 드 라 러쉐르쉬 샹띠피끄, 엥스띠뛰 나쇼날 드 라 쌍떼 에 드 라 러쉐르쉬 메디칼레 filed Critical 상트르 하스피탈리에 유니베르시테르 드 몽펠리에
Publication of KR20240035609A publication Critical patent/KR20240035609A/ko

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은 생물학적 샘플로부터 추출된 전체 세포 RNA, 세포 외 RNA 및/또는 단리된 뉴클레오시드로부터의 변형 및 비변형 뉴클레오시드의 정량적 분석을 기반으로 종양을 특성화하기 위한 시험관 내 방법에 관한 것이다. 보다 구체적으로, 본 발명은 신경교 종양의 등급을 예측하기 위한 방법에 관한 것이다. 더 구체적으로, 본 발명은 또한 종양을 검출하기 위한 방법에 관한 것이다. 따라서, 본 발명은 특히 의학적 진단에 적용되는 암종학 및 분자생물학 분야에 속한다.

Description

종양을 특성화하기 위한 방법
본 발명은 생물학적 샘플로부터 단리된 변형 및 비변형 뉴클레오시드의 정량적 분석을 기반으로 종양을 특성화하기 위한 시험관 내 방법에 관한 것이다. 보다 구체적으로, 본 발명은 신경교 종양(glial tumour)의 등급을 예측하기 위한 방법에 관한 것이다. 또 다른 특정 측면에 따르면, 본 발명은 종양의 존재를 검출하기 위한 방법에 관한 것이다.
따라서, 본 발명은 특히 의학적 진단에 적용되는 종양학 및 분자생물학 분야 에 속한다.
종양을 특성화하는 것은 환자에게 가장 적합한 치료법을 선택하기 위한 필수 전제 조건이다. "종양을 특성화한다"는 것은 주어진 종양의 발달 단계 또는 등급을 특성화하는 것을 의미하며; 이는 특히, 예를 들어 알려진 조직의 종양 발달 단계를 평가하는 것, 종양에 사전 정의된 등급을 지정하는 것, 또는 특히 종양의 초기 또는 전이성 특성을 결정하는 것과 같은 임의의 기타 특성화를 포함할 수 있다.
신경교종(Glioma) 또는 신경교 종양은 중추신경계의 가장 흔한 종양이다; 이들은 출현 연령, 분류, 조직학적 특성, 진행 능력 및 전이 가능성이 상당히 다양하다는 특징이 있다.
신경교종은 형태와 악성 등급에 따라 분류된다. 널리 받아들여지는 세계보건기구(WHO) 분류에서는 신경교종을 I에서 IV까지의 악성 등급으로 분류한다; 교모세포종(glioblastoma) 또는 등급 IV 종양이 가장 공격적이고 사망률이 가장 높은 형태이다.
신경교종 및 교모세포종 치료의 주요 한계 중 하나는 현재 효과적인 진단 전략이 부족하다는 것이다. 맞춤형 치료법을 선택하려면 종양의 정확한 분류가 필요하다. 현재, 신경교종을 검출하기 위해 임상적으로 사용되는 주요 진단 방법은 질병이 이미 진행된 단계에 있을 때 수행되는 신경학적 검사와 신경영상 기술에 의존한다.
종양을 진단하려면 생검이나 외과적 절제를 통해 유래한 환자 조직의 분석이 필요하다. 이 샘플을 기반으로 후보 유전자의 발현 테스트, DNA 카피본 수 계산, 메틸화 프로파일, 인단백질 경로 프로파일링 및 유전자 서열 분석 등 여러 가지 분자 분석이 수행된다. 그러나, 생검을 기반으로 한 진단은 종양의 등급 및 환자 계층화를 결정하는데 한계가 있다. 실제로, 예를 들어 특히 신경교 종양과 관련하여 신경교종의 등급은 구별하기 어렵고, 특히 등급 II와 III을 구별하기가 어렵다. 등급을 확립하려면 어려운 해부병리학적 분석이 필요하며, 이는 종종 두 명의 전문가가 독립적으로 수행하여야 한다. 등급 II는 양성 종양을 나타내고, 등급 III은 가장 공격적인 상태인 다형성 교모세포종으로의 전이를 나타낸다.
순전히 조직학적 분류는 재현하기 어렵다; 이는 시각적 전문 지식을 기반으로 하며 두 명의 전문가의 개입이 필요하다. 자기공명 영상(MRI)에 의한 이미지 분석과 함께 해부병리학적인 분석은 비용이 많이 들고 시간이 오래 걸린다; 이는 특히 MRI를 이용하기 위한 대기 시간에 좌우된다. 현재로는, 자체만으로 항암 치료 결정을 내리는 데 충분한 바이오마커가 없다.
따라서 종양을 특성화하기 위한 시험관 내 방법에 대한 일반적인 요구가 존재하며, 상기 방법은 객관적이고, 정확하고, 재현 가능하며, 용이하고, 가능하다면 질병의 초기 단계에서 수행될 수 있다. 상기 방법을 통해 진단을 강화하고 환자 계층화를 용이하게 할 수 있어야 한다.
Janzer의 간행물("Neuropathologie et pathologie mol culaire des gliomes." [Neuropathology and molecular pathology of gliomas] R-C Janzer, Rev. Med. Suisse, 5, 1501-4, 2009)은 WHO에 따른 신경교종의 분류를 조직학적 및 면역조직화학적 기준뿐만 아니라 세포 DNA 변형을 나타내는 유전적 프로파일: MGMT 유전자 프로모터 과메틸화 측정(교모세포종의 경우) 및 염색체 1p 및 19q의 손실 검출(희소돌기아교종양의 경우)에 기초해 설명한다.
Relier 등의 간행물 ("FTO-mediated cytoplasmic m 6 A m demethylation adjusts stem-like properties in colorectal cancer cell.", Nat. Commun 12, 1716, 2021)에서는 암 줄기 세포주에서 지방량과 비만 관련 단백질(FTO)에 의한 m6Am 메틸화 수준의 세포질 조절을 설명한다. 저자들은 m6Am 변형의 생물학적 기능과 결장직장암 관리에 대한 그의 잠재적인 부작용을 강조한다. 이 문서에는 질량 분석법(LC-MS/MS)에 의한 단편화 mRNA 분석 단계가 언급되어 있다. m6A, A, m6Am 및 Am 뉴클레오시드만이 검출되고 정량화되었다.
국제 출원 WO 2007/008647 "Diagnosing and grading gliomas using a proteomics approach"은 프로테오믹스(proteomic) 접근법을 사용하여 신경교종을 진단하고 등급화하는 방법에 관한 것이다. 이 방법에서는 종양 조직을 질량 분석법으로 분석하고 발현된 단백질의 프로파일을 얻는다.
신경교 종양의 악성 등급, 특히 그 분류를 평가하기 위한 시험관 내 방법이특별히 필요하다. 특히 진단을 강화하고 환자 계층화를 용이하게 하기 위해 신경교 종양의 등급 II와 등급 III을 구별할 수 있게 하는 객관적인 방법이 필요하다.
또한, 초기 단계부터 종양의 존재를 검출하는 방법이 특별히 필요하다. 실제로, 대부분의 암에 대한 조기 치료는 환자의 생존율을 상당히 증가시키거나 심지어 회복을 가능하게 한다. 따라서 종양의 존재를 조기에 특성화할 수 있는 객관적인 방법이 필요하다.
발명의 개시
본 발명자들은 이제 후성전사체(epitranscriptome)의 정량적 데이터를 활용하는 종양을 특성화하는 방법을 개발하였다.
후성전사체는 "RNA 후생유전학"이라는 용어로도 알려진 리보핵산(RNA) 염기에 의해 발생하는 모든 화학적 변형을 포함한다. 본 발명에 따른 방법은 종양을 앓고 있는 대상체로부터 생물학적 샘플을 제공하는 단계 및 상기 샘플로부터 유래된 변형 및 비변형 뉴클레오시드의 양을 얻는 단계를 포함하고; 상기 양은 벡터로 함께 (수학적 용어의 의미에서) 그룹화된다. 특정 측면에 따르면, 본 발명에 따른 방법은 종양의 특성화를 위해 상기 벡터의 후속 컴퓨터 분석을 포함한다. 종양의 상기 특성화는 분석 대상 샘플을 기반으로 종양에 대한 임상 및 의학적 정보 항목을 예측하는 것을 가능하게 한다. 보다 구체적으로, 본 발명에 따른 방법은 상기 종양의 등급을 예측하기 위한 상기 벡터의 컴퓨터 분석을 포함한다.
단순화를 위해, 주어진 샘플에 대해 변형되거나 비변형된 각 뉴클레오시드의 양을 함께 그룹화하는 벡터를 "후성전사체 프로파일" 또는 간단히 "프로파일"이라고 할 것이다.
변형 및 비변형 뉴클레오시드는 i) 환자로부터의 생물학적 샘플의 세포에서 추출된 전체 RNA, ii) 환자로부터의 생물학적 샘플에서 유래한 세포외 RNA 및/또는 iii) 환자로부터 단리된 생물학적 샘플로부터의 대사산물 추출물에서 유래한다.
환자로부터의 생물학적 샘플의 세포에서 추출된 전체 RNA 및/또는 환자로부터의 생물학적 샘플에서 유래한 세포외 RNA에서 유래한 뉴클레오시드는 RNA를 뉴클레오티드로 단편한 후 탈인산화하여 얻는다. 환자로부터 단리된 생물학적 샘플의 대사산물 추출물에서 유래하는 뉴클레오시드는 당업자에게 잘 알려진 적합한 방법에 따라 생물학적 샘플로부터 대사산물을 추출한 다음 상기 대사산물을 탈인산화하여 얻는다. 상기 대사산물은 특히 RNA의 이화작용으로부터 유래하며; 단량체 형태로 존재하는 뉴클레오시드는 또한 "유리(free)" 뉴클레오시드로 알려진 표현으로 나타내어질 수 있다.
보다 구체적으로, 변형 및 비변형 뉴클레오시드는 상기 종양의 생검 세포로부터 추출된 전체 RNA에 존재하는 뉴클레오시드이다.
"뉴클레오시드"는 피리미딘의 N1 질소 또는 퓨린의 N9로부터 글리코시드 결합에 의해 오탄당 잔기의 아노머 탄소에 부착된 뉴클레오티드 염기로 구성된 글리코실아민을 의미한다. 본 발명에 따른 방법의 특정 측면에 따르면, 상기 오탄당이 리보스인 경우, 용어 "뉴클레오시드"는 리보뉴클레오시드를 의미한다.
또한, 변형된 RNA 뉴클레오시드는 "후성전사체 표지" 또는 "후성전사체 변형"이라는 용어로 나타내어진다. 종양을 특성화하는 데 사용될 수 있는 일반적인 RNA 뉴클레오시드(표 1) 외에, 본 발명에 따른 방법, 특히 신경교종 분석에 사용될 수 있는 변형된 뉴클레오시드가 나열되어 있다(표 2).
뉴클레오시드 화학명
A 아데노신
C 사이티딘
G 구아노신
U 우리딘
뉴클레오시드 화학명 기원 뉴클레오시드
Am 2'-O-메틸아데노신 A
m1A 1-메틸아데노신 A
m66A N6,N6-디메틸아데노신 A
m66Am N6,N6,2'-O-트리메틸아데노신 A
m6A N6-메틸아데노신 A
m6Am N6,2'-O-디메틸아데노신 A
ac4C N4-아세틸사이티딘 C
Cm 2'-O-메틸사이티딘 C
hm5C 5-하이드록시메틸사이티딘 C
m3C 3-메틸사이티딘 C
m5C 5-메틸사이티딘 C
Gm 2'-O-메틸구아노신 G
m1G 1-메틸구아노신 G
m227G N2,N2,7-트리메틸구아노신 G
m27G N2,7-디메틸구아노신 G
m7G 7-메틸구아노신 G
oxo8G 8-하이드록시구아노신 G
I 이노신 I
Psi 슈도우리딘 P
Q 케오신 Q
m3Um 3,2'-O-디메틸우리딘 U
mem5s2U 5-메톡시카보닐메틸
-2-
U
본 발명에 따른 방법의 실시양태에 따르면, 후성전사체 프로파일은 적용 요건에 따라 공지된 뉴클레오시드 중에서 결정될 더 많은 수의 변형된 뉴클레오시드를 포함할 수 있다(Jonkhout et al, "The RNA modification landscape in human disease", RNA, Dec; 23 (12): 1754-1769, 2017). 분석 요건에 따라 전사체 프로파일에 포함될 수 있는 모든 변형된 뉴클레오시드의 전체 목록은 공개적으로 접근 가능하다.
샘플의 후성전사체 프로파일은 상기 샘플을 특정화한다. 상기 후성전사체 프로파일은 최신 기술의 임의의 공지 기술, 특히 질량 분석법, 특히 크로마토그래피와 결합된 질량 분석법에 의해 얻을 수 있다.
예측할 의료 정보 항목을 나타내기 위해 "임상 변수" 또는 "임상 특성"이라는 용어도 사용될 것이다.
본 발명에 따른 방법에서, 임상 예측을 위한 후성전사체 프로파일의 분석 단계는 지도 기계 학습 방법을 기반으로 한다. 학습은 코호트, 즉 예측할 특징적인 임상 변수가 사전에 알려진 세포 샘플에서 유래한 프로파일에 대해 수행된다. 따라서 학습을 통해 생성된 "계산 모델"은 임의의 새로운 샘플에 대한 임상 변수를 예측하기 위해 (예측 모드로) 사용될 수 있다.
본 발명자들은 또한 필적할만한 상대량을 포함하는 후성전사체 프로파일을 얻는 것을 가능하게 하는 원시(raw) 정량 데이터의 정규화 방법을 개발하였다.
학습 과정에 앞서, 코호트 샘플의 프로파일에 대한 탐색적 분석을 통해 프로파일의 변이가 드러났는데, 상기 변이는 샘플이 추출된 대상의 종양 등급과 상관관계가 있었다. 시그니처 코호트의 프로파일을 기반으로 하고 기계 학습 예측 도구를 사용하여, 본 발명에 따른 방법은 종양을 앓고 있는 환자로부터의 생물학적 샘플, 특히 종양 세포를 포함하는 샘플을 기반으로 신경교종의 등급을 예측하는 것을 가능하게 한다. 보다 구체적으로, 본 발명에 따른 방법은 종양 세포를 포함하는 샘플을 기반으로 신경교종의 등급 II 및 III을 구별하는 것을 가능하게 한다.
마지막으로, 정규화된 후성전사체 프로파일과 환자 생존성 데이터를 결합하고 기계 학습 예측 도구를 사용함으로써, 본 발명에 따른 방법은 환자로부터 단리된 생물학적 샘플, 특히 종양 샘플을 기반으로 환자의 생존성을 예측하는 것을 가능하게 한다.
본 발명자들은 또한 다음 단계를 포함하는, 개인으로부터 단리된 생물학적 샘플을 기반으로 상기 개인에게서 종양의 존재를 검출하는 방법을 개발하였다:
a) i) 전체 세포 RNA 및 이의 뉴클레오시드 단편, ii) 세포외 RNA 및 이의 뉴클레오시드 단편, 및/또는 iii) 단량체 이화대사산물에서 유래하는 뉴클레오시드를 추출하여 상기 생물학적 샘플로부터 뉴클레오시드를 단리하는 단계,
b) 단계 a) 동안 얻은 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드 각각의 양을 단리하고 결정하는 단계, 및
c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양의 존재에 특징적인 것인 단계.
개인에게서 종양의 존재를 검출하는 방법의 기술적 단계는 종양을 특성화하는 방법의 기술적 단계와 동일한 특징을 갖는다.
따라서, 본 발명자들은 한편으로는 종양을 특성화하고 다른 한편으로는 종양의 존재를 검출하기 위해 후성전사체의 정량적 데이터를 이용하는 방법을 개발하였다. 따라서 일 실시양태에 따르면, 본 발명에 따른 방법은 종양을 특성화하는데 유리하게 사용된다. 다른 실시양태에 따르면, 본 발명에 따른 방법은 종양의 존재를 검출하는데 유리하게 사용된다.
발명의 상세한 설명
제1 측면에 따르면, 본 발명은 다음 단계를 포함하는, 개인으로부터 단리된 생물학적 샘플을 기반으로 개인의 종양을 특성화하기 위한 시험관 내 방법에 관한 것이다:
a) i) 전체 세포 RNA 및 이의 뉴클레오시드 단편, ii) 세포외 RNA 및 이의 뉴클레오시드 단편, 및/또는 iii) 단량체 이화대사산물에서 유래하는 뉴클레오시드를 추출하여 상기 생물학적 샘플로부터 뉴클레오시드를 단리하는 단계,
b) 단계 a) 동안 얻은 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드 각각의 양을 단리하고 결정하는 단계, 및
c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계.
제1 실시양태에 따르면, 본 발명에 따른 방법은 생물학적 샘플의 전체 세포 RNA에서 유래하고/하거나 세포외 RNA 및 이의 뉴클레오시드 단편에서 유래하고/하거나 상기 샘플에 존재하는 단량체 이화대사산물로부터 얻은 뉴클레오시드에서 유래하는 다양한 뉴클레오시드의 양을 동시에 분석하는 것에 기초하며, 따라서 본 발명에 따른 방법은 단일 마커의 정량적 검출이 아닌 다중 변수의 동시 분석을 포함한다.
"프로파일" 또는 "뉴클레오시드 프로파일"은 뉴클레오시드 양의 벡터를 의미한다.
"전체 세포 RNA"는 잘 알려져 있고 접근 가능한 방법에 따라 추출된 세포 RNA 전체를 의미한다. 전체 세포 RNA에는 전달 RNA(tRNA), 메신저 RNA(mRNA), 리보솜 RNA(rRNA) 및 기타 비코딩 RNA가 포함된다. 따라서 본원에서 상기 전체 세포 RNA는 중합체 형태로 존재한다.
"세포외 RNA"는 잘 알려져 있고 접근 가능한 방법에 따라 추출된 중합체 형태로 존재하는 세포외 RNA 전체를 의미한다. 세포외 RNA의 이러한 중합체 형태는 특히 "순환 RNA"라는 표현으로도 나타내어진다. 상기 세포외 RNA는 수송 RNA(tRNA), 메신저 RNA(mRNA) 및/또는 리보솜 RNA(rRNA) 및 기타 유형의 RNA, 특히 비코딩 RNA의 생체내 효소 분해로부터 유래된다.
"단량체 이화대사산물로부터 유래된 뉴클레오시드"는 샘플에 단량체 형태로 존재하는 이화대사산물로부터 잘 알려져 있고 접근 가능한 방법에 따라 얻은 뉴클레오시드를 의미한다. 이러한 단량체 이화대사산물은 수송 RNA(tRNA), 메신저 RNA(mRNA) 및/또는 리보솜 RNA(rRNA) 및 기타 유형의 RNA, 특히 비코딩 RNA의 생체 내 효소 분해에서 유래한다.
"적어도 3개의 상이한 뉴클레오시드의 각각의 양을 단리하고 결정하는 것"은 개별적으로 취해진 "적어도 3개의" 뉴클레오시드 각각의 양을 단리하고 결정하는 것을 의미한다.
따라서 이러한 제1 실시양태에 따르면, 본 발명은 다음 단계를 포함하는, 개인으로부터 단리된 생물학적 샘플을 기반으로 개인의 종양을 특성화하기 위한 시험관 내 방법에 관한 것이다:
a) 전체 세포 RNA 및 이의 뉴클레오시드 단편을 추출함으로써 상기 생물학적 샘플로부터 뉴클레오시드를 단리하는 단계,
b) 단계 a) 동안 얻은 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 단리하고 결정하는 단계, 및
c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계.
뉴클레오시드는 또한 세포외 중합체 형태로 생물학적 샘플에 존재할 수 있으며, 특히 "순환 RNA"라는 표현으로도 나타내어진다. 뉴클레오시드는 또한 생물학적 샘플에 단량체 형태(대사산물)로 존재할 수도 있다. 상기 세포외 RNA 및 단량체 뉴클레오시드는 수송 RNA(tRNA), 메신저 RNA(mRNA) 및/또는 리보솜 RNA(rRNA) 및 기타 유형의 RNA, 특히 비코딩 RNA의 생체내 효소 분해로부터 유래된다.
제2 실시양태에 따르면, 본 발명에 따른 방법은 생물학적 샘플의 세포외 RNA에서 유래하는 다양한 뉴클레오시드 양의 동시 분석을 기반으로 한다.
이러한 제2 실시양태에 따르면, 본 발명은 다음 단계를 포함하는, 개인으로부터 단리된 생물학적 샘플을 기반으로 개인의 종양을 특성화하기 위한 시험관 내 방법에 관한 것이다:
a) 세포외 RNA 및 이의 뉴클레오시드 단편을 추출함으로써 상기 생물학적 샘플로부터 뉴클레오시드를 단리하는 단계,
b) 단계 a) 동안 얻은 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 단리하고 결정하는 단계, 및
c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계.
제3 실시양태에 따르면, 본 발명에 따른 방법은 생물학적 샘플에 존재하는 단량체 이화대사산물에서 유래하는 다양한 뉴클레오시드 양의 동시 분석을 기반으로 한다.
이러한 제3 실시양태에 따르면, 본 발명은 다음 단계를 포함하는, 개인으로부터 단리된 생물학적 샘플을 기반으로 개인의 종양을 특성화하기 위한 시험관 내 방법에 관한 것이다:
a) 상기 샘플에 존재하는 단량체성 이화대사산물을 추출함으로써 상기 생물학적 샘플로부터 뉴클레오시드를 단리하는 단계,
b) 단계 a) 동안 얻은 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 단리하고 결정하는 단계, 및
c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계.
개인의 종양을 특성화하기 위한 시험관 내 방법에서, 상기 개인으로부터 단리된 생물학적 샘플에 기초하여, 상기 생물학적 샘플은 특히 다음으로부터 선택된다:
- 고체 생물학적 샘플, 특히 생검, 더욱 특히 상기 종양의 생검, 및
- 액체 생물학적 샘플, 특히 상기 개인으로부터 채취한 체액, 더욱 특히 혈액, 혈장, 혈청 또는 소변 샘플.
"생검"이란 장기나 조직의 아주 작은 부분을 샘플링하는 것을 의미한다. 생물학적 샘플이 생검인 경우, 전체 세포 RNA가 추출된 다음 단편화되는 본 발명에 따른 방법의 제1 실시양태가 바람직하다.
생물학적 샘플이 액체 생물학적 샘플인 경우, 세포외 RNA를 추출한 후 단편하거나 단리된 뉴클레오시드 형태의 RNA를 각각 추출하는 본 발명에 따른 방법의 제2 및 제3 실시양태가 바람직하다.
본 발명에 따른 방법에서, 상기 생물학적 샘플은 상기 샘플로부터 전체 세포 RNA 추출물의 단편으로부터 유래하는 적어도 3개의 뉴클레오시드의 신뢰성 있는 정량적 결정을 가능하게 하기에 충분한 부피를 갖거나 충분한 수의 세포를 포함한다.
생검의 경우, 전체 세포 RNA는 당업자가 접근할 수 있는 방법, 특히 본 실시예에 기술된 방법 중에서 선택된 방법에 따라 추출된다. 혈액이나 소변과 같은 액체 샘플의 경우, 상기 샘플은 특히 임의의 간섭 화합물을 제거하고, 상기 샘플을 농축하고/하거나 소변 내 크레아티닌과 같은 참조 요소의 표준 농도 값을 결정하기 위해 필요한 경우 사전 처리되는데, 여기서 표준 값은 뉴클레오시드 프로파일의 확립 기준이 되는 샘플의 농도를 표준화하는 역할을 한다.
본 발명에 따른 방법에서, 전체 세포 RNA, 세포외 RNA 및 단리된 뉴클레오시드는 당업자에게 공지된 임의의 방법에 의해 생물학적 샘플로부터 얻어지고; 상기 방법은 특히 추출 단계, 선택적으로 단편화 단계 및 탈인산화 단계를 포함한다.
특정 측면에 따르면, 본 발명은 상기 종양의 생검을 기반으로 개인의 종양을 특성화하기 위한 시험관 내 방법에 관한 것이며, 상기 방법은 상기 생검을 기반으로 전체 세포 RNA의 추출물 및 상기 RNA의 뉴클레오시드 단편을 제조하는 단계를 포함한다.
일 실시양태에 따르면, 본 발명에 따른 개인의 종양을 특성화하기 위한 시험관 내 방법에서, i) 전체 세포 RNA 및 이의 뉴클레오시드 단편의 추출물을 제조하고, ii) 세포외 RNA 및 이의 뉴클레오시드 단편 추출물을 제조하고/거나 iii) 단리된 뉴클레오시드를 추출하여 얻은 생물학적 샘플로부터 유래된 적어도 3개의 단리된 뉴클레오시드를 단리하고 이들 각각의 양을 결정하며; 상기 적어도 3개의 뉴클레오시드는 다음으로부터 선택된다:
- 비변형 뉴클레오시드: 아데노신(A), 사이티딘(C), 구아노신(G), 우리딘(U) 및
- 변형된 뉴클레오시드(표 2 참조)
변형된 뉴클레오시드는 다수의 고도로 특이적인 효소의 작용으로 인해 생성되며; 뉴클레오시드는 특히 탄소-질소 결합의 메틸화 및 재배열을 거친다. 상기 변형된 뉴클레오시드는 모두 본 출원 당시 알려진 변형된 뉴클레오시드이며; 이들 뉴클레오시드는 특히 Jonkhout 등의 간행물(The RNA modification landscape in human disease", RNA, Dec; 23 (12): 1754-1769, 2017) 및 본 출원의 표 2에 언급되어 있다.
본 발명과 관련된 방법의 다양한 실시양태에 따르면, 상기 적어도 3개의 뉴클레오시드는 다음으로 구성된 군으로부터 선택된다:
- 비변형 뉴클레오시드: 아데노신(A), 사이티딘(C), 구아노신(G), 우리딘(U),
- 2'-O-메틸아데노신(Am), 1-메틸아데노신(m1A), N6,N6-디메틸아데노신(m66A), N6,N6,2'-O-트리메틸아데노신(m66Am), N6-메틸아데노신(m6A), N6,2'-O-디메틸아데노신(m6Am), N4-아세틸사이티딘(ac4C), 2'-O-메틸사이티딘(Cm), 5-하이드록시메틸사이티딘(hm5C), 3-메틸사이티딘(m3C), 5-메틸사이티딘(m5C), 2'-O-메틸구아노신(Gm), 1-메틸구아노신(m1G), N2,N2,7-트리메틸구아노신(m227G), N2,7-디메틸구아노신(m27G), 7-메틸구아노신(m7G), 8-하이드록시구아노신(oxo8G), 이노신(I), 슈도우리딘(Psi), 케오신(Q), 3,2'-O-디메틸우리딘(m3Um), 5-메톡시카보닐메틸-2-티오우리딘(mcm5s2U), 5-메톡시카보닐메틸우리딘(mcm5U), 5-카바모일메틸우리딘(ncm5U), 2'-O-메틸우리딘(Um), 및/또는
- 3-(3-아미노-3-카복시프로필)우리딘(acp3U), 2'-O-리보실아데노신(포스파트)(Ar(p)), 5-카복시메틸아미노메틸-2-티오우리딘(cmnm5s2U), 5-카복시메틸아미노메틸우리딘(cmnm5U), 5-카복시메틸아미노메틸-2'-O-메틸우리딘(cmnm5Um), 디하이드로우리딘(D), 5-포르밀사이티딘(f5C), 갈락토실-케오신(galQ), 2'-O-메틸-5-하이드록시메틸사이티딘(hm5Cm), 5-하이드록시우리딘(ho5U), 5-하이드록시아데노신(ho8A), 8-하이드록시구아노신(ho8G), N6-이소펜테닐아데노신(i6A), N6-(시스-하이드록시이소펜테닐)아데노신(io6A), 1-메틸이노신(m1I), 1-메틸슈도우리딘(m1psi), N2,N2-디메틸구아노신(m22G), 2-메틸아데노신(m2A), N2-메틸구아노신(m2G), 5-메틸우리딘(m5U), 5,2'-O-디메틸우리딘(m5Um), N6-메틸-N6-트레오닐카바모일아데노신(m6t6A), 만노실-케오신(manQ), 5-(카복시하이드록시메틸)우리딘 메틸 에스테르(mchm5U), 5-메틸아미노메틸-2-티오우리딘(mnm5s2U), 2-메틸티오-N6-이소펜테닐아데노신(ms2i6A), 2-메틸티오-N6-트레오닐카바모일아데노신(ms2t6A), 퍼옥시위부토신(o2yW), 2'-O-메틸슈도우리딘(psim), 2-티오우리딘(s2U), N6-트레오닐카바모일아데노신(t6A), 위부토신(yW).
본 발명과 관련된 방법의 일 실시양태에 따르면, 상기 적어도 3개의 뉴클레오시드는 다음으로 구성된 군으로부터 선택된다:
- 비변형 뉴클레오시드: 아데노신(A), 사이티딘(C), 구아노신(G), 우리딘(U), 및
- 2'-O-메틸아데노신(Am), 1-메틸아데노신(m1A), N6,N6-디메틸아데노신(m66A), N6,N6,2'-O-트리메틸아데노신(m66Am), N6-메틸아데노신(m6A), N6,2'-O-디메틸아데노신(m6Am), N4-아세틸사이티딘(ac4C), 2'-O-메틸사이티딘(Cm), 5-하이드록시메틸사이티딘(hm5C), 3-메틸사이티딘(m3C), 5-메틸사이티딘(m5C), 2'-O-메틸구아노신(Gm), 1-메틸구아노신(m1G), N2,N2,7-트리메틸구아노신(m227G), N2,7-디메틸구아노신(m27G), 7-메틸구아노신(m7G), 8-하이드록시구아노신(oxo8G), 이노신(I), 슈도우리딘(Psi), 케오신(Q), 3,2'-O-디메틸우리딘(m3Um), 5-메톡시카보닐메틸-2-티오우리딘(mcm5s2U), 5-메톡시카보닐메틸우리딘(mcm5U), 5-카바모일메틸우리딘(ncm5U), 2'-O-메틸우리딘(Um).
보다 특정한 실시양태에 따르면, 본 발명과 관련된 방법은 상기 생물학적 샘플로부터의 전체 RNA 단편화에서 유래한 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 또는 29개의 상이한 뉴클레오시드의 단리 및 정량적 결정을 포함한다.
또 다른 보다 특정한 실시양태에 따르면, 본 발명과 관련된 방법은 상기 생물학적 샘플로부터의 세포외 RNA 단편화에서 유래한 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 또는 29개의 상이한 뉴클레오시드의 단리 및 정량적 결정을 포함한다.
또 다른 보다 특정한 실시양태에 따르면, 본 발명과 관련된 방법은 상기 생물학적 샘플로부터 추출된 뉴클레오시드로부터 유래한 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28 또는 29개의 상이한 뉴클레오시드의 단리 및 정량적 결정을 포함한다.
더욱 특정한 실시양태에 따르면, 본 발명과 관련된 방법은 상기 생물학적 샘플로부터의 전체 RNA의 단편화 및/또는 세포외 RNA의 단편화 및/또는 단리된 뉴클레오시드의 추출로부터 유래된 적어도 3개의 상이한 뉴클레오시드의 단리 및 정량적 결정을 포함하며, 상기 뉴클레오시드는 다음으로부터 선택된다: 아데노신(A), 사이티딘(C), 구아노신(G), 우리딘(U), 2'-O-메틸아데노신(Am), 1-메틸아데노신(m1A), N6,N6-디메틸아데노신(m66A), N6,N6,2'-O-트리메틸아데노신(m66Am), N6-메틸아데노신(m6A), N6,2'-O-디메틸아데노신(m6Am), N4-아세틸사이티딘(ac4C), 2'-O-메틸사이티딘(Cm), 5-하이드록시메틸사이티딘(hm5C), 3-메틸사이티딘(m3C), 5-메틸사이티딘(m5C), 2'-O-메틸구아노신(Gm), 1-메틸구아노신(m1G), N2,N2,7-트리메틸구아노신(m227G), N2,7-디메틸구아노신(m27G), 7-메틸구아노신(m7G), 8-하이드록시구아노신(oxo8G), 이노신(I), 슈도우리딘(Psi), 케오신(Q), 3,2'-O-디메틸우리딘(m3Um), 5-메톡시카보닐메틸-2-티오우리딘(mcm5s2U), 5-메톡시카보닐메틸우리딘(mcm5U), 5-카바모일메틸우리딘(ncm5U), 2'-O-메틸우리딘(Um).
본 발명에 따른 방법에서, 적어도 3개의 뉴클레오시드 각각의 양의 단리 및 결정은 당업자에게 공지된 임의의 분석 수단에 의해 구현된다. 이러한 수단은 특히 크로마토그래피, 특히 역상 고성능 액체 크로마토그래피(RP-HPLC) 또는 모세관 전기영동(CE)을 포함한다.
이들 수단은 또한 분광분석 수단, 특히 질량 분석법을 포함한다. 보다 구체적으로, 이러한 수단은 액체상 크로마토그래피의 분리 능력과 삼중-사중극자 질량 분석법의 고감도 선택적 질량 분석 기능을 결합한 분석 기술인 액체상 크로마토그래피와 결합된 템덤 질량 분석법(LC-MS/MS)을 포함한다. 이 기술의 강점은 관심있는 각 화합물의 고유 질량/전하(m/z) 전이의 함수로서 높은 감도와 선택성으로 화합물을 정량화하는 질량 분석기의 성능과 결합된 광범위한 화합물에 대한 액상 크로마토그래피의 분리 능력에 있다.
특정 측면에 따르면, 본 발명에 따른 방법에서, 단편화에 의해 얻은 뉴클레오시드 혼합물은 삼중 사중극자 유형의 탠덤 질량 분석기와 결합된 고성능 액체 크로마토그래피(LC-MS/MS)를 사용하여 다중 반응 모니터링(MRM) 모드로 분석된다. MRM 모드는 질량 분석법으로 분자를 정량화할 수 있는 고감도 특수 기술이다. 이 스캔 모드는 탠덤, 특히 삼중 사중극자 질량 분석기 또는 하이브리드 이온 트랩 질량 분석기 시스템에 의존한다. MRM 스캔 모드는 특정 질량의 이온과 분자의 전하 수, 전구체 이온 또는 모 이온이라고 하는 이온을 선택하는 것뿐만 아니라 충돌 셀에서 단편화 후 해당 단편 이온을 선택하는 것을 기반으로 한다. 제1 사중극자를 사용하면 제2 사중극자에서 단편화될 관심 분자의 특정 전구체 이온을 정확하게 선택할 수 있다. 그런 다음 결과 단편 이온을 제3 사중극자에서 선택한다. 두 이온(질량/전하)은 관심 분자의 매우 특이한 전이에 해당한다.
더욱 특정한 실시양태에 따르면, 본 발명은 다음 단계를 포함하는, 개인으로부터의 생검을 기반으로 개인의 종양을 특성화하기 위한 시험관 내 방법에 관한 것이다:
a) 상기 생물학적 샘플에 기초해 전체 세포 RNA 및 중합체 RNA의 뉴클레오시드 단편 추출물을 제조하는 단계,
b) 단계 a)로부터 유래된 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 단리하고 결정하는 단계,
c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계.
보다 더 특정한 실시양태에 따르면, 본 발명은 개인의 종양을 특성화하기 위한 시험관 내 방법에 관한 것이며, 상기 종양은 직장, 결장, 유방, 췌장, 신장, 폐 장기 중 하나에 위치한 종양 또는 혈액 종양, 특히 백혈병이다.
보다 특정한 실시양태에 따르면, 본 발명은 다음 단계를 포함하는, 개인으로부터 단리된 생물학적 샘플을 기반으로 개인의 신경교 종양을 특성화하기 위한 시험관 내 방법에 관한 것이다:
a) 상기 생물학적 샘플에 기초해 전체 세포 RNA의 추출물 및 상기 RNA의 뉴클레오시드 단편을 제조하는 단계,
b) 단계 a)로부터 유래된 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 단리하고 결정하는 단계,
c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계, 및
d) 단계 c) 동안 확립된 프로파일에 기초하여 사전 훈련된 제1 분류 모델에 의해 상기 신경교 종양의 등급을 예측하는 단계.
"신경교 종양" 또는 "신경교종"이라는 용어는 뇌의 정상적인 신경교 세포에서 발생하는 다양한 뇌종양을 총칭한다. 신경교 종양의 등급은 그러한 종양을 가진 개인의 생존성을 결정하는 가장 중요한 요인을 나타낸다. 비종양성 뇌 조직은 내피 증식 없이 정상적인 특성과 일부 유사분열 특성을 갖는 수많은 세포를 특징으로 한다. "성상모세포종(astroblastoma)"이라고도 불리는 등급 II 종양은 유사분열 동안 다형성 핵을 포함하는 더 많은 수의 세포를 포함한다. 등급 III 종양은 "역형성 성상모세포종"이라고도 한다. 등급 IV 종양은 다형성 교모세포종에 해당한다.
"분류 모델"이란 사전 훈련된 기계 학습 알고리즘, 특히 지도 학습 중에 앞서 언급한 알고리즘을 훈련할 수 있는 훈련 데이터세트 및 평가 데이터세트를 의미한다.
실시양태에 따르면, 상기 제1 분류 모델은 훈련 데이터세트로 사전 훈련된 다음을 포함할 수 있다:
- 기계 학습 알고리즘,
- 더 구체적으로 지도 학습 신경망, 또는
- 다중 클래스 확률적 분류 알고리즘.
훈련 데이터는 한편으로는 제기된 질문에 특정되고, 다른 한편으로는 표적 암 유형에 특정된다. 따라서, 학습 알고리즘의 훈련 단계에서는 훈련 데이터를 사용하여 제기된 질문에 특정하고 표적 암 유형에 특정한 분류 모델을 생성한다. 학습 단계에서는 이러한 데이터와 질문의 함수로 모델의 매개변수를 추론한다. 예를 들어, 등급을 결정하는 질문에 대해 분류 모델은 4개의 등급이 구별되면 가능한 4개의 응답 중에서 응답을 다시 보낸다. 반대로, 종양의 존재를 검출하는 문제의 경우 분류 모델은 "종양" 또는 "건강함"으로 응답하며, 즉, 두 가지 가능한 응답 중에서 선택한다.
학습 단계에서 생성된 분류 모델은 샘플에서 유래된 후성전사체 프로파일의 데이터 항목을 기반으로, 고려된 질문에 대한 예측을 얻기 위해 컴퓨터에 구현된 프로그램이다. 이 프로그램은 다운로드하여 설치할 수 있으므로 해당 프로그램이 제작된 시스템이 아닌 다른 시스템에 설치될 수 있다.
훈련 데이터세트는 다수의 데이터 쌍을 포함할 수 있으며, 각각의 데이터 쌍은 뉴클레오시드 프로파일을 나타내는 제1 데이터 항목과 이 프로파일에 대한 종양 등급을 나타내는 제2 데이터 항목을 포함한다.
훈련 데이터세트는 훈련 세트와 모델의 "평가 세트[CF1]"로도 표시되는 테스트 세트를 포함할 수 있다. 따라서 모델은 훈련 세트에서 테스트될 수 있으며 테스트 세트를 사용하여 모델의 학습이 만족스러운지 여부를 결정할 수 있다.
훈련 세트와 테스트 세트는 상이할 수 있다. 대안적으로, 테스트 세트는 훈련 세트의 일부에 상응할 수 있다.
훈련 데이터세트는 암을 앓고 있고 종양의 등급이 사전 결정된 개인으로부터 얻은 샘플을 분석하여 실험실에서 얻은 데이터를 기반으로 사전 형성될 수 있다.
분류가 예를 들어 85% 정확도에 도달하면 분류 모델은 테스트 세트의 모든 프로파일에 대해 만족스러운 학습 수준에 도달한 것으로 간주된다; 즉, 분류가 예를 들어 최대 15%의 오류에 도달하면 분류 모델은 테스트 세트의 모든 프로파일에 대해 만족스러운 학습 수준에 도달한 것으로 간주된다.
분류 모델은 컴퓨터 프로그램으로 이루어질 수 있다. 본 발명의 바람직한 실시양태에 따르면, 본 발명에 따른 방법에서 구현된 분류 모델은 분류 방법의 단계로 이루어진 기술적 기능을 잠재적으로 실행하는 컴퓨터 프로그램으로 구성된다. 컴퓨터에 의해 상기 프로그램이 실행되면 기술적 객체인 디지털 객체가 생성된다.
상기 컴퓨터 프로그램은 예를 들어 C, C++, Java, Python 등과 같은 임의의 컴퓨터 언어로 작성될 수 있다.
실시양태에 따르면, 분류 모델은 서포트 벡터 머신(support vector machine), 랜덤 포레스트(random forest), 선형 판별 분석(linear discriminant analysis: LDA)을 포함할 수 있다.
보다 구체적으로, 상기 학습 알고리즘은 특히 다음으로부터 선택된다:
- 선형 커널 또는 저비용 매개변수 값을 갖는 방사형 기저 함수(RBF) 커널이 제공되는 서포트 벡터 머신,
- Ledoit-Wolf 절차에 따라 차원 축소 매개변수(dimension shrinkage parameter)를 자동으로 결정하는 최소 제곱 솔루션을 사용하는 LDA 알고리즘.
이러한 세 가지 기계 학습 알고리즘 계열은 문헌에 개념적으로 설명되어 있으며(Cornuejols and Miclet, "Apprentissage Artificiel: Concepts et Algorithmes" [Machine learning: concepts and algorithms] Eyrolles, 2012; Hastie et al. "The Elements of Statistical Learning: Data Mining, Inference, and Prediction", 2nd Edition. Springer Series in Statistics, Springer 2009, ISBN 9780387848570) 다중 클래스 분류에 완전 적합하다.
본 발명에 따른 방법의 실시양태에 따르면, 신경교 종양의 등급을 예측하는 것은 다음을 포함할 수 있다:
- 등급 II 신경교 종양을 예측하거나,
- 등급 III 신경교 종양을 예측하거나
- 등급 IV 신경교 종양을 예측한다.
보다 구체적으로, 본 발명은 개인으로부터의 생물학적 샘플, 특히 상기 신경교 종양의 생검을 기반으로 개인의 신경교 종양의 등급을 예측하기 위한 시험관 내 방법에 관한 것으로, 여기서 사전 훈련된 분류 모델에 의해 상기 신경교 종양의 등급을 예측하는 것은 등급 II 신경교 종양을 예측하고, 등급 III 신경교 종양을 예측하고, 등급 IV 신경교 종양을 예측하는 것을 포함한다. 더욱 구체적으로, 개인의 신경교 종양의 등급을 예측하기 위한 본 발명에 따른 방법은 등급 II 신경교 종양과 등급 III 또는 IV 신경교 종양을 구별하는 것; 등급 III 신경교 종양과 등급 II 또는 IV 신경교 종양을 구별하는 것; 등급 IV 신경교 종양과 등급 II 또는 III 신경교 종양을 구별하는 것을 포함한다.
보다 구체적으로, 본 발명은 다음 단계를 포함하는, 상기 종양의 생검을 기반으로 개인의 신경교 종양을 특성화하기 위한 시험관 내 방법에 관한 것이다:
a) 상기 생검에 기초하여, 전체 세포 RNA의 추출물 및 상기 RNA의 뉴클레오시드 단편을 제조하는 단계,
b) 아데노신(A), 사이티딘(C), 구아노신(G), 우리딘(U), 2'-O-메틸아데노신(Am), 1-메틸아데노신(m1A), N6,N6-디메틸아데노신(m66A), N6,N6,2'-O-트리메틸아데노신(m66Am), N6-메틸아데노신(m6A), N6,2'-O-디메틸아데노신(m6Am), N4-아세틸사이티딘(ac4C), 2'-O-메틸사이티딘(Cm), 5-하이드록시메틸사이티딘(hm5C), 3-메틸사이티딘(m3C), 5-메틸사이티딘(m5C), 2'-O-메틸구아노신(Gm), 1-메틸구아노신(m1G), N2,N2,7-트리메틸구아노신(m227G), N2,7-디메틸구아노신(m27G), 7-메틸구아노신(m7G), 8-하이드록시구아노신(oxo8G), 이노신(I), 슈도우리딘(Psi), 케오신(Q), 3,2'-O-디메틸우리딘(m3Um), 5-메톡시카보닐메틸-2-티오우리딘(mcm5s2U), 5-메톡시카보닐메틸우리딘(mcm5U), 5-카바모일메틸우리딘(ncm5U), 2'-O-메틸우리딘(Um) 중에서 선택되는, 상기 단편화로부터 유래하는 적어도 3개의 뉴클레오시드를 단리하고 정량적으로 결정하는 단계
c) 상기 종양에 대해, 단계 b) 동안 얻은 뉴클레오시드의 각각의 정량적 값에 기초하여 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계, 및
d) 단계 c) 동안 확립된 프로파일에 기초하여 사전 훈련된 분류 모델에 의해 상기 신경교 종양의 등급을 예측하는 단계로서, 여기서 신경교 종양의 등급을 예측하는 것은 등급 II 신경교 종양을 예측하고, 등급 III 신경교 종양을 예측하고 등급 IV 신경교 종양을 예측하는 것인 단계.
또 다른 측면에 따르면, 본 발명은 다음 단계를 포함하는, 개인의 신경교 종양을 특성화하기 위한 시험관 내 방법에 관한 것이다:
a) 상기 생물학적 샘플에 기초해 전체 세포 RNA의 추출물 및 상기 RNA의 뉴클레오시드 단편을 제조하는 단계,
b) 단계 a)로부터 유래된 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 단리하고 결정하는 단계,
c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계, 및
d) 단계 c) 동안 확립된 프로파일에 기초하여 사전 훈련된 제2 분류 모델에 의해 상기 개인의 생존성 상태를 예측하는 단계.
실시양태에 따르면, 상기 제2 분류 모델은 제2 훈련 데이터세트로 사전 훈련된 다음을 포함할 수 있다:
- 기계 학습 알고리즘,
- 더 구체적으로 지도 학습 신경망, 또는
- 확률적 분류 알고리즘.
상기 제2 훈련 데이터세트는 다수의 데이터 쌍을 포함할 수 있으며, 각각의 데이터 쌍은 뉴클레오시드 프로파일을 나타내는 제1 데이터 항목과 이 프로파일에 대한 생존성 상태를 나타내는 제2 데이터 항목을 포함한다.
이 훈련 데이터세트는 모델의 훈련 세트 및 평가 세트를 포함할 수 있다. 따라서 모델은 훈련 세트에서 테스트될 수 있으며 평가 세트는 모델의 학습이 만족스러운지 여부를 결정하는 데 사용될 수 있다. 훈련 세트와 평가 세트는 상이할 수 있다. 대안적으로, 평가 세트는 훈련 세트의 일부에 상응할 수 있다. 훈련 데이터세트는 암을 앓고 있고 생존성 상태가 사전 결정된 개인으로부터 얻은 샘플을 분석하여 실험실에서 얻은 데이터를 기반으로 사전 형성될 수 있다.
분류 정확도가 85%에 도달하면 평가 세트의 모든 프로파일에 대해 분류 모델이 만족스러운 학습 수준에 도달한 것으로 간주된다; 즉, 분류가 최대 15%의 오차에 도달하면 평가 세트의 모든 프로파일에 대해 분류 모델이 만족스러운 학습 수준에 도달한 것으로 간주된다.
제1 분류 모델과 마찬가지로 제2 분류 모델은 컴퓨터 프로그램으로 구성될 수 있다. 컴퓨터 프로그램은 C, C++, Java, Python 등과 같은 임의의 컴퓨터 언어로 작성될 수 있다.
실시양태에 따르면, 제2 분류 모델은 서포트 벡터 머신, 랜덤 포레스트, 선형 판별 분석을 포함할 수 있다.
또 다른 측면에 따르면, 본 발명은 본 발명에 따른 방법을 실시하여 얻은 뉴클레오시드 프로파일에 기초하여 종양을 앓고 있는 개인의 신경교 종양의 등급을 예측하기 위해 훈련 데이터세트에 대해 사전 훈련된 분류 모델에 관한 것이다.
신경교 종양의 등급을 예측하기 위한 상기 분류 모델은 특히 지도 학습 중에 신경교 종양의 등급 예측에 관한 훈련 데이터세트로 사전에 훈련 및 평가된 기계 학습 알고리즘을 포함하며, 상기 훈련 세트는 둘 다 신경교 종양의 등급 예측에 관한 훈련 세트 및 평가 세트를 포함한다.
본 발명은 또한 적어도 다음 단계를 포함하는, 신경교 종양의 등급을 예측하기 위한 분류 모델을 구축하는 방법에 관한 것이다:
- 분류 작업을 위한 기계 학습 알고리즘을 선택하는 단계,
- 훈련 세트와 테스트 세트를 포함하는, 신경교 종양의 등급 예측에 관한 훈련 데이터세트를 제공하는 단계,
- 상기 훈련 데이터세트를 사용하여 상기 알고리즘에 의해 신경교 종양의 등급을 예측하는 학습 단계.
또 다른 특정 측면에 따르면, 본 발명은 본 발명에 따른 방법을 실시하여 얻은 뉴클레오시드 프로파일에 기초하여 종양을 앓고 있는 개인의 생존성 상태를 예측하기 위해 훈련 데이터세트에 대해 사전 훈련된 제2 분류 모델에 관한 것이다.
종양을 앓고 있는 개인의 생존성 상태를 예측하기 위한 상기 분류 모델은 개인의 생존성 상태의 예측에 관한 훈련 데이터세트로 사전에, 특히 지도 학습 중에 훈련되고 평가된 기계 학습 알고리즘을 포함하며, 상기 훈련 세트는 둘 다 종양으로 고통받는 개인의 생존성 상태를 예측하는 것에 관한 훈련 세트 및 테스트 세트를 포함한다.
본 발명은 또한 적어도 다음 단계를 포함하는, 개인의 생존성 상태를 예측하기 위한 분류 모델을 구축하는 방법에 관한 것이다:
- 분류 작업을 위한 기계 학습 알고리즘을 선택하는 단계,
- 훈련 세트와 테스트 세트를 포함하는, 개인의 생존성 상태 예측에 관한 훈련 데이터세트를 제공하는 단계,
- 상기 훈련 데이터세트를 이용하여 상기 알고리즘에 의해 개인의 생존성 상태를 예측하는 학습 단계.
다른 측면에 따르면, 본 발명은 신경교 종양의 등급을 예측하기 위한 본 발명에 따른 분류 모델의 용도에 관한 것이다.
한 측면에 따르면, 본 발명은 상기 환자의 특징적인 적어도 하나의 다른 생물학적 마커와 조합된, 신경교 종양을 앓고 있는 환자의 계층화를 위한 본 발명에 따른 분류 모델의 용도에 관한 것이다.
다른 측면에 따르면, 본 발명은 개인의 생존성 상태를 예측하기 위한 본 발명에 따른 분류 모델의 용도에 관한 것이다.
또 다른 특정 실시양태에 따르면, 본 발명은 다음 단계를 포함하는, 개인으로부터 단리된 생물학적 샘플을 기반으로 개인에서 종양의 존재를 검출하기 위한 시험관 내 방법에 관한 것이다:
a) i) 전체 세포 RNA 및 이의 뉴클레오시드 단편, ii) 세포외 RNA 및 이의 뉴클레오시드 단편, 및/또는 iii) 단량체 이화대사산물로부터 유래된 뉴클레오시드, 바람직하게는 단량체 이화대사산물로부터 유래된 뉴클레오시드를 추출함으로써 상기 생물학적 샘플로부터 뉴클레오시드를 단리하는 단계,
b) 단계 a) 동안 얻은 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 단리하고 결정하는 단계, 및
c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양의 존재에 특징적인 것인 단계.
보다 더 특정한 실시양태에 따르면, 본 발명은 다음 단계를 포함하는, 개인으로부터 단리된 혈액 샘플을 기반으로 개인에게서 종양의 존재를 검출하기 위한 시험관 내 방법에 관한 것이다:
a) 단량체 이화대사산물로부터 유래된 뉴클레오시드를 추출함으로써 상기 생물학적 샘플로부터 뉴클레오시드를 단리하는 단계,
b) 단계 a)로부터 유래된 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 단리하고 결정하는 단계,
c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계, 및
d) 단계 c) 동안 확립된 프로파일에 기초하여 사전 훈련된 분류 모델에 의해 상기 종양의 존재를 예측하는 단계.
보다 더 특정한 실시양태에 따르면, 본 발명은 다음 단계를 포함하는, 개인으로부터 단리된 혈액 샘플을 기반으로 개인에게서 결장직장 종양의 존재를 검출하기 위한 시험관 내 방법에 관한 것이다:
a. 단량체 이화대사산물로부터 유래된 뉴클레오시드를 추출함으로써 상기 생물학적 샘플로부터 뉴클레오시드를 단리하는 단계,
b. 단계 a)로부터 유래된 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 단리하고 결정하는 단계,
c. 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계, 및
d. 단계 c) 동안 확립된 프로파일에 기초하여 사전 훈련된 분류 모델에 의해 상기 결장직장 종양의 존재를 예측하는 단계.
본 발명은 또한 종양의 존재를 검출하기 위한 본 발명에 따른 방법의 용도에 관한 것으로, 상기 종양은 직장, 결장, 유방, 췌장, 신장, 폐 기관 중 하나에 위치한 종양 또는 혈액학적 종양, 특히 백혈병이다.
본 발명은 또한 소화관 종양, 특히 결장직장 종양의 존재를 검출하기 위한 본 발명에 따른 방법의 용도에 관한 것이다.
또 다른 측면에 따르면, 본 발명은 본 발명에 따른 방법을 실시하여 얻은 뉴클레오시드 프로파일에 기초하여 개인에게서 종양의 존재를 검출하기 위한 훈련 데이터세트에 대해 사전 훈련된 분류 모델에 관한 것이다. 이 분류 모델은 개인에게서 종양의 존재를 검출하는 것에 관한 훈련 데이터세트로 특히 지도 학습 중에 사전 훈련되고 평가된 기계 학습 알고리즘을 포함하며, 상기 훈련 세트는 둘 다 개인에게서 종양의 존재를 검출하는 것에 관한 훈련 세트 및 테스트 세트를 포함한다.
보다 구체적으로, 본 발명은 본 발명에 따른 방법을 실시하여 얻은 뉴클레오시드 프로파일에 기초하여 개인에게서 결장직장 종양의 존재를 검출하기 위한 훈련 데이터세트에 대해 사전 훈련된 분류 모델에 관한 것이다. 상기 분류 모델은 개인에게서 결장직장 종양의 존재를 검출하는 것에 관한 훈련 데이터세트로, 특히 지도 학습 동안 사전 훈련되고 평가된 기계 학습 알고리즘을 포함한다.
본 발명은 또한 적어도 다음 단계를 포함하는, 종양의 존재를 검출하기 위한 상기 분류 모델을 구축하는 방법에 관한 것이다:
- 분류 작업을 위한 기계 학습 알고리즘을 선택하는 단계,
- 훈련 세트 및 테스트 세트를 포함하는, 개인에게서 종양의 존재를 검출하는 것에 관한 훈련 데이터세트를 제공하는 단계,
- 상기 훈련 데이터세트를 사용하여 상기 알고리즘에 의해 개인에게서 종양의 존재를 예측하는 학습 단계.
특정 실시양태에 따르면, 본 발명은 또한 분류 작업을 위한 기계 학습 알고리즘을 선택하는 단계, 개인에게서 결장직장 종양의 존재를 검출하는 것에 관한 훈련 세트 및 테스트 세트를 포함하는 훈련 데이터세트를 제공하는 단계, 및 상기 훈련 데이터세트를 이용하여 상기 알고리즘에 의해 개인에게서 결장직장 종양의 존재를 예측하는 학습 단계를 적어도 포함하는, 결장직장 종양의 존재를 검출하기 위한 분류 모델을 구축하는 방법에 관한 것이다.
다른 측면에 따르면, 본 발명은 종양, 특히 결장직장 종양을 검출하기 위한 본 발명에 따른 분류 모델의 용도에 관한 것이다.
한 측면에 따르면, 본 발명은 상기 환자의 특징적인 적어도 하나의 다른 생물학적 마커와 조합하여 종양, 특히 결장직장 종양을 검출하기 위한 본 발명에 따른 분류 모델의 용도에 관한 것이다.
또 다른 특정 측면에 따르면, 본 발명은 마지막으로 종양을 특성화하기 위해 본 발명에 따른 방법을 구현하는 것을 포함하는 진단 방법에 관한 것이다. 본 발명은 또한 신경교 종양의 등급을 예측하기 위해 본 발명에 따른 방법을 실시하는 것을 포함하는 진단 방법에 관한 것이다. 본 발명은 또한 환자의 생존성 상태를 예측하기 위해 본 발명에 따른 방법을 실시하는 것을 포함하는 진단 방법에 관한 것이다. 또한, 상기 진단 방법은 조직의 조직학적 분석을 포함할 수 있다.
또 다른 특정 측면에 따르면, 본 발명은 최종적으로 종양을 검출하기 위해 본 발명에 따른 방법을 구현하는 것을 포함하는 진단 방법에 관한 것이다. 본 발명은 또한 결장직장 종양을 검출하기 위해 본 발명에 따른 방법을 구현하는 것을 포함하는 진단 방법에 관한 것이다. 상기 진단 방법은 조직의 조직학적 분석을 포함할 수 있다.
도면 및 실시양태에 관한 설명
다른 장점과 특징은 어떤 식으로든 제한적이지 않은 실시양태의 상세한 설명과 첨부된 도면을 검토함으로써 명백해질 것이다.
도 1은 전체 실험 계획을 나타내며, 여기서 LC-MS/MS는 질량 분석법과 결합된 액체 크로마토그래피를 나타내고 원시 데이터(데이터)는 LC-MS/MS에서 얻은 후성전사체 프로파일이다.
도 2는 생물정보학 과정의 전체 계획을 나타내며. 원시 데이터는 LC-MS/MS로 얻은 후성전사체 프로파일이고, 정규화된 데이터는 정규화 후 후성전사체 프로파일이며, MS는 질량 분석법(액체 크로마토그래피와 결합)을 나타낸다.
도 3A, 3B 및 3C는 신경교 종양의 등급에 따라 6개의 변형된 뉴클레오시드의 상대적인 양(백분율)을 각각 나타내는 6개의 그래프를 상자 수염(box-and-whisker) 플롯 형태로 나타낸다. 각각의 그래프에 대해, 상기 등급은 x-축에 "정상", "등급-II", "등급-III" 또는 "등급-IV"로 표시되며, 이 표시는 각각 비종양성 신경교 조직 샘플 또는 등급 II, III 또는 IV의 신경교 종양 샘플을 나타낸다. 도 3A는 신경교 종양의 등급이 증가함에 따라 그 양이 감소하는 뉴클레오시드의 두 가지 예: (왼쪽에서 오른쪽으로) oxo8G 및 m1G를 나타낸다. 도 3B는 신경교 종양의 등급이 증가함에 따라 그 양이 증가하는 뉴클레오시드의 두 가지 예: (왼쪽에서 오른쪽으로) m6Am 및 Gm을 나타낸다. 도 3C는 신경교 종양의 등급이 증가함에 따라 그 양이 약간 달라지는 뉴클레오시드의 두 가지 예: (왼쪽에서 오른쪽으로) m1A 및 m7G를 나타낸다. 척도는 그래프마다 다르다.
도 4는 코호트의 후성전사체 프로파일에 대한 주성분 분석(PCA)의 제1 성분에 대해 설명된 분산 비율을 나타낸다. x-축에는 성분이 번호 0부터 9까지 매겨져 있다. y-축에는 이들 성분에 대해 설명된 분산 비율이 표시된다.
도 5는 주성분 분석(PCA)의 첫 세 성분, 즉 코호트의 후성전사체 프로파일 분산의 39.2 + 23.3 + 8.6 = 71.1%를 나타내는 세 성분에 따른 코호트 프로파일의 3차원 시각화를 나타낸다. 각 축은 각각 주성분 0(39.24%), 주성분 1(23.27%) 및 주성분 2(8.58%)를 나타낸다. "별" 기호는 "보통" 등급을; "삼각형"은 등급 II를; "사각형"은 등급 III을, "십자가"는 등급 IV를 각각 나타낸다.
이하에 설명되는 실시양태는 어떤 식으로든 제한적이지 않다는 것이 충분히 이해될 것이다. 본 발명의 변형은 이하에서 설명되는 특성 중 일부가 기술적 이점을 부여하거나 선행 기술의 상태와 관련하여 본 발명을 차별화하기에 충분하다면, 특히 설명된 다른 특성과 별개로 이하에서 설명되는 특성 중 일부만을 선택하여 포함하는 것이 구상될 수 있다. 본 발명은 본 발명을 설명하기 위해 제공되며 본 발명의 범위를 제한하지 않는 하기 실시예를 읽으면 더 잘 이해될 것이다.
실시예 1: 신경교 세포 샘플의 전사체 데이터 분석
본 섹션에서는 사용된 코호트, 샘플 제조, 후성전사체 프로파일을 얻는 방법 및 컴퓨터 분석 프로그램을 제시한다. 그런 다음 이 섹션에서는 코호트 프로파일에 대한 탐색적 분석, 종양 등급 예측 및 생존 예측 결과를 제시한다.
샘플 제조 및 질량 분석법에 의한 프로파일 획득을 다음과 같이 수행하였다: 신경아교종으로 진단되었고 수술 전에 화학 요법이나 방사선 요법을 받지 않은 성인 환자에서 외과적으로 절제된 종양으로부터 유래한 58개의 샘플을 환자 정보 및 동의에 관해 프랑스 생명윤리법을 준수하여 사용하였다. 절제 시 각 종양에 대해 분취량을 즉시 냉동하여 -80℃에 보관하고 나머지 조직은 4% 포르말린에 고정하여 파라핀에 포매시킨 다음 3 마이크론 섹션을 잘라 헤마톡실린과 에오신으로 염색하였다. 종양의 조직병리학적 유형을 개정된 세계보건기구 분류(Wesseling & Capper, "WHO 2016 Classification of gliomas". Neuropathol Appl Neurobiol. 44, 139-150, 2018)에 따라 결정하였다. 종양 그룹은 등급 II(n = 20), 등급 III(n = 20) 신경교종 및 등급 IV(n = 18) 교모세포종으로 이루어졌다. 또한, 비종양 신경교 세포의 19개 "대조군" 샘플(n = 19)을 종양 샘플과 동일한 프로토콜(이하 설명)에 따라 제조하였다.
산 구아니디늄-페놀 방법을 사용하여 종양 샘플로부터 전체 RNA를 추출하였다. RNA 샘플의 품질을 아가로스 겔 전기영동 및 에티듐 브로마이드 염색을 통해 결정하고, 18S 및 28S RNA 밴드를 UV 광 하에서 시각화하였다. 최소 100 ng의 RNA 샘플을 얻기 위해 상 분리를 통해 RNA를 추출하는 것부터 생물학적 샘플의 처리를 시작하였다. 중합체 RNA의 효소적 가수분해와 뉴클레오시드의 탈인산화로 처리를 계속하였다.
RNA의 효소 소화를 다음과 같이 수행하였다: 400 ng 양의 RNA를 총 부피 20 μL의 milliQ 물에 희석하고 여기에 3 μl의 아세트산암모늄(0.1M pH 5.3)과 0.001 효소 단위(U) 뉴클레아제 P1(Sigma, N8630)을 첨가하였다. 42℃에서 2시간 동안 인큐베이션을 수행하였다. 그런 다음, 3 μl 아세트산암모늄 1M 및 0.001 U 알칼리성 포스파타제(Sigma, P4252)를 첨가하였다. 이어서 혼합물을 37℃에서 2시간 동안 인큐베이션하였다. 마지막으로, 뉴클레오시드 용액을 두 번 희석하고 0.22 μm 필터(Millex®-GV, Millipore, SLGVR04NL)로 여과하였다. 마지막에, 각 샘플 5 μL를 주입하고 모든 샘플을 LC-MSMS에 의해 3중으로 분석하였다.
액체 크로마토그래피(LC)를 다음과 같이 수행하였다: Synergi™ Fusion-RP C18 컬럼(입자 크기 4 μm, 250 mm x 2 mm, 80Å)(Phenomenex, 00G-4424-B0)을 사용하여 Nexera LC-40 시스템(Shimadzu)으로 뉴클레오시드를 분리하였다. 이동상은 아세트산을 사용하여 pH 5.3으로 조정된 5 mM 아세트산암모늄(용매 A) 및 순수 아세토니트릴(용매 B)로 구성되었다. 30분 동안의 구배 용리를 100% 상 A로 시작하여 13분에 8% 용매 B까지로 선형 구배하였다. 용매 B를 10분에 40%까지 더 증가시켰다. 2분 후, 25.5분에 용매 B를 0%로 되돌렸다. 추가 4.5분 동안 100% 용매 A로 헹구어 초기 조건을 재생하였다. 유속은 0.4 ml/분이고 컬럼 온도는 35℃였다.
다중 반응 모니터링(MRM) 모드의 질량 분석을 다음과 같이 수행하였다: 검출을 양이온 모드에서 Shimadzu TripleQuad 8060으로 수행하였다. 질량 분석법을 체류 시간창이 3분이고 최대 사이클 시간이 258 ms로 설정된 동적 MRM 모드로 작동시켰다. Skyline 4.1 소프트웨어를 사용하여 피크 면적을 결정하였다(Pino LK et al, "The Skyline ecosystem: Informatics for quantitative mass spectrometry proteomics." Mass Spectrom Rev. 2020 May; 39(3): 229-244. 2020).
질량 분석기를 25개의 변형된 뉴클레오시드(표 2)와 4개의 비변형 뉴클레오시드(A, U, G, T)(표 1)를 정밀하게 식별하고 정량화하도록 보정하였다. 사용된 질량 분석 기기는 다중 반응 모니터링 모드의 Shimadzu TripleQuad 8060였다.
각 샘플을 3회 주입하여 세 번의 기술적 중복을 제공하였다. 각 뉴클레오시드에 대해 질량 분석기에 의해 제공된 체류 시간의 균질성을 검증하였다. 6%보다 큰 차이를 나타내는 측정값은 버렸다. 그로부터 모든 샘플에 대한 각 중복물에서 각 뉴클레오시드의 양 측정값을 포함하는 데이터 표를 생성하였다. 이 표를 출원인의 컴퓨터 프로그램을 통해 분석하였다.
모든 생물정보학적 분석을 내부적으로 개발된 Python 프로그램을 사용하여 수행하였다. 이를 위해 발명자들은 표 형식 데이터 관리를 위해 잘 알려진 오픈 소스 모듈인 "Pandas"(Reback et al, Pandas-dev/pandas: Pandas 1.0.3 (Version v1.0.3). Zenodo March 18, 2020)를 사용하였고, 데이터의 탐색적 통계 분석 및 기계 학습을 위해 "사이킷런-학습(scikit-learn)"(Pedregosa et al, Journal of Machine Learning Research, vol. 12, pp. 2825-2830, 2011)을 사용하였으며, 시각화를 위해 "Matplotlib"(JD Hunter, Computing in Science & Engineering, vol. 9, no. 3, pp. 90-95, 2007)를 사용하였다.
프로그램의 필수 특성은 다음과 같다: a) 표 형식(.csv 형식)의 파일에 질량 분석 데이터를 입력으로 수용한다; b) 분광계로부터 유래한 면적 및 체류 시간의 정량화는 최소 10-1의 정확도로 실수(real value) 형태로 제공되어야 한다; c) 위에서 언급한 것 중에서 다중 클래스 지도 기계 학습 알고리즘을 구현한다; d) 학습 단계, 검증 단계 및 예측 모드를 구현한다; e) 종양의 등급을 예측하기 위해 예측 모드로 분류 모델을 사용하여 환자 샘플의 후성전사체 프로파일을 분류한다.
데이터 전처리 및 정규화를 위해, 원시 양에 대한 표를 메모리에 로딩하고 해당 형식을 검증한다. 그런 다음, 각 뉴클레오시드의 평균 양을 계산하고, 각 생물학적 샘플에 대해 한 행의 모든 측정값을 얻기 위해 표를 다시 형식화한다. 질량 분광법은 분자의 절대적인 계산을 생성하지 않고 상대적인 측정을 생성한다. 본 발명자들은 비변형 뉴클레오시드 A, C, G 및 U의 양이 함께 추가되는 새로운 정규화 공식을 제안한다. 이 합계는 참고용이다. 그런 다음 모든 기준 측정값을 이 합계로 나눈다. 따라서, 상대 측정값이 얻어지며 모두 간격 [0, 1] 내에 포함되었다. 예를 들어, 이 데이터 표에서 추출한 값을 표 3, 4 및 5에 정리하였다.
표 3, 4 및 5는 분석된 각 뉴클레오시드에 대해 신경교종의 각 등급 II, III 및 IV와 건강한 조직("정상")에 대한 정규화된 데이터 값을 나타낸다.
특히 신경교종의 경우 등급과 관련하여 후성전사체 프로파일과 관심 있는 임상 변수의 공동 분석을 수행하였다(도 1). 이 절차는 모든 유형의 임상 변수에 적용될 수 있다. 본 실시예에서는 해부병리학적 검사로는 확립하기 어려울 수 있는 암의 등급을 구별하려고 한다.
코호트 프로파일의 전처리 결과 77개 행(샘플당 1개 행)과 29개 열(측정당 1개 열)이 생성되었다. 각 샘플에 대해 종양 등급 범례 또는 건강한 샘플에 대한 "정상" 범례를 추가하였다. 프로파일에 포함된 신호와 등급 정보의 관련성을 평가하기 위해 이 표에 대한 탐색적 통계 분석을 수행하였다.
먼저, 하나의 샘플과 동일한 등급의 샘플에서 각 뉴클레오시드 양의 변화를 조사하고, 이러한 변화를 등급 간 비교하였다. 도 3A, 3B 및 3C에서 상자 수염 플롯 그래프에 나타낸 바와 같이, 실험 결과 뉴클레오시드를 4개 그룹으로 함께 그룹화하는 것이 제안되었다: i) 등급에 따라, 즉 비-종양성 뇌 조직(단순화를 위해 그래프의 y-축에 "정상"으로 표시됨)과 등급 II, III 및 IV, 특히 뉴클레오시드 oxo8G, m1G, 케오신 및 Ac4C 사이에서 그 양이 증가하는 그룹(예를 들어 도 3A에 도시); ii) 등급에 따라 양이 감소하는 것(예를 들어 도 3B에 표시됨) iii) 등급에 따라 약간씩 변하는 것(예를 들어 도 3C에 도시됨) 및 iv) 첫 세 그룹에 속하는 조건을 충족하지 않는 나머지 뉴클레오시드.
언뜻 보기에 이들 그룹 중 어느 것도 해당 성분의 알려진 특정 특성(예를 들어, 뉴클레오시드의 변형된 가장자리)과 연관되어 있지 않다. 그러나, 주로 리보솜 RNA(rRNA)와 소핵 RNA(snRNA)에서 발견되는 2'-O-메틸화(Am, Um, Cm, Gm)는 rRNA의 특정 변형인 m6Am을 포함하는 중앙 클러스터에서 유사하게 거동한다는 점에 유의해야 한다.
이어, 이들 데이터의 주성분 분석(PCA)을 수행하여 "특성", 즉 뉴클레오시드의 선택과 혼동되지 않도록 차원 축소를 수행하여 양적 변동이 소수의 성분에 결합될 수 있는지 확인하였다. 도 4는 PCA의 첫 10개 성분에 대해 설명된 분산 비율을 나타낸다; 분명히 첫 세 성분이 프로파일 변동의 대부분을 함께 그룹화한다. 실제로 첫 세 가지 성분만 함께 그룹화된다는 것이 주목된다: 코호트의 후성전사체 프로파일 분산의 39.2 + 23.3 + 8.6 = 71.1%.
x개의 뉴클레오시드에 대한 측정을 포함하는 각 후성전사체 프로파일은 수학적 용어로 x 차원을 갖는 공간에서 한 점으로 표시된다. PCA는 데이터의 가변성을 포착하면서 데이터의 차원을 줄일 수 있는 다변량 탐색적 분석 방법이다. 성분은 분석할 변수의 수를 줄이면서 변동성을 더 잘 포착하기 위해 초기 관찰 데이터를 결합하는 새로운 변수이다. 성분은 다차원 공간의 다른 축에 초기 데이터를 투영한 결과이다. 성분을 설명된 분산 비율의 내림차순으로 정렬하였다. 각 성분과 연관된 이 백분율은 초기 데이터를 설명하는 데 있어 해당 성분의 중요성을 나타낸다. 도 4는 첫 10개 성분에 대해 설명된 분산 비율의 그래프를 나타낸다. PCA는 표준 데이터 분석 기술이다.
첫 세 성분에 대한 투영된 프로파일의 3차원 시각화가 도 5에 나와 있다. 첫째, 비종양 조직 샘플과 등급 II 샘플이 등급 III 및 등급 IV 샘플과 명확하게 구분된다. 또한 등급 III의 샘플은 등급 IV의 샘플과 상대적으로 분리된 부피를 차지한다. 이러한 탐색적 결과는 지도 기계 학습 알고리즘이 상이한 등급의 샘플 그룹 간의 경계를 학습할 수 있어야 함을 시사한다.
종양의 등급과 건강한 샘플을 정확하게 예측할 수 있는 기계 학습 방법
뉴클레오시드의 양 이외의 어떤 다른 정보도 사용하지 않고 후성전사체 프로파일만을 기반으로 샘플의 등급을 예측할 수 있는지 확인하기 위해 기계 학습 방법을 테스트하였다(도 1). 이를 위해, 프로파일을 두 개의 상이한 하위 집합으로 분할하였다: 첫 번째 것은 기계 학습 모델을 훈련하는 데만 사용하였고(n=60, 즉 78%), 두 번째 것은 모델을 평가하는 데 사용하였다(n=17, 즉 22%).
예측하려는 변수(여기서는 등급)는 범주형 데이터 항목이므로 학습 방법도 분류 범주에 속해야 한다. 서포트 벡터 머신(SVM) 분류 알고리즘은 학습의 표준에 따라 커널 유형을 변경하여 경계 공식을 적용할 수 있는 가능성을 제공하기 위해 주요 유형의 학습 알고리즘 중에서 선택하였다. 테스트 부분 집합의 프로파일에 대해 선형 커널을 제공하는 SVM 알고리즘의 예측 정확도는 최대 1 중 0.90으로 놀라운 수준이다. 예측 정확도 수준은 데이터세트의 새로운 무작위 분할을 통해 학습과 테스트가 반복될 때 유지되었으며 이는 개발된 학습 도구의 견고성을 보여준다.
또한, 평가 결과를 통해 출원인의 정규화 방법(합계의 경우 SUM으로 표시)을 문헌에서 사용된 공식과 비교할 수 있다. 실제로, 기존의 정규화는 변형된 뉴클레오시드, 예를 들어 m1A의 측정값을 해당 비변형 뉴클레오시드의 측정값, 여기서는 A의 측정값으로 나누는 것으로 이루어진 통상적인 정규화이다. 표 6에 다양한 공식 사용에 따른 정확도는 0.8에서 0.9 사이로 이루어져 있으므로 정규화 공식 SUM의 정확도보다 항상 작거나 같다(그러나 결코 크지는 않음).
또한, 등급 예측은 분류 알고리즘의 변경에도 견고하다. SVM 알고리즘 대신 선형 판별 분석 접근 방식에 기반한 알고리즘을 사용할 경우 90%의 리콜(recall)(또는 감도) 및 90%의 F1 점수와 함께 92%의 정확도를 얻을 수 있다. 각 등급에 대한 자세한 예측 결과는 표 7에 나타내었다.
결론적으로, 등급 예측의 품질은 서로 매우 다른 두 가지 학습 방법이 비슷한 결과를 얻기 때문에 주어진 코호트에 대한 학습 방법의 최적화와 특별히 관련이 없다. 따라서 예측 품질은 전사체 프로파일에 포함된 신호 세기와 관련이 있다.
또한, 여기에 그 결과가 보고된 훈련 모델은 모델의 일반화 능력에 불리한 영향을 미칠 수 있는 과도한 훈련의 위험을 피하기 위해 매개변수와 관련하여 의도적으로 최적화되지 않았다.
환자 생존성 상태 예측
코호트 추적 관찰 종료 시점, 즉 2020년에 생존성 상태, 즉 "생존" 또는 "사망" 상태를 나타내는 임상 변수를 예측하는 데도 지도 학습을 통한 동일한 접근 방식을 사용하였다. 여기서 분류는 "생존" 또는 "사망"의 이진법이다. SVM 학습 알고리즘은 80%의 정확도로 예측하며, 이는 해당 코호트의 규모를 고려할 때 타당한 수치이다(표 8).
결론
건강한 샘플이든 종양 샘플이든 샘플에 따라 RNA의 특정 후성유전학적 변형의 상대적인 양에 차이가 있는 것으로 나타났다. 이러한 차이는 특히 상이한 종양 등급을 구분하는 것을 가능하게 한다. 뉴클레오시드 양의 벡터에 지도 기계 학습 알고리즘을 적용하면 신경교종의 등급을 효율적으로 구분할 수 있으며, 특히 상대적으로 제한된 코호트 규모를 고려할 때 놀라울 정도로 정확하게 등급 II와 III을 구분할 수 있다. 또한 이 방법을 사용하면 동일한 데이터를 기반으로 지도 기계 학습 방법을 사용하여 환자의 생존성을 추정할 수 있다.
실시예 2: 대상으로부터의 혈청 샘플에 대한 전사체 데이터 분석
결장직장암으로 진단된 성인 환자 또는 대조군 대상( du Sang [French blood service], n=20)으로부터의 47개의 혈액 샘플(수술 전 화학 요법이나 방사선 요법을 받은 환자는 없음)을 환자 정보 및 동의에 관해 프랑스 생명윤리법을 준수하여 사용하였다. 지역 윤리 위원회(Comit
Figure pct00009
de Recherche Translationnelle[translational research committee](CORT))가 이들 샘플의 사용을 평가하고 승인하였다.
순환하는 RNA를 키트(miRNeasy Serum/Plasma)를 사용하여 혈장으로부터 추출하였다. RNA를 뉴클레아제 P1로 소화시키고 알칼리성 포스파타제로 처리하여 뉴클레오시드 혼합물을 얻었다. 순환하는 유리 뉴클레오시드를 메탄올에 의한 추출 절차를 사용하여 동일한 혈장 샘플로부터 추출하였다. 질량 분석법으로 넘어가기 전에 효소 처리는 필요하지 않았다.
액체 크로마토그래피(LC)와 질량 분석법 및 생물정보학 분석을 실시예 1에 나타낸 바와 같이 수행하였다. 특히, 각 샘플을 독립적으로 3회 분석하였으므로 각각에 대해 3개의 기술적 중복물을 얻는 것이 가능하다. 원시 데이터를 실시예 1에서와 같이 처리하여 정규화하였다. 따라서, 이들 단계는 샘플당 하나의 후성전사체 프로파일을 생성한다. 뉴클레오시드 양 이외의 어떤 다른 정보도 사용하지 않고 오직 후성전사체 프로파일만을 기반으로 종양의 존재 여부를 확인하기 위해 기계 학습 방법을 개발하고 테스트하였다. 실시예 1에서와 같이, "분류" 작업이라고 불리는 이러한 이진법 작업에 선형 커널이 제공된 서포트 벡터 머신(SVM) 분류 알고리즘을 선택하였다. 먼저 알고리즘을 훈련시킨 후 샘플 내 종양의 존재 여부를 예측하는 능력을 평가하기 위해 테스트하였다. 유리 뉴클레오시드의 측정값이 포함된 후성전사체 프로파일을 통해 기계 학습 방법은 100%의 정확도와 100%의 감도로 예측을 제공하였다.

Claims (13)

  1. 개인으로부터 단리된 생물학적 샘플을 기반으로 상기 개인의 종양을 특성화하기 위한 시험관 내 방법으로서,
    a) i) 전체 세포 RNA 및 이의 뉴클레오시드 단편, ii) 세포외 RNA 및 이의 뉴클레오시드 단편 및/또는 iii) 단량체 이화대사산물로부터 유래한 뉴클레오시드를 추출하여 상기 생물학적 샘플로부터 뉴클레오시드를 단리하는 단계,
    b) 단계 a)로부터 유래된 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 크로마토그래피에 의해 단리하고 결정하는 단계, 및
    c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양에 특징적인 것인 단계를 포함하는 방법.
  2. 제1항에 있어서, 상기 생물학적 샘플은 생검 또는 액체 생물학적 샘플이고, 상기 액체 생물학적 샘플은 혈액, 혈청, 혈장 및 소변으로부터 선택되는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 뉴클레오시드는 다음으로부터 선택되는 방법:
    - 비변형 뉴클레오시드: 아데노신(A), 사이티딘(C), 구아노신(G), 우리딘(U), 및
    - 변형 뉴클레오시드: 2'-O-메틸아데노신(Am), 1-메틸아데노신(m1A), N6,N6-디메틸아데노신(m66A), N6,N6,2'-O-트리메틸아데노신(m66Am), N6-메틸아데노신(m6A), N6,2'-O-디메틸아데노신(m6Am), N4-아세틸사이티딘(ac4C), 2'-O-메틸사이티딘(Cm), 5-하이드록시메틸사이티딘(hm5C), 3-메틸사이티딘(m3C), 5-메틸사이티딘(m5C), 2'-O-메틸구아노신(Gm), 1-메틸구아노신(m1G), N2,N2,7-트리메틸구아노신(m227G), N2,7-디메틸구아노신(m27G), 7-메틸구아노신(m7G), 8-하이드록시구아노신(oxo8G), 이노신(I), 슈도우리딘(Psi), 케오신(Q), 3,2'-O-디메틸우리딘(m3Um), 5-메톡시카보닐메틸-2-티오우리딘(mcm5s2U), 5-메톡시카보닐메틸우리딘(mcm5U), 5-카바모일메틸우리딘(ncm5U), 2'-O-메틸우리딘(Um).
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 종양은 신경교 종양(glial tumour)이고, 단계 c) 동안 확립된 프로파일에 기초하여 사전 훈련된 제1 분류 모델에 의해 상기 신경교 종양의 등급을 예측하는 단계를 포함하는 것을 특징으로 하는 방법.
  5. 제4항에 있어서, 상기 제1 분류 모델은 훈련 데이터세트로 사전 훈련된 다음을 포함하는 것을 특징으로 하는 방법:
    - 기계 학습 알고리즘,
    - 지도 학습 신경망, 또는
    - 다중 클래스 확률적 분류 알고리즘.
  6. 제4항 또는 제5항에 있어서, 상기 신경교 종양의 등급을 예측하는 것은 등급 II 신경교 종양을 예측하는 것, 등급 III 신경교 종양을 예측하는 것 및 등급 IV 신경교 종양을 예측하는 것으로부터 선택되는 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 단계 c) 동안 확립된 프로파일에 기초하여 사전 훈련된 제2 분류 모델에 의해 상기 개인의 생존성 상태를 예측하는 단계를 포함하는 것을 특징으로 하는 방법.
  8. 제7항에 있어서, 상기 제2 분류 모델은 훈련 데이터세트로 사전 훈련된 다음을 포함하는 것을 특징으로 하는 방법:
    - 기계 학습 알고리즘,
    - 지도 학습 신경망, 또는
    - 확률적 분류 알고리즘.
  9. 개인으로부터 단리된 생물학적 샘플을 기반으로 상기 개인에게서 종양의 존재를 검출하기 위한 시험관 내 방법으로서,
    a) i) 전체 세포 RNA 및 이의 뉴클레오시드 단편, ii) 세포외 RNA 및 이의 뉴클레오시드 단편 및/또는 iii) 단량체 이화대사산물로부터 유래한 뉴클레오시드를 추출하여 상기 생물학적 샘플로부터 뉴클레오시드를 단리하는 단계,
    b) 단계 a)로부터 유래된 적어도 3개, 바람직하게는 적어도 5개, 바람직하게는 적어도 10개, 바람직하게는 적어도 20개의 상이한 뉴클레오시드의 각각의 양을 크로마토그래피에 의해 단리하고 결정하는 단계, 및
    c) 상기 생물학적 샘플에 대해, 단계 b) 동안 얻은 각 뉴클레오시드의 각각의 양에 기초하여 뉴클레오시드 프로파일을 확립하는 단계로서, 상기 프로파일은 상기 종양의 존재에 특징적인 것인 단계를 포함하는 방법.
  10. 제4항 내지 제8항 중 어느 한 항에 따른 방법에서, 단계 c) 동안 확립된 프로파일을 기반으로 다음을 예측하기 위해 훈련 데이터세트에 대해 사전 훈련된 분류 모델:
    - 종양의 등급, 및/또는
    - 개인의 생존성 상태.
  11. 종양의 등급을 예측하고/하거나 개인의 생존성 상태를 예측하기 위한, 제9항에 따른 분류 모델의 용도.
  12. 종양을 검출하기 위한 제1항 내지 제3항 중 어느 한 항에 따른 방법의 용도.
  13. 제12항에 있어서, 결장직장 종양을 검출하기 위한 용도.
KR1020247006194A 2021-07-29 2022-07-21 종양을 특성화하기 위한 방법 KR20240035609A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR2108279A FR3125882A1 (fr) 2021-07-29 2021-07-29 Procede de caracterisation d’une tumeur
FRFR2108279 2021-07-29
PCT/EP2022/070551 WO2023006588A1 (fr) 2021-07-29 2022-07-21 Procede de caracterisation d'une tumeur

Publications (1)

Publication Number Publication Date
KR20240035609A true KR20240035609A (ko) 2024-03-15

Family

ID=80446963

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247006194A KR20240035609A (ko) 2021-07-29 2022-07-21 종양을 특성화하기 위한 방법

Country Status (7)

Country Link
EP (1) EP4377699A1 (ko)
KR (1) KR20240035609A (ko)
CN (1) CN118019981A (ko)
AU (1) AU2022320853A1 (ko)
CA (1) CA3226423A1 (ko)
FR (1) FR3125882A1 (ko)
WO (1) WO2023006588A1 (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007008647A2 (en) 2005-07-07 2007-01-18 Vanderbilt University Diagnosing and grading gliomas using a proteomics approach
PL214886B1 (pl) * 2008-10-03 2013-09-30 Akad Medyczna Sposób diagnozowania choroby nowotworowej układu moczowo-płciowego
PL409275A1 (pl) * 2014-08-26 2016-02-29 Gdański Uniwersytet Medyczny Sposób wykrywania nowotworów układu moczowo-płciowego, zastosowanie oraz zestaw do wykrywania choroby nowotworowej układu moczowo-płciowego

Also Published As

Publication number Publication date
WO2023006588A1 (fr) 2023-02-02
AU2022320853A1 (en) 2024-02-08
EP4377699A1 (fr) 2024-06-05
CA3226423A1 (fr) 2023-02-02
FR3125882A1 (fr) 2023-02-03
CN118019981A (zh) 2024-05-10

Similar Documents

Publication Publication Date Title
JP2021103177A (ja) 自閉症スペクトラム障害のリスクを決定するための方法およびシステム
CN113450873B (zh) 一种预测胃癌预后和免疫治疗适用性的标志物及其应用
Li et al. Radiomic features predict Ki-67 expression level and survival in lower grade gliomas
CN111128299B (zh) 一种结直肠癌预后显著相关ceRNA调控网络的构建方法
CN103415624A (zh) 胰腺癌生物标记及其用途
KR20150070308A (ko) 선택된 시점에서의 임신 확률을 결정하기 위한 시스템 및 방법
US20230126920A1 (en) Method and device for classification of urine sediment genomic dna, and use of urine sediment genomic dna
Cabús et al. Current challenges and best practices for cell-free long RNA biomarker discovery
CN115678994A (zh) 一种生物标志物组合、含其的试剂及其应用
CN115410713A (zh) 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建
Orzan et al. A simplified integrated molecular and immunohistochemistry-based algorithm allows high accuracy prediction of glioblastoma transcriptional subtypes
CN116024338A (zh) 生物标志物组合及其在预测药物治疗胃癌效果中的应用
CN111402955A (zh) 一种生物信息测定方法、系统、存储介质、终端
US20220042106A1 (en) Systems and methods of using cell-free nucleic acids to tailor cancer treatment
JP2016537031A (ja) イヌの泌尿生殖器悪性腫瘍を診断する為の染色体評価
EP4206330A1 (en) Identification system and kit for detection of circulating biomarkers of cancer
Jørgensen et al. Untangling the intracellular signalling network in cancer—A strategy for data integration in acute myeloid leukaemia
KR20240035609A (ko) 종양을 특성화하기 위한 방법
EP4131274A1 (en) Method for characterization of cancer
Campbell et al. Applying gene expression microarrays to pulmonary disease
Zhai et al. Five-gene signature predicts acute kidney injury in early kidney transplant patients
Ragazzi et al. Multivariate analysis approach to the plasma protein profile of patients with advanced colorectal cancer
CN115472294B (zh) 预测小细胞转化肺腺癌患者转化速度的模型及其构建方法
WO2018077225A1 (en) The primary site of metastatic cancer identification method and system thereof
Yan et al. Deep neural network based tissue deconvolution of circulating tumor cell RNA