KR20240053637A

KR20240053637A - 개선된 암 진단 및 치료법 선택을 위한 차세대 시퀀싱 및 인공 지능-기반 접근법

Info

Publication number: KR20240053637A
Application number: KR1020247011239A
Authority: KR
Inventors: 엠마누엘 슈미드-시거트; 로메인 그룩스; 티에리 슈에프바흐; 보니 첸; 이오아니스 제나리오스; 알라딘 불락 아팻; 후안 티안; 싱샤 우
Original assignee: 제이에스알 라이프 사이언시스, 엘엘씨
Priority date: 2021-09-08
Filing date: 2022-09-08
Publication date: 2024-04-24
Also published as: AU2022342002A1; CA3229981A1; WO2023039058A2; WO2023039058A3

Abstract

무증상 대상체 또는 암을 앓고 있는 대상체에서 암 상태의 진행을 식별하고 예측하는 방법; 및 이와 관련된 조성물 및 키트가 본 명세서에서 제공된다.

Description

개선된 암 진단 및 치료법 선택을 위한 차세대 시퀀싱 및 인공 지능-기반 접근법

관련 출원

본 출원은 2021년 9월 8일자로 출원된 미국 가출원 제63/241813호의 이익을 주장한다. 상기 출원의 전체 교시내용은 본 명세서에 참조에 의해 원용된다.

대부분의 국가에서, 인구 구조 변화와 노령화로 인해, 매년 암 진단 빈도가 증가하고 있다. 2015년, 스위스에서는 암 진단 사례가 연간 40,000건 이상으로 증가하였으며, 5년 생존율은 전체의 60% 미만이었다(Swiss Federal Statistics Office, 2019). 유방암과 전립선암은 가장 많이 진단되는 암 중 하나이며, 췌장암은 10가지 가장 빈번한 암 유형 중에서 생존율이 가장 낮고, 5년 생존율이 대략 10%인 것으로 나타난다. 연구 노력에도 불구하고, 현재의 병리학적 조직학 및 분자 분석을 사용하여 이용 가능한 치료법에 대한 진화, 중증도, 및 반응은 평가하기가 여전히 어렵다. 따라서, 병리학적 반응의 부족은 대부분의 요법에서 전형적으로 약 50%로 유지되어, 환자에 대한 예후와 삶의 질이 저하되고, 동시에 비용이 증가하게 된다.

췌장암의 경우, 무증상 초기 종양의 수술적 절제를 제외하고는, 질환은 여전히 대부분 치료가 불가능한 것으로 간주된다. 췌장암은 수술의 효능이 단지 제한적이고, 효율적이고 구체적인 약리학적 치료가 여전히 부족한 후기 전이 단계에서 가장 흔히 진단된다. 결과적으로, 비-특이적 및 비-치료적 화학요법 및 방사선요법이 기대 수명을 증가시키는 데 종종 사용되며, 이는 환자의 삶의 질에 심각한 결과를 가져온다. 췌장 도관 선암종(PDCA)과 같은 췌장암의 공격적인 형태는 주변 조직으로 확산 및/또는 전이를 형성한 후 더 이상 절제할 수 없는 말기 단계에 가장 빈번하게 진단된다. PDCA의 초기 단계는 대부분 증상이 없고 현재 혈청-기반 분석법은 무통성 췌장염과 점액성 췌장 선암종을 구별할 수 없다(Carmicheal et al., 2019). KRAS와 EGFR의 돌연변이 또는 상향 조절과 같은 돌연변이 부하에 대한 현재 분석은 이들이 많은 암에 대해 공통적이기 때문에 췌장암 유형을 진단하고 적절하게 분류하기에 충분하지 않다. 현재, 일상적으로 사용될 수 있는 효율적이고 민감하며 비-침습적인 무증상 진단 접근법은 없다. 말기 단계의 PDCA는, 재발로 인해 수술이 종종 장기적으로 비효율적인 것으로 판명되고, 특정 치료법이 부족하기 때문에 치료하기가 어려운 것으로 악명이 높다. 화학요법 및/또는 방사선요법은 종종 보조 요법의 완화 치료로 사용되지만, 대부분의 경우에 치료 효과가 없을 것이다. 따라서, 수술적 절제에 의해 치료 가능하면서, 더 효율적이고 특이적인 요법을 개발하고 적용하기 위해, 암, 예를 들어 췌장암을 초기 단계에서 검출하기 위한 비-침습적이고 민감하며 저렴한 진단 방법에 대한 명확하고 충족되지 않은 요구가 존재한다(Carmicheal et al., 2019). 유사하게, 유방암 및 전립선암은 진행 및 약물 반응의 측면에서 적절하게 진단하기 어려운 종양의 다른 예이다(Davidson et al., 2019; Ponde et al., 2019).

하기 단계를 포함하는, 무증상 대상체가 암 상태로 진행될 가능성을 예측하는 방법이 본 명세서에서 제공된다:

(a) 상기 대상체로부터의 샘플에서 상기 대상체의 게놈의 적어도 일부를 시퀀싱하는 단계 및

(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체(neotranscript)를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 암 발병 위험의 증가를 나타내는, 상기 식별하는 단계.

특정 양태에서, 하기 단계를 포함하는, 개별화 암 요법을 위해 무증상 대상체를 식별하는 방법이 본 명세서에서 제공된다:

(a) 상기 대상체로부터의 샘플에서 상기 대상체의 게놈의 적어도 일부를 시퀀싱하는 단계,

(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 대상체를 개별화 암 요법을 위한 후보자로서 식별하는, 상기 식별하는 단계 및

(c) 상기 요법을 개시하고/하거나 대상체에 대한 요법의 투여를 모니터링하는 단계.

본 명세서에서 제공된 바와 같은 본 발명의 양태는, 하기 단계를 포함하는, 암을 앓고 있는 대상체에서 종양 반응 또는 내성을 예측하는 방법을 포함한다:

(a) 상기 대상체의 샘플에서 하나 이상의 세포의 게놈의 적어도 일부를 시퀀싱하는 단계;

(b) 상기 샘플에서 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 내성 암 위험의 증가를 나타내는, 상기 식별하는 단계.

특정 양태에서, 하기 단계를 포함하는, 암을 앓고 있는 대상체에서 전이 가능성을 예측하는 방법이 본 명세서에서 제공된다:

(b) 상기 샘플에서 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 전이 위험의 증가를 나타내는, 상기 식별하는 단계.

또한, 대상체 유래의 샘플에서 표 1에 제시된 유전자 중 적어도 하나를 포함하거나 이로부터 전사되는 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체를 검출하기 위한 생물검정을 수행하는 단계, 생물검정의 결과를 컴퓨터 시스템으로 수신하는 단계, 결과를 처리하여 출력을 결정하는 단계, 판독 가능한 매체에 출력을 제시하는 단계를 포함하는 방법이 본 명세서에서 제공되되, 상기 출력은 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 존재 또는 부재에 기반하여 대상체에게 권장되는 치료 옵션을 식별하고, 샘플은 액체 또는 조직 생검이다.

본 발명의 일부 양태에서, 대상체 유래의 샘플에서 적어도 하나의 유전자 융합체 또는 비-유전자 융합체의 검출을 가능하게 하는 적어도 하나의 시약을 포함하는 암 진단 키트가 본 명세서에서 제공되되, 상기 융합체는 표 1에 제시된 유전자 중 적어도 하나를 포함하거나 이로부터 전사된다.

특정 양태에서, (a) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 접합부에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 검출 프로브; (b) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제1 표지된 프로브 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제2 표지된 프로브; (c) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 서열을 포함하는 제1 증폭 올리고뉴클레오타이드, 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 서열을 포함하는 제2 증폭 올리고뉴클레오타이드; (d) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열에 의해 인코딩되는 아미노산 서열에 특이적으로 결합하는 항체 및 (e) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 검출하기 위한 동일계내 혼성화 프로브(in situ hybridization probe) 중 적어도 하나를 포함하는 조성물이 본 명세서에서 제공된다.

도 1은 췌장암 환자에 대한 결과를 나타낸다. 환자 결과의 3가지 부문이 수 년에 걸쳐 확립되었다. 환자의 약 10 내지 20%를 차지하는 절제 가능한 부문에 절제를 수행하거나 절제 전 선행보조 치료(Neoadjuvant treatment: Neoadj. Tx)를 수행하였다. 절제 후 보조 치료(Adjuvant treatment: Adj Tx)를 적용하였을 때(환자의 76 내지 92%가 이 경로를 따름), 생존은 20.1 내지 23.6개월의 범위인 한편, 보조 치료를 받지 않은 환자에 대해서는 16.9 내지 20.2개월의 생존이 관찰되었다. 절제 전 선행보조 치료는 절제 가능 그룹 내 환자의 생존을 향상시켜(환자의 73.6%가 해당 경로를 따름), 평균 23.3개월의 생존을 야기한다. 환자의 30 내지 40%에 관한 제2 부문은 선행보조 치료 후 절제로 이루어지며, 사례의 33.2%에 대해서는 20.5개월 생존을 가능하게 하는 반면, 비-절제된 환자는 10.2개월의 기대 수명을 갖는다. 선행보조 치료 대신에 완화 치료가 제공된 경우, 평균 생존이 6 내지 11개월의 범위이다. 마지막으로 전이성 췌장암은 평균 생존이 5 내지 9개월인 완화 치료를 받은 환자의 50 내지 60%를 차지한다.
도 2는 신규 융합체의 검출 및 특성화를 가능하게 하는 발견 엔진 파이프라인을 나타낸다. 다양한 시퀀싱 기술에 대해 유래된 RNA 및 DNA 시퀀싱 데이터를 사용 가능한 증거 기반 융합체로 변환하기 위해 여러 소프트웨어에 의해 파이프라인을 조립하였다. 단계 1은 수득한 원시 시퀀스의 평가, 품질 관리 및 필터링으로 이루어졌다. 이어서, 판독 원점(마우스/인간 또는 알려지지 않음)을 단계 2에서 수행한 다음, 단계 2a로 분기하였으며, 이는 인간 게놈 참조 카탈로그(예를 들어, Refseq)에서 각각의 서열을 인덱싱하는 것으로 이루어진 맵핑 전략이었다. 2개의 게놈 위치를 연결하는 것으로 밝혀진 서열을 검출하고 알려진 융합체(즉, 과학 문헌 또는 진단 실무에서 이미 확립됨) 또는 이전에 알려지지 않은 경우 신규 융합체 기준으로 분류하였다. 알려졌거나 신규 융합체로 인식되지 않은 게놈 또는 RNA 서열의 경우, 신규 유전자 및/또는 비-유전자 융합 서열을 검출할 수 있도록 이들 서열을 조립하기 위한 다음 단계를 수행하였다. 단계 2b는 모든 융합체에 대한 포괄적인 평가를 가능하게 하는 새로운 조립-기반 접근법으로 이루어졌다. 이는 길고 짧은 시퀀싱 판독물 둘 다에서 수행되었으며, 샘플에 존재하는 다양한 유기체(마우스 및 인간) 사이의 융합체를 분류하는 데 사용되었다. RNA 서열을 이용하여 수행할 경우, 신규 신전사체 융합체를 발견하기 위한 기초의 역할을 하는 범-전사체 데이터베이스가 구축되었다.
도 3은 신전사체 및 게놈 융합체의 채점 및 우선순위 지정, 및 분류 특징 영향을 나타낸다. 융합체 식별에서 유래된 특징에 대한 기계 학습 접근법을 사용하여, 각각의 후보 융합체에 대한 발생 가능성을 정렬하고 평가할 수 있는 우선순위 지정 체계를 식별하였다. 방법의 성능은 하모닉 F1 스코어로 평가 시 94%로 결정되었으며, 이는 우수한 성능을 나타낸다. 각각의 융합을 사정하고 평가하는 데 사용된 측정값은 알려진 융합체/전사체에 대해 기준점이 되거나, 인실리코 원시 서열 데이터세트에서 스파이킹되거나, 실험적으로 다양한 농도로 RNA/DNA 준비에 도입되었다. 사용된 특징은 2개의 파트너 사이의 유전자 거리, 융합 점수(시퀀싱 판독의 여러 내부 측정기준에서 파생됨), 오픈 리딩 프레임(ORF) 길이(존재하는 경우), 융합체의 길이, 융합 지점을 지지하는 분할 쌍(Split Pair) 및 분할 판독물(Split Read)의 식별, 기원 또는 시작 부위(발생 시, 임의의 코딩 유전자 산물의 경우), 커버리지(샘플에서 융합 빈도 추정을 나타냄), 접합부의 품질을 설명하는 Orf의 접합부 측정값, 전사체당 발현 수준, 및 융합 신뢰도(파생된 신뢰도 측정기준임)이었다. 모든 특징을 높음부터 낮음까지 점수를 매기므로, 따라서 평가 선택이 각각의 융합체에 자동적으로 적용될 수 있다. 예측 점수 값에 긍정적 또는 부정적 영향을 미치는 특징 유형이 식별된 신전사체/게놈 융합체에 대해 설명된다.
도 4는 신규 게놈/전사체 융합체를 발견하기 위한 독특한 시퀀싱 기술의 사용을 나타낸다. 다양한 시퀀싱 기술은 뚜렷한 장점 및 단점을 갖는다. 이는 PDX 췌장암으로부터 얻은 단일 또는 결합 시퀀싱 데이터세트를 사용하여 문서화되었다. 표시된 데이터베이스로부터 수득한 신전사체/융합체는 각각의 열로 표시되고, 식별된 후보 융합체의 수는 y-축에 있다. 선택된 433개의 검증된 융합체는 마지막 2개의 열로 나타낸 후보 융합체의 합으로 이루어진다.
도 5는 알려진 게놈 변경을 사용하여 PDX 췌장암 융합 서열 데이터세트의 검증을 나타낸다. X 축 상에 표시된 돌연변이는 Y 축 상에 나타낸 136개의 췌장암 PDX 모델로부터 수득한 데이터세트를 사용하여 EGFR(좌측 패널) 및 KRAS(우측 패널) 코딩 서열에서 분석되었다. 췌장암의 전형적인 KRAS 돌연변이를 함유하는 종양 샘플의 큰 부분이 박스로 표시되어 있다.
도 6은 췌장암 샘플 중 후보 게놈 융합 및 발생의 히트맵을 나타낸다. 136개의 PDX 췌장암 샘플에서 신전사체/융합체 발생의 클러스터링이 민족성(아시아인/서양인), 하위유형(선암종, 선평편상피암종, 점액성 선암종, 신경내분비 선암종 로시스(rosis), 및 불명확), 생검 부위(횡경막, 간, 림프절, 대망(omentum), 췌장, 복수천자, 늑막, 위 및 불명) 및 병리학 등급(중등도, 중등도 내지 불량, 불량, 불명확, 양호) 범위에 걸쳐, 여러 분류와 관련하여 상부 행에 표시되어 있다. 우측 히스토그램은 특정 신전사체/융합체를 보유하는 PDX 췌장암의 수를 나타낸다. 분류는 매우 빈번하거나 드문(1 내지 2개의 PDX 췌장 모델에서만 관찰됨) 융합체에 기반한다.
도 7은 다른 암 유형과 공유되는 췌장암 신전사체/융합체의 일부를 나타낸다. PDX 암 샘플에서 식별된 433개의 신전사체/융합체의 발생 가능성을 췌장암 보델에서의 발생과 비교하여 다양한 PDX 암 샘플에서 평가하였다. 각각의 췌장암 신전사체/융합체는 선으로 표시되는 반면, 평가된 암 유형은 열로 표시되어 있다(MK=메르켈 암종 , AM=급성 골수성 백혈병, MC=전이성 암종, XX=알 수 없음, PR=전립선, AD= 부신암, MU= 뮬러리안(Mullerian), UT=자궁, KI=신장, GL=담낭, CV=자궁경부, BL=방광, OV=난소, BR=유방, HN=두경부, ES=식도, LU=폐, Li=간, CC=결장, GA=위장, CR=결장직장, PA= 췌장, Al=급성 림프구성, LY=림프종 , SA=육종, ME=흑색종, BN=뇌). 융합체를 함유하는 샘플의 일부(0 내지 100%)는 밝은 회색(암 유형의 100%에서 발생, 예를 들어 상단 선) 내지 검정색(암 유형의 1% 이하에서 발생, 예를 들어 하단 선)으로 표시되어 있다. 대략 47개의 신전사체/융합체는 폐암에도 존재하는 것을 제외하고, 췌장암에서만 배타적으로 발생하는 것으로 밝혀졌다.
도 8은 췌장암 세포 성장 및 배가율의 히트맵 및 분류를 나타낸다. 배가 성장률, 즉 이식된 암 조직의 부피를 두 배로 늘리는 데 필요한 시간을 5 내지 30일 범위의 배가 시간을 표시한 48개 샘플로 이루어진 PDX 모델의 하위집합에 대해 측정하였다. 빠른 성장자의 경우 임의의 10일 미만의 임계값, 그리고 느린 성장자의 경우 10일 초과 임계값을 고려하여, 신전사체/융합체 함량에 대한 배가 성장률의 비교를 평가하였다. 이는 공격적이고 빠른 성장자로 예측되는 결정되지 않은 샘플 중 일부의 분류를 가능하게 하였다(이중 점선).
도 9는 PDX PDAC(1) 및 GTEX 췌장 환자(2+3)에서 가장 차등적으로 조절되는 400개의 유전자의 PCA를 나타낸다. 흰색(3)으로 강조된 부분은 PDAC에 대한 후보 융합체로부터 유전자 융합체를 보유한 GTEX 환자의 하위집합이다.
도 10은 상이한 코호트에서 각각의 샘플에 대해 발견된 총 발현 유전자의 수(>= 1 TPM)를 나타낸다.
도 11은 췌장 샘플에서 융합 사건의 수를 나타낸다. 도 11a는 상이한 코호트에서 각각의 샘플에 대해 발견된 총 유전자-융합 사건의 수를 나타내고, 도 11b는 샘플당 높은 신뢰도의 사건 수를 나타낸다. 높은 신뢰도는 다중 판독 지원, 정확성 및 추가적인 증거로 정의된다.

환자-유래 이종이식(patient-derived xenograft; PDX) 모델이라고 불리는 면역력이 약화된 마우스에 이종이식에 의해 전파된 인간 종양에 대한 대규모 게놈 연구는 정밀 의학의 약물 반응 예측과 여러 암 환자에 대한 번역 측면에서 유망한 결과를 나타내었다. 그러한 모델은 또한 저항성 메커니즘을 확립하는 데에도 유용한 것으로 입증되어, 따라서 세포주 모델보다 더 많은 정보를 제공하는 것으로 입증되었다(Gao et al., 2015). 그러나, 복제 수 변이 및 큰 염색체 변경과 같은 잠재적으로 관련이 있는 일부 마커는 그러한 연구에서 포착되지 않았다. 이는 유방암이나 췌장 도관 선암종(PDAC)에서는 발견되지 않는 p53 조절인자 MDM4 또는 포스포글리세레이트 탈수소효소(PHGDH) 유전자의 증폭으로 예시된다. 이는 제한된 PDX 샘플 수, 충분한 차세대 시퀀싱(NGS) 깊이 부족, 및/또는 불충분한 데이터 채굴(mining) 및 분석으로 인한 것일 수 있다(Gao et al., 2015; Kim et al., 2019).

진전에도 불구하고, 빈번하거나 특히 치명적인 암(예를 들어, 전립선암과 유방 종양, 예컨대, 췌장암)에 대한 효율적인 진단 도구는 종종 최선의 치료 접근법을 예측하지 못하며, 요법은 이환된 환자 중 일부에 대하여 여전히 비효율적이다. 지금까지 시험관 내 진단 및 치료 접근법의 개발은 신뢰할 수 있는 임상 데이터베이스와 연관된 대규모 종양 샘플 집합이 부족하고, 대규모 데이터 세트를 처리할 수 있는 포괄적인 분자 데이터 세트 및 분석 도구의 필요성으로 인해 제한된다. 따라서, 초기 무증상 진단뿐만 아니라, 종양학에서 효율적이고 구체적인 치료 접근법을 가능하게 하는 데이터세트와 접근법 측면에서 충족되지 않은 요구가 분명히 존재한다.

암 환자-유래 이종이식(PDX) 종양 샘플의 가장 큰 집합 중 하나의 게놈과 전사체를 뮤린 모델에 이식 및 전파한 후 분석한 것이 본 명세서에 개시되어 있다. 환자 임상 데이터 및 종양 특성과 관련하여 DNA 및 RNA 차세대 시퀀싱(NGS) 데이터세트를 수집하고 채굴하였다. 암 진행과 연관된 게놈 및 전사체 변경은 인공 지능(AI) 기반 모델을 사용하여 식별되고 특성화되었다. 효율적인 진단과 치료가 부족하거나(예를 들어, 췌장암) 또는 정확한 진단과 예후를 아는 것이 여전히 어려운(예를 들어, 유방암 및 전립선암) 빈번한 암에 초점을 맞춰, NGS 데이터를 채굴하고 종양 유형 및 환자 임상 데이터뿐만 아니라, 치료법에 대한 종양 병리학적 반응과 상관 관계를 보였다. 인공 지능-기반 모델에 의해 분석될 때 다양한 종양 유형을 설명할 수 있는 특정 세트의 게놈 및 전사체 변경이 식별되어, 별개의 암을 서로 구별할 수 있을 뿐만 아니라, 동족의 건강한 조직과 구별할 수 있다. 또한, 임상 혈액 샘플 또는 종양 생검으로부터 분석될 수 있는 바와 같이, 이들 마커의 하위집합은 식별되어 주어진 종양 유형의 공격성을 예측할 수 있다. 따라서, 그러한 암 마커의 식별에 의해 가능해진 첫 번째 결과는 환자로부터 수득한 임상 샘플을 사용하여 종양 발생에 대한 더 민감하고 구체적인 조기 진단이다. 그러한 포괄적인 NGS 및 AI-기반 시험관 내 진단(IVD) 접근법을 사용하여 수술적 개입이 적합한지 여부를 평가하고 이용 가능한 치료법에 대한 종양 반응 또는 내성을 예측하는 데 필요할 수 있으므로, 종양 진화의 개선된 예후도 또한 달성될 수 있다.

추가적으로, 암 발생, 종양 공격성, 및 이용 가능한 치료법에 대한 반응 또는 내성의 진단을 제공하기 위해 적용될 수 있는 도구를 구성하는 특정 세트의 게놈 및 전사체 마커와 신규한 AI 기반 알고리즘이 본 명세서에서 제공된다. 그러한 도구는 암의 조기 무증상 진단을 가능하게 하여, 다양한 암 유형을 더 잘 구별할 수 있게 하고, 암의 진화에 대해 더 정확하게 예후를 알 수 있게 한다. 그러한 미커는 또한 이용 가능한 치료법에 대한 환자 반응의 보다 신뢰할 수 있는 예측을 제공하고, 이에 의해 각각의 환자에 대하여 가장 적절한 요법의 선택을 가능하게 한다. 이용 가능한 치료법은 분석된 각각의 PDX 샘플의 임상 주석(annotation)에 의해 부분적으로 포함된다. 전반적으로, 본 명세서에 개시된 도구 및 방법의 결과는 종양학 분야에서 시험관 내 진단(IVD), 정밀 의학, 및 개별화 요법을 위한 개선된 전략을 제공하는 것이다.

따라서, 하기 단계를 포함하는, 무증상 대상체가 암 상태로 진행될 가능성을 예측하는 방법이 본 명세서에서 제공된다:

(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 암 발병 위험의 증가를 나타내는, 상기 식별하는 단계.

융합체

일반적으로 융합체는 염색체간 및 염색체내 재배열(예를 들어, 전좌, 결실, 역위, 복제 등)을 통해 생성되고 코딩 및 비-코딩 서열의 복수의 조합을 생성할 수 있다. 본 명세서에 개시된 DNA 또는 RNA 서열 융합체는 암 세포에서는 함께 융합되지만 정상적인 참조 세포의 세트에서는 분리되어 있는 DNA 또는 RNA 서열로 이루어진다. 그러한 융합체는 코딩, 예를 들어 단백질-코딩 서열을 포함하는 경우 유전자 융합체로 추가로 분류될 수 있는 반면, 비-유전자 융합체는 비-코딩 서열, 예를 들어 아미노산을 코딩하지 않는 DNA 서열을 포함하며, 비-제한적인 예로서 염색체의 유전자 외부 및/또는 사이에 존재하는 DNA; 인트론; 및 유전자 발현의 조절에서 역할을 하는 DNA 요소를 포함할 수 있다. 일부 유전자 융합체는 코딩 잠재력을 가지며 암 발생 또는 진행과 연관될 수 있는 새롭거나 변경된 기능을 갖는 프레임 내(in-frame) 단백질 코딩 서열 또는 비-코딩 조절 RNA를 생산할 수 있다. 예를 들어, 임의의 특정 이론 또는 방법론에 의해 구속받고자 하지 않지만, 그러한 융합체는 암-연관 유전자 또는 유전자 산물을 조절하는 단백질 및/또는 조절 RNA를 생산할 수 있다. 그러한 융합체가 염색체 내(예를 들어, 복제/증폭, 삽입, 결실, 역위 등과 같은 당업계에 알려진 바와 같이 염색체 내부에서 발생하는 재배열로부터 발생하는 융합체) 또는 염색체간(예를 들어, 전좌와 같은 2개 이상 염색체 사이에서 발생하는 재배열 또는 삽입-전좌, 복제수 변이와 연관된 역위, 2개 초과의 염색체에 영향을 미치는 전좌, 및 이들의 조합과 같은 복잡한 염색체 재배열을 포함하지만 이에 제한되지 않는, 당업계에 알려진 바와 같은 더 복잡한 구조적 게놈 변이로부터 발생하는 융합체)에 이루어진 것일 수 있다는 것이 당업자에 의해 이해될 것이다. 따라서, 일부 실시형태에서, 본 명세서에 개시된 융합체는 하나 이상의 염색체간 융합체, 하나 이상의 염색체내 융합체, 또는 임의의 이들의 조합을 포함할 수 있다. 일부 그러한 실시형태에서, 본 명세서에서 고려되고 개시된 융합체는 코딩 및/또는 비-코딩 DNA 서열을 포함할 수 있다.

알려진 융합체라고 불리는 일부 융합체는 이전에 특정 암 세포에서 발생하는 것으로 관찰된 반면(Tembe et al., 2014 or Haas et al., 2019), 본 명세서에서 식별된 알려지지 않은 융합체 또는 신규 융합체는 이전에 본 발명자들의 지식에 보고되지 않았다. 세포에서 전사될 때, 신규 융합체를 구성하는 유전자 융합체는 신전사체 융합체로 식별되거나 검출될 수 있다.

후보 융합체는 융합 지점 및 유전자 융합 파트너(코딩 유전자인 경우)와 같은 계산적으로 포착되거나, 인코딩 조절 RNA(예를 들어, lnRNA)와 같은 별개의 특징을 보유하는 경우 다른 주석에 의해 여러 특징을 갖는다. 알려지지 않은 융합체가 신뢰할 수 있고 유사한 유형의 암에서 빈번하게 발생하는지 여부를 평가하기 위해, 예측된 융합체의 예측된 정확도를 평가하는 점수가 개발되었다.

예시적인 융합체는 NGSAI-NEOTX-1 내지 NGSAI-NEOTX-69 형태의 NGSAI-ID 식별자로 본 명세서에 개시되어 있다. (표 1 참조)

NGSAI-NEOTX-ID 융합체는 융합 지점 주위의 서열, 존재하는 경우 융합 파트너(예를 들어, 유전자 명칭), 및 융합의 예측된 정확도를 설명하는 점수에 의해 특성화될 수 있다.

상기 융합체의 추가적인 파생 특징은 다음과 같다:

종양에서 후성적 변화의 마커로서 발현 추정치;

염색체 좌표 참조 게놈을 사용하여, 단일 또는 다중 유전자좌의 위치;

코딩 능력;

엑손 능력(및 스플라이싱 사건);

막관통 함유 도메인;

다른 단백질 도메인 검출;

비-코딩 RNA(예를 들어, lnc-, mi-, sno- 또는 piRNA)로서의 발현

본 발명의 일부 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 단일 유전자/비-유전자의 융합체이다. 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 다중 염색체 유전자좌의 융합체이다. 예를 들어, 본 명세서에서 고려되고 개시된 융합체는 적어도 2, 3, 4, 5, 6개, 또는 그 이상의 별개의 염색체 유전자좌를 포함할 수 있다. 그러한 유전자좌는 코딩 또는 비-코딩 영역을 포함할 수 있다. 유사하게, 그러한 유전자좌는 유전자 또는 유전자 간의 영역을 포함할 수 있다. 일부 바람직한 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 2개의 별개의 염색체 유전자좌의 융합체이다. 대안적으로, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 3개의 별개의 염색체 유전자좌의 융합체이다. 추가 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 4개의 별개의 염색체 유전자좌의 융합체이다.

일부 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 유전자 세트 중 적어도 하나를 포함하거나 이로부터 전사된다. 일부 그러한 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 제공된 유전자 중 적어도 하나와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사된다. 바람직하게는, 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 서열번호 1 내지 47로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사된다. 일부 그러한 실시형태에서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 서열번호 1 내지 47의 유전자와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사된다.

일부 실시형태에서, 본 명세서에 개시된 유전자 융합체 또는 비-유전자 융합체는 암 세포에서 전사되어, 적어도 하나의 신전사체의 전사체 변경 및/또는 합성을 초래한다. 본 명세서에 개시된 융합체는 염색체 내(예를 들어, 복제/증폭, 삽입, 결실, 역위 등과 같은 당업계에 알려진 바와 같이 염색체 내부에서 발생하는 재배열로부터 발생하는 융합체) 또는 염색체간(예를 들어, 전좌와 같은 2개 이상 염색체 사이에서 발생하는 재배열 또는 삽입-전좌, 복제수 변이와 연관된 역위, 2개 초과의 염색체에 영향을 미치는 전좌, 및 이들의 조합과 같은 복잡한 염색체 재배열을 포함하지만 이에 제한되지 않는, 당업계에 알려진 바와 같은 더 복잡한 구조적 게놈 변이로부터 발생하는 융합체)에 이루어진 것일 수 있다.

일부 실시형태에서, 샘플은 액체 또는 조직 생검이다.

정의

본 명세서에서 달리 정의되지 않는 한, 본 출원에서 사용되는 과학 및 기술 용어는 당업자에 의해 일반적으로 이해되는 의미를 가질 것이다. 일반적으로 본 명세서에 기재된 화학, 세포 및 조직 배양, 분자 생물학, 세포 및 암 생물학, 신경생물학, 신경화학, 바이러스학, 면역학, 미생물학, 약리학, 유전학 및 단백질과 핵산 화학과 관련하여 사용되는 명명법 및 기법은 당업계에 잘 알려지고 일반적으로 사용되는 것들이다.

본 개시내용의 방법 및 기법은 일반적으로 달리 나타내지 않는 한, 당업계에 잘 알려진 통상적인 방법에 따라 그리고 본 명세서 전반에 걸쳐 인용되고 논의되는 다양한 일반적이고 보다 구체적인 참조문헌에 기재된 바와 같이 수행된다. 예를 들어, 제한 없이 문헌["Principles of Neural Science", McGraw-Hill Medical, New York, N.Y. (2000); Motulsky, "Intuitive Biostatistics", Oxford University Press, Inc. (1995); Lodish et al., "Molecular Cell Biology, 4th ed.", W. H. Freeman & Co., New York (2000); Griffiths et al., "Introduction to Genetic Analysis, 7th ed.", W. H. Freeman & Co., N.Y. (1999); 및 Gilbert et al., "Developmental Biology, 6th ed.", Sinauer Associates, Inc., Sunderland, MA (2000)]을 참조한다. 유사하게, 본 명세서에서 사용되는 화학 용어는 본 명세서에 달리 정의되지 않는 한, 당업계의 통상적인 용법에 따라 사용된다.

본 출원에서 언급된 상기 모든 내용, 및 임의의 다른 간행물, 특허 및 공개된 특허 출원은 구체적으로 본 명세서에 참조에 의해 원용된다.

"환자", "대상체", 또는 "개체"는 호환 가능하게 사용되며 인간 또는 비-인간 동물을 지칭한다. 이들 용어는 포유동물, 예컨대, 인간, 영장류, 가축 동물(소, 돼지 등을 포함함), 반려 동물(예를 들어, 개, 고양이 등) 및 설치류(예를 들어, 마우스 및 래트)를 포함한다.

병태 또는 환자를 "치료하는" 것은 임상 결과를 포함하여 유익하거나 원하는 결과를 얻기 위한 조치를 취하는 것을 지칭한다. 본 명세서에서 사용되는 바와 같고 당업계에서 잘 이해되는 바와 같이, "치료"는 임상 결과를 포함하여 유익하거나 원하는 결과를 얻기 위한 접근법이다. 유익하거나 원하는 임상적 결과는, 검출 가능하거나 검출 가능하지 않은지 여부에 관계 없이, 하나 이상의 증상 또는 병태의 경감 또는 개선, 질환 정도의 약화, 질환 상태의 안정화(예를 들어, 악화하지 않음), 질환 확산의 예방, 질환 진행의 지연 또는 둔화, 질환 상태의 개선 또는 완화, 및 관해(부분적이거나 전체적인지 여부는 관계 없음)를 포함할 수 있지만 이에 제한되지 않는다. "치료"는 또한 치료를 받지 않은 경우 예상되는 생존과 비교하여 생존을 연장시키는 것을 의미할 수 있다.

용어 "예방하는"은 당업계에서 인정되는 것이며, 국소 재발(예를 들어, 통증)과 같은 상태, 암과 같은 질환, 심부전과 같은 증후군 또는 임의의 다른 의학적 상태와 관련하여 사용될 때 당업계에서 잘 이해되고, 조성물을 받지 않은 대상체에 비해 대상체에서 의학적 상태의 증상의 빈도를 감소시키거나, 의학적 상태의 증상의 발생을 지연시키는 조성물의 투여를 포함한다. 따라서, 암의 예방은, 예를 들어 통계적으로 및/또는 임상적으로 유의한 양으로, 예를 들어 비치료 대조군 집단에 비해 예방적 치료를 받는 환자의 집단에서 검출 가능한 암 성장의 수를 감소시키는 것, 및/또는 치료받은 집단 대 비치료 대조군 집단에서 검출 가능한 암 성장의 출현을 지연시키는 것을 포함한다.

대상체에게 물질, 화합물 또는 작용제를 "투여하는 것" 또는 이의 "투여"는 당업자에게 알려진 다양한 방법 중 하나를 사용하여 수행될 수 있다. 예를 들어, 화합물 또는 작용제는 정맥내, 동맥내, 피내, 근육내, 복강내, 피하, 안구, 설하, 구강(섭취에 의함), 비강내(흡입에 의함), 척수내, 뇌내 및 경피(흡수, 예를 들어 피부관을 통한 흡수에 의함)로 투여될 수 있다. 화합물 또는 작용제는 또한 재충전 가능하거나 생분해성 중합체 장치 또는 기타 장치, 예를 들어 패치 및 펌프, 또는 화합물 또는 작용제의 연장, 서방 또는 제어 방출을 제공하는 제형에 의해 적절하게 도입될 수 있다. 투여하는 것은 또한, 예를 들어 1회, 복수 회 및/또는 1회 이상의 연장된 기간에 걸쳐 수행될 수 있다.

대상체에게 물질, 화합물 또는 작용제를 투여하는 적절한 방법은 또한, 예를 들어 대상체의 연령 및/또는 신체적 상태 및 화합물 또는 작용제의 화학적 및 생물학적 특성(예를 들어, 용해도, 소화성, 생체이용률, 안정성 및 독성)에 따라 달라질 것이다. 일부 실시형태에서, 화합물 또는 작용제는 경구로, 예를 들어 섭취에 의해 대상체에게 투여된다. 일부 실시형태에서, 경구로 투여되는 화합물 또는 작용제는 연장 방출 또는 서방형 제형으로 존재하거나, 서방 또는 연장 방출을 위한 장치를 사용하여 투여된다.

본 명세서에서 사용되는 바와 같이, 어구 "공동 투여"는 이전에 투여된 치료제가 체내에서 여전히 효과적인 동안 제2 작용제가 투여되도록 2가지 이상 상이한 치료제의 임의의 투여 형태를 지칭한다(예를 들어, 2가지 작용제가 환자에서 동시에 효과적이며, 이는 2가지 작용제의 상승 효과를 포함할 수 있음). 예를 들어, 상이한 치료용 화합물이 동일한 제형으로 또는 별도의 제형으로, 동시에 또는 순차적으로 투여될 수 있다. 따라서, 그러한 치료를 받는 개체는 상이한 치료제의 조합 효과로부터 이익을 얻을 수 있다.

약물 또는 작용제의 "치료적 유효량" 또는 "치료적 유효 용량"은 대상체에게 투여될 때 의도된 치료 효과를 갖게 될 약물 또는 작용제의 양이다. 전체 치료 효과는 반드시 1회 용량의 투여에 의해 일어나는 것은 아니며, 일련의 용량의 투여 후에만 일어날 수 있다. 따라서, 치료적 유효량은 1회 이상의 투여로 투여될 수 있다. 대상체에게 필요한 정확한 유효량은, 예를 들어 대상체의 크기, 건강 및 연령, 그리고 암 또는 MDS와 같은 치료될 병태의 성질 및 정도에 따라 달라질 것이다. 숙련된 작업자는 일상적인 실험에 의해 주어진 상황에 대한 유효량을 쉽게 결정할 수 있다.

어구 "약제학적으로 허용 가능한"은 당업계에서 인정되는 것이다. 특정 실시형태에서, 상기 용어는 적절한 의학적 판단의 범주 내에서, 합리적인 이득/위험 비에 부합하면서, 과도한 독성, 자극, 알레르기 반응, 또는 다른 문제 또는 합병증 없이 인간 및 동물의 조직과 접촉하여 사용하기에 적합한 조성물, 부형제, 아쥬반트, 중합체 및 기타 물질 및/또는 투약 형태를 포함한다.

개시된 발명의 암은 조절되지 않는 성장, 침윤, 또는 전이를 겪고 있는 대상체에서의 임의의 세포일 수 있다. 본 명세서에 개시된 바와 같은 암은, 예를 들어 교모세포종을 포함한 뇌암, 힘줄 윤활막 거대세포 종양(TSGCT), 육종, 흑색종, 중피종, 자궁암, 전립선암, 신장암(kidney cancer), 담낭암, 자궁경부암, 방광암, 난소암, 폐암, 폐의 선암종, 갑상선암, 방광암, 유방암, 식도암, 자궁내막암, 위암, 위장암, 신장암(renal cancer), 부신암, 뮬러리안암, 메르켈 암종, 급성 림프구성 암, 결장직장암, 췌장암, 간세포 암종을 포함한 간암, AML, DLBCL, 림프종, 다발성 골수종 등을 포함하는 고형 및 액체 암을 둘 다 포함한다. 일부 실시형태에서, 암은 담낭암, 외분비 선암종, 또는 아포크린 선암종이다. 바람직하게는, 암은 유방암, 전립선암, 또는 췌장암이다. 가장 바람직하게는, 췌장암.

일부 실시형태에서, 암은 방사선요법 또는 화학요법이 현재 사용되는 임의의 신생물 또는 종양일 수 있다. 대안적으로, 암은 표준 방법을 사용하는 방사선요법 또는 화학요법에 대해 충분히 민감하지 않은 신생물 또는 종양일 수 있다. 따라서, 암은 육종, 림프종, 백혈병, 암종, 모세포종, 또는 생식 세포 종양일 수 있다. 개시된 발명의 대표적이지만 비-제한적인 암 목록은 간세포 암종, 림프종, B 세포 림프종, T 세포 림프종, 균상식육종, 호지킨병, 골수성 백혈병, 방광암, 뇌암, 신경계암, 두경부암, 두경부의 편평세포 암종, 신장암(kidney cancer), 폐암(예컨대, 소세포 폐암 및 비-소세포 폐암), 신경모세포종/교모세포종, 난소암, 췌장암, 전립선암, 피부암, 간암, 흑색종, 구강, 인후, 후두, 및 폐의 편평세포 암종, 자궁내막암, 자궁경부암, 자궁경부 암종, 유방암, 상피암, 신장암(renal cancer), 비뇨생식기암, 폐암(pulmonary cancer), 식도 암종, 두경부 암종, 대장암, 조혈암; 고환암; 결장 및 직장암, 신장암(renal cancer), 전립선암, 및 췌장암을 포함한다.

또한, 대상체 유래의 샘플에서 표 1에 제시된 유전자 중 적어도 하나를 포함하거나 이로부터 전사되는 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체를 검출하기 위한 생물검정을 수행하는 단계, 생물검정의 결과를 컴퓨터 시스템으로 수신하는 단계, 결과를 처리하여 출력을 결정하는 단계, 판독 가능한 매체에 출력을 제시하는 단계를 포함하는 방법이 본 명세서에서 제공되되, 상기 출력은 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 존재 또는 부재에 기반하여 대상체에게 권장되는 치료 옵션을 식별하고, 샘플은 액체 또는 조직 생검이다. 일부 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 유전자 중 적어도 하나와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사된다. 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체는 본 명세서에 기재된 바와 같은 적어도 2, 3, 4, 5 또는 6개의 별개의 염색체 유전자좌의 융합체일 수 있다. 일부 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 2개의 별개의 염색체 유전자좌의 융합체이다. 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 3개의 별개의 염색체 유전자좌의 융합체일 수 있다. 다른 실시형태에서, 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 4개의 별개의 염색체 유전자좌의 융합체이다. 바람직한 실시형태에서, 생물검정은 표 1에 제시된 서열을 포함하는 융합 유전자좌에 특이적인 프로브를 포함한다.

본 발명의 일부 양태에서, 대상체 유래의 샘플에서 적어도 하나의 유전자 융합체 또는 비-유전자 융합체의 검출을 가능하게 하는 적어도 하나의 시약을 포함하는 암 진단 키트가 본 명세서에서 제공되되, 상기 융합체는 표 1에 제시된 유전자 중 적어도 하나를 포함하거나 이로부터 전사된다. 일부 구현예에서, 융합체는 표 1에 제시된 유전자 중 적어도 하나와 적어도 80% 상동성인 DNA 서열을 포함한다. 다른 실시형태에서, 융합체는 표 3에 제시된 적어도 하나의 서열을 포함하거나 이로부터 전사된다. 융합체는 표 3에 제시된 유전자와 적어도 80% 상동성인 적어도 하나의 서열을 포함할 수 있거나 이로부터 전사될 수 있다. 일부 실시형태에서, 융합체는 암 세포에서 전사되어, 적어도 하나의 전사체 변경, 또는 신전사체의 합성을 초래한다. 일부 실시형태에서, 융합체는 염색체내 또는 염색체간 융합체이다. 일부 그러한 실시형태에서, 상기 융합체는 본 명세서에 개시된 바와 같은 염색체 재배열로부터 발생한다.

일부 실시형태에서, 키트는 프로브 세트를 포함하며, 여기서 각각의 프로브는 표 1 또는 표 3에 제시된 서열을 포함하는 핵산에 특이적으로 혼성화한다. 일부 그러한 실시형태에서, 프로브는 융합 유전자좌(예를 들어, 표 1 또는 표 3에 제시된 서열을 포함하는 유전자좌)에 혼성화하거나 달리 결합할 수 있다. 바람직하게는, 그러한 프로브는 융합 유전자좌를 포함하는 핵산에 특이적으로 혼성화하도록 구성된 핵산 서열, 및 핵산 서열에 공유 결합된 검출 가능한 모이어티를 포함한다. 바람직한 실시형태에서, 융합 유전자좌는 표 1 또는 표 3에 제시된 적어도 하나의 서열을 포함한다. 일부 실시형태에서, 샘플은 액체 또는 조직 생검이다. 일부 실시형태에서, 암은 췌장암, 메르켈 암종, 급성 골수성 백혈병, 전이성 암종, 전립선암, 부신암, 뮬러리안암, 자궁암, 신장암, 담낭암, 경부암, 방광암, 난소암, 유방암, 두경부암, 식도암, 폐암, 간암, 결장암, 위장암, 결장직장암, 급성 림프구성암, 림프종, 육종, 흑색종 및 뇌암으로부터 선택된다.

특정 양태에서, (a) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 접합부에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 검출 프로브; (b) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제1 표지된 프로브, 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제2 표지된 프로브; (c) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 서열을 포함하는 제1 증폭 올리고뉴클레오타이드, 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 서열을 포함하는 제2 증폭 올리고뉴클레오타이드; (d) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열에 의해 인코딩되는 아미노산 서열에 특이적으로 결합하는 항체 및 (e) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 검출하기 위한 동일계내 혼성화 프로브 중 적어도 하나를 포함하는 조성물이 본 명세서에서 제공된다. 일부 실시형태에서, 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 전립선 세포 또는 분획, 전립선 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래된다. 다른 실시형태에서, 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 유방 세포 또는 분획, 유방 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래된다. 추가 실시형태에서, 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 췌장 세포 또는 분획, 췌장 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래된다. 바람직한 실시형태에서, 샘플은 액체 또는 조직 생검이다.

일부 실시형태에서 본 발명의 검출 프로브, 표지된 프로브, 동일계내 혼성화 프로브, 또는 증폭 올리고뉴클레오타이드는 엄격한 혼성화 조건 하에 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 일부가 아니거나 이로부터 생성되는 DNA 또는 RNA에 혼성화하지 않는다.

일부 실시형태에서, 제1 및 제2 증폭 올리고뉴클레오타이드는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 일부가 아니거나 이로부터 생성되는 DNA 또는 RNA를 증폭시키지 않는다. 또한 본 발명의 조성물을 포함하는 키트 및 포장된 분석물이 본 명세서에서 제공된다.

실시예

본 발명은 이제 일반적으로 설명되며, 이는 단지 본 발명의 특정 양태 및 실시형태를 설명하기 위한 목적으로 포함되고 본 발명을 제한하려는 것으로 의도되지 않는, 다음 실시예를 참조하여 더 쉽게 이해될 것이다.

실시예 1: 물질 및 방법

신전사체/융합체를 검출하는 방법 및 파이프라인

도구 세트를 사용하여 도 2에 설명된 분석 파이프라인을 생성하였다. 이들 도구를 파이프라인 재현 가능 표준(NextFlow®, Seqera Labs, 스페인 소재)에 의해 관리하였다. 파이프라인은 사용 가능한 데이터세트에서 원시 데이터를 변환한 다음 여러 제어 및 발견 도구에 제출되도록 실행되는 명령 집합이다. 모든 소프트웨어의 집합은 신전사체/융합체에 대한 발견 도구로 간주된다.

좋은 품질의 데이터를 식별하기 위해, FastQC, BBMap, SeqTK, Bedtools, Samtools, PacBio-CCS, Lima, Isoseq3과 같은 소프트웨어를 사용하여 원시 시퀀싱 데이터를 사용 가능하고 신뢰할 수 있는 데이터로 변환하였다. 그 다음 이들 데이터를 Kallisto 및 Mininmap2와 같은 신전사체/융합체를 정량화하고 평가하는 여러 소프트웨어에 제출하였다. 유전자의 코딩 능력을 식별하기 위해, CD-Hit 소프트웨어를 사용하여 모든 신규 신전사체/융합체에 대한 완전성과 코딩 잠재력을 평가하였다. 마지막으로, 데이터 표현, 시각화 및 평가는 R-stat 및 IGV 둘 다에 의해 이루어졌다. 그러한 분석에서 사용된 이들 및 기타 소프트웨어는 표 2에 제시되어 있다.

실시예 2: 실험 설계

종합적으로, 환자-유래 이종이식(PDX)이라고 하는 2500개 인간 종양 집합을 분리하고 마우스에서 이식에 의해 생체 내에서 증식시켰다. 이러한 PDX 샘플의 하위집합을 게놈 DNA 및 전사체 RNA의 차세대 시퀀싱에 의해 분석하여, 해당 종양 중 1500개 초과에 대한 게놈 및 추론된 후성적 특성에 대한 데이터베이스를 생성하였다.

도 2에 설명된 바와 같이, 마우스에서 체외 이식된 인간 종양을 오염시키는 뮤린 DNA 및 RNA를 제거하기 위하여, 수득한 원시 서열을 먼저 인간 및 마우스 게놈과 비교하였다. 그 다음 선택된 인간 또는 알려지지 않은 서열을 이전에 보고된 인간 유전자 또는 RNA 서열에 대해 정렬하거나 새로 조립하였다. 이에 의해 알려진 융합체뿐만 아니라 분석된 인간 종양 세포에 특이적일 수 있는 알려지지 않은 인간 유전자 또는 비-유전자 후보 융합체의 서열 집합을 산출하였다.

융합 선택 과정의 견고성을 평가하고 후보 융합체에 대한 신뢰도 점수를 제공하기 위해, 기계 학습 접근법을 사용하여 융합 특징이 알려진 융합체를 고려할 때 후보 신전사체 및/또는 게놈 융합체의 예측 값에 대해 긍정적(어두운 회색) 또는 부정적(밝은 회색) 영향을 미치는지를 결정하였다(도 3). 이는 주어진 융합체 서열 후보가 시퀀싱 인공물이 아닌 암 세포에서 실제로 발생하는 융합체를 나타낼 가능성을 나타내는 점수를 제공하였다.

특정 DNA 시퀀싱 기술과 연관될 수 있는 융합 인공물 서열을 추가로 제외하기 위해, 여러 시퀀싱 접근법을 사용하여 분석을 수행하였다. 136개의 PDX 췌장암 모델에서 얻은 2가지 별개의 NGS 접근법, 즉 Illumina^® RNAseq 짧은 RNA 판독물과 PacBio^® 긴 게놈 DNA 및 RNA 판독물을 비교하였다. 어느 한쪽 시퀀싱 전략으로부터 얻은 서열 데이터베이스의 사용으로 각각 20,811개 또는 81,466개의 후보 융합체를 산출하였다(도 4). 그러나, 두 데이터베이스의 조합 사용으로 총 433개의 보다 신뢰할 수 있는 후보 융합체 서열을 산출하였다.

융합체 서열의 선택된 접근법 및 데이터베이스를 추가로 검증하기 위해, 췌장암 생검에서 발생하는 것으로 알려진 게놈 변경을 433개 융합체 서열 데이터베이스에서 검색하였다. 예상한 대로, 표피 성장 인자 수용체(EGFR) 및 커스텐 RAS(Kirsten Ras: KRAS) 유전자에서 돌연변이가 발견되었으며, KRAS 돌연변이가 명확하게 과하게 나타났다(도 5). 이는 인간 췌장암의 90% 초과가 KRAS 변경을 보유하는 한편, EGFR과 KRAS 돌연변이 혼선은 가장 공격적인 암 유형에서 전이 형성에 관여한다는 것을 나타내는 이전 보고와 상관 관계가 있으며(Fitzgerald et al., 2015), 따라서 PDX 모델 및 신전사체/융합체 데이터세트의 추가 검증을 제공하였다. 신규한 암-특이적 신전사체/융합체 데이터세트를 검증한 다음, IVD 사용에 대해 다양한 암 유형 및 하위유형에 특이적인 마커의 식별을 위한 기초를 구성할 수 있는지 여부를 평가하였다.

실시예 3: 식별된 신전사체/게놈 융합체의 유병률

136개의 췌장암 샘플 중 식별된 433개 신전사체/게놈 융합체의 유병률을 평가하였으며, 일부는 거의 모든 췌장암 유형에서 발생하는 반면, 다른 일부는 소수의 샘플에서만 발생한다는 것을 나타내었다(각각 도 6의 상단 및 하단 라인 참조). 따라서, 특정한 융합체의 하위집합은 모든 췌장암 샘플의 거의 100%에 존재하였다(도 6의 우측에 있는 빈도 다이어그램 참조).

일부 암 샘플은 다른 것보다 그러한 융합체의 더 높은 부하를 보유하는 것으로 밝혀졌는데, 이는 췌장암의 다양한 하위유형 중에서 예상되는 이질성과 일치하며, 췌장암 하위유형을 설명하는 데 사용될 수 있다. 초기 진단 분석법이 부족하고 이용 가능한 치료법에 대해 제한된 반응을 나타내는 매우 공격적인 치명적 췌장 악성종양인 췌장 도관 선암종(PDAC)(Sarantis et al., 2020)은 종종 아시아인 환자에서 진단되고 함께 클러스터링되는 경향을 나타내었다. 이러한 융합체는, 대부분 함께 클러스터링되고 별개의 융합체 세트의 높은 발생률을 나타낸 서양인 환자의 췌장 선암종에서 관찰된 것과는 클러스터링되지 않았다(도 6의 좌측 열 참조). 일관되게, 다양한 인종 기원의 종양을 고려할 때, 불량한 예후와 연관된 샘플의 클러스터는 상이하였다(도 6의 상단의 클러스터링 아래 병리학 설명 라인 참조). 특정한 융합체 세트는 환자 인종 기원과 같은 다른 매개변수와 함께 사용될 때, 췌장암 하위유형의 하위유형 분류를 가능하게 할 수 있다.

실시예 4: 췌장암에 대한 특이성

유사한 돌연변이 또는 염색체 이상이 종종 다양한 종양 유형에서 발생하므로, 이들 433개 신전사체/게놈 융합체 중 일부가 췌장암에 특이적일 수 있는지 여부를 평가하였다. 47개 신전사체/융합체의 세트는 췌장암에서만 배타적으로 발생하고 다른 PDX 암 유형에서는 발생하지 않는 것으로 관찰되었다(도 7). 이는 혈액 샘플과 같은 임상 추출물에서 이러한 마커의 검출이 환자의 IVD 또는 예후 평가에서 췌장암 발병의 조기 징후로 간주될 수 있음을 나타내었다.

실시예 5: 보다 공격적인 췌장암과의 상관 관계

일부 췌장암-특이적 신전사체/융합체의 발생은 종양 성장의 측면에서 보다 공격적인 췌장암과 상관 관계가 있을 수 있다. 이는 종양 공격성의 대용 마커로서 PDX 이식의 성장 특성을 평가하고, 이의 배가 시간을 점수화함으로써 조사되었다. 다양한 췌장암 유형의 발생 및 종양 샘플의 PDX 집합에서의 공격성에서 예상된 대로, 광범위하게 다양한 성장률이 관찰되었다(도 8). 짧은 배가 시간을 나타내는 샘플의 클러스터링은 특정 신전사체/융합체 세트의 발견이 종양 진행 및 예후의 지표를 제공할 수 있으며, 따라서 수술적 절제 이전에 선행보조 화학요법이 지시될 수 있는지 여부와 같은 유용한 정보를 제공할 수 있음을 나타내었다.

실시예 6: PDX 집합 논의

PDX 집합에서 얻은 DNA 및 RNA 서열의 포괄적인 분석, 및 정상적인 인간 조직의 서열과의 비교는, 결실, 전좌, 재조합, 또는 기타 염색체 재배열 사건으로부터 생성된 유전자 융합체와 같은 종양 샘플에서 이전에 알려지지 않은 대규모 게놈 변경의 식별을 가능하게 하여, 암 이질성의 포괄적인 모델의 기초를 형성하였다. 이러한 신전사체 및/또는 게놈 변성의 하위집합은 종양학에서 충족되지 않은 필요성에 답하기 위해 신규 진단, 예후 및 치료 분석 도구 및 알고리즘을 생성하는 기초를 형성한다. 췌장암이 본 명세서에서 예시되어 있지만, 본 명세서에서 제공된 방법이 다른 암 유형 및 하위유형의 진단 및 예후에 적용될 수 있음이 당업자에 의해 이해될 것이다. 특히, 복수 및/또는 모든 알려진 암 유형, 즉 범-암 융합체와 연관된 신전사체 및/또는 게놈 변경이 식별되었다(표 4 참조).

본 명세서에서 상기 입증된 바와 같이, NGS 및 AI-기반 시험관 내 진단(IVD) 분석은 종양 발생 및 진화의 예후를 더 잘 알 수 있게 하고, 이용 가능한 치료법에 대한 개별 환자의 종양 반응 또는 내성을 예측하기 위한 기초를 형성할 수 있다. NGS 및 AI 기반 모델은 종양 유형 및 하위유형의 후보 마커의 식별, 및 치료법에 대한 진행 및 반응과 같은 일부 특성의 식별을 가능하게 하였다. 이들 특성은 유전체학, 생물정보학, 분자/세포 생물학 및 임상 과학 분야 전반에 설쳐 실험적 검증 및 추가 분석의 대상이 될 수 있다. 이들 NGS-AI 모델의 적용은 암의 사전 증상 검출 및 비-침습적 혈액 샘플로부터 암 유형 및 하위유형의 식별일 수 있다. 이는 각각의 특정 환자 및 암에 대한 최적의 치료법을 선택하기 위한 권장사항뿐만 아니라, 이용 가능한 치료법에 대한 치료 반응과 진화에 대한 예측으로 이러질 수 있다.

본 명세서에 개시된 방법에 의해 이용 가능한 치료법에 대한 종양 내성과 인과적으로 연관되는 생물학적 마커의 식별은 초기 무증상 진단뿐만 아니라, 효율적이고 특이적인 치료 전략의 준비를 가능하게 한다. 예를 들어 제한 없이, 종양 내성의 유전적 및 후성적 마커의 식별은 그러한 내성의 원인이 될 수 있는 특정 단백질의 식별 및 실험적 검증으로 이어진다. 유사하게, 후보 치료제에 대한 병리학적 반응 또는 내성의 예측을 가능하게 하는 게놈 마커의 발견은 환자 계층화, 즉 가장 민감한 환자, 예를 들어 임상 시험에서 잠재적인 치료제를 이용한 치료 시 완전한 병리학적 반응을 나타내는 환자의 선택을 가능하게 한다.

실시예 7: 상업용 암 바이오뱅크의 췌장 샘플

본 명세서에 기재된 PDX PDAC 샘플을 넘어서는 췌장암 마커 유전자-융합체를 테스트하기 위해, 제2 코호트에 대한 접근권을 얻었다. 이용 가능한 코호트의 대부분은 주로 서양 출신인 반면, PDX PDAC 집합 결과는 아시아 출신 민족의 비율이 더 높다. 아시아 유전적 배경의 췌장암 환자 유래 췌장 조직 샘플 100개를 Cureline(미국 캘리포니아주 브리즈베인 소재)에서 구입하였다. 이들은 포르말린-고정, 파라핀-포매(FFPE) 조직으로 이용 가능하였으며, 이들 모두에 대해 RNA 추출 및 시퀀싱을 수행하였다. 동일한 접근법을 사용하여 발현 및 융합체 발현을 수행하고 표 1, 3, 및 4에 제공된 후보 표와 비교하였다. 전체적으로, 유전자 융합체 후보 중 4개가 이러한 제2 코호트에 존재하였다.

췌장 특이적 세트

췌장 특이적 융합체 중에서, NGSAI_NEOTX_42(MRPS18A―NA; 서열번호 42) 및 NGSAI_NEOTX_47(NA―MUC20; 서열번호 47)이 각각 20개 샘플과 8개 샘플에서 나타났다.

범-암 세트

범-암 후보는 8개의 Cureline 샘플에서 나타나는 NGSAI_NEOTX_52(LOC107987295, AF127936.7―NRIP1; 서열번호 50) 및 2개의 샘플에 존재하는 NGSAI_NEOTX_61(ADAP1―SUN1; 서열번호 59)이었다.

NGSAI_NEOTX_52의 파트너를 둘 다 함유하는 융합체는 이전에 베이징 대학교 인민 병원에서 자궁내막암 환자 III기 환자 28명에서 식별되었다. (Yao et al., 2019). 본 연구는 이 융합체가 28명의 개체 중 12명에서 매우 널리 퍼져 있고 유전자 발현이 상승된 것을 밝혔다.

NGSAI_NEOTX_61의 파트너를 둘 다 함유하는 융합체는 이전에 일본의 야마구치 대학교 병원에서 결장직장 암종에 대한 연구에서 식별되었다. (Oga et al., 2019) 이 연구에서 12명의 간 전이 환자와 16명의 대조군 환자를 분석하였다. ADAP1와 SUN1 간의 융합이 전이성 환자에서 식별되었으며, RT-PCR 및 뉴클레오타이드 시퀀싱으로 확인되었다. 이러한 융합 쌍은 백인 라틴계 환자의 자궁경부 편평세포 암종 및 자궁경내 선암종(TCGA, 샘플 DS.A7WH.01A)의 맥락에서 발견되었다.

실시예 8: 공공 암 바이오맹크의 췌장 샘플

유전자형-조직 발현(Genotype-Tissue Expression: GTEx) 프로젝트는 조직-특이적 유전자 발현 및 조절을 연구하기 위한 포괄적인 공공 자원이다. GTEx는 상이한 조직 유형 및 환자로부터의 데이터를 함유하여 상기 데이터를 잠재적인 비-암 개체와 비교할 수 있는 기회를 제공한다(Lonsdale et al., 2013). GTEX 원시 시퀀싱 데이터에 대한 접근을 요청하였으며 이어서 안전한 클라우드 플랫폼에서 분석하여 유전자 융합 분석을 수행하였다. 전체적으로, 340개의 췌장 조직 RNA-seq 샘플을 분석하였으며 췌장 암 유전자 융합 후보의 목록과 비교한 결과는 본 명세서의 표 1, 3, 및 4에 제공되어 있다.

췌장 특이적 세트

PDX PDAC 세트로부터, GTEX에서 NGSAI_NEOTX_25(서열번호 25), NGSAI_NEOTX_42(서열번호 42), 및 NGSAI_NEOTX_47(서열번호 47)이 발견되었다.

융합체 NGSAI_NEOTX_25는 GTEX의 샘플 1개에서 관찰되었다. 융합 파트너 CHS.3009.1(표 1 및 3 참조; 잠재적인 신규 전사체로서 포괄적인 인간 발현 서열 프로젝트(Comprehensive Human Expressed SequenceS project: CHESS; 존스홉킨스 대학교 계산 생물학 센터가 인도함)에 의해 식별됨) 중 하나는 유전자 ENSA와 중첩된다. 융합 파트너로서 FAM120A 유전자와 함께 그러한 융합체는 문헌에서 설명된 바 없다.

NGSAI_NEOTX_42는 GTEX 샘플 340개 중 4개에서 검출된 반면, NGSAI_NEOTX_47은 18개 샘플에서 발견되었다.

범-암 세트

GTEX 샘플에 존재하는 이들 세트로부터의 3가지 융합체 후보, 즉 NGSAI_NEOTX_52(서열번호 50), NGSAI_NEOTX_58(서열번호 56), 및 NGSAI_NEOTX_61(서열번호 59)이 존재하였다. 이들은 각각 6, 1, 및 1개 사례에 존재하였다.

Cureline 샘플에 대해 기재된 바와 같이, NGSAI_NEOTX_52와 NGSAI_NEOTX_61 융합체는 명확하게 암과 관련이 있는 것으로 발표되었다. GTEX 샘플은 자연적으로 사망하고 연구를 위해 장기를 기증한 개체로부터 유래되었다. 이들 중 어느 것도 표준 암 검출 방법에 의해 진단되지 않았으며, 이에 대해 어느 것도 검출 가능한 암으로 보고되지 않았다. 따라서 소수의 GTEX 췌장 데이터에는 진단되지 않은 암을 보유하고 있을 가능성이 있다.

GTEX 췌장과 췌장암 샘플의 유전자 발현 비교

본 명세서에서 논의된 바와 같이, 일부 유전자 융합 마커 후보는 췌장 GTEX 샘플의 하위집합에서 검출되었다. 이는 이러한 GTEX 샘플이 진단되지 않은 췌장암을 가질 수 있거나 암 발병을 나타낼 가능성을 높인다. 전자의 가능성을 조사하기 위해, GTEX 췌장 샘플과 본 명세서에서 제공된 PDX PDAC 코호트 간의 유전자 발현 프로파일을 비교하였다. 마커 융합 후보를 함유한 췌장 GTEX 샘플의 하위집합에 초점이 맞춰져 있다. 도 9는 이들 샘플 중 가장 차등적으로 조절되는 400개의 유전자의 주성분 분석(PCA)을 나타내며, GTEX 하위집합은 추가적으로 강조표시되어 있다. GTEX 하위집합 샘플은 다른 GTEX 췌장 샘플 내에서 클러스터링되었으며, 췌장암 샘플과 상이하거나 훨씬 더 근접한 샘플에서는 그렇지 않았다. 이들 개체는 아직 췌장암이 진행되지 않았을 가능성이 있지만, 일반적인 유전자 발현 변화가 아직 발생하지 않은 초기 단계 췌장암일 가능성을 배제할 수 없다.

본 명세서에 개시된 관찰을 고려하여, 본 명세서에서 제공된 검출 방법은 초기 췌장암을 검출할 수 있다.

실시예 9: 전체적인 유전자 융합 코호트 비교에 대한 설명

본 명세서에 개시된 다양한 코호트에 대해 적용된 프로토콜은 상이하며 이후 코호트간 비교의 수준에 대한 특정 제한을 가한다. PDX PDAC 샘플의 경우 조직 준비부터, RNA 추출, 시퀀싱까지 모든 단계를 내부에서 수행하였다.

대조적으로, Cureline PDAC 샘플 라이브러리는 준비 및 시퀀싱뿐만 아니라 샘플의 성질도 상이하다. 상기 샘플은 PDX 샘플에 대한 경우에서와 같이 신선한 조직에 기반한 것이 아니고, FFPE의 슬라이스에 기반하였다. 이는 더 높은 수준의 RNA 분해를 함유하여, 변이의 증가 및 RNA 단편 감소를 야기하는 것으로 알려져 있다. 이는 또한 그러한 샘플에서 잘 발현된 유전자와 이후 유전자 융합 사건을 검출하는 능력을 방해할 수 있다(Williams et al., 1999).

둘째, 공개 데이터세트, 즉 GTEX(유전자형 조직 발현 프로젝트)를 사용하는 성질로 인해, 상기 실험 단계 중 임의의 것에 대한 제어가 가능하지 않았다. 영향과 제한을 이해하기 위해, 샘플당 코호트 각각에서 발현된 유전자 수의 비교를 수행하였다(도 10). FFPE Cureline PDAC 샘플에서 총 발현 유전자 수가 상승된 것으로 관찰되었다. GTEX와 PDX PDAC 샘플 둘 다 발현된 총 유전자의 수가 더 적었지만, 발현 편차로 평가 시 더 안정적인 견고한 수치를 나타내었다. 이러한 샘플에서 유전자 융합 사건의 수를 비교하였으며, PDAC Cureline 샘플과 PDAC PDX 샘플은 많은 유사성을 나타낸 반면, GTEX 샘플은 훨씬 더 적은 수의 사건을 나타내었다(도 11a 및 도 11b).

참조에 의한 원용

본 명세서에 언급된 모든 간행물 및 특허는 각각의 개별 간행물 또는 특허가 참조에 의해 원용된 것으로 구체적이면서 개별적으로 표시된 것처럼 본 명세서에 전문이 참조에 의해 원용된다. 상충하는 경우, 본 명세서의 임의의 정의를 포함하여 본 출원이 우선할 것이다.

균등물

주제 발명의 특정 실시형태가 논의되었지만, 상기 명세서는 예시적이며 제한적이지 않는다. 본 명세서 및 하기 청구범위를 검토하면 본 발명의 많은 변형이 당업자에게 명백하게 될 것이다. 본 발명의 전체 범주는 청구범위를 이의 균등물의 전체 범주와 함께, 그리고 명세서를 이러한 변형과 함께 참조하여 결정되어야 한다.

Claims

무증상 대상체가 암 상태로 진행될 가능성을 예측하는 방법으로서,
(a) 상기 대상체로부터의 샘플에서 상기 대상체의 게놈의 적어도 일부를 시퀀싱하는 단계 및
(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체(neotranscript)를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 암 발병 위험의 증가를 나타내는, 상기 식별하는 단계
를 포함하는, 방법.
개별화 암 요법을 위해 무증상 대상체를 식별하는 방법으로서,
(a) 상기 대상체로부터의 샘플에서 상기 대상체의 게놈의 적어도 일부를 시퀀싱하는 단계,
(b) 상기 샘플의 시퀀싱으로부터 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 대상체를 개별화 암 요법을 위한 후보자로서 식별하는, 상기 식별하는 단계 및
(c) 상기 요법을 개시하고/하거나 대상체에 대한 요법의 투여를 모니터링하는 단계
를 포함하는, 방법.
암을 앓고 있는 대상체에서 종양 반응 또는 내성을 예측하는 방법으로서,
(a) 상기 대상체의 샘플에서 하나 이상의 세포의 게놈의 적어도 일부를 시퀀싱하는 단계;
(b) 상기 샘플에서 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 내성 암 위험의 증가를 나타내는, 상기 식별하는 단계
를 포함하는, 방법.
암을 앓고 있는 대상체에서 전이 가능성을 예측하는 방법으로서,
(a) 상기 대상체의 샘플에서 하나 이상의 세포의 게놈의 적어도 일부를 시퀀싱하는 단계;
(b) 상기 샘플에서 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 식별하는 단계로서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 존재는 전이 위험의 증가를 나타내는, 상기 식별하는 단계
를 포함하는, 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 단일 유전자/비-유전자의 융합체인, 방법.
제1항 내지 제4항 중 어느 한 항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 2, 3, 4, 5 또는 6개의 별개의 염색체 유전자좌의 융합체인, 방법.
제6항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 2개의 별개의 염색체 유전자좌의 융합체인, 방법.
제6항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 3개의 별개의 염색체 유전자좌의 융합체인, 방법.
제6항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 4개의 별개의 염색체 유전자좌의 융합체인, 방법.
제5항 또는 제6항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 유전자 세트 중 적어도 하나를 포함하거나 이로부터 전사되는, 방법.
제5항 또는 제6항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 제공된 유전자 중 적어도 하나와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 방법.
제5항 내지 제11항 중 어느 한 항에 있어서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 서열번호 1 내지 47로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 방법.
제5항 내지 제12항 중 어느 한 항에 있어서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 서열번호 1 내지 47의 유전자와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 방법.
제5항 내지 제13항 중 어느 한 항에 있어서, 상기 유전자 융합체 또는 비-유전자 융합체는 암 세포에서 전사되어, 적어도 하나의 신전사체의 전사체 변경 및/또는 합성을 초래하는, 방법.
제5항 내지 제14항 중 어느 한 항에 있어서, 상기 유전자 융합체 또는 비-유전자 융합체는 염색체내 또는 염색체간 융합체인, 방법.
제1항 내지 제15항 중 어느 한 항에 있어서, 상기 샘플은 액체 또는 조직 생검인, 방법.
제1항 내지 제16항 중 어느 한 항에 있어서, 상기 암은 췌장암, 메르켈 암종, 급성 골수성 백혈병, 전이성 암종, 전립선암, 부신암, 뮬러리안암, 자궁암, 신장암, 담낭암, 경부암, 방광암, 난소암, 유방암, 두경부암, 식도암, 폐암, 간암, 결장암, 위장암, 결장직장암, 급성 림프구성암, 림프종, 육종, 흑색종 및 뇌암으로부터 선택되는, 방법.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 암은 췌장암인, 방법.
방법으로서, 대상체 유래의 샘플에서 표 1에 제시된 유전자 중 적어도 하나를 포함하거나 이로부터 전사되는 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체를 검출하기 위한 생물검정을 수행하는 단계, 상기 생물검정의 결과를 컴퓨터 시스템으로 수신하는 단계, 상기 결과를 처리하여 출력을 결정하는 단계, 판독 가능한 매체에 상기 출력을 제시하는 단계를 포함하되, 상기 출력은 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 존재 또는 부재에 기반하여 상기 대상체에게 권장되는 치료 옵션을 식별하고, 상기 샘플은 액체 또는 조직 생검인, 방법.
제19항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 표 1에 제시된 유전자 중 적어도 하나와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 방법.
제19항 또는 제20항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체는 적어도 2, 3, 4, 5 또는 6개의 별개의 염색체 유전자좌의 융합체인, 방법.
제21항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 2개의 별개의 염색체 유전자좌의 융합체인, 방법.
제21항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 3개의 별개의 염색체 유전자좌의 융합체인, 방법.
제21항에 있어서, 상기 적어도 하나의 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 적어도 4개의 별개의 염색체 유전자좌의 융합체인, 방법.
제19항 내지 제21항 중 어느 한 항에 있어서, 상기 생물검정은 표 1에 제시된 서열을 포함하는 융합 유전자좌에 특이적인 프로브를 포함하는, 방법.
암 진단 키트로서, 대상체 유래의 샘플에서 적어도 하나의 유전자 융합체 또는 비-유전자 융합체의 검출을 가능하게 하는 적어도 하나의 시약을 포함하되, 상기 융합체는 표 1에 제시된 유전자 중 적어도 하나를 포함하는, 암 진단 키트.
제26항에 있어서, 상기 융합체는 표 1에 제시된 유전자 중 적어도 하나와 적어도 80% 상동성인 DNA 서열을 포함하는, 키트.
제26항 또는 제27항에 있어서, 상기 융합체는 표 3에 제시된 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 키트.
제26항 또는 제27항에 있어서, 상기 융합체는 표 3에 제시된 유전자와 적어도 80% 상동성인 적어도 하나의 서열을 포함하거나 이로부터 전사되는, 키트.
제26항 내지 제29항 중 어느 한 항에 있어서, 상기 융합체는 암 세포에서 전사되어, 적어도 하나의 전사체 변경, 또는 신전사체의 합성을 초래하는, 키트.
제26항 내지 제30항 중 어느 한 항에 있어서, 상기 융합체는 염색체내 또는 염색체간 융합체인, 키트.
제26항 내지 제31항 중 어느 한 항에 있어서, 상기 키트는 프로브 세트를 포함하되, 각각의 프로브는 표 3에 제시된 서열을 포함하는 핵산에 특이적으로 혼성화하는, 키트.
제26항 내지 제32항 중 어느 한 항에 있어서, 각각의 프로브는 융합 유전자좌를 포함하는 핵산에 특이적으로 혼성화하도록 구성된 핵산 서열, 및 상기 핵산 서열에 공유 결합된 검출 가능한 모이어티를 포함하는, 키트.
제26항 내지 제31항 중 어느 한 항에 있어서, 상기 샘플은 액체 또는 조직 생검인, 키트.
제26항 내지 제32항 중 어느 한 항에 있어서, 상기 암은 췌장암, 메르켈 암종, 급성 골수성 백혈병, 전이성 암종, 전립선암, 부신암, 뮬러리안암, 자궁암, 신장암, 담낭암, 경부암, 방광암, 난소암, 유방암, 두경부암, 식도암, 폐암, 간암, 결장암, 위장암, 결장직장암, 급성 림프구성암, 림프종, 육종, 흑색종 및 뇌암으로부터 선택되는, 키트.
조성물로서,
(a) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체의 접합부에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 검출 프로브;
(b) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제1 표지된 프로브, 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 올리고뉴클레오타이드 서열을 포함하는 제2 표지된 프로브;
(c) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하거나 이로부터 전사되는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 5' 부분에 혼성화하는 서열을 포함하는 제1 증폭 올리고뉴클레오타이드, 및 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 상응하는 3' 부분에 혼성화하는 서열을 포함하는 제2 증폭 올리고뉴클레오타이드;
(d) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열에 의해 인코딩되는 아미노산 서열에 특이적으로 결합하는 항체; 및
(e) 서열번호 1 내지 65로부터 선택되는 적어도 하나의 서열을 포함하는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체를 검출하기 위한 동일계내 혼성화 프로브(in situ hybridization probe)
중 적어도 하나를 포함하는, 조성물.
제36항에 있어서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 전립선 세포 또는 분획, 전립선 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래되는, 조성물.
제36항에 있어서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 유방 세포 또는 분획, 유방 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래되는, 조성물.
제36항에 있어서, 상기 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경 또는 신전사체는 췌장 세포 또는 분획, 췌장 분비물 또는 분획, 또는 이들의 조합물을 포함하는 샘플로부터 유래되는, 조성물.
제37항 내지 제39항 중 어느 한 항에 있어서, 상기 샘플은 액체 또는 조직 생검인, 조성물.
제36항에 있어서, 상기 검출 프로브, 표지된 프로브, 동일계내 혼성화 프로브, 또는 증폭 올리고뉴클레오타이드는 엄격한 혼성화 조건 하에 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 일부가 아니거나 이로부터 생성되는 DNA 또는 RNA에 혼성화하지 않는, 조성물.
제36항에 있어서, 상기 제1 및 제2 증폭 올리고뉴클레오타이드는 유전자 융합체, 비-유전자 융합체, 게놈 변경, 전사체 변경, 또는 신전사체의 일부가 아니거나 이로부터 생성되는 DNA 또는 RNA를 증폭시키지 않는, 조성물.
제36항 내지 제42항 중 어느 한 항의 조성물을 포함하는 키트.