KR20240099405A - 단백질 검출 방법 및 단백질 검출용 조성물 - Google Patents

단백질 검출 방법 및 단백질 검출용 조성물 Download PDF

Info

Publication number
KR20240099405A
KR20240099405A KR1020247018426A KR20247018426A KR20240099405A KR 20240099405 A KR20240099405 A KR 20240099405A KR 1020247018426 A KR1020247018426 A KR 1020247018426A KR 20247018426 A KR20247018426 A KR 20247018426A KR 20240099405 A KR20240099405 A KR 20240099405A
Authority
KR
South Korea
Prior art keywords
barcode
binder
protein
barcodes
sequence
Prior art date
Application number
KR1020247018426A
Other languages
English (en)
Inventor
피어스 오그덴
글렙 쿠즈네트소브
쉐인 로프그렌
캐슬린 뉴델
홍 추인 림
카렌 더피
제프리 창
Original Assignee
매니폴드 바이오테크놀로지스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US17/518,221 external-priority patent/US11976384B2/en
Application filed by 매니폴드 바이오테크놀로지스 인코포레이티드 filed Critical 매니폴드 바이오테크놀로지스 인코포레이티드
Publication of KR20240099405A publication Critical patent/KR20240099405A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/005Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies constructed by phage libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1037Screening libraries presented on the surface of microorganisms, e.g. phage display, E. coli display
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/02Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Immunology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Analytical Chemistry (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

바코드(예를 들어, 펩티드 바코드(peptide barcode)), 바인더(binder)(예를 들어, 폴리펩티드 바인더) 및 결합제(binding agent)(예를 들어, 파지(phage))를 사용하여 혼합물(예를 들어, 복합 혼합물(complex mixture)(예를 들어, 생체 내))에서 하나 이상의 페이로드(payload)(예를 들어, 단백질)의 풍부도(abundance)를 정량화하기 위한 방법 및 시스템이 본원에서 제공된다.

Description

단백질 검출 방법 및 단백질 검출용 조성물
관련 출원에 대한 교차 참조
본 출원은 2021년 11월 3일에 출원된 미국 출원 번호 63/275,172 및 2021년 11월 3일에 출원된 미국 출원 번호 17/518,221의 우선권을 주장하며, 그 개시내용은 전체가 본원에 참조로 포함된다.
결합제(binding agent)(예를 들어, 파지(phage), 폴리펩티드 바인더(polypeptide binder), 항체 등)의 평가는 많은 분자 및 약학 생물학의 핵심이다.
서열 목록
본 명세서는 서열 목록(ST26_2013703-0005라는 명칭의 .xlm 파일로 전자 제출됨)을 참조한다. 상기 .xml 파일은 2022년 10월 18일에 생성되었으며 크기는 12,323,567바이트이다. 상기 서열 목록의 전체 내용은 본원에 참조로 포함된다.
본 개시내용은 작용제(agent)(예를 들어, 결합제, 치료제 및/또는 일부 실시양태에서는 항체 작용제와 같은 폴리펩티드 작용제)의 개선된 또는 바람직한 평가를 달성하는 통찰 및 기술을 제공한다.
무엇보다도, 본 개시내용은 하나 이상의 관심 있는 작용제를 평가하고, 특히 존재 및/또는 풍부도(abundance)를 확인(determining)하기 위한 많은 현재 기술이 전형적으로 질량 분광학 및/또는 친화도(예를 들어, 면역-) 검출에 의존한다는 것을 인식한다. 본 개시내용은 많은 이용 가능한 친화도 검출 기술이 수행 또는 구현하는 데 느리고/거나 비용이 많이 든다는 점을 인식하고; 이러한 많은 기술은 한 번에 하나씩 수행해야 하며 많은 경우, 예를 들어, 형광성 기질의 이용 가능성(예를 들어, 광 현미경검사와 같은 관련 기술로 평가할 수 있음)으로 인해 제한된다.
본 개시내용은 관심 있는 작용제를 평가하기 위해 때때로 활용되는 DNA 바코딩(barcoding) 기술과 같은 소정의 다른 기술도 단점이 있을 수 있다는 것을 추가로 인식한다. 예를 들어, DNA 바코드는 안정성이 부족할 수 있고/거나, 예를 들어, 생체 내에서 활용되는 경우 바람직하지 않은 면역원성을 나타낼 수 있다. 따라서, 본 개시내용은 이러한 기술이 특히 복합 환경(complex environment)(예를 들어, 생체 내)에서 작용제(예를 들어, 단백질 작용제)를 평가하는 데 문제에 직면할 수 있음을 인식한다.
무엇보다도, 본 개시내용은 관심 있는 작용제를 평가하고, 특히 단백질 작용제 및/또는 결합제(즉, 관심 있는 하나 이상의 결합 상호작용에 참여하는 작용제)를 평가하기 위해 전형적으로 사용되는 이용 가능한 기술로 소정의 문제의 원인을 인식하는 것을 포함한다. 특히, 본 개시내용은 다수의 작용제의 평가(예를 들어, 농도와 같은 양의 검출 및/또는 측정)를 위한 기술, 특히 그러한 작용제가 복합 시스템(예를 들어, 복합 용액 및/또는 생체 내)에 존재할 때 발생하는 소정의 문제의 원인을 식별한다.
또한, 본 개시내용은 일부 실시양태에서 놀라울 정도로 높은 정확도로 그러한 평가를 달성하는 특정 기술을 제공한다. 당업자는 복합 시스템 내의 복수의 작용제의 (예를 들어, 정확한 양의) 검출 및/또는 측정이 바람직한 다수의 상황이 존재한다는 것을 인식할 것이고; 또한, 당업자는 이러한 많은 상황에서 높은 정확도의 이점을 인식할 것이다.
무엇보다도, 본 개시내용은 하나 이상의, 일부 실시양태에서는 복합 시스템(예를 들어, 생체 내) 내의 복수의 작용제(예를 들어, 단백질 작용제)의 검출 및/또는 측정(예를 들어, 고도로 정확하고/거나 정밀한 측정)을 달성하는 기술을 제공한다. 일부 실시양태에서, 검출된 작용제(들)는 단백질(즉, 폴리펩티드) 및/또는 (예를 들어, 응집된; 복합화된; 디설파이드 결합 형성, 글리코실화, 페길화, 인산화에 의해 공유 변형된; 예컨대 단백질분해 절단에 의해 절단된 등의) 이의 형태일 수 있거나 이를 포함할 수 있다.
일부 실시양태에서, 제공된 기술은 치료제 평가에 특히 유용하거나 효과적이다. 예를 들어, 일부 실시양태에서, 제공된 기술은 관심 있는 작용제(들)의 하나 이상의 특징(예를 들어, 특성(예를 들어, 농도, 국소화, 지속성, 친화도 등))을 평가하는 데 특히 유용할 수 있고; 이러한 일부 실시양태에서, 관련 작용제(들)는 치료 용도에 적합하거나 바람직한 하나 이상의 속성을 특징으로 할 수 있다. 예를 들어, 일부 실시양태에서, 제공된 기술은 치료 용도에 적합한 하나 이상의 특징(예를 들어, 특성, 속성)에 대해 잠재적인 치료제(potential therapeutic agent)(예를 들어, 폴리펩티드 실체(polypeptide entities))를 스크리닝하는 데 사용될 수 있다. 일부 실시양태에서, 잠재적인 치료제(들)의 각 특징은 한 번에 하나씩 측정될 수 있다. 일부 실시양태에서, 잠재적인 치료제(들)의 두 가지 이상의 특징이 동시에 측정될 수 있다. 예를 들어, 일부 실시양태에서, 하나 이상의 치료제는 표적 단백질에 대한 친화도에 대해 스크리닝될 수 있지만, 생리학적으로 관련된 환경에서의 분자 안정성과 같은 다른 바람직한 특성은 아직 알려져 있지 않다. 일부 실시양태에서, 예를 들어, 하나 이상의 치료제는 생리학적으로 관련된 환경에서의 분자 안정성과 같은 다른 바람직한 특성과 함께 표적 단백질에 대한 친화도에 대해 스크리닝될 수 있다.
본 개시내용은 현재 많은 단백질 측정 방법, 예컨대 웨스턴 블롯(western blot) 또는 ELISA가 소정의 파장의 빛의 풍부도 또는 전체 발광성의 확인에 의존한다고 인식한다(Towbin 1979, Engvall 1972). 가시광선 파장의 제약으로 인해 이러한 방법을 사용하면 단일 반응 내에서 한 번에 종종 4개 미만인 소수의 각각 다른 단백질을 측정할 수 있다(Elshal, 2006). 본 개시내용은 약물 발견 응용분야를 포함하는 많은 응용분야가 극적으로 더 높은 처리량으로부터 이익을 얻을 것(이고, 일부 경우에는 이를 요구할 것)임을 인식한다.
본 개시내용은 단일 실험에서 수십억 개의 개별 DNA 분자를 분석할 수 있는 핵산 시퀀싱(sequencing) 기술(예를 들어, DNA 시퀀싱 기술)이 개발되었음을 추가로 인식한다(Shendure, 2005). 핵산 시퀀싱 기술로 달성할 수 있는 이러한 대량 처리량을 단백질 검출 및 측정에 적용하기 위한 다양한 전략이 개발되었는데, 특히 부착된 DNA 조각(전형적으로 "DNA 바코드"로 지칭됨)을 단백질에 태깅한 다음 시퀀싱하여 간접적으로 단백질을 검출(Trads, 2017)하거나 단백질의 하나 이상의 특징을 검출하도록 하는 방법이 있다.
본 개시내용은 다른 작용제, 특히 단백질 작용제의 평가에 고처리량 핵산 시퀀싱 기술을 적용하는 것의 힘을 인식할 뿐만 아니라 DNA 바코드의 부착에 의한 단백질 연구에 사용되는 많은 접근법과 연관된 소정의 문제의 원인을 파악한다. 예를 들어, 본 개시내용은 DNA 바코드의 부착에 의한 단백질의 변형이 종종 그 기능성을 변경할 수 있고(Trads, 2017), 이는 단백질을 평가하기 위해 DNA 바코드를 사용하는 목적을 무효화할 수 있음을 인식한다.
바코드가 표시된 단백질(barcoded protein)을 정량화하는 알려진 기술에는 질량 분석법을 사용하여 혼합물에서 단백질 서열의 존재 여부를 확인하는 Egloff 등 (2019)에 제시된 기술이 포함된다(Egloff 2019). 그러나 본 개시내용은 이러한 접근법의 문제의 원인을 파악하고, 또한, 예를 들어, 원래 신호의 증폭을 위해 핵산(예를 들어, DNA)을 사용하는 것을 포함하여 그러한 접근법에 비해 소정의 이점을 제공하며; Egloff 등에 설명된 것과 같은 접근법은 그러한 특징을 포함하지 못한다(또는 그러한 이점을 얻지 못한다). 더욱이, 당업자가 본 개시내용을 읽으면서 인식할 수 있는 바와 같이, 질량 분석법은 회합된(associated) 서열의 질량 대 전하 비율만을 판독하며; 따라서 질량 분석법을 사용하는 방법은 각각 다른 서열이 질량 대 전하 비율이 같을 수 있기 때문에 총 처리량이 제한된다. 이에 비해, 본 발명은 바코드가 표시된 단백질을 확인하고 정량화하기 위해 차례로 각 바코드와 회합된 하나 이상의 결합제와 회합된 핵산 서열을 시퀀싱하고 측정하기 때문에 이러한 단점에 의해 제한되지 않는다.
당업계에서 이용 가능한 다른 기술은 세포 표면에서 발현된 내인성 단백질의 존재를 확인하기 위해 파지(Fab-파지)에 표시된 항체를 사용한다(Pollock, 2018). 이러한 방법에서는 내인성 단백질(즉, 평가할 표적 단백질)당 하나의 Fab-파지가 생성되며 바코드는 활용되지 않는다. 대조적으로, 본 기술은 일반화 가능한 조작된 바코드 서열의 사용을 구상하여 상기 서열을 적용되는 상황에 대해 내인성이든 외인성이든 임의의 단백질을 표시하는 데 사용할 수 있고, 이후 각 바코드가, 즉 바코드가 표시된 각 단백질이 고유하게 회합되는 하나 이상의 결합제를 사용하여 측정할 수 있다(즉, 본 개시내용의 다른 곳에 설명된 '바코드 지문'). 이어서 하나 이상의 결합제와 바코드의 이러한 복합 결합이 측정되고, 예를 들어, 복합 알고리즘(즉, 본 개시내용의 다른 곳에 설명된 '해독(decoding)')을 사용하여 회합된 단백질의 정확한 정량화가 달성된다.
본 개시내용은 파지가 결합할 수 있는 혈액 내의 항체의 에피토프를 확인하기 위해 파지에 표시된 항원의 능력을 인식한다(Mohan, 2018). 그러나 이 방법은 항원이 결합하는 항체의 서열을 확인할 수 없기 때문에 파지에 표시된 항원에 특이적으로 결합하는 임의의 항체에 대한 제한된 정보만을 제공할 뿐이다. 그러나 본 개시내용은 혈액을 포함하지만 이에 제한되지 않는 복합 혼합물에서 임의의 관심 있는 표적(들)에 태깅되는 데 사용될 수 있는 하나 이상의 바인더 또는 결합제에 대해 친화도가 알려진 일반 바코드를 사용하여 표적(들)을 확인하고 정량화하는 이점을 제공하는 시스템, 조성물 및 방법을 제공한다.
본 개시내용은 무엇보다도 DNA 시퀀싱을 사용하여 이러한 작용제 풀 내의 다수의 작용제(예를 들어, 다수의 단백질 작용제)의 평가(예를 들어, 검출 및/또는 정량화)를 달성할 수 있는 기술을 제공하며 DNA와 평가된 작용제의 (직접 또는 간접) 공유 회합을 요구하지 않거나 평가된 작용제를 제한하지 않는다.
본원에는 펩티드 바코드("바코드"로도 알려짐) 및 이를 제조 및/또는 활용하는 기술이 설명되어 있다. 일부 실시양태에서, 페이로드(payload)를 표시하기 위해 바코드가 활용된다. 무엇보다도 이러한 접근 방식은 비단백질 식별자를 수정하지 않고도 단백질 페이로드의 통합 측정을 달성할 수 있다. 일부 실시양태에서, 펩티드 바코드는 아미노산 폴리펩티드 서열이다. 일부 실시양태에서, 펩티드 바코드는 단백질(예를 들어, 측정할 단백질(예를 들어, 항체) 내에 함유되어 있는데; 즉 측정할 단백질에 내인성이다. 일부 실시양태에서, 펩티드 바코드는 단백질(예를 들어, 측정할 단백질(예를 들어, 항체)과 함께 함유되어 있지 않은데; 예를 들어, 측정할 단백질에 대해 외인성이다. 일부 실시양태에서, 예를 들어, 바코드는 단백질(예를 들어, 측정할 단백질) 내에 함유된 서열(예를 들어, 설계된 서열)이다. 일부 실시양태에서, 바코드는 단백질(예를 들어, 측정할 단백질)의 N 말단에 회합(예를 들어, 결합(예를 들어, 공유적으로))되어 있다. 일부 실시양태에서, 바코드는 단백질(예를 들어, 측정할 단백질)의 C 말단에 회합(예를 들어, 결합(예를 들어, 공유적으로))되어 있다. 일부 실시양태에서, 바코드는 단백질(예를 들어, 측정할 단백질)의 N 말단에 근접하게(예를 들어, 단백질 내부에(예를 들어, N 말단에 근접한 루프 영역에)) 회합(예를 들어, 결합(예를 들어, 공유적으로))되어 있다. 일부 실시양태에서, 바코드는 단백질(예를 들어, 측정할 단백질)의 C 말단에 근접하게, 예를 들어, 단백질 내부에(예를 들어, C 말단에 근접한 루프 영역에) 회합(예를 들어, 결합(예를 들어, 공유적으로))되어 있다.
본원에 개시된 방법은 길이가 다양하도록 설계된 펩티드 바코드를 사용할 수 있다. 일부 실시양태에서, 펩티드 바코드는 1-100개, 5-50개, 8-25개, 9-25개 또는 9-15개 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 펩티드 바코드는 적어도 25개 아미노산 길이일 수 있다. 일부 실시양태에서, 펩티드 바코드는 최대 8개 아미노산 길이일 수 있다. 일부 실시양태에서, 펩티드 바코드는 10개 아미노산 길이일 수 있다.
본원에 설명된 바와 같은 바코드 서열은 각각 다른 페이로드(예를 들어, 관심 있는 단백질) 또는 페이로드 혼합물(측정할 관심 있는 단백질 혼합물)을 정량화할 수 있도록 재사용될 수 있다. 일부 실시양태에서, 바코드는 여러 실험에 걸쳐 여러 개의 각각 다른 페이로드(예를 들어, 측정할 단백질) 분자 간에 쉽게 재사용될 수 있도록 생성된다.
무엇보다도, 본원에 설명된 바코드는 별개이도록/고유하도록 디자인된다. 일부 실시양태에서, 바코드는 서열이 별개이도록(예를 들어, 다른 바코드와 별개이도록) 설계된다. 예를 들어, 각 바코드는 실험에 사용된 다른 모든 바코드와 별개이도록(예를 들어, 고유하도록) 설계되어 각 페이로드(예를 들어, 측정할 단백질)는 적어도 하나의 바코드에 부착되고 각 바코드(예를 들어, 특정 서열의 바코드)는 하나의 페이로드에만 부착된다. 당업자가 이해할 수 있는 바와 같이, 풀 내에 함유된 바코드의 다양성은 주어진 바코드 길이에 대한 아미노산 서열의 가능한 다양성에 의해서만 제한된다. 예를 들어, 바코드 길이가 'N'인 경우 길이 N의 20N개의 개별 아미노산 바코드 서열이 존재한다.
본원에 설명된 방법은 결합제를 사용하여 하나 이상의 바코드를 검출하는 것에 관한 것이다. 일부 실시양태에서, 바코드는 검출 가능한 핵산과 회합되거나 이를 포함하는 결합제와 접촉된다. 예를 들어, 일부 실시양태에서, 결합제는 파지, 리보솜, mRNA, DNA 등이거나 이를 포함할 수 있다. 일부 실시양태에서, 결합제는 표면에 결합 모티프가 있는 파지이다(예를 들어, 본원에 설명된 바와 같은 폴리펩티드 바인더). 일부 실시양태에서, 결합제는 검출 가능한 핵산을 포함한다. 일부 실시양태에서, 결합제는 검출 가능한 핵산을 발현한다. 일부 실시양태에서, 결합제는 결합제(예를 들어, 바인더)에서(예를 들어, 표면에서) 검출 가능한 핵산을 발현한다. 일부 실시양태에서, 바인더는 폴리펩티드이다. 일부 실시양태에서, 바인더는 (예를 들어, 알려진 특이성 및 친화도를 갖는) 바코드와 회합되어 있다. 일부 실시양태에서 바인더는 (예를 들어, 각각 다른 알려진 특이성 및 친화도를 갖는) 하나 이상의 바코드와 회합되어 있다. 일부 실시양태에서, 바인더는 (예를 들어, 결합제의 표면에서 발현된) 항체이다. 일부 실시양태에서, 예를 들어, 특이적(예를 들어, 개별) 바코드의 존재를 검출하기 위해, 본 개시내용은 검출 가능한 개별 핵산(예를 들어, DNA 서열, RNA 서열 등)을 특정 바코드에 회합시키는 것을 구상한다. 이는 검출 가능한 개별 핵산을 포함하는 결합제에서(예를 들어, 표면에서) 발현될 수 있는 바인더의 접촉을 통해 달성된다.
본원에는 바인더가 설명되어 있다. 일부 실시양태에서, 바인더는 폴리펩티드이다. 일부 실시양태에서, 예를 들어, 바인더는 주어진 바코드에 대해 알려진 특이성 및 친화도를 갖도록 생성된다. 일부 실시양태에서, 하나의 바코드에 대해 알려진 특이성 및 친화도를 갖도록 바인더가 생성된다. 일부 실시양태에서, 바인더는 다수(예를 들어, 2개 이상, 3개 이상 등)의 바코드에 대해 알려진 특이성 및 친화도를 갖도록 생성된다. 일부 실시양태에서, 적어도 하나의 바코드에 대해 알려진 특이성 및 친화도를 갖도록 바인더가 생성된다. 일부 실시양태에서, 예를 들어, 바인더는 당업자에게 알려진 방법을 사용하여 결합제(예를 들어, 파지, 리보솜 등)의 표면에서 발현된다.
무엇보다도, 예를 들어, 본원에 설명된 바와 같은 시스템 및 방법은 핵산 시퀀싱 기술의 이점을 식별하고 이를 단백질 검출 및 측정 방법에 효과적으로 적용한다. 예를 들어, 본원에 설명된 방법은 결합제에서 발현될 수 있고 단일 풀에서 함께 혼합될 수 있는 각각 다른 바코드에 대해 알려진 특이성 및 친화도를 갖는 여러 바인더를 사용할 수 있다. 바코드가 표시된 단백질(즉, 각각이 본원에 설명된 바와 같은 바코드와 회합된 단백질)의 풀과 혼합 시, 결합제에서 발현된 바인더는 알려졌지만 다양한 친화도로 풀 내 임의의 주어진 바코드에 결합한다. 다양한 바코드에 대한 바인더의 친화도 스펙트럼을 본원에서는 '바인더 지문(Binder Fingerprint)'이라고 한다. 반대로, 바코드는 알려졌지만 다양한 친화도로 바인더 풀 내 임의의 주어진 바인더에 결합될 수 있다. 다양한 바인더에 대한 바코드의 친화도 스펙트럼을 본원에서는 '바코드 지문(Barcode Fingerprint)'이라고 한다. 따라서, 바코드가 표시된 특이적 단백질의 존재는, 예를 들어, 복합 용액에서 단백질과 회합된 바코드에 결합된 결합제(예를 들어, 파지) 집단의 회합된 핵산(예를 들어, 검출 가능한 핵산(예를 들어, DNA 서열, RNA 서열 등))을 추출하고 시퀀싱하여 검출할 수 있다.
단백질 서열을 식별하기 위해 바인더를 사용하는 다른 방법이 개발되었다. 그러나 이러한 방법은 바인더 생성 및 특성화의 어려움 및 바인더의 결합을 효과적으로 해독하여 단백질을 구체적으로 식별하는 것을 포함한 여러 가지 문제에 직면한다. 이전에 개발된 바인더의 또 다른 제한 사항은 비특이적 결합으로 인해 신호 대 노이즈 비(signal to noise ratio)가 좋지 않아 검출 정확도에 부정적인 영향을 미친다. 대조적으로, 본 기술은 많은 바인더를 빠르게 생성한다(예를 들어, 약 1주, 약 2주, 약 3주, 약 4주, 약 1개월, 약 2개월, 약 3개월, 약 4개월, 약 5개월, 약 6개월, 약 1년 내). 일부 실시양태에서, 예를 들어, 약 100 내지 약 1000개의 바인더가 빠르게 생성될 수 있다. 일부 실시양태에서, 약 10 내지 약 1000개의 바인더가 빠르게 생성될 수 있다. 일부 실시양태에서, 약 10 내지 약 10,000개의 바인더가 빠르게 생성될 수 있다. 일부 실시양태에서, 적어도 약 10,000개의 바인더가 빠르게 생성될 수 있다.
본원에 설명된 바와 같은 바인더는 강력하다(robust). 바인더는 다양한 조건 및/또는 환경에서 본원에 설명된 바와 같이 바코드에 (예를 들어, 하나 이상의 바코드에 대한 강력한 친화도로) 결합할 수 있다. 예를 들어, 본원에 설명된 바와 같은 바인더는 다양한 복합 환경(예를 들어, 혈액, 조직, 혈청, 혈장 등)에서 바코드에 (예를 들어, 하나 이상의 바코드에 대한 강력한 친화도로) 결합할 수 있다. 따라서, 본 개시내용의 바인더는 다양한 조건(예를 들어, 생리학적 조건)에서 표적(예를 들어, 관심 있는 단백질)을 검출하는 데 사용될 수 있다.
유사하게, 본원에 설명된 바와 같은 바코드는 신속하고 강력한 방식으로 생성될 수 있다. 일부 실시양태에서, 본원에 설명된 바와 같은 바코드는 본원에 설명된 바와 같은 바인더에 특이적이다. 일부 실시양태에서, 예를 들어, 약 100 내지 약 2000개의 바코드가 빠르게 생성될 수 있다(예를 들어, 약 1주, 약 2주, 약 3주, 약 4주, 약 1개월, 약 2개월, 약 3개월, 약 4개월, 약 5개월, 약 6개월 또는 약 1년 내). 일부 실시양태에서 약 10 내지 약 1000개의 바코드가 빠르게 생성될 수 있다. 일부 실시양태에서 약 10 내지 약 10,000개의 바코드가 빠르게 생성될 수 있다. 일부 실시양태에서, 적어도 약 10,000개의 바코드가 빠르게 생성될 수 있다.
본원에 설명된 바와 같은 바코드는 강력하다. 바코드는 다양한 조건 및/또는 환경에서 본원에 설명된 바와 같이 바인더에 (예를 들어, 하나 이상의 바인더에 대한 강력한 친화도로) 결합할 수 있다. 예를 들어, 본원에 설명된 바와 같은 바코드는 다양한 복합 환경(예를 들어, 혈액, 조직, 혈청, 혈장 등)에서 바인더에 (예를 들어, 하나 이상의 바인더에 대한 강력한 친화도로) 결합할 수 있다. 따라서, 본 개시내용의 바코드는 다양한 조건(예를 들어, 생리학적 조건)에서 표적(예를 들어, 관심 있는 단백질)을 검출하는 데 사용될 수 있다. 따라서, 본 개시내용은 본원에 설명된 컴퓨터 기술(예를 들어, 디콘볼루션(deconvolution) 방법)과 결합하여 사용될 수 있는 다수의 강력한 바인더 및 바코드를 신속하게 생성함으로써 기존 방법(예를 들어, 비특이적 결합, 다양한 환경에서의 가변 결합 등)의 단점 및 결함을 수정하여 특이적이고 잘 특성화된 바인더-바코드 결합/회합 및 정확한 검출 방법이 가능하다.
또한, 본 개시내용은 서로 및/또는 잠재적인 배경 단백질 서열과 쉽게 구별될 수 있도록 하나 이상의 펩티드 바코드 서열의 서열(들)을 변형시키는 능력을 구상한다. 유사하게, 본 개시내용은 서로 및/또는 잠재적인 배경 단백질 서열과 쉽게 구별될 수 있도록 하나 이상의 폴리펩티드 바인더 서열의 서열(들)을 변형시키는 능력도 구상한다.
무엇보다도, 본원에 설명된 바와 같은 본 발명은 단일 검정 또는 동물 모델에서 n ≥ 1인 'n'개의 개별 단백질 후보를 테스트하는 방법을 제공한다. 일부 실시양태에서, 단백질 후보는 치료 단백질 후보이다. 일부 실시양태에서, 다수의 단백질 후보가 설계되고 각 개별 단백질 후보는 본원에 설명된 바와 같이 자체 고유 펩티드 바코드와 회합된다. 이러한 바코딩은 비용 및 시간 효율적 방식으로 검정 및/또는 동물로의 단일 주입으로 모든 단백질 후보를 주입하는 것을 포함하지만 이에 제한되지 않는 많은 이점이 있다. 이후, 주입된 동물로부터 샘플(예를 들어, 조직 샘플, 혈청 샘플, 혈액 샘플, 세포 외 샘플, 단일 세포 샘플 등)을 얻고 바코드를 추출할 수 있다. 일부 실시양태에서, 이러한 추출된 바코드는 원래 주입된 단백질 후보의 상대적 풍부도의 척도를 제공한다. 예를 들어, 하나 이상의 추출된 바코드는 단백질 후보에 원래 결합된 바코드에 결합하는 것으로 알려진 (예를 들어, 결합제에서 발현된) 바인더 풀과 접촉시킴으로써 식별될 수 있다. 바코드와 바인더가 결합된 후, 결합된 결합제(예를 들어, 파지)가 선택되고 이의 검출 가능한 핵산(예를 들어, DNA 서열, RNA 서열 등)이 추출된다. 일부 실시양태에서, 추출된 핵산은 시퀀싱(예를 들어, 차세대 시퀀싱)을 거친다. 이어서 시퀀싱된 핵산을 사용하여 결합하도록 설계된 하나 이상의 바코드를 식별할 수 있으며, 이는 다양한 바인더-바코드 쌍 간의 결합 친화도에 대해 이전에 확립된 정보와 함께 원래 주입된 각 단백질의 상대적 풍부도를 식별하고 확인하는 데 사용할 수 있다.
또한, 예를 들어, 시퀀싱 실험으로부터의 핵산 개수를 단백질의 상대 또는 절대 정량으로 변환하는 데 사용되는 방법이 본원에 설명되어 있다. 일부 실시양태에서, 핵산 서열을 계수하고 단백질 서열로 인실리코(in silico) 번역한다. 본원에 설명된 바와 같이, 핵산 서열은 풀에 제공된 모든 바코드에 대해 확립되고 특성화된 친화도를 갖는 바인더 서열에 상응한다. 일부 실시양태에서, 바인더 수는 단일 바코드에 대한 결합에 대해 알려진 성향의 데이터베이스와 비교된다. 일부 실시양태에서, 바인더 수는 다수의 바코드(예를 들어, 2개 이상, 3개 이상 등)에 대한 결합에 대해 알려진 성향의 데이터베이스와 비교된다. 일부 실시양태에서, 예를 들어, 시퀀싱 실험에서, 바코드 및/또는 바코드와 회합된 단백질의 상대적 비율을 확인하기 위해 바인더 수의 상대적 비율이 직접 비교된다. 일부 실시양태에서, 당업자에게 공지될 수 있는 바와 같이, 알려진 풍부도(예를 들어, 수, 정량화, 농도 등)의 서열(예를 들어, 제어 서열 또는 보조 서열)이 주어진 바인더 또는 바인더들에 대한 절대 풍부도(예를 들어, 수, 정량화, 농도 등)를 확인하는 데에 활용(예를 들어, 시퀀싱 실험에 추가)되며, 이는 본원에 설명된 바와 같이 직접 계수 또는 선형 모델을 사용하여 바코드 또는 바코드(들) 및/또는 바코드(들)와 회합된 단백질(들)에 대한 절대 풍부도(예를 들어, 수, 정량화, 농도 등)를 평가하는 데에 사용될 수 있다.
일부 실시양태에서, 페이로드는 단백질이거나 이를 포함한다. 일부 실시양태에서, 페이로드는 치료 단백질이거나 이를 포함한다. 일부 실시양태에서, 페이로드는 본원에 설명된 바와 같이 바코드와 회합(예를 들어, 연결)되어 있다.
무엇보다도, 본 개시내용은 본원에 설명되어 있는 바와 같이 바코드, 바인더(예를 들어, 결합제(예를 들어, 표면에서 바인더가 발현됨)), 페이로드(예를 들어, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질))를 평가하는 방법을 제공한다. 일부 실시양태에서, 방법은 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질) 집단을 평가하는 단계; 평가를 만족시키는 집단 구성원과 그렇지 않은 집단 구성원을 분리하여 양성 집단, 음성 집단 또는 둘 다를 식별하는 단계; 양성 집단, 음성 집단 또는 서로 별도로 각 집단을 집단의 각 바코드에 특이적인 적어도 하나의 특정 바인더를 포함하는 바인더 세트와 접촉시키는 단계; 및 어떤 바인더가 분리된 구성원에 결합하는지 확인하여 어떤 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)가 접촉된 집단(들)에 존재하는지 확인하는 단계를 포함한다.
본 개시내용은 바인더 세트를 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)의 제1 집단 또는 제2 집단과 접촉시키거나 별도로 제1 집단 및 제2 집단 각각과 접촉시키는 단계; 및 세트의 어떤 바인더가 제1 집단, 제2 집단 또는 둘 다의 구성원에 결합하는지를 확인하여 어떤 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)가 접촉된 집단(들)에 존재하는지 확인하는 단계를 포함한다. 일부 실시양태에서, 각 바인더는 하나 이상의 바코드에 특이적으로(예를 들어, 알려진 친화도로) 결합한다. 일부 실시양태에서, 바인더 세트는 집합적으로 제1 집단 및 제2 집단의 바코드 각각에 대해 특정한 적어도 하나의 바인더를 포함한다. 일부 실시양태에서, 제1 집단과 제2 집단은 평가 성과에 기초하여 서로 분리되었다.
일부 실시양태에서, 방법은 성과 평가의 기능적 효과를 확인하기 위해 제1 집단과 제2 집단 사이의 차이를 확인하는 단계를 추가로 포함한다. 일부 실시양태에서, 방법은 적어도 하나의 페이로드(예를 들어, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질))에 결합하는 바인더를 분리하는 단계를 포함한다.
일부 실시양태에서, 확인 단계는 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)에 결합하는 바인더 개수를 정량화하는 단계를 포함한다. 일부 실시양태에서, 정량화는 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)에 결합하는 각 바인더의 뉴클레오티드 서열을 해독함으로써 수행될 수 있다. 일부 실시양태에서, 페이로드(예를 들어, 바코드가 표시된 단백질)에 결합하는 바인더 개수를 정량화하여 집단 내 페이로드(예를 들어, 단백질)의 척도를 제공한다.
일부 실시양태에서, 확인 단계는 결합된 파지 입자의 핵산을 증폭시키는 단계를 포함한다. 일부 실시양태에서, 확인 단계는 증폭된 핵산의 뉴클레오티드 서열을 확인하는 단계를 포함한다. 일부 실시양태에서, 확인된 뉴클레오티드 서열 중 하나 이상은 바인더의 코딩 서열에 상응한다. 일부 실시양태에서, 확인 단계는 바인더의 코딩 서열 중 확인된 서열(들)을 사용하여 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질) 집단으로부터 하나 이상의 페이로드(예를 들어, 단백질)를 검출하는 단계를 포함한다. 일부 실시양태에서, 확인 단계는 하나 이상의 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)를 질병, 장애 또는 병태를 치료하기 위한 치료제 또는 표적으로서 식별하는 단계를 포함한다.
일부 실시양태에서, 확인 단계는 증폭, 전파 및 시퀀싱(예를 들어, 핵산(예를 들어, DNA, RNA) 증폭, 전파 및/또는 시퀀싱) 중 하나 이상을 수행하는 단계를 포함한다. 일부 실시양태에서, 증폭은 중합효소 연쇄 반응(Polymerase Chain Reaction, PCR), 루프 매개 등온 증폭(Loop-mediated Isothermal Amplification, LAMP), 회전환 증폭(Rolling Circle Amplificationm RCA) 또는 유사한 공지 기술 중 하나 이상을 사용하여 수행될 수 있다. 일부 실시양태에서, 시퀀싱은 Illumina, 차세대 시퀀싱(Next Generation Sequencing, NGS), 나노포어 시퀀싱(nanopore sequencing), Pac Bio 롱 리드 시퀀싱(Pac Bio long read sequencing) 또는 유사한 공지 기술 중 하나 이상을 사용하여 수행될 수 있다.
일부 실시양태에서, 분리 단계는 샘플로부터 하나 이상의 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)를 정제하는 단계를 포함한다. 일부 실시양태에서, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)는 복합 샘플로부터 정제된다. 일부 실시양태에서, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)는 복합 혼합물로부터 정제된다. 일부 실시양태에서, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)는 친화도 정제 방법(예를 들어, FLAG IP, 단백질 G/A) 또는 단백질 침전 방법을 사용하여 정제된다.
일부 실시양태에서, 방법은 바코드가 표시된 페이로드 집단을 동물에게 주입하는 단계를 추가로 포함한다. 일부 실시양태에서, 방법은 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질) 집단을 동물에게 주입하는 단계를 추가로 포함한다. 일부 실시양태에서, 각 바코드는 파지에서 발현된 특이적 바인더에 결합된다. 일부 실시양태에서, 방법은 동물로부터 샘플을 얻어 평가를 받는 단계를 추가로 포함한다.
일부 실시양태에서, 본원에 설명된 바와 같은 방법은 샘플에 존재하는 각 바인더의 상대량을 확인하여 샘플에 존재하는 주입된 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질) 집단의 하위세트를 식별하는 단계를 포함한다. 일부 실시양태에서, 본원에 설명된 바와 같은 방법은 상대량을 샘플에 존재하는 각 바인더의 절대량을 확인하기 위해 알려진 농도의 표준과 비교하는 단계를 포함한다.
일부 실시양태에서, 본원에 설명된 바와 같은 방법은 식별된 페이로드(예를 들어, 단백질)의 하위세트를 사용하여 본원에 설명된 방법 단계 중 하나 이상을 반복하는 단계를 선택적으로 포함한다.
일부 실시양태에서, 본원에 설명된 바와 같은 방법은 하나 이상의 페이로드(예를 들어, 단백질)를 질병, 장애 또는 병태를 치료하기 위한 치료제 또는 표적으로서 식별하는 단계를 포함한다.
일부 실시양태에서, 본원에 설명된 바와 같은 방법은 임의의 회합되지 않은(예를 들어, 결합되지 않은) 바인더를 제거하는 단계를 포함한다. 일부 실시양태에서, 제거는 세척에 의해 수행될 수 있다.
일부 실시양태에서, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)는 샘플 내에 있다. 일부 실시양태에서, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)는 복합 샘플 내에 있다. 일부 실시양태에서, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)는 복합 혼합물 내에 있다. 일부 실시양태에서, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)는 정제된 샘플 내에 있다.
일부 실시양태에서, 샘플은 혈청, 혈액, 조직 또는 종양 중 하나 이상이거나 이를 포함한다. 일부 실시양태에서, 샘플은 대조군(예를 들어, 양성 대조군 또는 음성 대조군)이다.
일부 실시양태에서, 샘플은 복합 샘플이다. 일부 실시양태에서, 복합 샘플은 조직이거나 이를 포함한다. 일부 실시양태에서, 복합 샘플은 혈액이거나 이를 포함한다. 일부 실시양태에서, 복합 샘플은 복합 혼합물이다. 일부 실시양태에서, 복합 샘플은 혈청, 혈액 또는 조직 중 하나 이상이거나 이를 포함한다.
일부 실시양태에서, 바코드는 하나 이상의 아미노산이거나 이를 포함한다. 일부 실시양태에서, 바코드는 페이로드(예를 들어, 단백질)의 상보성 결정 영역(Complementarity-Determining Region, CDR)에 포함된다. 일부 실시양태에서, 바코드는 합성 바코드이다. 일부 실시양태에서, 바코드는 1-100개, 5-50개, 8-25개, 9-25개 또는 9-15개 아미노산 길이이다. 일부 실시양태에서, 바코드는 10개 아미노산 길이이다. 일부 실시양태에서, 바코드는 페이로드(예를 들어, 단백질) 기능에 비교적 영향을 미치지 않는다. 일부 실시양태에서, 바코드는 면역 반응을 유발하지 않는다. 일부 실시양태에서, 바코드는 서로 직교한다. 일부 실시양태에서, 적어도 하나의 바코드는 관심 있는 폴리펩티드(예를 들어, 폴리펩티드 바인더, 페이로드)와 연결된다.
일부 실시양태에서, 바코드는 페이로드(예를 들어, 단백질)에 부착된다. 일부 실시양태에서, 바코드는 페이로드(예를 들어, 단백질) 상의 적합한 위치에 부착된다. 일부 실시양태에서, 적합한 위치는 N-말단 또는 C-말단이다.
일부 실시양태에서, 바인더는 파지에 표시되는 결합 모이어티이거나 이를 포함한다. 일부 실시양태에서, 바인더 세트의 각 바인더는 파지에서 발현된다. 일부 실시양태에서, 바인더는 파지 입자 표면에서 발현된다.
일부 실시양태에서, 파지는 M13, T4, T7, 람다(Lambda) 및 사상(filamentous) 파지로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 파지는 M13이다.
본 개시내용은 무엇보다도 뉴클레오티드 서열이 펩티드 바코드를 암호화(encoding)하는 서열이거나 이를 포함하는 핵산을 제공한다. 일부 실시양태에서, 펩티드 바코드는 1 내지 100개, 5 내지 50개, 8 내지 25개, 9 내지 25개 또는 9 내지 15개 아미노산 범위 내의 길이이다. 일부 실시양태에서, 펩티드 바코드는 8 내지 25개 아미노산 길이이다. 일부 실시양태에서, 펩티드 바코드는 10개 아미노산 길이이다. 일부 실시양태에서, 펩티드 바코드는 바인더 세트 내의 특정 폴리펩티드 바인더 그룹에 특이적으로 결합하는 것으로 확인되었다.
일부 실시양태에서, 펩티드 바코드는 서열번호 5347-8398로 이루어진 군으로부터 선택된 아미노산 서열을 갖는다. 일부 실시양태에서, 암호화 서열은 서열번호 1148-4199로 이루어진 군으로부터 선택된다.
본 개시내용은 복수의 핵산을 포함하는 라이브러리를 제공한다. 일부 실시양태에서, 복수의 핵산은 함께 펩티드 바코드의 집합체(collection)를 암호화한다. 일부 실시양태에서, 각 핵산은 5'에서 3' 또는 3'에서 5'의 순서로 다음 중 하나 이상을 포함한다: a) 제1 불변 서열(invariant sequence)(예를 들어, 링커 서열 또는 페이로드 서열); b) 적어도 9개 뉴클레오티드 길이인 변이체 서열; 및 c) 제2 불변 서열(예를 들어, 링커 서열, 정지 코돈 또는 페이로드 서열).
일부 실시양태에서, 변이체 서열은 적어도 15, 24, 27, 45, 150 또는 300개 뉴클레오티드 길이이다.
일부 실시양태에서, 라이브러리는 d) 짧은 나선형 모티프를 함유하는 서열; e) 무질서한 모티프를 함유하는 서열; f) 관심 있는 단백질에 서열을 연결하는 불변 서열 중 하나 이상을 포함한다.
일부 실시양태에서, 집합체의 각 펩티드 바코드는 바인더 세트 내의 특정 폴리펩티드 바인더 그룹에 특이적으로 결합한다. 일부 실시양태에서, 집합체의 각 펩티드 바코드는 바인더 세트 내의 하나 이상의 폴리펩티드 바인더에 특이적으로 결합한다.
본 개시내용은 뉴클레오티드 서열이 폴리펩티드 바인더 모이어티를 암호화하는 서열이거나 이를 포함하는 핵산을 제공한다. 일부 실시양태에서, 폴리펩티드 바인더 모이어티는 10 내지 400개 아미노산 범위 내의 길이이다. 일부 실시양태에서, 폴리펩티드 바인더 모이어티는 바코드 집합체 내의 특정 펩티드 바코드 그룹에 특이적으로 결합하는 것으로 확인되었다.
일부 실시양태에서, 폴리펩티드 바인더 모이어티는 서열번호 4200-5346으로 이루어진 군으로부터 선택된 아미노산 서열을 갖는다. 일부 실시양태에서, 암호화 서열은 서열번호 1-1147로 이루어진 군으로부터 선택된다.
본 개시내용은 복수의 핵산을 포함하는 라이브러리를 제공한다. 일부 실시양태에서, 복수의 핵산은 함께 폴리펩티드 바인더 모이어티 세트를 암호화한다. 일부 실시양태에서, 각 핵산은 5'에서 3' 또는 3'에서 5'의 순서로 a) 제1 불변 서열(예를 들어, 항체 생식계열 서열(antibody germline sequence)(예를 들어, IGHV/IGKV)); b) 적어도 10개 뉴클레오티드 길이인 제1 변이체 서열(예를 들어, CDR(예를 들어, CDR3) 서열); 및 c) 제2 불변 서열(예를 들어, 항체 생식계열 서열(예를 들어, IDHJ/IGKJ))을 포함한다.
일부 실시양태에서, 각 핵산은 d) 정지 코돈(예를 들어, 제2 불변 서열 뒤); e) 링커 서열; f) 제3 불변 서열(예를 들어, 항체 생식계열 서열(예를 들어, IGHV/IGKV)); g) 적어도 10개 뉴클레오티드 길이인 제2 변이체 서열(예를 들어, CDR(예를 들어, CDR3) 서열); 및 h) 제4 불변 서열(예를 들어, 항체 생식계열 서열(예를 들어, IDHJ/IGKJ)) 중 하나 이상을 추가로 포함한다.
본 개시내용은 무엇보다도 파지 입자 라이브러리를 제공하며, 각 파지 입자는 본원에 설명된 바와 같은 핵산을 하나 이상 포함한다.
일부 실시양태에서, 파지는 M13, T4, T7, 람다 및 사상 파지로 이루어진 군으로부터 선택된다. 일부 실시양태에서, 파지는 M13이다.
본 개시내용은 바코드와 바인더 세트를 제공한다. 일부 실시양태에서, 각 바코드는 세트 내 바인더 중 특정 바인더 그룹에 특이적으로 결합하는 1 내지 100개, 5 내지 50개, 8 내지 25개, 9 내지 25개 또는 9 내지 15개 아미노산 길이의 펩티드이다. 일부 실시양태에서, 각 바인더는 세트 내 바코드 중 적어도 하나의 바코드에 특이적으로 결합하는 폴리펩티드이다.
일부 실시양태에서, 바코드와 접촉된 파지에서 바인더가 발현될 때 특이적 결합이 관찰된다. 일부 실시양태에서, 각 바인더는 파지에서 발현된다.
본 개시내용은 바인더 세트를 포함하는 키트를 제공하며, 각 바인더는 집합체 바코드의 적어도 특정 펩티드 바코드에 특이적으로 결합하는 폴리펩티드이다. 일부 실시양태에서, 각 바인더는 폴리펩티드, 폴리펩티드를 암호화하는 핵산 또는 둘 다로서 제공된다. 일부 실시양태에서, 하나 이상의 바인더는 바인더를 발현하도록 조작된 파지 입자 또는 이의 집합체로 제공된다. 일부 실시양태에서, 하나 이상의 바인더는 파지미드 벡터(phagemid vector)의 핵산으로서 또는 파지 벡터로의 클로닝에 적합한 삽입물로서 제공된다.
일부 실시양태에서, 키트는 각 바인더에 대한 펩티드 바코드를 지정하는 정보를 추가로 포함한다. 일부 실시양태에서, 각 바인더는 세트의 바인더 중 적어도 하나에 특이적으로 결합하는 바코드 집합체의 적어도 특정 펩티드 바코드에 특이적으로 결합하는 것으로 확인되었다.
일부 실시양태에서, 키트는 하나 이상의 바코드에 결합된 하나 이상의 파지 입자의 시퀀싱을 수행하기 위한 지시사항 세트를 추가로 포함한다. 일부 실시양태에서, 키트는 시퀀싱 데이터를 해독하기 위한 컴퓨터 판독 가능 프로그램을 추가로 포함한다. 일부 실시양태에서, 키트는 파지 입자에 바인더를 발현시키기 위한 시약을 추가로 포함한다.
일부 실시양태에서, 키트는 하나 이상의 바코드를 암호화하는 핵산을 포함한다. 일부 실시양태에서, 키트는 하나 이상의 바인더를 암호화하는 핵산을 포함한다.
본 개시내용은 약동학적 스크리닝(pharmacokinetic screening) 방법을 제공한다. 일부 실시양태에서, 방법은 바코드가 표시된 치료 후보 단백질 세트를 동물에 주입하는 단계를 포함한다. 일부 실시양태에서, 바코드가 표시된 각 치료 후보 단백질은 특이적 펩티드 바코드를 포함한다. 일부 실시양태에서, 방법은 동물로부터 샘플을 얻는 단계; 샘플로부터 하나 이상의 바코드가 표시된 치료 후보 단백질을 정제하는 단계; 샘플의 각 바코드에 특이적인 적어도 하나의 특정 바인더를 포함하는 바인더 세트(예를 들어, 바인더가 발현되어 있는 결합제)와 샘플을 접촉시키는 단계; 및 바코드가 표시된 각 치료 후보 단백질의 약동학적 특성 또는 생체분포를 확인하기 위해 샘플에 존재하는 각 바인더의 상대량을 확인하는 단계를 포함한다.
일부 실시양태에서, 정제된 단백질은 동물에 주입되는 바코드가 표시된 치료 후보 단백질의 하위세트일 수 있다.
일부 실시양태에서, 다수의 샘플은 동물로부터 얻을 수 있다.
일부 실시양태에서, 동물은 포유동물이다. 일부 실시양태에서, 동물은 인간이다. 일부 실시양태에서, 동물은 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)를 발현하도록 유전자 변형된다.
일부 실시양태에서, 동물은 질병, 장애 또는 병태에 대한 모델이다. 일부 실시양태에서, 질병, 장애 또는 병태는 암, 자가면역, 신경퇴행성 또는 병원성(예를 들어, 바이러스/세균) 질병, 장애 또는 병태이다.
일부 실시양태에서, 확인 단계는 (ⅰ) 바인더를 발현하는 결합제로부터 핵산을 시퀀싱하는 단계; (ⅱ) 존재하는 각 바코드의 상대량을 해독하여 각 치료 후보 단백질의 상대량을 확인하는 단계; 및/또는 (ⅲ) FACS 또는 MACS(자기 활성화 세포 분류(magnetic activated cell sorting)) 중 하나 이상, 친화도 기반 정제를 수행하는 단계를 포함한다.
일부 실시양태에서, 확인 단계는 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질(예를 들어, 바코드가 표시된 치료 단백질))에 결합하는 바인더 개수를 정량화하는 단계를 포함한다. 일부 실시양태에서, 정량화는 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)에 결합하는 각 바인더의 뉴클레오티드 서열을 해독함으로써 수행된다.
일부 실시양태에서, 다수의 뉴클레오티드 서열은 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질) 집단 내 페이로드(예를 들어, 표적 단백질)의 척도를 제공한다.
일부 실시양태에서, 주입 단계는 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질, 바코드가 표시된 치료 후보 단백질 등)를 경구 또는 정맥 내로 투여하는 단계를 포함한다. 일부 실시양태에서, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)는 바이러스 전달 또는 mRNA 전달에 의해 주입(예를 들어, 전달)된다.
본 개시내용은 (ⅰ) 파지 입자 라이브러리로서, 각 파지 입자는 폴리펩티드 바인더를 발현하도록 설계되고, 각 바인더는 하나 이상의 펩티드 바코드에 결합하는 라이브러리; (ⅱ) 펩티드 바코드 집합체를 제공하는 단계; 각 파지 입자를 각 바코드와 접촉시켜 결합된 파지-바코드 입자를 형성하는 단계; 각 파지 입자와 바코드 사이의 결합량을 확인하는 단계; 및 집합체의 바코드와 라이브러리의 파지 중에서 서로 특이적으로 결합하는 파지-바코드 쌍을 식별하는 단계를 포함하는, 펩티드 바코드 집합체를 특성화하는 방법을 제공한다.
본 개시내용은 (ⅰ) 바인더 세트로서, 각 바인더는 하나 이상의 펩티드 바코드에 결합하는 폴리펩티드인 바인더 세트; (ⅱ) 펩티드 바코드 집합체를 제공하는 단계; 각 바인더를 각 바코드와 접촉시켜 결합된 바인더-바코드 입자를 형성하는 단계; 각 폴리펩티드 바인더와 펩티드 바코드 사이의 상대적 결합량을 확인하는 단계; 및 집합체의 바코드와 세트의 바인더 중에서 서로 특이적으로 결합하는 바인더-바코드 쌍을 식별하는 단계를 포함하는, 펩티드 바코드 집합체를 특성화하는 방법을 제공한다.
본 개시내용은 펩티드 바코드 집합체에 대한 아미노산 또는 암호화 핵산 서열의 데이터베이스를 제공하며, 이 데이터베이스는 컴퓨터 판독 가능 형식으로 구현된다. 일부 실시양태에서, 각 바코드 서열은 1 내지 100개, 5 내지 50개, 8 내지 25개, 9 내지 25개 또는 9 내지 15개 아미노산 범위 내의 길이이다. 일부 실시양태에서, 각 바코드 서열은 각각 집합체의 하나 이상의 바코드에 특이적으로 결합하는 바인더 세트 내의 하나 이상의 폴리펩티드 바인더에 특이적으로 결합하는 것으로 확인되었다.
일부 실시양태에서, 펩티드 바코드를 식별하기 위해 하나 이상의 폴리펩티드 바인더와 바코드의 결합 패턴을 사용한다.
본 개시내용은 폴리펩티드 바인더 세트에 대한 아미노산 또는 암호화 핵산 서열의 데이터베이스를 제공한다. 일부 실시양태에서, 데이터베이스는 컴퓨터 판독 가능 형식으로 구현된다. 일부 실시양태에서, 각 바인더 서열은 10 내지 400개 아미노산 범위 내의 길이이다. 일부 실시양태에서, 각 바인더 서열은 각각 세트의 하나 이상의 바인더에 특이적으로 결합하는 바코드 집합체 내의 하나 이상의 펩티드 바코드에 특이적으로 결합하는 것으로 확인되었다.
본 개시내용은 무엇보다도 컴퓨터 판독 가능 형식으로 구현되는, 바코드-바인더회합 세트에 대한 아미노산 또는 암호화 핵산 서열의 데이터베이스를 제공한다. 일부 실시양태에서, 각 바코드는 1 내지 100개, 5 내지 50개, 8 내지 25개, 9 내지 25개 또는 9 내지 15개 아미노산 길이의 펩티드이다. 일부 실시양태에서, 각 바인더는 세트의 바코드 중 하나 이상의 바코드에 특이적으로 결합하는 폴리펩티드이다.
본 개시내용은 컴퓨터 판독 가능 형식으로 구현되는 바코드-바인더 회합 지정 세트를 제공한다. 일부 실시양태에서, 각 바코드는 1 내지 100개, 5 내지 50개, 8 내지 25개, 9 내지 25개 또는 9 내지 15개 아미노산 길이의 펩티드이다. 일부 실시양태에서, 각 바인더는 세트의 바코드 중 하나 이상의 바코드에 특이적으로 결합하는 폴리펩티드이다.
일부 실시양태에서, 바인더는 파지 입자에서 발현된 다음 바코드와 접촉될 때 특이적 결합이 관찰된다.
본 개시내용은 본원에 설명된 기술을 사용한 치료 방법을 제공한다. 일부 실시양태에서, 방법은 평가를 만족시키는 것으로 확인된 치료 단백질을 투여하는 단계를 포함한다. 일부 실시양태에서, 평가를 만족시키는 것은 a) 바코드가 표시된 단백질 집단을 평가하는 단계; b) 평가를 만족시키는 집단 구성원과 그렇지 않은 집단 구성원을 분리하여 양성 집단, 음성 집단 또는 둘 다를 식별하는 단계; c) 양성 집단, 음성 집단 또는 서로 별도로 각 집단을 집단의 각 바코드에 특이적인 적어도 하나의 특정 바인더를 포함하는 바인더 세트와 접촉시키는 단계; d) 어떤 바인더가 분리된 구성원에 결합하는지 확인하여 어떤 바코드 단백질이 접촉된 집단(들)에 존재하는지 확인하는 단계; 및 e) 접촉된 집단(들)에 존재하는 것으로 확인된 바코드가 표시된 단백질로부터 치료 단백질을 식별하는 단계를 포함하는 프로세스에 의한 것일 수 있다.
본 개시내용은 a) 바인더 세트를 바코드가 표시된 단백질의 제1 집단, 제2 집단과 접촉시키거나 별도로 제1 집단 및 제2 집단 각각과 접촉시키는 단계; b) 세트의 어떤 바인더가 제1 집단, 제2 집단 또는 둘 다의 구성원에 결합하는지 확인하여 어떤 바코드가 표시된 단백질이 접촉된 집단(들)에 존재하는지 확인하는 단계; 및 c) 접촉된 집단(들)에 존재하는 것으로 확인된 바코드가 표시된 단백질로부터 치료 단백질을 식별하는 단계를 포함하는 프로세스에 의한 평가를 만족시키는 것으로 확인된 치료 단백질을 투여하는 단계를 포함한다. 일부 실시양태에서, 각 바인더는 다른 바코드에 비해 하나 이상의 바코드에 특이적으로 결합한다. 일부 실시양태에서, 바인더 세트는 제1 집단 및 제2 집단의 각 바코드에 특정한 바인더를 집합적으로 포함한다. 일부 실시양태에서, 제1 집단과 제2 집단은 평가 성과에 기초하여 서로 분리되었다.
본 개시내용에 포함되는 이러한 측면 및 다른 측면은 이하 및 청구범위에서 더 자세히 설명된다.
도 1a는 예시적인 실시양태에 따른, 본원에 설명된 바와 같은 바코드가 표시된 페이로드의 개략도이다. 이는 바코드가 표시된 페이로드와 바코드가 표시된 페이로드를 암호화하는 상응하는 DNA를 예시한다. LN은 "링커 N 말단"을 지칭하고 LC는 "링커 C 말단"을 지칭한다. 일부 실시양태에서, LN 및 LC 서열은 불변 서열이고 페이로드를 바코드에 연결하는 아미노산을 암호화한다. 일부 실시양태에서, LN 및 LC 서열은 불변 서열이고, 각각 다른 페이로드를 갖는 바코드의 모듈식 클로닝(modular cloning)에 사용되는 핵산 서열이다. 일부 실시양태에서, LN 및 LC 서열은 Type ⅡS 제한 부위 서열 옆에 있다.
도 1b는 예시적인 실시양태에 따른, 본원에 설명된 바와 같은 바코드가 표시된 페이로드의 개략도이다. 이는 바코드 및/또는 바코드가 표시된 페이로드를 암호화하는 핵산 서열을 예시한다. LN은 "링커 N 말단"을 지칭하고 LC는 "링커 C 말단"을 지칭한다. 일부 실시양태에서, LN 및 LC 서열은 불변 서열이고 페이로드를 바코드에 연결하는 아미노산을 암호화한다. 일부 실시양태에서, LN 및 LC 서열은 불변 서열이고, 각각 다른 페이로드를 갖는 바코드의 모듈식 클로닝에 사용되는 핵산 서열이다. 일부 실시양태에서, LN 및 LC 서열은 Type IIS 제한 부위 서열 옆에 있다.
도 2는 예시적인 실시양태에 따른, 본원에 설명된 바와 같은 바코드 및 결합제를 사용하여 풀에서 페이로드(예를 들어, 단백질)를 검출 및/또는 정량화 및/또는 특성화하는 방법의 개략도이다. 바코드가 표시된 페이로드 단백질 라이브러리는 식별 DNA를 함유하는 결합제 라이브러리와 접촉된다. 바코드가 표시된 임의의 페이로드 단백질에 회합(예를 들어, 연결(예를 들어, 강한 연결을 형성))하지 않는 결합제를 제거하고 바코드와 회합하는 결합제만 남기는 세척 단계가 적용된다. 세척 후에 DNA 시퀀싱 과정이 회합된 결합제에 적용된다. 일부 실시양태에서, 시퀀싱은 차세대 시퀀싱(NGS)을 사용하여 수행될 수 있다(예를 들어, Illumina 시퀀서에 의해 작동됨). DNA 서열의 상대적 풍부도는 컴퓨터 파일(예를 들어, .fastq 데이터)로 보고된다. 풀에 있는 바코드가 표시된 각 페이로드 단백질의 풍부도를 추론하기 위해 결합제의 이전 생물물리학적 특성 분석과 결합된 .fastq 데이터에 컴퓨터 알고리즘이 적용된다.
도 3a는 예시적인 실시양태에 따른, 본원에 설명된 바와 같은 결합제에 의해 접촉될 수 있도록 본원에 설명된 바와 같은 바코드 캡처 개략도이다. 이는 회합되는(예를 들어, 표면에 고정되는) 바코드를 가질 수 있는 캡처 스캐폴드(capture scaffold)를 예시하며, 결합제(예를 들어, 표면에 바인더가 발현된 파지(예를 들어, 파지에 바인더 DNA가 있음))가 접촉되어 생물물리학적 상호작용을 특성화한다. 일부 실시양태에서, 생물물리학적 특성화는 결합제와 단백질 바코드 사이의 해리 상수(Kd)의 척도이다.
도 3b는 예시적인 실시양태에 따른, 본원에 설명된 바와 같은 결합제에 의해 접촉될 수 있도록 본원에 설명된 바와 같은 바코드 캡처 개략도이다. 이는 예시적인 실시양태에 따른, 본원에 설명된 바와 같은 바코드-바인더 플랫폼의 개략도이다. 본 개략도는 보편적으로 태깅된(예를 들어, HALO, 키틴 BD, Avitag(Strep) 등) 바코드가 표시된 페이로드에 접합된 비드 결합 도메인이 있는 자기 비드를 보여준다. 캡처된 바코드가 표시된 페이로드를 검출하기 위해 바코드에 대해 알려진 친화도의 결합제(예를 들어, 표면에서 바인더를 발현하는 파지(예를 들어, 바인더 DNA/lib가 있는 파지))가 고정된 페이로드에 결합된다. 이어서 바인더를 암호화하는 파지 내의 DNA가 증폭되고 NGS를 거쳐 페이로드가 검출된다.
도 3c는 예시적인 실시양태에 따른, 본원에 설명된 바와 같은 결합제에 의해 접촉될 수 있도록 본원에 설명된 바와 같은 바코드 캡처 개략도이다. 이는 예시적인 실시양태에 따른, 본원에 설명된 바와 같은 바코드 바인더 플랫폼의 개략도이다. 본 개략도는 Fc/단백질 A 접합된 바코드가 표시된 페이로드가 있는 자기 비드를 보여준다. 캡처된 바코드가 표시된 페이로드를 검출하기 위해 바코드에 대해 알려진 친화도의 결합제(예를 들어, 표면에서 바인더를 발현하는 파지(예를 들어, 바인더 DNA/lib가 있는 파지))가 고정된 페이로드에 결합된다. 이어서 바인더를 암호화하는 파지 내의 DNA가 증폭되고 NGS를 거쳐 페이로드를 검출한다.
도 4는 예시적인 실시양태에 따른, 본원에 설명된 바와 같은 주어진 바코드의 바코드 지문 학습 방법의 개략도이다. 캡처 스캐폴드에 표시된 펩티드 바코드는 식별 DNA를 함유하는 결합제 라이브러리와 접촉된다. 어떠한 바코드와도 회합(예를 들어, 연결(예를 들어, 강한 연결을 형성))하지 않는 결합제를 제거하고, 바코드와 회합하는 결합제만 남기는 세척 단계가 적용된다. 세척 후, DNA 시퀀싱 과정이 회합된 결합제에 적용된다. 일부 실시양태에서, 시퀀싱은 차세대 시퀀싱(NGS)을 사용하여 수행될 수 있다(예를 들어, Illumina 시퀀서에 의해 작동됨). DNA 서열의 상대적 풍부도는 컴퓨터 파일로(예를 들어, .fastq 형식으로) 보고된다. 컴퓨터 알고리즘이 .fastq 데이터에 적용되어 바코드 지문을 전산화한다. 이는 결합제 라이브러리 구성원의 상대적 수에 대한 벡터이다. 바코드 지문 학습 방법은 임의의 바코드에 대해 반복하여 고유 지문을 식별할 수 있다. 일부 실시양태에서, 기존 지문이 있는 바코드 또는 새로운 바코드에 대해 지문을 개선하기 위해 집중된 결합제 라이브러리로 시작할 때마다 도 4의 단계 1-4를 반복할 수 있다. 일부 실시양태에서, 집중된 결합제 라이브러리는 올리고뉴클레오티드 라이브러리 합성에 의해 만들어진다.
도 5는 예시적인 실시양태에 따른, 바코드 혼합물의 상대적 풍부도를 확인하기 위해 바코드 세트의 지문 행렬을 사용하는 방법의 개략도이다. 개별 지문이 확인된 바코드 세트는 알려진 비율로 함께 결합되고 결합제 라이브러리와의 후속 접촉을 위해 (예를 들어, 스캐폴드에) 표시된다. 결합제 라이브러리는 바코드 세트와 접촉되고 비특이적 결합제는 세척되어 제거된다. 특이적 결합제는 NGS에 의해 정량화되고 혼합 측정(mixed measurement) 컴퓨터 파일로(예를 들어, .fastq 형식으로) 보고된다. 이 데이터는 혼합 측정을 사용하여 원본 지문에 대한 판독값의 상대적 스케일링을 학습하고 스케일링된 지문을 스케일링된 행렬로 함께 조립하는 컴퓨터 알고리즘에 제공된다. 이 스케일링된 지문 행렬은 결합제 라이브러리와 샘플을 접촉시켜 NGS 판독에 컴퓨터 알고리즘이 적용되는, 이러한 바코드를 사용하여 바코드가 표시된 페이로드의 상대적 풍부도를 정량화하는 추가 응용분야에 사용될 수 있다.
도 6a-6c는 바코드의 복합 혼합물을 정량화한 결과를 보여준다. 최대 6개의 바코드를 모은 다음 본원에 설명된 해독 방법을 사용하여 측정하였다. 도 6a는 주어진 바코드의 실제 상대적 비율(왼쪽 패널)과 주어진 바코드의 측정된 상대적 비율(오른쪽 패널)을 보여준다. 행은 개별 실험 조건이고 열은 바코드이고 색상은 측정값이다(100% 바코드 = 흰색, 0% 바코드 = 검은색). 도 6b는 모든 바코드에 걸쳐 비교한, 모든 실험에 대한 바코드의 실제 농도에 대한 측정된 바코드 농도의 플롯을 보여준다. 모든 실험과 혼합물에 걸쳐 측정된 비율과 실제 비율 사이의 피어슨(pearson)이 0.95로 계산되었다. 도 6c는 혼합물 내의 각 바코드의 상대적 풍부도를 예측하는 데 사용된 혼합물뿐만 아니라 각 단일 바코드 측정에 대해 백만회당 개수로 정규화된 NGS 개수 값의 플롯을 보여준다. 행은 실험이므로 행의 모든 값은 단일 .fastq 파일로부터 생성되고 열은 결합제이다. 도 6c는 서열번호 8400-8413을 각각 등장 순서대로 개시한다.
도 7a-7b는 단백질 서열의 내부 영역 내에 바코드가 함유된(즉, 내인성 바코드) 페이로드 단백질에 대한 해독 방법 및 이를 사용하여 얻은 데이터의 개략도를 보여준다. 본 개략도는 합성 풀 바코드 측정 검정 결과를 보여준다. 도 7a는 2개의 바코드가 표시된 페이로드(BC1 및 BC2)가 96웰 플레이트의 각각 다른 웰에서 다양한 알려진 농도로 함께 결합되었음을 보여준다. 각 혼합물을 동일한 결합제 풀과 접촉시키고 본원에 설명된 바와 같이 해독하였다. 각 혼합물을 정량화한 다음 바코드가 표시된 페이로드의 알려진 값과 비교하였다. 도 7b는 각 바코드의 상대적 실제 비율(X축)이 피어슨 .96으로 상대적 측정 비율(Y축)과 상관관계가 있음을 보여준다.
도 8a-8c는 예시적인 실시양태에 따른, 본원에 설명된 바와 같이 바코드-바인더 플랫폼을 사용하여 혈청 내 단백질 페이로드를 검출하는 방법의 개략도를 보여준다. 페이로드 단백질에는 단백질 서열의 내부 영역 내에 바코드가 함유되어 있다(즉, 내인성 바코드). 도 8a는 바코드가 표시된 관심 있는 치료 항체 작용제(바코드가 표시된 mAb)가 알려진 농도로 혼합된 다음 혈청에 첨가되었음을 보여준다. 이어서 바코드가 표시된 페이로드를 정제하고 결합제와 접촉시킨 후 해독하였다. 도 8b는 3가지 실험 조건에 대한 상대적 실제 바코드 항체 비율(왼쪽)과 상대적 측정 항체 비율(오른쪽)을 각각 3회 반복한 것을 보여준다. 행은 실험 조건에 해당하고 열은 바코드에 해당하며 히트맵 셀(heat-map cell)의 색상은 존재하는 바코드가 표시된 항체 비율의 척도이다. 도 8c는 모든 실험 측정에 걸쳐 스피어만(Spearman) 상관계수가 .926인 모든 바코드에 대한 모든 실험 조건에 걸친 모든 데이터의 산점도(scatterplot)를 보여준다.
도 9a는 실시예 1, 2 및 8에 제공된 실험 설명의 개략도를 보여준다. 6개의 고유 바코드(BC1, BC2, BC3, BC4, BC5 및 BC6)를 알려진 비율로 혼합하고 결합제와 접촉시키고 본원에 설명된 바와 같이 해독하였다. 2개의 바코드가 실험적으로 음성 대조군으로 제외되었지만 이러한 바코드에 대한 예측이 허용되어 배경 예측을 확인할 수 있었다.
도 9b도 9c는 6개의 고유 바코드에 대한 10배 범위의 농도에 걸친 해독 절차의 정확성에 대한 데이터를 보여준다. 도 9b는 알려진 바코드 농도의 한 혼합물에 대해 해독 후 얻은 측정 데이터와 실제 데이터(입력) 플롯을 보여준다. 알려진 입력 농도(왼쪽 막대)는 3회 반복에 걸쳐 각 바코드에 대한 예측/측정 데이터(오른쪽 막대) 옆에 표시된다. 도 9c는 알려진 바코드 농도의 5가지 각각 다른 혼합물(즉, 풀 1-5)에 대해 해독한 후 얻은 측정 데이터와 실제 데이터(입력) 플롯을 보여준다. 알려진 입력 농도(왼쪽 막대)는 3회 반복에 걸쳐 각 바코드에 대한 예측/측정 데이터(오른쪽 막대) 옆에 표시된다.
도 10a-10c는 본원에 설명된 바와 같은, 단일 테스트 바코드의 절대 농도를 확인하기 위한 방법 및 데이터를 보여준다. 도 10a는 실험의 개략도를 보여준다. 단일 테스트 바코드는 여러 농도에서 검정되었으며, "스파이크인(spike-in)" 바코드(즉, 기준 바코드)가 알려진 농도의 각 검정 혼합물에 추가되었다. 다양한 농도의 테스트 바코드를 결합제와 접촉시키고 해독을 본원에 설명된 바와 같이 수행하였다. "스파이크인" 바코드의 예측을 사용하여 측정할 테스트 바코드의 절대량을 확인하였다. 도 10b는 테스트 바코드의 각 적정에 대해 테스트 바코드의 알려진 입력 농도(왼쪽 막대)와 비교한 테스트 바코드의 측정 절대량(오른쪽 막대) 플롯을 보여준다. Y축은 밀리리터당 나노그램(ng/mL) 단위의 테스트 바코드 농도의 로그이다. 도 10c는 6가지 각각 다른 바코드에 대한 절대 농도의 확인 결과를 보여준다. 6개의 각각 다른 바코드에 대해 알려진 입력 농도(왼쪽 막대)와 측정 농도(오른쪽 막대)가 표시되어 있다.
도 11은 예시적인 실시양태에 따라 본원에 설명된 바인더-바코드 시스템을 사용한, 생체 내 주입 후 두 단백질의 상대적 풍부도를 확인하는 방법을 보여준다. 본 도면은 실험 설정을 그래픽으로 보여준다. 그룹 1(상단)에서는 마우스에 바코드가 표시된 페이로드가 1개 주입되었다. 그룹 2(중간)에는 바코드가 표시된 페이로드가 2개 주입되었다. 그룹 3(하단)에는 바코드가 표시된 페이로드가 삽입되지 않았다. 세 그룹 각각에 대해 24시간에 혈청 샘플을 채취하였고; 바코드가 표시된 페이로드(들)는 본원에 설명된 바와 같은 결합제를 사용하여 캡처되고 해독되었다. 각 그룹에 대해 알려진 입력 농도(왼쪽 막대)와 비교하여 바코드가 표시된 페이로드의 측정 농도(오른쪽 막대)가 표시되어 있다.
도 12a-12e는 단일 혼합물 내에 함유된 24개 바코드를 확인한 것이다. 도 12a는 실험의 그래픽 묘사를 보여준다. 알고리즘이 예측할 수 있는 총 24개의 바코드 중 10개가 동일한 농도로 혼합물 내에 존재하였다. 나머지는 풀에서 제외되었지만 예측은 계산적으로 허용되었다. 가능한 모든 바코드를 포괄하는 3개의 별도 풀을 반복해서 측정하였다. 도 12b는 제1 풀에 대한 예측을 보여준다. 입력 농도(왼쪽 막대)와 측정 농도(오른쪽 막대)가 표시되어 있다. 도 12c는 3개 풀 모두에 대한 예측을 보여준다. 도 12b에서와 같이 입력 농도는 왼쪽 막대이고 측정 농도는 오른쪽 막대이다. 도 12d는 3개 풀 내의 바코드의 상대적 풍부도를 계산적으로 확인하는 데 사용된 24개 바코드에 대한 바코드 지문을 보여준다. 열은 바코드 지문을 나타내고 행은 결합제 지문을 나타낸다. 도 12d는 서열번호 8414, 8415, 8414, 8416, 8414, 8413, 8414, 8417, 8414, 8418, 8414, 8419, 8414, 8420-8425, 8422, 8426, 8427, 8426, 8428-8431, 8430, 8432, 8433, 8432, 8434, 8432, 8435, 8432, 8430, 8432, 8436-8453, 8413, 8453, 8454, 8453, 8455-8475, 8474, 8476-8480, 8479, 8481-8484, 8483, 8484-8493, 8472, 8494, 8472, 8495, 8472, 8496, 8472, 8497, 8472, 8498-8502, 8501, 8503-8505, 8504, 8506, 8504, 8507, 8504, 8508-8516, 8515, 8517, 8518, 8417, 8519, 8520, 8519, 8521-8532, 8403, 8533-8542, 8541, 8543-8545, 8544, 8546, 8544, 8547, 8544, 8548-8552, 8551, 8553, 8551, 8554-8562를 각각 등장순으로 개시한다. 도 12e는 풀의 비율을 계산적으로 확인하는 데 사용된 3개 풀로부터의 결합제 수를 보여준다. 행은 결합제 개수이고 열은 풀이며 셀은 특이적 풀 내의 결합제 수이다. 도 12e는 서열번호 8414, 8415, 8414, 8416, 8414, 8413, 8414, 8417, 8414, 8418, 8414, 8419, 8414, 8420-8425, 8422, 8426, 8427, 8426, 8428-8431, 8430, 8432, 8433, 8432, 8434, 8432, 8435, 8432, 8430, 8432, 8436-8453, 8413, 8453, 8454, 8453, 8455-8475, 8474, 8476-8480, 8479, 8481-8484, 8483, 8484-8493, 8472, 8494, 8472, 8495, 8472, 8496, 8472, 8497, 8472, 8498-8502, 8501, 8503-8505, 8504, 8506, 8504, 8507, 8504, 8508-8516, 8515, 8517, 8518, 8417, 8519, 8520, 8519, 8521-8532, 8403, 8533-8542, 8541, 8543-8545, 8544, 8546, 8544, 8547, 8544, 8548-8552, 8551, 8553, 8551, 8554-8562를 각각 등장순으로 개시한다.
도 13a는 본원에 설명된 바와 같은 바인더-바코드 플랫폼을 사용하여 풀에서 14개의 예시적인 페이로드(예를 들어, 단백질)를 검출 및/또는 정량화 및/또는 특성화하는 방법의 개략도이다. 바코드가 표시된 페이로드 단백질 라이브러리를 식별 DNA("바인더-바코드 입자")를 함유하는 결합제 라이브러리와 접촉시켰다. 바인더-바코드 입자를 모아진 라이브러리로서 생체 내에서 야생형(wt) BALB/c 마우스(시점당 n=3)에 주입하였다. 30분, 6시간, 24시간 및 48시간 시점에 개별 마우스로부터 혈액을 수집하고(시점당 n=3) 혈청을 추출하였다. 바인더-바코드 입자를 캡처하고 본원에 설명된 바와 같이 해독 절차를 수행하였다.
도 13b는 생체 내에서 야생형(wt) BALB/c 마우스(시점당 n=3)에 주입된 14개의 예시적인 바인더-바코드 입자의 제거를 보여주는 플롯을 묘사한다. 데이터는 본원에 설명된 해독 절차에 의해 측정된 30분, 6시간, 24시간 및 48시간 시점에서 수집되었다. Y축은 각각의 예시적인 바인더-바코드 입자에 대한 주입 용적의 100%로 정규화된 것이다. 도 13b에 나와 있는 플롯은 동시에 측정하였다. 각 플롯에는 소정의 측정 가능한 표현형을 갖는 것으로 특성화된 예시적인 바인더-바코드 입자가 함유되어 있다. 왼쪽 플롯은 알려진 특성을 갖는 임상 대조군의 제거(주입 %)를 보여준다. 중간 플롯은 느린 제거 특성을 갖는 것으로 특성화된 예시적인 바인더-바코드 입자의 제거(주입 %)를 보여준다. 오른쪽 플롯은 빠른 제거 특성을 갖는 것으로 특성화된 예시적인 바인더-바코드 입자의 제거(주입 %)를 보여준다.
도 14a는 본원에 설명된 바와 같은 바인더-바코드 플랫폼을 사용하여 풀에서 36개의 페이로드(예를 들어, 단백질)를 검출 및/또는 정량화 및/또는 특성화하는 방법의 개략도이다. 바코드가 표시된 페이로드 단백질 라이브러리를 식별 DNA("바인더-바코드 입자")를 함유하는 결합제 라이브러리와 접촉시켰다. 바인더-바코드 입자는 이전에 2개의 종양 세포주("종양 1", "종양 2")가 생체 내 이식된 종양 보유 NSG 마우스에 모아진 라이브러리로서 주입되었다(시점당 n=2-4). 혈액 및 종양 조직은 30분, 6시간, 24시간 및 48시간 시점에 개별 마우스로부터 수집되었다(시점당 n=3). 표준 용해 버퍼를 사용하여 조직을 용해시키고 혈액에서 혈청을 분리하였다. 바인더-바코드 입자를 캡처하고 본원에 설명된 바와 같이 해독 절차를 수행하였다.
도 14b는 본원에 설명된 바와 같은 해독 절차를 사용하여 36개의 예시적인 바인더-바코드 입자로부터 수집된 데이터의 히트맵이다. 행은 본 예에서 테스트된 각각의 예시적인 바인더-바코드 입자를 나타낸다. 열은 혈청, 종양 1 또는 종양 2에 대한 각 시점에서의 마우스에 대한 데이터를 나타낸다. 색상 강도는 본원에 설명된 해독 절차를 통해 측정된 약물의 상대적 단위를 나타낸다. 색상 강도는 차세대 시퀀싱(NGS)을 통해 측정된 상대적 농도의 정규화된 판독값을 나타낸다.
도 14c는 본원에 설명된 바와 같은 해독 절차를 사용한 도 14b에 설명된 바인더-바코드 입자의 플롯을 묘사한다. 다양한 특성이 동시에 측정되었다. 예를 들어, 바인더-바코드 입자 P14_A5는 종양 1 또는 종양 2에 최소한으로 축적되면서 혈청에서 빠르게 제거되는 반면, 바인더-바코드 입자 P17_A10은 시간이 지남에 따라 종양 1에서 더 천천히 제거되고 유지되었다.
도 15a-15c는 두 그룹의 페이로드(그룹 1: 바코드가 없는 단백질 페이로드; 그룹 2: 각 입자가 그룹 1에서 사용된 것과 동일한 단백질 페이로드를 포함하고 각 입자가 각각 다른 바코드로 바코드가 표시된 8개의 바인더-바코드 입자 풀)의 ELISA 정량화(도 15a), 본원에 설명된 해독 절차를 사용한 그룹 2의 정량화(도 15b) 및 ELISA를 사용하여 정량화된 그룹 1과 그룹 2에 대한 반감기 측정의 비교 및 본원에 설명된 해독 절차(도 15c)을 각각 보여주는 플롯을 묘사한다.
도 16a는 본원에 설명된 바와 같은 바인더-바코드 플랫폼을 사용하여 각각 다른 농도에서 각각 다른 개수의 바코드가 표시된 페이로드를 갖는 개별 풀에서 35개의 페이로드(예를 들어, 단백질)를 검출 및/또는 정량화 및/또는 특성화하는 방법의 개략도이다.
도 16b는 10-35개의 바코드가 표시된 단백질을 포함하는 96개의 개별 혼합물을 각각의 바코드가 표시된 단백질과 함께 1pg에서 1μg 사이의 알려진 농도로 배열하여 생성된, 측정 바코드 수준(임의 단위) 대 바코드가 표시된 페이로드의 예상 수준(ng)을 보여주는 플롯을 묘사한다. 도 16b는 96개의 개별 혼합물 중 하나로부터의 바인더-바코드 입자의 알려진 농도와 본원에 설명된 해독 절차에 의해 확인된 농도 사이의 비교를 나타낸다.
정의
약: 본원에서 값과 관련하여 사용되는 용어 "약"은 기준 값과 관련하여 유사한 값을 지칭한다. 일반적으로, 문맥에 익숙한 당업자는 그 문맥에서 "약"에 의해 포함되는 관련된 변동 정도를 인식할 것이다. 예를 들어, 일부 실시양태에서, 용어 "약"은 언급된 값의 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 이하 내인 값의 범위를 포함할 수 있다.
친화도: 당업계에 알려진 바와 같이, "친화도"는 둘 이상의 결합 파트너가 서로 화합되는 견고성(tightness)의 척도이다. 당업자는 친화도를 평가하는 데 사용될 수 있는 다양한 검정을 알고 있으며, 또한 그러한 검정에 대한 적절한 대조군도 알고 있을 것이다. 일부 실시양태에서, 친화도는 정량 검정으로 평가된다. 일부 실시양태에서, 친화도는 (예를 들어, 한 번에 결합 파트너의) 복수의 농도에 걸쳐 평가된다. 일부 실시양태에서, 친화도는 (예를 들어, 관련된 - 예를 들어, 생리학적 - 설정에 존재할 수 있는) 하나 이상의 잠재적인 경쟁자 실체의 존재 하에 평가된다. 일부 실시양태에서, 친화도는 기준(예를 들어, 알려진 친화도가 특정 역치를 초과하는 기준["양성 대조군" 기준] 또는 알려진 친화도가 특정 역치 미만인 기준["음성 대조군" 기준])에 대해 평가된다. 일부 실시양태에서, 친화도는 동시 기준(contemporaneous reference)에 대해 평가될 수 있고; 일부 실시양태에서, 친화도는 과거 기준(historical reference)에 대해 평가될 수 있다. 전형적으로, 친화도가 기준에 대해 평가되는 경우, 유사한 조건 하에서 평가된다.
작용제: 일반적으로, 본원에서 사용되는 용어 "작용제"는 실체(예를 들어, 지질, 금속, 핵산, 폴리펩티드, 다당류, 소분자 등 또는 복합체, 이들의 조합, 혼합 또는 시스템(예를 들어, 세포, 조직, 유기체)) 또는 현상(예를 들어, 열, 전류 또는 전기장, 자기력 또는 자기장 등)을 지칭하는 데 사용된다. 적절한 상황에서, 당업자에게 문맥상 명확한 바와 같이, 이 용어는 세포 또는 유기체, 또는 이의 분획, 추출물 또는 성분이거나 이를 포함하는 실체를 지칭하는 데 사용될 수 있다. 대안적으로 또는 추가적으로, 문맥에서 명확해지듯이, 이 용어는 자연에서 발견되고/거나 자연으로부터 얻는 자연 생성물을 지칭하는 데 사용될 수 있다. 일부 경우에는 다시 문맥상 명확한 바와 같이, 이 용어는 사람의 손으로 하는 작업을 통해 설계, 조작 및/또는 생성되고/거나 자연에서는 발견되지 않는다는 점에서 사람이 만든 하나 이상의 실체를 지칭하는 데 사용될 수 있다. 일부 실시양태에서, 작용제는 단리된 형태 또는 순수한 형태로 사용될 수 있으며; 일부 실시양태에서, 작용제는 미정제 형태로 사용될 수 있다. 일부 실시양태에서, 잠재적인 작용제는, 예를 들어, 그 안에 있는 활성제를 식별하거나 특성화하기 위해 스크리닝될 수 있는 집합체 또는 라이브러리로 제공될 수 있다. 일부 경우에, 용어 "작용제"는 중합체이거나 이를 포함하는 화합물 또는 실체를 지칭할 수 있으며; 일부 경우에, 이 용어는 하나 이상의 중합체성 모이어티를 포함하는 화합물 또는 실체를 지칭할 수 있다. 일부 실시양태에서, 용어 "작용제"는 중합체가 아니고/거나 임의의 중합체 및/또는 하나 이상의 특정 중합체성 모이어티가 실질적으로 없는 화합물 또는 실체를 지칭할 수 있다. 일부 실시양태에서, 이 용어는 임의의 중합체성 모이어티가 결여되어 있거나 실질적으로 없는 화합물 또는 실체를 지칭할 수 있다.
아미노산: 본원에서 사용되는 바와 같이 가장 넓은 의미에서는, 예를 들어, 하나 이상의 펩티드 결합의 형성을 통해 폴리펩티드 사슬에 혼입될 수 있는 임의의 화합물 및/또는 물질을 지칭한다. 일부 실시양태에서, 아미노산은 일반 구조 H2N-C(H)(R)-COOH를 갖는다. 일부 실시양태에서, 아미노산은 자연 발생 아미노산이다. 일부 실시양태에서, 아미노산은 비자연 아미노산이고; 일부 실시양태에서, 아미노산은 D-아미노산이고; 일부 실시양태에서, 아미노산은 L-아미노산이다. "표준 아미노산"은 자연 발생 펩티드에서 흔히 발견되는 20개의 표준 L-아미노산 중 임의의 것을 지칭한다. "비표준 아미노산"이란 표준 아미노산 이외의 모든 아미노산을 지칭하며, 합성으로 제조된 것인지 자연에서 얻은 것인지는 관계없다. 일부 실시양태에서, 폴리펩티드 내의 카복시- 및/또는 아미노-말단 아미노산을 포함한 아미노산은 위의 일반 구조와 비교하여 구조적 변형을 함유할 수 있다. 예를 들어, 일부 실시양태에서, 아미노산은 일반 구조와 비교하여 메틸화, 아미드화, 아세틸화, 페길화, 글리코실화, 인산화 및/또는 (예를 들어, 아미노 그룹, 카복실산 그룹, 하나 이상의 양성자 및/또는 하이드록시 그룹의) 치환에 의해 변형될 수 있다. 일부 실시양태에서, 이러한 변형은, 예를 들어, 동일한 비변형 아미노산을 함유하는 것과 비교하여 변형된 아미노산을 함유하는 폴리펩티드의 순환 반감기를 변경할 수 있다. 일부 실시양태에서, 이러한 변형은 동일한 비변형 아미노산을 함유하는 것과 비교하여 변형된 아미노산을 함유하는 폴리펩티드의 관련 활성을 유의하게 변경시키지 않는다. 문맥상 명확한 바와 같이, 일부 실시양태에서 용어 "아미노산"은 유리 아미노산을 지칭하는 데 사용될 수 있으며; 일부 실시양태에서 이는 폴리펩티드의 아미노산 잔기를 지칭하는 데 사용될 수 있다.
동물: 본원에서 사용되는 바와 같이 동물계의 임의의 구성원을 지칭한다. 일부 실시양태에서, "동물"은 성별 및 발달 단계에 관계없이 인간을 지칭한다. 일부 실시양태에서, "동물"은 임의의 발달 단계에 있는 비인간 동물을 지칭한다. 특정 실시양태에서, 비인간 동물은 포유동물(예를 들어, 설치류, 마우스, 래트, 토끼, 원숭이, 개, 고양이, 양, 소, 영장류 및/또는 돼지)이다. 일부 실시양태에서, 동물에는 포유동물, 조류, 파충류, 양서류, 어류, 곤충 및/또는 벌레가 포함되지만 이에 제한되지 않는다. 일부 실시양태에서, 동물은 형질전환 동물, 유전자 조작된 동물 및/또는 클론일 수 있다.
항체: 본원에서 사용되는 용어 "항체"는 특정 표적 항원에 대한 특이적 결합을 부여하기에 충분한 표준 면역글로불린 서열 요소를 포함하는 폴리펩티드를 지칭한다. 당업계에 알려진 바와 같이, 자연적으로 생성된 온전한(intact) 항체는 서로 회합하여 흔히 "Y자형" 구조로 지칭되는 2개의 동일한 중쇄 폴리펩티드(각각 약 50kD) 및 2개의 동일한 경쇄 폴리펩티드(각각 약 25kD)로 구성된 약 150kD의 사량체 작용제이다. 각 중쇄는 적어도 4개의 도메인(각각 약 110개 아미노산 길이), 즉 아미노 말단 가변(VH) 도메인(Y 구조의 끝에 위치)과 3개의 불변 도메인 CH1, CH2 및 카복시 말단 CH3(Y 줄기의 밑 부분에 위치)으로 구성된다. "스위치"로 알려진 짧은 영역은 중쇄 가변 영역과 불변 영역을 연결한다. "힌지"는 CH2 및 CH3 도메인을 항체의 나머지 부분에 연결한다. 이 힌지 영역에 있는 2개의 디설파이드 결합은 온전한 항체에서 2개의 중쇄 폴리펩티드를 서로 연결한다. 각 경쇄는 2개의 도메인, 즉 아미노 말단 가변(VL) 도메인과 카복시 말단 불변(CL) 도메인으로 구성되며, 또 다른 "스위치"에 의해 서로 분리된다. 온전한 항체 사량체는 중쇄와 경쇄가 단일 디설파이드 결합에 의해 서로 연결된 2개의 중쇄-경쇄 이량체로 구성되고; 2개의 다른 디설파이드 결합은 중쇄 힌지 영역을 서로 연결하여 이량체가 서로 연결되어 사량체가 형성된다. 자연에서 생성된 항체도 전형적으로 CH2 도메인에서 글리코실화되어 있다. 자연 항체의 각 도메인은 압축된 역평행 베타 배럴(compressed antiparallel beta barrel)에서 서로 팩킹된 2개의 베타 시트(예를 들어, 3, 4 또는 5가닥 시트)로 형성된 "면역글로불린 접힘(immunoglobulin fold)"을 특징으로 하는 구조를 가지고 있다. 각 가변 도메인은 "보체 결정 영역(complement determining region)"(CDR1, CDR2 및 CDR3)으로 알려진 3개의 초가변 루프(hypervariable loop)와 다소 불변인 4개의 "프레임워크(framework)" 영역(FR1, FR2, FR3 및 FR4)을 함유한다. 자연 항체가 접히면 FR 영역은 도메인에 대한 구조적 프레임워크를 제공하는 베타 시트를 형성하고, 중쇄와 경쇄 모두의 CDR 루프 영역은 3차원 공간에서 함께 모여 Y 구조의 끝에 위치한 단일 초가변 항원 결합 위치를 생성한다. 자연 발생 항체의 Fc 영역은 보체 시스템의 요소에 결합하고, 예를 들어, 세포독성을 매개하는 이펙터 세포를 포함한 이펙터 세포의 수용체에도 결합한다. 당업계에 알려진 바와 같이, Fc 수용체에 대한 Fc 영역의 친화도 및/또는 기타 결합 속성은 글리코실화 또는 기타 변형을 통해 조절될 수 있다. 일부 실시양태에서, 본 발명에 따라 생성되고/거나 활용되는 항체는 글리코실화와 같이 변형되거나 조작된 Fc 도메인을 포함한 글리코실화된 Fc 도메인을 포함한다. 본 발명을 위해, 소정의 실시양태에서, 자연 항체에서 발견되는 충분한 면역글로불린 도메인 서열을 포함하는 임의의 폴리펩티드 또는 폴리펩티드 복합체는 이러한 폴리펩티드가 자연적으로 생성되는지(예를 들어, 항원에 반응하는 유기체에 의해 생성되는지), 또는 재조합 조작, 화학적 합성 또는 기타 인공 시스템이나 방법론에 의해 생성되는지에 관계없이 "항체"로 지칭되고/거나 사용될 수 있다. 일부 실시양태에서, 항체는 다클론성이고; 일부 실시양태에서 항체는 단클론성이다. 일부 실시양태에서, 항체는 마우스, 토끼, 영장류 또는 인간 항체의 특징인 불변 영역 서열을 갖는다. 일부 실시양태에서, 항체 서열 요소는 당업계에 알려진 바와 같이 인간화, 영장류화, 키메라 등이다. 더욱이, 본원에서 사용되는 용어 "항체"는 적절한 실시양태에서 (달리 명시되지 않거나 문맥상 명확하지 않는 한) 대체 제시(alternative presentation)에서 항체의 구조적 및 기능적 특징을 활용하기 위한 임의의 당업계에 공지되거나 개발된 작제물 또는 형식을 지칭할 수 있다. 예를 들어, 실시양태에서, 본 발명에 따라 사용되는 항체는 온전한 IgA, IgG, IgE 또는 IgM 항체; 이중특이적 또는 다중특이적 항체(예를 들어, Zybodies® 등); Fab 단편, Fab' 단편, F(ab')2 단편, Fd' 단편, Fd 단편 및 단리된 CDR 또는 이들의 세트와 같은 항체 단편; 단일 사슬 Fvs; 폴리펩티드-Fc 융합체; 단일 도메인 항체(예를 들어, IgNAR 또는 이의 단편과 같은 상어 단일 도메인 항체); 카멜로이드(cameloid) 항체; 차폐된 항체(예를 들어, Probodies®); 소형 모듈형 면역약제(Small Modular ImmunoPharmaceuticals)("SMIPs™"); 단일 사슬 또는 텐덤 디아바디(Tandem diabody)(TandAb®); VHH; Anticalins®; Nanobodies® 미니바디; BiTE®; 안키린 반복 단백질(ankyrin repeat protein) 또는 DARPINs®; Avimers®; DARTs; TCR 유사 항체, Adnectins®; Affilins®; Trans-bodies®; Affibodies®; TrimerX®; MicroProteins; Fynomers®, Centyrins®; 및 KALBITOR®로부터 선택되지만 이에 제한되지 않는 형식으로 있다. 일부 실시양태에서, 항체는 자연적으로 생성된다면 가질 수 있는 공유 변형(예를 들어, 글리칸의 부착)이 결여될 수 있다. 일부 실시양태에서, 항체는 공유 변형(예를 들어, 글리칸의 부착, 페이로드[예를 들어, 검출 가능한 모이어티, 치료 모이어티, 촉매 모이어티 등], 또는 다른 펜던트 그룹[예를 들어, 폴리에틸렌 글리콜 등]을 함유할 수 있다.
항체 작용제: 본원에서 사용되는 용어 "항체 작용제"는 특정 항원에 특이적으로 결합하는 작용제를 지칭한다. 일부 실시양태에서, 이 용어는 특이적 결합을 부여하기에 충분한 면역글로불린 구조 요소를 포함하는 임의의 폴리펩티드 또는 폴리펩티드 복합체를 포괄한다. 예시적인 항체 작용제에는 단클론 항체 또는 다클론 항체가 포함되지만 이에 제한되지 않는다. 일부 실시양태에서, 항체 작용제는 마우스, 토끼, 영장류 또는 인간 항체의 특징인 하나 이상의 불변 영역 서열을 포함할 수 있다. 일부 실시양태에서, 항체 작용제는 당업계에 알려진 바와 같이 인간화, 영장류화, 키메라 등의 하나 이상의 서열 요소를 포함할 수 있다. 많은 실시양태에서, 용어 "항체 작용제"는 대체 제시에서 항체의 구조적 및 기능적 특징을 활용하기 위한 당업계에 공지되거나 개발된 작제물 또는 형식 중 하나 이상을 지칭하는 데 사용된다. 예를 들어, 실시양태에서, 본 발명에 따라 사용되는 항체 작용제는 온전한 IgA, IgG, IgE 또는 IgM 항체; 이중특이적 또는 다중특이적 항체(예를 들어, Zybodies® 등); Fab 단편, Fab' 단편, F(ab')2 단편, Fd' 단편, Fd 단편 및 단리된 CDR 또는 이들의 세트와 같은 항체 단편; 단일 사슬 Fvs; 폴리펩티드-Fc 융합체; 단일 도메인 항체(예를 들어, IgNAR 또는 이의 단편과 같은 상어 단일 도메인 항체); 카멜로이드 항체; 차폐된 항체(예를 들어, Probodies®); 소형 모듈형 면역약제("SMIPs™"); 단일 사슬 또는 탠덤 디아바디(TandAb®); VHH; Anticalins®; Nanobodies® 미니바디; BiTE®; 안키린 반복 단백질 또는 DARPINs®; Avimers®; DARTs; TCR 유사 항체, Adnectins®; Affilins®; Trans-bodies®; Affibodies®; TrimerX®; MicroProteins; Fynomers®, Centyrins®; 및 KALBITOR®로부터 선택되지만 이에 제한되지 않는 형식으로 있다. 일부 실시양태에서, 항체는 자연적으로 생성된다면 가질 수 있는 공유 변형(예를 들어, 글리칸의 부착)이 결여될 수 있다. 일부 실시양태에서, 항체는 공유 변형(예를 들어, 글리칸의 부착, 페이로드[예를 들어, 검출 가능한 모이어티, 치료 모이어티, 촉매 모이어티 등], 또는 다른 펜던트 그룹[예를 들어, 폴리에틸렌 글리콜 등]을 함유할 수 있다. 많은 실시양태에서, 항체 작용제는 아미노산 서열이 당업자에 의해 상보성 결정 영역(CDR)으로 인식되는 하나 이상의 구조적 요소를 포함하는 폴리펩티드이거나 이를 포함하고; 일부 실시양태에서, 항체 작용제는 기준 항체에서 발견된 것과 실질적으로 동일한 적어도 하나의 CDR(예를 들어, 적어도 하나의 중쇄 CDR 및/또는 적어도 하나의 경쇄 CDR)을 포함하는 아미노산 서열을 갖는 폴리펩티드이거나 이를 포함한다. 일부 실시양태에서, 포함된 CDR은 기준 CDR과 비교하여 서열이 동일하거나 1-5개 아미노산 치환을 함유한다는 점에서 기준 CDR과 실질적으로 동일하다. 일부 실시양태에서, 포함된 CDR은 기준 CDR과의 서열 동일성이 적어도 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 100%를 보여준다는 점에서 기준 CDR과 실질적으로 동일하다. 일부 실시양태에서, 포함된 CDR은 기준 CDR과의 서열 동일성이 적어도 96%, 96%, 97%, 98%, 99% 또는 100%를 보여준다는 점에서 기준 CDR과 실질적으로 동일하다. 일부 실시양태에서, 포함된 CDR은 기준 CDR과 비교하여 포함된 CDR 내의 적어도 하나의 아미노산이 결실, 추가 또는 치환되지만 그 외에는 포함된 CDR의 아미노산 서열이 기준 CDR의 아미노산 서열과 동일하다는 점에서 기준 CDR과 실질적으로 동일하다. 일부 실시양태에서, 포함된 CDR은 기준 CDR과 비교하여 포함된 CDR 내의 1-5개 아미노산이 결실, 추가 또는 치환되지만 그 외에는 포함된 CDR의 아미노산 서열이 기준 CDR의 아미노산 서열과 동일하다는 점에서 기준 CDR과 실질적으로 동일하다. 일부 실시양태에서, 포함된 CDR은 기준 CDR과 비교하여 포함된 CDR 내의 적어도 하나의 아미노산이 치환되지만 그 외에는 포함된 CDR의 아미노산 서열이 기준 CDR의 아미노산 서열과 동일하다는 점에서 기준 CDR과 실질적으로 동일하다. 일부 실시양태에서, 포함된 CDR은 기준 CDR과 비교하여 포함된 CDR 내의 1-5개 아미노산이 결실, 추가 또는 치환되지만 그 외에는 포함된 CDR의 아미노산 서열이 기준 CDR의 아미노산 서열과 동일하다는 점에서 기준 CDR과 실질적으로 동일하다. 일부 실시양태에서, 항체 작용제는 아미노산 서열이 당업자에 의해 면역글로불린 가변 도메인으로 인식되는 구조적 요소를 포함하는 폴리펩티드이거나 이를 포함한다. 일부 실시양태에서, 항체 작용제는 면역글로불린 결합 도메인과 상동성이거나 대체로 상동성인 결합 도메인을 갖는 폴리펩티드 단백질이다.
회합된: 하나의 존재, 수준, 정도, 유형 및/또는 형태가 다른 것의 존재, 수준, 정도, 유형 및/또는 형태와 상관관계가 있는 경우, 본원에서 사용되는 바와 같이 두 이벤트 또는 실체는 서로 "회합된" 것이다. 예를 들어, 특정 실체(예를 들어, 폴리펩티드, 유전적 시그니처, 대사산물, 미생물 등)는 그 존재, 수준 및/또는 형태가 질병, 장애 또는 병태의 발생 및/또는 이에 대한 민감성(예를 들어, 관련 인구 전체)과 상관관계가 있는 경우 특정 질병, 장애 또는 병태와 회합된 것으로 간주된다. 일부 실시양태에서, 2개 이상의 실체는 직접적으로 또는 간접적으로 상호작용하는 경우 서로 물리적으로 "회합"되어 서로 물리적으로 근접하게 있고/거나 유지된다. 일부 실시양태에서, 서로 물리적으로 회합된 2개 이상의 실체는 서로 공유적으로 연결되며; 일부 실시양태에서, 서로 물리적으로 회합된 2개 이상의 실체는 서로 공유적으로 연결되지 않지만, 예를 들어, 수소 결합, 반 데르 발스 상호작용, 소수성 상호작용, 자성 및 이들의 조합에 의해 비공유적으로 연결되어 있다.
바코드: 본원에서 사용되는 용어 "바코드"는 특이성 및 친화도가 알려진 바인더와 회합하는 펩티드 서열을 지칭한다. 일부 실시양태에서, 바코드는 특정 항체-작용제에 결합한다. 일부 실시양태에서, 바코드는 관심 있는 특정 페이로드 내에 포함될 수 있다. 일부 실시양태에서, 바코드는 관심 있는 특정 페이로드의 말단일 수 있다. 일부 실시양태에서, 바코드는 합성 바코드일 수 있다. 일부 실시양태에서는 바코드는 설계될 수 있다. 예를 들어, 바코드 서열은 DNA 폴리뉴클레오티드로서 정돈될 수 있고 당업자에게 알려진 분자 클로닝 방법을 사용하여 관심 있는 페이로드로 클로닝될 수 있다.
바인더: 본원에서 사용되는 용어 "바인더" 또는 "바인더 모이어티"는 특이성 및 친화도가 알려진 바코드와 회합하는 폴리펩티드 서열을 지칭한다. 일부 실시양태에서, 바인더는 항체 작용제이거나 이를 포함한다. 일부 실시양태에서, 바인더는 결합제의 표면에서 발현된다. 일부 실시양태에서, 바인더는 하나 이상의 바코드에 결합될 수 있다.
결합: 본원에서 사용되는 용어 "결합" 또는 "결합하다"는 전형적으로 2개 이상의 실체 사이의 비공유 결합을 지칭하는 것으로 이해될 것이다. "직접" 결합에는 실체 또는 모이어티 간의 물리적 접촉이 포함되고; 간접 결합에는 하나 이상의 중간 실체와의 물리적 접촉을 통한 물리적 상호작용이 포함된다. 둘 이상의 실체 간의 결합은 전형적으로 상호작용하는 실체 또는 모이어티가 단리되어 연구되거나 더 복합 시스템의 맥락에서 연구되는 경우(예를 들어, 공유적으로 또는 다른 방식으로 캐리어 실체와 회합되어 있는 동안 및/또는 생물학적 시스템이나 세포에서)를 포함하여 다양한 상황에서 평가될 수 있다.
결합제: 일반적으로, 용어 "결합제"는 본원에 설명된 바와 같은 관심 있는 표적(예를 들어, 바코드, 바코드가 표시된 표적 등)에 결합하는 임의의 실체를 지칭하기 위해 본원에서 사용된다. 많은 실시양태에서, 관심 있는 결합제는 특정 상호작용 방식에서 그 표적을 다른 잠재적인 결합 파트너와 구별한다는 점에서 그 표적과 특이적으로 결합하는 것이다. 일반적으로, 결합제는 임의의 화학적 부류(예를 들어, 중합체, 비중합체, 소분자, 폴리펩티드, 탄수화물, 지질, 핵산 등) 또는 생물학적 부류(예를 들어, 박테리아, 파지, 리보솜, mRNA, DNA 등)의 실체이거나 이를 포함할 수 있다. 일부 실시양태에서, 결합제는 단일 화학적 실체이다. 일부 실시양태에서, 결합제는 비공유 상호작용에 의해 관련 조건 하에 서로 회합된 2개 이상의 개별 화학적 실체의 복합체이다. 예를 들어, 당업자는 일부 실시양태에서 결합제가 "일반" 결합 모이어티(예를 들어, 비오틴(biotin)/아비딘(avidin)/스트렙트아비딘(streptavidin) 및/또는 부류 특이적 항체 중 하나) 및 일반 결합 모이어티의 파트너에 연결된 "특이적" 결합 모이어티(예를 들어, 특정 분자 표적을 가진 항체 또는 압타머(aptamer))를 포함할 수 있음을 이해할 것이다. 일부 실시양태에서, 이러한 접근법으로 동일한 일반 결합 모이어티 파트너와 각각 다른 특이적 결합 모이어티의 연결을 통해 다수의 결합제의 모듈형 조립이 가능하다. 일부 실시양태에서, 결합제는 파지이거나 이를 포함한다. 일부 실시양태에서, 결합제는 (예를 들어, 항체 또는 항체 단편을 포함하는) 폴리펩티드이거나 이를 포함한다. 일부 실시양태에서, 결합제는 소분자이거나 이를 포함한다. 일부 실시양태에서, 결합제는 핵산이거나 이를 포함한다. 일부 실시양태에서, 결합제는 압타머이거나 이를 포함한다. 일부 실시양태에서, 결합제는 중합체이고; 일부 실시양태에서 결합제는 중합체가 아니다. 일부 실시양태에서, 결합제는 중합체성 모이어티가 결여되어 있다는 점에서 비중합체성이다. 일부 실시양태에서, 결합제는 탄수화물이거나 이를 포함한다. 일부 실시양태에서, 결합제는 렉틴(lectin)이거나 이를 포함한다. 일부 실시양태에서, 결합제는 펩티도미메틱(peptidomimetics)이거나 이를 포함한다. 일부 실시양태에서, 결합제는 스캐폴드 단백질이거나 이를 포함한다. 일부 실시양태에서, 결합제는 미메토프(mimeotope)이거나 이를 포함한다. 일부 실시양태에서, 결합제는 스테이플화 펩티드(stapled peptide)이거나 이를 포함한다. 특정 실시양태에서, 결합제는 DNA 또는 RNA와 같은 핵산이거나 이를 포함한다.
생물학적 샘플 : 본원에서 사용되는 용어 "생물학적 샘플"은 전형적으로 본원에 설명된 바와 같이 관심 있는 생물학적 공급원(예를 들어, 조직 또는 유기체 또는 세포 배양물)에서 얻거나 이로부터 유래된 샘플을 지칭한다. 일부 실시양태에서, 관심 있는 공급원은 동물 또는 인간과 같은 유기체를 포함한다. 일부 실시양태에서, 생물학적 샘플은 생물학적 조직 또는 체액이거나 이를 포함한다. 일부 실시양태에서, 생물학적 샘플은 골수; 혈액; 혈액 세포; 복수(ascites); 조직 또는 가는 바늘 생검(fine needle biopsy) 샘플; 세포 함유 체액; 자유 부유 핵산(free floating nucleic acid); 가래; 타액; 소변; 뇌척수액, 복막액; 흉막액; 대변; 림프; 부인과 액(gynecological fluid); 피부 면봉(swab); 질 면봉; 구강 면봉; 비강 면봉; 관 세척물(ductal lavage) 또는 기관지폐포 세척물(broncheoalveolar lavage)과 같은 세척액 또는 세정액; 흡입물; 스크랩; 골수 표본; 조직 생검 표본; 수술 표본; 대변, 기타 체액, 분비물 및/또는 배설물; 및/또는 이로부터의 세포 등일 수 있거나 이를 포함할 수 있다. 일부 실시양태에서, 생물학적 샘플은 실체로부터 얻은 세포이거나 이를 포함한다. 일부 실시양태에서, 얻은 세포는 샘플을 얻은 개체의 세포이거나 이를 포함한다. 일부 실시양태에서, 샘플은 임의의 적절한 수단을 통해 관심 있는 공급원으로부터 직접 얻은 "1차 샘플"이다. 예를 들어, 일부 실시양태에서, 1차 생물학적 샘플은 생검(예를 들어, 가는 바늘 흡인 또는 조직 생검), 수술, 체액(예를 들어, 혈액, 림프, 대변 등) 수집 등으로 이루어진 군으로부터 선택된 방법에 의해 얻는다. 일부 실시양태에서, 문맥상 명확한 바와 같이, 용어 "샘플"은 프로세싱(예를 들어, 1차 샘플의 하나 이상의 성분을 제거하고/거나 1차 샘플에 하나 이상의 작용제를 첨가)하여 얻은 제제(preparation)를 지칭한다. 예를 들어, 반투과막을 사용한 여과. 이러한 "프로세싱된 샘플"은, 예를 들어, 샘플로부터 추출되거나 1차 샘플에 mRNA의 증폭 또는 역전사, 소정의 성분의 단리 및/또는 정제 등과 같은 기술을 적용하여 얻은 핵산 또는 단백질을 포함할 수 있다.
CDR: 본원에서 사용되는 "CDR"은 항체 가변 영역 내의 상보성 결정 영역을 지칭한다. 중쇄 및 경쇄의 각 가변 영역에는 3개의 CDR이 있으며, 이는 각 가변 영역에 대해 CDR1, CDR2 및 CDR3으로 지정된다. "CDR의 세트" 또는 "CDR 세트"는 항원에 결합할 수 있는 단일 가변 영역 또는 항원에 결합할 수 있는 동족(cognate) 중쇄 및 경쇄 가변 영역의 CDR에서 발생하는 3개 또는 6개의 CDR 그룹을 지칭한다. CDR 경계를 정의하기 위한 특정 시스템(예를 들어, Kabat, Chothia 등)이 당업계에서 확립되었고; 당업자는 이러한 시스템 사이의 차이점을 인식하고 청구된 발명을 이해하고 실시하는 데 필요한 정도로 CDR 경계를 이해할 수 있다.
비교 가능한(comparable): 본원에서 사용되는 용어 "비교 가능한"은 서로 동일하지 않을 수 있지만 둘 사이의 비교를 허용할 만큼 충분히 유사하여 당업자가 관찰된 차이점 또는 유사점에 기초하여 결론이 합리적으로 도출될 수 있음을 이해할 수 있는 2개 이상의 작용제, 실체, 상황, 조건의 세트를 지칭한다. 일부 실시양태에서, 조건, 환경, 개체 또는 집단의 비교 가능한 세트는 실질적으로 동일한 복수의 특징과 하나 또는 소수의 다양한 특징으로 특성화된다. 당업자는 비교 가능한 것으로 간주되기 위해서는 2개 이상의 작용제, 실체, 상황, 조건의 세트에 대해 임의의 주어진 상황에서 어느 정도의 동일성이 요구되는지 맥락에서 이해할 것이다. 예를 들어, 당업자는 상황, 개체 또는 집단의 각각 다른 세트 하에 또는 상기 세트에서 얻은 결과 또는 관찰된 현상의 차이가 다양한 그러한 특징의 차이로 인해 발생하거나 그러한 특징의 차이를 나타내는 것이라는 합리적인 결론을 보증하기에 충분한 개수와 유형의 실질적으로 동일한 특징으로 특성화되는 경우 상황, 개체 또는 집단의 세트가 서로 비교 가능한 것으로 인식할 것이다.
포함하는: 하나 이상의 명명된 요소 또는 단계를 "포함하는" 것으로 본원에 설명된 조성물 또는 방법은 개방형이며, 이는 명명된 요소 또는 단계가 필수적이지만 다른 요소 또는 단계가 조성물 또는 방법의 범위 내에서 추가될 수 있음을 의미한다. 장황함을 피하기 위해, 하나 이상의 명명된 요소 또는 단계를 "포함하는"(또는 "포함하다") 것으로 설명된 임의의 조성물 또는 방법은 또한 동일한 명명된 요소 또는 단계로 "본질적으로 이루어지는"(또는 "본질적으로 이루어지다") 상응하는 더 제한된 조성물 또는 방법을 설명하며, 이는 조성물 또는 방법이 명명된 필수 요소 또는 단계를 포함하고 조성물 또는 방법의 기본적이고 신규한 특성(들)에 실질적으로 영향을 미치지 않는 추가 요소 또는 단계도 포함할 수도 있음을 의미한다. 또한, 하나 이상의 명명된 요소 또는 단계를 "포함하는" 또는 이것으로 "본질적으로 이루어지는" 것으로 본원에 설명된 임의의 조성물 또는 방법은 또한 임의의 명명되지 않은 다른 요소 또는 단계를 제외하고 명명된 요소 또는 단계로 "이루어진"(또는 "~로 이루어지다") 상응하는 더 제한적인 폐쇄형 조성물 또는 방법을 설명하는 것으로 이해된다. 본원에 개시된 임의의 조성물 또는 방법에서, 임의의 명명된 필수 요소 또는 단계의 알려지거나 개시된 등가물이 해당 요소 또는 단계를 대체할 수 있다.
해독: 본원에서 사용되는 용어 "해독"은 바코드 내의 고유 아미노산 세트를 식별하고 정량화하는 실험실 및/또는 생물정보학 프로세스를 지칭한다. 일부 실시양태에서, 이러한 식별 및 정량화는 시퀀싱 실험을 통해 얻은 핵산(예를 들어, DNA) 수를 사용하고 바인더 수의 풍부도를 측정하여 달성된다. 일부 실시양태에서, 이전에 측정된 지문(예를 들어, 바인더 지문 또는 바코드 지문)은, 예를 들어, 풀 내의 여러 바코드에 대해 알려진 다양한 친화도를 갖는 바인더를 이전에 알려진 혼합물의 바인더 수와 비교하여 해독할 미지의 바코드 혼합물 사이의 관계를 확인하는 데 사용된다.
설계된: 본원에서 사용되는 용어 "설계된"은 (ⅰ) 구조가 사람의 손으로 선택되거나 선택되었고/거나; (ⅱ) 사람의 손이 필요한 프로세스에 의해 생성되고/거나; (ⅲ) 자연 물질 및 기타 알려진 작용제와 구별되는 작용제를 지칭한다.
확인하다: 본원에 설명된 많은 방법론은 "확인" 단계를 포함한다. 본 명세서를 읽은 당업자는 이러한 "확인"이, 예를 들어, 본원에 명시적으로 언급된 특정 기술을 포함하여 당업자가 이용 가능한 임의의 다양한 기술을 이용하거나 이를 통해 달성될 수 있음을 인식할 것이다. 일부 실시양태에서, 확인은 물리적 샘플의 조작(manipulation)을 포함한다. 일부 실시양태에서, 확인에는 데이터 또는 정보의 고려 및/또는 조작, 예를 들어, 관련 분석을 수행하도록 구성된 컴퓨터 또는 기타 프로세싱 장치를 활용하는 것이 포함된다. 일부 실시양태에서, 확인은 공급원으로부터 관련 정보 및/또는 자료를 수신하는 것을 포함한다. 일부 실시양태에서, 확인은 샘플 또는 실체의 하나 이상의 특징을 비교 가능한 기준과 비교하는 것을 포함한다.
조작된(engineered): 일반적으로 "조작된"이라는 용어는 사람의 손으로 조작된(manipulated) 측면을 지칭한다. 예를 들어, 일부 실시양태에서, 소분자는 그 구조 및/또는 생성이 사람의 손으로 설계 및/또는 구현된다면 조작된 것으로 간주될 수 있다. 유사하게, 일부 실시양태에서, 자연에서의 순서로 함께 연결되지 않는 2개 이상의 서열이 사람의 손으로 조작되어 조작된 폴리뉴클레오티드에서 서로 직접 연결되도록 한 경우 폴리뉴클레오티드는 "조작된" 것으로 간주될 수 있다. 예를 들어, 본 발명의 일부 실시양태에서, 조작된 폴리뉴클레오티드는 자연에서 제1 서열(예를 들어, 코딩 서열)과 작동적으로 회합되어 있지만 제2 서열(예를 들어, 코딩 서열)과는 작동적으로 회합되어 있지 않은 조절 서열을 제2 서열과 작동적으로 회합되도록 사람의 손으로 연결한 것을 포함한다. 이와 유사하게, 세포나 유기체가 유전 정보가 변경되도록 조작된 경우 "조작된" 것으로 간주된다(예를 들어, 이전에 존재하지 않았던 새로운 유전 물질이, 예를 들어, 형질전환, 교배, 체세포 혼성화, 형질감염, 형질도입 또는 다른 메커니즘에 의해 도입되거나, 이전에 존재했던 유전 물질이, 예를 들어, 치환 또는 결실 돌연변이, 교배 프로토콜에 의해 변경되거나 제거된다). 일반적인 관행이고 당업자가 이해하는 바와 같이, 조작된 폴리뉴클레오티드의 발현 생성물 및/또는 조작된 폴리뉴클레오티드나 세포의 자손은 실제 조작이 이전 실체에 대해 수행되었음에도 불구하고 전형적으로 여전히 "조작된" 것으로 지칭된다.
발현: 본원에서 사용되는 핵산 서열의 "발현"은 다음 이벤트 중 하나 이상을 지칭한다: (1) DNA 서열로부터 RNA 주형의 생성(예를 들어, 전사에 의함); (2) RNA 전사체 프로세싱(예를 들어, 스플라이싱, 편집, 5' 캡 형성 및/또는 3' 말단 형성에 의함); (3) RNA를 폴리펩티드 또는 단백질로 번역하는 것; 및/또는 (4) 폴리펩티드 또는 단백질의 번역 후 변형.
지문: 본원에서 사용되는 용어 "지문"은 알려진 작용제가 결합하거나 회합될 수 있는 하나 이상의 미지의 작용제 수를 지칭한다. 일부 실시양태에서, 지문은 알려진 바코드 또는 바코드 혼합물에 대한 것일 수 있다. 일부 실시양태에서, 지문은 알려진 바인더 또는 바인더 혼합물에 대한 것일 수 있다. 예를 들어, 일부 실시양태에서, 지문(예를 들어, 바코드 지문)은 알려진 바코드 또는 바코드 혼합물에 특이적으로 결합하는 하나 이상의 바인더(예를 들어, 서열 분석을 통해 확인됨) 수를 지칭할 수 있다. 즉, 일부 실시양태에서, 바코드에 대한 지문은 하나 이상의 바인더 수를 지칭하며, 그 중 일부는 바코드에 대해 친화도가 높을 수 있고, 그 중 일부는 바코드에 대해 친화도가 낮을 수 있다. 일부 실시양태에서, 지문이 해독 프로세스에 사용될 수 있으며, 이 프로세스는 바코드 풀 내에서 주어진 바코드의 상대적 또는 절대적 풍부도를 확인하는 데 사용된다. 당업자가 이해하는 바와 같이, 알려진 바코드 또는 바코드 혼합물에 대해, 또는 알려진 바인더 또는 바인더 혼합물에 대해 지문이 확인될 수 있다. 예를 들어, 일부 실시양태에서, 지문(예를 들어, 바인더 지문)은 알려진 바인더 또는 바인더 혼합물에 특이적으로 결합하는 하나 이상의 바코드(예를 들어, 서열 분석을 통해 확인됨) 수를 지칭할 수 있다. 즉, 일부 실시양태에서, 바인더에 대한 지문은 하나 이상의 바코드 수를 지칭하며, 그 중 일부는 바인더에 대해 친화도가 높을 수 있고, 그중 일부는 바인더에 대해 친화도가 낮을 수 있다. 따라서, 일부 실시양태에서는 바인더 풀 내에서 주어진 바인더의 상대적 또는 절대적 풍부도를 확인하기 위해 해독 프로세스에서 지문이 사용될 수도 있다.
단편 : 본원에 설명된 바와 같은 물질 또는 실체의 "단편"은 전체의 개별 부분을 포함하지만 전체에서 발견되는 하나 이상의 모이어티가 결여된 구조를 갖는다. 일부 실시양태에서, 단편은 이러한 개별 부분으로 이루어진다. 일부 실시양태에서, 단편은 전체에서 발견되는 특징적인 구조적 요소 또는 모이어티로 이루어지거나 이를 포함한다. 일부 실시양태에서, 중합체 단편은 전체 중합체에서 발견되는 단량체 단위(예를 들어, 잔기)를 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500개 이상 포함하거나 이로 이루어진다. 일부 실시양태에서, 중합체 단편은 전체 중합체에서 발견되는 단량체 단위(예를 들어, 잔기)를 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 25%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 이상 포함하거나 이로 이루어진다. 전체 물질 또는 실체는 일부 실시양태에서는 전체의 "모체"로 지칭될 수 있다.
인간 : 일부 실시양태에서, 인간은 배아, 태아, 유아, 아동, 10대, 성인 또는 노인이다.
"개선하다", "증가하다", "억제하다" 또는 "감소하다": 본원에서 사용되는 용어 "개선하다", "증가하다", "억제하다", "감소하다" 또는 이들의 문법적 동등어는 기준선 또는 기타 기준 측정값에 상대적인 값을 나타낸다. 일부 실시양태에서, 적절한 기준 측정은 특정 작용제 또는 치료가 존재하지 않는(예를 들어, 이전 및/또는 이후) 비교 가능한 조건 하에서 또는 적절한 비교 가능한 기준 작용제가 존재하는 경우 특정 시스템(예를 들어, 단일 실체)에서의 측정일 수 있거나 이를 포함할 수 있다. 일부 실시양태에서, 적절한 기준 측정은 관련 작용제 또는 치료의 존재 하에 특정 방식으로 반응할 것으로 알려졌거나 예상되는 비교 가능한 시스템에서의 측정일 수 있거나 이를 포함할 수 있다.
시험관 내: 본원에서 사용되는 용어 "시험관 내"는 다세포 유기체 내부가 아닌 인공 환경, 예를 들어, 시험관 또는 반응 용기, 세포 배양물 등에서 발생하는 이벤트를 지칭한다.
생체 내: 본원에서 사용되는 바와 같이 인간 및 비인간 동물과 같은 다세포 유기체 내에서 발생하는 이벤트를 지칭한다. 세포 기반 시스템의 맥락에서, 이 용어는 살아있는 세포 내에서 발생하는 이벤트를 지칭하는 데 사용될 수 있다(예를 들어, 시험관 내 시스템과 반대).
라이브러리: 본원에서 사용되는 용어 "라이브러리"는 하나 이상의 개별 분자의 혼합물을 지칭한다. 일부 실시양태에서, 라이브러리의 모든 요소는 하나 이상의 공통 구성요소를 공유한다. 일부 실시양태에서, 라이브러리의 모든 요소는 공통 구성 요소를 공유하지 않는다. 일부 실시양태에서, 라이브러리의 하나 이상의 요소는 하나 이상의 고유 구성요소에 의해 구별된다. 일부 실시양태에서, 문맥상 명백할 수 있는 바와 같이, 라이브러리는 결합제의 혼합물을 지칭할 수 있다. 일부 실시양태에서, 라이브러리는 파지 라이브러리일 수 있다. 일부 실시양태에서, 예를 들어, 파지 라이브러리는 파지(예를 들어, 표면)에 표시되는 개별 바인더와 파지 내에 이 바인더를 암호화하는 DNA를 캡슐화하는 파지로 이루어질 수 있다. 일부 실시양태에서, 라이브러리는 바코드가 표시된 페이로드 단백질의 혼합물을 지칭할 수 있다. 일부 실시양태에서, 라이브러리는 바코드의 혼합물(예를 들어, 펩티드 바코드)을 지칭할 수 있다.
링커: 본원에서 사용되는 바와 같이, 각각 다른 요소를 서로 연결하는 다수의 요소 작용제의 부분을 지칭하는 데 사용된다. 예를 들어, 당업자는 구조가 2개 이상의 기능적 또는 조직적 도메인을 포함하는 폴리펩티드가 종종 이러한 도메인을 서로 연결하는, 도메인 사이의 일련의 아미노산을 포함한다는 것을 인식한다. 일부 실시양태에서, 링커 요소를 포함하는 폴리펩티드는 일반 형태 S1-L-S2의 전체 구조를 가지며, 여기서 S1 및 S2는 동일하거나 상이할 수 있고 링커에 의해 서로 회합된 2개의 도메인을 나타낼 수 있다. 일부 실시양태에서, 폴리펩티드 링커는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100개 이상의 아미노산 길이이다. 일부 실시양태에서, 링커는 단단한 3차원 구조를 채택하지 않고 오히려 폴리펩티드에 유연성을 제공하는 경향이 있는 것을 특징으로 한다. 폴리펩티드(예를 들어, 융합 폴리펩티드)를 조작할 때 적절하게 사용될 수 있는 다양한 각각 다른 링커 요소가 당업계에 알려져 있다(예를 들어, Holliger, P., 등 (1993) Proc. Natl. Acad. Sci. USA 90: 6444-6448; Poljak, R.J., 등 (1994) Structure 2: 1 121-1123).
핵산: 본원에서 사용되는 바와 같이, 가장 넓은 의미에서는 올리고뉴클레오티드 사슬에 포함되거나 포함될 수 있는 임의의 화합물 및/또는 물질을 지칭한다. 일부 실시양태에서, 핵산은 포스포디에스테르 연결을 통해 올리고뉴클레오티드 사슬에 포함되거나 포함될 수 있는 화합물 및/또는 물질이다. 문맥상 명확해지듯이, 일부 실시양태에서 "핵산"은 개별 핵산 잔기(예를 들어, 뉴클레오티드 및/또는 뉴클레오시드)를 지칭하고; 일부 실시양태에서 "핵산"은 개별 핵산 잔기를 포함하는 올리고뉴클레오티드 사슬을 지칭한다. 일부 실시양태에서, "핵산"은 RNA이거나 이를 포함하고; 일부 실시양태에서 "핵산"은 DNA이거나 이를 포함한다. 일부 실시양태에서, 핵산은 하나 이상의 자연 핵산 잔기이거나 이를 포함하거나 이로 이루어진다. 일부 실시양태에서, 핵산은 하나 이상의 핵산 유사체이거나 이를 포함하거나 이로 이루어진다. 일부 실시양태에서, 핵산 유사체는 포스포디에스테르 백본을 활용하지 않는다는 점에서 핵산과 다르다. 예를 들어, 일부 실시양태에서, 핵산은 당업계에 알려져 있고 백본에 포스포디에스테르 결합 대신 펩티드 결합이 있는 하나 이상의 "펩티드 핵산"이거나 이를 포함하거나 이로 이루어지며, 이는 본 발명의 범위 내에 있는 것으로 간주된다. 대안적으로 또는 추가적으로, 일부 실시양태에서, 핵산은 포스포디에스테르 결합보다는 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포르아미다이트 결합을 갖는다. 일부 실시양태에서, 핵산은 하나 이상의 자연 뉴클레오시드(예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시 구아노신 및 데옥시시티딘)이거나 이를 포함하거나 이로 이루어진다. 일부 실시양태에서, 핵산은 하나 이상의 뉴클레오시드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, C-5 프로피닐-시티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, 0(6)-메틸구아닌, 2-티오시티딘, 메틸화된 염기, 삽입된(intercalated) 염기 및 이들의 조합)이거나 이를 포함하거나 이로 이루어진다. 일부 실시양태에서, 핵산은 자연 핵산과 비교하여 하나 이상의 변형된 당(예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스 및 헥소스)을 포함한다. 일부 실시양태에서, 핵산은 RNA 또는 단백질과 같은 기능성 유전자 산물을 암호화하는 뉴클레오티드 서열을 갖는다. 일부 실시양태에서, 핵산은 하나 이상의 인트론(intron)을 포함한다. 일부 실시양태에서, 핵산은 자연 공급원으로부터의 분리, 상보적 주형(생체 내 또는 시험관 내)을 기반으로 한 중합에 의한 효소 합성, 재조합 세포 또는 시스템에서의 재생, 및 화학적 합성 중 하나 이상에 의해 제조된다. 일부 실시양태에서, 핵산은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 20, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000개 이상의 잔기 길이이다. 일부 실시양태에서, 핵산은 부분적으로 또는 전체적으로 단일 가닥이고; 일부 실시양태에서, 핵산은 부분적으로 또는 전체적으로 이중 가닥이다. 일부 실시양태에서, 핵산은 폴리펩티드를 암호화하거나 폴리펩티드를 암호화하는 서열의 상보체인 적어도 하나의 요소를 포함하는 뉴클레오티드 서열을 갖는다. 일부 실시양태에서, 핵산은 효소 활성을 갖는다.
페이로드: 본원에서 사용되는 용어 "페이로드"는 적어도 하나의 공유 결합을 통해 펩티드 바코드에 회합될 수 있는 단백질 서열을 지칭한다. 일부 실시양태에서, 페이로드는 단백질 풀에서 검출되는 단백질이다. 일부 실시양태에서, 페이로드는 펩티드 바코드를 부착하지 않고 단백질 풀에서 검출되는 비변형 단백질이다. 일부 실시양태에서, 페이로드는 단백질 풀에서 검출되는 변형된 단백질이다. 일부 실시양태에서, 페이로드는 바코드(예를 들어, 펩티드 바코드)와 회합될 수 있다. 일부 실시양태에서, 페이로드는 바코드(예를 들어, 펩티드 바코드)와 회합되지 않을 수 있다.
펩티드: 본원에서 사용되는 용어 "펩티드"는 일반적으로 길이가 비교적 짧은, 예를 들어, 약 100개 미만의 아미노산, 약 50개 미만의 아미노산, 약 40개 미만의 아미노산, 약 30개 미만의 아미노산, 약 25개 미만의 아미노산, 약 20개 미만의 아미노산, 약 15개 미만의 아미노산 또는 10개 미만의 아미노산의 폴리펩티드를 지칭한다.
폴리펩티드: 본원에서 사용되는 바와 같이, 전형적으로 펩티드 결합에 의해 연결된 잔기(예를 들어, 아미노산)의 임의의 중합체성 사슬을 지칭한다. 일부 실시양태에서, 폴리펩티드는 자연 발생 아미노산 서열을 갖는다. 일부 실시양태에서, 폴리펩티드는 비자연 발생 아미노산 서열을 갖는다. 일부 실시양태에서, 폴리펩티드는 사람의 손의 작용을 통해 설계 및/또는 생성되도록 조작된 아미노산 서열을 갖는다. 일부 실시양태에서, 폴리펩티드는 자연 아미노산, 비자연 아미노산 또는 둘 다를 포함하거나 이로 이루어질 수 있다. 일부 실시양태에서, 폴리펩티드는 자연 아미노산만 또는 비자연 아미노산만을 포함하거나 이로 이루어질 수 있다. 일부 실시양태에서, 폴리펩티드는 D-아미노산, L-아미노산 또는 둘 다를 포함할 수 있다. 일부 실시양태에서, 폴리펩티드는 D-아미노산만을 포함할 수 있다. 일부 실시양태에서, 폴리펩티드는 L-아미노산만을 포함할 수 있다. 일부 실시양태에서, 폴리펩티드는 하나 이상의 펜던트 그룹 또는 다른 변형, 예를 들어, 폴리펩티드의 N-말단, 폴리펩티드의 C-말단 또는 이들의 임의의 조합에서 하나 이상의 아미노산 측쇄를 변형하거나 이에 부착하는 것을 포함할 수 있다. 일부 실시양태에서, 이러한 펜던트 그룹 또는 변형은 아세틸화, 아미드화, 지질화, 메틸화, 페길화 등 및 이들의 조합으로 이루어진 군으로부터 선택될 수 있다. 일부 실시양태에서, 폴리펩티드는 고리형(cyclic)일 수 있고/거나 고리형 부분을 포함할 수 있다. 일부 실시양태에서, 폴리펩티드는 고리형이 아니고/거나 임의의 고리형 부분을 포함하지 않는다. 일부 실시양태에서, 폴리펩티드는 선형이다. 일부 실시양태에서, 폴리펩티드는 스테이플화 폴리펩티드이거나 이를 포함할 수 있다. 일부 실시양태에서, 용어 "폴리펩티드"는 기준 폴리펩티드, 활성 또는 구조의 명칭에 첨부될 수 있고; 그러한 경우, 이는 관련 활성 또는 구조를 공유하는 폴리펩티드를 지칭하기 위해 본원에서 사용되며, 따라서 동일한 폴리펩티드 부류 또는 계열의 구성원으로 간주될 수 있다. 이러한 각 부류에 대해, 본 명세서는 아미노산 서열 및/또는 기능이 알려져 있는 부류 내의 예시적인 폴리펩티드를 제공하고/거나 당업자는 알 수 있을 것이며; 일부 실시양태에서, 이러한 예시적인 폴리펩티드는 폴리펩티드 부류 또는 계열에 대한 기준 폴리펩티드이다. 일부 실시양태에서, 폴리펩티드 부류 또는 계열의 구성원은 부류의 기준 폴리펩티드와, 일부 실시양태에서는 부류 내의 모든 폴리펩티드와 유의미한 서열 상동성 또는 동일성을 나타내고/거나 공통 서열 모티프(예를 들어, 특징적인 서열 요소)를 공유하고/거나 공통 활성을 공유한다(일부 실시양태에서는 비교할 만한 수준 또는 지정된 범위 내). 예를 들어, 일부 실시양태에서, 구성원 폴리펩티드는 적어도 약 30-40%, 종종 약 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 초과 또는 그 이상의 기준 폴리펩티드와의 서열 상동성 또는 동일성의 전체 정도를 나타내고/거나 종종 90% 초과 또는 심지어 95%, 96%, 97%, 98% 또는 99%를 초과하는 매우 높은 서열 동일성을 나타내는 적어도 하나의 영역(예를 들어, 일부 실시양태에서 특징적인 서열 요소이거나 이를 포함할 수 있는 보존 부위(conserved region))을 포함한다. 이러한 보존 부위는 대개 적어도 3-4개, 종종 최대 20개 이상의 아미노산을 포함하고; 일부 실시양태에서, 보존 부위는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15개 이상의 연속 아미노산의 적어도 하나의 스트레치를 포함한다. 일부 실시양태에서, 유용한 폴리펩티드는 모체 폴리펩티드의 단편을 포함하거나 이로 이루어질 수 있다. 일부 실시양태에서, 유용한 폴리펩티드는 복수의 단편을 포함하거나 이로 이루어질 수 있으며, 이들 각각은 관심 있는 폴리펩티드에서 발견되는 것보다 서로에 대해 각각 다른 공간 배열로 동일한 모체 폴리펩티드에서 발견되어(예를 들어, 모체에서 직접 연결된 단편은 관심 폴리펩티드에서 공간적으로 분리되어 있거나 그 반대일 수 있고/거나 단편은 모체와는 각각 다른 순서로 관심 폴리펩티드에 존재할 수 있음) 관심 있는 폴리펩티드는 모체 폴리펩티드의 유도체가 될 수 있다.
단백질: 본원에서 사용되는 용어 "단백질"은 폴리펩티드(즉, 펩티드 결합에 의해 서로 연결된 적어도 2개의 아미노산의 스트링)를 지칭한다. 단백질은 아미노산 이외의 모이어티(예를 들어, 당단백질, 프로테오글리칸 등일 수 있음)를 포함할 수 있고/거나 프로세싱되거나 변형될 수 있다. 당업자는 "단백질"이 세포에 의해 생성된 바와 같은 완전한 폴리펩티드 사슬(신호 서열이 있거나 없음)일 수 있거나 이의 특징적인 부분일 수 있음을 이해할 것이다. 당업자는 단백질이 때때로, 예를 들어, 하나 이상의 디설파이드 결합에 의해 연결되거나 다른 수단에 의해 회합되는 하나 초과의 폴리펩티드 사슬을 포함할 수 있음을 이해할 것이다. 폴리펩티드는 l-아미노산, d-아미노산 또는 둘 다를 함유할 수 있으며, 당업계에 알려진 임의의 다양한 아미노산 변형 또는 유사체를 함유할 수 있다. 유용한 변형에는, 예를 들어, 말단 아세틸화, 아미드화, 메틸화 등이 포함된다. 일부 실시양태에서, 단백질은 자연 아미노산, 비자연 아미노산, 합성 아미노산 및 이들의 조합을 포함할 수 있다. 일부 실시양태에서, 단백질은 항체, 항체 단편, 이의 생물학적 활성 부분 및/또는 이의 특징적인 부분이다.
기준 : 본원에서 사용되는 바와 같이, 비교가 수행되는 것과 관련된 표준 또는 대조군을 설명한다. 예를 들어, 일부 실시양태에서, 관심 있는 작용제, 동물, 개체, 집단, 샘플, 서열 또는 값은 기준 또는 대조군 작용제, 동물, 개체, 집단, 샘플, 서열 또는 값과 비교된다. 일부 실시양태에서, 기준 또는 대조군은 관심 있는 테스트 또는 확인과 실질적으로 동시에 테스트 및/또는 확인된다. 일부 실시양태에서, 기준 또는 대조군은 선택적으로 유형 매체(tangible medium)에 구현된 과거 기준 또는 대조군이다. 전형적으로, 당업자가 이해하는 바와 같이, 기준 또는 대조군은 평가 중인 것과 비교할 만한 조건 또는 상황 하에서 확인되거나 특성화된다. 당업자는 특정의 가능한 기준 또는 대조군에 대한 의존 및/또는 비교를 정당화하기에 충분한 유사성이 존재하는 경우를 인식할 것이다.
샘플: 본원에서 사용되는 용어 "샘플"은 전형적으로 관심 있는 공급원으로부터 얻거나 유래된 물질의 분취량을 지칭한다. 일부 실시양태에서, 당업자가 문맥상 이해하는 바와 같이, 용어 "샘플"은 "혼합물", "복합 혼합물" 또는 "복합 샘플"과 같은 용어와 상호교환적으로 사용될 수 있다. 일부 실시양태에서 관심 있는 공급원은 생물학적 또는 환경적 공급원이다. 일부 실시양태에서 관심 있는 공급원은 미생물, 식물 또는 동물(예를 들어, 인간)과 같은 세포 또는 유기체이거나 이를 포함할 수 있다. 일부 실시양태에서, 관심 있는 공급원은 생물학적 조직 또는 체액이거나 이를 포함한다. 일부 실시양태에서, 생물학적 조직 또는 체액은 세포, 혈청, 세포 외 기질, CSF 및/또는 이들의 조합 또는 성분(들)이거나 이를 포함할 수 있다. 일부 실시양태에서, 생물학적 조직 또는 체액은 양수, 방수(aqueous humor), 복수, 담즙, 골수, 혈액, 모유, 뇌척수액, 귀지, 유미액(chyle), 차임(chime), 사정액, 내림프(endolymph), 삼출물(exudate), 대변, 위산, 위액, 림프, 점액, 심낭액(pericardial fluid), 외림프(perilymph), 복막액, 흉막액, 고름(pus), 점막 분비물(rheum), 타액, 피지, 정액, 혈청, 스메그마(smegma), 가래, 윤활액(synovial fluid), 땀, 눈물, 소변, 질 분비물, 유리액, 토사물 및/또는 이들의 조합 또는 성분(들)이거나 이를 포함할 수 있다. 일부 실시양태에서, 생물학적 유체는 세포내액, 세포외액, 혈관내액(혈장), 간질액, 림프액 및/또는 체강액(transcellular fluid)이거나 이를 포함할 수 있다. 일부 실시양태에서, 생물학적 유체는 식물 삼출물이거나 이를 포함할 수 있다. 일부 실시양태에서, 생물학적 조직 또는 샘플은, 예를 들어, 흡인, 생검(예를 들어, 가는 바늘 또는 조직 생검), 면봉 채취(예를 들어, 구강, 비강, 피부 또는 질 면봉 채취), 스크랩, 수술, 세정 또는 세척(예를 들어, 기관폐막, 관, 비강, 안구, 구강, 자궁, 질 또는 기타 세정 또는 세척)에 의해 얻을 수 있다. 일부 실시양태에서, 생물학적 샘플은 개체로부터 얻은 세포이거나 이를 포함한다. 일부 실시양태에서, 샘플은 임의의 적절한 수단을 통해 관심 있는 공급원으로부터 직접 얻은 "1차 샘플"이다. 일부 실시양태에서, 문맥상 명확해지는 바와 같이, 용어 "샘플"은 1차 샘플을 프로세싱하여(예를 들어, 하나 이상의 성분을 제거하고/거나 하나 이상의 작용제를 첨가하여) 얻은 제제를 지칭한다. 예를 들어, 반투과막을 사용한 여과. 이러한 "프로세싱된 샘플"은, 예를 들어, 샘플로부터 추출되거나 1차 샘플에 핵산의 증폭 또는 역전사, 소정 성분의 분리 및/또는 정제 등과 같은 하나 이상의 기술을 적용하여 얻은 핵산 또는 단백질을 포함할 수 있다.
특이적: 활성을 갖는 작용제와 관련하여 본원에서 사용되는 용어 "특이적"은 작용제가 잠재적인 표적 실체 또는 상태를 구별한다는 것을 의미하는 것으로 당업자에 의해 이해된다. 예를 들어, 일부 실시양태에서, 작용제가 하나 이상의 경쟁 대체 표적의 존재 하에 표적과 우선적으로 결합하는 경우, 작용제는 이의 표적에 "특이적으로" 결합한다고 일컬어진다. 많은 실시양태에서, 특이적 상호작용은 표적 실체의 특정 구조적 특징(예를 들어, 에피토프, 틈(cleft), 결합 부위)의 존재에 따라 달라진다. 특이성은 절대적일 필요는 없는 것으로 이해해야 한다. 일부 실시양태에서, 특이성은 하나 이상의 다른 잠재적인 표적 실체(예를 들어, 경쟁자)에 대한 결합제의 특이성과 비교하여 평가될 수 있다. 일부 실시양태에서, 특이성은 기준 특이적 결합제의 특이성과 비교하여 평가된다. 일부 실시양태에서, 특이성은 기준 비특이적 결합제의 특이성과 비교하여 평가된다. 일부 실시양태에서, 작용제 또는 실체는 표적 실체에 대한 결합 조건 하에서 경쟁 대체 표적에 검출 가능하게 결합하지 않는다. 일부 실시양태에서, 결합제는 경쟁 대체 표적(들)과 비교하여 표적 실체에 더 높은 온-속도, 더 낮은 오프-속도, 증가된 친화도, 감소된 해리 및/또는 증가된 안정성으로 결합한다.
대상체: 본원에서 사용되는 용어 "대상체"는 유기체, 전형적으로 포유동물(예를 들어, 인간, 일부 실시양태에서는 태아기 인간 형태를 포함하는 인간)을 지칭한다. 일부 실시양태에서, 대상체는 관련 질병, 장애 또는 병태를 앓고 있다. 일부 실시양태에서, 대상체는 질병, 장애 또는 병태에 걸리기 쉽다. 일부 실시양태에서, 대상체는 질병, 장애 또는 병태의 하나 이상의 증상 또는 특징을 나타낸다. 일부 실시양태에서, 대상체는 질병, 장애 또는 병태의 어떠한 증상이나 특징도 나타내지 않는다. 일부 실시양태에서, 대상체는 질병, 장애 또는 병태에 대한 감수성 또는 위험의 특징적인 하나 이상의 특징을 갖는다. 일부 실시양태에서, 대상체는 환자이다. 일부 실시양태에서, 대상체는 진단 및/또는 요법이 투여되고/거나 투여된 실체이다.
실질적으로: 본원에서 사용되는 용어 "실질적으로"는 관심 있는 특징 또는 특성의 전체 또는 거의 전체 범위 또는 정도를 나타내는 질적 상태를 지칭한다. 생물학 분야의 숙련된 기술자는 생물학적 및 화학적 현상이 완성에 이르고/거나 완전하게 진행되거나 절대적인 결과를 얻거나 피하는 경우는 거의 없다는 것을 이해할 것이다. 따라서, "실질적으로"라는 용어는 많은 생물학적 및 화학적 현상에 내재된 완전성의 잠재적인 결여를 포착하기 위해 본원에서 사용된다.
치료제: 본원에서 사용되는 바와 같이, "치료제"라는 문구는 일반적으로 유기체에 투여될 때 원하는 약리학적 효과를 이끌어내는 임의의 작용제를 지칭한다. 일부 실시양태에서, 적절한 집단에 걸쳐 통계적으로 유의한 효과를 나타내는 경우 작용제는 치료제인 것으로 간주된다. 일부 실시양태에서, 적절한 집단은 모델 유기체의 집단일 수 있다. 일부 실시양태에서, 적절한 집단은 소정의 연령 그룹, 성별, 유전적 배경, 기존 임상 상태 등과 같은 다양한 기준에 의해 정의될 수 있다. 일부 실시양태에서, 치료제는 질병, 장애 및/또는 병태의 하나 이상의 증상이나 특징의 완화, 개선, 경감, 억제, 예방, 발병 지연, 중증도 감소 및/또는 발생률 감소를 위해 사용될 수 있는 물질이다. 일부 실시양태에서, "치료제"는 인간에게 투여하기 위해 시판되기 전에 정부 기관의 승인을 받았거나 승인을 받아야 하는 작용제이다. 일부 실시양태에서, "치료제"는 인간에게 투여하기 위해 의료 처방이 필요한 작용제이다. 일부 실시양태에서, 치료제는 치료 단백질이다.
Ⅰ. 바코드가 표시된 페이로드
바코드 및 바코드가 표시된 페이로드를 생성하고 사용하는 방법 및 시스템이 본원에 설명되어 있다. 일부 실시양태에서, 본원에 개시된 방법은 페이로드를 검출 및/또는 특성화하는 데 사용된다. 일부 실시양태에서, 본원에 개시된 방법은 단백질을 검출 및/또는 특성화하는 데 사용된다. 일부 실시양태에서, 본원에 개시된 방법은 치료 단백질을 검출 및/또는 특성화하는 데 사용된다. 일부 실시양태에서, 본원에 개시된 방법은 비치료적 단백질을 검출 및/또는 특성화하는 데 사용된다. 일부 실시양태에서, 본원에 개시된 방법은 단백질에 바코드 태깅됨으로써(예를 들어, 바코드가 표시된 단백질) 단백질을 검출 및/또는 특성화하는 데 사용된다. 일부 실시양태에서, 본원에 개시된 방법은 시험관 내에서 단백질을 검출 및/또는 특성화하는 데 사용된다. 일부 실시양태에서, 본원에 개시된 방법은 생체 내에서 단백질을 검출 및/또는 특성화하는데 사용된다. 일부 실시양태에서, 본원에 개시된 방법은 단백질을 검출 및/또는 특성화하는 데 사용된다. 일부 실시양태에서, 본원에 개시된 방법은 다수(예를 들어, 2개 이상, 3개 이상, 4개 이상 등)의 단백질을 검출 및/또는 특성화하는 데 사용된다.
바코드:
일부 실시양태에서, 바코드는 아미노산 서열이거나 이를 포함한다. 일부 실시양태에서, 바코드는 자연 발생 아미노산 서열이거나 이를 포함한다. 일부 실시양태에서, 바코드는 비자연 발생 아미노산 서열이거나 이를 포함한다. 일부 실시양태에서, 바코드는 합성된 아미노산 서열이거나 이를 포함한다. 일부 실시양태에서, 바코드는 자연 발생 아미노산을 포함한다. 일부 실시양태에서, 바코드는 비자연 발생 아미노산(예를 들어, 변형된 아미노산)을 포함한다. 일부 실시양태에서, 바코드는 펩티드 바코드이거나 이를 포함한다.
본 발명의 바코드 길이는 다양할 수 있다. 예를 들어, 일부 실시양태에서, 바코드는 1 내지 100개 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바코드는 5 내지 50개 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바코드는 8 내지 25개 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바코드는 9 내지 25개 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바코드는 9 내지 15개 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바코드는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개 아미노산 길이일 수 있다. 일부 실시양태에서, 바코드는 적어도 5개 아미노산 길이일 수 있다. 일부 실시양태에서, 바코드는 최대 100개 아미노산 길이일 수 있다.
본원에 설명된 바와 같은 바코드는 다양한 형식의 라이브러리로 이용 가능하다. 예를 들어, 일부 실시양태에서 본원에 설명된 바와 같은 바코드는 핵산 서열로 설명될 수 있다. 다른 경우, 본원에 설명된 바와 같은 바코드는 아미노산 서열로 설명될 수 있다. 당업자는 하나의 형식으로 설명된 바코드가 기본적인 생물학적 원리를 사용하여 다른 형식으로 변환될 수 있다는 것을 이해할 것이다. 따라서, 핵산 서열로 설명된 바코드는 단백질로 번역될 수 있으며, 이는 혼합물에서 페이로드(예를 들어, 단백질)의 존재 또는 부재를 검출하는 데 사용될 수 있다. 이러한 번역된 바코드는 본원에서 펩티드 바코드로 지칭된다.
따라서, 핵산을 사용하여 설명할 때 본 개시내용의 바코드는 위 단락에 개시된 아미노산 서열 길이와 다른 길이일 수 있다. 예를 들어, 일부 실시양태에서, 바코드는 3개에서 300개 사이의 뉴클레오티드 범위의 길이일 수 있다. 일부 실시양태에서, 바코드는 15개에서 150개 사이의 뉴클레오티드 범위의 길이일 수 있다. 일부 실시양태에서, 바코드는 24개에서 75개 사이의 뉴클레오티드 범위의 길이일 수 있다. 일부 실시양태에서, 바코드는 27개에서 75개 사이의 뉴클레오티드 범위의 길이일 수 있다. 일부 실시양태에서, 바코드는 27개에서 45개 사이의 뉴클레오티드 범위의 길이일 수 있다. 일부 실시양태에서 바코드는 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74 또는 75개 뉴클레오티드 길이일 수 있다. 일부 실시양태에서, 바코드는 적어도 15개 뉴클레오티드 길이일 수 있다. 일부 실시양태에서, 바코드는 최대 300개 뉴클레오티드 길이일 수 있다.
본 개시내용의 바코드는 하나 이상의 특성이 있을 수 있다. 일부 실시양태에서, 바코드는 자연 발생일 수 있다. 일부 실시양태에서 바코드는 비자연적 발생(예를 들어, 합성)일 수 있다. 일부 실시양태에서, 바코드는 페이로드 기능에 비교적 영향을 미치지 않을 수 있다. 예를 들어, 일부 실시양태에서, 본원에 설명된 바와 같은 바코드로 페이로드(예를 들어, 단백질)를 태깅하는 것은 태깅된 페이로드의 기능을 비교적 변경시키지 않거나 변화시키지 않는다. 일부 실시양태에서, 바코드는 페이로드 기능에 (예를 들어, 긍정적 또는 부정적) 영향을 미칠 수 있다. 예를 들어, 일부 실시양태에서, 본원에 설명된 바와 같은 바코드로 페이로드(예를 들어, 단백질)를 태깅하는 것은 태깅된 페이로드의 기능을 비교적 변경시키거나 변화시킨다(예를 들어, 반감기(예를 들어, 더 긴 반감기), 특정 조직에 대한 표적화 향상 등). 일부 실시양태에서, 바코드는 면역 반응(예를 들어, IgG 반응, 보체 반응 등)을 유발하지 않을 수 있다. 일부 실시양태에서, 바코드는 서로 직교한다. 일부 실시양태에서, 바코드는 서로 직교하지 않는다.
본 발명의 바코드는 페이로드의 다양한 위치에 부착될 수 있다. 예를 들어, 일부 실시양태에서, 바코드는 페이로드의 적절한 위치에 부착될 수 있다. 일부 실시양태에서, 바코드는 페이로드의 부적합한 위치에 부착될 수 있다. 일부 실시양태에서, 바코드는 단백질 상의 적합한 위치에 부착될 수 있다. 예를 들어, 일부 실시양태에서, 바코드는 단백질의 N-말단에 부착될 수 있다. 일부 실시양태에서, 바코드는 단백질의 C-말단에 부착될 수 있다. 일부 실시양태에서, 바코드는 단백질 상의 비말단 위치(예를 들어, 측쇄)에 부착될 수 있다. 일부 실시양태에서, 바코드는 단백질 상의 부적합한 위치에 부착될 수 있다.
무엇보다도, 본 개시내용의 바코드(예를 들어, 펩티드 바코드 또는 펩티드 바코드를 암호화하는 핵산)는 추가 서열(예를 들어, 핵산 서열, 아미노산 서열 등) 옆에 있을 수 있다. 일부 실시양태에서, 바코드는 바코드의 5' 말단의 추가 서열 옆에 있을 수 있다. 일부 실시양태에서, 바코드는 바코드의 3' 말단의 추가 서열 옆에 있을 수 있다. 일부 실시양태에서, 바코드는 바코드의 3' 및 5' 말단의 추가 서열 옆에 있을 수 있다. 일부 실시양태에서, 추가 서열은 프라이머 결합 부위(primer binding site), 제한 엔도뉴클레아제 인식 서열(restriction endonuclease recognition sequence), 제한 효소 부위(restriction enzyme site)(예를 들어, 절단 부위), 아미노산 서열을 암호화하는 서열, 아미노산 서열을 암호화하지 않는 서열, 아미노산 서열 또는 핵산 서열일 수 있다. 예를 들어, 일부 실시양태에서, 바코드는 아미노산 서열을 암호화하는 핵산 서열 옆에 있을 수 있다. 일부 실시양태에서, 바코드는 아미노산 서열을 암호화하지 않는 핵산 서열 옆에 있을 수 있다. 일부 실시양태에서, 바코드는 아미노산 서열 옆에 있을 수 있다. 일부 실시양태에서, 펩티드 바코드는 아미노산 서열(예를 들어, 글리신-세린(GS)) 옆에 있을 수 있다. 유사하게, 일부 실시양태에서, 본 개시내용의 펩티드 바코드를 암호화하는 핵산은 추가 서열(예를 들어, 핵산 서열, 아미노산 서열 등) 옆에 있을 수 있다. 일부 실시양태에서, 펩티드 바코드를 암호화하는 핵산은 5' 말단의 핵산 서열 옆에 있을 수 있다. 일부 실시양태에서, 펩티드 바코드를 암호화하는 핵산은 3' 말단의 핵산 서열 옆에 있을 수 있다. 일부 실시양태에서, 펩티드 바코드를 암호화하는 핵산은 3' 및 5' 말단의 핵산 서열 옆에 있을 수 있다. 일부 실시양태에서, 펩티드 바코드를 암호화하는 핵산은 글리신-세린(GS)을 포함하는 아미노산 서열을 암호화하는 핵산 서열 옆에 있을 수 있다.
일부 실시양태에서, 바코드는 제한 엔도뉴클레아제 인식 서열 옆에 있을 수 있다. 일부 실시양태에서, 바코드는 바코드의 5' 말단의 제한 엔도뉴클레아제 인식 서열 옆에 있을 수 있다. 일부 실시양태에서, 바코드는 바코드의 3' 말단의 제한 엔도뉴클레아제 인식 서열 옆에 있을 수 있다. 일부 실시양태에서, 바코드는 바코드의 3' 및 5' 말단의 제한 엔도뉴클레아제 인식 서열 옆에 있을 수 있다. 일부 실시양태에서, 펩티드 바코드를 암호화하는 핵산은 제한 엔도뉴클레아제 인식 서열 옆에 있을 수 있다. 일부 실시양태에서, 펩티드 바코드를 암호화하는 핵산은 5' 말단의 제한 엔도뉴클레아제 인식 서열 옆에 있을 수 있다. 일부 실시양태에서, 펩티드 바코드를 암호화하는 핵산은 3' 말단의 제한 엔도뉴클레아제 인식 서열 옆에 있을 수 있다. 일부 실시양태에서, 펩티드 바코드를 암호화하는 핵산은 3' 및 5' 말단의 제한 엔도뉴클레아제 인식 서열 옆에 있을 수 있다. 일부 실시양태에서, 제한 엔도뉴클레아제 인식 서열은 하나 이상의 제한 효소(예를 들어, BsaI, BsmBI, BbsI, SapI 등)에 의해 인식될 수 있다. 일부 실시양태에서, 제한 엔도뉴클레아제 인식 서열은 유형 Ⅰ, 유형 Ⅱ, 또는 유형 Ⅱs 제한 엔도뉴클레아제 인식 서열이다. 예를 들어, 이러한 인식 서열은 다양한 페이로드의 각각 다른 위치로 펩티드 바코드를 클로닝하는 데 사용될 수 있는 보편적인 오버행(overhang)을 생성하는 데 사용될 수 있다. 이러한 유연성을 통해 바코드를 사용하여 각각 다른 실험에서 각각 다른 단백질 페이로드를 검출할 수 있다.
일부 실시양태에서, 바코드(예를 들어, 펩티드 바코드)를 암호화하는 핵산 서열은 페이로드(예를 들어, 관심 있는 단백질 페이로드)를 암호화하는 제2 핵산 서열과 회합(예를 들어, 부착, 연결)될 수 있다. 예를 들어, 이러한 핵산 서열은 번역되어 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)를 형성할 수 있다. 일부 실시양태에서, 바코드(예를 들어, 펩티드 바코드)를 암호화하는 핵산 서열은 페이로드(예를 들어, 관심 있는 단백질 페이로드)를 암호화하는 제2 핵산 서열과 별개이다. 이러한 핵산 서열의 경우, 예를 들어, 바코드를 암호화하는 핵산 서열은 페이로드를 암호화하는 제2 핵산 서열과 별개로 번역될 수 있으며, 이어서 개별 아미노산 서열을 (예를 들어, 링커를 사용하여) 연결하기 위해 당업계에 알려진 하나 이상의 방법을 사용하여 부착될 수 있다.
본 개시내용의 바코드는 바코드가 표시된 페이로드를 형성하기 위해 페이로드에 회합(예를 들어, 직접 또는 간접적으로 부착)될 수 있다. 예를 들어, 일부 실시양태에서, 각 바코드 서열(예를 들어, 펩티드 바코드 서열)은 혼합물 내의 단지 하나의 관심 있는 페이로드(예를 들어, 관심 있는 단백질)와 회합될 수 있다. 일부 실시양태에서, 각 바코드 서열은 혼합물 내의 하나 초과의 관심 있는 페이로드(예를 들어, 서열이 각각 다른 페이로드)와 회합될 수 있다. 일부 실시양태에서, 다수(예를 들어, 2개 이상, 3개 이상, 4개 이상 등)의 바코드 서열은 혼합물 내의 관심 있는 하나의 페이로드와 회합될 수 있다. 예를 들어, 일부 실시양태에서, 하나 이상의 바코드 서열은 주어진 페이로드의 다양한 각각 다른 위치에 회합될 수 있다 - 이러한 설정은, 예를 들어, 이러한 바코드가 표시된 페이로드의 안정성 및/또는 절단을 연구하고 식별하는 데 유용할 수 있다. 일부 실시양태에서, 혼합물 내 각 페이로드는 고유 서열이다(예를 들어, 각 페이로드는 혼합물 내 다른 모든 페이로드와 서열이 상이하다). 일부 실시양태에서, 혼합물 내 각 페이로드는 고유 서열이 아니다.
주어진 페이로드에 적합한 바코드를 선택하기 위해 다양한 방법과 매개변수가 사용될 수 있다. 예를 들어, 바코드가 표시된 페이로드의 안정성은 페이로드가 상기 바코드에 의해 태깅될 수 있는지를 확인하는 데 중요하다. 일부 실시양태에서, 바코드는 각각 다른 실험에 걸쳐 특이적 페이로드에 태깅될 수 있다. 일부 실시양태에서, 바코드는 각각 다른 실험에서 각각 다른 페이로드에 태깅될 수 있다. 예를 들어, 일부 실시양태에서, 바코드는 각각 다른 실험에 걸쳐 2개 이상, 3개 이상, 4개 이상, 10개 이상, 100개 이상, 1000개 이상 또는 10,000개 이상의 각각 다른 페이로드에 태깅될 수 있다.
일부 실시양태에서, 바코드는 주어진 실험에서 단 하나의 페이로드와 회합될 수 있다. 일부 실시양태에서, 바코드는 주어진 실험에서 다수의 페이로드와 회합될 수 있다. 예를 들어, 일부 실시양태에서, 하나 이상의 바코드는 혼합물 내 다수의 페이로드와 회합되어(즉, 바코드가 다수의 페이로드에 태깅되어) 각 페이로드는 혼합물 내의 고유 바코드 세트와 회합된다. 즉, 각 페이로드는 혼합물 내 고유 바코드 "패턴"과 회합될 수 있다. 유사하게, 일부 실시양태에서는 여러 페이로드가 동일한 바코드와 회합될 수 있다.
무엇보다도, 본원에 설명된 바코드는 개별(즉, 고유한) 서열을 갖도록 설계되었다. 일부 실시양태에서, 바코드는 개별 서열(예를 들어, 다른 바코드와 별개)을 갖도록 설계된다. 예를 들어, 각 바코드는 실험에 사용된 다른 모든 바코드와 별개이도록(예를 들어, 고유하도록) 설계되어 각 페이로드(예를 들어, 측정할 단백질)가 적어도 하나의 바코드에 부착되고 각 바코드(예를 들어, 특정 순서의 바코드)는 하나의 페이로드에만 첨부된다. 당업자가 이해할 수 있는 바와 같이, 풀 내에 함유된 바코드의 다양성은 주어진 바코드 길이에 대한 아미노산 서열의 가능한 다양성에 의해서만 제한된다. 예를 들어, 바코드 길이가 'N'인 경우, 길이 N의 20N개의 개별 아미노산 바코드 서열이 존재한다(비변형/자연 발생 아미노산만 사용되는 경우). 즉, 바코드 길이가 15인 경우, 이론적 제한은 2015개, 즉 3.2768 x 1019개이다.
본 개시내용의 다양한 실시양태에 따른 바코드의 예는 표 1 및 표 2에 나열되어 있다. 일부 실시양태에서, 바코드(예를 들어, 펩티드 바코드)는 서열번호 5347-8398로부터 선택된 아미노산 서열이거나 이를 포함한다. 일부 실시양태에서, 바코드(예를 들어, 펩티드 바코드)는 서열번호 1148-4199로부터 선택된 핵산 서열이거나 이를 포함하는 서열에 의해 암호화된다.
페이로드:
본원에 개시된 방법 및 시스템은 본원에 설명된 바와 같은 하나 이상의 페이로드를 검출하는 데 사용될 수 있다. 일부 실시양태에서, 페이로드는 관심 있는 단백질이다. 일부 실시양태에서, 페이로드는 치료 기능이 있는 단백질이다. 일부 실시양태에서, 페이로드는 치료 기능이 없는 단백질이다(예를 들어, 치료 기능이 있는 또 다른 페이로드를 보조할 수 있음). 예를 들어, 가능한 페이로드는 단클론 항체, 단일 도메인 항체, 효소, 이중특이적 항체 또는 치료 기능이 있을 수 있는 기타 단백질과 같이 약물로서 스크리닝하려는 단백질이다.
한 측면에서, 본원에 개시된 시스템 및 방법은 혼합물 내 페이로드(예를 들어, 단백질)를 검출하는 데 사용될 수 있다. 구체적으로, 본원에 개시된 바코드는 혼합물 내 페이로드(예를 들어, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질))에 태깅되고 혼합물 내 상기 페이로드를 검출하는 데 사용된다. 일부 실시양태에서, 각 페이로드는 혼합물 내 다른 모든 페이로드와 상이하다. 일부 실시양태에서, 혼합물 내 각 페이로드는 혼합물 내 다른 모든 페이로드와 적어도 하나의 아미노산이 상이하다. 일부 실시양태에서, 혼합물 내 각 페이로드는 혼합물 내 다른 모든 페이로드와 2개 이상의 아미노산이 상이하다. 일부 실시양태에서, (예를 들어, 혼합물 내) 페이로드에는 바코드가 태깅될 수 있다. 일부 실시양태에서, (예를 들어, 혼합물 내) 각 페이로드에는 동일한 바코드가 태깅될 수 있다. 일부 실시양태에서, (예를 들어, 혼합물 내) 각 페이로드에는 각각 다른 바코드가 태깅될 수 있다. 일부 실시양태에서, (예를 들어, 혼합물 내) 페이로드는 적어도 하나의 아미노산이 혼합물 내 (예를 들어, 다른 페이로드와 회합된) 다른 모든 바코드와 각각 다른 바코드로 태깅될 수 있다. 일부 실시양태에서, (예를 들어, 혼합물 내) 페이로드는 2개 이상의 아미노산이 혼합물 내 (예를 들어, 다른 페이로드와 회합된) 다른 모든 바코드와 각각 다른 바코드로 태깅될 수 있다.
본원의 다른 곳에서 논의된 바와 같이, 페이로드는 (예를 들어, 각각 다른 혼합물 내, 각각 다른 실험 등에서) 각각 다른 바코드로 태깅될 수 있다. 예를 들어, 위에서 언급한 바와 같이, 일부 실시양태에서, 각 바코드 서열은 혼합물 내 단지 하나의 관심 있는 페이로드에만 부착될 수 있다. 일부 실시양태에서, 각 바코드 서열은 혼합물 내 하나 초과의 관심 있는 페이로드(예를 들어, 각각 다른 서열을 갖는 페이로드)에 부착될 수 있다. 일부 실시양태에서, 다수(예를 들어, 2개 이상, 3개 이상, 4개 이상 등)의 바코드 서열이 혼합물 내 관심 있는 하나의 페이로드에 부착될 수 있다. 예를 들어, 일부 실시양태에서 하나 이상의 바코드 서열은 주어진 페이로드의 다양한 각각 다른 위치에 부착될 수 있다 - 이러한 설정은, 예를 들어, 이러한 바코드가 표시된 페이로드의 안정성을 연구하고 식별하는 데 유용할 수 있다. 일부 실시양태에서, 혼합물 내 각 페이로드는 고유 서열이다(예를 들어, 각 페이로드는 혼합물 내 다른 모든 페이로드와 각각 다른 서열을 갖는다). 일부 실시양태에서, 혼합물 내 각 페이로드는 고유하지 않은 서열이다.
일부 실시양태에서, 페이로드는 각각 다른 실험에 걸쳐 특이적 바코드에 태깅될 수 있다. 일부 실시양태에서, 페이로드는 각각 다른 실험에서 각각 다른 바코드에 태깅될 수 있다. 예를 들어, 일부 실시양태에서, 페이로드는 여러 실험에 걸쳐 2개 이상, 3개 이상, 4개 이상, 10개 이상, 100개 이상, 1000개 이상 또는 10,000개 이상의 각각 다른 바코드에 태깅될 수 있다.
일부 실시양태에서 페이로드는 주어진 실험에서 단 하나의 바코드와 회합될 수 있다. 일부 실시양태에서, 페이로드는 주어진 실험에서 다수의 바코드와 회합될 수 있다. 예를 들어, 일부 실시양태에서, (예를 들어, 혼합물 내) 하나 이상의 바코드는 혼합물 내 다수의 페이로드와 회합되어(즉, 바코드가 다수의 페이로드에 태깅됨) 각 페이로드는 혼합물 내의 고유 바코드 세트와 회합된다. 즉, 각 페이로드는 혼합물 내 고유 바코드 "패턴"과 연관될 수 있다. 일부 실시양태에서, 여러 페이로드가 동일한 바코드와 회합될 수 있다.
링커:
무엇보다도, 본원에 설명된 시스템 및 방법은 링커를 사용할 수 있다. 일부 실시양태에서, 본원에 설명된 바와 같은 페이로드와 본원에 설명된 바와 같은 바코드는 링커에 의해 분리된다. 일부 실시양태에서, 링커(L)는 페이로드(P)와 바코드(b) 사이의 거리를 제공한다. 즉, 일부 실시양태에서 구조적으로 바코드가 표시된 페이로드는 P-L-b의 시퀀스를 가질 수 있다. 예를 들어, 이는 접힘 특성, 페이로드 기능성 및/또는 페이로드 안정성에 기여할 수 있다.
일부 실시양태에서, 링커는 핵산일 수 있다. 일부 실시양태에서, 링커는 아미노산일 수 있다. 본원에 설명된 바와 같은 링커는 길이가 다양할 수 있다. 예를 들어, 일부 실시양태에서, 링커는 적어도 3개 아미노산 길이일 수 있다. 일부 실시양태에서, 링커는 1 내지 50개 아미노산(예를 들어, 1 내지 30개 아미노산) 길이일 수 있다.
일부 실시양태에서, 본 발명의 링커는 치료 시 절단될 수 있다. 예를 들어, 일부 실시양태에서, 링커는 치료 시 절단될 수 있는 하나 이상의 모티프를 포함할 수 있다.
일부 실시양태에서, 본 발명의 링커는 절단에 대해 저항성이 있을 수 있다. 일부 실시양태에서, 본 발명의 링커는 검정에서 절단에 대해 저항성이 있을 수 있다. 일부 실시양태에서, 본 발명의 링커는 생체 내 절단에 대해 저항성이 있을 수 있다.
한 측면에서, 링커는 바코드를 태깅하는데 사용될 수 있다. 일부 실시양태에서, 각 링커 서열은 개별 바코드 서열과 회합되어 있다. 예를 들어, 일부 실시양태에서, 링커 서열은 혼합물에서 개별 바코드 서열(예를 들어, 핵산 서열)과 회합된 고유 태그로서 사용될 수 있다. 즉, 일부 실시양태에서, 이러한 링커는 회합된 바코드 서열을 증폭시키는 데 사용될 수 있다. 예를 들어, 일부 실시양태에서, 이러한 링커는 회합된 바코드 서열을 증폭시키기 위한 프라이머로서 사용될 수 있다. 이어서 일부 실시양태에서, 증폭된 링커를 사용하여 회합된 바코드 서열을 단리함으로써, 주어진 링커-바코드 쌍으로부터 바코드 서열(예를 들어, 핵산 서열)을 검색할 수 있다. 일부 실시양태에서, 링커-바코드 쌍은 바코드 서열의 식별을 위해 DNA 시퀀싱의 대상이 될 수 있다.
일부 실시양태에서, 링커-바코드 쌍을 암호화하는 핵산 서열은 링커-바코드 쌍을 새로운 페이로드에 회합(예를 들어, 연결)하는 데 사용될 수 있다.
Ⅱ. 바인더 및 결합제
바인더:
일부 실시양태에서, 바인더(즉, 바인더 모이어티)는 핵산 서열이거나 이를 포함한다. 일부 실시양태에서, 바인더는 자연 발생 핵산 서열이거나 이를 포함한다. 일부 실시양태에서, 바인더는 비자연 발생 핵산 서열이거나 이를 포함한다. 일부 실시양태에서, 바인더는 합성된 핵산 서열이거나 이를 포함한다. 일부 실시양태에서, 바인더는 자연 발생 핵산을 포함한다. 일부 실시양태에서, 바인더는 비자연 발생 핵산(예를 들어, 변형된 핵산)을 포함한다.
일부 실시양태에서, 바인더 핵산 서열은 폴리펩티드 서열을 암호화하는 서열이거나 이를 포함한다. 예를 들어, 일부 실시양태에서, 바인더 핵산 서열은 주어진 바코드(예를 들어, 펩티드 바코드)에 대해 높은 친화도 및/또는 특이성을 부여하는 폴리펩티드 서열을 암호화하는 영역을 함유할 수 있다. 일부 실시양태에서, 바인더 핵산 서열은 항체를 암호화하는 서열이거나 이를 포함한다. 일부 실시양태에서, 바인더 핵산 서열은 항체의 단편을 암호화하는 서열이거나 이를 포함한다. 일부 실시양태에서, 바인더 핵산 서열은 단일 사슬 가변 단편(scFv)을 암호화하는 서열이거나 이를 포함한다. 당업자에게 알려진 바와 같이, scFv는 면역글로불린의 중쇄(VH) 및 경쇄(VL)의 가변 영역의 융합 단백질이다. 일부 실시양태에서, VH 및 VL 사슬은 짧은 링커 펩티드(예를 들어, 약 5-50개 아미노산 길이, 10-25개 아미노산 길이의 링커 등)와 연결될 수 있다.
예를 들어, 일부 실시양태에서, 바인더는 주어진 바코드에 대해 알려진 특이성 및 친화도를 갖도록 생성된다. 일부 실시양태에서, 바인더는 하나의 바코드에 대해 알려진 특이성 및 친화도를 갖도록 생성된다. 일부 실시양태에서, 바인더는 다수(예를 들어, 2개 이상, 3개 이상 등)의 바코드에 대해 알려진 특이성 및 친화도를 갖도록 생성된다. 일부 실시양태에서, 바인더는 적어도 하나의 바코드에 대해 알려진 특이성 및 친화도를 갖도록 생성된다. 일부 실시양태에서, 예를 들어, 바인더는 당업자에게 알려진 방법을 사용하여 결합제(예를 들어, 파지, 리보솜 등)의 표면에서 발현된다.
일부 실시양태에서, 바인더는 (예를 들어, 알려진 특이성 및 친화도를 갖는) 바코드와 회합한다.
일부 실시양태에서, 바인더는 자연 발생 폴리펩티드 서열이거나 이를 포함한다. 일부 실시양태에서, 바인더는 비자연 발생 폴리펩티드 서열이거나 이를 포함한다. 일부 실시양태에서, 바인더는 합성된 폴리펩티드 서열이거나 이를 포함한다. 일부 실시양태에서, 바인더는 자연 발생 아미노산을 포함한다. 일부 실시양태에서, 바인더는 비자연 발생 아미노산(예를 들어, 변형된 아미노산)을 포함한다.
본 발명의 바인더의 길이는 다양할 수 있다. 예를 들어, 일부 실시양태에서, 바인더는 5개에서 1000개 사이의 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바인더는 5개에서 800개 사이의 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바인더는 6개에서 500개 사이의 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바인더는 10개에서 400개 사이의 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바인더는 5개에서 500개 사이의 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바인더는 5개에서 1000개 사이의 아미노산 범위의 길이일 수 있다. 일부 실시양태에서, 바인더는 10개 아미노산 길이일 수 있다. 일부 실시양태에서, 바인더는 적어도 5개 아미노산 길이일 수 있다. 일부 실시양태에서, 바인더는 최대 1000개 아미노산 길이일 수 있다.
본원에 설명된 바와 같은 바인더는 각각 다른 형식의 라이브러리로 이용 가능하다. 예를 들어, 일부 실시양태에서, 본원에 설명된 바와 같은 바인더는 핵산 서열로서 설명될 수 있다. 다른 경우, 본원에 설명된 바와 같은 바인더는 아미노산 서열로서 기술될 수 있다. 당업자는 하나의 형식으로 설명된 바인더가 기본적인 생물학적 원리를 사용하여 다른 형식으로 전환될 수 있음을 이해할 것이다. 따라서, 핵산 서열로 설명된 바인더는 단백질로 번역될 수 있으며, 이는 혼합물 내 페이로드(예를 들어, 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질))의 존재 또는 부재를 검출하는 데 사용될 수 있다. 이러한 번역된 바인더는 본원에서 폴리펩티드 바인더 또는 폴리펩티드 바인더 모이어티로 지칭된다.
따라서, 핵산을 사용하여 설명할 때 본 개시내용의 바인더는 길이가 상기 단락에 개시된 아미노산 서열 길이와 다를 수 있다. 예를 들어, 일부 실시양태에서, 바인더는 15개에서 3000개 사이의 뉴클레오티드 범위의 길이일 수 있다. 일부 실시양태에서, 바인더는 15개에서 2400개 사이의 뉴클레오티드 범위의 길이일 수 있다. 일부 실시양태에서, 바인더는 24개에서 1500개 사이의 뉴클레오티드 범위의 길이일 수 있다. 일부 실시양태에서, 바인더는 30개에서 1200개 사이의 뉴클레오티드 범위의 길이일 수 있다. 일부 실시양태에서, 바인더는 30개 뉴클레오티드 길이일 수 있다. 일부 실시양태에서, 바인더는 적어도 15개 뉴클레오티드 길이일 수 있다. 일부 실시양태에서, 바인더는 최대 3000개 뉴클레오티드 길이일 수 있다.
본 개시내용의 바인더는 하나 이상의 특이적 특성이 있을 수 있다. 일부 실시양태에서, 바인더는 자연 발생일 수 있다. 일부 실시양태에서, 바인더는 비자연 발생(예를 들어, 합성)일 수 있다. 일부 실시양태에서, 바인더는 면역 반응(예를 들어, IgG 반응, 보체 반응 등)을 유발하지 않을 수 있다.
무엇보다도, 위에서 논의된 바코드와 마찬가지로 본 개시내용의 바인더(예를 들어, 폴리펩티드 바인더, 바인더를 암호화하는 핵산)는 추가 서열(예를 들어, 핵산 서열, 아미노산 서열 등) 옆에 있을 수 있다. 일부 실시양태에서, 바인더는 바인더의 5' 말단의 추가 서열 옆에 있을 수 있다. 일부 실시양태에서, 바인더는 바인더의 3' 말단의 추가 서열 옆에 있을 수 있다. 일부 실시양태에서, 바인더는 바인더의 3' 및 5' 말단의 추가 서열 옆에 있을 수 있다. 일부 실시양태에서, 추가 서열은 프라이머 결합 부위, 제한 엔도뉴클레아제 인식 서열, 제한 효소 부위(예를 들어, 절단 부위), 아미노산 서열을 암호화하는 서열, 아미노산 서열을 암호화하지 않는 서열, 아미노산 서열 또는 핵산 서열일 수 있다.
본 발명의 한 측면에서, 바인더 핵산 서열은 또 다른 핵산 서열과 회합될 수 있다(예를 들어, 부착되거나 연결될 수 있음). 예를 들어, 일부 실시양태에서, 바인더 핵산 서열은 하나 이상의 유전자를 암호화하는 핵산 서열과 회합될 수 있다. 일부 실시양태에서, 바인더 핵산 서열은 파지의 하나 이상의 유전자(예를 들어, m13)를 암호화하는 핵산 서열과 회합될 수 있다. 일부 실시양태에서, 바인더 핵산 서열은 폴리펩티드를 암호화하는 핵산 서열과 회합될 수 있다. 일부 실시양태에서, 바인더 핵산 서열은 파지의 폴리펩티드(예를 들어, m13 유전자3 단백질)를 암호화하는 핵산 서열과 회합될 수 있다. 바인더-유전자3 단백질 융합체는 발현되어 m13 파지에 통합될 수 있다.
무엇보다도, 본원에 설명된 바인더는 개별(즉, 고유) 서열을 갖도록 설계된다. 일부 실시양태에서, 바인더는 (예를 들어, 다른 바인더와 별개의) 개별 서열을 갖도록 설계된다. 예를 들어, 각 바인더는 실험에 사용된 다른 모든 바인더와 별개이도록(예를 들어, 고유하도록) 설계되었다.
본 발명의 한 측면에서, 바인더는 본원에 설명된 바와 같이 바코드 또는 바코드가 표시된 페이로드에 높은 특이성과 높은 친화력으로 결합한다. 일부 실시양태에서, 바코드 또는 바코드가 표시된 페이로드(예를 들어, 측정할 바코드가 표시된 단백질)는 하나의 바인더에 결합하고, 각 바인더(예를 들어, 특정 서열을 갖는 바인더)는 하나의 바코드 또는 바코드가 표시된 페이로드에 결합한다. 일부 실시양태에서, 바코드 또는 바코드가 표시된 페이로드(예를 들어, 측정될 바코드가 표시된 단백질)는 적어도 하나의 바인더에 결합한다. 일부 실시양태에서, 각 바인더(예를 들어, 특정 서열을 갖는 바인더)가 적어도 하나의 바코드 또는 바코드가 표시된 페이로드에 결합한다. 일부 실시양태에서, (예를 들어, 각각 다른 서열(예를 들어, 폴리펩티드 서열)을 갖는) 다수의 바인더가 단일 바코드에 결합한다. 일부 실시양태에서, (예를 들어, 각각 다른 서열(예를 들어, 펩티드 서열)을 갖는) 다수의 바코드가 단일 바인더에 결합한다.
본 개시내용의 다양한 실시양태에 따른 바인더의 예는 표 1 및 2에 나열되어 있다. 일부 실시양태에서, 바인더(예를 들어, 폴리펩티드 바인더)는 서열번호 4200-5346으로부터 선택된 아미노산 서열이거나 이를 포함한다. 일부 실시양태에서, 바인더(예를 들어, 폴리펩티드 바인더)는 서열번호 1-1147로부터 선택된 핵산 서열이거나 이를 포함하는 서열에 의해 암호화된다.
결합제:
본원에 설명된 방법은 결합제를 사용하여 하나 이상의 바코드를 검출하는 것에 관한 것이다. 일부 실시양태에서, 결합제는 검출 가능한 핵산과 회합되거나 이를 포함한다. 일부 실시양태에서, 결합제는 검출 가능한 핵산을 발현한다. 일부 실시양태에서, 결합제는 표면에 검출 가능한 핵산(예를 들어, 바인더)을 발현한다. 일부 실시양태에서, 결합제는 표면에서 항체를 발현한다.
예를 들어, 일부 실시양태에서, 특이적(예를 들어, 개별) 바코드의 존재를 검출하기 위해, 본 발명은 검출 가능한 개별 핵산(예를 들어, DNA 서열, RNA 서열 등)과 특이적 바코드의 회합을 구상한다. 이는 바코드를 결합제와 접촉시킴으로써 달성된다. 일부 실시양태에서, 하나 이상의 바코드는 결합제와 접촉될 수 있다. 일부 실시양태에서, 하나 이상의 결합제는 바코드와 접촉될 수 있다.
일부 실시양태에서, 결합제는 파지, 리보솜, mRNA, DNA 등이거나 이를 포함할 수 있다. 일부 실시양태에서, 결합제는 파지이다. 일부 실시양태에서, 결합제는 M13 파지, T4 파지, T7 파지, 람다 파지 또는 사상 파지일 수 있다. 일부 실시양태에서, 결합제는 M13 파지일 수 있다.
본원에 개시된 바와 같은 바인더는 당업계에 알려진 방법을 사용하여 결합제에서 발현될 수 있다. 예를 들어, 당업자는 당업계에서 이용 가능한 기술 및 방법을 사용하여 파지에서(예를 들어, 표면에서) 폴리펩티드 바인더를 암호화하는 핵산을 발현시킬 수 있다.
Ⅲ. 생성
바코드의 생성:
본 개시내용의 시스템 및 방법에 사용하기 위한 바코드의 생성 방법 및 생성용 시스템이 본원에 개시된다. 일부 실시양태에서, 본원에 설명된 바와 같은 바코드는 신속하게(예를 들어, 약 1주, 약 2주, 약 3주, 약 4주, 약 1개월, 약 2개월, 약 3개월, 약 4개월, 약 5개월, 약 6개월 또는 약 1년 내) 생성될 수 있다. 일부 실시양태에서, 예를 들어, 약 100개에서 약 1,000개 사이의 바코드가 빠르게 생성될 수 있다. 일부 실시양태에서, 약 10개에서 약 1000개 사이의 바코드가 빠르게 생성될 수 있다. 일부 실시양태에서, 약 10개에서 약 10,000개 사이의 바코드가 빠르게 생성될 수 있다. 본원에 설명된 바와 같이 다수의 바코드가 신속하게 생성될 수 있지만, 이러한 바코드는 본원에 개시된 방법을 사용하여 생성된 바코드가 알려진 바인더 세트에 특이적으로 각각 다른 친화도로 결합할 수 있다는 점에서 강력하다.
다양한 실시양태에 따르면, 본원에 설명된 바와 같은 바코드는 핵산(예를 들어, 올리고뉴클레오티드) 어레이를 사용하여 합성될 수 있다. 일부 실시양태에서, 본원에 설명된 바와 같은 바코드는 DNA 어레이를 사용하여 합성될 수 있다. 일부 실시양태에서, 핵산 어레이의 핵산(예를 들어, 올리고뉴클레오티드)은 바코드 안으로 발현된다. 일부 실시양태에서, 본원에 설명된 바와 같은 바코드는 핵산 라이브러리를 사용하여 합성될 수 있다. 일부 실시양태에서, 핵산 라이브러리는 핵산 어레이를 사용하여 합성된다. 일부 실시양태에서, 핵산 라이브러리의 핵산(예를 들어, 올리고뉴클레오티드)은 바코드 안으로 발현된다.
일부 실시양태에서, 바코드 핵산 라이브러리는 약 1개 이상, 약 2개 이상, 약 3개 이상, 약 4개 이상, 약 5개 이상, 약 10개 이상, 약 50개 이상, 약 100개, 약 200개 이상, 약 300개 이상, 약 400개 이상, 약 500개 이상, 약 600개 이상, 약 700개 이상, 약 800개 이상, 약 900개 이상, 약 1000개 이상, 약 2000개 이상, 약 3000개 이상, 약 4000개 이상 또는 약 5000개 이상의 잠재적인 바코드를 포함한다. 일부 실시양태에서, 핵산 라이브러리는 하나 이상의 잠재적인 바코드 서열을 포함한다. 이러한 잠재적인 바코드 서열은 본원에 설명된 하나 이상의 방법을 사용하여 (즉, 잠재적인 바코드 핵산 서열의 번역 후) 펩티드 바코드로서의 기능성에 대해 스크리닝될 수 있다.
본 발명의 바코드는 하나 이상의 특이적 특성에 대해 스크리닝될 수 있다. 일부 실시양태에서, 바코드는 바인더에 대한 특이적 결합(예를 들어, 특이성, 결합 친화도)에 대해 스크리닝될 수 있다. 일부 실시양태에서, 바코드는 하나 이상의 바인더에 대한 특이적 결합에 대해 스크리닝될 수 있다. 일부 실시양태에서, 바코드는 적어도 하나의 바인더에 대한 특이적 결합에 대해 스크리닝될 수 있다. 일부 실시양태에서, 바코드는 최대 하나의 바인더에 대한 특이적 결합에 대해 스크리닝될 수 있다. 일부 실시양태에서, 바코드는 다수의 바인더에 대한 특이적 결합에 대해 스크리닝될 수 있다.
당업자가 이해할 수 있는 바와 같이, 바코드는 바코드 풀에서 별개이도록(즉, 고유하도록(예를 들어, 고유 서열을 갖도록)) 설계된다. 이러한 구별은 일부 실시양태에서 바코드의 하나 이상의 아미노산을 변경함으로써 달성될 수 있다. 일부 실시양태에서, 바코드는 바코드 풀 내 다른 바코드와 1개의 아미노산이 구별된다. 일부 실시양태에서, 바코드는 바코드 풀 내 다른 바코드와 적어도 1개의 아미노산이 구별된다. 일부 실시양태에서, 바코드는 바코드 풀 내 다른 바코드와 최대 1개의 아미노산이 구별된다. 일부 실시양태에서, 바코드는 바코드 풀 내 다른 바코드와 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 아미노산이 구별된다. 일부 실시양태에서, 바코드는 바코드 풀 내 다른 바코드와 적어도 2개의 아미노산이 구별된다. 일부 실시양태에서, 바코드는 바코드 풀 내 다른 바코드와 최대 50개의 아미노산이 구별된다.
바코드가 표시된 페이로드의 생성:
본 발명에 따른 바코드가 표시된 페이로드는 다양한 방식으로 생성될 수 있다. 일부 실시양태에서, 페이로드-바코드 핵산 서열 쌍은 각각 다른 발현 시스템(예를 들어, 단백질 발현 시스템)에서의 발현을 허용하기 위해 플라스미드에 삽입될 수 있다. 일부 실시양태에서, 적어도 하나의 페이로드-바코드 핵산 서열 쌍이 플라스미드에 삽입된다. 일부 실시양태에서, 적어도 2개의 페이로드-바코드 핵산 서열 쌍이 플라스미드에 삽입된다. 일부 실시양태에서, 적어도 3개의 페이로드-바코드 핵산 서열 쌍이 플라스미드에 삽입된다. 일부 실시양태에서, 하나 이상의 페이로드-바코드 핵산 서열 쌍이 플라스미드에 삽입된다.
일부 실시양태에서, 페이로드-바코드 핵산 서열은 추가 서열을 포함할 수 있다. 일부 실시양태에서, 페이로드-바코드 핵산 서열은 추가 핵산 서열을 포함할 수 있다. 일부 실시양태에서, 페이로드-바코드 핵산 서열은 범용 모티프 서열을 포함할 수 있다. 일부 실시양태에서, 페이로드-바코드 핵산 서열은 적어도 하나의 범용 모티프 서열을 포함할 수 있다. 일부 실시양태에서, 페이로드-바코드 핵산 서열은 적어도 2개의 범용 모티프 서열을 포함할 수 있다. 일부 실시양태에서, 페이로드-바코드 핵산 서열은 2개 이상의 범용 모티프 서열을 포함할 수 있다.
일부 실시양태에서, 페이로드-바코드 핵산 서열 풀 내 적어도 하나의 페이로드-바코드 핵산 서열은 범용 모티프 서열을 포함할 수 있다. 일부 실시양태에서, 페이로드-바코드 핵산 서열 풀 내 모든 페이로드-바코드 핵산 서열은 범용 모티프 서열을 포함할 수 있다.
본원에 설명된 기술을 생성하기 위해 각각 다른 플라스미드가 사용될 수 있다. 일부 실시양태에서, 플라스미드는 DNA 플라스미드이다. 일부 실시양태에서, 플라스미드는 RNA 플라스미드이다. 일부 실시양태에서, 플라스미드는 생식력(fertility) F-플라스미드이다. 일부 실시양태에서, 플라스미드는 저항 플라스미드(resistance plasmid)이다. 일부 실시양태에서, 플라스미드는 독성 플라스미드(virulence plasmid)이다. 일부 실시양태에서, 플라스미드는 분해성 플라스미드(degradative plasmid)이다. 일부 실시양태에서, 플라스미드는 Col 플라스미드이다.
본원에 설명된 기술을 생성하기 위해 각각 다른 숙주(예를 들어, 숙주 세포, 숙주 세포주 등)가 사용될 수 있다. 일부 실시양태에서, 숙주는 포유동물 숙주이다. 일부 실시양태에서, 숙주는 비포유동물 숙주이다. 일부 실시양태에서, 숙주는 곤충이다. 일부 실시양태에서, 숙주는 박테리아이다. 일부 실시양태에서, 숙주는 대장균(E. coli)이다.
일부 실시양태에서, 페이로드-바코드 쌍은 시험관 내에서 발현된다. 일부 실시양태에서, 페이로드-바코드 쌍은 생체 내에서 발현된다. 일부 실시양태에서, 페이로드-바코드 쌍은 RNA로부터 발현된다. 일부 실시양태에서, 페이로드-바코드 쌍은 전사된 RNA로부터 발현된다. 일부 실시양태에서, 페이로드-바코드 쌍은 DNA로부터 발현된다. 일부 실시양태에서, 페이로드-바코드 쌍은 (예를 들어, 단백질 번역에 필요한) 단백질 성분을 사용하여 발현된다.
바코드가 표시된 페이로드 작제물의 발현 후, 작제물은 풀로부터 정제될 수 있다. 일부 실시양태에서, 정제는 범용 모티프를 사용하여 수행될 수 있다. 일부 실시양태에서, 정제는 HIS 태그, FLAG 태그, HALO 태그, SNAP 태그, Avitag, Twin strep 태그, 또는 당업계에 알려진 임의의 다른 태그 기반 단백질 정제 방법을 사용하여 수행될 수 있다.
바인더의 생성:
본 개시내용의 시스템 및 방법에 사용하기 위한 바인더의 생성 방법 및 생성용 시스템이 본원에 개시된다. 일부 실시양태에서, 본원에 설명된 바와 같이 바인더는 빠르게(예를 들어, 약 1주, 약 2주, 약 3주, 약 4주, 약 1개월, 약 2개월, 약 3개월, 약 4개월, 약 5개월, 약 6개월 또는 약 1년 내) 생성될 수 있다. 일부 실시양태에서, 예를 들어, 약 100개에서 약 1000개 사이의 바인더가 빠르게 생성될 수 있다. 일부 실시양태에서, 약 10개에서 약 1000개 사이의 바인더가 빠르게 생성될 수 있다. 일부 실시양태에서, 약 10개에서 약 10,000개 사이의 바인더가 빠르게 생성될 수 있다. 본원에 설명된 바와 같이 다수의 바인더가 신속하게 생성될 수 있지만, 이러한 바인더는 본원에 개시된 방법을 사용하여 생성된 바인더가 알려진 바코드 세트에 특이적으로 각각 다른 친화도로 결합할 수 있다는 점에서 강력하다.
일부 실시양태에서, 바인더 핵산 라이브러리는 약 1개 이상, 약 2개 이상, 약 3개 이상, 약 4개 이상, 약 5개 이상, 약 10개 이상, 약 50개 이상, 약 100개 이상, 약 200개 이상, 약 300개 이상, 약 400개 이상, 약 500개 이상, 약 600개 이상, 약 700개 이상, 약 800개 이상, 약 900개 이상, 약 1000개 이상, 약 2000개 이상, 약 3000개 이상, 약 4000개 이상 또는 약 5000개 이상의 잠재적인 바인더를 포함한다. 일부 실시양태에서, 핵산 라이브러리는 하나 이상의 잠재적인 바인더 서열을 포함한다. 이러한 잠재적인 바인더 서열은 본원에 설명된 하나 이상의 방법을 사용하여(즉, 잠재적인 핵산 바인더 서열의 번역 후) 폴리펩티드 바인더로서의 기능성에 대해 스크리닝될 수 있다.
본 발명에 따른 바인더는 다양한 방식으로 생성될 수 있다. 일부 실시양태에서, 바인더 핵산 서열은 각각 다른 발현 시스템에서의 발현을 허용하기 위해 플라스미드에 삽입될 수 있다. 일부 실시양태에서, 적어도 하나의 바인더 핵산 서열이 플라스미드에 삽입된다. 일부 실시양태에서, 적어도 2개의 바인더 핵산 서열이 플라스미드에 삽입된다. 일부 실시양태에서, 적어도 3개의 바인더 핵산 서열이 플라스미드에 삽입된다. 일부 실시양태에서, 하나 이상의 바인더 핵산 서열은 플라스미드에 삽입된다.
일부 실시양태에서, 바인더 핵산 서열은 하나 이상의 유전자에 부착된다. 일부 실시양태에서, 바인더 핵산 서열은 플라스미드 안으로 삽입되기 전에 하나 이상의 유전자에 부착된다. 일부 실시양태에서, 바인더 핵산 서열은 플라스미드 안으로 삽입된 후 하나 이상의 유전자에 부착된다. 일부 실시양태에서, 바인더 핵산 서열은 박테리오파지 유전자에 부착된다. 일부 실시양태에서, 바인더 핵산 서열은 m13 박테리오파지 유전자에 부착된다. 일부 실시양태에서, 바인더 핵산 서열은 m13 박테리오파지의 유전자 3(즉, 유전자 3 단백질을 암호화하는 것)에 부착된다.
일부 실시양태에서, 플라스미드(예를 들어, 바인더 서열 함유, 바인더 및 박테리오파지 서열 등 함유)는 숙주 안으로 형질전환될 수 있다. 일부 실시양태에서, 플라스미드는 숙주 안으로 형질전환되어 발현될 수 있다. 일부 실시양태에서, 플라스미드는 박테리아 안으로 형질전환된다. 일부 실시양태에서, 플라스미드는 대장균 안으로 형질전환된다.
일부 실시양태에서, 플라스미드의 발현으로 파지가 생성된다. 일부 실시양태에서, 플라스미드의 발현으로 파지 표면에 바인더가 표시된다. 일부 실시양태에서, 플라스미드의 발현으로 파지 표면에 2개의 바인더가 표시된다. 일부 실시양태에서, 플라스미드의 발현으로 파지 표면에 적어도 하나의 바인더가 표시된다. 일부 실시양태에서, 플라스미드의 발현으로 파지 표면에 하나 이상의 바인더가 표시된다. 일부 실시양태에서, 플라스미드의 발현으로 파지의 하나 이상의 표면에 하나 이상의 바인더가 표시된다. 일부 실시양태에서, 플라스미드의 발현으로 파지의 하나 이상의 표면에 적어도 하나의 바인더가 표시된다.
파지 생성 후, 생성된 풀을 정제하여 하나 이상의 폴리펩티드 바인더의 존재를 확인할 수 있다. 일부 실시양태에서, 정제는 범용 모티프를 사용하여 수행될 수 있다. 일부 실시양태에서, 정제는 HIS 태그, FLAG 태그, HALO 태그, SNAP 태그, Avitag, Twin strep 태그, 또는 당업계에 알려진 임의의 다른 태그 기반 단백질 정제 방법을 사용하여 수행될 수 있다.
일부 실시양태에서, 정제된 바인더 풀은 매우 다양할 수 있다. 일부 실시양태에서, 정제된 바인더 풀은 매우 다양하지 않을 수 있다. 일부 실시양태에서, 정제된 바인더 풀은 관심 있는 바인더를 선택하기 위한 스크리닝 방법을 거친다.
본 개시내용의 바인더는 하나 이상의 특이적 특성에 대해 스크리닝될 수 있다. 일부 실시양태에서, 바인더는 바코드에 대한 특이적 결합에 대해 스크리닝될 수 있다. 일부 실시양태에서, 바인더는 하나 이상의 바코드에 대한 특이적 결합에 대해 스크리닝될 수 있다. 일부 실시양태에서, 바인더는 적어도 하나의 바코드에 대한 특이적 결합에 대해 스크리닝될 수 있다. 일부 실시양태에서, 바인더는 최대 하나의 바코드에 대한 특이적 결합에 대해 스크리닝될 수 있다. 일부 실시양태에서, 바인더는 다수의 바코드에 대한 특이적 결합에 대해 스크리닝될 수 있다.
당업자가 이해할 수 있는 바와 같이, 바인더는 바인더 풀에서 별개이도록(즉, 고유하도록(예를 들어, 고유 서열을 갖도록)) 설계된다. 이러한 구별은 일부 실시양태에서 바인더의 하나 이상의 아미노산을 변경함으로써 달성될 수 있다. 일부 실시양태에서, 바인더는 바인더 풀 내 다른 바인더와 1개 아미노산이 구별된다. 일부 실시양태에서, 바인더는 바인더 풀 내 다른 바인더와 적어도 1개의 아미노산이 구별된다. 일부 실시양태에서, 바인더는 바인더 풀 내 다른 바인더와 최대 1개의 아미노산이 구별된다. 일부 실시양태에서, 바인더는 바인더 풀 내 다른 바인더와 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 또는 25개의 아미노산이 구별된다. 일부 실시양태에서, 바인더는 바인더 풀 내 다른 바인더와 적어도 2개의 아미노산이 구별된다. 일부 실시양태에서, 바인더는 바인더 풀 내 다른 바인더와 최대 1000개의 아미노산이 구별된다.
Ⅳ. 특성화
샘플:
본 개시내용의 다른 곳에서 설명된 바와 같이, 샘플은 생물학적 샘플일 수 있다. 일부 실시양태에서 샘플은 하나 이상의 바코드가 표시된 페이로드를 함유할 수 있다. 일부 실시양태에서, 샘플은 하나 이상의 바코드가 표시된 단백질을 함유할 수 있다.
일부 실시양태에서, 샘플은 유기체로부터 유래된다. 일부 실시양태에서, 샘플은 동물로부터 유래된다. 일부 실시양태에서, 샘플은 질병의 동물 모델로부터 유래된다. 일부 실시양태에서, 샘플은 비포유동물로부터 유래된다. 일부 실시양태에서, 샘플은 포유동물(예를 들어, 설치류, 마우스, 래트, 토끼, 원숭이, 개, 고양이, 양, 소, 영장류 및/또는 돼지)로부터 유래된다. 일부 실시양태에서, 샘플은 마우스로부터 유래된다. 일부 실시양태에서, 샘플은 인간으로부터 유래된다. 일부 실시양태에서, 샘플은 세포로부터 유래된다(예를 들어, 시험관 내). 일부 실시양태에서, 샘플은 인간 세포주이다.
일부 실시양태에서, 샘플은 정제될 수 있다. 일부 실시양태에서, 샘플은 정제되지 않을 수도 있다.
일부 실시양태에서, 샘플은 바코드가 표시된 페이로드로 처리된 세포로부터 얻는다. 일부 실시양태에서, 샘플은 바코드가 표시된 페이로드로 처리되지 않은 세포로부터 얻는다. 일부 실시양태에서, 샘플은 바코드가 표시된 페이로드로 처리된 동물로부터 얻는다. 일부 실시양태에서, 샘플은 바코드가 표시된 페이로드로 처리되지 않은 동물로부터 얻는다. 예를 들어, 일부 실시양태에서, 샘플은 바코드가 표시된 단백질로 처리된 인간으로부터 얻는다.
일부 실시양태에서, 유전자 변형된 세포로부터 샘플을 얻는다. 일부 실시양태에서, 유전자 요법에 의해 변형된 세포로부터 샘플을 얻는다. 일부 실시양태에서, 하나 이상의 바코드가 표시된 페이로드를 포함하도록 유전자 변형된 세포로부터 샘플을 얻는다. 일부 실시양태에서, 바코드가 표시된 페이로드를 발현하도록 유전자 변형된 세포로부터 샘플을 얻는다. 일부 실시양태에서, 하나 이상의 바코드를 포함하도록 유전자 변형된 세포로부터 샘플을 얻는다. 일부 실시양태에서, 바코드를 발현하도록 유전자 변형된 세포로부터 샘플을 얻는다. 일부 실시양태에서, 하나 이상의 바인더를 포함하도록 유전자 변형된 세포로부터 샘플을 얻는다. 일부 실시양태에서, 바인더를 발현하도록 유전자 변형된 세포로부터 샘플을 얻는다.
일부 실시양태에서, 유전자 변형된 동물로부터 샘플을 얻는다. 일부 실시양태에서, 유전자 요법에 의해 변형된 동물로부터 샘플을 얻는다. 일부 실시양태에서, 하나 이상의 바코드가 표시된 페이로드를 포함하도록 유전자 변형된 동물로부터 샘플을 얻는다. 일부 실시양태에서, 바코드가 표시된 페이로드를 발현하도록 유전자 변형된 동물로부터 샘플을 얻는다. 일부 실시양태에서, 하나 이상의 바코드를 포함하도록 유전자 변형된 동물로부터 샘플을 얻는다. 일부 실시양태에서, 바코드를 발현하도록 유전자 변형된 동물로부터 샘플을 얻는다. 일부 실시양태에서, 하나 이상의 바인더를 포함하도록 유전자 변형된 동물로부터 샘플을 얻는다. 일부 실시양태에서, 바인더를 발현하도록 유전자 변형된 동물로부터 샘플을 얻는다.
지문:
무엇보다도, 본원에 설명된 시스템과 방법은 핵산 시퀀싱 기술의 장점을 확인하고 이를 단백질 검출 및 측정 방법에 효과적으로 적용한다. 예를 들어, 본원에 설명된 방법은 결합제에서 발현될 수 있고 단일 풀에서 함께 혼합될 수 있는, 각각 다른 바코드에 대한 결합 특이성 및 친화도가 알려진 여러 바인더를 사용할 수 있다. 바코드가 표시된 단백질(즉, 각각 본원에 설명된 바와 같은 바코드와 회합된 단백질)의 풀과 혼합 시, 결합제에서 발현된 각 바인더는 알려졌지만 다양한 친화도로 풀 내의 하나 이상의 바코드에 결합한다. 하나 이상의 바인더에 대한 주어진 바코드의 친화도 스펙트럼은 NGS를 통해 확인될 수 있는 주어진 바코드에 대한 바인더 수의 뚜렷한 분포를 가져오며, 본원에서는 '바코드 지문'이라고 한다. 일부 실시양태에서, 바코드 세트에 대한 집합적 바코드 지문을 본원에서 '지문 행렬'이라고 한다. 유사하게, 다양한(예를 들어, 하나 이상의) 바코드에 대한 바인더의 친화도 스펙트럼을 본원에서는 '바인더 지문'이라고 한다. 일부 실시양태에서, 제공된 기술을 사용하면, 바코드가 표시된 단백질(들)에 결합하는 결합제(예를 들어, 파지) 집단의 회합된 핵산(예를 들어, 검출 가능한 핵산(예를 들어, DNA 서열, RNA 서열 등))을 추출하고 시퀀싱하여, 예를 들어, 복합 용액 내 바코드가 표시된 단백질(들)의 존재를 검출할 수 있다. 즉, 예를 들어, 일부 실시양태에서, 복합 용액 내 단백질의 존재는 단일 바인더를 통해서가 아니라 고정된 알려진 비율로 상기 단백질과 회합된 바코드에 결합하는 다수의 바인더의 특정 조합을 통해 확인된다.
본원에 개시된 바와 같은 지문에는 많은 이점이 있다. 일부 실시양태에서, 검출의 지문 접근 방식은 노이즈의 감소를 허용한다. 예를 들어, 복합 용액 내 바코드를 검출하기 위해 다수의 바인더를 사용하면 검출 방법에 중복성이 도입되어 신호 노이즈가 줄어든다. 또한, "지문" 접근 방식의 또 다른 장점은 (예를 들어, 검출할 관심 있는 바코드 이외의 바코드에 대한) 바인더의 부분적 비특이성이 컴퓨터 예측 방법을 통해 허용되고 보상될 수 있다는 것이다.
일부 실시양태에서, 지문을 변화시키기 위해 바인더 서열이 변형될 수 있다. 일부 실시양태에서, 지문을 개선하기 위해 바인더 서열이 변형될 수 있다.
본원에 설명된 바와 같이, 주어진 바코드에 대한 바코드 지문은 하나 이상의 바인더에 대한 주어진 바코드의 친화도 정보를 포함할 수 있다. 일부 실시양태에서, 바코드 지문은 하나의 바인더에 대한 주어진 바코드의 친화도 정보를 포함할 수 있다. 일부 실시양태에서, 바코드 지문은 적어도 하나의 바인더에 대한 주어진 바코드의 친화도 정보를 포함할 수 있다. 일부 실시양태에서, 바코드 지문은 2, 3, 4, 5, 10, 20, 25, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 또는 10,000개 이상의 바인더에 대한 주어진 바코드의 친화도 정보를 포함할 수 있다. 일부 실시양태에서, 바코드 지문은 최대 10,000개의 바인더에 대한 주어진 바코드의 친화도 정보를 포함할 수 있다.
본원에 설명된 바와 같이, 주어진 바인더에 대한 바인더 지문은 하나 이상의 바코드에 대한 주어진 바인더의 친화도 정보를 포함할 수 있다. 일부 실시양태에서, 바인더 지문은 하나의 바코드에 대한 주어진 바인더의 친화도 정보를 포함할 수 있다. 일부 실시양태에서, 바인더 지문은 적어도 하나의 바코드에 대한 주어진 바인더의 친화도 정보를 포함할 수 있다. 일부 실시양태에서, 바인더 지문은 2, 3, 4, 5, 10, 20, 25, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 또는 10,000개 이상의 바코드에 대한 주어진 바인더의 친화도 정보를 포함할 수 있다. 일부 실시양태에서, 바인더 지문은 최대 10,000개의 바코드에 대한 주어진 바인더의 친화도 정보를 포함할 수 있다.
본원에 설명된 바와 같이, 일부 실시양태에서, 바코드 세트에 대한 다수의 바코드 지문은 함께 그룹화될 수 있으며 본원에서는 '지문 행렬'이라고 한다. 일부 실시양태에서, 지문 행렬은 하나의 바코드 지문을 포함할 수 있다. 일부 실시양태에서, 지문 행렬은 적어도 하나의 바코드 지문을 포함할 수 있다. 일부 실시양태에서, 지문 행렬은 2, 3, 4, 5, 10, 20, 25, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000 또는 10,000개 이상의 바코드 지문을 포함할 수 있다. 일부 실시양태에서, 지문 행렬은 최대 10,000개의 바코드 지문을 포함할 수 있다.
본원에 설명된 기술을 통해 각 바코드에 대한 고유 지문의 생성 및 특성화가 가능하다. 이를 통해, 예를 들어, 바코드-바인더 쌍 간의 직교성을 요구하지 않는 페이로드(즉, 표적(예를 들어, 단백질)) 검출 방법을 이용할 수 있다. 일부 실시양태에서, 바코드-바인더 쌍은 직교할 수 있다. 일부 실시양태에서, 바코드-바인더 쌍은 직교하지 않을 수 있다. 당업자에게 명백할 수 있는 바와 같이, 본원에 설명된 바와 같은 바코드-바인더 쌍은 더 강력한 이점을 제공하는데, 이는 고유 지문의 이용 가능성이 비특이적 결합에 대한 우려를 줄이기 때문이며, 이는 복합 환경(예를 들어, 혈청, 혈액 등)에서의 주요 이점이다.
해독:
분석
본 발명의 주요 구성요소는 바인더의 DNA 시퀀싱으로부터 상대적 또는 절대적 단백질 농도를 추론하는 데 사용되는 방법이다. 본 발명에서, DNA 서열은 각 바인더에 상응하는 아미노산 서열로 인실리코 번역되고 바인더 수의 표로 작성된다. 단리된 임의의 주어진 바코드에 대해 측정된 바인더 수의 표는 이후로는 바코드의 "지문"으로 안다. 본 발명을 바코드가 표시된 페이로드의 미지의 혼합물에 적용할 때, 개별 바코드의 상대적 또는 절대적 풍부도는 바인더 수의 표를 개별 바코드의 미리 결정된 지문과 비교하고 아래에 설명된 컴퓨터 예측 방법을 적용함으로써 확인된다. 일부 실시양태에서, 미지의 바코드 혼합물의 바인더 수의 표는 각각의 지문의 선형 조합인 것으로 가정되고; 선형 조합의 계수는 방정식 A x = b의 최소 제곱 피팅을 통해 추론되며, 여기서 A는 지문의 n×m 행렬이고, b는 바인더 개수의 길이 n 벡터이고, x는 각 바코드의 풍부도에 대한 미확인 길이-m 벡터이다. 일부 실시양태에서, 각 바코드의 풍부도는 베이지안(Bayesian) 방법을 사용하여 추론되며, 이로써 바코드 풍부도에 대한 적절한 사전 확률 분포가 가정되고, 바코드 풍부도가 주어진 관찰된 수의 표의 우도비(likelihood ratio)는 실험 시스템에서 불확실성의 모델로부터 계산되며, 사후 확률(posterior probability) 분포는 우도비와 사전 확률의 곱으로 추론된다. 일부 실시양태에서, 사후 분포는 몬테카를로 샘플링(Monte Carlo sampling) 방법을 사용하여 추정된다. 일부 실시양태에서, 사후 분포의 최대값은 컴퓨터 최적화 절차를 통해 확인된다. 일부 실시양태에서, 바인더 수의 표는 특정 바코드-바인더 상호작용의 포화, 또는 개별 바코드 또는 개별 바인더 사이의 경쟁을 설명하기 위해 다양한 바코드 풍부도의 비선형 함수인 것으로 가정된다.
일부 실시양태에서, 바코드의 상대적 비율을 확인하기 위해 바인더 수의 상대적 비율이 직접 비교된다. 일부 실시양태에서, 알려진 풍부도의 서열이 실험에 혼합되고 바코드에 대한 절대적 농도를 추정하는 데 사용되는, 주어진 바인더의 절대적 풍부도를 확인하는 데 활용된다.
Ⅴ. 용도
페이로드 평가:
본원에 설명된 기술은 페이로드(예를 들어, 단백질)를 검출, 평가 및/또는 특성화하는 데 사용될 수 있다. 일부 실시양태에서, 제공된 기술은, 예를 들어, 복합 환경(예를 들어, 혈청, 혈액, 조직 등) 내 페이로드를 검정하는 데 사용될 수 있다. 일부 실시양태에서, 페이로드는 단백질일 수 있다. 일부 실시양태에서, 페이로드는 치료 단백질일 수 있다.
본원에 설명된 바와 같이, 페이로드는 바코드(즉, 바코드가 표시된 페이로드)와 회합될 수 있다. 일부 실시양태에서, 바코드가 표시된 페이로드는 본원에 설명된 바와 같은 방법을 사용하여 결합제(예를 들어, 바인더가 발현되어 있는 파지)를 사용하여 검정될 수 있다. 일부 실시양태에서, 바코드가 표시된 페이로드는 표면(예를 들어, 비드 또는 플레이트)에서 (예를 들어, 친화성 시약을 사용하여) 캡처될 수 있다. 일부 실시양태에서, 바코드 검정을 위해 바코드가 표시된 페이로드가 고정될 수 있다. 일부 실시양태에서, 바코드가 표시된 페이로드는 하나 이상의 바인더와 접촉되고 본원에 설명된 바와 같이 해독된다.
일부 실시양태에서, 페이로드는 시험관 내에서 검출, 평가 및/또는 특성화될 수 있다. 일부 실시양태에서, 페이로드는 생체 내에서 검출, 평가 및/또는 특성화될 수 있다.
일부 실시양태에서, 본원에 설명된 바와 같은 방법은 다수의 조직에서 페이로드 표현형의 생체 내 동시 평가를 확인한다. 일부 실시양태에서, 표현형은 페이로드와 관련된 생체분포 정보를 포함한다. 일부 실시양태에서, 표현형은 페이로드의 약동학(제거) 정보를 포함한다. 일부 실시양태에서, 표현형은 페이로드의 반감기 정보를 포함한다. 일부 실시양태에서, 표현형은 페이로드의 조직 매개 약물 배치(TMDD)를 포함한다. 일부 실시양태에서, 표현형은 페이로드의 생체 내 안정성과 관련된 특성을 포함한다. 일부 실시양태에서, 페이로드의 다수의 표현형이 동시에 확인될 수 있다.
키트:
본원에 설명된 바와 같은 기술은 조성물의 형태로 제공될 수 있다. 예를 들어, 일부 실시양태에서, 조성물은 본원에 설명된 바와 같은 하나 이상의 바코드 및/또는 바인더를 생성하거나 만들기 위한 하나 이상의 요소(예를 들어, 핵산, 아미노산 등)를 포함할 수 있다. 일부 실시양태에서, 조성물은 바코드 세트를 생성하거나 만들기 위한 하나 이상의 요소를 포함할 수 있다. 일부 실시양태에서, 조성물은 바인더 세트를 생성하거나 만들기 위한 하나 이상의 요소를 포함할 수 있다. 일부 실시양태에서, 조성물은 바코드-바인더 쌍의 풀을 생성하거나 만들기 위한 하나 이상의 요소를 포함할 수 있다. 일부 실시양태에서, 조성물은 결합제(예를 들어, 바인더 발현 파지)를 생성하거나 만들기 위한 하나 이상의 요소를 포함할 수 있다. 일부 실시양태에서, 조성물은 바코드 조성물일 수 있다. 일부 실시양태에서, 조성물은 바인더 조성물일 수 있다. 일부 실시양태에서, 조성물은 바코드-바인더 조성물일 수 있다. 일부 실시양태에서, 조성물은 결합제 조성물일 수 있다. 일부 실시양태에서, 조성물은 바코드, 바인더, 결합제 및/또는 이들의 성분 중 하나 이상을 포함할 수 있다. 일부 실시양태에서, 조성물은 바코드, 바인더, 결합제 및/또는 이들의 성분의 하나 이상의 세트/풀을 포함할 수 있다.
바코드, 바인더, 결합제 또는 이들의 성분을 포함하는 조성물이 본원에서 제공된다. 일부 실시양태에서, 조성물은 본원에 설명된 바와 같은 방법을 사용하여 평가, 식별, 특성화 또는 검정된 바코드, 바인더, 결합제 또는 이들의 성분 및/또는 이들의 조합을 포함한다. 일부 실시양태에서, 본원에 제공된 조성물은 본원에 설명된 바와 같은 방법을 사용하여 평가, 식별, 특성화 또는 검정된 바코드, 바인더, 결합제, 이들의 성분 및/또는 이들의 조합을 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상 또는 10개 이상 포함한다.
일부 실시양태에서, 본원에 제공된 조성물은 표 1 또는 표 2에 나열된 핵산 서열 또는 아미노산 서열을 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상 또는 10개 이상 포함한다.
본원에 설명된 바와 같은 조성물은 다양한 형태로 제형화될 수 있다. 예를 들어, 일부 실시양태에서, 본원에 설명된 바와 같은 조성물은 분말 형태로 제형화될 수 있다(예를 들어, 동결건조됨). 일부 실시양태에서, 본원에 설명된 바와 같은 조성물은 액체 형태로 제형화될 수 있다.
일부 실시양태에서, 본 개시내용에 따라 사용하기 위한 조성물은, 예를 들어, 대상체(예를 들어, 포유동물(예를 들어, 인간))에게 투여(예를 들어, 국소, 경구, 피하, 정맥 내, 근육 내, 뇌 내, 척수강 내, 직장(예를 들어, 직장 삽관), 안과용, 유리체강 내 또는 맥락막위 투여)하기 위한 약제학적 조성물이다. 일부 실시양태에서, 이러한 조성물은 대상체에게 투여된 또는 투여될 하나 이상의 페이로드의 하나 이상의 속성을 검출, 특성화 및/또는 평가하기 위해 대상체에게 투여된다. 약제학적 조성물은 전형적으로 투여될 작용제(예를 들어, 바코드, 바인더, 결합제 및/또는 이들의 성분) 및 약제학적으로 허용되는 담체를 포함한다. 소정의 예시적인 약제학적으로 허용되는 담체에는, 예를 들어, 약제학적 투여에 상용성인 식염수, 용매, 분산 매질, 코팅, 항균제 및 항진균제, 등장성제 및 흡수 지연제 등이 포함된다. 약제학적 조성물은 전형적으로 의도된 투여 경로에 적합하도록 제형화된다. 투여 경로의 예에는 국소, 경구, 피하, 정맥 내, 근육 내, 뇌 내, 척추강 내, 직장(예를 들어, 직장 삽관), 안구, 유리체 내 또는 맥락막상 투여가 포함된다.
일부 실시양태에서, 약제학적으로 상용성인 결합제 및/또는 보조 물질이 약제학적 조성물의 일부로 포함될 수 있다. 일부 특정 실시양태에서, 약제학적 조성물은, 예를 들어, 다음 불활성 성분 중 임의의 하나 이상, 또는 유사한 성질의 화합물을 함유할 수 있다: 바인더, 부형제, 윤활제, 활택제 또는 일부 유사한 이러한 화합물.
조성물은 (예를 들어, 대상체로의) 투여 또는 본원에 설명된 방법에서의 사용을 위한 지침과 함께 키트, 용기, 팩 또는 디스펜서에 포함될 수 있다. 일부 실시양태에서, 지침에는 추가 사용을 위해 분말 형태 조성물을 액체 형태 조성물로 재구성하는 방법이 포함될 수 있다. 일부 실시양태에서, 키트는 사용자가 새로운 바코드 세트에 대한 새로운 바인더 세트를 생성하도록 허용하는 지침을 포함할 수 있다. 일부 실시양태에서, 키트는 하나 이상의 바코드에 결합된 하나 이상의 파지 입자의 시퀀싱을 수행하기 위한 지침 세트를 포함한다.
일부 실시양태에서, 키트는 각 바인더에 대한 펩티드 바코드를 지정하는 정보를 포함한다. 일부 실시양태에서, 키트는 시퀀싱 데이터를 해독하기 위한 컴퓨터 판독 가능 프로그램을 포함한다.
일부 실시양태에서, 키트는 파지 입자에서 바인더를 발현시키기 위한 시약을 포함한다. 일부 실시양태에서, 키트는 하나 이상의 바코드를 암호화하는 핵산을 포함한다. 일부 실시양태에서, 키트는 하나 이상의 바인더를 암호화하는 핵산을 포함한다.
본 개시내용을 읽는 당업자는 일부 실시양태에서, 본원에 설명된 바와 같은 조성물(예를 들어, 바인더 조성물, 바코드 조성물, 결합제 조성물 등)이 본원에 설명된 바와 같은 관련 바인더, 바코드 및/또는 결합제를 생성하는(예를 들어, 생성했거나 생성하고 있는) 하나 이상의 세포, 조직 또는 유기체(예를 들어, 식물 또는 미생물 세포, 조직, 바이러스 또는 유기체)일 수 있거나 이를 포함할 수 있음을 이해할 것이다.
당업자는 일부 실시양태에서 조성물 및/또는 제제를 제조하는 기술 및/또는 제조하는 기술(특히 약제학적 조성물을 제조하는 기술)이, 예를 들어, 품질 관리의 일부로서 화합물, 제제 또는 조성물을 평가하거나 특성화하는 하나 이상의 단계를 포함할 수 있음을 이해할 것이다. 일부 실시양태에서, 검정된 물질이 관련 평가에 대해 미리 결정된 사양을 충족하지 않는 경우 해당 물질은 폐기된다. 일부 실시양태에서, 이러한 검정된 물질이 미리 결정된 사양을 충족하는 경우, 본원에 설명된 바와 같이 계속 프로세싱된다.
일부 실시양태에서, 조성물은 특이적 대상체(예를 들어, 특정 포유동물, 예를 들어, 환자)에 맞춰 조정된다. 일부 실시양태에서, 조성물은 개체 대상체(예를 들어, 포유동물(예를 들어, 인간, 마우스 등))에 대해 평가될 페이로드에 특이적이다. 일부 실시양태에서, 조성물은 개체 대상체(예를 들어, 포유동물(예를 들어, 인간, 마우스))에 대해 평가될 페이로드에 특이적이다. 일부 실시양태에서, 조성물은 대상체(예를 들어, 포유동물(예를 들어, 인간, 마우스 등)) 집단의 페이로드에 특이적이다. 대상체 집단에는 가족, 동일한 지역 위치(예를 들어, 이웃, 도시, 주(state) 또는 국가)에 있는 대상체, 동일한 질병 또는 병태를 가진 대상체, 특정 연령 또는 연령 범위의 대상체, 특정 식단(예를 들어, 음식, 음식 공급원 또는 칼로리 섭취량)을 섭취하는 대상체가 포함되지만 이에 제한되지 않는다.
예시
실시예 1: 바코드, 상응하는 결합제 식별 및 지문 확인
본 실시예는 바코드, 상응하는 결합제(예를 들어, 결합제에서 발현된 바인더)를 식별하고 지문(예를 들어, 바코드 지문)을 확인하고 정보를 사용하여 주어진 혼합물에서 바코드의 비율을 확인하는 방법을 보여준다. 이어서 생성된 물질을 사용하여 각각 다른 페이로드를 측정하고 정량화할 수 있다.
바코드 라이브러리의 설계 및 합성:
주어진 나선 또는 루프 구조로 접히는 것으로 생각되는 소정의 서열 모티프를 함유하는 바코드 서열을 설계하였다. 단백질 정보 은행(Protein Data Bank, PDB)의 모든 서열과 이의 상응하는 2차 구조 예측을 다운로드하였다. 서열이 8-25개 아미노산 길이에 대한 연속 나선 또는 루프 서열이라는 기준을 충족하면 서열을 선택하고 전체 서열로부터 하위세트화하였다. 이어서 이 기준과 일치하는 100,000개의 펩티드 서열의 무작위 하위세트를 벡터로의 클로닝을 위한 일정한 오버행 및 유형 ⅡS 부위를 함유하는 올리고 풀로서 정돈하였다(도 1b 참조).
발현 플라스미드로의 바코드 라이브러리 클로닝:
설계된 바코드 풀을 pET 발현 벡터에 클로닝하여 페이로드 단백질에 부착된 바코드를 생성하였다. 6xHIS-HALO-TEV-LN-IIS-LC를 함유하는 플라스미드를 작제하여 골든 게이트 어셈블리(golden gate assembly)를 통해 올리고 풀을 직접 클로닝할 수 있었다. LN 및 LC는 결찰에 사용된 올리고 풀의 일정한 오버행을 나타낸다(도 1b). 1μg의 벡터를 37℃에서 BsaI로 사전분해하고 정제하였다. 올리고 풀을 중합효소 연쇄 반응(PCR)을 통해 증폭시켰다. NEB 골든 게이트 어셈블리 믹스(Cat: E1601S)를 사용하여 1:10 몰 비의 정제된 벡터와 삽입물을 골든 게이트 어셈블리 반응에 첨가하고, 37℃에서 1시간 동안 인큐베이션한 다음 70℃에서 5분 동안 열 사멸시켰다. 이어서 이 물질을 정제하고, 순수한 H2O에 60분 동안 투석한 다음 전기감응성(electrocompetent) BL21 박테리아(lucigen) 내로 전기천공하였다. 개별 콜로니를 회수하기 위해 연속 희석액으로 플레이팅하였다. 이어서 콜로니를 선택하고, 1% 글리세롤과 100μg/ml 카르베니실린(carbenicillin)을 함유한 배지에서 성장시켰고 -80℃에서 20% 글리세롤에 글리세롤 저장하였다. 클로닝 후, 링커를 사용하여 단백질에 부착된 바코드를 함유하는 작제물을 생성한다(도 1a).
개별 바코드의 발현:
시험관 내 전사 번역(in vitro transcription translation, IVTT) 또는 BL21 유도를 사용하여 발현을 수행하였다. IVTT의 경우, BL21의 T7 및 T7 종결자(terminator) 서열에 특이적인 프라이머를 추가하여 글리세롤 스톡에서 직접 PCR을 수행하였다. 생성된 앰플리콘은 발현을 위한 T7 및 T7 종결자를 함유하며 단백질 8xHIS-HALO-TEV-LN-바코드-LC를 만든다. 제조업체의 지침에 따라 조립된 NEBPure(카탈로그 번호: E6800S)를 사용하여 약 50ng의 DNA를 함유하는 1μL의 PCR 산물을 10μL의 IVTT 반응에 첨가하였다. 이어서 반응물을 37℃에서 4시간 동안 인큐베이션하였다. 대장균 발현을 위해 배양물을 37℃에서 OD 0.5로 성장시킨 다음, 이소프로필 β-d-1-티오갈락토피라노사이드(IPTG)를 사용하여 유도하고 25℃에서 밤새 성장시켰다. 다음날 세포를 용해 버퍼에서 초음파처리로 용해시키고, 용해된 물질을 원심분리를 통해 봉입체(inclusion body)로부터 분리하여 단백질이 함유된 상청액을 채취하였다. 상청액은 친화성 크로마토그래피 Ni-NTA 수지를 사용하여 정제하고 향후 사용을 위해 보관하였다.
HALO 자기 비드에서의 개별 바코드의 캡처:
10μL의 IVTT를 1mg/ml의 BSA가 보충된 PBS에 50μL로 희석하였다. 이 혼합물에 Halo 태그 자기 비드(카탈로그: G7281) 30μL를 첨가하고, 400rpm에서 2시간 동안 진탕하면서 인큐베이션한 다음 4℃에서 밤새 진탕하면서 인큐베이션하였다. 비드를 자기 스탠드에 캡처하고 상청액을 제거하였다. 이어서 비드를 0.1% Tween 20을 함유한 PBS-T(PBS-T)로 2회 세척하였다. 캡처된 바코드의 개략도가 도 3b에 나와 있다.
바코드에 대한 친화도가 다양한 바인더를 함유하는 파지 디스플레이 라이브러리의 작제:
적어도 하나의 바코드에 대한 친화성이 강한 바인더는 당업자에게 알려진 방법(예를 들어, 파지 디스플레이, 하이브리도마 등)을 통해 생성하였다. 이어서 이러한 바인더를 m13 유전자 3 단백질(g3)에 융합된 scFv 단편으로 파지에 표시하였다. 간단히 말하면, scFv 결합 서열을 함유하는 올리고를 DNA 합성을 통해 생성하였다. 올리고를 G4S 링커(서열번호 8399) 및 myc 태그를 통해 G3에 연결된 scFv의 불변 영역을 함유하는 플라스미드에 클로닝하였다. 30μg의 라이브러리를 TG1(lucigen)에 전기천공하고 100μg/ml의 카르베네클린과 1% 글루코스를 함유하는 여러 25mm 플레이트에 플레이팅하였다. 다양성 분석을 위해 전기천공의 희석액을 플레이팅하였다. Q 트레이를 스크래핑하고 글리세롤 저장하였다. 파지를 생성하기 위해 2L 배양물을 OD ~0.05에서 접종하고 100μg/ml의 카르베니실린 및 1% 글리세롤을 사용하여 37℃에서 OD 0.5까지 성장시켰다. OD 0.5에서 헬퍼 파지를 10:1의 파지:세포 비율로 첨가하고 250rpm에서 진탕하면서 인큐베이션하였다. 1시간 후, 진탕 속도를 150rpm으로 낮추고 온도를 30℃로 낮추고 밤새 인큐베이션하였다. 다음날 파지를 PEG 침전(Barbas 등 2001)을 통해 제조하고 10mL에 재현탁시킨 후 적정하였다. 파지는 사용 전까지 4℃에 보관하였다.
파지-바인더-바코드 상호작용의 평가:
상술한 방법을 사용하여 제조된 파지 라이브러리 10μL를 캡처된 바코드에 첨가하고 실온에서 2시간 동안 인큐베이션하여 파지가 바코드에 결합되도록 하였다(도 3c). 인큐베이션 후, 자기 비드를 새로운 PBS-T에 3회 연속으로 옮겨 혼합물을 세척하였다. 파지는 TEV 프로테아제 + 0.1% DTT를 함유하는 PBS에 재현탁시키고 37℃에서 30분 동안 인큐베이션하여 비드로부터 용출시켰다. 비드를 자기 스탠드에 수집하고, 상청액을 수집하였다. 상청액에 트립신을 첨가하고 30분 동안 추가로 인큐베이션하였다. 파지를 증식시키기 위해 상청액을 2xYT에서 OD 0.5까지 37℃에서 성장된 TG1 대장균 50mL에 첨가하고 37℃에서 1시간 동안 진탕하면서 인큐베이션하였다. 이어서 100μg/ml의 카르베니실린과 1% 글루코스를 첨가하고 동일한 조건에서 1시간 동안 인큐베이션하였다. 헬퍼 파지(카탈로그: PH050L)를 첨가하고 37℃에서 1시간 동안 추가로 인큐베이션하였다. 배양물을 원심분리하고, 100μg/ml의 카르베니실린과 50μg/ml의 카나마이신(kanamycin)을 함유하는 새로운 배지에 넣은 다음, 30℃에서 밤새 배양하였다. 이후 4000g에서 20분 동안 원심분리하고 파지를 함유하는 상청액을 채취하였다.
주어진 바코드에 대한 지문의 분석 및 확립:
각 바코드에 대해 개별적으로 원래 파지 풀에서 선택을 수행한 후, NGS를 통해 파지-scfv(즉, 파지-바인더) 선택도를 분석하였다. 파지는 98℃에서 10분 동안 가열하여 용해시켰으며, 생성된 게놈은 중쇄 CDR3(5 프라임) 및 경쇄 CDR3(3 프라임)의 CDR 영역 측면에 있는 프라이머를 사용하여 PCR을 수행하였다. NGS에 필요한 illumina 서열(i5/i7, 시퀀싱 프라이머 결합 부위)을 추가하기 위해 두 번째 PCR을 수행하였다. 생성된 DNA를 모아서 정량화하고 Illumina 기기를 사용하여 NGS를 실시하였다. 이 프로세스는 도 2 및 도 3a-3c에 나와 있다.
illumina 소프트웨어 bcl-convert를 사용하여 NGS 판독값을 역다중화(demultiplex)하여 각각의 최종 .fastq는 주어진 바코드 웰로부터의 출력에 상응하는 주어진 파지 CDR3 쌍의 DNA 서열을 함유하게 된다. 이어서 컴퓨터 프로그램을 사용하여 상응하는 CDR3 서열을 세었고, 이는 주어진 바코드에 대해 존재하는 바인더의 분포를 드러낸다. 바코드의 지문은 주어진 풀 내의 각 scFv 바인더에 대한 수의 벡터에 해당한다. 각 지문은 n=3 개별 바코드 반복 중앙값이다. 파지 바인더 풀을 사용한 단일 바코드에 대한 프로세스 및 생성된 지문이 도 4에 나와 있다.
지문 행렬을 사용한 주어진 혼합물 내 바코드 비율의 확인:
바코드 세트의 각 바코드의 지문이 확인되면, 미지의 샘플에서 바코드의 비율을 다음 방식으로 측정하였다. 바인더-바코드 상호작용은 상술된 바와 같이 평가하였고 생성된 NGS 판독값을 최소 제곱(least square)을 통해 알려진 지문의 선형 조합에 맞췄다. 즉, 선형 조합의 계수는 실시예 8에 설명된 바와 같이 모든 결합 종에 대해 측정된 NGS 수와 예상 NGS 수 사이의 차이의 제곱의 합을 최소화하여 선택한다. 예상 NGS 수는 일련의 바코드 풍부도 계수와 지문 행렬의 곱으로 제공된다. 계수를 얻으면 합계가 1이 되도록 정규화하여 비율을 얻는다.
지문 스케일링을 평가하기 위한 동일한 비율의 바코드 혼합물의 해독:
바인더와 바코드 사이의 다양한 친화도로 인해 발생할 수 있는 임의의 스케일링 문제를 확인하기 위해, 동일한 비율로 혼합된 바코드의 측정을 통해 스케일링 계수(scaling factor)를 생성한다. 간단히 말하면, 검증된 모든 바코드는 생성 후 균일한 농도로 혼합한다. 파지 바인더 상호작용을 상술된 바와 같이 평가하였으며, 생성된 파지를 NGS에 적용하였다. 위의 개별 바코드에 대해 확인된 지문을 사용하여 혼합물 내 바코드 비율을 실시예 8에 설명된 바와 같이 최소 제곱 회귀를 통해 추정하였다. 최소 제곱을 사용하여 예측된 비율은 스케일링 계수(sf)의 기초를 형성하며, 여기서 sf = 1/p이고, p는 예측 비율이다. 이 프로세스는 도 5에 설명되어 있다.
알려진 비율의 바코드 혼합물의 평가:
위에서 생성된 바코드를 알려진 비율로 혼합하고 평가하여 정확도를 확인하였다. 각각 다른 비율로 혼합된 바코드(도 6a), 이어서 파지 바인더(즉, 결합제) 상호작용의 분석을 상술된 바와 같이 수행하였다. 풀 내의 각 바인더에 대한 NGS 수를 세었다. 단일 바코드를 사용하여 위에서 작제한 지문을 고려하여 바코드의 비율을 확인하기 위해 최소 제곱을 사용하였다. 이어서 최소 제곱 분석의 예측은 설정된 스케일링 계수를 사용하여 p' = p*sf로 재조정하였으며, 여기서 p'는 새로운 예측이고, p는 원래 예측이며, sf는 설정된 스케일링 계수이다. 이어서 새로운 예측을 합계 1로 다시 정규화한다.
도 6b는 이 방법에 대한 비율 측정의 정확도를 보여준다. 6개의 각각 다른 바코드를 측정하고 스케일링 계수를 통해 정규화하였으며, 모든 측정에서 .95의 글로벌 피어슨 상관계수를 사용하여 상대적 바코드 비율을 추정하였다. 측정은 바코드의 100배 구배에 걸쳐 수행하였다. 도 6c는 혼합물 내의 각 바코드의 상대적 풍부도를 예측하는 데 사용된 혼합물뿐만 아니라 각각의 단일 바코드 측정에 대해 백만회당 개수로 정규화된 NGS 개수 값의 플롯을 보여준다. 행은 실험이며, 따라서 행의 모든 값은 단일 .fastq 파일에서 생성되고 열은 결합제이다.
실시예 2: 바인더-바코드 플랫폼을 사용한 혼합물 내 페이로드의 시험관 내 검출
본 실시예는 본원에 설명된 바와 같은 바인더-바코드 플랫폼을 사용하여 혼합물에서 주어진 페이로드의 존재 또는 부재를 측정하는 방법을 보여준다.
실시예 1에서 생성된 바코드는 DNA 클로닝을 사용하여 새로운 페이로드로 전달하였다. 간단히 말하면, LN-바코드-LC 부분이 증폭되도록 pET 6xHIS-HALO-TEV-LN-바코드-LC에서 바코드가 증폭되었다. 바코드 삽입물은 gibson을 사용하여 6xHIS-페이로드-LN-바코드-LC를 함유하는 새로운 pET 벡터에 클로닝되었으며, 여기서 페이로드는 관심 있는 새로운 단백질이었다. 페이로드-바코드는 상술된 바와 같이 대장균에서 생성되었다. 이어서 바코드가 표시된 페이로드 단백질을 Ni NTA를 사용하는 친화성 크로마토그래피를 통해 정제하고, 500mM NaCl, 50mM Tris-HCl, 50mM 이미다졸로 세척하고, 500mM 이미다졸을 사용하여 용출하였다. 이어서 바코드가 표시된 페이로드 단백질을 실시예 1에 설명된 파지 바인더 라이브러리를 사용하여 해독하였다. 도 6, 9 및 12는 이전에 상이한 상황에서 생성된 바코드를 사용하여 페이로드를 검출하기 위한 실험 설정과 이러한 실험의 결과를 보여주며, 따라서 이러한 바코드에는 풀 내의 다양한 수의 바코드에 걸쳐 일반화된 검출 특성이 포함되어 있음을 보여준다.
도 9에 설명된 실험에서, 6개의 고유 바코드(BC1, BC2, BC3, BC4, BC5 및 BC6)를 알려진 비율로 혼합하고, 결합제와 접촉시키고, 본원에 설명된 바와 같이 해독하였다(도 9a). 2개의 바코드가 실험적으로 음성 대조군으로 제외되었지만 이러한 바코드에 대한 예측이 허용되어 배경 예측을 확인할 수 있었다. 도 9b 및 9c는 6개의 고유 바코드에 대한 10배 범위 농도에 걸친 해독 절차의 정확성에 대한 데이터를 보여준다. 도 9b는 알려진 바코드 농도의 한 혼합물에 대해 해독 후 얻은 측정 데이터와 실제 데이터(입력)의 플롯을 보여준다. 알려진 입력 농도(왼쪽 막대)는 3회 반복에 걸친 각 바코드에 대한 예측/측정 데이터(오른쪽 막대) 옆에 표시된다. 도 9c는 알려진 바코드 농도의 5가지 서로 다른 혼합물(즉, 풀 1-5)에 대해 해독한 후 얻은 측정 데이터와 실제 데이터(입력)의 플롯을 보여준다. 알려진 입력 농도(왼쪽 막대)는 3회 반복에 걸친 각 바코드에 대한 예측/측정 데이터(오른쪽 막대) 옆에 표시된다.
도 12에 설명된 실험에서, 단일 혼합물 내에 함유된 24개 바코드의 정량화가 확인되었다. 도 12a는 실험의 그래픽 묘사를 보여준다. 알고리즘이 예측할 수 있는 총 24개의 바코드 중 10개가 동일한 농도로 혼합물 내에 존재하였다. 나머지는 풀에서 제외되었지만 예측은 계산적으로 허용되었다. 가능한 모든 바코드를 포괄하는 3개의 개별 풀을 반복해서 측정하였다. 이러한 풀을 혼합한 다음, 실시예 1에 설명된 HALO 비드에 캡처하였다. 이어서 고정된 바코드가 표시된 페이로드를 결합제 풀(즉, 바인더가 발현되어 있는 결합제)과 접촉시키고 실시예 1에 설명된 바와 같이 CDR3 서열 수로 해독하였다. 이어서 NGS를 통해 확인된 CDR3 서열 수를 사용하여 해독을 통해 샘플 내 각 바코드가 표시된 페이로드의 존재 및 총 농도를 확인하였다(실시예 8 참고). 도 12b는 첫 번째 풀에 대한 예측을 보여주며; 풀 내 각 바코드에 대해 입력 농도(왼쪽 막대)와 측정 농도(오른쪽 막대)가 표시되어 있다. 도 12c는 3개의 풀 각각에 대한 예측을 플롯한다. 도 12b에서와 같이, 막대 그래프로 왼쪽에 입력 농도를 표시하고 오른쪽에 측정된 농도를 표시한다. 도 12d는 3개 풀 각각 내의 바코드의 상대적 풍부도를 계산적으로 확인하는 데 사용된 24개 바코드 각각에 대한 바코드 지문을 보여준다. 열은 바코드 지문을 나타내고 행은 결합제 지문을 나타낸다. 도 12e는 풀의 비율을 계산적으로 확인하는 데 사용된 3개의 풀로부터의 결합제 수를 보여준다. 행은 결합제 수이고, 열은 풀이며, 각 셀은 특이적 풀 내의 결합제 수이다.
실시예 3: 바인더-바코드 플랫폼을 사용한 페이로드 풀 내의 페이로드 안정성에 대한 시험관 내 평가
본 실시예는 바코드 해독을 사용하여 풀 내 여러 페이로드의 일반적인 응집 경향을 확인하는 방법을 보여준다.
실시예 2에 설명된 방법을 사용하여 바코드가 표시된 페이로드의 정제된 풀을 생성하였다. 이어서 정제된 풀을 표준 방법을 사용하여 크기 배제 크로마토그래피에 적용하였다. 단량체 페이로드 대 응집된 페이로드에 상응하는 각각 다른 분획이 수집된다. 정제된 풀 내의 주어진 바코드가 표시된 페이로드의 일반적인 존재 또는 부재는 미지이다. 미지의 풍부도의 각 바코드가 표시된 페이로드를 함유하는 분리된 분획을 비드 또는 면역흡착 검정 플레이트에 고정하고, 바인더 풀(즉, 바인더가 발현되어 있는 결합제)과 접촉시키고, 실시예 1에 설명된 바와 같이 CDR3 서열 수로 해독하였다. 이어서 NGS를 통해 확인된 CDR3 서열 수를 각 분획에서 바코드가 표시된 페이로드의 존재 및 총 농도를 확인하는 데 활용한다. 이어서 각각 다른 분획 내 바코드가 표시된 페이로드 농도를 비교하여 정제된 풀 내의 단량체 대 응집체인 각 바코드가 표시된 페이로드 %를 확인한다.
실시예 4: 바인더-바코드 플랫폼을 사용한 페이로드 풀 내의 페이로드 약동학의 생체 내 평가
본 실시예는 도 11에 나와 있는 바와 같이 마우스 모델을 사용하여 페이로드 풀 내에 함유된 주어진 페이로드의 전체 체류 시간 및 제거 시간을 확인하는 방법을 보여준다.
바코드가 표시된 페이로드의 3개의 풀을 마우스(n=3)의 3개의 각각 다른 그룹에 주입하였다(그룹 1에 풀 1, 그룹 2에 풀 2 및 그룹 3에 풀 3). 풀 1은 10mg/kg의 단일 바코드가 표시된 항체를 함유하였다. 풀 2는 동일한 농도로 모아지고 20mg/kg으로 주입된 2개의 바코드가 표시된 항체를 함유하였다. 풀 3은 PBS만 함유하였다. 주입 용적은 풀당 100μL로 일정하게 유지하였다. 주입 후 24시간째에 각 마우스로부터 혈액을 채취하여 혈청을 분리하였다. 10μL의 혈청을 PBS에 1:10으로 희석하고 항-인간 IgG 자기 비드(Ray biotech 카탈로그 번호 801-101-1)를 사용하여 700rpm으로 혼합하면서 4℃에서 밤새 인큐베이션하여 캡처하였다. 고정된 바코드가 표시된 페이로드를 PBS-T를 사용하여 3회 세척하여 친화성 시약과 회합되지 않은 모든 혈청 단백질을 제거하였다. 이어서 고정된 바코드가 표시된 페이로드를 결합제 풀(즉, 바인더가 발현되어 있는 결합제)과 접촉시키고, 실시예 1에 설명된 바와 같이 CDR3 서열 수로 해독하였다. 이어서 NGS를 통해 확인된 CDR3 서열 수를 활용하여 해독을 통해 샘플 내 각 바코드가 표시된 페이로드의 존재 및 총 농도를 확인하였다(실시예 8 참고). 24시간째에 측정된 바코드가 표시된 페이로드의 비율을 주입된 농도와 비교하여 유기체로부터 각 바코드가 표시된 페이로드에 대한 상대적 제거율을 확인하였다. 각 그룹에서는 주입된 바코드가 표시된 항체만이 해독에 의해 높은 정확도로 검출되었으며, 이는 도 11에 표시된 그래프에 의해 입증된다. 동일한 농도의 두 항체를 모두 함유하는 풀 2를 주입한 그룹 2 마우스에서는 24시간째에 혈청에서 해독을 통해 약간 상이한 양이 측정된다. 이러한 차이는 두 바코드가 표시된 항체 간의 제거율 차이로 인한 것으로 가정된다. 예상대로 대조군에서는 항체가 거의 나타나지 않았다.
실시예 5: 바인더-바코드 플랫폼을 사용한 페이로드 생체분포의 생체 내 평가
본 실시예는 마우스 모델을 사용하여 다양한 조직 세트에 걸쳐 바코드가 표시된 페이로드의 전체 분포를 확인하는 방법을 보여준다.
정제된 페이로드 풀을 BALB-6 마우스에 정맥 내 주입하였다. 최소 24시간 후에 간, 폐 및 뇌와 같은 각각 다른 조직 샘플을 유기체에서 채취한다. 이어서 조직을 비드와 함께 격렬하게 진탕하여 단일 세포 현탁액으로 프로세싱한다. 이어서 현탁액을 용해 버퍼를 사용하여 용해시켜 조직 내에 함유된 바코드가 표시된 페이로드(예를 들어, 바코드가 표시된 단백질)를 유리시킨다. 이어서 용해된 현탁액을 페이로드 내에 함유된 범용 태그 친화성 시약을 사용하여 정제하여 바코드가 표시된 페이로드를 분리한다. 이어서 정제된 바코드가 표시된 페이로드를 고정시키고, 실시예 1에 설명된 방법에 따라 바코드 해독을 수행한다. 이어서 NGS를 통해 확인된 CDR3 서열 수를 활용하여 각 샘플 내 각각의 바코드가 표시된 페이로드의 존재 및 총 농도를 확인한다. 이어서 각각 다른 조직 샘플에 걸쳐 페이로드 풍부도를 비교하여 각 조직 내에 함유된 각 페이로드의 비율을 확인한다. 이어서 이 데이터를 사용하여 특이적 생체분포 특성이 있는 최상의 페이로드를 선택할 수 있다.
실시예 6: 비변형 항체의 알려진 혼합물을 회수하는 시험관 내 입증
본 실시예는 바코드가 부착되지 않은 항체 단백질의 알려진 혼합물이 본원에 설명된 단백질 정량화 발명을 사용하여 어떻게 정량화되었는지를 입증한다.
간단히 말하면, 항체에 대한 scFv 바인더를 당업자에게 알려진 방법을 사용하여 생성하였다. 이어서 바인더를 클로닝하고 실시예 1에 설명된 바와 같이 파지에 표시하였다. 관심 있는 2개의 항체를 CHO 세포에서 발현시키고 단백질 A 친화성 크로마토그래피를 사용하여 배지로부터 정제하였다. 항체를 알려진 비율로 함께 혼합하였다(도 7a). 이어서 50μL의 항-인간 Fc 자기 비드를 사용하여 항체를 캡처하고 PBS에서 인큐베이션하였다. 이어서 항체를 실시예 1에 설명된 바와 같은 파지 평가에 적용하고, 실시예 8에 설명된 알고리즘을 사용하여 각 항체의 상대적 풍부도를 추정하였다. 다양한 비율의 혼합물에서 이들 두 항체의 상대적 농도를 확인할 때 피어슨 .96의 정확도로 계산하였다(도 7b).
실시예 7: 혈청 존재 하에 알려진 항체 혼합물을 회수하는 시험관 내 입증
본 실시예는 단백질 서열의 내부 영역 내에 함유된 바코드와 항체 단백질의 알려진 혼합물이 본원에 설명된 단백질 정량화 기술을 사용하여 마우스 혈청에서 어떻게 정량화되었는지를 입증한다.
간단히 말하면, 실시예 6에 설명된 바와 같이 항체를 생성하고 유사한 실험을 수행하였지만, 생성 후 항체를 마우스 혈청과 혼합하고 37℃에서 30분 동안 인큐베이션한 후 항-Fc 자기 비드를 사용하여 캡처하는 것은 제외하였다(도 8a). 이어서 고정된 바코드가 표시된 항체를 결합제 풀(즉, 바인더가 발현되어 있는 결합제)과 접촉시키고, 실시예 1에 설명된 바와 같이 CDR3 서열 수로 해독하였다. 이어서 NGS를 통해 확인된 CDR3 서열 수를 활용하여 해독을 통해 샘플 내 각각의 바코드가 표시된 항체의 존재 및 총 농도를 확인하였다(실시예 8). 3개 항체의 상대적 농도는 도 8b 및 8c에 나와 있는 바와 같이 항체 농도의 3개 혼합물에 걸쳐 .926의 스피어만으로 추정하였다. 이러한 결과는 혈청과 함께 인큐베이션한 후, 즉 복합 환경에서 높은 정확도로 샘플에 존재하는 항체의 순위를 매기기 위해 본원에 설명된 기술을 사용하는 능력을 보여준다.
실시예 8: 바코드 풍부도를 추론하는 데 사용되는 해독 알고리즘에 대한 자세한 설명
바코드 양의 추론 방법:
미지의 샘플을 해독하기 전에, 바코드 세트 및 바인더 풀(즉, 파지 바인더 풀)과의 상호작용을 먼저 특성화해야 한다. 이는 알려진 조건 하에 알려진 샘플 세트를 해독하여 수행한다. 바인더 풀과 실험 조건은 모든 샘플 사이에 고정되어 있다.
바코드 세트를 특성화하기 위해 각 바코드에 대해 하나씩 지문 세트를 측정한다. 지문은 개별 바코드의 이상적인 판독값을 나타낸다. 대략적으로 말하면, 이는 주어진 바코드와 풀 내 모든 바인더 종 사이의 친화도 스펙트럼이다. 하나의 바코드만 함유하는 다수의 동일한 샘플을 해독하고 반복 판독값의 평균을 낸 다음 그에 따라 리스케일링(rescaling)하여 지문을 평가할 수 있다. 그렇지 않으면 알려진 바코드 혼합물을 함유하는 샘플을 해독하고 적절하게 디콘볼루션하여 개별 지문을 단리함으로써 지문을 학습할 수 있다. 바코드 세트의 지문을 함께 "지문 행렬"이라고 한다.
바코드 세트의 지문 행렬이 확인되면 이를 사용하여 미지의 샘플의 바코드 구성을 추론할 수 있다. 해독 알고리즘은 미지의 샘플의 판독값을 지문의 선형 조합에 피팅하여 이를 수행한다. 이는 본원에 설명된 알고리즘 섹션에서 더 자세히 설명된다. 알고리즘의 주요 가정은 해독 프로세스가 선형이라는 것이다: 샘플에 동일한 비율로 혼합된 2개의 바코드가 포함되어 있는 경우, 해당 판독값은 상기 2개의 바코드의 지문 합계(노이즈 포함)와 동일하다고 가정된다. 더 일반적으로, 바코드 혼합물의 판독은 각 바코드 지문의 합으로 가정되며, 혼합물에서의 해당 바코드의 출현율에 따라 적절하게 가중치가 적용된다. 이 가정은 경험적으로 사실임이 밝혀졌다.
바코드 정량화 작업은 다양한 수준의 난이도를 가지고 있다. 가장 쉬운 것부터 가장 어려운 것까지 다음이 포함된다:
● 이항 분류(binary classification): 샘플 내 바코드의 존재 또는 부재를 검출함.
● 순위 정량화(rank-order quantification): 샘플 내 최다 출현하는 바코드부터 최소 출현하는 바코드까지 순위를 매김.
● 상대 정량화(relative quantification): 샘플 내 바코드 간 비율을 확인함.
● 절대 정량화(absolute quantification): 샘플 내 각 바코드의 절대량을 확인함.
본 실시예에서는 절대 정량화가 더 자세히 논의된다.
해독의 수학적 모델:
해독 프로세스는 다음과 같은 수학적 모델로 표현될 수 있다:
x는 입력 샘플을 나타내는 길이-n 벡터이고 각 항목은 ng 단위의 바코드 종의 양이며; y는 결합된 바인더 분획을 나타내는 길이-m 벡터이고 각 항목은 pfu 단위의 바인더 종의 입자 수이며; z는 NGS 판독값을 나타내는 길이-m 벡터이고 각 항목은 바인더 종의 수이다.
결합된 바인더 분획은 지문의 선형 조합으로서 모델링되고, NGS 판독값은 결합된 바인더 분율에 전환 계수를 곱하여 모델링된다:
여기서 A ji 는 지문 행렬로, 바코드 ng당 pfu 단위의 m × n 행렬이다. 'ji' 항목은 바코드 i가 바인더 풀 내 바인더 j를 결합하는 경향을 나타내고; s j 는 바인더 종 j에 대한 NGS 판독 횟수와 결합된 pfu 사이의 전환 계수이며; ε 1 은 결합 단계와 관련된 노이즈이고; ε 2 는 결합 후 단계와 관련된 노이즈이다.
이 모델은 바코드와 바인더 사이의 결합이 선형이라고 가정한다. 즉, 샘플에 바코드가 혼합되어 있는 경우, 판독값은 상대적인 바코드 풍부도에 따라 가중치가 부여된 개별 바코드 지문의 합과 동일하다고 가정된다. 부록 A에서는 한 가지 주요 조건, 즉 샘플 내 바코드에 결합하여 이용 가능한 바인더의 양을 크게 고갈할 수 없다는 조건 하에서 선형 가정을 정당화하는 상세한 생물물리학적 모델을 제공한다. 따라서, 전형적인 면역분석에서와 같이 결합제는 과잉이어야 하며 제한 시약이 될 수 없다.
지문 행렬 A ji :
mn-지문 행렬의 각 열은 지문이다. 각 지문은 순수 바코드의 이상적이고 적절하게 표준화된 판독값을 나타낸다. A ji 항목은 j번째 바인더가 바코드 i의 지문에 미치는 영향을 나타낸다.
바코드의 지문은 풀 내 모든 바인더에 대한 결합 친화도와 풀 내 각 바인더 종의 상대적 풍부도에 따라 달라진다. 또한, 지문은 결합, 평형 및 용출 단계에 민감하다. 가장 간단한 경우, 지문 행렬은 다음과 같이 주어진다:
여기서 d j 는 바인더 풀 내 바인더 j 농도이고, K ji 는 바코드 i와 바인더 j 사이 복합체의 해리 상수이다(부록 A 참고). 더 복잡한 경우, A ji 에는 표면 접착 효과, 세척 단계 중 결합 해제 효과 등도 포함될 수도 있다.
바코드 혼합물 x를 포함하는 A의 행렬 산물은 이상적인 결합된 바인더 분획(즉, 노이즈가 없는 경우)의 구성을 파지 입자 수 단위로 제공한다.
지문 행렬은 알려진 다수의 샘플의 판독값을 측정하여 확인할 수 있다. 노이즈에 대한 평균을 내기 위해 다수의 반복이 수행된다. 또한, 지문은 서로에 대해 또는 절대 표준에 따라 적절하게 크기가 조정된다(정규화 섹션 참고).
전환 계수 s j :
결합 후 단계에서는 결합된 파지 입자 개수와 NGS 판독 횟수 사이의 전환 계수를 도입한다. 이는 s j 로 표시된다. 가장 간단한 경우, s j 는 모든 바인더 종에 대해 동일하며 전반적인 정규화 를 나타내어, 총 판독 횟수/개수가 C가 되도록 한다. 이는 전파 배양의 포화와 같이 프로세싱에 일종의 병목 현상이 있는 상황을 모델링하여 최종 결과는 결합된 파지의 양에 관계없이 고정된 횟수의 판독이 이루어지도록 한다. 더 복합인 경우, s j 는 증폭 편향이나 전파 시 차등 파지 적합성을 반영하여 바인더 종에 따라 달라질 수 있다.
전환 계수가 모든 바인더 종에 대해 동일한 경우, 이는 샘플별로 확인해야 하는 단일 숫자이다. 이는 (본원에 설명된 바와 같이) 프로세스의 일부 지점에 스파이크된 DNA 서열을 사용하여 수행될 수 있다.
노이즈 ε:
노이즈는 ε 1 ε 2 라는 용어로 표현된다. 가장 단순한 경우에, ε 1 이 없고 ε 2 는 고정 분산(fixed variance)의 가우스 노이즈(Gaussian noise)이며, 이 경우 예측은 일반적인 최소 제곱 회귀 분석으로 수행할 수 있다. 실제로 노이즈는 위 섹션에 자세히 설명된 바와 같이 가우스가 아닌 여러 소스에서 발생한다. 여기에는 파지 전파 및 PCR 증폭과 같은 지수 단계와 관련된 로그 정규 노이즈(log-normal noise), 유한 시퀀싱 깊이(및 낮은 농도에서 결합/용출의 확률성)로 인한 포아송 노이즈(Poisson noise), 및 샘플 분해와 같은 기타 모든 프로세스에서 발생하는 가우스 노이즈 등이 포함된다.
판독 횟수에서 파지 개수로의 변환:
NGS의 한 가지 특징은 판독이 상대적 측정값이라는 것이다: 이는 각각 다른 바인더 종 사이의 풍부도 비율을 제공하지만 반드시 바인더 종의 절대 농도는 아니다. 절대 판독값을 얻으려면 원시 판독값을 결합된 파지 입자 개수와 NGS 판독 횟수 간의 전환 계수로 나누어야 한다.
전환 계수를 알지 못하면 샘플 내 바코드의 상대적 풍부도(즉, 비율)만 확인하는 것이 가능하다. 절대 정량화를 위해서는 알려진 농도(바코드 또는 바인더)의 기준을 프로세스에 추가해야 한다.
절대 정량화 방법:
용출된 파지 래더(phage ladder)의 스파이킹:
한 가지 정규화 방법은 알려진 농도 y 스파이크인 으로 용출액에 고유 바인더 종을 추가하는 것이다. 이 기준 종은 풀 내 기존 바인더와 구별되어야 한다. 아래와 같이 (용출된 파지가 전파되고, DNA가 추출되고, PCR이 수행되고 시퀀싱되는) 후속 단계에서 기준 파지는 (이상적으로) 풀 내 다른 파지와 동일한 인자에 의해 증폭될 것이다:
전환 계수는 아래와 같이 기준 파지에 상응하는 판독 횟수를 추가된 (알려진) 농도로 나누어 추정할 수 있다:
일반화는 다수의 바인더 종을 용출액에 추가하는 것이다. 각 기준 종은 각각 다른 농도로 추가될 수 있다. 농도가 균등한 간격으로 있으면 겔 전기영동에 사용되는 래더와 유사하게 "파지 래더"가 형성된다. 전환 계수를 추정하기 위해 각 기준 서열의 판독 횟수를 용출액에 추가된 (알려진) 농도와 비교할 수 있다. 이어서 종 전체에 걸쳐 평균을 구하면 전환 계수를 더 정확하게 추정할 수 있다.
샘플로의 바코드의 스파이킹:
대안적으로, 알려진 농도의 기준 바코드가 해독 프로세스 시작 시 샘플에 추가될 수 있다. 이 기준 바코드는 샘플의 기존 바코드와 구별되어야 한다. 해독 알고리즘은 원시 판독값을 사용하여 기준 바코드와 샘플 바코드를 포함한 샘플 내 모든 바코드의 비율을 확인할 수 있다. 기준 바코드 농도를 예측 비율로 나누어 바코드 전환 계수를 확인할 수 있다. 예측된 모든 비율에 이 계수를 곱하면 바코드의 절대 풍부도가 산출된다.
이 방법은 적절하게 정규화된 지문 세트가 확인된 후 미지의 샘플을 해독하는 데에만 적용 가능하다는 점에 유의한다.
지문 스케일링:
중요한 세부사항은 상대적 정량화의 경우에도 판독값을 스케일링해야 한다는 것이다. 특히, 바코드 세트의 지문은 서로 적절하게 스케일링되어야 한다. 직관적으로 이는 크기가 스케일링되지 않은 원시 지문을 바코드 간에 직접 비교할 수 없기 때문이다. 각 바코드는 결합된 바인더 수와 판독 횟수 간의 전환 계수가 상이하기 때문에 바인더의 판독 횟수는 바코드의 지문이 상이할 때 의미가 다르다. 지문이 동일한 단위로 측정되도록 하려면 스케일링되지 않은 각 지문을 전환 계수로(전환 계수의 역수로) 크기를 스케일링해야 한다.
이를 설명하기 위해 2개의 바코드가 있는 경우를 고려한다. 바인더 풀 전체에 걸친 결합 친화도의 차이로 인해 바코드 A 100ng에 결합된 바인더의 총량이 바코드 B 100ng에 결합된 것보다 10배 더 많다고 가정한다. 그러나 이 방법의 특성으로 인해 원시 판독값은 결국 동일한 수의 판독값을 갖게 된다. 이 예에서 바코드 A의 원시 지문에 있는 하나의 NGS 판독값은 바코드 B의 원시 지문에 있는 10개의 판독값에 해당한다. 전환 계수가 상이하다. 이제 2개의 바코드가 1:1로 혼합된 샘플을 생각해 본다. 친화도의 차이로 인해 이 샘플 내 결합된 바인더 분율은 10:1이고; 결과적으로 AB에 상응하는 NGS 판독값 개수도 10:1 비율이 된다. 즉, 판독값은 10a+b에 비례하며, 여기서 aA의 원시 판독값이고 bB의 원시 판독값이다. 이를 바탕으로 AB가 10:1의 비율로 있다는 잘못된 결론에 도달하게 된다. 이를 수정하려면 다음과 같이 바코드 A의 원시 지문을 B와 비교하여 10을 곱해야 올바르게 스케일링된 지문을 얻을 수 있다: a'=10ab'=b. 이제 2개의 바코드가 동일한 비율로 혼합되면 올바른 결과가 된다: 판독값은 올바르게 스케일링된 2개의 지문의 동일한 가중치 혼합물, a'+b'이다.
이 예는 바코드의 원시 지문 사이의 상대적 스케일링 계수가 알려진 바코드 혼합물의 판독값을 측정함으로써 확인될 수 있음을 보여준다. 바코드가 동일한 비율로 혼합된 경우, 혼합물 판독값의 구성은 각 원시 지문이 되며 서로에 대한 비율에 따라 가중치가 부여된다. (이는 바코드 간의 상대 전환 계수만 제공하며 절대 바코드 수량에 대한 절대 전환 계수는 제공하지 않음을 주목한다.)
해독 알고리즘:
해독 알고리즘에는 두 가지 단계가 있다:
● "훈련 단계(Training phase)": 알려진 여러 샘플의 판독값을 측정하여 지문 행렬 A ji 를 학습
● "테스트 단계(Testing phase)": 판독값을 측정하고 이를 A ji 와 비교하여 미지의 샘플 내 바코드 양을 예측
훈련 단계: 지문 행렬 학습
훈련 단계에서, 바코드 세트의 지문은 구성이 알려진 샘플 세트의 판독값을 측정함으로써 확인한다. 지문은 서로 정확하게 스케일링되어야 한다: 지문 행렬을 측정하는 한 가지 방법을 아래에 설명한다.
먼저, 각각 순수하게 단일 바코드를 함유하는 샘플 세트를 준비한다. 각 샘플을 해독한다. 각 바코드의 지문은 바코드를 여러 번 반복실험하고 판독값의 평균을 계산하여 추정한다. 더 많은 반복실험을 평균하면 오차가 줄어든다. 이렇게 하면 각 바코드에 대해 크기가 스케일링되지 않은 지문이 생성된다.
다음으로, 지문을 서로에 대해 정확하게 스케일링한다. 이는 스케일링되지 않은 각 지문에 스케일링 계수를 곱하여 수행한다. 각 바코드의 스케일링 계수를 확인하기 위해 동일한 비율로 혼합된 모든 바코드로 이루어진 샘플을 해독한다. 이론적으로 이 샘플의 판독값은 동일한 가중치를 적용한 모든 바코드의 정규화된 지문의 합계여야 한다. 그러나 이 혼합물 판독값을 이전 단계에서 확인된 정규화되지 않은 지문 세트에 피팅하면 바코드의 가중치가 동일하지 않게 된다. 선형 피팅에 대한 계수는 정확하게 정규화된 지문을 얻기 위해 각 바코드의 지문을 곱해야 하는 계수이다. 이를 여러 번 반복하여 평균화하면 스케일링 계수에 대한 더 정확한 추정치를 확인할 수 있다.
이 방법은 아래에서 더 자세히 설명한다. 를 단일 바코드의 스케일링되지 않은 다수의 측정값의 평균을 구하여 얻은 스케일링되지 않은 지문 행렬이라고 둔다. 각 열의 합은 고정된 판독 횟수로 계산되므로 의 단위는 백만회당 개수이다. 올바르게 스케일링된 지문 행렬 A의 각 열에 리스케일링 계수 S를 곱하여 얻는데, 즉 이고, 여기서 S 대각선 "리스케일링 행렬"이다. 여기서 S ii i번째 바코드의 스케일링 계수이며, 백만회당 용출된 pfu 단위이다. y를 알려진 구성 x의 혼합물에 대한 판독값으로 설정한다. 스케일링 계수를 확인하는 한 가지 방법은 스케일링되지 않은 지문 행렬을 사용하여 "편향된(biased)" 예측 세트를 로 추론하는 것이며, 여기서 의 유사역수(pseudoinverse)이다(아래 예측 섹션 참고). 실제 양에 대한 "편향된" 예측의 비율은 스케일링 계수의 추정치이다: . 스케일링되지 않은 각 지문에 이 스케일링 계수를 곱하면 적절하게 스케일링된 지문에 대한 최상의 추정치 가 제공된다.
지문 행렬을 측정하는 다른 방법도 있다. 본 방법은 (정규화되지 않은) 지문을 확인하기 위해 단일 바코드 샘플만을 사용하고, 스케일링 계수를 확인하기 위해 혼합물 샘플을 사용한다. 더 정교한 방법은 고르지 않은 혼합물을 사용하여 스케일링 계수를 확인하거나 이러한 샘플의 정보를 사용하여 지문을 더 잘 추정할 수 있다(단순히 스케일링 계수를 학습하는 것 이상).
테스트 단계: 미지의 샘플 내 바코드 양 예측
테스트 단계에서 우리는 미지의 샘플 x의 판독값 y를 제공받으며 그 구성요소 를 추론하는 것을 목표로 한다. 이는 판독값을 지문의 선형 조합인 에 피팅하는 방식으로 수행되며, 여기서 A는 훈련 단계에서 학습된 (적절하게 스케일링된) 지문 행렬이다.
피팅은 손실 함수를 최소화하는 계수 xj 세트를 선택하여 수행된다. 손실 함수는 예상 판독값과 측정 판독값 간의 편차를 측정한다. 예상 판독값은 확인된 지문과 제안된 혼합물 계수를 기반으로 하는 행렬 곱 Ax이다. 가장 간단한 경우 손실 함수는 오차 제곱의 합이고:
추론된 혼합물 조성은 이 손실의 미니마이저(minimizer)이다: . 바인더 개수가 바코드 개수보다 많으면 A x =y는 초과선정 시스템(overdetermined system)이며 고유 손실 미니마이저가 있다. 해법은 다음과 같다:
여기서 는 지문 행렬의 무어-펜로즈 역(Moore-Penrose inverse)이다. 상대적 풍부도(비율)가 필요한 경우, 계수를 합계가 1이 되도록 정규화할 수 있다.
위의 L2 손실 함수는 가장 간단한 경우이다. 이는 ε 1 이 없고(결합 시 노이즈 없음) ε 2 가 고정 분산의 가우스 노이즈인 경우 음의 로그 우도에 비례한다. 더 현실적인 형태의 노이즈를 모델링하려면 다른 손실 함수를 선택할 수 있다.
부록 A: 결합 프로세스의 생물물리학적 모델
n을 샘플 내 바코드가 표시된 단백질 종의 개수라고 하고, 을 해독 웰에 추가된 각 바코드가 표시된 종의 농도라고 둔다. 마찬가지로, m을 디코더(decoder) 풀 내 디코더 종의 개수라고 하고, 을 해독 웰에 추가된 각 디코더 종의 농도라고 둔다. 모든 디코더가 일대일 화학량론으로 바코드와 상호작용하여 결합된 복합체를 형성할 수 있다고 가정한다. 각 바코드-디코더 쌍에 대해 하나씩 총 nm개의 이러한 복합체가 형성될 수 있다. 을 바코드 i와 디코더 j 사이의 복합체 농도라고 하고, 를 이 상호작용의 친화도를 특징짓는 평형 해리 상수라고 두고, 를 사용한다.
모든 디코더 종에 대해, 샘플에 결합한 후 용출되는 양은 로 주어지며, 해당 디코더의 결합된 복합체는 가능한 모든 바코드 쌍에 대해 합산된다.
가장 간단한 경우, 우리는 각 종이 희석 용액에서 이상적인 용질이고 바코드와 디코더 사이의 결합이 열역학적 평형에 접근할 수 있다고 가정한다. 평형 상태에서는 디코더 중 일부가 바코드에 결합하지만 의 농도의 결합되지 않은 바코드와 농도 의 결합되지 않은 디코더가 여전히 남아 있을 것이다.
평형 상태는 시스템의 전체 자유 에너지를 최소화함으로써 제공된다. 이는 다음 방정식 세트를 푸는 것과 동일하다:
의 경우
의 경우
의 경우
첫 번째 방정식은 질량 보존을 보장한다. 바코드 종의 총량은 결합되지 않은 양과 가능한 모든 디코더 파트너가 있는 복합체에 결합된 양을 더한 것이다. 두 번째 방정식은 디코더에 대한 유사한 설명이다. 마지막 방정식은 바코드-디코더 쌍의 평형 상수에 대한 정의이다.
알려진 값은 평형 상수 K ij x i d j 이며, 각각 웰에 추가된 바코드 및 디코더의 각 종의 총 농도를 나타낸다. 미지의 변수는 이다. 미지의 변수의 값은 위 방정식 시스템을 풀어 확인한다.
선형 근사
해독 프로세스에서는 고정된 값 K ij d j 를 갖는 디코더 풀이 미지의 바코드 구성의 샘플 x i 에 추가된다. 결합 프로세스의 관찰 가능한 출력은 샘플에 결합되는 각 디코더 종의 양이다: . 결합 프로세스의 핵심 질문은 입력인 바코드 농도 x i 가 출력인 결합된 디코더 양 y j 에 어떻게 영향을 미치는가이다.
일반적으로 위의 방정식 시스템은 비선형이지만 특정 조건이 충족되면 결합 프로세스는 일련의 선형 방정식으로 잘 근사화될 수 있다. 기본 방정식이 선형이면 해독 프로세스가 크게 단순화된다. 선형 시스템은 최소한 다음을 의미한다:
1) 바코드의 농도가 두 배로 증가하면 해당 바코드에 결합된 디코더도 그에 따라 두 배로 늘어난다. (포화 없음)
2) 2개의 바코드가 함께 혼합된 경우 혼합물에 결합된 디코더는 각 바코드에만 결합된 디코더의 합계이다. (경쟁 없음)
이 두 가지 기준은 각각 단일 및 다중 바코드 검출의 선형성으로 생각할 수 있다. 그것은 필요하지만 충분조건은 아니다.
이러한 기준이 실제로 어떻게 작동하는지 확인하려면 하나 이상의 기준을 위반하는 다음 결합 상황을 고려한다. 디코더가 바코드와 디코더의 일대일 화학량론에서 제한 시약이라고 가정한다. 소정의 바코드 농도를 초과하면 이용 가능한 모든 디코더가 포화 상태가 된다. x i 의 증가는 y j 의 비례적인 증가로 이어지지 않는다. 따라서, 포화를 방지하려면 바코드 농도를 상호작용의 Kd(또는 디코더 농도 중 더 큰 값 - 아래 참고) 아래로 유지해야 한다.
또 다른 예로, 2개의 바코드 A와 B가 모두 특정 디코더 D에 대해 친화성이 있지만 바코드 A가 바코드 B보다 훨씬 더 강한 친화성이 있는 상황을 생각해 본다. A가 없는 경우 바코드 B의 결합은 특정 결합 곡선을 갖는다. 그러나 이용 가능한 D의 대부분을 고갈시키기에 충분한 A가 있는 경우 나머지 D에 대한 바코드 B의 결합이 크게 변경된다. 이는 A와 B가 이용 가능한 디코더 D를 놓고 경쟁하는 상황이다. 그러나 A의 결합이 풀에 남아 있는 D의 양을 고갈시키지 않으면 B와 D 간의 결합은 A의 존재에 의해 변경되지 않는다. 경쟁적 행동은 A에 결합하여 이용 가능한 D가 크게 소비되는 상황 - A가 매우 풍부하고/거나 A-D 친화성이 강한 경우에서만 발생한다. 비선형 상황의 두 가지 예 모두에서 바코드 결합으로 인해 풀 내 하나 이상의 디코더가 크게 고갈된다.
이러한 예는 해독 풀의 작은 부분이 샘플에 결합될 때 결합 프로세스가 선형임을 나타낸다. 실제로 이 조건이 충족되면 위의 방정식은 간단한 선형 시스템으로 단순화될 수 있다. 이 가정 하에서, 결합되지 않은 디코더의 양 는 디코더의 총량 에 의해 잘 근사된다. 결합된 복합체가 이용 가능한 바코드의 작은 부분을 고갈시킨다고 가정하면 방정식 시스템은 다음과 같이 단순화되고:
출력은 간단한 행렬 곱셈으로 표현될 수 있다:
.
실시예 9: 기준 바코드(또는 스파이크인 바코드)를 사용한 단일 테스트 바코드의 절대 페이로드 풍부도 평가
본 실시예는 기준 바코드 및 바코드 해독을 사용하여 풀 내 페이로드의 절대적 페이로드 풍부도를 확인하는 방법을 보여준다.
도 10a는 실험의 개략도를 도시한다. 페이로드에 부착된 단일 테스트 바코드를 0ng/mL 내지 1250ng/mL 범위의 여러 농도에서 검정하였다. 동일한 샘플에서 페이로드(즉, 기준 바코드)에 부착된 "스파이크인" 바코드가 각 검정 혼합물에 250ng/mL로 추가되었다. 다양한 농도의 테스트 바코드가 표시된 페이로드를 결합제(즉, 바인더가 발현되어 있는 결합제)와 접촉시키고, 본원에 설명된 바와 같이 해독을 수행하였다. 기준 또는 "스파이크인" 바코드의 예측을 사용하여 테스트 바코드의 절대량을 확인하였고, 더 나아가 측정되는 바코드가 표시된 페이로드도 측정하였다(실시예 8 참조). 도 10b는 테스트 바코드의 각 적정에 대한 테스트 바코드의 알려진 입력 농도(왼쪽 막대)와 비교한 테스트 바코드의 측정된 절대량(오른쪽 막대)의 플롯을 보여준다. Y축은 밀리리터당 나노그램(ng/mL) 단위의 테스트 바코드 농도의 로그이다. 도 10c는 6개의 각각 다른 바코드가 표시된 페이로드에 대한 절대 농도 측정 결과를 보여준다. 플롯은 6개의 각각 다른 바코드가 표시된 페이로드에 대한 알려진 입력 농도(왼쪽 막대)와 측정 농도(오른쪽 막대)를 보여준다.
실시예 10: 바인더-바코드 플랫폼을 사용한 페이로드 표현형의 생체 내 동시 평가
본 실시예는 본원에 설명된 바인더-바코드 플랫폼을 사용하여 페이로드 표현형의 생체 내 동시 평가를 확인하는 방법을 보여준다. 일부 실시양태에서, 표현형은 본원에 설명된 바와 같은 약동학(또는 제거) 데이터를 포함한다.
도 13a는 본원에 설명된 바인더-바코드 플랫폼을 사용하여 풀에서 14개의 예시적인 페이로드(예를 들어, 단백질)를 검출 및/또는 정량화 및/또는 특성화하는 방법의 개략도이다. 14개의 예시적인 바인더 분자는 본원에 설명된 바와 같은 각각 다른 바코드를 사용하여 생성하였다("바인더-바코드 입자"). 바인더-코드 입자를 야생형(wt) BALB/c 마우스에 풀로 주입하였다. 30분, 6시간, 24시간 및 48시간 시점에 개별 마우스(시점당 n=3)로부터 혈액을 수집하고 혈청을 추출하였다. 바인더-바코드 입자를 캡처하여 설명된 대로 해독 절차를 수행하였다.
도 13b는 본원에 설명된 바인더-바코드 플랫폼을 사용한 페이로드의 제거 표현형에 대한 동시 생체 내 평가를 보여준다. 특히, 도 13b는 동시에 측정되고 제거 표현형의 속도(예를 들어, 느린 제거 대 빠른 제거)에 따라 그룹화된 다중 페이로드의 제거 플롯을 보여준다. 도 13b(왼쪽)는 측정된 알려진 특성의 대조군을 도시한다. 도 13b(중앙)는 시간이 지남에 따라 느린 제거 특성이 있는 것으로 식별된 페이로드를 도시한다. 도 13b(오른쪽)는 시간이 지남에 따라 빠른 제거 특성을 갖는 것으로 식별된 페이로드를 도시한다. 데이터는 각 바인더-바코드 입자에 대해 100%의 주입 용적으로 정규화되었다.
따라서, 본 실시예는 본원에 설명된 바인더-바코드 플랫폼이 생체 내에서 표현형의 동시 특성화를 위해 사용될 수 있음을 확인시켜준다.
실시예 11: 바인더-바코드 플랫폼을 사용한 다수의 조직에서 페이로드 표현형에 대한 생체 내 동시 평가
무엇보다도, 본 개시내용은 표적 내, 종양 외 독성이 생체분포 문제라는 통찰을 제공한다. 본 실시예는 본원에 설명된 바인더-바코드 플랫폼을 사용하여 다수의 조직에서 페이로드 표현형에 대한 생체 내 동시 평가를 확인하는 방법을 보여준다. 일부 실시양태에서, 표현형은 본원에 설명된 바와 같은 생체분포 데이터를 포함한다. 일부 실시양태에서, 표현형은 본원에 설명된 바와 같은 약동학(제거) 데이터를 포함한다. 일부 실시양태에서, 표현형은 본원에 설명된 바와 같은 약동학 데이터 및 생체분포 데이터를 포함한다.
도 14a는 본원에 설명된 바인더-바코드 플랫폼을 사용하여 풀 내 36개의 예시적인 페이로드(예를 들어, 단백질)를 검출 및/또는 정량화 및/또는 특성화하는 방법의 개략도이다. 36개의 바인더 분자가 각각 다른 바코드("바인더-바코드 입자")로 생성되었다. 이전에 2개의 종양 세포주(종양 1, 종양 2)가 이식된 종양 보유 NSG 마우스에 바인더-바코드 입자를 풀로 주입하였다. 30분, 6시간, 24시간 및 48시간 시점에서 혈액 및 종양 조직을 개별 마우스(시점당 n=2-4)로부터 수집하였다. 일부 실시양태에서, 폐, 간, 뇌 등을 포함한 기타 조직이 수확될 수 있다. 조직은 표준 용해 버퍼를 사용하여 용해시켰다. 혈청은 혈액에서 분리하였다. 바인더-바코드 입자는 각 조직으로부터 바인더를 캡처하고 본원에 설명된 바와 같이 해독 절차를 거쳤다.
도 14b는 본원에 설명된 바와 같이 수집된 모든 바인더-바코드 입자 데이터의 히트맵이다. 행은 본 실시예에서 테스트한 바인더-바코드 입자와 상관관계가 있는 다양한 바인더 작제물 식별자(ID)를 나타낸다. 열은 혈청, 종양 1 또는 종양 2에 대한 각 시점에서의 마우스에 대한 데이터를 나타낸다. 색상 강도는 본원에 설명된 해독 절차를 통해 측정된 약물의 상대적 단위를 나타낸다. 색상 강도는 차세대 시퀀싱(NGS)을 통해 측정된 상대 농도의 정규화된 판독값을 나타낸다.
도 14c는 본원에 설명된 해독 절차를 사용한 도 14b에 설명된 바인더-바코드 입자의 플롯을 도시한다. 다양한 특성이 동시에 측정되었다. 예를 들어, 바인더-바코드 입자 P14_A5는 종양 1 또는 종양 2에 최소한으로 축적되면서 혈청에서 빠르게 제거되는 반면, 바인더-바코드 입자 P17_A10은 시간이 지남에 따라 종양 1에서 더 천천히 제거되고 유지되었다.
따라서, 본 실시예는 본원에 설명된 바인더-바코드 플랫폼이 생체 내에서 다수의 조직 유형에 걸쳐 페이로드의 표현형을 동시에 특성화하는 데 사용될 수 있음을 확인시켜준다.
실시예 12: 바인더-바코드 플랫폼을 사용한 페이로드 표현형의 생체 내 동시 평가
본 실시예는 본원에 설명된 바인더-바코드 플랫폼을 사용한 페이로드(예를 들어, 단백질) 표현형의 생체 내 동시 평가를 확인하는 방법을 보여준다. 일부 실시양태에서, 표현형은 본원에 설명된 바와 같은 반감기 측정값이다.
도 15a는 두 그룹의 페이로드(그룹 1: 바코드가 없는 단백질 페이로드; 그룹 2: 8개의 바인더-바코드 입자 풀로서 각 입자는 그룹 1에서 사용된 것과 동일한 단백질 페이로드를 포함하고 각 입자는 각각 다른 바코드로 바코드가 표시됨)의 ELISA 정량을 보여주는 플롯을 도시한다. 그룹 1은 야생형(wt) BALB/c 마우스 코호트에 주입되었다. 그룹 2도 야생형(wt) BALB/c 마우스 코호트에 주입되었다. 6시간, 24시간 및 48시간 시점에 개별 마우스(시점당 n=3)로부터 혈액을 수집하고 혈청을 추출하였다. ELISA 정량 분석으로는 그룹 1과 그룹 2 간에 유사한 측정값이 나타나 바코드가 페이로드 기능에 영향을 미치지 않음을 확인하였다. 도 15b는 본원에 설명된 해독 절차를 사용한 그룹 2의 8개 개별 실체에 대한 동시 및 개별 평가를 도시한 플롯을 보여준다. 도 15c는 그룹 1과 그룹 2에 대한 반감기 측정값의 비교를 보여준다. 그룹 1에 대한 반감기 측정값은 ELISA를 사용하여 정량화하였다(점선). 그룹 2에 대한 반감기 측정값은 본원에 설명된 해독 절차를 사용하여 정량화하였다(막대). 도 15c에 나타낸 바와 같이, 풀 내의 다양한 바인더-바코드 입자에 대한 반감기 측정값의 변동은 본원에 설명된 바인더-바코드 플랫폼을 사용하여 해결될 수 있다. 더욱이, ELISA는 한 번의 실험으로 표현형을 동시에 측정할 수 없다.
따라서, 본 실시예는 본원에 설명된 바인더-바코드 플랫폼이 생체 내에서 표현형의 동시적이고 정확한 특성화를 위해 사용될 수 있음을 확인시켜준다. 더욱이, 본 실시예는 본원에 설명된 방법을 사용하여 페이로드에 바코드를 부착하는 것이 페이로드의 생체 내 특성을 방해하지 않는다는 것을 확인시켜준다.
실시예 13: 바인더-바코드 플랫폼의 감도 및 동적 범위(dynamic range)
본 실시예는 본원에 설명된 바인더-바코드 플랫폼의 감도와 동적 범위를 확인하는 방법을 보여준다.
10 내지 35개의 바코드가 표시된 페이로드(예를 들어, 단백질)를 포함하는 96개 혼합물 어레이(각각의 바코드가 표시된 페이로드는 1피코그램(pg)에서 1마이크로그램(μg) 사이의 알려진 농도를 가짐)를 본원에 설명된 바인더-바코드 플랫폼의 감도 및 동적 범위를 확인하도록 설계하였다(도 16a-16b). 도 16b의 각 데이터 포인트는 96개의 개별 혼합물 중 하나로부터의 바코드가 표시된 페이로드 입자의 알려진 농도와 본원에 설명된 해독 절차에 의해 확인된 농도 사이의 비교를 나타낸다. 도 16b에 나타낸 바와 같이, 페이로드는 10,000배 범위의 농도에 걸쳐 정량화되었다. 도 16b는 0.1나노그램(ng)까지의 페이로드도 정량화되었음을 보여준다.
따라서, 본 실시예는 본원에 설명된 바인더-바코드 플랫폼이 다양한 혼합물의 광범위한 동적 농도 범위에 걸쳐 바코드가 표시된 페이로드의 동시적이고 민감한 특성화에 사용될 수 있음을 확인시켜준다.
실시예 14: 바인더-바코드 플랫폼을 사용한 페이로드 표현형의 시험관 내 및 생체 내 평가 비교
본 실시예는 시험관 내 모델이 때때로 생체 내 환경을 정확하게 모델링하지 못한다는 통찰을 제공한다. 무엇보다도, 본 개시내용은 소정의 시험관 내 시스템이 다음 중 하나 이상에 의해 제한될 수 있다는 통찰을 제공한다(예를 들어, 생체 내 성과 모델링과 관련하여): 시험관 내 모델의 2차원 단층 대 생체 내 환경의 복합체 3차원 구조, 표적 번역 후 변형 또는 접근성의 차이, 유전자 발현의 차이, 간질 세포 및/또는 세포 외 기질의 부재, 혈관계로부터의 순환 및 확산 결여 또는 시험관 내 모델에서 모델링되지 않은 표적 외 및 항원 싱크 효과(antigen sink effect).
실시예 11에서 테스트된 바인더-바코드 입자는 시험관 내 T 세포 활성화 검정에서도 테스트되었다(데이터는 표시되지 않음). 시험관 내에서 가장 높은 T 세포 활성화를 보인 바인더-바코드 입자는 생체 내에서 불량한 종양 조직 축적과 빠른 제거를 나타냈다. 또한, 시험관 내에서 적당한 T 세포 활성화를 보인 바인더-바코드 입자는 생체 내에서 높은 종양 축적과 느린 제거를 나타냈다. 따라서, 본 실시예는 본원에 설명된 바인더-바코드 플랫폼이 예상치 못한 생체 내 특성이 있는 바인더를 식별하는 데 사용될 수 있음을 확인시켜준다. 더욱이, 본 실시예는 본원에 설명된 바인더-바코드 플랫폼이 생체 내에서 바람직한 표현형을 나타내는 치료 후보를 선택하는데 사용될 수 있음을 확인시켜준다.
실시예 15: 바코드는 페이로드 특성에 큰 영향을 미치지 않는다
본 실시예는 바코드가 페이로드(예를 들어, 단백질) 특성에 비교적 영향을 미치지 않음을 확인시켜준다. 일부 실시양태에서, 특성은 본원에 설명된 바와 같은 페이로드 친화도를 포함한다. 일부 실시양태에서, 특성은 본원에 설명된 바와 같은 페이로드 생성(또는 수율)을 포함한다.
바코드가 있거나 없는 페이로드(예를 들어, 단백질)의 친화도 및 생성(또는 수율)은 바이오층 간섭측정법(biolayer interferometry, BLI)를 사용하여 평가하였다. 10개의 각각 다른 바코드를 테스트하였다. 바코드가 있는 페이로드의 친화도는 BLI로 측정했을 때 바코드가 없는 페이로드와 유사한 친화도를 나타냈다(데이터는 표시되지 않음). 또한, 바코드가 표시된 페이로드의 페이로드 생성(또는 수율)은 BLI로 측정했을 때 바코드가 없는 페이로드와 유사한 페이로드 생성(또는 수율)을 나타냈다(데이터는 표시되지 않음).
따라서, 본 실시예는 페이로드 성능이 바코드에 의해 큰 영향을 받지 않는다는 것을 확인시켜준다. 더욱이, 본 실시예는 페이로드 생성이 바코드에 의해 큰 영향을 받지 않는다는 것을 확인시켜 준다.
참고문헌
Towbin H, Staehelin T, Gordon J. Electrophoretic transfer of proteins from polyacrylamide gels to nitrocellulose sheets: procedure and some applications. Proc Natl Acad Sci U S A. 1979;76(9):4350-4354. doi:10.1073/pnas.76.9.4350
Engvall E, Perlmann P. Enzyme-linked immunosorbent assay, Elisa. 3. Quantitation of specific antibodies by enzyme-labeled anti-immunoglobulin in antigen-coated tubes. J Immunol. 1972 Jul;109(1):129-35. PMID: 4113792.
Elshal MF, McCoy JP. Multiplex bead array assays: performance evaluation and comparison of sensitivity to ELISA. Methods. 2006 Apr;38(4):317-23. doi: 10.1016/j.ymeth.2005.11.010. PMID: 16481199; PMCID: PMC1534009.
Shendure J, Porreca GJ, Reppas NB, Lin X, McCutcheon JP, Rosenbaum AM, Wang MD, Zhang K, Mitra RD, Church GM. Accurate multiplex polony sequencing of an evolved bacterial genome. Science. 2005 Sep 9;309(5741):1728-32. doi: 10.1126/science.1117389. Epub 2005 Aug 4. PMID: 16081699.
Trads JB, Tørring T, Gothelf KV. Site-Selective Conjugation of Native Proteins with DNA. Acc Chem Res. 2017 Jun 20;50(6):1367-1374. doi: 10.1021/acs.accounts.6b00618. Epub 2017 May 9. PMID: 28485577.
Egloff P, Zimmermann I, Arnold FM, Hutter CAJ, Morger D, Opitz L, Poveda L, Keserue HA, Panse C, Roschitzki B, Seeger MA. Engineered peptide barcodes for in-depth analyses of binding protein libraries. Nat Methods. 2019 May;16(5):421-428. doi: 10.1038/s41592-019-0389-8. Epub 2019 Apr 22. PMID: 31011184; PMCID: PMC7116144.
Pollock SB, Hu A, Mou Y, Martinko AJ, Julien O, Hornsby M, Ploder L, Adams JJ, Geng H, Muschen M, Sidhu SS, Moffat J, Wells JA. Highly multiplexed and quantitative cell-surface protein profiling using genetically barcoded antibodies. Proc Natl Acad Sci U S A. 2018 Mar 13;115(11):2836-2841. doi: 10.1073/pnas.1721899115. Epub 2018 Feb 23. PMID: 29476010; PMCID: PMC5856557.
Mohan D, Wansley DL, Sie BM, Noon MS, Baer AN, Laserson U, Larman HB. PhIP-Seq characterization of serum antibodies using oligonucleotide-encoded peptidomes. Nat Protoc. 2018 Sep;13(9):1958-1978. doi: 10.1038/s41596-018-0025-6. Erratum in: Nat Protoc. 2018 Oct 25;: PMID: 30190553; PMCID: PMC6568263.
Barbas, C. F., Burton, D. R., Scott, J. K., & Silverman, G. J. Phage Display: A Laboratory Manual. 2001. Cold Spring Harbor Laboratory Press.
기타 실시양태
당업자는 본 개시내용에 대한 다양한 변경, 수정 및 개선이 당업자에게 용이할 수 있다는 것을 이해해야 한다. 이러한 변경, 수정 및 개선은 본 개시내용의 일부가 되도록 의도되었으며, 본 발명의 사상 및 범위 내에 속하도록 의도되었다. 따라서, 전술한 설명 및 도면은 단지 예일 뿐이며, 본 개시내용에 설명된 임의의 발명은 다음의 청구범위에 의해 더 자세히 설명된다.
당업자는 본원에 설명된 바와 같은 검정 또는 기타 과정에서 얻은 값에 기인하는 편차 또는 오차의 전형적 표준을 이해할 것이다. 본 발명의 배경을 설명하고 본 발명의 실시에 관한 추가 세부사항을 제공하기 위해 본원에 언급된 간행물, 웹사이트 및 기타 참고문헌(위 참고문헌 섹션에 나열된 내용을 포함)는 전체 내용이 본원에 참조로 포함된다.
본 발명의 실시양태가 이의 상세한 설명과 함께 설명되었지만, 전술한 설명은 설명하기 위한 것이지 첨부된 청구범위에 의해 정의되는 본 발명의 범위를 제한하려는 것이 아니라는 것을 이해해야 한다. 다른 측면, 이점 및 수정은 다음의 청구범위 내에 있다.
등가물
당업자는 단지 일상적인 실험만을 사용하여 본원에 설명된 본 발명의 구체적인 실시양태에 대한 많은 등가물을 인식하거나 알아낼 수 있을 것이다. 본 발명의 범위는 상기 설명으로 제한되는 것이 아니라, 다음의 청구범위에 제시된 바와 같다:
표 1: 바인더 및 바코드 핵산 서열의 예시적인 리스트를 제공하는 표
표 2: 바인더 및 바코드 아미노산 서열의 예시적인 리스트를 제공하는 표
서열목록 전자파일 첨부

Claims (115)

  1. 다음 단계를 포함하는 방법:
    a) 바코드가 표시된 단백질(barcoded protein) 집단을 평가하는 단계;
    b) 평가를 만족시키는 집단 구성원과 그렇지 않은 집단 구성원을 분리하여 양성 집단, 음성 집단 또는 둘 다를 식별하는 단계;
    c) 양성 집단, 음성 집단 또는 서로 별도로 각 집단을 집단의 각 바코드에 특이적인 적어도 하나의 특정 바인더(binder)를 포함하는 바인더 세트와 접촉시키는 단계; 및
    d) 어떤 바인더가 분리된 구성원에 결합하는지 확인하여 어떤 바코드가 표시된 단백질이 접촉된 집단(들)에 존재하는지 확인하는 단계.
  2. 다음 단계를 포함하는 방법:
    a) 바인더 세트를 바코드가 표시된 단백질의 제1 집단 또는 제2 집단과 접촉시키거나 별도로 제1 집단 및 제2 집단 각각과 접촉시키는 단계로서,
    ⅰ) 각 바인더는 하나 이상의 바코드에 특이적으로(예를 들어, 알려진 친화도로) 결합하고;
    ⅱ) 바인더 세트는 집합적으로 제1 집단 및 제2 집단의 바코드 각각에 대해 특이적인 적어도 하나의 바인더를 포함하며,
    제1 집단과 제2 집단은 평가 성과에 기초하여 서로 분리되는 것인 단계; 및
    b) 세트의 어떤 바인더가 제1 집단, 제2 집단 또는 둘 다의 구성원에 결합하는지 확인하여 어떤 바코드가 표시된 단백질이 접촉된 집단(들)에 존재하는지 확인하는 단계.
  3. 제2항에 있어서, c) 성과 평가의 기능적 효과를 확인하기 위해 제1 집단과 제2 집단 사이의 차이를 확인하는 단계를 추가로 포함하는 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 바코드가 단백질의 상보성 결정 영역(Complementarity-Determining Region, CDR)에 포함되는 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 바코드가 아미노산이거나 이를 포함하고, 바코드가 단백질에 부착되는 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 바인더가 파지(phage)에 표시된 결합 모이어티(binding moiety)이거나 이를 포함하는 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 바코드가 합성 바코드인 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 바코드가 1-100개, 5-50개, 8-25개, 9-25개 또는 9-15개 아미노산 길이인 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 바코드가 10개 아미노산 길이인 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 바코드가 단백질 기능에 비교적 영향을 미치지 않는 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 바코드가 면역 반응을 유발하지 않는 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 바코드가 서로 직교하는 방법.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, 바코드가 단백질 상의 적합한 위치에 부착되는 방법.
  14. 제13항에 있어서, 적합한 위치가 N-말단 또는 C-말단인 방법.
  15. 제1항 내지 제14항 중 어느 한 항에 있어서, 적어도 하나의 단백질에 결합하는 바인더를 분리하는 단계를 포함하는 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 확인 단계가 증폭(amplification), 전파(propagation) 및 시퀀싱(sequencing)(예를 들어, 핵산(예를 들어, DNA, RNA) 증폭, 전파 및/또는 시퀀싱) 중 하나 이상을 수행하는 단계를 포함하는 방법.
  17. 제16항에 있어서, 증폭이 PCR, LAMP 또는 회전환 증폭(rolling circle amplification, RCA)을 사용하여 수행되는 방법.
  18. 제16항에 있어서, 시퀀싱이 Illumina, 차세대 시퀀싱(Next Generation Sequencing, NGS), 나노포어 시퀀싱(nanopore sequencing), Pac Bio 롱 리드 시퀀싱(Pac Bio long read sequencing) 등을 사용하여 수행되는 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 확인 단계가 바코드가 표시된 단백질에 결합하는 바인더의 개수를 정량화하는 단계를 포함하고, 정량화는 바코드가 표시된 단백질에 결합하는 각 바인더의 뉴클레오티드 서열을 해독(decode)함으로써 수행되는 방법.
  20. 제19항에 있어서, 시퀀싱이 Illumina, 차세대 시퀀싱(NGS), 나노포어 시퀀싱, Pac Bio 롱 리드 시퀀싱 등을 사용하여 수행되는 방법.
  21. 제19항에 있어서, 단백질에 결합하는 바인더의 개수를 정량화하여 집단 내 단백질의 척도를 제공하는 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 바코드가 표시된 단백질이 복합 혼합물(complex mixture) 내에 존재하는 것인 방법.
  23. 제22항에 있어서, 복합 혼합물이 혈청, 혈액 또는 조직인 방법.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, 바코드가 표시된 단백질이 정제된 샘플 내에 존재하는 방법.
  25. 제6항에 있어서, 파지가 M13, T4, T7, 람다(Lambda) 및 사상(filamentous) 파지로 구성된 군으로부터 선택되는 방법.
  26. 제19항에 있어서, 파지가 M13인 방법.
  27. 뉴클레오티드 서열이 펩티드 바코드를 암호화하는(encoding) 서열이거나 이를 포함하는 핵산으로서,
    a) 펩티드 바코드가 1 내지 100개, 5 내지 50개, 8 내지 25개, 9 내지 25개 또는 9 내지 15개 아미노산 범위 내의 길이이고;
    b) 펩티드 바코드가 바인더 세트 내의 특정 폴리펩티드 바인더 그룹에 특이적으로 결합하는 것으로 확인된 것을 특징으로 하는 핵산.
  28. 제27항에 있어서, 펩티드 바코드가 서열번호 5347-8398로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 핵산.
  29. 제27항에 있어서, 암호화 서열이 서열번호 1148-4199로 이루어진 군으로부터 선택되는 핵산.
  30. 제27항에 있어서, 펩티드 바코드가 8 내지 25개 아미노산 길이인 핵산.
  31. 제27항에 있어서, 펩티드 바코드가 10개 아미노산 길이인 핵산.
  32. 제27항 내지 제31항 중 어느 한 항의 핵산을 복수로 포함하는 라이브러리로서, 복수의 핵산이 함께 펩티드 바코드의 집합체(collection)를 암호화하며, 각 핵산은 5'에서 3' 또는 3'에서 5'의 순서로 다음 중 하나 이상을 포함하는 라이브러리:
    a) 제1 불변 서열(invariant sequence)(예를 들어, 링커 서열 또는 페이로드 서열);
    b) 적어도 9개 뉴클레오티드 길이인 변이체 서열; 및
    c) 제2 불변 서열(예를 들어, 링커 서열, 정지 코돈 또는 페이로드 서열).
  33. 제32항에 있어서, 변이체 서열이 적어도 15, 24, 27, 45, 150 또는 300개 뉴클레오티드 길이인 라이브러리.
  34. 제32항에 있어서, 다음 중 하나 이상을 추가로 포함하는 라이브러리:
    d) 짧은 나선형 모티프를 함유하는 서열;
    e) 무질서한 모티프를 함유하는 서열;
    f) 관심 있는 단백질에 서열을 연결하는 불변 서열.
  35. 제32항 내지 제34항 중 어느 한 항에 있어서, 집합체(collection)의 각 펩티드 바코드가 바인더 세트 내의 특정 폴리펩티드 바인더 그룹에 특이적으로 결합하는 라이브러리.
  36. 제32항 내지 제34항 중 어느 한 항에 있어서, 집합체의 각 펩티드 바코드가 바인더 세트 내의 하나 이상의 폴리펩티드 바인더에 특이적으로 결합하는 라이브러리.
  37. 뉴클레오티드 서열이 폴리펩티드 바인더 모이어티를 암호화하는 서열이거나 이를 포함하는 핵산으로서,
    a) 폴리펩티드 바인더 모이어티가 10 내지 400개 아미노산 범위 내의 길이이고;
    b) 폴리펩티드 바인더 모이어티가 바코드 집합체 내의 특정 펩티드 바코드 그룹에 특이적으로 결합하는 것으로 확인된 것을 특징으로 하는 핵산.
  38. 제37항에 있어서, 폴리펩티드 바인더 모이어티가 서열번호 4200-5346으로 이루어진 군으로부터 선택되는 아미노산 서열을 갖는 핵산.
  39. 제37항에 있어서, 암호화 서열이 서열번호 1-1147로 이루어진 군으로부터 선택되는 핵산.
  40. 제37항 내지 제39항 중 어느 한 항의 핵산을 복수로 포함하는 라이브러리로서, 복수의 핵산이 함께 폴리펩티드 바인더 모이어티 세트를 암호화하며, 각 핵산은 5'에서 3' 또는 3'에서 5'의 순서로 다음을 포함하는 라이브러리:
    a) 제1 불변 서열(예를 들어, 항체 생식계열 서열(antibody germline sequence)(예를 들어, IGHV/IGKV));
    b) 적어도 10개 뉴클레오티드 길이인 제1 변이체 서열(예를 들어, CDR(예를 들어, CDR3) 서열); 및
    c) 제2 불변 서열(예를 들어, 항체 생식계열 서열(예를 들어, IDHJ/IGKJ)).
  41. 제40항에 있어서, 각 핵산이 다음 중 하나 이상을 추가로 포함하는 라이브러리:
    d) 정지 코돈(예를 들어, 제2 불변 서열 뒤);
    e) 링커 서열;
    f) 제3 불변 서열(예를 들어, 항체 생식계열 서열(예를 들어, IGHV/IGKV));
    g) 적어도 10개 뉴클레오티드 길이인 제2 변이체 서열(예를 들어, CDR(예를 들어, CDR3) 서열); 및
    h) 제4 불변 서열(예를 들어, 항체 생식계열 서열(예를 들어, IDHJ/IGKJ)).
  42. 파지 입자 라이브러리로서, 각 파지 입자가 제37항의 핵산을 하나 이상 포함하는 라이브러리.
  43. 제42항에 있어서, 파지가 M13, T4, T7, 람다 및 사상 파지로 이루어진 군으로부터 선택되는 라이브러리.
  44. 제42항에 있어서, 파지가 M13인 라이브러리.
  45. 바코드와 바인더 세트로서,
    a) 각 바코드가 세트 내 바인더 중 특정 바인더 그룹에 특이적으로 결합하는 1 내지 100개, 5 내지 50개, 8 내지 25개, 9 내지 25개 또는 9 내지 15개 아미노산 길이의 펩티드이고;
    b) 각 바인더가 세트 내 바코드 중 적어도 하나의 바코드에 특이적으로 결합하는 폴리펩티드인 세트.
  46. 제45항에 있어서, 바인더가 바코드와 접촉된 파지에서 발현될 때 특이적 결합이 관찰되는 세트.
  47. 제45항에 있어서, 각 바인더가 파지에서 발현되는 세트.
  48. 제45항 내지 제47항 중 어느 한 항에 있어서, 적어도 하나의 바코드가 관심 있는 폴리펩티드와 연결된 세트.
  49. 제45항 내지 제48항 중 어느 한 항에 있어서, 바코드가 하나 이상의 아미노산이거나 이를 포함하는 세트.
  50. 제45항 내지 제49항 중 어느 한 항에 있어서, 바코드는 서로 직교하는 세트.
  51. 제45항 내지 제50항 중 어느 한 항에 있어서, 바코드가 합성 바코드인 세트.
  52. 제45항 내지 제51항 중 어느 한 항에 있어서, 바코드가 1-100개, 5-50개, 8-25개, 9-25개 또는 9-15개 아미노산 길이인 세트.
  53. 제45항 내지 제52항 중 어느 한 항에 있어서, 바코드가 10개 아미노산 길이인 세트.
  54. 제45항 내지 제53항 중 어느 한 항에 있어서, 바코드가 단백질 기능에 비교적 영향을 미치지 않는 세트.
  55. 제45항 내지 제54항 중 어느 한 항에 있어서, 바코드가 면역 반응을 유발하지 않는 세트.
  56. 제47항에 있어서, 파지가 M13, T4, T7, 람다 및 사상 파지로 이루어진 군으로부터 선택되는 세트.
  57. 제56항에 있어서, 파지가 M13인 세트.
  58. 다음을 포함하는 키트:
    a) 바인더 세트로서, 각 바인더가 집합체 바코드의 적어도 특정 펩티드 바코드에 특이적으로 결합하는 폴리펩티드이고, 각 바인더는 폴리펩티드, 폴리펩티드를 암호화하는 핵산 또는 둘 다로서 제공되는 바인더 세트.
  59. 제58항에 있어서, 하나 이상의 바인더가 바인더를 발현하도록 조작된 파지 입자 또는 이의 집합체로서 제공되는 키트.
  60. 제58항에 있어서, 하나 이상의 바인더가 파지미드 벡터(phagemid vector)의 핵산으로서 또는 파지 벡터(phage vector)로의 클로닝에 적합한 삽입물로서 제공되는 키트.
  61. 제58항 내지 제60항 중 어느 한 항에 있어서, 각 바인더에 대한 펩티드 바코드를 지정하는 정보를 추가로 포함하고, 각 바인더는 각 바코드가 세트 내 바인더 중 적어도 하나에 특이적으로 결합하는 바코드 집합체 내의 적어도 특정 펩티드 바코드에 특이적으로 결합하는 것으로 확인된 것인 키트.
  62. 제58항 내지 제61항 중 어느 한 항에 있어서, 하나 이상의 바코드에 결합된 하나 이상의 파지 입자의 시퀀싱을 수행하기 위한 지시사항 세트를 추가로 포함하는 키트.
  63. 제62항에 있어서, 시퀀싱 데이터를 해독하기 위한 컴퓨터 판독 가능 프로그램을 추가로 포함하는 키트.
  64. 제58항 내지 제63항 중 어느 한 항에 있어서, 파지 입자에 바인더를 발현시키기 위한 시약을 추가로 포함하는 키트.
  65. 제58항 내지 제64항 중 어느 한 항에 있어서, 하나 이상의 바코드를 암호화하는 핵산을 포함하는 키트.
  66. 제58항 내지 제65항 중 어느 한 항에 있어서, 하나 이상의 바인더를 암호화하는 핵산을 포함하는 키트.
  67. 제1항에 있어서,
    a) 바코드가 표시된 단백질 집단을 동물에게 주입하는 단계; 및
    b) 평가 대상 동물로부터 샘플을 얻는 단계를 추가로 포함하는 방법.
  68. 제67항에 있어서, 분리 단계가 샘플로부터 하나 이상의 바코드가 표시된 단백질을 정제하는 단계를 포함하는 방법.
  69. 제67항 또는 제68항에 있어서, 바코드가 표시된 단백질이 복합 샘플로부터 정제되는 방법.
  70. 제69항에 있어서, 복합 샘플이 조직인 방법.
  71. 제70항에 있어서, 복합 샘플이 혈액인 방법.
  72. 제68항 내지 제71항 중 어느 한 항에 있어서, 바코드가 표시된 단백질이 친화도 정제 방법(예를 들어, FLAG IP, 단백질 G/A) 또는 단백질 침전 방법을 사용하여 정제되는 방법.
  73. 제67항에 있어서, 바인더 세트의 각 바인더가 파지에서 발현되는 방법.
  74. 제73항에 있어서, 확인 단계가 다음 단계를 포함하는 방법:
    a) 결합된 파지 입자의 핵산을 증폭시키는 단계;
    b) 증폭된 핵산의 뉴클레오티드 서열을 확인하는 단계로서, 확인된 뉴클레오티드 서열 중 하나 이상은 바인더의 코딩 서열에 상응하는 단계;
    c) 바인더의 코딩 서열 중 확인된 서열(들)을 사용하여 바코드가 표시된 단백질 집단으로부터 하나 이상의 단백질을 검출하는 단계; 및
    f) 하나 이상의 바코드가 표시된 단백질을 질병, 장애 또는 병태를 치료하기 위한 치료제 또는 표적으로서 식별하는 단계.
  75. 제1항에 있어서,
    a) 바코드가 표시된 단백질 집단을 동물에게 주입하는 단계로서, 각 바코드는 파지에서 발현된 특이적 바인더에 결합되는 단계; 및
    b) 평가 대상 동물로부터 샘플을 얻는 단계를 추가로 포함하는 방법.
  76. 제75항에 있어서,
    c) 샘플에 존재하는 각 바인더의 상대량을 확인하여 샘플에 존재하는 주입된 바코드가 표시된 단백질 집단의 하위세트를 식별하는 단계;
    d) 상대량을 샘플에 존재하는 각 바인더의 절대량을 확인하기 위해 알려진 농도의 표준과 비교하는 단계;
    e) 선택적으로, 식별된 단백질 하위세트를 사용하여 단계 a)-c)를 반복하는 단계; 및
    f) 하나 이상의 단백질을 질병, 장애 또는 병태를 치료하기 위한 치료제 또는 표적으로서 식별하는 단계를 포함하는 방법.
  77. 다음 단계를 포함하는 약동학적 스크리닝(pharmacokinetic screening) 방법:
    a) 바코드가 표시된 치료 후보 단백질 세트를 동물에게 주입하는 단계로서, 각 치료 후보 단백질은 특정 펩티드 바코드를 포함하는 단계;
    b) 동물로부터 샘플을 얻는 단계;
    c) 샘플로부터 하나 이상의 바코드가 표시된 치료 후보 단백질을 정제하는 단계;
    d) 샘플의 각 바코드에 특이적인 적어도 하나의 특정 바인더를 포함하는 바인더 세트(예를 들어, 바인더가 발현되어 있는 결합제(binding agent))와 샘플을 접촉시키는 단계; 및
    e) 바코드가 표시된 각 치료 후보 단백질의 약동학적 특성, 생체분포, 반감기, 조직 매개 약물 배치(tissue-mediated drug disposition, TMDD) 또는 생체 내 안정성을 확인하기 위해 샘플에 존재하는 각 바인더의 상대량을 (예를 들어, 동시에) 확인하는 단계.
  78. 제77항에 있어서, 다수의 샘플을 동물로부터 얻는 방법.
  79. 제77항에 있어서, 동물이 질병, 장애 또는 병태에 대한 모델인 방법.
  80. 제79항에 있어서, 질병, 장애 또는 병태가 암, 자가면역, 신경퇴행성 또는 병원성(예를 들어, 바이러스/세균) 질병, 장애 또는 병태인 방법.
  81. 제77항 내지 제80항 중 어느 한 항에 있어서, 정제된 단백질이 동물에 주입된 바코드가 표시된 치료 후보 단백질의 하위세트인 방법.
  82. 제77항 내지 제81항 중 어느 한 항에 있어서, 샘플이 혈액, 조직, 종양인 방법.
  83. 제77항 내지 제82항 중 어느 한 항에 있어서, 샘플이 대조군인 방법.
  84. 제77항 내지 제83항 중 어느 한 항에 있어서, 확인 단계가 (ⅰ) 바인더를 발현하는 결합제로부터 핵산을 시퀀싱하는 단계; (ⅱ) 존재하는 각 바코드의 상대량을 해독하여 각 치료 후보 단백질의 상대량을 확인하는 단계; 및/또는 (ⅲ) FACS 또는 MACS(자기 활성화 세포 분류(magnetic activated cell sorting)) 중 하나 이상, 친화도 기반 정제를 수행하는 단계를 포함하는 방법.
  85. 제75항 내지 제84항 중 어느 한 항에 있어서, 바코드가 아미노산이거나 이를 포함하는 방법.
  86. 제75항 내지 제85항 중 어느 한 항에 있어서, 바코드가 합성 바코드인 방법.
  87. 제75항 내지 제86항 중 어느 한 항에 있어서, 바코드가 1-100개, 5-50개, 8-25개, 9-25개, 9-15개 또는 10개 아미노산 길이인 방법.
  88. 제75항 내지 제87항 중 어느 한 항에 있어서, 바코드가 단백질 기능에 비교적 영향을 미치지 않는 방법.
  89. 제75항 내지 제88항 중 어느 한 항에 있어서, 바코드가 면역 반응을 유발하지 않는 방법.
  90. 제75항 내지 제89항 중 어느 한 항에 있어서, 바코드가 서로 직교하는 방법.
  91. 제75항 내지 제90항 중 어느 한 항에 있어서, 바인더가 파지 입자의 표면에서 발현되는 방법.
  92. 제77항 내지 제91항 중 어느 한 항에 있어서, 임의의 회합되지 않은(예를 들어, 결합되지 않은) 바인더를 제거하는 단계를 포함하는 방법.
  93. 제92항에 있어서, 제거가 세척에 의해 수행되는 방법.
  94. 제75항 내지 제93항 중 어느 한 항에 있어서, 확인 단계가 증폭, 전파 및 시퀀싱(예를 들어, 핵산(예를 들어, DNA, RNA) 증폭, 전파 및/또는 시퀀싱) 중 하나 이상을 수행하는 단계를 포함하는 방법.
  95. 제94항에 있어서, 증폭이 PCR, LAMP 또는 RCA를 사용하여 수행되는 방법.
  96. 제94항에 있어서, 시퀀싱이 Illumina, NGS, 나노포어 시퀀싱 또는 Pac Bio 롱 리드 시퀀싱을 사용하여 수행되는 방법.
  97. 제75항 내지 제96항 중 어느 한 항에 있어서, 확인 단계가 바코드가 표시된 단백질에 결합하는 바인더의 개수를 정량화하는 단계를 포함하고, 정량화는 바코드가 표시된 단백질에 결합하는 각 바인더의 뉴클레오티드 서열을 해독함으로써 수행되는 방법.
  98. 제97항에 있어서, 뉴클레오티드 서열의 개수가 바코드가 표시된 단백질 집단 내 표적 단백질의 척도를 제공하는 방법.
  99. 제91항 내지 제98항 중 어느 한 항에 있어서, 파지가 M13, T4, T7, 람다 및 사상 파지로 이루어진 군으로부터 선택되는 방법.
  100. 제99항에 있어서, 파지가 M13인 방법.
  101. 제75항 내지 제100항 중 어느 한 항에 있어서, 주입 단계가 바코드가 표시된 단백질을 경구 또는 정맥 내 투여하는 단계를 포함하는 방법.
  102. 제75항 내지 제101항 중 어느 한 항에 있어서, 바코드가 표시된 단백질이 바이러스 전달 또는 mRNA 전달에 의해 주입(예를 들어, 전달)되는 방법.
  103. 제75항 내지 제102항 중 어느 한 항에 있어서, 동물이 포유동물인 방법.
  104. 제75항 내지 제103항 중 어느 한 항에 있어서, 동물이 인간인 방법.
  105. 제75항 내지 제104항 중 어느 한 항에 있어서, 동물이 바코드가 표시된 단백질을 발현하도록 유전적으로 변형되는 방법.
  106. 펩티드 바코드 집합체를 특성화하는 방법으로서, 다음 단계를 포함하는 방법:
    a) 다음을 제공하는 단계:
    (ⅰ) 파지 입자 라이브러리로서, 각 파지 입자는 폴리펩티드 바인더를 발현하도록 설계되고, 각 바인더는 하나 이상의 펩티드 바코드에 결합하는 파지 입자 라이브러리;
    (ⅱ) 펩티드 바코드 집합체;
    b) 각 파지 입자를 각 바코드와 접촉시켜 결합된 파지-바코드 입자를 형성하는 단계;
    c) 각 파지 입자와 바코드 사이의 결합량을 확인하는 단계; 및
    d) 집합체의 바코드와 라이브러리의 파지 중에서 서로 특이적으로 결합하는 파지-바코드 쌍을 식별하는 단계.
  107. 펩티드 바코드 집합체를 특성화하는 방법으로서, 다음 단계를 포함하는 방법:
    a) 다음을 제공하는 단계:
    (ⅰ) 바인더 세트로서, 각 바인더는 하나 이상의 펩티드 바코드에 결합하는 폴리펩티드인 바인더 세트;
    (ⅱ) 펩티드 바코드 집합체;
    b) 각 바인더를 각 바코드와 접촉시켜 결합된 바인더-바코드 입자를 형성하는 단계;
    c) 각 폴리펩티드 바인더와 펩티드 바코드 사이의 상대적 결합량을 확인하는 단계; 및
    d) 집합체의 바코드와 세트의 바인더 중에서 서로 특이적으로 결합하는 바인더-바코드 쌍을 식별하는 단계.
  108. 컴퓨터 판독 가능 형식으로 구현된, 펩티드 바코드 집합체에 대한 아미노산 또는 암호화 핵산 서열의 데이터베이스로서, 각 바코드 서열은:
    a) 1 내지 100개, 5 내지 50개, 8 내지 25개, 9 내지 25개 또는 9 내지 15개 아미노산 범위 내의 길이이고;
    b) 집합체의 바코드 중 하나 이상에 각각 특이적으로 결합하는 바인더 세트 내의 하나 이상의 폴리펩티드 바인더에 특이적으로 결합하는 것으로 확인된 것인 데이터베이스.
  109. 제108항에 있어서, 펩티드 바코드를 식별하기 위해 바코드에 대한 하나 이상의 폴리펩티드 바인더의 결합 패턴을 사용하는 데이터베이스.
  110. 컴퓨터 판독 가능 형식으로 구현된, 폴리펩티드 바인더 세트에 대한 아미노산 또는 암호화 핵산 서열의 데이터베이스로서, 각 바인더 서열은:
    a) 10 내지 400개 아미노산 범위 내의 길이이고;
    b) 각각이 세트의 하나 이상의 바인더에 특이적으로 결합하는 바코드 집합체 내의 하나 이상의 펩티드 바코드에 특이적으로 결합하는 것으로 확인된 것인 데이터베이스.
  111. 컴퓨터 판독 가능 형식으로 구현된, 바코드-바인더 회합 세트에 대한 아미노산 또는 암호화 핵산 서열의 데이터베이스로서,
    a) 각 바코드가 1 내지 100개, 5 내지 50개, 8 내지 25개, 9 내지 25개 또는 9 내지 15개 아미노산 길이의 펩티드이고;
    b) 각 바인더가 세트의 바코드 중 하나 이상의 바코드에 특이적으로 결합하는 폴리펩티드인 데이터베이스.
  112. 컴퓨터 판독 가능 형식으로 구현된 바코드-바인더 회합 지정 세트로서,
    a) 각 바코드가 1 내지 100개, 5 내지 50개, 8 내지 25개, 9 내지 25개 또는 9 내지 15개 아미노산 길이의 펩티드이고;
    b) 각 바인더가 세트의 바코드 중 하나 이상의 바코드에 특이적으로 결합하는 폴리펩티드인 데이터베이스.
  113. 제112항에 있어서, 바인더가 파지 입자에서 발현된 다음 바코드와 접촉될 때 특이적 결합이 관찰되는 세트.
  114. 다음 단계를 포함하는 프로세스에 의한 평가를 만족시키는 것으로 확인된 치료 단백질을 투여하는 단계를 포함하는 치료 방법:
    a) 바코드가 표시된 단백질 집단을 평가하는 단계;
    b) 평가를 만족시키는 집단 구성원과 그렇지 않은 집단의 구성원을 분리하여 양성 집단, 음성 집단 또는 둘 다를 식별하는 단계;
    c) 양성 집단, 음성 집단 또는 서로 별도로 각 집단을 집단의 각 바코드에 특이적인 적어도 하나의 특정 바인더를 포함하는 바인더 세트와 접촉시키는 단계;
    d) 어떤 바인더가 분리된 구성원에 결합하는지 확인하여 어떤 바코드가 표시된 단백질이 접촉된 집단(들)에 존재하는지 확인하는 단계; 및
    e) 접촉된 집단(들)에 존재하는 것으로 확인된 바코드가 표시된 단백질로부터 치료 단백질을 식별하는 단계.
  115. 다음 단계를 포함하는 프로세스에 의한 평가를 만족시키는 것으로 확인된 치료 단백질을 투여하는 단계를 포함하는 치료 방법:
    a) 바인더 세트를 바코드가 표시된 단백질의 제1 집단 또는 제2 집단과 접촉시키거나 별도로 제1 집단 및 제2 집단 각각과 접촉시키는 단계로서,
    ⅰ) 각 바인더는 다른 바코드에 비해 하나의 바코드에 특이적으로 결합하고;
    ⅱ) 바인더 세트는 집합적으로 제1 집단 및 제2 집단의 바코드 각각에 대해 특이적인 바인더를 포함하며,
    제1 집단과 제2 집단은 평가 성과에 기초하여 서로 분리되는 것인 단계;
    b) 세트의 어떤 바인더가 제1 집단, 제2 집단 또는 둘 다의 구성원에 결합하는지 확인하여 어떤 바코드가 표시된 단백질이 접촉된 집단(들)에 존재하는지 확인하는 단계; 및
    c) 접촉된 집단(들)에 존재하는 것으로 확인된 바코드가 표시된 단백질로부터 치료 단백질을 식별하는 단계.
KR1020247018426A 2021-11-03 2022-11-02 단백질 검출 방법 및 단백질 검출용 조성물 KR20240099405A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163275172P 2021-11-03 2021-11-03
US17/518,221 2021-11-03
US17/518,221 US11976384B2 (en) 2021-11-03 2021-11-03 Methods and compositions for protein detection
US63/275,172 2021-11-03
PCT/US2022/079134 WO2023081695A1 (en) 2021-11-03 2022-11-02 Methods and compositions for protein detection

Publications (1)

Publication Number Publication Date
KR20240099405A true KR20240099405A (ko) 2024-06-28

Family

ID=84799735

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247018426A KR20240099405A (ko) 2021-11-03 2022-11-02 단백질 검출 방법 및 단백질 검출용 조성물

Country Status (5)

Country Link
KR (1) KR20240099405A (ko)
AU (1) AU2022380720A1 (ko)
CA (1) CA3236602A1 (ko)
IL (1) IL312450A (ko)
WO (1) WO2023081695A1 (ko)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100216659A1 (en) * 2007-06-15 2010-08-26 The Scipps Research Institute Methods and compositions for indentifying binding partners from libraries of biomolecules
WO2013143026A1 (en) * 2012-03-31 2013-10-03 Abmart (Shanghai) Co., Ltd Peptide and antibody libraries and uses thereof
WO2020097254A1 (en) * 2018-11-06 2020-05-14 Gordian Biotechnology, Inc. Compositions and methods for in vivo screening of therapeutics

Also Published As

Publication number Publication date
CA3236602A1 (en) 2023-05-11
WO2023081695A1 (en) 2023-05-11
AU2022380720A1 (en) 2024-05-23
IL312450A (en) 2024-06-01

Similar Documents

Publication Publication Date Title
US11447891B2 (en) Compositions and methods for rapid production of versatile nanobody repertoires
CZ20013399A3 (cs) Způsob izolace proteinů a analýzy proteinů, zejména hmotnostní analýzou
CN107430130B (zh) 方法
US10759834B2 (en) Methods and compositions involving protein G variants
US20100004134A1 (en) Combinatorial libraries of conformationally constrained polypeptide sequences
US20190002558A1 (en) Compositions and methods for the identification and isolation of cell-membrane protein specific binding moieties
Stern et al. Cellular-based selections aid yeast-display discovery of genuine cell-binding ligands: targeting oncology vascular biomarker CD276
WO2017191252A1 (en) Targeted compounds for the site-specific coupling of chemical moieties comprising a peptide linker
Kruziki et al. Constrained combinatorial libraries of Gp2 proteins enhance discovery of PD-L1 binders
US20230176070A1 (en) Compositions and methods for identifying nanobodies and nanobody affinities
US11169157B2 (en) Methods for stable complex formation and related kits
KR20240099405A (ko) 단백질 검출 방법 및 단백질 검출용 조성물
US12037706B2 (en) Methods and compositions for protein detection
WO2022148491A1 (zh) 一种可组装蛋白原件及其用途
US20230220589A1 (en) Polypeptide terminal binders and uses thereof
US11976384B2 (en) Methods and compositions for protein detection
US20230056532A1 (en) Methods for information transfer and related kits
US20220214350A1 (en) Methods for stable complex formation and related kits
CN116390945A (zh) 无细胞抗体工程化平台和针对SARS-CoV-2的中和抗体
JP6665274B2 (ja) 標的分子に結合するポリペプチドの決定方法及び決定システム
Arras et al. Bovine ultralong CDR-H3 derived knob paratopes elicit potent TNF-α neutralization and enable the generation of novel adalimumab-based antibody architectures with augmented features
WO2021141924A1 (en) Methods for stable complex formation and related kits
KR20230128290A (ko) 가변 중쇄 전용 라이브러리, 이의 제조 방법, 및 이의용도
Alsultan Beyond antibodies: development of a novel molecular scaffold based on human chaperonin 10