KR20230163541A - 신속한, 자동화된 이미지 기반 바이러스 플라크 및 효능 검정법 - Google Patents

신속한, 자동화된 이미지 기반 바이러스 플라크 및 효능 검정법 Download PDF

Info

Publication number
KR20230163541A
KR20230163541A KR1020237037453A KR20237037453A KR20230163541A KR 20230163541 A KR20230163541 A KR 20230163541A KR 1020237037453 A KR1020237037453 A KR 1020237037453A KR 20237037453 A KR20237037453 A KR 20237037453A KR 20230163541 A KR20230163541 A KR 20230163541A
Authority
KR
South Korea
Prior art keywords
images
virus
cell culture
viral
machine learning
Prior art date
Application number
KR1020237037453A
Other languages
English (en)
Inventor
마이클 더블유 올스조위
오스카 워너 라이프
요한 트리그
리처드 웨일스
리카드 쇼그렌
크리스토퍼 에들룬드
Original Assignee
싸토리우스 바이오애널리티컬 인스트루먼츠, 아이엔씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US17/218,439 external-priority patent/US20220318668A1/en
Priority claimed from EP21166201.0A external-priority patent/EP4068152A1/en
Application filed by 싸토리우스 바이오애널리티컬 인스트루먼츠, 아이엔씨 filed Critical 싸토리우스 바이오애널리티컬 인스트루먼츠, 아이엔씨
Publication of KR20230163541A publication Critical patent/KR20230163541A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume, or surface-area of porous materials
    • G01N15/06Investigating concentration of particle suspensions
    • G01N15/1433
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume, or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Electro-optical investigation, e.g. flow cytometers
    • G01N15/1456Electro-optical investigation, e.g. flow cytometers without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals
    • G01N15/1463Electro-optical investigation, e.g. flow cytometers without spatial resolution of the texture or inner structure of the particle, e.g. processing of pulse signals using image analysis for extracting features of the particle
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G01N15/01
    • G01N15/075
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume, or surface-area of porous materials
    • G01N15/06Investigating concentration of particle suspensions
    • G01N2015/0675Comparing suspension before/after dilution
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume, or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N2015/1006Investigating individual particles for cytology
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume, or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Electro-optical investigation, e.g. flow cytometers
    • G01N2015/1486Counting the particles

Abstract

바이러스 개체군을 포함하는 세포 배양의 이미지 또는 이미지들의 시퀀스로부터 바이러스 역가를 예측하기 위해 기계 학습 모델을 훈련하기 위한 방법이 설명된다. 훈련된 기계 학습 모델은 바이러스 역가의 예측이 표준 바이러스 플라크 검정에서 보다 훨씬 더 빨리, 예를 들어, 바이러스 샘플로 세포 배양물의 초기 주입 후 6 또는 8시간 내에 이루어질 수 있게 한다. 상기 방법은: (1) 시작 시간 t0으로부터 최종 시간 t최종까지의 하나 이상의 시점에서 다수의 실험으로부터 바이러스 처리된 세포 배양물의 이미지의 다수의 세트의 형태로 훈련 세트를 획득하는 단계, (2) 각각의 실험에 대해, 최종 시간 t최종에서 바이러스 처리된 세포 배양물의 적어도 하나의 수치적 바이러스 역가 판독을 레코딩하는 단계, (3) 각각의 이미지의 수치적 표현을 획득하기 위해 훈련 세트 내의 모든 이미지를 처리하는 단계, 및 (4) 훈련 세트 수치적 표현에 기초하여 최종 바이러스 역가의 예측을 행하도록 하나 이상의 기계 학습 모델을 훈련하는 단계를 포함한다.

Description

신속한, 자동화된 이미지 기반 바이러스 플라크 및 효능 검정법
관련 출원에 대한 상호 참조
본 출원은 2021년 3월 31일에 출원된 미국 특허 출원 제17/218,439호 및 2021년 3월 31일에 출원된 EP 특허 출원 번호 21166201.0에 대한 우선권을 주장하며, 각각의 내용은 본원에 그 전문이 참고로 통합된다.
본 개시는 세포-기반, 기능적 바이러스 계수 검정법(cell-based, functional virus counting assays)을 수행하기 위한 방법 및 시스템에 관한 것으로, 보다 상세하게는 이러한 검정법이 평소보다 훨씬 적은 시간 내에 완료되게 하기 위한 방법 및 시스템에 관한 것이다.
활성 바이러스와 같은 바이러스의 기능은 현재 다양한 방식으로 측정된다. 가장 널리 사용되는 방법은 1953년에 처음 기재된 표준 플라크 검정법이다. 검정법은 표적 세포의 감염 및 용해를 통해 바이러스 기능을 측정한다. 검정법은 샘플 내의 기능성 바이러스, 또는 플라크 형성 단위의 수를 나타내는 플라크 역가(titer)(농도)를 산출한다. 기본적인 방법은 도 1과 같다. 먼저, 세포를 처음에 플레이팅(plate)하고 융합(confluence)할 때까지 성장시킨다. 그런 다음, 미지의 농도(역가)의 바이러스 샘플을 연속 희석하고, 세포를 함유하는 플레이트(종종 페트리(petri)-유형 접시 또는 플레이트의 형태)에 첨가한다. 다음으로, 2 내지 14일 후에 세포 단층(monolayer)을 염색하여 용해 부위(플라크)를 노출시킨다. 마지막으로, 플라크의 수를 희석에 맞게 조정하여 원래 샘플의 바이러스 역가를 결정한다.
50% 조직 배양 감염 용량(tissue culture infective dose)(TCID50)과 같은 다른 기능 검정법은 플라크 검정법의 유도체이다. 모두 기능적 감염성을 측정하는 데 사용되는 바이러스 및 세포에 따라 2 내지 12+ 플러스 일(day)의 배양 기간, 세포에 붙은 바이러스를 포함한다.
표 1에 표시된 바와 같이 다양한 바이러스에 대한 전체 바이러스 입자, 기능성 및 비기능성, 플라크 형성 단위(PFU)의 비율에는 큰 차이가 있다. 감염성 역가 또는 감염성 입자 수 및 전체 입자 수는 전체 바이러스 특성화에 필수적이다. 입자 대 PFU 비율은 자릿수(order of magnitude)에 걸쳐 달라질 수 있다.
Figure pct00001
따라서, 백신 개발 및 제조와 같은 상업적 적용 뿐만 아니라 유전자 요법에서의 안전성을 위해, 바이러스 샘플 내의 총 바이러스 입자 수 뿐만 아니라 플라크 검정을 통해, 기능적 바이러스 역가 둘 모두를 이해하는 것이 매우 중요해졌다.
총 입자 수에 대한 요구를 해결하기 위해, Sartorius' Virus Counter® 제품, 전자 현미경 및 다수의 간접 방법에서 구현되는 것과 같은 보다 현대의 기술이 총 입자 수를 제공하기 위해 개발되었다. 이러한 기술들 중 일부에 대해, 이러한 계수들은 30분만큼 적게 측정될 수 있다. 불행히도 지금까지 도 1의 기존 바이러스 플라크 검정에 대한 신속한 대용이 없다. 총 입자 및 감염성 입자 수 둘 모두를 동시에 또는 거의 동시에 갖는 것이 매우 바람직하다. 본 개시는 플라크 검정 역가, 및 차례로 감염성 입자 수를 일수(days)가 아닌 시간 단위로 제공하는 신속하고 자동화된 이미지 기반 바이러스 플라크 및 효능 검정법을 제공한다. 따라서, 본 개시는 이제 본질적으로 동시에 총 입자 및 감염성 입자 수를 획득하는 것을 가능하게 한다.
일 양태에서, 바이러스 개체군(population)을 함유하는 세포 배양의 이미지 또는 이미지 시퀀스로부터 바이러스 역가(virus titer)를 예측하기 위해 기계 학습 모델을 훈련시키는 방법이 본 명세서에 설명된다. 본 문서에서 용어 "기계 학습 모델"은 원하는 입력-출력 쌍의 이전 예를 기반으로 태스크를 학습하고 수행하기 위해 최적화 알고리즘을 사용하는 계산 시스템을 의미한다. 훈련된 기계 학습 모델을 사용하면 표준 바이러스 플라크 검정보다 훨씬 더 일찍, 예를 들어, 선행 기술에서는 며칠에 비교하여 바이러스 샘플로 세포 배양물을 처음 주입(inoculation)한 후 6 또는 8시간(또는 그 이하) 내에 바이러스 역가를 예측할 수 있다. 기계 학습 모델을 훈련시키는 방법은, (1) 시작 시간 t0으로부터 최종 시간 t최종까지의 하나 이상의 시점에서 복수의 실험으로부터 바이러스 처리된 세포 배양물의 복수의 이미지의 형태로 훈련 세트를 획득하는 단계, (2) 각각의 실험에 대해, 시간 t최종에서 바이러스 처리된 세포 배양물의 적어도 하나의 수치적 바이러스 역가 판독 (이하, "실측값(ground truth)")을 레코딩하는 단계(recording), (3) 각각의 이미지의 수치적 표현을 취득하기 위해 훈련 세트 내의 이미지를 처리하는 단계, 및 (4) 훈련 세트 수치적 표현에 대한 최종 바이러스 역가의 예측을 수행하기 위해 하나 이상의 기계 학습 모델을 훈련시키는 단계를 포함할 수 있다.
미지의 역가의 바이러스 샘플이 추가된 세포 배양물의 바이러스 역가를 예측하는 방법으로서 훈련된 하나 이상의 기계 학습 모델의 적용이 또한 본 명세서에 설명된다. 이 "적용" 단계에서, 방법은 a) 세포 배양물의 이미지의 시간 시퀀스를 획득하는 단계, b) 단계 a)에서 획득된 이미지의 시간 시퀀스의 수치적 표현을 이전 단락에 따라 훈련된 하나 이상의 기계 학습 모델에 공급하는 단계, 및 c) 바이러스 역가의 하나 이상의 훈련된 기계 학습 모델로 예측을 하는 단계를 포함할 수 있다.
다른 양태에서, 세포 배양물 및 바이러스 샘플을 함유하는 하나 이상의 플레이트(plate)를 보유하도록 구성된 분석 기구(analytical instrument)가 제공된다. 기구는 통합된 이미징 시스템을 포함한다. 기구는 이미징 시스템에 의해 획득된 세포 배양물의 이미지들의 시간 시퀀스 내의 하나 이상의 이미지들로부터 세포 배양물 내의 바이러스 역가의 예측을 행하도록 훈련된 기계 학습 모델로 구성되며, 예측은 세포 배양물의 바이러스 감염이 만기(term)로 진행되기 전에 행해진다. 예를 들어, 예로써, 수일(days) 대신에 바이러스 감염의 개시 후 4, 6, 10 또는 15시간에 예측이 행해질 수 있다.
하나의 추가 양태에서, 이 검정 기구는, 기구의 사용자가 바이러스 역가 예측을 행하기 위해 새로운 훈련된 기계 학습 모델을 생성하기 위한 훈련 절차를 수행할 수 있게 하는 훈련 모듈을 실행하는 처리 유닛(processing unit)이 추가로 구성될 수 있다. 이 훈련 모듈은 기구의 사용자가 기구로 훈련 방법을 수행하는 것을 가능하게 하기 위한 셋업(set-up) 명령을 제공한다. 이 훈련 방법은 (1) 시작 시간t0로부터 최종 시간 t최종까지의 시점들의 세트에서 복수의 실험들로부터 바이러스 처리된 세포 배양물들의 복수의 이미지들의 형태로 훈련 세트를 획득하는 단계, (2) 각각의 실험에 대해, 시간 t최종에서 바이러스 처리된 세포 배양물의 적어도 하나의 수치적 바이러스 역가 판독을 레코딩하는 단계, (3) 각각의 이미지의 수치적 표현을 취득하기 위해 훈련 세트 내의 전체 이미지들을 처리하는 단계, 및 (4) 훈련 세트 내의 수치적 표현들에 기초한 최종 바이러스 역가의 예측을 행하도록 하나 이상의 기계 학습 모델들을 훈련하는 단계를 포함할 수 있고, 훈련은 최종 바이러스 역가의 모델 예측과 실측값(ground truth) 사이의 오차를 최소화하는 것을 포함한다.
모델 훈련에서 처리 단계(3)를 위해 여러 상이한 방법들이 사용될 수 있으며, 일 실시예에서, 처리 단계(3)는 이미지들을 컨볼루션 신경망(CNN)을 통해 통과시켜 이미지들의 중간 데이터 표현을 취득하는 것을 수반하고, 다른 실시예에서, 처리 단계(3)는 서브 단계들 a) 내지 c)의 형태를 취한다: a) 이미지로부터 개별 세포들을 분할하는 단계(segmenting), b) 각각의 세포의 세포별 수치적 기술(numeric description)을 계산하는 단계, 및 c) 모든 세포에 걸쳐 수치적 기술들을 집계하는 단계(aggregating).
도 1은 종래 기술의 바이러스 역가 검정의 예시이다.
도 2는 초기 시간 t0에서 최종 시간 t최종사이의 이미지의 시간 시퀀스로부터 바이러스 역가를 예측하고 시간 t최종에서 바이러스 처리된 세포 배양물의 수치적 바이러스 역가 판독 이하 "실측값"을 제공하기 위해 기계 학습 모델을 훈련하는 방법의 예시이고; 도 2는 또한 하나 이상의 이미지 형태의 새로운 모델 입력에 훈련된 모델을 적용하는 것을 도시한다. 훈련된 모델은 예측된 바이러스 역가의 형태로 출력을 생성한다.
도 3은 사용자에게 모델 출력을 보고하는 한 가지 가능한 방법의 예시이다.
도 4는 본 개시의 모델 훈련 및 모델 적용 단계를 구현하는 데 사용될 수 있는 검정 기구의 하나의 가능한 예제의 예시이다.
도 5는 도 4의 검정 기구에서의 형광 이미징 시스템의 예시이다.
도 6은 단일 기계 학습 모델이 다수의 시점들로부터의 이미지들의 수치적 표현들로부터 훈련될 때의 훈련 단계를 예시하는 흐름도이다.
도 7은 별도의 기계학습 모델을 시점별로 학습시킬 때, 학습 단계를 나타낸 흐름도이다.
도 8은 훈련 단계 동안 다수의 시점들로부터의 수치적 표현들을 사용하도록 훈련된 단일 기계 학습 모델을 사용하는 모델 적용 단계를 예시하는 흐름도이다.
도 9는 훈련 단계 동안 시점 마다의 수치적 표현을 사용하도록 훈련된 단일 기계 학습 모델을 사용하는 모델 적용 단계를 도시하는 흐름도이다.
도 10은 기계학습 모델 예측과 실측값 간의 손실 또는 예측 오차가 최소화되는 모델 학습 단계를 나타내는 흐름도이다.
도 11은 모델 훈련 절차의 이미지 처리 단계(3)의 하나의 대안적인 실시예에서 수행되는 단계의 시퀀스의 예시이다.
도 12는 사용자가 기구를 사용하여 바이러스 역가 검정을 실행할 수 있게 하는 셋업 메뉴를 도시하는 도 4의 검정 기구와 연관된 워크스테이션 상의 디스플레이의 예시이다.
도 13은 시딩(seeding)부터 실험 종료까지 녹색 형광 단백질(GFP)을 발현하는 인간 아데노바이러스 5 형광 활성화가 오버레이된(overlain) 다수의 예시적인 위상차 이미지(phase contrast image)이다.
도 14는 세 가지 다른 바이러스 희석액의 측정된 형광(왼쪽 열) 및 모델 예측(오른쪽 열)의 예시적인 이미지 예시이다.
개요
본 개시는 실험 종료 시간, 또는 t최종에서, t최종보다 더 작은(또는 더 이른) 시점 t에서, 바이러스 역가 판독을 예측하는 방법을 제공한다. 어구 "실험 종료 시간(experiment end time)" 또는 t최종은 바이러스 역가 검정이 완료되는 것을 허용되거나 동등하게 만기(term)로 진행되는 시간, 즉 가시적 플라크가 형성된 시간을 말하며, 전형으로 해당 바이러스 또는 바이러스 패밀리, 바이러스가 성장할 수 있는 세포 유형 및 당업계에 알려진 다른 요인에 따라 2일 이상이다. 개시된 방법은 이러한 예측된 바이러스 역가 판독이 며칠이 아닌 일부 바이러스 역가 검정의 경우 일반적인 실험 종료 시간보다 오래 전에, 예를 들어, 6-8시간 또는 가능한 더 이른 시간에 이루어지도록 허용한다.
방법은 이러한 예측을 행하는 데 사용되는 하나 이상의 기계 학습 모델의 훈련 및 사용을 수반한다. 따라서, 본 개시는 도 2에 도시된 2개의 상이한 양태들, 즉 훈련된 기계 학습 모델(150)이 개발되는 기계 학습 모델 훈련 단계(100), 및 훈련된 기계 학습 모델(150)이 새로운 모델 입력(202)에 적용되고, 예측된 바이러스 역가의 형태의 모델 출력(204)이 훈련된 기계 학습 모델(150)에 의해 생성되는 기계 학습 모델 적용 단계(200)를 포함한다.
모델 훈련 단계(100)는 여러 단계를 포함할 수 있다. 먼저, 단계 (1)에서, 훈련 세트(102)는 복수의 이미지 세트, 전형적으로 시작 시간 t0으로부터 최종 시간 t최종까지의 하나 이상의 시점에서 복수의 실험으로부터 바이러스 처리된 세포 배양물의 현미경 이미지(104)의 형태로 획득된다. 시점 t1, t2, ...는 예를 들어, 30 또는 60분마다 주기적일 수 있다. 단계 (2)에서, 각각의 실험에 대해, 시간 t최종에서의 바이러스 처리된 세포 배양물의 적어도 하나의 수치적 바이러스 역가 판독, 이하, "실측값"(106)의 레코딩이 이루어진다. 도 2는 이러한 실측값을 이미지로 보여주지만, 이는 예를 들어 감염 또는 감염성 입자의 수, 단위 부피당 감염성 입자의 수, 또는 바이러스 역가(농도)를 나타내는 것으로 당업계에 알려진 다른 메트릭(metric)으로 표시될 수 있다. 단계 (3)에서, 훈련 세트(102) 내의 모든 현미경 이미지들의 처리가 각각의 현미경 이미지의 수치적 표현을 취득하기 위해 수행된다. 이 단계는 도 2에 도시되지 않았지만, 도 6 내지 도 11의 실시예들의 논의에 도시되며, 아래에서 상세히 설명될 것이다. 단계 (4)에서, 하나 이상의 기계 학습 모델(108)의 훈련은 훈련 세트 수치적 표현에 기초한 최종 바이러스 역가의 예측을 행하기 위해 수행된다. 훈련은 도 10에 설명되고 아래에 상세히 논의되는 바와 같이 최종 바이러스 역가의 모델 예측과 실측값(ground truth) 사이의 손실 또는 예측 오차를 최소화하는 것을 포함한다.
도 2의 모델 적용 단계(200)는 훈련된 기계 학습 모델(150)이 바이러스 역가의 예측을 행하기 위해 사용되는 곳이다. 특히, 미지의 역가의 바이러스 샘플이 첨가된 세포 배양물의 바이러스 역가를 예측하는 방법이 설명되며, 이는 a) 예를 들어, 바이러스로 세포 배양물을 주입한 후 매 30분에 세포 배양물의 현미경 이미지의 시간 시퀀스(time sequence)(202)를 획득하는 단계; b) 단계 a)에서 획득된 현미경 이미지의 시간 시퀀스의 수치적 표현을 모델 훈련 단계(100)에 따라 훈련된 하나 이상의 기계 학습 모델에 공급하는 단계; 및 c) 모델 출력(204)으로 도시된, 바이러스 역가의 하나 이상의 훈련된 기계 학습 모델로 예측을 행하는 단계를 포함할 수 있다. 모델 입력에 대한 수치적 표현 단계는 현미경 이미지들(104)의 형태로 훈련 세트(102)의 수치적 표현들을 생성하기 위해 아래에서 설명되는 것과 동일한 방법을 사용하여 수행된다. 모델 출력(204)은 도 2에 이미지로서 도시되어 있지만, 바이러스 역가(titer)(농도)를 표현하기 위해 당업계에 공지된 숫자 또는 다른 공지된 메트릭으로 표현될 수 있다.
모델 출력(204)의 예가 도 3에 도시되어 있다. 모델 출력은, 도 2의 모델 적용 과정 또는 단계 200을 수행하는 기구의 워크스테이션(24)의 디스플레이 상에 제시된, 바이러스로 세포 배양물의 초기 주입 후 여러 기간에 걸친 시간 기간의 함수로서 "계산된 역가"(또는, 동등하게는, 예측된 역가)의 플롯의 형태로 도시된다. 도 3의 이러한 특정(가설에 근거한) 예에서, 모델 출력(204)은 왼쪽의 눈금(scale) 및 6시간, 9시간, 12시간, 15시간 및 60시간에서의 예측된 바이러스 역가의 플롯을 포함하며, 오차 막대(error bar)는 각 시점에서 예측의 불확실도를 나타내며, 예컨대 6시간에서의 2,800,000 +/- 500,000 PFU(플라크 형성 단위)/mL, 9시간에서의 2,900,000 +/- 300,000 PFU/mL 등이다. 이러한 예측은 본 실시예에서 대략 6시간에서 시작하여 12시간에서 바이러스 역가의 높은 정밀도 및 15시간에서 훨씬 더 큰 정밀도로 증가하는 정밀도로 이루어질 수 있다는 것에 유의한다.
다시 도 2를 참조하면, 모델 훈련 프로세스 또는 단계(100)는 훈련된 기계 학습 모델들의 모음(suite)을 획득하기 위해 여러 번 반복될 수 있다. 이는 상이한 바이러스 또는 바이러스 패밀리가 특히 세포 용해(cell lysis) 및 감염 비율을 다르게 나타내기 때문이다. 따라서, 많은 상이한 세포 유형 및 바이러스 패밀리에 걸쳐 바이러스 역가를 정확하게 예측하는 모델을 생성하기 위해, 훈련 절차는 바이러스의 각 패밀리 및 바이러스 연구에서 일반적으로 사용되는 세포주(cell line) 각각에 대해 수행될 수 있다. 추가적으로, 아래에 설명되는 바와 같이, t0와 t최종 사이의 전체 기간에 걸쳐 생성된 이미지들의 세트로부터 훈련된 단일 기계 학습 모델보다는 상이한 시점들에서, 예를 들어, 6시간, 12시간, 15시간 등에서의 시간적으로 상이한 지점들에서 예측하는 기계 학습 모델들을 개발하는 것이 유리할 수 있다. 또한, 바이러스의 상이한 희석액에 대해 모델 훈련 과정 또는 단계(100)을 반복하는 것이 바람직할 수 있다(도 1의 왼쪽 참조).
예시적인 분석 기구
본 개시의 방법은 상이한 시점에서 첨가된 바이러스 샘플을 갖는 세포 배양물의 이미지를 획득하기 위한 메커니즘을 포함하는 임의의 적합한 기계 또는 기구에서 수행될 수 있다. 바람직하게는, 이러한 이미지는 현미경 이미지이다. 이러한 기구의 예가 도 4에 도시되고, 이하의 설명은 제한이 아닌 예시로서 제공된다. 예시된 실시예에서의 기구(400)는 양수인의 Incucyte® 살아있는 세포 이미징 시스템이다. 기구(400)는 마이크로홈(microwell) 플레이트, 세포 배양 플레이트 등을 포함하는 상이한 가능한 포맷을 갖는 살아있는 세포 또는 세포 배양물로부터 이미지를 획득하도록 적합화되고 구성된다. 기구(400)는 하우징(410)을 포함하고, 그 전체가 사용 동안에 도시되지 않은 온도 및 습도 제어 인큐베이터 내부에 배치될 수 있다. 기구(400)는 하나 이상의 보유 홈(holding well)(10)을 포함하는 세포 배양 플레이트(404)를 수용하도록 적응되며, 보유 홈 각각은 세포 배양물 및 알려지지 않은 농도의 플라크 형성 유닛의 바이러스 샘플을 수용한다. 또한, 기구(400)는 형광 및/또는 면역조직화학 시약(immunohistochemical reagent)(406)의 옵션 세트를 포함할 수 있는 시약 키트와 함께 사용하기 위해 호환가능하고, 이 중 하나 이상이 각각의 홈(10)에 첨가되어, 세포주 샘플로부터 형광 또는 면역조직화학 측정이 획득될 수 있게 한다. 시스템은 기계 학습 모델 훈련 프로세스 및/또는 적용 프로세스(도 2, 절차 또는 단계(100 및/또는 200))를 구현하고, 연구자가 샘플에 대해 수행된 바이러스 역가 실험의 결과를 볼 수 있게 하는 특징을 디스플레이하는 연관된 워크스테이션(24)을 포함한다. 도 4에서 워크스테이션의 디스플레이는 사용자가 "바이러스 플라크 검출(virus plaque detection)" 적용에 진입한 것을 도시하며, 이는 사용자가 "셋업" 메뉴(도 12 참조)를 선택하고 모델 적용 프로세스 또는 단계(도 2, 200)를 수행하는 데 필요한 파라미터 및 정보를 입력할 수 있게 하거나 또는 사용자가 모델 훈련 프로세스 또는 단계(도 2, 200)를 수행하기 위한 절차를 셋업할 수 있는 "훈련" 메뉴를 선택할 수 있게 한다.
기구(400)는 트레이(408)를 포함하고, 트레이는 시스템 밖으로 슬라이딩하고 배양 플레이트(404)가 트레이(408) 상에 배치될 수 있게 하고, 그런 다음배양 플레이트(404)를 하우징(410)의 내부에 배치하기 위해 집어넣고 닫는다. 배양 플레이트(404)는 하우징 내에서 정지 상태로 유지되는 반면, 형광 광학 모듈(402)(도 5 참조)은 플레이트(404)에 대해 이동하고 실험의 진행 동안에 일련의 형광 이미지를 획득한다. 이 실시예의 변형에서, 획득된 이미지는 명시야(brightfield), 비형광(non-fluorescent) 이미지일 수 있다.
도 5는 도 4의 형광 광학 모듈(402)의 보다 상세한 광학 다이어그램이다. 도 5에 도시된 형광 광학 모듈(402)에 대한 추가 세부사항은, "Optical module with three or more color fluorescent light sources and methods for use thereof"라는 제목으로 본 발명의 양수인에게 양도된, 2020년 4월 21일에 출원된 Brad Neagle et al.의 미국 특허 출원 일련 번호 16/854,756에서 찾아질 수 있으며, 이의 내용은 본 명세서에 참고로 통합된다. 도 5의 광학 모듈(402)의 세부 사항은 특별히 중요하지 않으며 도면에 도시된 것에서 광범위하게 변할 수 있고, 이러한 도 5는 제한이 아닌 예로서 제공된다.
모듈(402)은 개별적으로 453-486 nm 및 546-568 nm와 같은 상이한 파장에서 광을 방출하는 LED 여기 광원(450A 및 450B)을 포함한다. 광학 모듈(402)은 648-674 nm와 같은 제3 파장의 광을 방출하는 제3 LED 여기 광원(도시되지 않음), 또는 심지어 제4 상이한 파장의 제4 LED 여기 광원으로 구성될 수 있다. LED들(450A 및 450B)로부터의 광은 개별적으로 좁은 대역통과 필터들(452A 및 452B)을 통과하며, 이들은 세포 배양 및 바이러스 배지에서 형광체들을 여기시키도록 설계되는 특정 파장들의 광을 통과시킨다. 필터(452A)를 통과한 광은 이색성 미러(dichroic mirror)(454A)에서 반사되고 이색성 미러(454B)에서 반사되며 대물 렌즈(460), 예를 들어 20X 확대 렌즈로 지향된다. LED(450B)로부터의 광은 또한 필터(452B)를 통과하고 또한 이색성 미러(454B)를 통과하여 대물 렌즈(460)로 지향된다. 렌즈(460)를 통과한 여기 광은 그런 다음 플레이트(10)의 바닥에 충돌하고, 매체(404) 내로 지나간다. 결국, 샘플 내의 형광체로부터의 방출은 렌즈(460)를 통과하고, 미러(454B)에서 반사되고, 이색성 미러(454A)를 통과하고, (비-형광 광을 필터링하는) 협대역 방출 필터(462)를 통과하고, 디지털 카메라(464)에 충돌하며, 이는 현재 당업계에 공지되어 있고 형광 현미경법에 사용되는 CCD(charge coupled device) 또는 다른 유형의 카메라의 형태를 취할 수 있다. 그런 다음, 모터 시스템(418)은 광원(450A 또는 450B)이 ON 상태에 있는 동안 전체 광학 모듈(402)을 X, Y 및 옵션으로 Z 방향으로 이동시키도록 동작한다. 일반적으로 한 번에 하나의 광학 채널만이 활성화되는데, 예를 들어 LED(450A)가 턴 온되고 이미지가 캡처되고, 그런 다음 LED(450A)가 턴 오프되고 LED(450B)가 활성화되고 제2 이미지가 캡처된다는 것이 이해될 것이다.
대물 렌즈(460)는 상이한 배율의 제2 대물 렌즈가 상이한 배율에서 제2 이미지를 획득하기 위해 광학 경로 내에 배치되도록 수직 축을 중심으로 회전될 수 있는 터릿(turret)에 장착될 수 있다는 것이 이해될 것이다.
또한, 모터 시스템(418)은 형광 광학 모듈(402) 및 대물 렌즈(460)의 광학 경로가 플레이트(404)의 다양한 홈(well)(10) 내의 각각의 세포 배양물 바로 아래에 배치되도록 X 및 Y 방향으로 플레이트(404) 아래로 이동하도록 구성될 수 있다.
형광 광학 모듈(402)을 위한 모터 시스템(418)의 세부사항은 광범위하게 변할 수 있고 당업자에게 공지되어 있다.
도 5의 형광 및 필터의 사용은 옵션이며, 일 실시예에서는 여기 및 방출 필터를 사용하지 않고 넓은 스펙트럼 조명원으로부터 명시야 이미지(brightfield image)가 획득된다.
일 실시예에서, 바이러스 샘플은 총 입자 수를 취득하기 위해 Sartorius Virus Counterⓒ와 같은 별도의 기구에 공급되고, 여기서 별도의 기구는 총 입자 수와 본질적으로 동시에 플라크 검정 역가를 취득하기 위해 적용 단계에서 도 4 및 5의 기구에서 바이러스 플라크 검정과 병행하여 동작할 수 있다.
예제 실시예
이 섹션은 개별적으로, 도면들 2 및 6-11과 함께, 모델 훈련 및 모델 적용 단계들에 대한 다수의 가능한 실시예들을 설명할 것이다.
이하의 논의에서, 특정 의미들이 본 명세서에서 사용되는 용어들에 기인한다:
"인공 신경망(Artificial neural network)"(ANN)은 최적화 알고리즘들을 사용하여 학습되는 모델 파라미터들을 갖는 비선형 수학적 변환들의 다수의 rP층들로 구성되는, 기계 학습 모델의 유형을 지칭한다.
"컨볼루션 신경망(Convolutional Neural Network)"(CNN)은 이미지에서 형상과 객체를 형성하는 픽셀과 같은 공간적 상관관계를 갖는 데이터를 처리하는 데 흔히 사용되는 유형의 ANN을 의미한다.
"활성화(Activations)"은 ANN의 계층들을 통과하는 입력 데이터의 중간 표현을 지칭한다.
앞서 설명한 바와 같이, 도 2의 모델 훈련(또는 셋업) 단계(100) 및 도 2의 적용 단계(200)가 있다. 모델 훈련 단계(100)는 본질적으로 4-단 프로세스일 수 있다: (1) 예를 들어, 배양 플레이트의 홈 내에 보유된 세포 배양 배지에서 바이러스 처리된 세포의 이미지의 훈련 세트(102)를 취득하고; 일련의 실험으로서 반복한다. (2) 단계 1에서, 각각의 실험에서 시간 t최종, 또는 "실측값(ground truth)" (106)에서 이미징된 세포 배양 배지에 대한 적어도 하나의 수치적 바이러스 역가 판독을 획득하여 레코딩한다. (3) 각각의 현미경 이미지의 수치적 표현을 취득하기 위해 훈련 세트(102)에서 이미지들을 처리한다. (4) 하나 이상의 기계 학습 모델(108), 예를 들어 회귀 모델을 훈련시켜, 더 이른 시점들로부터의 수치적 표현들에 기초하여 최종 바이러스 역가를 예측하고, 이 훈련 단계에서, 예측된 최종 바이러스 역가와 실측값 사이의 손실(loss) 또는 오차(error)의 최소화가 수행된다. 이 모델(또는 모델들의 세트)이 훈련되면, 이들은 저장되고, 그런 다음 모델 적용 단계(200) 동안 사용된다. 모델 적용 단계(200)는 (1) 바이러스 역가의 조기 예측이 요구되는, 미지의 역가의 바이러스로 주입된 세포 배양물의 이미지의 시간 시퀀스를 취득하는 단계, (2) 모델 훈련 단계(100)의 단계 3과 관련하여 위에서 논의된 바와 동일한 방식으로 이미지를 수치적 표현으로 처리하는 단계, 및 (3) 예측된 바이러스 역가를 획득하기 위해 훈련된 기계 학습 모델을 적용하는 단계로 구성된다.
앞서 언급된 바와 같이, 일부 실시예들에서, 흔히 사용되는 세포 유형들에 대한 모델들을 훈련하기 위해 훈련 단계를 거치거나 반복하는 것이 가능하고 바람직하다. 그런 다음 이러한 모델은 도 4 및 5에서 전술한 것과 같은 검정 기구의 사용자에게 소프트웨어 모듈의 통합 부품으로서 배송되거나 제공될 수 있다. 그런 다음 고객/사용자는 적용 단계만 수행하면 된다. 그러나, 도구의 고객/사용자가 도 2의 프로세스를 사용하여 모델이 개발된 것과 너무 다른 흔하지 않은(uncommon) 세포 유형에 대해 바이러스 역가 실험을 수행하기를 원하는 상황이 있을 수 있다. 이 경에, 고객/사용자는 도 2의 모델 훈련 프로세스를 수행한다. 기구는 예를 들어, 도 4의 워크스테이션의 디스플레이에 도시된 "훈련" 모듈을 입력함으로써, 기본적으로 사용자에게 도 2의 프로세스 또는 단계 100을 구현하도록 가이드하는 소프트웨어 패키지로서 모델 훈련 절차를 제공함으로써 이 실시예를 지원한다.
도 2에 도시되고 상기에서 설명된 4-단계 모델 훈련 단계 또는 프로세스(100) 및 3-단계 적용 단계(200)의 예가 이제 도 6과 함께 설명될 것이다.
모델 훈련(또는 셋업) 단계(도 2, 100 및 도 6)
단계 1. 시작 시간 t0으로부터 t최종까지의 하나 이상의 시점에서 복수의 실험(600)으로부터 바이러스 처리된 세포 배양물의 하나 이상의 이미지, 바람직하게는 현미경 이미지(602, 도 6)의 형태로 훈련 세트를 취득한다. 동일한 시점(들)이 바람직하게는 모든 실험에 사용된다. 시점은 균일하게 또는 불균일하게 이격될 수 있고, 60분 이하의 기간, 예컨대 30분마다 주기적일 수 있다. 하나의 실험(600)은 배양 플레이트의 홈에서 성장하는 세포 배양물을 포함할 수 있고, 복수의 실험들은 상이한 바이러스 농도로 처리된 세포 배양물의 다수의 홈을 포함할 수 있다. 이 이미지 세트(602)는 본 명세서에서 훈련 세트(training set)로 지칭될 것이다. 이미지들을 획득하는 카메라의 시야(field of view)에 따라, 이미지들은 전체 세포 배양물의 넓은 시야 이미지를 생성하기 위해 함께 조합되거나 스티칭(stitch)될 수 있다. 대안으로, 합성 또는 조합된 전체 이미지를 생성하지 않고 개별 작은 시야 이미지가 취득되고 처리될 수 있다.
현미경 이미지들(602)은 명시야 이미지들 또는 위상차 이미지(phase contrast image)들과 같은 무표지(label-free) 광 현미경 이미지들일 수 있다.
대안으로, 현미경 이미지(602)는 또한 관심 형광 마커로 표지된 세포 배양물의 형광 이미지일 수 있다. 본 실시예에서 형광 마커는 바이러스 감염 세포의 표면 또는 내부에서 발현되는 바이러스 특이적 단백질 에피토프(epitope)에 결합하는 형광 항체일 수 있다. 대안으로, 형광 마커는 세포막 마커 또는, 세포 사멸(dead) 마커일 수 있다. 상기 마커들의 조합으로 세포 배양물을 표지하는 것이 가능하다.
현미경 이미지(602)는 또한 발색 검출 시스템의 효소 작용의 결과로서 표지된 세포 배양물의 면역조직화학 이미지, 명시야 및 상(phase)일 수 있다. 이 발색 마커는 바이러스 감염 세포의 표면 또는 내부에서 발현되는 바이러스 특이적 단백질 에피토프에 결합하는 효소-링크된 직접 1차 항체일 수 있다. 대안으로, 발색 마커는 바이러스-감염된 세포의 표면 또는 내부에서 발현되는, 바이러스 특이적 단백질 에피토프에 특이적인 제1 항체에 대한 친화성을 갖는 2차 항체일 수 있다. 또 다른 가능성으로서, 발색 검출 시스템은 1차 또는 2차 항체에 컨쥬게이트(conjugate)된 HRP(horseradish peroxidase) 효소 및 3,3'-디아미노벤지딘 테트라히드로키오리드(diaminobenzidine tetrahydrochioride)(DAB)에 대한 HRP의 작용의 결과로 생성된 불용성 생성물의 조합일 수 있다. 또 다른 가능성으로서, 발색 검출 시스템은 면역조직화학 검출 시스템의 복수의 다른 쌍 중 하나일 수 있다. 예를 들어, https://www.abcam.com/kits/substrates-and-chromogens-for-ihc을 참조한다.
현미경 이미지(602)는 상술한 바와 같이 무표지(label-free) 광 현미경 이미지와 형광 마커로 표지된 형광 이미지의 쌍일 수 있다.
단계 2. 훈련 세트에서 이미징된 각각의 실험에 대해, t최종에서 바이러스 처리된 세포 배양물의 적어도 하나의 수치적 바이러스 역가 판독(604)을 레코딩한다. 바이러스 역가 판독은 시각적 검사에 의해 수동으로, 또는 t최종에서 이미지(들)를 처리하기 위한 계산 알고리즘을 사용하여 자동으로 레코딩될 수 있다. 이러한 바이러스 역가 판독은 실측값 타겟, 또는 단순히 "실측값"로 표시될 것이다.
바이러스 역가 판독은 플라크 검정(plaque assay)으로부터의 판독일 수 있다. 특히, 플라크 검정 판독은 개별 플라크의 수(즉, 표준 판독)일 수 있다.
대안으로, 플라크 검정 판독은 또한 플라크에 의해 덮이는 면적일 수 있다. (옵션 a)
변형예로서, 바이러스 역가는 플라크 검정으로부터의 판독일 수 있으며, 여기서 플라크 검정 판독은 실험 기간 동안 세포 덩어리(cell mass)를 형성하지 않는 세포의 구멍(hole)으로서 배경 및 플라크로부터 세포 덩어리를 분할하기 위해 이미지 분할 알고리즘을 사용하여 자동으로 획득된다. (옵션 b)
또 다른 변형예로서, 바이러스 역가 판독은 조직 배양 감염 용량 50% 검정(TCID50)으로부터의 판독일 수 있다. (옵션 c)
또 다른 변형예로서, 바이러스 역가 판독은 초점 형성 검정(FFA : focus forming assay)로부터의 판독에 의해 이루어질 수 있다. (옵션 d)
또 다른 가능성으로서, 바이러스 역가 판독은 상기 옵션들, 예를 들어 옵션 a 또는 b 및 옵션 c; 또는 옵션 a 또는 b 및 옵션 d의 조합일 수 있다.
단계 3. 도 6의 단계 606에서 각각의 이미지(형광 이미지가 사용되는 경우, 쌍(pair))의 수치적 표현(808)을 획득하기 위해 훈련 세트의 모든 현미경 이미지를 처리한다.
처리(606)는 이미지 마다 CNN 활성화들의 세트를 획득하기 위해 전체 이미지들을 CNN을 통과하여 지나가는 것으로 구성될 수 있다.
대안으로, 처리(606)는 또한 또는 대안으로 도 11에 도시된 프로세스 단계들: 단계(1100) - 이미지로부터 각각의 개별 세포를 분할(segmentation)거나 분할하는 단계, 단계(1102) - 옵션의 필터링 단계, 단계(1104) - 각각의 세포의 세포별 수치적 기술을 계산하는 단계, 및 단계(1106) - 모든 세포들에 걸쳐 수치적 기술들을 집계하는 단계로 구성될 수 있다.
분할(단계 1100)은 다음과 같은 다양한 가능한 기술들에 의해 수행될 수 있다:
전통적인 컴퓨터 비전 알고리즘을 사용하는 무표지 세포 분할, 세포 인스턴스 분할을 위해 CNN을 사용하는 무표지 세포 분할, 또는 세포막 마커를 사용하는 단계 1의 절차에 의해 주어진 막 마커 형광 이미지(membrane marker fluorescent image)를 임계화하는 것.
세포별(cell-by-cell) 수치적 기술 단계(1104)는 다수의 상이한 방식들로 계산될 수 있다. 예를 들어, 다음 방법 중 하나를 사용할 수 있다:
1. 세포 면적, 편심(eccentricity), 점, 단축/장축, 세분화도(granularity) 등에 기초하여 인간 정의 특징 기술자(feature descriptor)의 세트를 계산하는 프로세스에서와 같이 특징 추출을 이용하여 형태학적 특징(morphological feature)을 추출하는 것
2. 기계 학습 정의된 특징 기술자들의 세트를 추출하기 위해 CNN에 세포들의 분할된 서브 이미지들을 공급함으로써 형태학적 특징들을 추출하는 단계,
3. 형광 이미지를 기초로 형광 픽셀의 세포내(intra-cell) 합으로 정의된 형광 수준을 추출하는 단계(단계 1에서 설명된 바와 같이 세포 배양물에 관심 형광 마커가 표지된 경우)
집계 단계(aggregation step)(1106)는 여러 가능한 방법으로 수행될 수 있다. 예를 들어, 그것은 이미지 내의 모든 세포들에 걸쳐 특징별(feature-wise) 평균을 계산하거나, 세포별 수치적 기술자들에 기초하여 정의된 상이한 유형들의 세포들 간의 비율을 계산하거나, 차원 감소를 수행하고 전체 이미지에 대한 감소된 차원-공간의 확률 분포를 계산한 다음, 모든 이미지들에 기초하여 정의된 확률 분포에 따라 각각의 이미지를 감소된 차원에 대한 분포로서 집계함으로써 수행될 수 있다. 후자의 방법은 2020년 6월12일에 출원된 EP 특허 출원 20290050.2에 설명된 단일 세포-형상 분포 분석을 지칭하며, 이의 내용은 참조로 통합된다. 대안으로, 집계 단계는 세포별 특징 기술들을 세트-불변 신경망(set-invariant neural network)(예컨대, Deep Sets, see Zaheer, Manzil, et al. "Deep sets". Advances in neural information processing systems 30 (NIPS 2017))에 공급함으로써 수행될 수 있다.
도 11에 나타낸 바와 같이, 옵션의 필터링 단계(1102)가 있다. 특히, 도 4의 단계 1104 및 1106은 옵션의 형광 이미지(형광 이미지가 획득되는 단계 1에서 획득됨)에 기초하여 형광 픽셀의 세포내 합을 먼저 임계화함으로써 필터링되는 바와 같이 바이러스 감염된 세포만을 사용하여, 또는 바이러스 감염 또는 바이러스 감염되지 않은 세포의 무표지 분류를 수행하도록 훈련된 기계 학습 모델을 사용하여 수행될 수 있다.
도 11의 필터링 단계(1102)의 다른 예로서, 처리 단계들(1106 및 1106)은 사멸 세포(dead cell)들을 필터링함으로써 수행될 수 있다. 이러한 사멸 세포는 단계 1에서 세포 사멸 마커가 사용되는 옵션의 형광 이미지에 기초하여 형광 픽셀의 세포내 합을 임계화함으로써, 또는 세포를 사멸 세포 또는 사멸되지 않은 세포로서 무표지 분류를 수행하도록 훈련된 기계 학습 모델을 사용함으로써 식별될 수 있다.
도 11의 필터링 단계(1102)의 다른 예로서, 바이러스 감염으로 인해 사멸되지 않은 사멸된 세포를 필터링하기 위해 (전술된 바와 같이) 바이러스 감염되지 않은 세포를 필터링하는 것 (전술된 바와 같이) 그리고 사멸된 세포를 필터링하는 것의 조합이 수행될 수 있다.
단계 4. t최종에서의 바이러스 역가의 모델 예측(예측된 플라크 검정)과 실측값 사이의 차이(또는 동등하게, 오차 또는 손실)를 최소화하기 위해 훈련 세트 수치적 표현들(608)에 기초하여 하나 이상의 기계 학습 모델들을 훈련하여(단계(108)), 훈련된 기계 학습 모델(150)을 생성한다. 도 10 을 참조한다.
모델(150)은 다양한 형태를 취할 수 있다. 예를 들어, 이는 부분 최소 제곱 회귀 모델(partial least squares regression model)과 같은 선형 모델일 수 있다. 대안으로, ANN과 같은 비선형 모델일 수 있다. 다른 예로서, 모델(150)은 가우시안 프로세스 회귀(Gaussian process regression)와 같은 플라크 검정 판독에 대한 확률 분포일 수 있다. Rasmussen, Carl Edward, "Gaussian processes in machine learning" Summer School on Machine Learning. Springer, Berlin, Heidelberg (2003)를 참조한다. 다른 예로서, 모델(150)은 신경 상미분 방정식 모델과 같은 동적 모델일 수 있다. 예를 들어, Chen, Ricky TQ, ei ai., "Neural ordinary differential equations," Advances in neural information processing systems 31 (NeurlPS 2018)를 참조한다.
모델(150)은 실측값(ground truth)와 비교하여 예측된 플라크 검정 판독의 오차를 최소화하기 위해 모델 파라미터들을 반복적으로 조정함으로써 훈련될 수 있다. 이 오차는 평균 제곱 오차, 평균 절대 오차 또는 "Huber 손실"이라고도 하는 구분적(piece-wise) 절대, 구분적 제곱 오차로서 주어질 수 있다. Huber, Peter J., "Robust estimation of a location parameter, Breakthrough in statistics. Springer, New York, NY, 1992, pp. 492-518.
주: ANN 모델이 2개 이상의 연속적인 단계에서 사용될 때, 이들은 옵션으로 연결될 수 있고, 바이러스 역가 예측 손실은 이들을 공동으로 최적화하기 위해 다수의 서브 ANN을 통해 역전파(back-propagated)된다.
적용 단계(도 2, 200)
적용 단계 동안, 바이러스 역가 판독이 모델 훈련 단계 동안 훈련된 모델에 기초하여 시간상 더 일찍 예측될 것인 바이러스 처리된 세포 배양물(들)로 하나 이상의 실험이 실행된다. 주어진 실험에 대해, 최종 바이러스 역가 판독 계수(count)는 시점 t < t최종에서 다음에 의해 예측된다:
1. 시점 t까지 실험 세포 배양물의 하나 이상의 현미경 이미지를 취득하는 단계(도 2, 202). 이미지(들)는 바람직하게는 모델 훈련 단계(100)의 단계 1과 동일한 이미지 취득 프로토콜을 사용하여 취득된다.
2. 상기에서 설명된 모델 훈련 단계(100)의 단계 3과 동일한 이미지 처리 프로토콜을 사용하여 취득된 이미지(들)를 수치적 표현(들)(도 10, 1000)으로 처리하는 단계.
3. 도 10에 도시된 바와 같이, 훈련된 기계 학습 모델(150)을 수치적 표현(들)(1000)에 적용함으로써 최종 바이러스 역가(204)를 예측하는 단계.
도 7은 별도의 기계 학습 모델이 시점별로 훈련될 때의 모델 학습 단계를 나타낸 흐름도이다. 도면에 도시된 3개의 그러한 모델(150A, 150B, 150C)이 있지만, 예를 들어, 훈련 단계 동안 수행되는 각각의 실험 동안, 예를 들어, 매 30, 45 또는 80분마다, 이미지들이 취득되는 10 또는 20개의 시점이 있을 때, 그러한 모델들 중 더 많은 것, 예를 들어, 가능하게는 10 또는 20개 이상이 있을 수 있다는 것이 이해될 것이다. 도 7의 다른 단계는 도 6과 관련하여 상기에서 설명된 것과 같다. 도 7의 실시예는 적용 단계(도 2, 200)에서 사용될 수 있으며, 여기서, 예를 들어, 이미지는 6시간 기간에 걸쳐 30분마다 취득되고, 모델 훈련 동안 6시간 기간에 훈련된 12번째 훈련된 모델(150)은 그런 다음 실험이 개시된 6시간 후에 최종 바이러스 역가의 예측을 행하는 데 사용된다. 유사하게, 이미지들이 각각의 30분 또는 60분 간격으로 적용 단계에서 수집됨에 따라, 각각의 이미지의 수치적 표현은 그런 다음 각각의 간격, 모델들(150A(30분), 150B(80분), 150C(90분), 150D(120분) 등)으로 연관된 훈련된 기계 학습 모델에 공급되고, 각각의 모델은 예측을 행하고, 결과들은 예측에 있어서의 오차 바(error bar)들 또는 불확실도(uncertainty)과 함께, 예를 들어, 도 3에 도시된 바와 같이 사용자에 대해 생성 및 디스플레이된다.
도 8은 단일 기계 학습 모델(150)이 도 6에 설명된 절차에 따라, 다수의 시점들에서 획득된 이미지들(202)로부터 수치적 표현(numeric representation)들(608)을 사용하도록 훈련된 상황에서 모델 적용 단계(도 2, 200)를 예시하는 흐름도이다. 프로세스 이미지 모듈(606)은 전술한 바와 같이 이미지의 수치적 표현을 생성하고, 수치적 표현(608)은 훈련된 모델(150)에 그리고 204에 표시된 바와 같이 바이러스 역가의 예측이 입력된다.
도 9는 도 7에 도시된 학습 프로세스에 따라, 모델 학습 단계 동안 각 시점별로 단일 기계 학습 모델이 학습된 상황에서 모델 적용 단계를 예시한 흐름도이다. 훈련 프로세스는 다수의 훈련된 기계 학습 모델들(150A, 150B 및 150C)(및 옵션으로, 예를 들어, 도시되지 않은 20개의 추가적인 그러한 모델들과 같은 추가적인 모델들)을 생성한다. 그런 다음, 각각의 시점에서의 이미지들의 수치적 표현은 해당 시점에 대한 연관된 기계 학습 모델들에 공급되고, 각각의 모델(150A, 150B, 150C,…)은 개별적으로 바이러스 역가 판독치(204A, 204B, 204C, …)를 예측한다.
이제 도 4 및 도 12를 참조하면, 분석 기구(analytical instrument)(400)와 연관된 워크스테이션은 기구의 사용자가 본원에 설명된 바이러스 역가 검정을 실행하는데 필요한 도구 또는 인터페이스를 제공하는 디스플레이(24)를 포함할 수 있다. 디스플레이(24)의 세부사항이 매우 다양할 수 있지만, 일반적으로 사용자가 기구의 소프트웨어가 메모리에 저장된 적절한 기계 학습 모델(들)을 선택하여 기구 내에서 이미징될 세포 배양물 및 바이러스 세트로서 예측을 행하기 위해 필요한 정보를 입력할 수 있게 하는 특징부를 포함할 것이다. 예를 들어, 도 12와 같이, 사용자는 다음과 같은 것들을 선택할 수 있는 메뉴를 제공받는다:
실험에서 세포주(cell line)의 유형,
세포주에 주입(inoculated)되는 바이러스 패밀리의 유형
검정 유형(예를 들어, 단위 부피당 플라크 형성 단위 수(count), TCID50, 둘 다, 기타 등)
세포 플레이트에서의 희석 수준,
예측이 원해지는 처리의 시작 이후의 시간 또는 시간 기간들(예를 들어, 4시간, 6시간, 15시간, 30분마다 또는 1시간마다 등)
옵션으로, 메뉴는 사용자가 적용을 프로그래밍할 수 있는 신뢰 수준 특징을 포함할 수 있어서, 특정 신뢰 구간 또는 오차 제한 내의 예측들만이 보고되고, 더 큰 불확실도를 갖는 예측들은 보고되지 않는다. 도 12에 도시된 인터페이스는 단지 하나의 가능한 예이며 제한이 아닌 예로서 제공되며, 인터페이스의 설계 및 메뉴 옵션들의 세부사항들은 도 12에 도시된 것과 크게 다를 수 있다.
추가적으로, 메뉴는 사용자가 바이러스 역가를 예측하기 위해 새로운 추가 기계 학습 모델들을 훈련하도록 실험 설계를 셋업하는 훈련 모드로 진입하는 옵션을 포함할 수 있다. 예를 들어, 기구의 디스플레이는 활성화될 때 사용자가 상기에서 설명된 모델 훈련을 수행하기 위해 실험 파라미터를 입력할 수 있게 하는 "훈련(TRAIN)" 아이콘(도 4 참조)을 포함할 수 있다.
훈련된 기계 학습 모델은 도 4의 기구(400)의 처리 유닛에서, 또는 대안으로 기구에 연결된 원격 컴퓨팅 플랫폼 상에서 구현될 수 있다. 도 4의 기구(400)는 기기의 사용자가 도 4의 기구를 사용하여 본 개시의 모델 훈련 프로세스를 수행할 수 있게 하는 모델 훈련 모듈을 옵션으로 더 포함할 수 있다.
추가 고려 사항
상기에서 설명된 바와 같이, 이미지 또는 시퀀스 이미지들이 촬영되고 분할 알고리즘(segmentation algorithm)들이 개별 세포들을 식별하기 위해 사용되는 실시예가 설명된다(도 11, 단계(1100) 참조). 이러한 분할 알고리즘들은 인스턴스 분할을 수행하는 컨볼루션 신경망(CNN)에 기초할 수 있거나, 또는 이들은 기존의 세포별 유형의 알고리즘들에 기초할 수 있다. 그런 다음, 각각의 개별 세포는 하나 이상의 상이한 방식으로 표현형(phenotype), 형상(shape) 및 텍스처를 정량화하는 다중 속성 표현을 사용하여 설명될 수 있다. 특히, 이미지는 픽셀별(pixel-by-pixel) 레벨로 검사될 수 있어, 픽셀 사이의 패턴 및 텍스처에 대한 추가 정보를 보다 상세히 제공한다. 세포 관련 기술자(descriptor) 및/또는 다른 관련 메타데이터의 이러한 생성된 특징 풍부 데이터세트(feature rich dataset)에 기초하여, 다변량 데이터 분석(multivariate data analysis)이 그런 다음 바이러스 활성과 특이적으로 관련된 세포변성 효과(cytopathic effect)를 검출하는 데 사용될 수 있다. 관찰된 세포변성 효과에 기초하여, 기계 학습 모델은 바이러스 활성을 예측하도록 훈련될 수 있다. 기계 학습은 예측을 위한 입력으로서 단일 시점을 사용하거나 현재 시간까지 이어지는 다수의 시점을 사용할 수 있다. 이 실시예는 세포 분할 알고리즘들의 사용을 생략하고 대신에 이미지(들)의 패치 방식 기술(patch-wise description)들을 사용함으로써 수정될 수 있다. 세포 카펫의 성질로 인해, 세포 서브 개체군(subpopulation)은 이미지(들)를 규칙적인 그리드(grid)로 분열(divide)시킴으로써 근사화될 수 있으며, 각각의 그리드 요소는 형상 및 텍스처 파라미터에 기초하여 설명되고, 설명된 것과 동일한 방식으로 바이러스 활성을 예측한다.
또한, 방법들은 이미지 기반 훈련된 모델들에 기초하기 때문에, 방법들은 플라크들의 얼마나 큰, 얼마나 많은, 및 특정 위치와 같은 정보를 예측함으로써 세포변성 효과들의 정도의 결정을 허용한다. 더욱이, 단지 세포변성 효과가 샘플에 존재하기 때문에, 이는 반드시 플라크 검정 형성과 동일하지는 않다. 본 개시의 플라크 검정은 세포변성 효과가 플라크로 발전할 것인지의 예측을 가능하게 한다. 세포변성 효과를 나타내는 모든 세포가 플라크 형성으로 이어지거나 초래할 것임도 분명하거나 예상되지 않는다. 특정 환경 조건은 플라크 형성이 발생하기 위해 존재되어야 한다. 세포 배양의 특정 pH 및 생리학적 온도를 유지하는, 도 4 및 5에 도시된 인큐베이터 기반 현미경의 살아있는 세포의, 교란되지 않는(unperturbed) 이미징 능력은, 바이러스 침입 및 이에 따른 플라크 형성에 의해 야기되는 숙주 세포(host cell)의 구조적 변화의 모니터링 및 관찰을 허용한다.
본 발명의 다양한 실시예들은 인-실리코 표지화(in-silico labelling)에 의해 보완될 수 있다. 인-실리코 표지화는 기계 학습 또는 딥 러닝 모델이 관심 형광 표지의 대응하는 형광 이미지를 예측하도록 훈련되었음을 의미한다. 바이러스 활성, 감염 정도 등을 나타내는 표지(label)로 표지화된 바이러스 처리된 세포 배양물의 데이터세트가 주어지면, 기계 학습 또는 딥 러닝 모델은 대응하는 광학 현미경 이미지로부터 표지를 예측하도록 훈련될 수 있다. 그런 다음, 이러한 훈련된 모델은 무표지(label-free) 방식으로 대응하는 표지를 예측하기 위해 추가 이미지 세트들에 적용될 수 있다. 그런 다음 예측된 표지는 플라크 예측 모델에서 보조 입력으로서 사용되거나 예측들이 그리드 내의 특정 세포들에 할당되는 세포들/그리드 요소들의 추가 설명으로서 사용될 수 있다.
다변량 데이터 분석은 또한 바이러스 활성과 직접 관련되지 않고, 예측 모델의 일부로서 사용되거나 필터링되는 정상 복제 동안의 세포 분리 및 라운딩(rounding)과 같은 시간 관련 또는 단일 시점에서 다른 표현형 효과를 검출할 수 있다. 신생(emerging) 기술은 또한 실시간으로 또는 일시적으로 플라크 크기 및 성장 속도를 구별할 수 있어, 잠재적으로, 원래 샘플의 응집 상태, 바이러스 효능, 및 돌연변이에 의한 개체군 내의 변이를 포함하는, 테스트된 바이러스 샘플과 관련된 다수의 품질 파라미터에 대한 품질 제어 모니터링, 이상치 검출, 및 근본 원인 분석 조사에 관한 정보를 밝힐 수 있다. 추출되거나 생성된 이미지 특징 세트 또는 다른 관련 메타데이터에 기초한 다변량 데이터(multivariate data) 분석은 또한 플라크 모폴러지(plaque morphology)의 다른 변이의 검출을 통한 다른 미결정된 바이러스/세포 상호작용 특징의 식별을 위한 발견 도구로서 기능할 수 있다. 플라크 모폴러지의 이러한 변이는 현재 방법에 의해 구별될 수 없지만, 본 개시의 양태인 자동화 기계 학습, 다변량 데이터 분석 및 라이브 세포 이미징의 조합에 의해 가능하게 되는 다중 파라메트릭 분석 및 처리량(throughput)에 의해 밝혀진다.
본 개시의 방법들의 다른 이점으로서, 검출에 필요한 플라크 크기가 감소되고, 따라서, 오버랩(overlap)의 위험 없이 단위 면적/시야(field of view) 당 더 많은 플라크들을 효과적으로 허용한다. 이와 같이 이는 필요한 희석 계열(dilution series)을 효과적으로 감소시켜 상당한 노동 부담을 덜어준다. 본원에서 다른 대안은 적절한 테스트 희석액으로부터 플라크를 검사하는 데 필요한 면적을 감소시키고 잠재적으로 더 높은 처리량을 갖는 더 작은 포맷으로 이동할 수 있다는 것이다.
전문 배지가 배양 플레이트에 첨가될 수 있으며, 예를 들어, 바이러스에 특이적인 검출 보조제 또는 일반적으로 그리고 기계 학습 특정 방식으로 이미징을 보조하는 제제를 함유한다. 후자는 보다 일반적인 적용을 가질 수 있다. 이러한 배지는, 예를 들어, 세포 내용물의 방출에 반응하거나 바이러스 항원(예를 들어, 바이러스 항체)에 응집하는 시약을 가질 수 있고 그리고 검출가능한 마커를 운반하거나 그들의 응집을 통해 검출가능한 구조를 형성한다. 이러한 시약은 배지의 더 낮은 농도에서 더 높은 양자 수율을 갖는 형광 염료 또는 염료들 또는 특정 이미징 방법, 예를 들어 라만 분광법(Raman spectroscopy)을 통해 검출을 위해 설계된 분자 태그와 같은 다른 시약일 수 있다. 시약은 세포골격의 재형성, 막 무결성(integrity) 변화를 통한 살아 있는/사멸 검출, 아폽토시스(apoptosis) 및 자가포식(autophagy) 경로의 활성화, 세포 주기, 및 산화 스트레스와 같은, 그러나 이에 제한되지 않는 특정 세포변성 효과의 조기 검출에 사용될 수 있다.
항체 및 다른 표지는 기계 학습 또는 이러한 이미지로부터 도출될 AI에서 훈련 모델에 대한 고전적 식별을 추가함으로써 수학 알고리즘의 생성을 미리 가능하게 할 수 있고, 즉, 이들은 모델링을 수행하는 사람에게 액션(action)이 어디에 있는지, 어디를 보아야 하는지를 알려줄 수 있다. 이들 시약은 또한 모델 확인을 위해 사용될 수 있다. 이것은 바이러스 감염의 총 효과가 세포변성 효과가 더 감지하기 힘들 수 있는(subtle) 바이러스의 이질적이거나 원시 제제에서 덜 분명했던 경우에 사실이다. 이것은 제제의 감염성이 높은 바이러스와 동일한 기간 내에 용해되지 않을 수 있는 또는 용해되지 않는 일부 바이러스로 인해 발생할 수 있다.
이러한 결합 분자(binding molecule)는 검출가능한 물리적 구조적 정보에 영역의 화학적 및 분자 구성에 대한 정보의 추가를 통해 추가 정보를 제공할 수 있다.
일 실시예에서, 세포의 융합 단일층(confluent monolayer)은 다양한 희석액에서 바이러스로 감염되고, 바이러스 감염이 무분별하게 퍼지는 것을 방지하기 위해 세균 배양액(agar)과 같은 반고체 배지로 덮인다.
전술한 바와 같이, 본 방법은 이제 본 개시의 바이러스 플라크 검정을 통해 (1) 총 입자 수(Sartorius' Virus Counterⓒ와 같은 바이러스 입자 계수 기구에서 샘플의 검정에 의해) 및 (2) 감염성 입자 수의 본질적으로 동시적인 결정을 허용한다. 두 가지 검정은 동시에, 별개의 기구 또는 플랫폼에서 병행하여 수행될 수 있다.
마지막으로, 이러한 기술은 또한 바이러스학(virology) 외부의 부착된 세포와 함께 개발되고 사용되는 새로운 화학적 및 생물학적 개체(entity) 효능 검정에도 적용될 수 있다. 이들은 중화, 세포 증식, 세포 사멸 (아폽토시스), 사이토카인 방출, 세포 신호전달의 조절, 염증 반응의 조절, 수용체 결합/활성화, 리간드 결합, 및 칼슘 유동을 포함하지만, 이에 한정되지 않는다.
본 발명에 대한 적용은 매우 광범위하다. 기초 연구, 개발 및 제조에 걸친 바이러스 정량 시장의 대부분은 플라크 검정을 표준 검정으로 간주한다. 적용은 다음을 포함되지만 이에 한정되지 않는다 :
1. 기초 연구(학술 또는 산업)
2. 검정 개발
3. 유전자 치료, 배큘로바이러스(baculovirus) 발현을 통한 단백질 제조, 바이러스 백신을 포함하는 공정 개발 및 생산
4. 항바이러스 스크리닝(screening) 및 개발
5. 제조 품질 관리(QC : Quality Control)
8. 전환율 최적화(CRQ : Conversion Rate Optimization) 테스트
7. 바이러스주(viral stock) 확립
8. 바이러스 제거 및/또는 불활성화
9. GMP(Good Manufacturing Process) 검증 및 비 GMP 연구, 및
10. 새로운 화학적 또는 생물학적 개체에 대한 효능 검정.
예들(Examples)
더 이른 시점으로부터 감염성 역가를 예측하는 방법의 예시적인 예를 제공하기 위해, 우리는 작은 이미지 예측 사례 연구를 수행했다. 우리는 표준 플라크 검정을 수행했는데, 여기서 HEK293 세포를 폴리-L-리신으로 코팅된 홈(well)에서 높은 융합 수준으로 성장시켜 접착력을 증가시키고, 시딩(seeding) 후 16-20시간 후, 세포에 녹색 형광 단백질(GFP)을 발현하는 인간 아데노바이러스 5의 계열 희석액을 주입한 후 세포를 37°C에서 배양하여 바이러스가 세포와 상호작용할 수 있도록 했다. 배양 한 시간 후, 세포에 아직 들어가지 않은 모든 바이러스를 제거한 다음 0.5% 아가로스 오버레이(agarose overlay)를 첨가했다. 오버레이를 가열하여 액체로서 세포에 첨가한 다음 홈에 부은 후 빠르게 응고시킨다. 이것은 바이러스 감염을 제한하는 반고체 오버레이(semi solid overlay)를 만들고, 바이러스는 초기 감염된 세포에 인접한 감염 세포뿐이다. 홈(well)은 7일 동안 배양되었고, 위상차 이미징과 녹색 형광 이미징을 둘 모두 사용하여 incucyte®에서 4X 배율로 이미징되었다.
결과 데이터 세트는 위상차 이미지와 녹색 형광 이미지 쌍으로 구성되며, 여기서 녹색 형광은 감염된 세포를 나타낸다(도 13의 예 참조).
더 이른 시점으로부터의 예측을 입증하기 위해, 본 발명자들은 5일의 위상차 이미지에 기초하여 7일의 녹색 형광 이미지를 예측하도록 컨볼루션 신경망 모델을 훈련시켰다. 성공적인 예측은 적어도 2일 전에 최종 감염성 바이러스 역가를 추정할 수 있음을 나타낸다. 우리는 2개의 희석액(10-6 및 10-5)으로부터 측정된 것과 예측된 형광 이미지 간의 Huber Loss (See Huber, P. J. (1992). Robust estimation of a location parameter. In Breakthroughs in statistics (pp. 492-518). Springer, New York, NY.) 최소화하기 위해 구체적으로 U-net 아키텍처를 포함한 완전 컨볼루션 신경망 모델을 훈련했다 (Ronneberger, G., Fischer, P., & Brox, T. (2015, October). U-net: Convolutional networks for biomedical image segmentation, in International Conference on Medical image computing and computer-assisted intervention (pp. 234-241). Springer, Cham 참조.). 우리는 10-4의 학습률을 사용하여 1000개의 에포크(epoch)에 대한 모델 가중치를 업데이트하기 위해 아담 옵티마이저(Adam optimizer)를 사용했다(Kingma, D. P., & Ba, J. (2014) Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980 참조). 그런 다음 바이러스의 10-7 및 10-5 희석액이 주입된 음성 대조군 및 배양물을 포함하는 3개의 다른 홈(well)의 형광(fluorescence)을 예측했다.
결과는 도 14에서 알 수 있듯이 예측이 절대적인 의미에서 완전하지 않더라도 예측된 형광이 바이러스 농도와 상관관계가 있음을 보여준다. 낮은 농도의 바이러스에 대한 no에서, 모델은 no에서 낮은 형광성을 정확하게 예측하여 낮은 세포 감염이 없음을 나타내는 반면 높은 바이러스 농도에서 형광을 정확하게 예측한다. 모든 감염 부위가 모델 예측에 의해 잡히는 것은 아니지만(도 14 바닥 패널, 오른쪽 열의 예측에 비해 왼쪽 열에서 측정됨) 모델은 여전히 낮은 농도에 비해 훨씬 더 많이 예측한다는 점에 유의한다. 이러한 차이는 1차 감염 부위에 의해 유도된 세포변성 효과를 주로 검출하는 모델에 기인할 수 있는 반면, 2차 감염 부위의 세포변성 효과는 아직 보이지 않는다. 데이터는 전체 실험이 끝나기를 기다리는 것보다 적어도 2일 전에 감염성 바이러스 역가를 추정할 수 있음을 보여준다.
첨부된 청구항들은 개시된 발명들의 추가 설명들로서 제공된다. 상기 상세한 설명은 첨부 도면들을 참조하여 개시된 시스템들, 디바이스들, 및 방법들의 다양한 특징들 및 기능들을 설명한다. 도면들에서, 문맥이 달리 나타내지 않는 한, 유사한 심볼들은 통상적으로 유사한 컴포넌트들을 식별한다. 상세한 설명, 도면들, 및 청구항들에 설명된 예시적인 실시예들은 제한적인 것으로 의도되지 않는다. 본 명세서에 제시된 주제의 범위를 벗어나지 않고, 다른 실시예들이 이용될 수 있고, 다른 변경들이 이루어질 수 있다. 본 명세서에서 일반적으로 설명되고 도면들에 예시된 바와 본 개시의 양태들은 매우 다양한 상이한 구성들로 배열, 대체, 조합, 분리 및 설계될 수 있으며, 이들 모두는 본 명세서에서 명시적으로 고려된다는 것이 쉽게 이해될 것이다.
도면들에서의 메시지 흐름도들, 시나리오들, 및 흐름도들 중 임의의 것 또는 전부와 관련하여 그리고 본 명세서에서 논의된, 각각의 단계, 블록 및/또는 통신은 예시적인 실시예들에 따른 정보의 처리 및/또는 정보의 송신을 나타낼 수 있다. 대안적인 실시예들은 이러한 예시적인 실시예들의 범위 내에 포함된다. 이러한 대안적인 실시예들에서, 예를 들어, 단계들, 블록들, 송신들, 통신들, 요청들, 응답들, 및/또는 메시지들로서 설명된 기능들은, 수반되는 기능에 따라, 실질적으로 동시에 또는 역순을 포함하여, 도시되거나 논의된 것으로부터 비순차적으로 실행될 수 있다. 또한, 더 많거나 더 적은 단계들, 블록들 및/또는 기능들이 본 명세서에서 논의된 메시지 흐름도들, 시나리오들, 및 흐름도들 중 임의의 것과 함께 사용될 수 있고, 이들 메시지 흐름도들, 시나리오들, 및 흐름도들은 부분적으로 또는 전체적으로 서로 조합될 수 있다.
정보의 처리를 나타내는 단계 또는 블록은 본 명세서에 설명된 방법 또는 기술의 특정 논리 기능들을 수행하도록 구성될 수 있는 회로부에 대응할 수 있다. 대안으로 또는 추가적으로, 정보의 처리를 나타내는 단계 또는 블록은 모듈, 세그먼트, 또는 (관련 데이터를 포함하는) 프로그램 코드의 일부에 대응할 수 있다. 프로그램 코드는 방법 또는 기술에서 특정 논리 기능들 또는 액션들을 구현하기 위해 프로세서에 의해 실행가능한 하나 이상의 명령을 포함할 수 있다. 프로그램 코드 및/또는 관련 데이터는 디스크 드라이브, 하드 드라이브, 또는 다른 저장 매체를 포함하는 저장 디바이스와 같은 임의의 유형의 컴퓨터 판독 가능 매체 상에 저장될 수 있다.
컴퓨터 판독 가능 매체는 또한 레지스터 메모리, 프로세서 캐시, 및/또는 랜덤 액세스 메모리(RAM)와 같이 단기간들 동안 데이터를 저장하는 컴퓨터 판독 가능 매체와 같은 비일시적 컴퓨터 판독 가능 매체를 포함할 수도 있다. 컴퓨터 판독 가능 매체는 또한, 예를 들어, 판독 전용 메모리(ROM), 광학 또는 자기 디스크들, 및/또는 컴팩트 디스크 판독 전용 메모리(CD-ROM)와 같은 2차 또는 영구 장기 저장과 같은, 보다 장기간 동안 프로그램 코드 및/또는 데이터를 저장하는 비일시적 컴퓨터 판독 가능 매체를 포함할 수 있다. 컴퓨터 판독 가능 매체는 또한 임의의 다른 휘발성 또는 비휘발성 저장 시스템들일 수 있다. 컴퓨터 판독 가능 매체는, 예를 들어, 컴퓨터 판독 가능 저장 매체, 또는 유형의 저장 디바이스로 간주될 수 있다.
또한, 하나 이상의 정보 송신들을 나타내는 단계 또는 블록은 동일한 물리적 디바이스 내의 소프트웨어 및/또는 하드웨어 모듈들 사이의 정보 송신들에 대응할 수 있다. 그러나, 다른 정보 송신들은 상이한 물리적 디바이스들 내의 소프트웨어 모듈들 및/또는 하드웨어 모듈들 사이에 있을 수 있다.
다양한 양태들 및 실시예들이 제한이 아닌 예시의 목적으로 개시되었지만, 본 개시의 세부사항들로부터의 변형이 본 발명의 범위를 벗어나지 않고 가능하다는 것이 당업자에게 명백할 것이다. 범위에 관한 모든 질문들은 첨부된 청구항들을 참조하여 답변되어야 한다.

Claims (33)

  1. 바이러스 개체군(virus population)을 함유하는 세포 배양물(cell culture)의 이미지 또는 이미지 시퀀스로부터 바이러스 역가(virus titer)를 예측하기 위해 기계 학습 모델을 훈련하는 방법으로서,
    (1) 시작 시간(t0)으로부터 최종 시간(t최종)까지 하나 이상의 시점에서 복수의 실험으로부터 바이러스 처리된 세포 배양물(virus-treated cell culture)의 복수의 이미지 형태의 훈련 세트를 획득하는 단계,
    (2) 각각의 실험에 대해, 최종 시간 t최종에서 상기 바이러스 처리된 세포 배양물의 적어도 하나의 수치적 바이러스 역가 판독(virus titer readout)을 레코딩하는 단계;
    (3) 각각의 이미지의 수치적 표현을 취득하기 위해 상기 훈련 세트 내의 이미지들을 처리하는 단계; 및
    (4) 상기 훈련 세트 수치적 표현들에 기초하여 최종 바이러스 역가의 예측을 행하도록 하나 이상의 기계 학습 모델들을 훈련하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 바이러스 역가 판독은 감염성 입자들의 수 또는 단위 부피당 감염성 입자들의 수를 포함하는, 방법.
  3. 제1항에 있어서, 상기 바이러스 역가 판독은 조직 배양 감염 용량(Tissue Culture Infective Dose) 50% 검정의 판독을 포함하는, 방법.
  4. 제1항에 있어서, 상기 바이러스 역가 판독은 초점 형성 검정(FFA : focus forming assay)으로부터의 판독을 포함하는, 방법.
  5. 제1항에 있어서, 상기 바이러스 역가 판독은 감염성 입자들의 수 또는 단위 부피당 감염성 입자들의 수와 조직 배양 감염 용량(Tissue Culture Infective Dose) 50% 검정의 조합을 포함하는, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 훈련 세트 이미지는 무표지 광학 현미경 이미지(label-free light microscopy image)를 포함하는, 방법.
  7. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 훈련 세트 이미지는 형광 마커가 표지된(labelled) 상기 세포 배양물의 형광 이미지를 포함하는, 방법.
  8. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 훈련 세트 이미지는 발색 검출 시스템(chromogenic detection system)으로 표지된 상기 세포 배양물의 면역조직화학 이미지(immunohistochemistry image)를 포함하는 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 처리하는 단계(3)는 상기 이미지들의 중간 데이터 표현을 취득하기 위해 상기 이미지들이 컨볼루션 신경망(CNN)을 통과해 지나가는 단계를 포함하는, 방법.
  10. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 처리하는 단계 (3)는,
    a) 이미지로부터 개별 세포를 분할하는 단계(segmenting);
    b) 각각의 세포의 세포별 수치적 기술(numeric description)을 계산하는 단계; 및
    c) 모든 세포에 대하여 수치적 기술을 집계하는 단계들을 더 포함하는, 방법.
  11. 제10항에 있어서, 상기 바이러스에 감염되지 않은 세포를 필터링하는 단계(filter out)를 더 포함하는, 방법.
  12. 제10항에 있어서, 사멸 세포(dead cell)를 필터링하는 단계를 더 포함하는, 방법.
  13. 제10항에 있어서, 바이러스 감염에 의해 사멸되지 않은 사멸된 세포를 필터링하는 단계를 더 포함하는, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 기계 학습 모델은 부분 최소 제곱 선형 모델(partial least squares linear model), 인공 신경망(artificial neural network), 가우시안 프로세스 회귀(Gaussian process regression), 및 신경 상미분 방정식 모델(neural ordinary differential equation model) 중 하나를 포함하는, 방법.
  15. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 훈련하는 단계 (4)는 최종 시간 t최종에서의 바이러스 처리된 세포 배양물의 적어도 하나의 수치적 바이러스 역가 판독과 연관된 실측값(ground truth)와 상기 최종 바이러스 역가의 모델 예측 사이의 오차(error)를 최소화하는 것을 포함하는, 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상이한 클래스의 바이러스, 상이한 세포 유형, 또는 상이한 기계 학습 모델에 대해 단계 (1) 내지 (4)를 각각의 시점 마다 반복하는 단계를 더 포함하는, 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 단계 (1)에서 적어도 2개의 시점이 있고, 시점들 사이의 기간은 60분 이하인, 방법.
  18. 제1항 내지 제17항 중 어느 한 항에 있어서, 상기 바이러스 개체군을 함유하는 세포 배양물은 발색 오버레이(ager-overlay)를 포함하지만 이에 제한되지 않고, 반고체 배지 오버레이 (semisolid medium overlay)를 포함하는, 방법.
  19. 미지의 역가의 바이러스 샘플이 첨가된 세포 배양물의 바이러스 역가 예측 방법에 있어서,
    a) 상기 세포 배양물(cell culture)의 이미지의 시간 시퀀스를 획득하는 단계;
    b) 청구항 1 내지 18 중 어느 한 항에 따라 훈련된 하나 이상의 기계 학습 모델에 단계 a)에서 획득된 이미지들의 시간 시퀀스의 수치적 표현을 공급하는 단계; 및
    c) 상기 바이러스 역가의 하나 이상의 훈련된 기계 학습 모델로 예측을 행하는 단계를 포함하는, 방법.
  20. 제19항에 있어서, 상기 바이러스 역가의 예측은 감염성 입자의 수, 단위 부피당 감염성 입자의 수, 또는 조직 배양 감염성 용량 50% 검정의 판독인, 방법.
  21. 제19항에 있어서, 단계 a)에서 획득된 이미지의 시간 시퀀스가 세포 배양물을 함유하고 통합 이미징 시스템을 갖는 하나 이상의 배양 플레이트를 보유하는 기구(instrument)에서 획득되는, 방법.
  22. 제21항에 있어서, 상기 이미징 시스템은 형광 이미징 시스템을 포함하는, 방법.
  23. 제19항 내지 제22항 중 어느 한 항에 있어서, 상기 세포 배양물은 상기 세포 배양물의 이미징을 돕는 전문 배지(specialist media)를 더 포함하는, 방법.
  24. 제23항에 있어서, 상기 전문 배지는 상기 세포 내용물의 방출에 반응하는 시약, 바이러스 항원 상에 응집하는 시약, 형광 염료, 및 살아있는 것 대 사멸한 세포 검출, 아폽토시스(apoptosis) 및 자가포식(autophagy) 경로의 활성화, 세포 주기, 및 산화 스트레스와 같은 세포변성 효과(cytopathic effect)의 조기 검출을 위해 사용되는 시약 중 적어도 하나를 더 포함하는, 방법.
  25. 제19항 내지 제24항 중 어느 한 항에 있어서, 상기 바이러스 샘플을 함유하는 세포 배양물은 발색 오버레이(ager-overlay)를 포함하지만 이에 제한되지 않고, 반고체 배지 오버레이 (semisolid medium overlay)를 포함하는, 방법.
  26. 분석 기구에 있어서,
    세포 배양물 및 바이러스 샘플을 함유하는 하나 이상의 플레이트를 보유(hold)하도록 구성된 시스템;
    통합 이미징 시스템; 및
    상기 이미징 시스템에 의해 획득된 상기 세포 배양물의 이미지의 시간 시퀀스(time sequence)에서의 하나 이상의 이미지로부터 상기 세포 배양물 내의 바이러스 역가의 예측을 행하도록 훈련된 기계 학습 모델을 포함하되, 상기 예측은 세포 배양물의 바이러스 감염이 만기(term)로 진행되기 전에 행해지는, 분석 기구.
  27. 제26항에 있어서, 상기 기구는 훈련 모듈을 실행하는 처리 유닛으로 추가로 구성되고, 상기 훈련 모듈은 상기 기구의 사용자가 상기 기구로,
    (1) 시작 시간 t0으로부터 최종 시간 t최종까지의 시점들의 세트에서의 복수의 실험들로부터 바이러스 처리된 세포 배양물의 복수의 이미지들의 형태로 훈련 세트를 획득하는 단계;
    (2) 각각의 실험에 대해, 시간 t최종에서 상기 바이러스 처리된 세포 배양물의 적어도 하나의 수치적 바이러스 역가 판독을 레코딩하는 단계;
    (3) 각각의 이미지의 수치적 표현을 획득하기 위해 훈련 세트 내의 모든 이미지들을 처리하는 단계; 및
    (4) 상기 훈련 세트 수치적 표현들에 기초하여 최종 바이러스 역가의 예측을 행하기 위해 하나 이상의 기계 학습 모델들을 훈련하는 단계를 포함하는, - 상기 훈련은 최종 바이러스 역가의 모델 예측과 실측값(groundtruth) 사이의 오차를 최소화하는 것을 포함함 - 훈련 방법을 수행하는 것을 가능하게 하기 위한 셋업 명령을 제공하는, 분석 기구.
  28. 제27항에 있어서, 상기 처리하는 단계(3)는, a) 상기 이미지들로부터 개별 세포들을 분할하는 단계(segmenting), b) 각각의 세포의 세포별(cell-by-cell) 수치적 기술(numeric description)을 계산하는 단계, 및 c) 모든 세포들에 걸쳐 상기 수치적 기술들을 집계하는 단계를 더 포함하는, 분석 기구.
  29. 제28항에 있어서, 상기 처리하는 단계 (3)는 상기 바이러스에 감염되지 않은 세포를 필터링하는 단계를 더 포함하는, 분석 기구.
  30. 제28항에 있어서, 상기 처리하는 단계(3)는 사멸 세포를 필터링하는 단계를 더 포함하는, 분석 기구.
  31. 제28항에 있어서, 상기 처리하는 단계(3)는 바이러스 감염에 의해 사멸하지 않은 사멸 세포를 필터링하는 단계를 더 포함하는, 분석 기구.
  32. 제26항 내지 제31항 중 어느 한 항에 있어서, 상기 기계 학습 모델은 부분 최소 제곱 선형 모델, 인공 신경망, 가우시안 프로세스 회귀, 및 신경 상미분 방정식 모델 중 하나를 포함하는, 분석 기구.
  33. 분석 기구와 연관된 처리 유닛에 대한 명령들의 세트를 저장하는 비일시적 컴퓨터 판독 가능 매체로서, 상기 기구는 세포 배양물의 이미지들의 시간 시퀀스를 획득하기 위한 이미징 시스템을 포함하고,
    상기 명령들의 세트는 상기 이미지 이미징 시스템의 시간 시퀀스 내의 하나 이상의 이미지로부터 상기 세포 배양물 내의 바이러스 역가의 예측을 행하기 위해 훈련된 기계 학습 모델 상에서 동작하고, 상기 예측은 상기 세포 배양물의 바이러스 감염이 만기(term)로 진행되기 전에 행해지는, 비일시적 컴퓨터 판독 가능 매체.
KR1020237037453A 2021-03-31 2022-03-30 신속한, 자동화된 이미지 기반 바이러스 플라크 및 효능 검정법 KR20230163541A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US17/218,439 2021-03-31
US17/218,439 US20220318668A1 (en) 2021-03-31 2021-03-31 Rapid, automated image-based virus plaque and potency assay
EP21166201.0A EP4068152A1 (en) 2021-03-31 2021-03-31 Rapid, automated image-based virus plaque and potency assay
EP21166201.0 2021-03-31
PCT/US2022/022490 WO2022212463A1 (en) 2021-03-31 2022-03-30 Rapid, automated image-based virus plaque and potency assay

Publications (1)

Publication Number Publication Date
KR20230163541A true KR20230163541A (ko) 2023-11-30

Family

ID=83459882

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237037453A KR20230163541A (ko) 2021-03-31 2022-03-30 신속한, 자동화된 이미지 기반 바이러스 플라크 및 효능 검정법

Country Status (3)

Country Link
JP (1) JP2024515512A (ko)
KR (1) KR20230163541A (ko)
WO (1) WO2022212463A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024006670A2 (en) * 2022-06-29 2024-01-04 The Regents Of The University Of California Stain-free, rapid, and quantitative viral plaque assay using deep learning and holography

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010138618A1 (en) * 2009-05-26 2010-12-02 Duke University Molecular predictors of fungal infection
WO2013090738A1 (en) * 2011-12-15 2013-06-20 Brown University Device and system for mechanical measurement of biomaterial
WO2015101510A1 (en) * 2013-12-30 2015-07-09 Baxter Healthcare Sa A method of predicting a performance characteristic of a plant or yeast hydrolysate and its use
EP3469095A4 (en) * 2016-06-14 2020-03-04 Beth Israel Deaconess Medical Center, Inc. AUTOMATED, DIGITAL OUTPUT PLATFORM FOR MICRODILUTION, ANTIMICROBIAL SUSCEPTIBILITY TEST

Also Published As

Publication number Publication date
WO2022212463A1 (en) 2022-10-06
JP2024515512A (ja) 2024-04-10

Similar Documents

Publication Publication Date Title
US8320655B2 (en) Process and system for analyzing the expression of biomarkers in cells
US20230145084A1 (en) Artificial immunohistochemical image systems and methods
US7796815B2 (en) Image analysis of biological objects
JP6660712B2 (ja) 分類器構成方法および細胞の生死判定方法
WO2018105432A1 (ja) 細胞画像評価装置および細胞画像評価制御プログラム
WO2018101004A1 (ja) 細胞画像評価装置および細胞画像評価制御プログラム
Sharma et al. High-throughput screening in primary neurons
Seo et al. PICASSO allows ultra-multiplexed fluorescence imaging of spatially overlapping proteins without reference spectra measurements
Ferrer‐Font et al. Panel optimization for high‐dimensional immunophenotyping assays using full‐spectrum flow cytometry
De Vos et al. High content image cytometry in the context of subnuclear organization
Cohen et al. Multispectral live‐cell imaging
Faustino et al. Automatic embryonic stem cells detection and counting method in fluorescence microscopy images
Kesler et al. Automated cell boundary and 3D nuclear segmentation of cells in suspension
JP7407107B2 (ja) 生細胞の視覚化及び分析
Cuny et al. Live cell microscopy: From image to insight
KR20230163541A (ko) 신속한, 자동화된 이미지 기반 바이러스 플라크 및 효능 검정법
Wolf et al. Current approaches to fate mapping and lineage tracing using image data
JP6818041B2 (ja) 解析装置、解析方法、及びプログラム
US20220318668A1 (en) Rapid, automated image-based virus plaque and potency assay
Benson et al. A high-content assay for identifying small molecules that reprogram C. elegans germ cell fate
WO2018003063A1 (ja) 解析装置、解析方法、解析プログラム及び表示装置
Calvert et al. Yeast cell cycle analysis: combining DNA staining with cell and nuclear morphology
EP4068152A1 (en) Rapid, automated image-based virus plaque and potency assay
Kroll et al. High‐Content Microscopy Analysis of Subcellular Structures: Assay Development and Application to Focal Adhesion Quantification
JP2023511666A (ja) 適応的データサブサンプリングおよび計算