KR20190076966A - 샘플 트래킹 체인들을 통한 샘플 트래킹, 시스템들 및 방법들 - Google Patents

샘플 트래킹 체인들을 통한 샘플 트래킹, 시스템들 및 방법들 Download PDF

Info

Publication number
KR20190076966A
KR20190076966A KR1020197011437A KR20197011437A KR20190076966A KR 20190076966 A KR20190076966 A KR 20190076966A KR 1020197011437 A KR1020197011437 A KR 1020197011437A KR 20197011437 A KR20197011437 A KR 20197011437A KR 20190076966 A KR20190076966 A KR 20190076966A
Authority
KR
South Korea
Prior art keywords
sample
data
state
chain
tracking
Prior art date
Application number
KR1020197011437A
Other languages
English (en)
Other versions
KR102385775B1 (ko
Inventor
니콜라스 제이 위치
패트릭 순-시옹
Original Assignee
난트 홀딩스 아이피, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 난트 홀딩스 아이피, 엘엘씨 filed Critical 난트 홀딩스 아이피, 엘엘씨
Publication of KR20190076966A publication Critical patent/KR20190076966A/ko
Application granted granted Critical
Publication of KR102385775B1 publication Critical patent/KR102385775B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing

Abstract

샘플 트래킹 체인들을 통해 샘플들을 트래킹하기 위한 시스템들 및 방법들이 제시된다. 샘플 트래킹 체인들은 샘플의 내재 특성들에 따라 인스턴스화된 디지털 데이터 구조들을 나타낸다. 체인에서의 각각의 링크는 샘플의 관찰된 내재 상태를 나타내는 데이터의 블록이고, 적어도 이전 상태를 나타내는 이전 블록에 링크된다. 샘플 트래킹 체인 및 블록들은 대응하는 샘플의 상태의 내재 특성들에 의해 나중의 취출을 위해 인덱싱될 수 있다. 샘플 트래킹 체인은 가능하게는 비밀 또는 공개 분산된 장부의 일부로서 저장된 블록체인의 형태를 취할 수 있다. 개시된 샘플 트래킹 체인들은 샘플 프로세싱에 대해 전체 라이프 사이클 감사 단서를 제공한다.

Description

샘플 트래킹 체인들을 통한 샘플 트래킹, 시스템들 및 방법들
관련 출원들에 대한 상호 참조
이 출원은 2016년 9월 20일 출원된 미국 가 특허 출원 제 62/396,986 호로부터 35 USC 119 하의 우선권을 주장하고, 그것의 내용들은 그 전체가 본원에 참조에 의해 통합된다.
발명의 분야
본 발명의 분야는 디지털 상태 트래킹 기술들이다.
배경
배경 설명은 본원에 기술된 시스템들 및 방법들을 이해하는데 유용할 수도 있는 정보를 포함한다. 그것은, 여기에 제공된 정보의 어느 것이 종래 기술이라거나, 구체적으로 또는 암시적으로 언급된 임의의 공개가 종래 기술이라는 인정이 아니다.
많은 의학적 치료들, 특히 종양학적 치료들은 환자로부터 취해진 하나 이상의 생물학적 샘플들의 분석을 필요로 한다. 통상적으로 이러한 샘플들은 추적 또는 식별 목적들을 위해 외적으로 라벨링된다. 예를 들어, 컨테이너에서의 샘플은 그것의 컨테이너에 부착된 바 코드 또는 환자 식별자 라벨을 가질 수도 있을 것이다. 샘플들이 워크플로우를 통해 프로세싱됨에 따라, 기술자는 샘플이 분석 워크플로우 또는 그것의 완전한 라이프 사이클을 통해서 적절하게 작용하도록 보장하기 위해 이러한 라벨들을 스캔할 수 있다. 불행하게도, 오늘날의 컴퓨터 구동되는 환경들에서조차도, 생물학적 샘플 트래킹은 문제점들 투성이이고, 이들 중 많은 것들은 컴퓨팅 환경들의 성질로 인해 발생한다. 한가지 문제점은 라벨들이 외적으로 생성된다는 것이고, 이는 작업자가 우연히 또는 부적절한 데이터 입력으로 인해서 중 어느 일방으로 인해 샘플 상에 잘못된 라벨을 붙일 기회를 형성한다는 것이다. 다른 문제점은, 분석을 통해 생성된 데이터가, 취출된 데이터가 사실 타겟 생물학적 샘플과 연관되는 것을 유효화하기 위한 빌트-인 메커니즘을 갖는 일 없이 외재적 정보 (예컨대, 바 코드, 라벨, 환자의 명칭 등) 를 통해 오직 액세스가능한 데이터베이스에 다지 저장된다는 것이다.
생물학적 샘플들을 트래킹하는 것에 적용된 다음과 같은 노력들을 고려하자. 2003년 11월 20일 국제 출원된 "Sample Holder for a Reception Device Receiving Biological Objects and Microscope System Designed to Operate Using One Such Sample Holder" 라는 제목의 Schutze 등에 대한 미국 특허 제 8,431,078 호는, 현미해부 (microdissection) 디바이스에 의한 샘플들의 명확한 식별을 보장하기 위해 시도하는 시스템을 기술한다. Schutze 시스템은, 샘플 홀더 (sample holder) 가 디스플레이 상에 사용자에게 선택 기능들을 제시하기 위해 사용될 수 있는 코딩을 갖는 것을 필요로 한다. 샘플에 대해 적절한 방식으로 현미해부 디바이스를 제어하기 위해 유용하지만, 개시된 시스템은 분석의 전체 라이프 사이클 (life cycle) 을 통한 생물학적 샘플들의 트래킹 (tracking) 내로의 그리고 내재적 감사 단서 (intrinsic audit trail) 의 생성 내로의 통찰을 제공하는데 실패한다. 또한, 샘플 홀더의 코딩이 잘못 라벨링되는 경우에, 기술자에게 부정확한 기능들이 제시될 수 있을 것이다.
추가적인 프로그레스는 2002년 11월 13일 출원된 "System for Tracking Biological Samples" 라는 제목의 De La Torre-Bueno 에 대한 미국 특허 제 8,676,509 호에 의해 이루어진다. De La Torre-Bueno 는 수집부터 저장까지 샘플들의 실시간 트래킹을 제공하기 위해 모색한다. 샘플들은 여러 워크스테이션들 (workstations) 에서의 프로세싱 단계들에 링크하는 고유한 바 코드 식별자와 연관된다. 이러한 접근법은 슬라이드들을 관리하는 것과 관련하여 가능한 프로세싱 에러들을 감소시키는데 도움이 된다. 하지만, 그 시스템은 여전히, 처음 장소에서 샘플들에 태그를 붙이기 위해 사람들의 부분에 대한 상당한 상호작용을 필요로 한다. 다시, 언제라도 바 코드가 부정확하게 사용되는 경우에, 슬라이드들은 잘못 관리될 수 있을 것이다. 또한, 바 코드 태그들은 시간에 걸쳐 열화되어 장기간의 연구들에 걸친 사용을 위해 그것들의 유효성이 감소될 수 있을 것이다.
또 다른 예는 2014년 5월 28일 출원된 "Automated System and Method of Processing Biological Specimens" 라는 제목의 Lefebvre 에 대한 미국 특허 제 9,354,147 호를 포함한다. Lefebvre 는 시료 슬라이드들을 촬상부로 그리고 촬상부로부터 운반하는 자동화된 시스템에 초점을 맞춘다. 또한, Lefebvre 는, 슬라이드들 및 시스템에서의 다른 항목들이 머신 이해가능 코드들 (예컨대, RFID, 바코드들 등) 로 식별될 수 있음을 나타낸다. 다시, 이러한 시스템들은 트래킹 시스템 엘리먼트들로서 유용한 것으로 고려된다. 하지만, 이러한 태그들 또는 코드들은 시간에 걸쳐 손상될 수 있어서 그것들을 덜 유용하게 만들고; 또 다시, 잘못 취급될 수 있을 것이다.
또 추가적인 노력은, 환자 정보를 샘플 식별자 정보와 고도로 결합하는 것에 지향되었다. 예를 들어, 2007년 6월 13일 출원된 "Laboratory Instrumentation Information Management and Control Network" 라는 제목의 Mattingly 등에 대한 미국 특허 출원 공개공보 U.S. 2008/0235055 호는, 환자의 케이스 식별자 및 시료 식별자로부터 조화된 시료 식별자를 형성하는 것을 논의한다. 조화된 시료 식별자는 정의된 포맷, 가능하게는 계층적 포맷으로 배열된 식별자들의 조합을 나타내고, 여기서, 다양한 식별자들은 워크플로우에서 상이한 포인트들에서 시료를 트래킹하는데 도움이 된다. 하지만, Mattingly 의 조화된 시료 식별자들은 또한, 시간에 걸쳐 강건함을 제공하는데 실패하고, 시료의 내용에 대한 구체적 내재적인 결합들을 결여한다. 따라서, Mattingly 접근법은 여전히 샘플 외부의 외재적 정보에 오직 의존한다.
흥미롭게도, 생물학적 샘플들을 패턴 인식 알고리즘들을 통해 디지털로 프로세싱하는 것을 향한 추가적인 노력이 또한 있었다. 예를 들어, 2013년 1월 18일 국제 출원된 "Histology Recognition to Automatically Score and Quantify Cancer Grades and Individual User Digital Whole Histological Image Device" 라는 제목의 Lloyd 등에 대한 미국 특허 출원 공개 제 2015/0003716 호는, 촬상된 세포들의 피처들 (features) 에 기초하여 암 세포 분류를 수행하는 것을 논의한다. 불행하게도, Lloyd 는 또한, 강건한 트래킹 시스템을 형성하기 위해서 어떻게 시료 또는 슬라이드 콘텐츠를 결합할지에 대한 통찰을 제공하는데 실패한다.
"Method and System for Processing Regions of Interest for Objects Comprising Biological Material" 라는 제목의 Kallioniemi 등에 대한 국제 특허 출원 공개 WO 02/48680 호는 또한, 생물학적 샘플들을 프로세싱하기 위해 패턴들을 이용한다. Kallioniemi 는 관심 구역들을 발견하기 위해서 생물학적 샘플 내의 기준 포인트들을 이용하는 것을 기술한다. Kallioniemi 는 또한, 전체 분석 라이프사이클을 통해서 샘플들을 트래킹하거나 슬라이드 콘텐츠를 트래킹 정보에 결합하는 것이 가능한 강건한 트래킹 시스템 내로의 임의의 통찰이 결여된다.
블록체인 기술을 구현하는 전통적인 기법들은 계산 집약적일 수 있고, 상당한 레이턴시를 초래하고 계산을 위해 특수화된 하드웨어에 의존한다. 이러한 문제점들을 해결하기 위해서, 블록체인 기반 시스템들을 보다 빠르게 하고 데이터의 프라이버시에 대한 개선들을 제공할 목적으로 Microsoft 의 CoCo (Confidential Consortium) 과 같은 기술들이 개발 중에 있다.
기업 블록체인 접근법들은 오픈 소스 분산된 장부 (ledger) 기술 플랫폼들인 openchain (www.openchain.org) 및 Ethereum 을 포함한다. 기업 블록체인 솔루션들은 암호화폐의 관리를 너머서 확장되는 능력들로 강건하고, 스케일러블하며, 안전한 방식의 디지털 데이터의 관리를 향해 적합화된다.
신뢰된 실행 환경에서 동작하도록 설계된 다른 접근법들은 Intel 의 Sawtooth Lake (URL intelledger.github.io/0.7/introduction.html 참조) 를 포함한다. Sawtooth Lake, 분산 장부 플랫폼은 하나 이상의 트랜잭션 패밀리들을 이용하여 데이터 모델들 및 트랜잭션 언어를 구현한다. 다른 블록체인 접근법들과 달리, 특수화된 하드웨어가 필요하지 않고, 시뮬레이션들은 이러한 접근법이 수천 클라이언트들에게 스케일 가능함을 제안한다.
보다 이상적인 셋팅에서, 생물학적 샘플들은 샘플들에 외적 코드들을 단지 태깅하는 것보다 더 신뢰가능한 기법들을 통해 트래킹될 수 있을 것이다. 따라서, 외적 코드들 또는 정보에만 의존하기보다는 생물학적 샘플의 내재적 피처들에 기초하여 전체 분석 라이프 사이클을 통해 생물학적 샘플들이 트래킹될 수 있는 새로운 시스템들 또는 방법들에 대한 필요성이 남아 있다.
본 명세서에서 식별된 모든 공개물들은 각각의 개별적 공개물 또는 특허 출원이 구체적으로 그리고 개별적으로 참조에 의해 통합되는 것으로 표시되는 것과 같이 동일한 정도로 참조에 의해 통합된다. 통합된 참조에서의 용어의 정의 또는 사용이 본원에서 제공된 그 용어의 정의와 불일치하거나 반대되는 경우에, 본원에서 제공된 용어의 정의가 적용되고, 참조에서의 그 용어의 정의는 적용되지 않는다.
일부 실시형태들에서, 본원에 기술된 주제의 소정 실시형태들을 기술하고 청구하기 위해 사용되는 농도, 반응 조건들 등과 같은 성분들의 양들, 특성들의 양들을 표현하는 수들은 용어 "약 (about)" 에 의해 일부 경우들에서 수정되는 것으로서 이해되어야 한다. 이에 따라, 일부 실시형태들에서, 쓰여진 설명 및 첨부된 청구항들에서 전개되는 수치적 파라미터들은 특정 실시형태에 의해 획득될 것으로 생각되는 요망되는 특성들에 따라 변화할 수 있는 근사치들이다. 일부 실시형태들에서, 수치적 파라미터들은 리포팅된 유효 숫자들의 수를 고려하고 보통의 라운딩 기법들을 적용함으로써 해석되어야 한다. 본원에 기술된 주제의 일부 실시형태들의 넓은 범위에서 전개되는 수치적 범위들 및 파라미터들은 근사치들임에도 불구하고, 구체적인 예들에서 전개되는 수치적 값들은 실시가능한만큼 정확하게 리포팅된다. 본원에서 기술된 주제의 일부 실시형태들에서 제시된 수치적인 값들은 그것들 각각의 시험 측정들에서 발견된 표준 편차로부터 필수적으로 초래되는 소정의 에러들을 포함할 수도 있다.
문맥상 반대로 진술되지 않는 한, 본원에서 전개되는 모든 범위들은 그것들의 끝점들을 포함하는 것으로서 해석되어야 하고, 종점 개방형 범위들은 오직 상업적으로 실시가능한 값들을 포함하는 것으로 해석되어야 한다. 유사하게, 값들의 모든 리스트들은 문맥상 반대로 나타내지 않는 한 중간 값들을 포함하는 것으로서 고려되어야 한다.
본원의 설명에서 그리고 이어지는 청구항들 전체에 걸쳐서 사용되는 바와 같이, 부정관사 및 정관사 "a", "an", 및 "the" 의 의미는 문맥상 명확하게 달리 진술되지 않는 한 복수의 언급을 포함한다. 또한, 본원의 설명에서 사용되는 바와 같이, "에서 (in)" 의 의미는 문맥상 달리 명확하게 진술되지 않는 한 "에서 (in)" 및 "상에서 (on)" 를 포함한다.
본원에서의 값들의 범위들의 기재는 단지 그 범위 내에 속하는 각각의 별개의 값에 대해 개별적으로 언급하는 약기 방법으로서 기능하도록 의도된다. 본원에서 달리 나타내지 않는 한, 각각의 개별적인 값은 그것이 본원에서 개별적으로 기재된 것처럼 명세서 내로 통합된다. 본원에 기술된 모든 방법들은 본원에서 달리 표시되거나 문맥에 의해 달리 명확하게 부정되지 않는 한 임의의 적합한 순서로 수행될 수 있다. 본원에서 소정 실시형태들과 관련하여 제공된 임의의 및 모든 예들, 또는 예시적인 언어 (예컨대, "~와 같은 (such as)") 의 사용은 단지 본원에 기술된 주제를 더 잘 조명하기 위해 의도된 것이고, 달리 청구되는 본원에 기술된 주제의 범위에 대한 제한을 부과하지 않는다. 명세서에서의 어떤 언어도 본원에 기술된 주제의 실시에 필수적인 임의의 비-청구된 요소를 나타내는 것으로서 해석되어서는 아니된다.
본원에 개시된 본원에서 기술된 주제의 대안적 요소들 또는 실시형태들의 그룹핑들은 제한하는 것으로서 해석되어서는 아니된다. 각 그룹 멤버는 본원에서 발견되는 그룹 또는 다른 요소들의 다른 멤버들과의 임의의 결합으로 또는 개별적으로 지칭되고 청구된다. 그룹의 하나 이상의 멤버들은 편의성 및/또는 특허성의 이유들로 그룹에 포함되거나 그룹으로부터 삭제될 수 있다. 임의의 이러한 포함 또는 삭제가 발생할 때, 명세서는 수정된 것으로서 그 그룹을 포함하고 따라서 첨부된 청구항들에서 사용되는 모든 마쿠쉬 그룹들의 쓰여진 설명을 충족하는 것으로서 본원에서 간주된다.
요약
본원에 기술된 주제는, 생물학적 샘플들이, 샘플 상태들의 디지털 체인 (예컨대, 블록체인 등) 을 생성함으로써 그 생물학적 샘플의 관찰된 내재적 특성들에 기초하여 워크플로우를 통해서 전자적으로 트래킹될 수 있는 장치들, 시스템들, 컴퓨터 판독가능 매체들, 또는 방법들을 제공한다. 본원에 기술된 주제의 하나의 양태는 샘플 데이터베이스, 샘플 트래킹 엔진, 및 가능하게는 샘플 검색 엔진을 포함하는 생물학적 샘플 트래킹 시스템을 포함한다. 샘플 데이터베이스는 비-일시적 (non-transitory), 컴퓨터 판독가능 메모리 상에 샘플 트래킹 체인들 (즉, 샘플의 라이프 사이클 전체에 걸친 생물학적 샘플 상태들의 체인) 을 저장하도록 구성된 컴퓨팅 디바이스이다. 샘플 트래킹 체인은, 통상적인 실시형태들에서, 가능하게는 단일 감사 단서를 형성하는, 상태 디지털 오브젝트들의 링크된 체인을 포함하고, 여기서, 각각의 상태 오브젝트는 그것의 라이프 사이클의 시간에서의 포인트에서 타겟 생물학적 샘플을 표현하도록 인스턴스화된다. 샘플 트래킹 엔진은 또한, 가능하게는 컴퓨터 네트워크를 통해서 또는 내부 통신 버스를 통해서 샘플 데이터베이스와 커플링된 컴퓨팅 디바이스 (예컨대, 서버, 워크스테이션, 셀 폰, 클라우드 디바이스 등) 를 이용하여 구현된다. 샘플 트래킹 엔진은 적어도 하나의 프로세서 및, 소프트웨어 명령들을 저장하는 컴퓨터 판독가능, 비-일시적 메모리를 포함한다. 프로세서에 의한 소프트웨어 명령들의 실행 시에, 샘플 트래킹 엔진은 타겟 생물학적 샘플의 하나 이상의 관찰된 상태들을 프로세싱하도록 구성가능하다. 샘플 트래킹 엔진은, 샘플 트래킹 체인이 타겟 생물학적 샘플에 관련되는 샘플 데이터베이스에서 적어도 하나의 샘플 트래킹 체인에 대한 액세스를 획득한다. 샘플 트래킹 엔진은 추가적으로, 샘플 트래킹 체인으로부터, 적어도 하나의 이전 샘플 상태 오브젝트, 예를 들어 이전 샘플 상태로부터의 블록 데이터를 취출한다. 샘플 트래킹 엔진은, 타겟 생물학적 샘플의 내재적 특성들 또는 피처들을 포함하는; 예컨대, 전체 슬라이드 이미지, 샘플의 현미해부된 이미지, 밀도 측정치들, 또는 다른 디지털 데이터를 포함하는, 관찰된 상태를 나타내는 현재 상태를 생성함으로써 계속된다. 이전 트래킹 상태 오브젝트 및 현재 상태를 이용하여, 샘플 트래킹 엔진은 현재 샘플 상태 오브젝트; 데이터의 새로운 블록을 인스턴스화하거나 그 외에 도출한다. 샘플 트래킹 엔진은 또한 샘플 트래킹 체인에서 이전 샘플 상태 오브젝트에 현재 샘플 상태 오브젝트를 링크한다. 예를 들어, 이전 샘플 상태 오브젝트는 이전 샘플 상태와 연관된 데이터의 해시 다이제스트 (hash digest) 를 포함할 수 있다. 이전 해시 다이제스트는 현재 해시 다이제스트를 생성하기 위해 현재 상태로부터의 데이터와 연쇄적으로 연결될 수 있고, 따라서, 현재 해시 다이제스트는 이전 해시 다이제스트에 의존적이고, 그에 의해 현재 샘플 상태 오브젝트를 그것들의 해시 값들을 통해 이전 샘플 상태 오브젝트에 링크한다. 일부 실시형태들에서, 샘플 트래킹 체인은 샘플-특정적 감사 단서로 고려될 수 있는 블록체인을 포함한다. 샘플 트래킹 엔진은 또한, 샘플 트래킹 체인이 현재 샘플 상태 오브젝트를 포함하도록 샘플 데이터베이스에서 샘플 트래킹 체인을 업데이터할 수 있다.
다른 양태들에서, 해시 다이제스트들은 사회 보장 번호, 생일, 외부 공증 데이터, 또는 시간의 함수로서의 변수가 아닌 다른 식별 정보를 포함하는 정적 데이터 (static data) 를 이용하여 생성될 수도 있다. 일부 실시형태들에서, 정적 데이터로부터의 해시 다이제스트는 동일한 정적 데이터의 후속하는 해시에 대한 비교를 위해 저장될 수도 있다. 이것은 유리하게는 정적 데이터가 손상이나 변형되지 않았음에 대한 추가적인 검증을 제공할 수 있다. 기원 블록 (genesis block) 이 정적 데이터로 이루어지는 경우들에서, 이것은 전체 기원 블록의 유효화를 제공할 수 있다.
본원에 기술된 주제의 다양한 목적들, 특징들, 양태들 및 이점들은, 동일한 부호들은 동일한 컴포넌트들을 나타내는 첨부 도면들과 함께 선호되는 실시형태들의 이하의 상세한 설명으로부터 보다 명백하게 될 것이다.
도 1 은 본원에 개시된 기법들의 일 실시형태에 따른, 생물학적 샘플 라이프 사이클의 개관이다.
도 2 는 본원에 개시된 기법들의 일 실시형태에 따른, 샘플의 내재적 정보를 레버리징하는 생물학적 샘플 트래킹 시스템의 일 예시적인 실시형태를 나타낸다.
도 3 은 본원에 개시된 기법들의 일 실시형태에 따른, 데이터 구조로서 샘플 트래킹 체인의 일 예시적인 개략도를 나타내고, 여기서, 체인은 내재적 샘플 상태 정보의 블록들을 포함한다.
도 4 는 본원에 개시된 기법들의 일 실시형태에 따른, 샘플 트래킹 체인들을 형성하거나 그 외에 관리하는 것을 통해 생물학적 샘플들을 트래킹하는 방법을 나타낸다.
도 5 는 본원에 개시된 기법들의 일 실시형태에 따른, 현미해부 전의 그리고 후의 슬라이드 상에 준배된 종양 조직 시료의 실세계의 예시적인 이미지를 나타낸다.
컴퓨터에 관한 임의의 언어는 서버들, 인ㅌ페이스들, 시스템들, 데이터베이스들, 에이전트들, 피어들, 엔진들, 제어기들, 모듈들, 또는 개별적으로 또는 집합적으로 작동하는 다른 타입들의 컴퓨팅 디바이스들을 포함하는, 컴퓨팅 디바이스들이 임의의 적합한 조합을 포함하도록 읽혀져야 함에 유의하여야 한다. 컴퓨팅 디바이스들은 유형의, 비-일시적인 컴퓨터 판독가능 저장 매체 (예컨대, 하드 드라이브, FPGA, PLA, 솔리드 스테이트 드라이브, RAM, 플래시, ROM 등) 를 실행하도록 구성된 적어도 하나의 프로세서를 포함함을 이해하여야 한다. 소프트웨어 명령들은 개시된 장치에 관해 이하에서 논의되는 바와 같이 역할들, 의무들, 또는 다른 기능성을 제공하도록 컴퓨팅 디바이스를 구성하거나 프로그래밍한다. 또한, 개시된 기술들은, 프로세서로 하여금 컴퓨터 기반 알고리즘들, 프로세스들, 방법들, 또는 다른 명령들의 구현들과 연관된 개시된 단계들을 실행하게 하는 소프트웨어 명령들을 저장하는 비-일시적 컴퓨터 판독가능 매체를 포함하는 컴퓨터 프로그램 제품으로서 구현될 수 있다. 일부 실시형태들에서, 다양한 서버들, 시스템들, 데이터베이스들, 또는 인터페이스들은 가능하게는 HTTP, HTTPS, TCP/IP, UPD/IP, AES, 공개-비밀 키 교환들, 웹 서비스 API 들, 알려진 금융 거래 프로토콜들, 또는 다른 전자적 정보 교환 방법들에 기초하여, 표준화된 프로토콜들 또는 알고리즘들을 이용하여 데이터를 교환한다. 디바이스들 사이의 데이터 교환들은 패킷-교환 네트워크, 인터넷, LAN, WAN, VPN, 또는 다른 타입의 패킷 교환 네트워크; 회선 교환 네트워크; 셀 교환 네트워크; 또는 다른 타입의 네트워크를 통해 수행될 수 있다.
본원의 설명 및 이어지는 청구항들 전체에 걸쳐 사용되는 바와 같이, 시스템, 엔진, 서버, 디바이스, 모듈, 또는 다른 컴퓨팅 엘리먼트가 메모리에서의 데이터에 대해 함수들을 수행 또는 실행하도록 구성되는 것으로서 설명될 때, "~ 하도록 구성되는" 또는 "~ 하도록 프로그래밍되는" 의 의미는 컴퓨팅 엘리먼트의 하나 이상의 프로세서들 또는 코어들이 메모리에 저장된 타겟 데이터 또는 데이터 오브젝트들에 대해 함수들의 셋트를 실행하도록 컴퓨팅 엘리먼트의 메모리에 저장된 소프트웨어 명령들의 셋트에 의해 프로그래밍되는 것으로서 정의된다. "~ 하도록 구성되는" 또는 "~ 하도록 프로그래밍되는" (또는 유사한 언어) 의 사용은 35 USC 112(f) 하의 해석을 유발하도록 해석되어서는 아니된다.
개시된 기법들은 생물학적 샘플 데이터에 대한 저 레이턴시 액세스를 제공하는 한편 또한 물리적인 샘플에 대한 샘플 트래킹 체인에서 데이터를 유효하게 하기 위한 기법들을 제공하는 것을 포함하는 많은 유리한 기술적 효과들을 제공한다. 이에 따라, 본 기법들은 데이터, 특히, 시간이 함수로서 외관에서 변화할 수도 있는 오브젝트에 대응하는 데이터의 유효성을 크게 향상시키기 위한 방식을 제공한다. 다른 이점들은, 예컨대, 프로세싱 단계들이 발생한 후에 샘플의 하나 이상의 특성들을 예측하기 위한 능력과 같은, 예측 능력들을 포함한다. 본원에 제시된 기법들의 또 다른 이점들은, 샘플이 이전 상태에서와 같이 보인 것을 재구성하기 위해, 예컨대, T3 로부터 T2 로, T2 로부터 T1 으로, T1 으로부터 T0 로, 이전 상태로 샘플 트래킹 체인을 백트래킹하기 위한 능령을 포함한다. 메모리에 저장된 샘플 트래킹 체인 데이터 구조의 사용을 통해서, 샘플에 관한 내재적 정보 (예컨대, 사이즈, 형상, 텍스처, 피처들 등) 는 외재적 정보 (예컨대, 바 코드들, RFID 등) 를 필요로 함이 없이 샘플 정보를 직접적으로 액세스하기 위한 인덱스로서 사용될 수 있다. 또한, 샘플의 내재적 피처들은 샘플의 현재 상태가 사실 동일한 샘플의 이전 상태에 대해 샘플의 유효한 상태임을 입증하기 위해 사용될 수 있다.
본원에 기술된 개시의 주제의 초점은 인간의 능력들을 넘어서, 생물학적 샘플 데이터의 형태의 방대한 양들의 디지털 데이터에 대해 동작하도록 컴퓨팅 디바이스의 구축 또는 구성을 가능하게 하는 것이다. 디지털 데이터는 생물학적 샘플들 또는 샘플 상태들을 나타내지만, 그 디지털 데이터는 샘플 그자체가 아니라 관찰된 샘플의 하나 이상의 디지털 모델들의 표현임을 이해하여야 한다. 컴퓨팅 디바이스(들)의 메모리에서 샘플의 내재적 피처들로붙의 이러한 디지털 모델들의 인스턴스와에 의해, 이 경우의 샘플 트래킹 체인들에서, 컴퓨팅 디바이스(들)는 사용자가 이러한 툴 없이 부족할 유틸리티를 컴퓨팅 디바이스의 사용자에게 제공하는 방식으로 디지털 데이터 또는 모델들을 관리할 수 있다.
이하의 논의는 본원에 기술된 주제의 많은 예시적인 실시형태들을 제공한다. 각 실시형태는 발명적 엘리먼트들의 단일 조합을 나타냄에도 불구하고, 본원에 기술된 주제는 개시된 엘리먼트들의 모든 가능한 조합들을 포함하는 것으로 고려된다. 따라서, 하나의 실시형태가 엘리먼트들 A, B, 및 C 를 포함하고, 제 2 실시형태가 엘리먼트들 B 및 D 를 포함하는 경우에, 본원에 기술된 주제는 또한 명시적으로 개시되지 않는 경우에도 A, B, C, 또는, D 의 다른 나머지 조합들을 포함하는 것으로 또한 고려된다.
본 명세서에서 사용된 바와 같이, 그리고 문맥상 달리 진술하지 않는 한, "~ 에 커플링된" 이라는 용어는 (서로 정보적으로 커플링된 2 개의 엘리먼트들이 서로 접촉하는) 직접적 커플링 (coupling) 및 (적어도 하나의 추가적인 엘리먼트가 그 2 개의 엘리먼트들 사이에 위치하는) 간접적 커플링 양자를 포함하도록 의도된다. 따라서, 용어들 "~ 에 커플링된" 및 "~ 와 커플이된" 은 같은 뜻으로 사용된다.
도 1 은 본원에 기술된 주제가 채용되는 예시적인 샘플 워크플로우 환경 (100) 을 나타낸다. 환경 (100) 은 생물학적 분석 (예컨대, 질량 분석법, 전체 게놈 시퀀싱, 전체 엑솜 시퀀싱, RNA-시퀀싱 등) 을 위해 하나 이상의 현미해부된 샘플들을 형성할 목적으로 분석 워크플로우를 통해 흐르는 생물학적 샘플 (120A) (예컨대, 종양 샘플, 정상 조직 등) 의 관점에서 제시된다. 생물학적 샘플 (120A) 은 환자 (110) 로부터 추출된 조직; 예를 들어 종양 조직을 나타낸다. 이하의 논의는 생물학적 샘플 (120A) 이 종양 조직 샘플인 관점에서 본원에 기술된 주제를 나타내지만, 개시된 기법들은 타액, 소변, 혈액, 대변, 피부, 모발 또는 환자 (110)로부터 얻은 다른 시료들을 포함하는 다른 타입들의 생물학적 샘플들에 대해 적응될 수 있음을 이해하여야 한다. 또한, 환자 (110) 는 인간으로서 제시된다. 하지만, 환자 (110) 는 또한 다른 형태들의 포유동물들 또는 심지어 일반적으로 다른 동물들일 수 있다. 따라서, 개시된 기법들은 수의 과학, 축산학, 환경 연구, 토양 샘플, 보석 가공, 머신 부품 생산 트래킹, 미술 복원, 지질학적 연구, 임상 시험, 장기 종단적 연구, 또는 시간에 걸쳐 샘플들이나 시료들을 트래킹하기 위해 엄격함이 필요한 다른 영역들을 포함하는, 인간 건강관리를 넘어선 다른 시장들에서 가치있는 것이다. 예를 들어, 개시된 기법들은 블록체인-기반 감사 단서를 생성하기 위해 사용될 수 있다.
생물학적 샘플 (120A) 은 알려진 기법들 또는 아직 발명될 것들을 이용하여 환자 (110) 로부터 획득될 수 있다. 통상적으로 생물학적 샘플 (120A) 은 외재적 정보를 레버리징 (leveraging) 하는 몇몇 방식 (예컨대, 바 코드들, QR (Quick Response) 코드들, RFID (Radio Frequency Identification) 등) 으로 태깅되거나 코딩될 것이다. 예를 들어, 생물학적 샘플 (120A) 은 QR 코드가 부착되는 바이오-안전 용기 내에 놓일 수 있다. QR 코드는 가능하게는 환자 이름, 환자 식별자, 타임 스탬프, 또는 다른 외재적 정보를 포함하는 환자-특정적 정보로 코딩될 수 있다. 보다 흥미롭게, 생물학적 샘플 (120A) 의 성질, 또는 그보다는 생물학적 샘플 (120A) 의 내재적 특성들 또는 피처들이 또한 그 샘플을 식별하고 트래킹하기 위해 사용될 수 있다. 예를 들어, 샘플의 다음과 같은 내재적 특성들의 하나 이상이 시료에 대한 라벨 내로 인코딩될 수 있다: 사이즈, 형상, 컬러, 질량, 중량, 밀도, 길이, 폭, 부피, 조직 타입, 세포주, 게놈 시퀀스들, 샘플이 획득된 로케이션, 샘플이 획득된 날짜, 샘플이 놓이는 컨테이너의 외관, 샘플의 외관, 시료 또는 시료들에 관한 다른 내재적 정보. 이하에서 논의되는 바와 같이, 내재적 정보, 특히 샘플 상태 정보는 샘플 데이터베이스 내의 생물학적 샘플 (120A) 에 관한 정보를 인덱싱하기 위해 사용될 수 있다.
도 1 에서의 예로 계속하면, 생물학적 샘플 (120A) 이, 생물학적 샘플들 (120B) 에 의해 표현되는 바와 같이 하나 이상의 슬라이드들 상에 배치되는 다수의 조직 슬라이스들의 형태를 취하는 다음 상태로 변환되는 워크플로우에서의 다음 스테이지를 고려하자. 명확하게, 예의 이 스테이지에서, 원래의 시료는 슬라이드들 상에 놓여진, 하지만 표시된 바와 같이 아직 착색되지 않은 다수의, 구분되는 시료들로 변환된 것이 가능함을 이해하여야 한다. 이러한 변환 후에, 생물학적 샘플들 (120B) 의 각각은 그들 자신의 내재적 특성들을 가지거나 공유된, 유사한 내재적 특성들을 가질 수 있을 것이다. 예를 들어, 슬라이드 상의 각각의 슬라이스는 그 자신의 고유한 구체적인 내재적 형상 또는 텍스ㅊ를 가질 것인 한편, 슬라이스들 전체는, 특히 슬라이드들이 시료로부터 이웃하는 슬라이스들인 경우에, 유사한 전반적인 형상을 가질 수도 있을 것이다. 이들 내재적 특성들의 하나 이상은 시료들을 개별적으로 또는 집합적으로 식별하거나 트래킹하기 위해 레버리징되는 디지털 시그니처들 (digital signatures) (즉, 내재적 피처들) 을 형성하기 위해 디지털로 정량화될 수 있다. 이들 새롭게 생성된 디지털 시그니처들은 또한, 생물학적 샘플 (120B) 에 관한 정보를 인덱싱하기 위해 서용될 수 있고, 또한 시료들의 현재 상태의 디지털 표현들일 수 있다. 보다 구체적으로, 디지털 시그니처들은 형상 디스크립터들 (예컨대, 원형, 에지들 등), 이미지 디스크립터들 (예컨대, SIFT, DAISY 등), 또는 샘플의 다른 타입들의 디지털 피처들을 포함할 수 있을 것이다. 이들 디지털 피처들은 또한 내재적 피처들 또는 특성들로서 지칭된다. 또한, 도 2 에 관해 이하에서 보다 자세히 논의되는 바와 같이, 디지털 시그니처들은, 다른 바람직한 정보와 함께, 이전 상태 정보에 링크되어 그에 의해 샘플 상태들의 체인을 형성할 수 있다.
워크플로우 (100) 에서의 다음 스테이지는 시료들의 또 다른 변환을 포함하고, 여기서, 각각의 조직 슬라이스는 하나 이상의 염료들을 이용하여 착색되고 그에 의해 생물학적 샘플들 (120C) 을 형성한다. 이 특정 예에서, 물리적 시료들은 생물학적 샘플들 (120B) 로부터의 동일한 시료들임을 이해하여야 한다. 하지만, 생물학적 샘플들 (120C) 은 물리적 시료들의 새로운 상태를 나타낸다. 개별 착색된 슬라이드들은 샘플의 상이한 또는 다양한 구조들을 강조하기 위해 상이하게 착색될 수도 있음이 가능하다. 예를 들어, 하나의 슬라이드는 세포 구조들을 강조하기 위해 톨루이딘 블루 (toluidine blue) 로 착색될 수도 있을 것이고, 핵산들을 식별하기 위해 헤마톡실린 (hematoxylin) 이 사용될 수 있을 것이며, 혈액 세포들을 식별하기 위해 라이트 염색액 (Wright's stain) 이 사용될 수 있을 것이고, 또는 다른 타입들의 염색액들이 사용될 수 있을 것이다. 이 스테이지에서, 생물학적 샘플들 (120C) 의 관찰된 상태로부터 도출될 수 있는 수많은 가능한 내재적 특성들이 존재한다. 내재적 특성들의 예들은 셀 클러스터링, 핵 밀도 또는 카운트, 컬러 채널 디스크립터들 (예컨대, RGB (red green blue), HSV (hue saturation value), 파장들 등) 을 포함하고, 이들은 착색, 형상들, 세포 경계들, 조직 경계들, 또는 착색 시 보다 두드러질 수 있는 다른 타입들의 내재적 특성들에 의존할 수 있다. 다시, 상기 논의된 바와 같이, 내재적 특성들을 나타내는 디지털 피처들은 샘플 정보를 인덱싱하고 이 특정 상태를 식별하기 위해 사용될 수 있다. 추가로, 상기에서도 논의된 바와 같이, 관찰된 상태 및 디지털 피처들에 관한 정보는 생물학적 샘플들 (120B) 의 이전 상태 정보에 링크될 수 있다.
예를 들어, 생물학적 샘플들 (120C) 이 슬라이드들 상에 놓인 종양 조직 샘플들을 나타내는 경우에, 병리학자는 세포들을 암으로서 태깅하기 위해 각 슬라이드를 검토할 수도 있을 것이다. 병리학자는 관심 구역들 주위의 경계들, 현미해부 마스크들, 또는 다른 관심 포인트들을 식별할 수 있다.
워크플로우 (100) 에서 예시된 다음 스테이지는 생물학적 샘플들 (120D) 을 포함하고, 이 생물학적 샘플들 (120D) 은 가능하게는 레이저 캡처 현미해부 (laser capture microdissection; LCM) (2004년 6월 4일 출원된 Ringeisen 등에 대한 "Biological Laser Printer for Tissue Microdissection via Indirect Photon-Biomaterial Interaction" 라는 제목의 미국 특허 제 7,381,440 호 참조) 를 통한 생물학적 샘플들 (120C) 의 현미해부된 버전들을 나타낸다. 이 스테이지에서, 도시된 바와 같은 예시적인 워크플로우 (100) 는 적어도 2 개의 평행한 경로들로 분할된다. 하나의 경로에서, 현미해부 프로세스로부터 획득된 캡처된 세포들 (130) 은 추가적인 분석을 위해 전송된다. 예를 들어, 캡처된 세포들 (130) 은 전체 게놈 시퀀싱, RNA 시퀀싱, 단백질 유전 정보 분석, 전체 엑솜 시퀀싱, 또는 다른 타입들의 분석을 위해 프로세싱될 수 있다. 일부 실시형태들에서, 그 현미해부된 세포들은 Expression Pathology (URL www.expressionpathology.com 참조) 에 의해 제공되는 또는 2004 년 3월 10일 출원된 Darfler 등에 대한 "Liquid Tissue Preparation from Histopathologically Processed Biological Samples, Tissues and Cells" 라는 제목의 미국 특허 제 7,473,532 호에서 기술된 바와 같은 것들과 같이 Liquid Tissue® SRM Assays 를 통해 프로세싱된다.
일부 양태들에서, 디렉터 슬라이드 (director slide) 가 다른 슬라이드들, 예컨대, 두꺼운 슬라이스 현미해부 슬라이드들에서의 레이저 해부를 안내하기 위한 템플릿으로서 준비될 수도 있다. 디렉터 슬라이드는 당해 기술분야에서 알려진 기법들 (예컨대, URL www.expressionpathology.com /director_microdissection.shtml 참조) 에 기초하여 준비될 수도 있다. 디렉터 슬라이드들은 에너지 전사 코팅을 이용하고 유리 지지체에 본딩된다. 조직 섹션들 (예컨대, 얇은 조직 슬라이스들) 은 그 에너지 코팅의 상부에 위치되고, UV 펄스는 에너지 코팅을 기화시키고 세포들을 수집 튜브 내로 추진시켜, 정밀한 레이저 해부 및 세포들의 수집을 허용한다.
다수의 슬라이드들이 현미해부에 의해 프로세싱되는 경우에, 디렉터 슬라이드는 후속 슬라이드들 (예컨대, 두꺼운 슬라이스들) 을 프로세싱하기 위한 템플릿으로서 사용될 수 있다. 환자로부터 획득된 조직에 대해, 그 조직은 냉동되고 슬라이스화되어서, 비정상 세포들이 그 조직의 특정 공간적 로케이션들에 대하여 다수의 슬라이스들 전체에 걸쳐 분포되도록 한다. 디렉터 슬라이드를 이용함으로써, 기술자는, 디렉터 슬라이드에서 타겟팅된 구역들이 또한 후속 슬라이드들 (조직의 인접한 슬라이스들) 에서의 해부를 위해 또한 타겟팅되는 것을 보장할 수 있어서, 다수의 슬라이드들 전체에 걸쳐 분포된 샘플의 특정 구역으로부터의 세포들이 수집되고 프로세싱되는 것을 보장하도록 돕는다.
일단 적절하게 준비되고 나면, 그 준비된 것들은 하나 이상의 질량 스펙트럼 (145) 을 생성하기 위해 질량 분석계 (140) 로 패스된다. 워크플로우 (100) 경로를 따른 각각의 스텝, 스테이지, 또는 상태는 샘플들의 대응하는 상태의 내지적 특성들 또는 피처들을 생성하기 위해서 하나 이상의 센서들 (예컨대, 디지털 카메라들, 현미경들, 프로브들, 질량 분석계 등) 을 통해 또한 관찰될 수 있을 것이다. 따라서, 경로의 최종 결과, 질량 스펙트럼 (145) 조차도, 캡처된 세포들 (130) 의 내재적 특성 및 생물학적 샘플들 (120D) 의 내재적 특성들로 고려된다.
현미해부 후에, 제 2 경로를 따라서, 생물학적 샘플들 (120C) 의 디지털로 관찰된 상태는 관심대상의 내재적 특성들을 포함할 수 있다. 일 예로서, 샘플들 (120D) 에서의 현비해부 후에 뒤에 남겨진 홀들을 고려하자. 각각의 홀 (hole) 은 (프로세싱, 예컨대 해부 후의) 생물학적 샘플들 (120D) 에 대응하는 상태를 나타내는 디지털 피처들을 생성하기 위해 디지털로 특성화될 수 있다. 이전 스테이지들에서와 같이, 생물학적 샘플들 (120C) 로부터 도출된 디지털 피처들 (예컨대, 형상 디스크립터들, 홀 형상들, 홀 배열들 등) 은 시료에 관한 정보를 인덱싱하거나 그 시료를 식별하기 위해 사용될 수 있다. 이들 피처들은 또한 이전 상태들에 대해 다시 역으로 링크하기 위해 사용될 수 있다.
마지막으로, 나타낸 예에서, 최종 상태가 워크플로우 (100) 에서 달성된다. 이 경우에, 샘플들의 최종 버전은 저장 설비 (150) 에 저장된다. 저장 로케이션 정보는 또한 이전 상태들에 다시 역으로 링크될 수 있고, 그에 의해, 전체 라이프 사이클 샘플 트래킹 체인 또는 블록체인 감사 단서를 형성한다. 스테이지 너머의 추가적인 스테이지들이 또한 존재할 수 있고, 샘플 트래킹 체인의 이전 상태들에 묶일 수 있음을 추가로 이해하여야 한다. 예를 들어, 추가적인 검토를 수행하기 위해서 사람이 저장 설비 (150) 로부터 샘플을 취출 (retrieve) 할 수도 있을 것이다. 그렇다면, 이벤트의 하나 이상의 양태들 (예컨대, 샘플의 취출, 샘플을 취출한 사용자, 샘플의 취출 날짜, 샘플이 저장소로부터 제거되었던 시간의 길이 등) 이 그 시점에서의 샘플의 현재의 내재적 특성들과 함께 이하에서 설명되는 샘플 트래킹 체인 내에 레코딩 및 로깅될 수 있다.
워크플로우 (100) 와 연관된 환경이 현미해부를 위해 준비되는 생물학적 샘플의 관점으로부터 제시됨에도 불구하고, 그것들의 내재적 특성들을 통한 트래킹 샘플들의 핵심 피처들은 모두 종양 샘플들 너머의 다른 타입들의 샘플들에 적용될 수 있음을 이해하여야 한다. 따라서, 본 발명의 주제는 타액, 소변, 혈액, 난자, 정자, 대변, 피부, 땀, 또는 다른 타입들의 생물학적 샘플들을 포함하는 다른 타입들의 샘플들의 트래킹을 커버하는 것으로 생각된다. 본 발명의 기법들은 일반저긍로 포유류, 야생생물, 원생생물, 균류, 식물들, 또는 다른 유기체들을 포함하는 인간 너머의 다른 타입들의 유기체들에 적용될 수 있음이 또한 구체적으로 고려된다. 또 추가적으로, 본 기법들은 환경 연구 (예컨대, 지질학적 샘플들, 플롯 연구 샘플들, 물 샘플들, 토양 샘플들 등) 관리, 공급 체인 관리, 임상 시험, 연구 개발 프로젝트들, 보석 공급 체인 트래킹, 보석 가공, 제조, 노트북 트래킹, 축산업 (예컨대, 말, 개 사육 등) 을 포함하는 샘플 트래킹 너머의 다른 영역들, 또는 상태 정보가 오브젝트들의 내재적 특성들을 통해 트래킹될 수 있는 영역들에서의 사용을 위해 적응될 수 있다.
도 2 는 생물학적 샘플의 내재적 특성들 또는 피처들이 샘플 트래킹 체인 (212) 을 생성하기 위해 사용되는 샘플 트래킹 환경 (200) 을 나타낸다. 샘플 데이터베이스 (210) 는 샘플 트래킹 체인 (212) 의 하나 이상을 저장하고, 각각의 샘플 트래킹 체인 (212) 은 생물학적 샘플의 라이프 사이클 또는 가능하게는 감사 단서를 나타낸다. 비록 하나의 이해관계자, 사용자 (205) 가 예시되지만, 이 환경은 샘플 트래킹 체인 (212) 의 하나 이상과 상호작용하기를 희망하는 다수의 사용자들 또는 다른 이해관계자들을 지원할 수 있음을 이해하여야 한다.
샘플 트래킹 체인 (212) 은 컴퓨터 판독가능한 비-일시적 메모리에 저장된 하나 이상의 디지털 데이터 레코드들을 나타낸다. 도시된 예에서, 샘플 트래킹 체인 (212) 은 예를 들어 하드 디스크 상에 또는 RAM 내에 파일 시스템에서의 레코드들로서 샘플 데이터베이스 (210) 의 메모리에 저장된다. 샘플 데이터베이스 (210) 는 샘플 데이터베이스 (210) 의 인덱싱 시스템에 따라 정의될 수 있는 하나 이상의 쿼리 (query) 기준들에 기초하여 샘플 트래킹 체인 (212) 에 관련된 데이터를 취출하도록 구성된 컴퓨팅 디바이스이다. 일부 실시형태들에서, 샘플 데이터베이스 (210) 및/또는 샘플 트래킹 엔진 (220) 은 샘플 트래킹 검색 엔진으로서 동작할 수 있다. 샘플 데이터베이스 (210) 를 구축함에 있어서 사용하기에 적합한 예시적인 데이터베이스 기술들은 단지 몇 가지만 들어보면 MySQL, No SQL, MongoDB, Riak, CouchDB, OpenCog, 또는 ArangoDB 를 포함한다. 일부 실시형태들에서, 샘플 데이터베이스 (210) 는 또한, 메모리에서의 룩-업 테이블 (look-up table) 또는 심지어 샘플 트래킹 체인들 (212) 을 포함하는 전체 블록체인을 포함할 수 있을 것이다. 샘플 트래킹 체인 (212) 이 블록체인으로서 구현되는 경우, 샘플 데이터베이스 (210) 는 쿼리들을 수용하도록 구성된 블록체인 브라우저로서 구현될 수 있을 것이다. 샘플 트래킹 체인 (212) 또는 그것의 개별 상태 오브젝트들은 샘플의 다양한 상태들의 대응하는 내재적 특성들에 의해 인덱싱된다.
샘플 데이터베이스 (210) 는 샘플 트래킹 엔진 (220) 과 커플링되어 샘플 트래킹 엔진 (220) 이 샘플 트래킹 체인 (212) 을 액세스하도록 허용한다. 일부 실시형태들에서, 나타낸 바와 같이, 샘플 트래킹 엔진 (220) 은 네트워크 (215) (예컨대, 인터넷, 인트라넷, WAN, LAN, WLAN, P2P, 무선, 셀룰러, 애드-혹 등) 를 통해 샘플 데이터베이스 (210) 와 통신가능하게 커플링된다. 네트워크 (215) 는 무선 네트워크 (예컨대, WUSB, 802.11, 802.15, 802.16, 셀룰러 등), 유선 네트워크 (이더넷, 회선 교환망, ATM 등), 또는 무선 및 유선 네트워크들의 조합을 포함할 수 있다.
샘플 트래킹 엔진 (220) 은 그것들의 내재적 특성들 또는 피처들을 통해 생물학적 샘플들을 트래킹하도록 구성된 컴퓨팅 디바이스를 포함한다. 일부 실시형태들에서, 샘플 트래킹 엔진 (220) 은 웹 인터페이스 (예컨대, HTTP, HTTPS, TCP/IP, UDP/IP 등) 를 통해 그것의 서비스들에 대한 액세스를 제공하는 서버 시스템을 포함한다. 다른 실시형태들에서, 샘플 트래킹 엔진 (220) 은 또한, 샘플 트래킹 엔진 (220) 에 대해 로컬로 (예컨대, 동일한 컴퓨터 내에서, 동일한 네트워크 상에서) 또는, 샘플 트래킹 엔진 (220) 에 대해 원격으로 (예컨대, 인터넷, WAN 등을 통해) 샘플 데이터베이스 (210) 를 액세스 가능한 워크스테이션 또는 심지어 모바일 디바이스를 포함할 수 있다. 또 다른 실시형태들에서, 샘플 트래킹 엔진 (220) 은 가능하게는 하나 이상의 기존의 클라우드 시스템들 (예컨대, Amazon AWS, Microsoft Azure, Google Cloud 등) 에 기초하여 클라우드 기반 인프라스트럭처 (예컨대, IaaS, PaaS, SaaS, Chain-as-a-Service 등) 로서 동작할 수 있다.
샘플 트래킹 엔진 (220) 은 생물학적 샘플에 관련된 정보를 트래킹, 저장, 또는 액세스하는데 사용자 (205) 를 보조하는 것과 관련하여 환경 (200) 내에서 수많은 역할들 및 임무들을 갖는다. 사용자 (205), 예를 들어 병리학자는 상태 정보가 샘플 트래킹 체인 (212) 으로서 저장된 (또는 저장될) 생물학적 샘플로 작업한다. 사용자 (205) 는 샘플 트래킹 엔진 (220) 에 관찰된 상태 (230) 의 형태로 샘플 데이터베이스를 제공한다. 예를 들어, 관찰된 상태 (230) 는 슬라이드 상의 조직의 디지털 이미지를 포함할 수 있을 것이고, 또는, 종양 조직에 대한 현미해부 마스크들을 포함할 수 있을 것이다. 관찰된 상태 (230) 는 사용자 (205) 에 의해 동작되는 컴퓨팅 디바이스를 통해 사용자 (205) 로부터 수신되거나 사용자 (205) 에 의해 생성된 디지털 데이터를 포함한다. 예를 들어 이미지 데이터를 포함하는 관찰된 상태 (230) 의 경우에, 관찰된 상태 (230) 는 40배 배율 또는 다른 배율로 샘플 슬라이드의 적어도 부분의 디지털 이미지를 포함할 수 있을 것이다. 이 개시물 내에서 비록 디지털 이미지 데이터가 상세하게 논의되지만, 관찰된 상태 (230) 는 샘플의 성질에 따라 다른 양태들의 데이터를 포함할 수 있을 것임이 또한 고려된다. 예시적인 양태들은 오디오 데이터, 구어 발화 데이터, 생체인식 데이터, 운동감각 데이터, 촉각 데이터, 후각 데이터, 미각 데이터, 센서 데이터, 텍스처 데이터, 또는 인간 감각 내의 또는 인간 감각 너머의 다른 데이터 양태론을 포함한다.
샘플 트래킹 엔진 (220) 은 관찰된 상태 (230) 를 샘플을 트래킹하는 것으로 진행하도록 다수의 방식들로 레버리징한다. 제 1 경로에 이어서, 샘플 트래킹 엔진 (220) 은, 샘플 트래킹 체인 (212) 이 관심대상의 타겟 생물학적 샘플에 관련되는 샘플 데이터베이스 (210) 로부터 샘플 트래킹 체인 (212) 의 하나 이상에 대한 액세스를 획득한다. 샘플 트래킹 엔진 (220) 은 관찰된 상태 (230) 로부터의 관심 대상의 샘플에 관련된 정보의 하나 이상의 조각들을 컴파일링한다. 일부 실시형태들에서, 관찰된 상태 (230) 는 물리적 샘플에 관한 내재적 데이터 뿐만 아니라 환자 식별자 또는 샘플 아이덴티티/식별자를 나타내는 데이터의 하나 이상의 조각들을 포함할 수 있다. 샘플 트래킹 엔진 (220) 은 예를 들어 검색 엔진으로서 동작하는 샘플 데이터베이스 (210) 의 인덱싱 시스템을 타겟팅하는 검색 쿼리 (235) 를 구축하기 위해 컴파일링된 정보 (예컨대, 환자 ID, 샘플 ID, 내재적 특성들 등) 를 레버리징한다. 예를 들어, 쿼리는 관찰된 상태 (230) 로부터의 도출된 피처들 뿐만 아니라 환자의 사회 보장 번호 및/또는 그들의 이름을 포함하는 SQL 쿼리를 포함할 수 있을 것이다.
검색 쿼리 (235) 는 샘플 데이터베이스 (210) 또는 샘플 트래킹 엔진 (220) 의 구현에 의존하여 많은 상이한 형태들을 취할 수 있다. 일부 실시형태들에서, 검색 쿼리 (235) 는 덜 구조화될 수 있을 것이고, 관찰된 상태 (230) 또는 키워드들로부터 도출된 속성-기반 값들의 셋트를 나타낼 수 있을 것이다. 속성들의 값들은 그 다음에, 샘플 데이터베이스 (210) 에 제출될 수 있고, 이 샘플 데이터베이스 (210) 는 다시 검색 쿼리 (235) 를 만족하는 유사한 속성들을 갖는 샘플 트래킹 체인들 (212) 의 부분들 또는 샘플 트래킹 체인들 (212) 의 결과들 셋트를 리턴한다. 보다 관심대상의 실시형태들에서, 검색 쿼리 (235) 는 요구되는 피처들을 포함하거나 선택적 피처들을 포함할 수 있는 검색 기준들을 포함한다. 샘플 데이터베이스 (210) 는, 가능하게는 하나 이상의 유사도 측정들에 기초하여 각각의 결과가 얼마나 잘 쿼리를 만족하는 지에 따라 랭크되고 물리적 샘플의 도출된 내재적 특성들에 기초하여 계산된 결과들 셋트를 리턴할 수 있다. 예를 들어, 유사도 측정은, 슬라이드들 상에 탑재된 조직들의 2 개의 조직 경계들 사이의 순환성에서의 차이를 계산하는 것을 포함할 수 있을 것이고, 또는, 도출된 디스크립터들과 같은 내재적 피처들 사이의 "거리 (distance)" 일 수 있을 것이다.
도시된 예에서, 샘플 트래킹 엔진 (220) 은 검색 쿼리 (235) 에 기초하여 샘플 데이터베이스 (210) 로부터 적어도 하나의 이전 샘플 상태 오브젝트 (240) 를 취출한다. 이전 샘플 상태 오브젝트 (240) 는 타겟 생물학적 샘플의 적어도 하나의 이전에 레코딩된 상태를 나타내는 인스턴스화된 데이터 오브젝트이다. 이 예에서, 타겟 생물학적 샘플은 제 때의 3 개의 스냅 샷들을 나타내는 T0, T1, 및 T2 로서 리스트된 3 개의 더 오래된 상태들을 갖는 것으로서 예시된다. 비록 샘플 데이터베이스 (210) 는 이전 샘플 상태 오브젝트 (240) 로서 T2 를 리턴하지만, 샘플 데이터베이스 (210) 는 또한 레코드가 아직 존재하지 않음을 나타내는 NULL 값을 리턴하거나, 매칭되는 샘플 트래킹 체인 (212) 의 부분을 리턴하거나, 심지어 완전한 샘플 트래킹 체인 (212) 을 리턴할 수 있을 것이다. 이전 샘플 상태 오브젝트 (240) 는 반드시 바로 이전 상태일 필요는 없다. 하지만, 대부분의 직접적인 실시형태들에서, 이전 샘플 상태 오브젝트 (240) 는 관찰된 상태 (230) 에서 관찰된 데이터에 대하여 바로 이전 상태이다.
이전 샘플 상태 오브젝트 (240) 는 다양한 기법들을 통해 패키징될 수 있다. 일부 실시형태들에서, 이전 샘플 상태 오브젝트 (240) 는 그것의 원래 형태로, 예컨대, 바이너리 레코드, 파일, 원시 텍스트, 또는 이전 샘플 상태 오브젝트 (240) 가 저장되는 다른 포맷으로서 샘플 트래킹 엔진 (220) 에 제시될 수 있다. 다른 실시형태들에서, 샘플 데이터베이스 (210) 는 이전 샘플 상태 오브젝트 (240) 를 샘플 트래킹 엔진 (220) 으로의 전달을 위해 요망되는 포맷으로 재-패키징될 수 있다. 예시적인 포맷들은 CSV 파일, 바이너리 오브젝트, BLOB, 직렬화된 데이터 구조 (예컨대, YAML, XML, JSON 등), 또는 다른 포맷들을 포함할 수 있다. 특히 관심 대상으로서, 이전 샘플 상태 오브젝트 (240) 는, 이전 샘플 상태 오브젝트 (240) 를 나타내거나 식별하는 블록 토큰, 통상적으로 해시 다이제스트를 포함할 수 있다. 일부 양태들에서, 해시 다이제스트는 정해진 사이즈의, 예컨대, 길이가 약 128 내지 256 비트들 이상인 비트 스트링이다. 해시 함수는 임의의 사이즈의 데이터를 정해진 사이즈의 해시 다이제스트에 맵핑하기 위해 사용될 수도 있다. 임의의 데이터의 하나의 비트가 변경되는 경우에, 다른 다이제스트가 해시 함수에 의해 생성될 것이다. 따라서, 해시 다이제스트들은 데이터 무결성을 트래킹하는데 및 본원에 제시된 다른 애플리케이션들에 적합하다. 다른 양태들에서, 암호 함수가 해시 다이제스트 (예컨대, SHA-256, RIPEMD, 스크립트 등) 를 생성하기 위해 사용될 수도 있다. 블록 토큰들은 이하에서 더 자세히 논의된다.
샘플 트래킹 엔진 (220) 은 또한, 관심대상의 타겟 생물학적 샘플의 관찰된 상태 (230) 를 나타내는 현재 상태 (250) 의 하나 이상을 생성하거나 그 외에 인스턴스화한다. 현재 상태 (250) 는 새로운 상태의 오브젝트의 준비에 있어서 샘플 트래킹 엔진 (220) 의 메모리에 저장된 중간 데이터 구조일 수 있다. 예를 들어, 현재 상태 (250) 는 디지털 이미지들, 비디오, 오디오, 또는 다른 형태들의 데이터를 포함하는 관찰된 상태 (230) 로부터의 데이터의 카피들을 포함할 수 있다. 현재 상태 (250) 는 단지 관찰된 상태 (230) 일 수 있는 것이 또한 가능하다. 하지만, 일부 실시형태들에서, 현재 상태 (250) 는 또한 관찰된 상태 (230) 로부터 도출된 현저한 파라미터들 또는 피처들 및 새로운 상태 오브젝트를 생성하기 위한 준비에 있어서 컴파일링되는 다른 데이터를 포함한다. 예시적인 현저한 파라미터들은 관찰된 상태 (230) 의 디지털 데이터로부터 생성되거나 도출된 하나 이상의 디지털 시그니처들 (예컨대, 디스크립터들, 피처들 등) 을 포함할 수 있다. 디지털 이미지들과 관련하여, 현재 상태 (250) 는 하나 이상의 이미지 프로세싱 알고리즘들에 따라 생성된 하나 이상의 디스크립터들을 포함할 수 있을 것이다. 디스크립터들은 다음과 같은 타입들의 디스크립터들 SIFT, SURF, GLOH, TILT, DAISY, HOG, 거친 에지들, 모서리들, 얼룩 디스크립터들, 텍스처들, 형상 디스크립터들, 또는 다른 타입들의 디스크립터들 중 하나 이상을 포함할 수 있을 것이다. 일부 실시형태들에서, 디스크립터들은 2015년 2월 13일 출원된 Bing 등에 대한 "Global Visual Vocabulary, Systems and Methods" 라는 제목의 미국 특허 출원 공개 제 2015/0262036 호에서 기술된 것들과 유사한 글로벌 어휘의 디스크립터들을 포함할 수 있을 것이다. 글로벌 어휘 (global vocabulary) 를 이용하는 하나의 이점은, 디스크립터들이 보다 콤팩트하고 (즉, 전송하기에 보다 효율적), 원시 디스크립터들에 비해 보다 결정론적이라는 것이다. 이러한 디스크립터들은 그것들이 샘플의 직접적 관찰에 기초하여 생성됨에 따라 타겟 생물학적 샘플의 내재적 피처들을 나타내는 값들을 나타냄을 이해하여야 한다. 또 추가로, 현재 상태 (250) 는 바 코드 정보, RFID 코드들, 환자 또는 도너 (donor) 식별자들, 샘플 식별자들, 사용자 (205) 의 식별자, 타임 스탬프들, 메타데이터, 로케이션, 또는 다른 타입들의 정보를 포함할 수 있다.
일단 현재 상태 (250) 와 연관된 데이터가 수집되고 나면, 샘플 트래킹 엔진 (220) 은 현재 상태 (250) 및 이전 샘플 상태 오브젝트 (240) 의 함수로서 메모리에서 현재 샘플 상태 오브젝트 (260) 를 인스턴스화한다. 현재 샘플 상태 오브젝트 (260) 가 인스턴스화되는 경우에, 그것은 초기에 NULL 값들을 갖는 것으로 생성될 수 있고, 그것은 그 다음에 인스턴스화 후에 채워진다. 대안적으로, 현재 샘플 상태 오브젝트 (260) 는 데이터를 현재 상태 (250) 및 이전 샘플 상태 오브젝트 (240) 로부터 현재 샘플 상태 오브젝트 (260) 의 생성자 메소드로 패스함으로써 충분히 완성된 값들을 갖는 것으로 생성될 수 있다. 일부 실시형태들에서, 현재 샘플 상태 오브젝트 (260) 는 또한 외부 데이터에 기초하여 구성될 수 있다. 보다 구체적으로, 외부 데이터는 하나 이상의 외부 배포된, 공개 장부들로부터의 해시 다이제스트를 포함할 수 있다 (예컨대, BitCoin, LiteCoin, Ethereum 등). 일부 경우들에서, 샘플 트래킹 환경 (200) 과 연관된 타임스탬프는 손상되거나 부정확하게 될 수도 있다. 소정 양태들에 따르면, 공개 장부로부터의 외부 데이터, 예컨대, BitCoin 과 연관된 해시 다이제스트는 공증인 (notary) 으로서 사용될 수 있고, 샘플 상태 오브젝트와 연관된 타임스탬프의 유효성의 독립적인 척도를 제공한다. 공개 장부 데이터 또는 해시 다이제스트는 특정 시점 또는 그 후의 시간과 관련하여 샘플 트래킹 체인에 독립적인 외부 타임스탬프로서 작용한다. 따라서, 공개 장부를 이용하여 현재 샘플 상태 오브젝트를 생성하는 것은 대응하는 블록으로부터의 데이터가 탬퍼링되거나 변형되지 않았다는 독립적인 확증을 제공한다.
현재 샘플 상태 오브젝트 (260) 에 의해 표현된 데이터의 블록은 타겟 생물학적 샘플의 이전 상태에 밀접하게 의존함에 유의하여야 한다. 따라서, 내재적 상태들의 블록체인이 형성된다. 또 추가로, 현재 샘플 상태 오브젝트 (260) 는, 시간 데이터, 날짜 데이터, 프로시저 데이터, 진단 데이터, 이해관계인 데이터, 의료 제공자 데이터, 이미지 데이터, 지리위치 데이터, 주소 데이터, 샘플 데이터, 보험 데이터, 워크스테이션 데이터,워크플로우 데이터, 또는 샘플에 관련된 다른 타입들의 메타데이터를 가능하게는 포함하는 하나 이상의 타입들의 샘플 메타데이터를 포함할 수 있다.
샘플 트래킹 엔진 (220) 은 샘플 트래킹 체인을 구축하는 것을 계속하기 위해 현재 샘플 상태 오브젝트 (260) 를 이전 샘플 상태 오브젝트 (240) 에 링크한다. 예를 들어, 시간에서 다음 상태인 것을 나타내기 위해 T3 로 라벨링된 현재 샘플 상태 오브젝트 (260) 는 이전 샘플 상태 오브젝트 (240) 로부터의 해시 다이제스트와 함께 현재 상태 (250) 로부터의 데이터를 해싱함으로써 생성된 해시 다이제스트 및 현재 상태 (250) 로부터의 데이터를 포함할 수 있을 것이다. 이전 샘플 상태 오브젝트 (240) 를 현재 상태 (250) 와 결합하거나 그 외에 링크하기 위해 사용되는 링킹 함수는 "원형 내의 플러스" 심볼에 의해 도시된다. 일단 현재 샘플 상태 오브젝트 (260) 가 인스턴스화되고 링크되고 나면, 샘플 트래킹 엔진 (220) 은 샘플 데이터베이스 (210) 에서의 샘플 트래킹 체인 (212) 을 새롭게 생성된 그리고 링크된 현재 샘플 상태 오브젝트 (260) 로 업데이트한다. 샘플 트래킹 체인 (212) 은 샘플 트래킹 엔진 (220) 이 네트워크 (215) 를 통해 샘플 데이터베이스 (210) 에 가능하게는 직렬화된 포맷 (예컨대, XML, YAML, JSON 등) 으로 현재 샘플 상태 오브젝트 (260) 를 전송하는 것에 의해 업데이트될 수 있다. 또한 샘플 트래킹 체인 (212) 및 현재 샘플 상태 오브젝트 (260) 는 관찰된 상태 (230) 로부터 도출된 피처들 또는 새롭게 생성된 내재적 특성들에 의해 인덱싱될 수 있다.
샘플 트래킹 체인 (212) 을 형성하기 위해 상태들의 체인을 구축하는 접근법은 많은 암호화폐; 예를 들어 BitCoin 에서 통상적으로 사용되는 것들과 유사한 블록체인을 구축하는 것으로서 고려될 수 있다. 하지만, 거기에는 유의할만한 차이점들이 있다. 암호화폐는 그때까지 수행된 모든 트랜잭션들의 전체를 나타내는 단일 블록 체인을 형성하고, 이는 점점 커지고 다루기 어려운 데이터 구조를 형성하게 된다. 추가로, 암호화폐는 통상적으로 블록들을 블록체인 내로 결합하기 위해 작업 증명 또는 지분 증명을 제공하기 위해 채굴기들로서 지칭되는 피어 컴퓨팅 디바이스들을 필요로 하고, 이는 상당한 컴퓨팅 리소스들은 말할 것도 없고 블록이 체인에 추가되기 전에 상당한 시간이 걸릴 수 있다. 개시된 접근법은 이러한 불리한 점들을 가지지 않는다. 그보다, 샘플 트래킹 체인 (212) 은 단일 샘플에 대해 단일의 독립적 체인으로서 인스턴스화될 수 있고, 샘플의 라이프 사이클을 나타낼 수 있고, 또는 심지어 샘플의 감사 단서를 나타낼 수 있다. 샘플 트래킹 체인 (212) 은 한정없는 성장을 유발함이 없이 자기-보유되고 소형인 채로 유지될 수 있다. 추가로, 샘플 트래킹 체인 (212) 은 다음 블록을 생성하기 위해 상당한 양의 작업을 필요로 하지 않고, 그보다는, 샘플 트래킹 엔진 (220) 은 시간 소모적인 암호적 퍼즐에 대한 솔루션 (예컨대, 작업 증명, 특정 시그니처를 갖는 해시 다이제스트 등) 을 필요로 함이 없이 원하는 링킹 기능을 빨리 수행할 수 있다. 또한, 샘플 트래킹 체인 (212) 은 많은 샘플들의 더 큰 보다 포괄적인 블록체인을 구성하거나 심지어 일단 프라이버시 관심사들이 해결되고 나면 다른 블록체인들 (예컨대, Ethereum 등) 내로 통합될 수 있을 것이다.
추가적으로, 다른 양태들에 따르면, 본 기법들과 다른 블록체인 접근법들 사이의 다른 구별점은 샘플 트래킹 체인이 샘플의 워크플로우에 기초하여 업데이트된다는 점이다. 일부 양태들에서, 워크플로우는 다수의 프로세싱 단계들을 포함하고, 그 워크플로우에서의 하나 이상의 단계들은 샘플의 물리적 외관을 변경시킨다 (예컨대, 착색, 해부, 정제, 결정화, 다른 용액에서의 현탁 또는 용해로부터, 하나 이상의 시약들을 추가하여 화학적 반응 야기 등). 따라서, 샘플 트래킹 체인은 전체 워크플로우를 통해 생물학적 샘플을 트래킹하고, 워크플로우에서의 다양한 단계들에서의 외관 및 형태 변화들의 레코드를 유지하기 위한 방식을 제공한다. 일부 접근법들에서, 워크플로우의 각 단계는 샘플 트래킹 체인에서 레코딩될 수도 있다. 다른 접근법들에서, 워크플로우의 단계들의 서브셋트 (예컨대, 물리적 외관에서의 변화, 로케이션에서의 변화 등과 연관된 단계들) 는 샘플 트래킹 체인에서 레코딩된다. 따라서, 이들 기법들은 샘플 혼동으로부터 발생하는 에러들을 감소시키기 위해, 워크플로우의 상이한 프로세싱 단계들에서, 환자 샘플의 모집단들을 관리하기 위해 적합하다. 이 기법들은, 트랜잭션 이벤트로부터 (그리고 프로세싱 단계들로부터는 아님) 발생하는 장부에서의 변화들을 단순히 레코딩하는 다른 타입들의 트랜잭션 기반 분산된 장부들과는 구별된다. 이들 이점들을 진술하였고, 그것은 또한 샘플 트래킹 체인 (212) 이 비밀 (또는 공개) 분산된 블록체인 장부 시스템 내에서 구축될 수 있음이 구체적으로 고려된다.
샘플 트래킹 체인 (212), 및 그것의 개별 블록들은 많은 기법들을 통해서 인덱싱될 수 있고, 이는 빠른 취출 또는 관리를 제공한다. 샘플 트래킹 체인 (212) 은 각각의 상태가 그 자신의 내재적 특성들을 갖는 많은 상태들을 포함한다는 점에서, 각 상태의 내재적 특성들로부터 도출된 값들 또는 메트릭들은 그 다음에, 샘플 트래킹 체인 (212) 의 대응하는 부분들에 추가하여 샘플 트래킹 체인 (212) 을 인덱싱하기 위해 사용될 수 있다. 따라서, 물리적 샘플이 분석되거나 관찰될 때, 그 물리적 샘플의 내재적 특성들과 연관된 하나 이상의 메트릭들은 샘플 트래킹 체인 (212) 의 대응하는 부분들 또는 샘플 트래킹 체인 (212) 내의 부분들 (예컨대, 블록들 등) 을 취출하기 위해 사용될 수 있다. 또 추가로, 샘플 트래킹 체인 (212) 은 대응하는 물리적 샘플에 관한 외재적 정보에 기초하여 인덱싱될 수 있다. 예시적인 외재적 정보는 환자 데이터, 보험 데이터, 의료 제공자 데이터, 이해관계인 데이터 (예컨대, 사용자 (205) 에 관련된 식별표시 정보 등), 타임스탬프들, 연구 또는 조사 제품 데이터, 메타데이터, 또는 물리적 샘플로부터 도출된 내재적 특성들 너무 확장되는 다른 정보를 포함한다.
논의의 편의를 위해, 사용자 (205) 가 환자의 종양으로부터 형성된 조직 탑재된 슬라이드들로 작업하는 병리학자라고 고려하자. 그 병리학자는 어느 구역들이 암적인 세포들을 포함할 것 같은지를 결정하기 위해 각 슬라이드 내의 관심대상의 구역들을 식별하는 임무가 주어진다. 병리학자는 생물학적 샘플과 연관된 정보를 소환하기 위한 몇가지 옵션들을 갖는다. 보다 현학적인 시나리오들에서, 관찰 하의 슬라이드는 샘플 및/또는 환자에 관한 외재적 정보; 예를 들어 바 코드들로 태깅되거나 인코딩된다. 보다 흥미로운 시나리오들에서, 병리학자는 디지털 슬라이드 이미지를 생성하기 위해서 디지털 현미경을 통해 슬라이드를 스캔한다. 병리학자가 그의 작업을 시작함에 따라, 디지털 슬라이드 이미지는 관찰된 상태 (230) 로서 샘플 트래킹 엔진 (220) 에 보내질 수 있다. 샘플 트래킹 엔진 (220) 은 통상적으로 디스크립터들로서 지칭되는 하나 이상의 피처들을 생성하기 위해 디지털 이미지에 대해 이미지 프로세싱 알고리즘의 하나 이상의 구현들을 실행한다. 예시적인 피처들은 에지 디스크립터들, 이미지 디스크립터들 (예컨대, SIFT, TILT, DAISY 등), 텍스처 디스크립터들, 형상 디스크립터들, 또는 다른 타입들의 디지털 피처들을 포함할 수 있다. 이러한 디스크립터들은 물리적 샘플로부터 직접 생성되는 것이고, 따라서 그 물리적 샘플의 내재적 성질을 나타내는 것으로 간주됨을 이해하여야 한다. 그 피처들은 그 다음에, 검색 쿼리 (235) 내로 결합될 수 있고, 이 검색 쿼리 (235) 는 샘플 데이터베이스 (210) 에 제출된다. 응답하여, 샘플 데이터베이스 (210) 는 이러한 피처들 및/또는 디스크립터들에 따라 이전에 인덱싱된 샘플 트래킹 체인 (212) 을 취출한다. 이 포인트에서, 샘플 트래킹 엔진 (220) 은 이전 샘플 상태 오브젝트 (240) 에 의해 표현되는 바와 같은 샘플 트래킹 체인 (212), 또는 샘플 트래킹 체인 (212) 의 적어도 부분을 취출하였다. 고려 하의 샘플의 내재적 특성들은 샘플의 이력 데이터를 취출하기 위해 사용됨을 이해하여야 한다. 이러한 접근법은 정보를 취출하기 위해 외재적 정보 (예컨대, 바 코드들, QR 코드들, 라벨들, FRID 등) 를 이용하는 것을 배제하지 않는다. 하지만, 개시된 접근법은, 내재적 정보는 샘플 정보를 액세스하는 것이 내부적으로 일치되고, 이는 샘플들의 잘못된 취급 또는 잘못된 라벨링에 의해 발생되는 잠재적인 에러들을 감소시키기 때문에, 외재적 정보의 배타적 사용에 비해 우수한 것으로 고려된다. 이미지 디스크립터들에 기초하여 정보를 저장하고 취출하기 위한 예시적인 기법들은, 2001년 11월 5일 출원된 Boncyk 등에 대한 "Image Capture and Identification System and Process" 라는 제목의 미국 특허 제 7,016,532 호; 2005년 8월 15일 출원된 Boncyk 등에 대한 "Use of Image-Derived Information as Search Criteria for Internet and Other Search Engines" 라는 제목의 미국 특허 제 7,680,324 호; 2006년 1월 26일 출원된 Boncyk 등에 대한 "Data Capture and Identification System and Process" 라는 제목의 미국 특허 제 7,565,008 호; 및 2009년 9월 28일 출원된 Boncyk 등에 대한 "Object Information Derived from Object Images" 라는 제목의 미국 특허 제 7,899,252 호에서 기술된다.
이 예로 계속하면, 병리학자는 추가적인 분석을 위해 LCM 을 통해 제거되어야 하는 조직의 영역들을 나타내는 하나 이상의 현미해부 마스크들 또는 종양 마크업들을 생성함으로써 관심대상의 구역들을 식별한다. 여기서 몇가지 유의할 점들이 있다. 첫째로, 관심대상의 구역들은 그들 구역들에서 발견되는 내재적 피처들에 관해 분석될 수 있다. 예를 들어, 구역이 현미해부되어야 하는 경우에, 샘플 트래킹 체인 (212) 을 인덱싱하기 위해 사용되는 구역들로부터의 대응하는 내재적 피처들은 또한 시료들로부터 제거될 것이다. 하지만, 일단 관심대상 구역들이 그 조직으로부터 제거되고 나면, 이러한 내재적 피처들은 더이상 그 물리적 샘플에 존재하지 않을 것이다. 따라서, 이들 "제거된" 내재적 피처들은, 그것들이 샘플 트래킹 체인 (212) 또는 대응하는 샘플 상태 오브젝트 (240 또는 260) 를 취출할 때 필요한 인덱싱 피처들이라기보다는 선택적 인덱싱 피처들이라는 것을 나타내기 위해 샘플 데이터베이스 (210) 에서 메타데이터로 태깅될 수 있다. 둘째로, 관심대상 구역들 (예컨대, 마스크들) 의 형상들은 형상 분석 알고리즘들의 하나 이상의 구현들에 따라 하나 이상의 형상 디스크립터들을 통해 양자화될 수 있다. 형상 디스크립터들은 현미해부를 위한 사이트들의 내재적 형상들을 표현하기 위해 고려될 수 있다 (현미해부 마스크들을 갖는 종양 시료 (좌측) 및 현미해부 후의 홀들을 갖는 종양 시료 (우측) 를 갖는 슬라이드를 나타내는 도 5 참조). 마스크 형상 디스크립터들은 현재 상태 (250) 에 포함될 수 있고, 해부 전 형상 디스크립터들을 실제 해부 후 형상 디스크립터들과 비교함으로써 현미해부 후에 샘플이 적절하게 프로세싱되는 것을 유효화하기 위해 사용될 수 있다. 실제 현미해부 후 형상 디스크립터들이 현미해부 전 형상 디스크립터들에 대하여 매칭 기준들을 만족하는 경우에, 현미해부 작업은 유효한 것으로서 간주될 수 있다. 사용될 수 있는 예시적인 형상 디스크립터들은, 중심 불변 대 한계 포인트 분포들, 최소 관성의 축으로부터 경계까지의 수직 거리의 분포, 평균 벤딩 에너지의 분포, 이심률의 측정 (예컨대, 주 축들 방법, 최소 경계 직각 방법 등), 원형 비들, 타원 분산, 직사각형도, 볼록도, 고체성, 오일러 계수, 프로파일들, 홀 면적 비, 중심 거리 분포, 접선 각 분포들, 접공간 분포들, 윤곽 곡률 분포들, 면적 분포들, 삼각형 영역 분포들, 현 길이 분포들, 정사각형 또는 극 형상 매트릭스들, 형상 컨텍스트, 또는 다른 타입들의 디스크립터들 (Park, UCI iCAMP 2011 "Shape Descriptor/Feature Extraction Techniques") 을 포함하는 형상 알고리즘들의 하나 이상의 구현들에 의해 생성되는 것들을 포함한다.
비록 도 1 및 도 2 는 착색, 해부, 및 질량 분석을 겪은 생물학적 샘플의 일 예시적인 워크플로우를 제공하지만, 본원에 제시된 기법들은 이 예시적인 워크플로우에 한정되지 않는다. 일반적으로, 본원에 제시된 기법들은 워크플로우의 하나 이상의 단계들을 통해 임의의 수의 샘플들을 트래킹하기 위해 사용될 수 있다. 예를 들어, 유전적 분석 서비스들을 제공하는 회사들은 샘플들의 수동적 취급으로부터 발생하는 에러드을 크게 감소시키기 위해서, (예컨대, DNA 시퀀싱 워크플로우들, RNA 시퀀싱 워크플로우들, 단백질 유전 정보 분석 워크플로우들, 면역 측정 워크플로우들, 바이오마커 분석 워크플로우들, 정제 워크플로우들, 또는 이들의 임의의 조합 등의 다양한 스테이지들을 통해) 그것이 프로세싱됨에 따라 각 샘플을 모니터링하기 위해 본원에 제공된 샘플 트래킹 기법들을 이용할 수 있을 것이다. 추가적으로, (예컨대, 특정 기술자에 의한 잘못된 취급으로부터, 특정 기구에 의해 도입된 오염으로부터, 분석시험에서의 결함있는 시약을 이용하는 것으로부터 등) 나중의 시점에 프로세싱 에러들 또는 불일치들이 발견되는 경우에, 이들 기법들은 전체 집단들이 영향을 받은 것으로 가정하기 보다는 샘플들의 집단들 중 어느 샘플들이 영향을 받았는지를 정밀하게 식별하기 위해 사용될 수 있다. 본원에 제시된 기법들은 또한, 외과적 절차들에서 사용되는 기구, 특히 수술 또는 진단 검사 동안 재사용되는 기구의 프로세싱을 트래킹하기 위해서 병원들 또는 다른 의료 시설들에 적용될 수 있을 것이다. 일 예로서, 다수의 외과적 절차들에서 사용되는 특정 외과 기구가 수술들 사이에서 적절하게 오염제거되지 않은 것으로 발견되는 경우에, 모든 환자들이 특정 시설에서 외과적 절차들을 겪는 대신에, 그 특정 외과 기구와 접촉된 환자들의 집단이 쉽게 식별될 수 있을 것이다.
본원에 제시된 기법들이 적용되는 다른 예들은 예술 작품 트래킹을 포함한다. 예술품 (예컨대, 조각상들, 그림들, 다이아몬드들 등) 의 내재적 특성들은 그 예술품의 (미술관에서의) 판매 또는 전시와 결합되고 트래킹될 수 있다. 내재적 특성들은, 예컨대, 그 예술품의 중량; 사이즈; 그림들에 대해: 프레임 타입, 매체 타입; 조각 작품들에 대해: 재료/매체 타입; 보석류에 대해: 투명도, 광채 등을 포함한다.
본원에 제시된 기법들이 적용되는 또 다른 예들은 토지 또는 다른 인프라스트럭처 조사를 포함한다. 한편의 토지의 변화하는 특성들 (예컨대, 갱신된 조사로 인한 변화하는 치수들을 트래킹하기 위한 이미지들 및 다른 측정들, 토지 또는 그것의 부분의 판매, 상업적 사용을 위한 전용, 공공 도로의 추가, 개편, 조경, 토지와 연관된 구조들, 건축의 다양한 상태들에서의 빌딩들, 재산 손상 등) 또는 인프라스트럭처의 변화하는 특성들 (예컨대, 문서화하기 위한 (LIDAR 와 같은) 지형학적 디스크립터들의 사용을 포함하는, 다리, 철도의 열화, 손상, 수리 또는 건설을 트래킹하기 위한 이미지들 및 다른 측정들) 은 시간의 함수로서 트래킹될 수 있다.
다른 예들은, 자동차 조립, 반도체 제조, 보석 가공, 대규모 및 소규모 제약 및 생물학적 제조 프로세스들, 및 다른 타입들의 제조 프로세스들 등을 포함하는 제조 워크플로우들을 포함한다. 자동차 프로세스들 (부품, 부품 조립의 순서, 기술자, 조립할 시간 등을 트래킹함으로써); 반도체 제조 프로세스들 (예컨대, 웨이퍼 사이즈, 웨이퍼 형상, 도핑 화학들, 리소그래피/제조 단계들, 배치 넘버, 제조 후 검증 및 테스팅, 기술자 등); 대규모 및 소규모 제약 및 생물학적 제조 프로세스들 (예컨대, 시약들, 시약들의 추가 시간, 기술자, 불순불들, 생성물의 형성, 바이러스 또는 세균 오염, 부산물의 형성 등) 을 포함하는 제조 프로세스의 내재적 특성들은 시간의 함수로서 트래킹될 수 있다.
본원에 제시되는 기법들이 적용되는 또 다른 예들은 장시간 동안 생물학적 샘플들을 트래킹하는 것 (예컨대, 평생 동안 환자에게 이용가능해야 할 필요성이 있을 수도 있는 제대혈), 여러 장소들로부터 중앙 저장 시설로 운반될 수도 있는 환경적 샘플들을 트래킹하는 것, 나중의 법적 분석의 대상 및 범죄 현장에서 획득된 샘물학적 샘플들 또는 증거의 트래킹, 역학적 연구의 일부로서 독감 또는 에볼라와 같은 질병이 특정 장소들로 확산된 범위를 트래킹하는 것을 포함한다.
도 3 은 샘플 트래킹 체인 (340) 에 의해 표현되는 바와 같은 샘플 트래킹 체인의 예시적인 상세들을 나타낸다. 샘플 트래킹 체인 (340) 은 데이터 구조의 각 부분이 다음 부분에 링크되는 샘플 상태 데이터 구조들의 체인을 나타낸다. 추가적으로, 각 상태는 대응하는 생물학적 샘플의 내재적 상태에 관한 정보를 포함하는 디지털 데이터를 포함한다. 도시된 예에서, 샘플 트래킹 체인 (340) 은 블록 체인을 포함하고, 여기서, 그 체인의 각 부분은, 이웃하는 블록들과 커플링된, 총칭하여 블록들 (310) 로서 지칭되는, 블록들 (310-0 내지 310-3) 에 의해 표현되는 데이터의 블록이다. 블록들 (310) 의 각각은 물리적 샘플의 관찰된 상태로부터 도출된 내재적 샘플 데이터를 포함한다. 용어 "블록체인 (blockchain)" 은 암호화폐 (예컨대, BitCoin, LiteCoin, PeerCoin 등) 에 관해 사용되는 것과 유사한 방식으로 사용됨을 이해하여야 한다. 샘플 트래킹 체인 (340) 은 샘플들의 내재적 특성들을 통해 샘플들의 상태들에 의해 연대적으로 기록되는 바와 같이 하나 이상의 생물학적 샘플들의 라이프 사이클을 나타낸다.
다른 실시형태들에서, 샘플 상태 오브젝트는 후속하는 샘플 상태 오브젝트를 유효화하기 위해 사용될 수도 있다. 일 예로서, 조직 병리학에서, (예컨대, 블록 (310-2) 에서) 관심대상의 구역들이 특정 샘플 측면 상에 그려지고 (예컨대, 블록 (310-3) 에서) 해부 후의 샘플의 형상이 예측될 수 있다. 따라서, 본원에서 제시된 샘플 트래킹 체인 기법들은, 샘플이 프로세싱 단계 후에 무엇처럼 보일지를 예측하는 방식을 제공할 수 있고, (예컨대, 샘플 혼동 또는 프로세싱 실수들로부터 발생하는) 불일치들을 식별할 수 있다. 예를 들어, 현미해부 후의 샘플이 특정된 임계치 내로 예측과 상관되지 않는 경우에, 경보가 기술자에게 전송될 수 있다. 일부 실시형태들에서, 디렉터 슬라이드는 해부 후의 샘플들의 형상을 예측하기 위해 사용될 수 있다.
샘플 트래킹 체인의 무결성을 증가시키기 위해, 샘플 트래킹 체인에 추가되는 각 블록이 정확한 것을 보장하도록 돕기 위해 다양한 접근법들이 구현될 수 있다. 예를 들어, 블록체인의 후속하는 블록들에서의 정보는, 예컨대, 착색에 이은 현미해부와 같이 정의된 순서화된 워크플로우에서의 단계들에 대해, 또는, 특정 컴퓨터, 특정 로케이션, 특정 기술자, 그 기술자의 대응하는 작업 스케줄, 특정 타입의 분석에 대한 의사 주문 등과같은 프로세스의 특정 단계와 연관된 디스크립터들 또는 다른 메타데이터를 이용하여, 더 이전의 블록들과 상관될 수 있다. 일 예로서, 의사가 환자 A 에 대한 바이오마커 혈액 테스트 및 환자 B 에 대한 착색 및 조직 분석 내의 생체검사를 주문한다고 가정하자. 오직 기술자 A 만이 기기 A 상에서 실험실 N 에서 바이오마커 분석을 수행하고, 오직 기술자 B 만이 기기 B 를 이용하여 실험실 N 에서 조직의 착색 및 해부를 수행한다고 가정하면, 시스템은 의사의 주문을 블록체인 데이터에서의 이상들을 검출하기 위해 환자 명칭에 의해 각 샘플의 프로세싱과 상관시킬 수 있다. 따라서, 검토를 위해 플래그될 샘플 상태 오브젝트들 또는 블록들은 환자 A, 기술자 A, 및 기기 B; 또는 환자 B, 기술자 A, 및 기기 B 를 포함한다.
또 다른 양태들에서, 기술자 또는 자동화된 프로그램은 특정 슬라이드와 연관된 관심대상의 세포 타입 구역들을 분류할 수 있다 (예컨대, 기름진 대 정상 대 종양). 샘플 트래킹 체인에 의해 캡처되는 바와 같은 슬라이드의 내재적 특성들은 데이터 유효성을 향상시키기 위해서 사용될 수 있고, 각 슬라이드가 적절한 대응하는 환자와 연관되는 것을 보장하도록 그리고 샘플 혼동을 회피하도록 돕는다. 유효화된 데이터를 확립하는 것의 개시된 기법들은 매칭 러닝을 위해 훌륭한 소스를 제공함을 이해하여야 한다. 샘플 트래킹 체인들이 축적됨에 따라, 체인들에서의 정보는 머신 러닝 트레이닝 데이터 셋트들로 컴파일링될 수 있고, 이 머신 러닝 트레이닝 데이터 셋트들은 그 다음에 머신 러닝 알고리즘들의 구현들을 트레이닝하기 위해 사용될 수 있다. 예를 들어, 슬라이드에서의 암 세포들의 식별된 구역들을 갖는 샘플 트래킹 체인들은 새로운 슬라이드들에서의 암 세포들을 식별하기 위해 트레이닝된 신경망을 생성하기 위해 빨리 식별될 수 있다. 이해관계자들은, 슬라이드 체인들이 본질적으로 유효화되었기 때문에, 트레이닝 데이터 셋트에서 더 높은 정도의 확신을 가질 것이다.
논의의 편의를 위해, 샘플 트래킹 체인 (340) 은 생물학적 샘플, 예를 들어 종양 샘플의 형성 시에 존재를 시작한다. 처음에, 샘플 트래킹 체인 (340) 은, 샘플 트래킹 체인 (340) 의 피처들이 하나 이상의 연속 API 호들을 통해 집단화될 수 있는 구성자 API 호를 통해 NULL 오브젝트로서 인스턴스화될 수 있다. 예를 들어, 샘플 트래킹 체인 (340) 은 기원 블록 (310-0) 의 생성을 통해서 인스턴스화될 수 있다. 기원 블록 (310-0) 은 환자 데이터 (303), 외부 데이터 (307), 또는 내재적 데이터 (305) 를 포함하는 생물학적 샘플의 생성과 연관된 데이터 구조를 포함한다. 환자 데이터 (303) 는 생물학적 샘플의 환자 또는 다른 도너와 연관된 다양한 디지털 정보를 포함한다. 예시적인 환자 데이터는 이름, 사회 보장 번호, 주소, 보험 정보, 의료 제공자 (예컨대, 의사 명칭 등), 또는 그 환자와 연관된 다른 정보를 포함한다. 일부 실시형태들에서, 환자 데이터 (303) 는 또한, 샘플 트래킹 체인 (340) 의 하나 이상의 부분들에 대한 액세스를 허가하도록 환자에게 허용하는 하나 이상의 공개 및/또는 비밀 환자 키들을 포함할 수 있다. 샘플 트래킹 체인 (340) 은 환자 데이터 (303) 내의 하나 이상의 필드들을 통해 인덱싱될 수 있어서, 이해관계자들은 원하는 바와 같이 샘플 트래킹 체인 (340) 또는 그것의 블록들을 취출하기 위해 알려진 환자 정보를 레버리징할 수 있음을 이해하여야 한다.
외부 데이터 (307) 는 기원 블록 (310-0) 에 포함될 수 있는 선택적 데이터를 나타내고, 여기서, 외부 데이터 (307) 는 타겟 생물학적 샘플의 내재적 성질 너머이거나 환자에 관련된다. 예를 들어, 외부 데이터 (307) 는 타임 스탬프들, 워크플로우 정보, 절차 코드들 (예컨대, CPT 코드들), 제안된 진단 코드들 (예컨대, ICD 코드들), 또는 다른 정보를 나타내는 메타데이터를 포함할 수 있을 것이다. 더욱 흥미롭게, 하나의 구체적으로 고려되는 외부 데이터는 샘플 트래킹 체인 (340) 에 대한 유효화 토큰으로서 사용될 수 있는 외부 해시 다이제스트를 포함한다. 외부 해시 값은, 공개적으로 이용가능한 분산된 장부들 (즉, 공공 블록체인들) 로부터, 가능하게는 하나 이상의 암호화폐들로부터 획득될 수 있다. 일부 실시형태들에서, 외부 해시 값은 비트코인 브록체인 또는 이더리움 블록체인의 가장 현재의 유효화된 블록의 해시 다이제스트일 수 있을 것이다. 외부 해시 값은, 기원 블록 (310-0) 이 외부 해시 값이 생성되었던 시간 후에 오직 인스턴스화될 수 있었을 것을 나타내는 유효화된 타임스탬프가 된다. 이러한 접근법은, 그것이 검증가능한 외부 소스들에 샘플 트래킹 체인 (340) 을 효율적으로 링크하기 때문에 이로운 것으로서 고려된다.
비록 외부 데이터 (307) 가 기원 블록 (310-0) 에 기여하는 것으로서 예시되지만, 외부 데이터 (307) 는 또한 샘플 트래킹 체인 (340) 에서 각각의 후속하는 블록에 추가될 수 있음을 이해하여야 한다. 예를 들어, 외부 데이터 (307) 는 또한, 워크플로우 문서화, 워크플로우 데이터 (예컨대, 프로세스 코드들, 기술자 식별자들 등), 예상되는 다음 상태, 또는 샘플들의 프로세싱에 관련된 다른 정보를 포함할 수 있다.
내재적 데이터 (305) 는 타겟 생물학적 샘플의 내재적 특성들의 디지털 표현을 나타낸다. 내재적 데이터 (305) 의 예들은 샘플의 타입(들), 질량, 사이즈, 형상, 밀도, 디스크립터들, 디지털 시그니처들, 또는 샘플에 관련된 다른 피처들을 포함한다. 보다 흥미로운 실시형태들에서, 내재적 데이터 (305) 는 샘플에 관한 불변의 내재적 특성 데이터; 타겟 샘플이 프로세싱됨에 따라 변화하지 않는 내재적 특성들을 포함할 수 있을 것이다. 게놈 시퀀스들 (예컨대, 전체 게놈 시퀀스, 전체 엑솜 시퀀스들, 알려진 변이들, SNP 패턴들, RNA-시퀀스 데이터, 단백질 유전 정보 등) 은 예를 들어 불변 내재적 특성의 일 유형일 것이다. 또 추가적으로, 샘플 트래킹 체인 (340) 은 내재적 데이터 (305) 내의 속성들의 하나 이상에 의해 데이터베이스 내에 저장되고 인덱싱될 수 있다.
기원 블록 (310-0) 은 타겟 샘플에 대해 제로 상태와 동일한 시간에서 (T0; t=0) 인스턴스화된다. 기원 블록 (310-0) 은, 적절한 인증 또는 허가가 획득되는 것을 가정하여 취출될 수 있는 다양한 데이터 소스 (예컨대, 환자 데이터 (303), 내재적 데이터 (305), 외부 데이터 (307) 등) 로부터 획득된 관련 데이터를 포함한다. 추가로, 기원 블록 (310-0) 은 또한, 블록에 포함된 데이터의 함수로서 생성되고 블록을 식별하기 위해 사용될 수 있는 블록 토큰 (HT0 참조) 을 포함한다. 도시된 예에서, 블록 토큰은 입력 데이터의 함수로서 그리고 해시 알고리즘의 구현에 따라 생성된 해시 다이제스트 (HT0) 이다. 이러한 접근법은, 외부 해시 다이제스트를 포함하는 외부 데이터 (307) 에 의존하는 해시 다이제스트를 생성하기 위해 사용될 수 있고 (하지만 반드시 그럴 필요는 없다), 그에 의해 몇가지 이익들이 초래됨을 유의하여야 한다. 첫째로, 외부 이해관계자는 이용가능한 데이터로부터 HT0 를 재계산함으로써 기원 블록 (310-0) 내의 데이터가 유효함을 확인할 수 있다. 둘재로, 기원 블록 (310-0) 에서의 데이터가 변경되는 경우에, 이해관계자는, 재계산된 해시가 기원 블록 (310-0) 에 저장된 그 값과 상이할 것이기 때문에, 변경을 검출하는 것이 가능할 것이다. 셋째로, 이해관계자는, 기원 블록 (310-0) 에서의 데이터가, 외부 해시가 외부의 공개 소스들에 의해 유효화된 바와 같이 존재하였을 때에 대응하는 시간 프레임에서 존재하였음을 입증할 수 있다.
일부 실시형태들에서, 기원 블록 (310-0) 은 정적 데이터를 이용하여 형성될 수 도 있다. 환자와 연관된 일부 데이터는 기간에 걸쳐 정적일 수도 있고, 예컨대, 환자 샘플이 획득되는 장소, 사회 보장 번호, 생일일 수도 있다. 다른 데이터는 환자 이름, 바이오마커들의 레벨, 예측 등과 같이 가변적일 수도 있다. 따라서, 일부 실시형태들에서, 기원 블록의 해시 다이제스트는 정적 데이터를 이용하여 형성될 수도 있고, 기원 블록의 무결성을 검증하기 위해 동일한 정적 데이터의 해시 다이제스트에 대한 후속하는 비교를 위해 저장될 수도 있다. 다른 예들에서, 데이터는 데이터 필드가 변경된 것을 나타내기 위해 속성 값 쌍들로서 데이터베이스에 저장될 수도 있다. 따라서, 일부 실시형태들에서, 정적 데이터는 해시 함수에 대한 입력으로서 선택될 수도 있는 한편, 다른 실시형태들에서, 정적 데이터 및 가변 데이터 양자가 해시 함수에 대한 입력으로서 선택될 수도 있다.
블록 토큰이 생성될 수 있는 수많은 가능한 알고리즘들이 존재하지만, 해시 알고리즘들의 몇몇 예들이 참조를 위해 여기에 포함된다. 예시적인 해시 함수들은 MD5, SHA (예컨대, SHA-1, SHA-2, SHA-3, SHA-256, SHA-512 등), Whirlpool, BLAKE2, 스크립트, 또는 다른 해싱 함수들을 포함한다. 일반적으로, 샘플 트래킹 체인 (340) 이 탬퍼링에 대해 보다 강건하도록 보다 안전한 해시 함수들이 보다 바람직하다. 따라서, MD5 는 깨졌기 때문에, SHA-기반 해시가 MD5 보다 더 바람직하다. 또 추가로, 더 큰 다이제스트들 (즉, 해시 값) 을 생성하는 보다 바람직한 해시 함수들은 가능한 충돌들을 감소시키기 위해 보다 흥미롭다. 따라서, SHA-512 는 SHA-256 보다 더 바람직한 것으로 고려될 수 있다. 일부 실시형태들에서, 계산적으로 부수기 어렵도록 다이제스트를 생성하기 위해 더 오래 걸리는 해시 함수를 가지는 것이 바람직하다. 이러한 실시형태들에서, 스크립트는 보다 바람직한 SHA-512 일 수도 있을 것이다.
블록 토큰을 생성하기 위해 사용될 수 있는 다른 타입들의 함수들은 UUID 생성 함수들 (예컨대, RFC 4122 등), GUID 생성 함수들, 또는 다른 타입들의 식별자 생성 함수들을 포함한다. 보다 흥미로운 실시형태들에서, 블록 토큰은 블록 내에 포함된 데이터에 또한 의존하고 가능하게는 외부 데이터 (예컨대, 외부 해시 다이제스트 등) 에 기초하는 한편 가능하게는 고유하도록 생성된다. 일 예시적인 이종 블록 토큰은 GUID 및 블록 데이터로부터 도출된 해시 다이제스트 플러스 GUID 를 갖는 스트링을 포함할 수 있을 것이다. 또 추가로, 비-해시-기반 함수들이 여전히 요망되는 단서들을 관련시키면서 레버리징될 수 있음이 고려된다.
도 3 에서 제시된 예로 돌아가서, 독자의 주의는 워크플로우 (320) 로 향해진다. 워크플로우 (320) 는 타겟 생물학적 샘플로부터 생성된 조직 슬라이드들 상에 현미해부 사이트들을 생성하는 것에 초점을 맞춘 오버아칭 (overarching) 워크플로우의 부분을 나타낸다. 비록 워크플로우 (320) 는 오버아칭 워크플로우의 부분을 나타내지만, 개시된 기법들은 수많은 단계들 또는 작업들을 갖는 보다 복잡한 워크플로우들과 잘 동등하게 사용될 수 있다. 워크플로우 (320) 는 타겟 생물학적 샘플이, 슬라이드들 (320-1) 로서 총칭되는 착색되지 않은 슬라이드들 (320-1A 내지 320-1N) 에 의해 표현되는 바와 같이 하나 이상의 슬라이드들 상에 배치되는 것으로 시작하고, 여기서, 이들 슬라이드들의 각각은 타겟 샘플의 단면을 포함한다. 슬라이드들 (320-1) 의 집합은 샘플의 3 차원적 구조를 나타내는 것으로 고려될 수 있음을 이해하여야 한다. 따라서, 이 스테이지에서의 샘플의 하나의 내재적 특성은 추론된 3D 모델 또는 형상을 포함할 수 있을 것이다. 따라서, 다양한 블록들이 타겟 생물학적 샘플의 3D 모델들 및 2D 이미지들로부터 하나 이상의 샘플 상태 오브젝트들로부터 생성될 수 있다.
도시된 예에서, 착색되지 않은 슬라이드들 (320-1) 은 집합적으로 생물학적 샘플의 새로운 상태를 나타낸다. 새로운 상태는 그러면 샘플 트래킹 체인 (340) 내에서 새로운 블록, 블록 (310-1) 을 생성하기 위해 사용된다. 이 경우에, 슬라이드들 (320-1) 상의 조직의 내재적 특성들은, 개별적으로 또는 집학적으로, 내재적 데이터로서 슬라이드 (예컨대, 전체 슬라이드 이미지, 조직 이미지 등) 의 실제 디지털 이미지들을 포함하는 블록 (310-1) 의 기반으로서 사용될 수 있다. 추가로, 조직의 경계 (예컨대, 에지들, 경계 등), 형상, 사이즈, 피처들, 또는 다른 양태들의 조직을 포함하는 다른 내재적 특성들이 또한 컴파일링될 수 있다. 블록 (310-0) 과 유사하게, 블록 (310-1) 은 또한, 가능하게는 워크플로우 메타데이터를 포함하는 외부 데이터 (예컨대, 기술자 식별자, 워크플로우 식별자, 워크플로우 작업, 감사 단서 정보, IEC 62304 호환 데이터, 시간 스탬프들 등), 또는 심지어 이전에 논의된 바와 같이 유효성 타임 스탬프로서 다른 외부 해시 다이제스트 (예컨대, 비트코인 현재 블록 해시, 라이트코인 현재 블록 해시, 공개 장부 해시 등) 를 통합할 수 있다. 일단 그 예에서 새로운 상태, 상태 T1 와 연관된 데이터가 컴파일링되고 나면, 블록 (310-1) 은 링크 (330) 중 하나 이상을 통해 이전 상태에 링크될 수 있다.
일부 실시형태들에서, 각각의 블록 (310) 은 데이터 스토어 또는 데이터베이스에서 개별 레코드로서 저장될 수 있다. 이러한 경우들에서, 링크 (330) 는 블록 (310-0) 의 식별자에 대응하는 값을 갖는 블록 (310-1) 의 데이터 멤버를 포함할 수 있다. 다른 실시형태들에서, 블록들 (310-0 및 310-1) 은 링크된 리스트, 가능하게는 더블 링크된 리스트를 형성하고, 여기서, 각 블록은 타방을 포인팅한다. 또한, 보다 흥미로운 실시형태들에서, 링크 (330) 는 본질적으로, 현재 샘플 상태 오브젝트가 이전 상태들 블록 토큰 (에컨대, 해시 다이제스트 등) 및 현재 상태들 데이터에 기초하여 생성된 해시 다이제스트를 통해 이전 샘플 상태 오브젝트에 역으로 "링크" 되는 상기 논의된 바와 같은 블록체인을 형성하는 링크된 해시 다이제스트를 포함한다. 달리 말하면, 블록 (310-1) 은, 블록 토큰이 본질적으로 링크 (330) 인 블록 (310-0) 의 해시 다이제스트 (즉, HT0) 와 함께 블록 (310-1) 의 데이터를 해싱함으로써 생성된 해시 다이제스트의 형태를 갖는 블록 토큰 (즉, HT1) 을 포함할 수 잇다. 일부 실시형태들에서, 양 해시-기반 블록 토큰 및 이웃 블록들에 대한 포인터들이 채용된다.
블록 (310-1) 은 착색되지 않은 슬라이드들 (320-lA 내지 320-lN) 로부터의 모든 데이터의 컴필레이션을 갖는 것으로서 예시된다. 하지만, 각 슬라이드는 샘플 트래킹 체인 (340) 내에 그 자신의 대응하는 블록을 가질 수 있을 것임이 또한 고려된다. 이 경우에, 샘플 트래킹 체인 (340) 은 많은 더 작은 블록들의 체인을 가질 수 있을 것이다. 또 다른 실시형태들에서, 슬라이드들로부터의 정보는 트리 구조로 배열될 수 있을 것이고, 그 트리에서의 각 브랜치는 단일 슬라이드의 상태들을 나타내고, 트리의 루트는 블록 (310-1) 을 나타낸다. 이러한 시나리오들에서, 샘플 블록체인 (340) 은 다수의 더 작은 블록들로부터 해시 다이제스트들의 생성을 쉽게 하기 위해 그리고 저 레이턴시 액세스를 위해 Merkle 트리로서 배열될 수 있을 것이다. 따라서, 본원에 기술된 주제는 바이너리 트리들, AVL 트리들, 사이드 체인들, 또는 다른 데이터 구조들을 포함하는, 선형 체인 너머의 데이터의 다른 배열들을 포함하는 것으로 고려된다.
워크플로우 (320) 는 착색되지 않은 슬라이드들 (320-1) 을 착색된 슬라이드들 (320-2) 로서 총칭되는 착색된 슬라이드들 (320-2A 내지 320-2N) 로 변환함으로써 계속된다. 이 예에서, 착색되지 않은 슬라이드들 (320-1) 대 착색된 슬라이드들 (320-2) 사이에 일 대 일 대응관계가 존재한다. 하지만, 일부 실시형태들에서 이러한 일-대-일 대응관계는 필요하지 않음이 고려된다. 예를 들어, 일부 실시형태들에서, 하나의 물리적 시료는 하위-시료들의 다수의 그룹들로 분할될 수 있을 것이고, 여기서, 각 그룹은 상이하게 프로세싱된다. 착색된 슬라이드들 (320-2) 은 각각 동일한 착색 기법을 이용하여 착색되거나 상이한 기법들을 이용하여 착색될 수 있다. 일 예로서, 착색된 슬라이드 (320-2A) 는 헤마톡실린으로 착색될 수 있는 한편, 다른 착색된 슬라이드 (320-2B) 는 PAS 디아스타제로 착색될 수 있을 것이다. 이러한 경우들에서, 대응하는 블록 (310-2) 은 슬라이드들에 대한 착색 식별표시 정보를 포함할 수 있다. 착색된 슬라이드들 (320-2A 내지 320-2N) 의 각각은 슬라이드들의 디지털 이미지들을 생성하기 위해, 바람직하게는 표준화된 프로세스들에 따라, 디지털화될 수 있고; 전체 슬라이드 이미지들은 예를 들어 SVS 포맷 (즉, OpenSlide 포맷; URL openslide.org/formats/aperio/ 참조) 으로 저장된다. 다른 포맷들은 Hamamatsu 포맷, Leica 포맷, MIRAX 포맷, Philips 포맷, Sakura 포맷, Trestle 포맷, Ventana 포맷, 일반 타일형 포맷, 또는 다른 타입들의 가상 슬라이드 포맷들을 포함할 수 있다. 이러한 디지털 이미지들은 슬라이드들 상의 샘플의 내재적 성질을 나타내고, 블록 (310-2) 의 일부가 될 수 있다.
또 추가로, 일부 실시형태들에서, 착색된 슬라이드들 (320-2A 내지 320-2N) 은, PerkinElmer® (예컨대, Vectra® 촬상 시스템, Nuance® FX 멀티플렉스 바이오마커 촬상 시스템 등) 에 의해서 또는 Optra SystemsTM (예컨대, OptraScan® 자동화된 스캐닝 및 고 해상도 스캐닝 시스템) 에 의해 제공되는 바와 같은 하나 이상의 촬상 시스템들을 가능하게는 레버리징하여, 각 슬라이드에 멀티플렉스 형광 면역조직화학법 (IHC) 가능 특성화를 적용함으로써 생성될 수 있다. 일단 이미지화되고 나면, 가상 슬라이드들은 그 슬라이드들로부터 생성된 광 스펙트럼에 기초하여 착색된 슬라이드들로부터 생성될 수 있다. 따라서, 착색된 슬라이드들 (320-2A 내지 320-2N) 의 각각은 다수의 가상 슬라이드들로 생성될 수 있고, 여기서, 각각의 대응하는 가상 슬라이드는 대응하는 샘플의 요망되는 내재적 피처들을 경감시킨다. IHC 특성화로부터의 슬라이드 이미지들 또는 데이터 파일들의 각각은 광의 관찰된 파장 (예컨대, 350nm 내지 900nm 등) 과 같은 광 스펙트럼 정보를 포함할 수 있다. 흥미롭게도, 슬라이드드의 각각의 "스펙트럼" 뷰는 하나 이상의 추가적인 내재적 피처들 (예컨대, 디스크립터들, 메트릭들 등) 을 생성하도록 요망되는 바와 같이 상이한 알고리즘들에 따라 디지털로 분석될 수 있다. 또 추가로, 슬라이드의 각 구역은 그 구역들에서 나타나는 집합적 내재적 피처들에 기초하여 상이하게 분석될 수 있다. 예를 들어, 높은 핵 밀도를 갖는 구역은 높은 에지 디스크립터 밀도를 갖는 구역과는 다르게 분석될 수 있을 것이다. 밀도에 기초하여 상이한 기법들을 이용하여 이미지의 특정 구역들을 인식하거나 분류하기 위한 예시적인 기법들은 2014년 12월 9일 출원된 Jaber 등에 대한 "Feature Density Object Classification, Systems and Methods" 라는 제목의 미국 특허 출원 공개 제 2015/0161474 호에서 기술된다.
디지털화된 슬라이드들 이미지들은 그 다음에, 샘플 트래킹 체인 (340) 의 다음 블록, 이 예에서 블록 (310-2) 내로의 통합을 위해 컴파일링될 수 있다 (예컨대, 파일들, 원시 데이터, BLOB 들, 마크업 언어 파일들 등). 또한, 일부 실시형태들에서, 디지털 슬라이드 이미지들은 블록의 일부일 필요는 없다. 이러한 경우들에서, 블록 (310-2) 은 각 슬라이드 이미지들이 저장되는 포인터들을 포함할 수 있다. 그 포인터들은 디지털 오브젝트 식별자 (DOI) 들, URL 들, URI 들, 슬라이드 식별자들 (예컨대, GUID 들, UUID 들 등), 또는 슬라이드들이 액세스될 수 있는 다른 타입들의 어드레스를 포함할 수 있다. 이러한 접근법은 실제 데이터를 비밀로 유지하도록 또한 요구하면서 공개의, 배포된 장부들을 레버리징하는 시나리오들에서 유리한 것으로 고려된다.
착색된 슬라이드들 (320-2) 의 디지털화된 이미지들에 추가하여, 블록 (310-2) 은 또한, 워크플로우의 이 스테이지에서 샘플을 식별함에 있어서 도움이 되는 추가적인 정보를 포함할 수 있다. 각각의 디지털화된 이미지는 식별 피처들 (예컨대, 디스크립터들, 텍스처들, 파장들, 밀도들, 메트릭들 등) 을 도출하기 위해 이미지 프로세싱 알고리즘들의 하나 이상의 구현들에 의해 프로세싱될 수 있다. 이전에 논의된 바와 같이, 식별 피처들은 이미지 디스크립터들 (예컨대, SIFT, HOG, 에지 디스크립터들, TILT 등) 을 포함할 수 있다. SIFT 는 2000년 3월 6일 출원된 Lowe 에 대한 "Method and Apparatus for Identifying Scale Invariant Features in an Image and Use of Same for Locating an Object in an Image" 라는 제목의 미국 특허 제 6,711,293 호에서 보다 충분히 설명된다. 예시적인 에지 디스크립터들은 2015년 5월 6일 출원된 Song 등에 대한 "Image-Based Feature Detection using Edge Vectors" 라는 제목의 미국 특허 제 9,412,176 호에서 기술된다. 알고리즘들에 의해 생성된 결과적인 디스크립터들은 또한 블록 (320-2) 내로 컴파일링될 수 있고, 또한 나중의 취출을 위해 샘플 트래킹 체인 (340) 및/또는 블록 (320-2) 을 인덱싱하기 위해 사용된다. 흥미롭게도, 이러한 디스크립터들을 샘플 트래킹 체인 (340) 내로 통합하는 접근법은, 비밀일 수도 있을, 실제 이미지 데이터가 존재할 것을 요구함이 없이, 블록 (320-2) 을 취출하기 위해 이미지-기반 오브젝트 인식 기법들을 이용하도록 제공한다.
일단 데이터가 새롭게 생성된 착색된 상태에 대해 컴파일링되고 나면, 블록 (310-2) 은 그것의 블록 토큰을 생성함으로써 마무리될 수 있다. 다시, 블록 (310-1) 과 유사하게, 블록 (310-2) 의 블록 토큰은 이전 상태의 블록 (310-1); 이 경우에 HT1 으로부터의 해시 다이제스트와 함께 새로운 상태의 컴파일링된 데이터의 해시 다이제스트로서 예시된다. 새로운 해시 다이제스트, HT2 는 본질적으로 블록 (310-1) 로의 역방향의 링크 (330) 를 나타낸다. 블록 (320-2) 의 일부 실시형태들은 또한, 블록 (310-2) 에서 다른 형태들의 링크 (330) (예컨대, GUID 들, UUID 들, URL 들, 레코드 식별자들 등) 를 포함할 수 있다.
간략함을 위해, 예시적인 워크플로우 (320) 는, 특히 관심대상의 것인, 현미해부된 슬라이드들 (320-3) 로 총칭되는, 현미해부된 슬라이드들 (320-3A 내지 320-3N) 에 초점을 맞추기 위해 통상적인 워크플로우에서 나타날 수도 있을 하나 이상의 단계들을 생략한다. 현미해부된 슬라이드들 (320-3) 은 슬라이드들이 가능하게는 LCM 을 통해 현미해부되어서 슬라이드 상의 조직 샘플에 하나 이상의 홀들이 남겨진 후의 타겟 생물학적 샘플의 상태를 나타낸다. 참조로서, 독자의 주의는 일 예시적인 슬라이드 이미지를 보여주는 도 5 로 향해진다. 좌측 이미지는 현미해부가 발생하여야 하는 곳을 나타내는 종양 마크업을 나타내는 조직 샘플을 도시한다. 마크업은 병리학자에 의해 생성된 다수의 현미해부 마스크들을 나타낸다. 우측 이미지는 현미해부된 슬라이드들 (320-3) 중 하나에 대응하는 현미해부 후의 정확히 동일한 조직 샘플을 도시한다.
현미해부 후의 조직은 타겟 생물학적 샘플의 또 다른 새로운 상태를 나타내고, 여기서, 조직 샘플은 이제 다양한 형상들의 다수의 홀들을 포함함에 유의한다. 그 홀들은 그 샘플에 대한 새로운 내재적 피처들이고, 각 홀은 디지털로 특성화될 수 있다. 이전에 논의된 바와 같이, 홀들은 하나 이상의 형상 디스크립터들에 의해 특성화될 수 있고, 여기서, 형상 디스크립터들은 또한 새로운 샘플 상태 및/또는 샘플 트래킹 체인 (340) 을 인덱싱하기 위해 사용될 수 있다. 현미해부된 슬라이드들 (320-3) 은 워크플로우 (320) 에서 이전 스테이지 동안 생성된 종양 마크업들 또는 마스크들에 대하여 유효화될 수 있음을 또한 이해하여야 한다. 우측 이미지의 실제 현미해부 홀들에 대한 도 5 의 좌측 이미지 상의 마스크 형상들의 유사성에 유의한다. 각 구역에 대한 형상 디스크립터들 전 및 후 (즉, 마스크 대 대응하는 홀) 는 개별적으로 및 집합적으로 비교될 수 있다. 일부 실시형태들에서, 형상 디스크립터들 전 및 후가 임계치 또는 다른 유사도 기준들에 충분히 유사하거나 그 내인 경우에는, 현미해부 후 슬라이드는 현미해부 전 슬라이드에 대하여 유효한 상태로 고려된다. 그 유사도 측정은 형상 디스크립터의 성질에 의존하여 2 개의 형상 디스크립터들 사이의 유클리디안 거리에 기초할 수 있을 것이다.
유효화의 다른 형태들이 또한 채용될 수 있다. 각 블록이 예상되는 다음 상태 데이터 (즉, 외부 데이터) 를 포함하는 실시형태들에서, 샘플 트래킹 체인 (340) 을 프로세싱하는 샘플 트래킹 엔진은 이전 샘플 상태 오브젝트에서의 예상되는 다음 상태를 현재 상태에 대해 비교할 수 있다. 예상되는 다음 상태와 현재 상태 사이의 동의가 존재하는 경우에, 현재 상태는 유효한 상태를 포함하는 것으로서 고려될 수 있다. 현미해부 마스크들과 관련하여 이전에 하나의 예가 제시되었다. 다른 예는 착색되지 않은 슬라이드들 (320-1) 과 연관된 블록 (310-1) 이 예상되는 착색 정보 (예컨대, 스펙트럼적 정보, 예상되는 컬러들 등) 를 포함할 수도 있을 시나리오를 포함할 수 있다. 착색된 슬라이드들 (320-2) 이 관찰될 때, 관찰된 컬러들 또는 스펙트럼적 정보 (예컨대, 멀티플렉스 IHC 등) 가 측정되고 예상되는 상태 정보에 대해 비교될 수 있다. 2 개가 매칭 기준들 내에서 매칭되는 경우에, 착색된 슬라이드들 (320-2) 은 유효한 것으로 고려될 수 있다. 따라서, 본 발명의 주제는 샘플 트래킹 체인들 (340) 의 함수로서 워크플로우 상태드의 실시간 검증의 개념을 포함하는 것으로 고려된다.
현미해부된 슬라이드들 (320-3) 에서의 홀들을 특성화하는 것을 넘어서, 슬라이드들에서의 홀들의 배열이 특성화될 수 있다. 비유적으로, 슬라이드에서의 홀들은 슬라이드에 대한 내재적 바 코드로 고려될 수 있다. 따라서, 일단 슬라이드가 이미지화되고 나면, 홀들은 디지털로 분석되어서 하나 이상의 전체 슬라이드 디스크립터들을 생성하게 되고, 이들은 그 다음에 그 슬라이드를 식별 또는 인덱싱하기 위해 사용될 수 있다. 하나의 가능한 디스크립터는 전체 조직에 의해 대면하는 면적에 대한 각 홀의 면적을 나타내는 히스토그램을 포함할 수 있을 것이다. 히스토그램의 빈들은 조직의 중심으로부터 최외곽 에지까지의 상대적인 거리에 의해 배열될 수 있다. 조직 중심으로부터 홀의 중심까지의 반경방향 거리는 홀 또는 홀들이 어느 빈 내로 속하는지를 결정할 수 있다. 히스토그램에서의 빈들의 수는 임의의 실질적인 수; 예를 들어 5, 10, 15, 또는 그 이상의 빈들일 수 있다. 이러한 디스크립터는 회전방향으로 불변이고 이미지 해상도 불변이다. 따라서, 사용자는 유사한 디스크립터를 재생성하기 위해서 슬라이드의 동일한 이미지들을 취할 필요가 없다.
이전 블록들 및 샘플 상태들과 같이, 이미지 데이터 및/또는 홀 디스크립터들은 타겟 조직의 새로운 상태를 나타내는 블록 (310-3) 내로의 통합을 위해 데이터 셋트로 컴파일링될 수 있다. 블록체인을 구축하는 관점으로부터 계속하면, 블록 (310-3) 은 또한, 블록의 데이터 (예컨대, 현미해부된 슬라이드들, 홀 형상 디스크립터들, 홀 배열 디스크립터들 등) 의 함수로서 생성된 해시 다이제스트 (즉, HT3) 및 이전 상태의 블록 토큰 (즉, 블록 (310-2) 으로부터의 해시 다이제스트; HT2) 의 형태로 상태를 나타내는 블록 토큰을 갖는다. 다시, 새로운 해시 다이제스트 HT3 는 블록 (310-2) 에 대한 역방향의 링크 (330) 가 된다.
제시된 바와 같은 샘플 트래킹 체인 (340) 은 예시적 목적들을 위해 4 개의 상태들을 나타내는 4 개의 도시된 블록들을 오직 갖는다. 그보다는, 샘플 트래킹 체인 (340) 은 어느 임의의 큰 수의 블록들 및/또는 대응하는 상태들을 포함할 수 있음은 독자에게 명백할 것이다. 이러한 체인들은 체인의 성질에 따라 수천, 수만, 또는 심지어 그 이상의 블록들을 포함할 수 있다.
샘플 트래킹 체인 (340) 은 또한 단일의, 독립형 체인으로서 예시된다. 일부 실시형태들에서, 샘플 트래킹 체인 (340) 은 많은 다른 피처들을 갖는 더 큰 구조들을 구성할 수 있다. 예를 들어, 샘플 트래킹 체인 (340) 은 환자의 의료 블록체인에 링크하거나 그 환자의 의료 블록체인으로부터 분기하는 사이드 체인의 형태를 취할 수 있다. 다른 유사한 시나리오들에서, 샘플 트래킹 체인 (340) 은 환자의 의료 블록체인의 일부일 수 있다. 개시된 접근법을 레버리징할 수 있는 예시적인 의료 블록체인들은 2015년 5월 13일 출원된 Witchey 등의 "Healthcare Transaction Validation via Blockchain Proof-of-Work, Systems and Methods" 라는 제목의 미국 특허 출원 공개 제 2015/0332283 호에서 기술된다.
샘플 트래킹 체인 (340) 은 환자 또는 샘플 특정적 구조의 일부인 것으로 제한되지 않고, 그러나 또한 데이터의 더 큰 집합의 일부일 수 있다. 보다 구체적으로, 샘플 트래킹 체인 (340) 은 연구의 진행과 연관된 데이터의 블록들을 포함하는 더 큰 임상 연구의 일부일 수 있다. 임상 연구 체인의 각 블록은, 연구의 블록체인에 대하여 사이드 체인일 수도 있을 환자 개인적 트래킹 체인 (340) 을 포함하는, 연구의 연대기적 진행 및 각 환자의 의료 데이터로 구축될 수 있다. 이러한 접근법의 이점들은 명확하다. 이러한 "연구 트래킹 체인들" 을 제공하는 것은, 일단 데이터가 수집되고 나면, 거짓 데이터를 도입하기 위해서는 전체 체인이 재구축되어야 할 것이기 때문에 그것은 심각한 어려움 없이는 변경될 수 없는 것을 보장한다. 따라서, 연구 데이터는 연구가 완료된 후의 위조에 대하여 보다 강건하다. 일부 실시형태들에서, 비밀에 반대되게 공개의 분산된 블록체인을 이용하여, 데이터의 위조는 더욱더 어렵게 되는데, 그 이유는 이러한 위조가 공공의 외부 감시에 대하여 설 자리가 없을 것이기 때문이다. 본원의 기법들에 따르면, 각 블록의 계산은 시간 효율적인 방식으로 수행될 수 있고, 샘플 체인의 컴퓨팅 상태들 사이의 지연 시간을 최소화한다.
따라서, 샘플 트래킹 체인 (340) 이 인스턴스화될 수 있는 많은 이용가능한 기법들이 존재한다. 단순한 실시형태들에서, 샘플 트래킹 체인 (340) 은 가능하게는 포인터들과 함께, 재귀적 해시 다이제스트들에 의해 링크된 데이터 블록들의 셋트를 포함한다. 각 블록은 데이터베이스에서 별도의 레코드로서 저장될 수 있을 것이다. 하지만, 보다 흥미로운 실시형태들은, 블록체인이 분산된 공개 장부의 일부 또는 비밀 장부의 일부일 수 있는 진짜 블록체인으로서의 샘플 트래킹 체인 (340) 의 인스턴스화를 제공한다. 샘플 트래킹 체인 (340) 을 생성하기 위한 사용을 우해 적응될 수 있는 기존의 기술들은 단지 몇가지만 들어보자면 BitCoin, Ethereum (URL www.ethereum.org 참조), 또는 Hyper Ledger Project (URL www.hyperledger.org 참조) 를 포함한다.
블록체인의 블록들이 환자 정보를 포함할 수 있다는 관점에서, 데이터는 하나 이상의 암호 기술들 (예컨대, 3DES, AES, ECC 등) 을 통해 보안될 수 있다. 예를 들어, 샘플 트래킹 체인 (340) 의 블록들에 저장된 사적 데이터는 환자의 비밀 키에 기초하여 암호화될 수 있다. 환자 또는 다른 허가된 에이전트로부터의 허가 시에, 이해관계인은 가능하게는 기존의 키 교환 기법들을 이용하여 환자의 키에 기초하여 데이터를 액세스하도록 허용될 수 있다. 추가로, 샘플 트래킹 체인 (340) 내의 사적 데이터에 대한 액세스는 2015년 7월 21일 출원된 Soon-Shiong 의 "Homomorphic Encryption in a Healthcare Network Environment, Systems and Methods" 라는 제목의 미국 특허 출원 공개 제 2016/0105402 호에서 논의된 바와 같이 호모모픽 환경 내에서 하나 이상의 보안 세션들을 확립하는 것을 통해 발생할 수 있다.
흥미롭게도, 샘플 트래킹 체인 (340) 은 상기 논의된 바와 같이 데이터를 저장할 수 있거나 문서로서 외부적으로 참조될 수 있다. 예를 들어, 샘플 트래킹 체인 (340) 은 URL 을 통해서 참조될 수 있고, 여기서, URL 의 도메인은 샘플 트래킹 체인 (340) 및/또는 블록들을 참조한다 (예컨대, www.<샘플 체인 도메인 네임>.com/<블록 ID>/<데이터 멤버 ID>/ 등). 샘플 트래킹 체인 (340) 은 또한 DOI 들에 으해 참조되거나 DOI 들을 포인팅할 수 있다. 또 추가로, 샘플 트래킹 체인 (340) 은 환자와 연관된 헬스 오브젝트 식별자들 (health object identifiers; HOI) 에 의해 참조되거나 그 헬스 오브젝트 식별자들에 포인팅할 수 있다. HOI 들은 2014년 1월 3일 출원된 Soon-Shiong 의 "Healthcare Management Objects" 라는 제목의 미국 특허 출원 공개 제 2014/0114675 호에서 보다 상세하게 논의된다.
일부 실시형태들에서, 샘플 트래킹 체인 (340) 은 그래프 데이터베이스 내에 저장될 수 있다. 샘플 트래킹 체인 (340) 에서의 각각의 상태 또는 블록은 그래프 데이터베이스 스키마 내의 노드로서 저장될 수 있고, 여기서, 하나의 상태로부터 다른 상태로의 천이는 노드들 사이의 에지를 나타낸다. 추가로, 외재적 정보는 노드들 및/또는 에지들에 대한 특성들로서 저장될 수 있다. 따라서, 그래프 데이터베이스는 단지 개별 샘플 트래킹 체인들 (340) 에 관한 관련 정보만이 아니라 유사한 특성들을 갖는 유사한 그래프들을 갖는 샘플 트래킹 체인들 (340) 의 집합들로부터의 관련 정보를 빨리 취출하기 위해 사용될 수 있다. 이러한 접근법은, 시스템이 수많은 환자들에 걸치 또는 큰 집단들에 대한 샘플 트래킹 정보를 저장하는 R&D 연구들 또는 임상 시험 연구들을 저장 또는 분석할 때 유리하다. 샘플 트래킹 체인 (340) 을 저장하기 위해 레버리징될 수 있는 예시적인 그래프 데이터베이스 구현은 다른 것들 중에서도 Neo4j, OpenCog, 및 ArangoDB 를 포함한다. 일부 실시형태들에서, AI 프레임워크를 제공하는 OpenCog 와 같은 그래프 데이터베이스들은 샘플 트래킹 체인들 (340) 이 환자들의 치료들 및 결과들에 커플링될 때 보다 바람직할 수도 있을 것이다. 이러한 커플링은, 환자의 샘플 트래킹 체인 (340) 의 이전의, 알려진 샘플 트래킹 체인들 및 결과들의 비교에 기초하여 새로운 환자의 가능한 결과들에 관한 자동화된, 합리적인 가정들을 생성하기 위한 확고한 기반을 제공한다. 샘플 트래킹 체인 (340) 의 그래프 데이터베이스 구현들을 레버리징하기 위해 적응될 수 있는 예시적인 추론 엔진들은 2012년 3월 22일에 국제 출원된 Soon-Shiong 에 대한 "Reasoning Engines" 라는 제목의 미국 특허 제 9,262,719 호에서 기술된다.
샘플 트래킹 체인 (340) 은 또한 하나 이상의 규정들과 부합하기 위한 확고한 기반을 제공한다. 예를 들어, 샘플 트래킹 체인 (340) 은 IEC 62304 감사 단서 요건들, 21 CFR part 11 요건들, HIPPA 규정들, HL7 서포트, 또는 다른 피처들과 호환되는 블록-레벨 데이터를 포함할 수 있다.
도 4 는 디지털 샘플 트래킹 체인을 관리 또는 생성하는 예시적인 컴퓨터 구현된 방법 (400) 을 제시한다. 방법 (400) 의 단계들은 비-일시적 컴퓨터 판독가능한 메모리에 저장된 소프트웨어 명령들에 따라 하나 이상의 프로세서들에 의해 실행될 수 있다. 방법 (400) 에 따라 샘플 트래킹 엔진 또는 검색 엔진으로서 동작하도록 구성될 수 있는 예시적인 컴퓨팅 디바이스들은 의료 촬상 디바이스들 (예컨대, 슬라이드 스캐너들 등), 셀 폰들, 웹 서버들, 워크 스테이션들, 태블릿 컴퓨터들, 클라우드-기반 서버들, 또는 샘플 내재적 상태 정보에 대한 액세스를 갖는 다른 컴퓨팅 디바이스들을 포함한다.
방법 (400) 은 샘플 트래킹 체인의 기원 블록을 생성하는 것을 포함하는 단계 (410) 로 시작한다. 상기 논의된 바와 같은 기원 블록은 타겟 생물학적 샘플의 내재적 특성들 또는 피처들의 표현을 포함하는 디지털 데이터의 블록이다. 추가적으로, 내재적 특성들은 통상적으로 소스로부터의 추출 바로 후의 타겟 생물학적 샘플의 초기 상태를 나타낸다. 예시적인 내재적 특성들은 샘플 질량, 샘플 형상, 샘플들의 수, 조직 타입, 유전체적 특성들, 기계적 특성들, 음향학적 특성들, 밀도, 탄성, 또는 샘플에 관한 다른 특성드을 포함할 수 있다. 제네시스 블록은 또한 생물학적 샘플의 소스 또는 도너와 연관된 데이터 (예컨대, 사회 보장 번호, 이름, 도너 식별자 등) 를 포함할 수 있다. 통상적인 실시형태들에서, 도너는 사람 환자이고; 하지만, 도너는 또한 다른 타입들의 동물들 또는 생물 유기체들일 수 있을 것이다. 예시적인 도너 데이터는, 샘플 로케이션, 프로시저 코드들 (예컨대, CPT 코드들 등), 진단 코드들 (예컨대, ICD 코드들 등), 환자 이름, 환자 식별자, 슬라이드 식별자, 게놈 시퀀스, 주소, 보험 식별자 또는 다른 도너 정보와 같은 샘플 도너 식별자를 포함할 수 있다. 기원 블록은 또한, 가능하게는 바 코드들, RFID 코드들, 라벨들, 워크플로우 식별자들, 작업 식별자들, 감사 단서 코드들, 또는 다른 정보를 포함하는 다른 소스들로부터의 외부의 또는 외재적 데이터를 포함할 수 있다. 기원 블록에서의 포함을 위해 고려되는 외부 데이터의 다른 특정 타입은 사전의 기존의 외부 배포된 공공 장부 (예컨대, BitCoin, Ethereum, HyperLedger 등) 의 블록으로부터 획득된 해시 값 또는 다이제스트를 포함한다. 외부 해시 다이제스트는 샘플이 특정 시점 후에 취해진 것을 나타내는 인증적 및 검증가능한 마커를 제공한다. 일단 샘플 트래킹 체인의 기원 블록과 연관된 데이터가 컴파일링되고 나면, 수집된 데이터 (예컨대, 도너 데이터, 내재적 샘플 데이터, 외부적 데이터 등) 는 그 기원 블록을 실질적으로 식별하는 블록 토큰을 생성하기 위해 사용된다. 보다 바람직한 실시형태들에서, 블록 토큰은 블록의 데이터의 해시 다이제스트를 포함하고, 여기서, 해시 다이제스트는 해시 알고리즘의 하나 이상의 구현들에 따라 생성된다. 일단 기원 블록이 인스턴스화되고 나면, 샘플의 내재적 특성들 또는 다른 속성들 (예컨대, 환자 이름, 샘플 ID 등) 에 의해 인덱싱되는 데이터베이스 또는 다른 저장 시스템에 저장될 수 있다. 기원 블록은 공개 또는 비밀 분산된 장부 내에 저장될 수 있다. 기원 블록은 샘플의 라이프에 대해 연대기적인 샘플의 대응하는 샘플 트래킹 체인의 초기 블록이 블록이 된다. 이러한 크로니컬 (chronical) 은 또한 샘플에 대한 감사 단서를 제공하는 것으로 고려된다. 일부 실시형태들에서, 기원 블록은 정적 데이터, 예컨대, 사회 보장 번호, 생일 등으로부터 구성될 수 있다. 해시 다이제스트는 나중의 시점에 동일한 데이터를 이용하여 재생성된 해시 다이제스트에 대한 비교를 위해 로컬로 저장될 수도 있다. 이 예에서, 양 해시 값들은 동일하여야 하고, 따라서, 기원 블록의 무결성을 검증하기 위해 사용될 수 있다.
단계 (420) 는 일단 샘플 트래킹 체인이 존재하면 그 샘플 트래킹 체인에 대한 액세스를 제공하는데 초점을 맞춘다. 따라서, 단계 (420) 는 관찰된 내재적 샘플 특성들 또는 피처들에 기초하여 샘플 트래킹 체인을 새로운 샘플 상태 정보로 업데이트하는 샘플 트래킹 엔진으로서 동작하는 디바이스에 대한 기초로서 또는 검색 엔진으로서 동작하는 디바이스에 대한 기초로서 기능할 수 있다. 단계 (420) 는 디바이스 (예컨대, 샘플 트래킹 엔진, 샘플 검색 엔진 등) 가 타겟 생물학적 샘플의 샘플 트래킹 체인에 대한 액세스를 획득하는 것을 포함한다. 하나 이상의 내부 특성들은 타겟 생물학적 샘플의 디지털 표현으로부터 도출된다. 일부 시나리오들에서, 디지털 표현은 원시 센서 데이터 (예컨대, 이미지 센서 데이터, 프로브 데이터 등) 를 포함한다. 다른 시나리오들에서, 디지털 표현은 오디오 데이터, 이미지 데이터, 비디오 데이터, 또는 실시간으로 또는 디지털 레코딩으로부터 캡처된 다른 데이터 양태들을 포함할 수 있을 것이다. 내재적 데이터는, 가능하게는 샘플에 관련된 다른 데이터와 함께, 쿼리 (예컨대, SQL 커맨드, 키워드들, 룩-업 인덱스들 등) 내로 컴파일링될 수 있고, 이는 그 다음에 샘플 트래킹 체인들의 하나 이상을 저장하는 샘플 데이터베이스에 제출될 수 있다. 보다 선호되는 실시형태들에서, 쿼리는, 데이터베이스에서 샘플 트래킹 변화들이 인덱싱되는 네임스페이스 또는 스키마에 따라 구성된다. 예를 들어, 샘플의 디지털 이미지로부터 도출된 하나 이상의 이미지 디스크립터들은 샘플 데이터베이스에 쿼리로서 제출될 수 있다. 데이터베이스는 쿼리를 만족하는 제로 (즉, 매칭 없음 또는 NULL 매치) 또는 그보다 많은 샘플 트래킹 체인들의 결과들 셋트를 리턴한다. 이미지 디스크립터들을 이용하는 것의 예로 돌아가서, 샘플 데이터베이스는 유사한 이미지 디스크립터들을 갖는 하나 이상의 샘플 트래킹 변화들을 리턴할 수 있다. 하나보다 많은 샘플 트래킹 체인이 리턴되는 경우에, 그것들은 그것들의 이미지 디스크립터들이 얼마나 잘 쿼리 이미지 디스크립터들에 매칭되는지에 의해 랭크될 수 있다. 랭킹은 용어 빈도 (예컨대, 디스크립터들) 및 역 문서 빈도 (TF-IDF) 의 변화에 기초할 수 있을 것이다. 쿼리가 샘플의 내재적 특성들 및 다른 데이터 (예컨대, 도너 명칭, 샘플 ID, 외재적 데이터 등) 의 내재적 특성들에 기초하여 구성될 수 있다는 관점에서, 외재적 데이터 엔트리 또는 샘플 라벨들에서의 에러들이 완화된다. 샘플 정보를 달성하는 것에 대한 이전의 접근법들에서, 샘플 정보를 인덱싱하기 위해 사용된 인덱스들은 오직 외재적 정보에만 의존하였다. 이러한 외재적 정보는 가능하게는 부정확한 데이터 입력, 미스라벨링, 또는 다른 인자들로 인해 인간 오류에 심각하게 영향을 받는다. 따라서, 개시된 접근법은 샘플의 실제 내재적 피처들에 또한 의존함으로써 잘못된 긍정들을 감소시키고, 에러에 취약한 수동 프로세스들에 비해 향상을 제공한다.
단계 (430) 는 샘플 트래킹 체인으로부터 이전 샘플 상태 오브젝트를 취출하는 것을 포함한다. 이전 샘플 상태 오브젝트는 타겟 생물학적 샘플의 이전 상태를 나타내는 데이터를 갖는 샘플 트래킹 체인의 적어도 하나의 부분을 포함한다. 샘플 트래킹 체인이 새롭게 관찰된 상태에 기초하여 새로 생성되고 있는 경우에, 이전 샘플 상태 오브젝트는 NULL 오브젝트로 고려될 수 있거나 새롭게 관찰된 상태에 기초하여 구체화될 수 있는 새롭게 인스턴스화된 오브젝트로 고려될 수 있다. 샘플 트래킹 체인이 이미 존재하는 경우에, 이전 샘플 상태 오브젝트는 블록체인으로부터의 데이터의 블록일 수 있다. 도 3 과 관련하여 논의된 바와 같이, 블록은 그 블록을 식별하는 하나 이상의 블록 토큰들을 포함할 수 있고, 이전 상태 정보; 예를 들어 이전 블록으로부터의 해시 다이제스트와 함께 블록의 데이터의 함수로서 생성된다. 이전 샘플 상태 오브젝트는 새로운 블록을 생성하기 위한 기반으로서 사용된다. 통상적인 실시형태들에서, 이전 샘플 상태 오브젝트는 바로 선행하는 블록이다. 하지만, 이전 샘플 상태 오브젝트는 타겟 생물학적 샘플의 임의의 이전 상태일 수 있거나, 심지어 타겟 생물학적 샘플과 연관된 완전한 블록체인일 수 있을 것임이 또한 고려된다.
선택적 단계로 고려될 수 있는 단계 (440) 는 현재 관찰된 상태와 샘플 트래킹 체인에서의 이전 샘플 상태 오브젝트들 중 적어도 하나 사이의 유사도 측정치를 계산함으로써 타겟 생물학적 샘플을 유효화하는 것을 포함한다. 블록체인에서의 각각의 블록인 각각의 상태 오브젝트가 생물학적 샘플의 디지털 내재적 피처들을 포함한다는 관점에서, 현재 상태의 디지털 피처들을 이전 샘플 상태 오브젝트에서 발견된 것들에 대해 비교하는 것이 가능하다. 일 예로서, 이전 샘플 상태 오브젝트가 전체 슬라이드 이미지를 나타내고, 가능하게는 슬라이드 상의 조직의 윤곽 또는 경계로부터 생성된 에지 디스크립터들을 포함하는 다수의 이미지 디스크립터들을 포함하는 경우를 고려하자. 에지 디스크립터들은 이전 샘플 상태 오브젝트 및 대응하는 샘플 트래킹 체인을 인덱싱하기 위해 사용될 수 있음에 유의한다. 이 예로 계속하면, 현재 관찰된 상태는 현미해부 후의 동일 슬라이드의 전체 슬라이드 이미지를 포함한다고 가정하자. 비록 조직 샘플의 섹션들이 제거되었고 따라서 가능하게는 하나 이상의 이미지 디스크립터들이 제거되었음에도 불구하고, 샘플에서의 조직의 윤곽은 실질적으로 온전하게 남아있을 수 있다. 이것은, 조직의 경계와 연관된 에지 디스크립터들이 대부분 온전하게 남아있음을 의미한다. 따라서, 에지 디스크립터들은 몇가지 목적들을 위해 사용될 수 있다. 첫째로, 현미해부된 슬라이드에서의 조직 경계의 에지 디스크립터들은, 가능하게는 가장 가까운 이웃 검색 (예컨대, k-NN 검색, 근사 NN 검색 등) 에 기초하여, 샘플 트래킹 체인 또는 이전 샘플 상태 오브젝트를 취출하기 위해 사용될 수 있다. 둘째로, 현미해부된 조직의 경계 에지 디스크립터들은 유사도 측정치를 생성하기 위해 현미해부 전에 이전의 에지 디스크립터들에 대해 비교될 수 있다. 유사도 측정치는 현미해부 전 및 후의 가장 유사한 에지 디스크립터들의 쌍들 사이의 유클리디안 거리의 함수로서 계산될 수 있다. 최종 유사한 측정치는, 가능하게는 정규화 후의; 단지 유클리디안 거리들의 합일 수 있을 것이다; 제로에 근접할 때, 2 개의 조직 샘플 상태들은 매우 유사하고, 유효한 매치로 고려될 수 있다. 유사도 측정치가 큰 포지티브 값을 갖는 경우에, 상태들은 비유사하다. 이러한 유사도 측정을 위해 사용되는 임계치 값은 디스크립터들의 성징, 측정치를 정규화하는 것, 디스크립터들의 수, 또는 다른 인자들에 의존할 것이다. 샘플 피처들에 기초한 모든 유사도 측정치들이 고려된다. 따라서, 2 개의 상태들이 유사한 것으로 발견될 때, 새로운 상태는 고려 하의 타겟 생물학적 샘플에 대해 유효 상태로 고려될 수 있다.
단계 (450) 는 타겟 생물학적 샘플의 관찰된 상태를 나타내는 현재 상태를 생성하는 것을 포함한다. 관찰된 상태는 하나 이상의 센서들 (예컨대, 카메라들, 프로브들 등) 또는 다른 데이터 소스들과 연관되고 타겟 생물학적 샘플을 나타내는 원시 데이터 또는 데이터 파일들을 포함한다. 일부 실시형태들에서, 관찰된 상태는 예를 들어 타겟 생물학적 샘플의 디지털 이미지를 포함할 수 있다. 디지털 이미지는 샘플의 부분들의 이미지들 또는 전체 샘플의 이미지일 수 있을 것이다. 일부 시나리오들에서, 디지털 이미지는 다양한 배율들; 10x, 20x, 40x, 및/또는 그 이상의 배율들에서 샘플의 부분들을 캡처하는 마이크로그래프일 수 있을 것이다. 조직의 슬라이드 이미지와 관련하여, 40x 배율들은 세포-레벨 상세들을 포함할 가능성이 클 것이다. 현재 상태는 관찰된 상태로부터 인스턴스화된다. 일부 실시형태들에서, 현재 상태는 관찰된 상태와 동일한 데이터를 저장한다. 이러한 경우들에서, 현재 상태 및 관찰된 상태는 동일한 데이터 구조일 수 있을 것이다. 또한, 보다 흥미로운 실시형태들에서, 현재 상태는 또한 관찰된 상태 데이터로부터의 하나 이상의 디지털 피처들 (예컨대, 이미지 디스크립터들, 에지 디스크립터들, 형상 디스크립터들, 핵 밀도, Voronoi 다이어그램들 등) 을 포함한다. 용어들 "현재 상태" 및 "관찰된 상태" 는 전체 블록 오브젝트를 생성하기 위한 준비에 있어서 생물학적 샘플에 관련된 데이터를 저장하는 중간 데이터 오브젝트들을 의미하기 위해 사용됨을 이해하여야 한다.
단계 (460) 는 샘플 트래킹 체인 내로의 통합을 위해 새로운 블록 오브젝트를 생성하는 것에 초점을 맞춘다. 단계 (460) 는 이전 샘플 상태 오브젝트 및, 단계 (450) 와 관련하여 논의된 바와 같이, 현재 상태의 함수로서 현재 샘플 상태 오브젝트를 도출하는 것을 포함한다. 현재 샘플 상태 오브젝트는 샘플 트래킹 체인 내에 통합될 수 있는 충분히 인스턴스화된 데이터의 블록을 나타낸다. 통상적으로, 현재 샘플 상태 오브젝트는 타겟 생물학적 샘플의 내재적 피처들을 나타내는 현재 상태로부터의 요망도는 샘플 상태 데이터 (예컨대, 이미지 데이터, 디스크립터들, 오디오 데이터, 비디오 데이터 등) 를 포함한다. 특별히 관심 있는 것은, 현재 샘플 상태 오브젝트는 또한, 이전 샘플 상태 오브젝트로부터의 블록 토큰 및 현재 데이터로부터 생성되는 블록 토큰, 해시 다이제스트를 예를 들어 포함한다. 예를 들어, 단계 (465) 에 의해 나타낸 바와 같이, 현재 샘플 상태 오브젝트에 대한 블록 토큰을 생성하는 것은 이전 상태의 해시 다이제스트에 기초하여 현재 샘플 상태 오브젝트에 대한 해시 다이제스트를 계산하는 것을 포함한다. 이러한 해시 다이제스트는 이전 상태의 해시 및 현재 상태 데이터의 연쇄일 수 있다. 추가로, 해시 다이제스트는 해시 충돌들을 감소시키기 위해 동일한 해시 함수의 다중 반복들 (예컨대, SHA-512(SHA-512(data))) 또는 해시 함수들의 이종 혼합 (예컨대, SHA-512(scrypt(data))) 을 포함할 수 있을 것이다. 일부 실시형태들에서, 현재 샘플 상태 오브젝트의 생성은 또한, 작업 증명으로서 암호 퍼즐을 풂으로써 분산된 장부 시스템 (예컨대, Ethereum, HyperLedger, BitCoin 등) 내에 블록을 생성하는 것을 포함할 수 있다. 이러한 경우들에서, 블록 토큰은 특정 시그니처 (예컨대, 선행 제로들의 수, 요망되는 비트 패턴 등) 를 갖는 해시 다이제스트를 포함할 수 있다. 또 추가로, 현재 샘플 상태 오브젝트는, 현재 샘플 상태 오브젝트에서의 데이터가 어떤 잘 정의된 시간만큼 존재하고 있었다는 것을 증명하기 위해, 외부 정보, 예를 들어 외부 공공 장부 해시 다이제스트를 통합할 수 있다.
단계 (470) 는 샘플 트래킹 체인에서 현재 샘플 상태 오브젝트를 이전 샘플 상태 오브젝트에 링크하는 것을 포함한다. 일부 실시형태들에서, 이전 샘플 상태 오브젝트로부터 해시 다이제스트를 생성하는 것은 다계 (465) 에서 설명된 바와 같이 링크를 형성한다. 한편, 다른 실시형태들에서, 새롭게 생성된 또는 인스턴스화된 블록은 이전 샘플 상태 오브젝트에 대한 역방향의 포인터를 포함할 수 있거나, 이전 샘플 상태 오브젝트는 새롭게 생성된 현재 샘플 상태 오브젝트에 포인팅되는 포인터로 업데이트될 수 있고, 그에 의해 각 블록이 그것의 이웃들에 링크하는 이중 링크된 리스트를 형성한다.
단계 (480) 는 샘플 트래킹 체인을 현재 샘플 상태 오브젝트로 업데이트하는 것을 포함한다. 구현에 따라, 이 단계는 상이한 특성들을 취할 수 있다. 링크된 리스트-기반 시스템에서, 현재 샘플 상태 오브젝트는 데이터베이스에 저장될 수 있고, 이전 샘플 상태 오브젝트는 단계 (470) 에서 논의된 바와 같이 포인터로 업데이트될 수 있다. 또한, 다른 블록체인 실시형태들에서, 샘플 트래킹 체인은 현재 샘플 상태 오브젝트를 나타내는 블록을 통합하기 위해 업데이트되고, 여기서, 샘플 트래킹 체인은 단일 레코드이다. 샘플 트래킹 체인이 분산된 장부의 일부인 경우에, 피어 디바이스들 상에 위치된 샘플 트래킹 체인들은 네트워크를 통해 샘플 트래킹 체인에 대한 업데이트들을 수신할 수 있다. 예를 들어, 가능하게는 작업 증명 또는 다른 "증명 (proof)" 모델에 기초하여, 현재 샘플 상태 오브젝트를 성공적으로 생성하는 샘플 트래킹 엔진은, 현재 샘플 상태 오브젝트를 하나 이상의 디지털 포맷들 (예컨대, XML, YAML, WSDL, 바이너리 오브젝트들 등) 로 캡슐화되고 하나 이상의 프로토콜들 (예컨대, TCP/IP, UDP/IP, HTTP, HTTPS, FTP 등) 을 통해 전송된 새로운 블록으로서 패키징함으로써 분산 장부 시스템에서 다른 피어들에 현재 샘플 상태 오브젝트를 제출할 수 있다.
추가적으로, 장부가 분산되고 복수의 컴퓨터들을 수반하는 경우에, 블록체인에서의 다음 링크가 진정한 것이고 탬퍼링되지 않았다는 것을 보장하는 작업 증명 (proof of work) 알고리즘들, 블록들을 생성하기 위해 검증자들에 의존하고 다른 컴퓨터들에 대해 블록 상에서 사인 오프하게 하는 지분 증명 (proof of stake) 알고리즘들 등을 포함하는, 블록체인들을 업데이트하기 위한 당해 기술분야에서 알려진 컨센서스 기법들이 이용될 수도 있다. 모든 이러한 기법들은 본원에서의 사용을 위해 고려된다.
단계 (485) 는 타겟 생물학적 샘플의 디지털 표현으로부터 도출된 디지털 샘플 피처들에 따라 샘플 트래킹 데이터베이스에서 샘플 트래킹 체인을 인덱싱하는 것을 포함한다. 디지털 샘플 피처들은 글로벌 샘플 피처들 (예컨대, 전체 슬라이드 이미지 디스크립터들, 조직 경계 에지 디스크립터들 등), 샘플 상태 피처들 (예컨대, 착색들, 컬러 맵들 등), 또는 다양한 디스크립터들 (예컨대, 이미지 디스크립터들, 에지 디스크립터들, 형상 디스크립터들, 컬러 디스크립터들, 텍스처 디스크립터들 등) 을 포함할 수 있다. 샘플 트래킹 체인 및 현재 샘플 상태 오브젝트는 관찰된 상태로부터 도출된 내재적 피처들로 인덱싱될 수 있다. 내재적 피처들은 이미지 디스크립터들, 에지 디스크립터들, 디지털 시그니처들, 측정된 피처들, 형상 디스크립터들, 메트릭들, 또는 관찰된 상태의 디지털 표현으로부터 도출되거나 측정될 수 있는 다른 피처들을 포함할 수 있다. 이전에 논의된 바와 같이, 샘플의 내재적 피처들에 기초하여 현재 샘플 상태 오브젝트 및 샘플 트래킹 체인을 인덱싱하는 것은 데이터의 빠르고 유효한 취출을 가능하게 한다. 비록 방법 (400) 은 타겟 생물학적 샘플의 내재적 특성들 또는 피처들에 기초하여 샘플 트래킹 정보를 구출하는 것에 초점을 맞춤에도 불구하고, 샘플 트래킹 체인 및 그것의 상태 오브젝트들 (예컨대, 샘플 트래킹 블록체인에서의 블록들 등) 은 외재적 정보; 바 코드들, 환자 식별자, 메타데이터 등에 의해서도 역시 잘 인덱싱될 수 있음이 또한 고려된다.
샘플 트래킹 체인은 요망되는 바와 같이 상술된 단계들의 하나 이상에 따라 계속 성장할 수 있다. 결과적인 트래킹 체인은 수많은 명확한 기술적 이익들을 갖는다. 첫째로, 타겟 생물학적 샘플의 라이프 사이클은 연대기적이 되고, 임의의 시점에서 샘플의 디지털 인덱스로서 동작하는 내재적 피처들에 기초하여 컴퓨팅 디바이스를 통해 빨리 취출될 수 있다. 둘째로, 샘플 데이터는 체인에서의 다양한 블록 토큰들을 재계산하는 컴퓨팅 디바이스를 이용하여 이해관계자들을 통해 외부 이해관계자들에 의해 입증될 수 있다. 추가로, 이해관계자들은, 기존의, 외부의 공개 장부들로부터의 외부 해시 다이제스트들에 기초하여 데이터가 어떤 시간들만큼 존재하였었다는 것을 입증할 수 있다.
일부 실시형태들에서, 샘플 트래킹 체인은 독립형 데이터 구조, 예컨대, 개별 데이터 구조일 수 있다. 다른 실시형태들에서, 샘플 트래킹 체인은, 예컨대, 하이퍼 레저 (hyper ledger) 또는 다른 블록체인 기반 인프라스트럭처의 일부로서, 더 큰 블록체인 인프라스트럭처의 일부이거나, 다른 기존의 샘플 트래킹 체인들 또는 블록체인들 내로 통합될 수 있다. 다른 실시형태들에서, 샘플 트래킹 체인은, 예컨대, 기술자 또는 시설 등과 연관된, 더 큰 블록체인 인프라스트럭처의 일부일 수 있다. 의료 이력 블록체인 (healthcare historical blockchain; HHBC) 을 생성하기 위해 큰 블록체인에 의료 데이터를 저장하는 것의 예들은 미국 특허 출원 제 14/711,740 호에서 발견될 수도 있고, 이는 참조에 의해 본원에 통합된다.
본원에 개시된 기법들은 또한 애플리케이션 프로그래임 인터페이스 (API) 를 이용하여 OaaS (Operating as a Service) 로서 이용될 수도 있다. 해시 다이제스트들의 링크된 리스트들을 포함하는 샘플 트래킹 체인들에 대해 다양한 분석론들이 수행될 수 있다. 다양한 샘플 트래킹 체인들이 적합한 인프라스트럭처 상에 저장된다면, 병원들, 과학자들, 회사들 또는 하나 이상의 샘플 상태 오브젝트들에서의 데이터에 대해 액세스하기를 원하는 다른 에티티들은 관련 데이터를 액세스하기 위한 서비스에 가입할 수도 있다. 추가적으로, 본원에 제시된 기법들은 데이터 프라이빗의 일부 양태들을 저장하고 유지하기 위해 이용될 수도 있다. 예를 들어, 촬상 슬라이드들에 대한 포인터들을 포함함으로써, 제 3 자는 슬라이드들과 연관된 기밀의 환자 정보가 아닌 그 슬라이드들에 대한 액세스를 제공받을 수 있을 것이다.
예를 들어, 폐암의 특정 타입에 대해 이용가능하거나 특정 임상 연구와 연관된 현미해부의 전부를 검토하기 위해, 관련 샘플들 (예컨대, 오직 폐 현비해부 사이트들) 을 식별하기 위해 샘플 트래킹 체인을 검토할 수 있을 것이다. 다른 예들에서, 샘플 트래킹 체인들은 특정 시설에서 또는 특정 데이터 기술자에 의해 분석되는 데이터 샘플들을 확립하기 위해 검토될 수도 있다.
관련 데이터의 식별을 용이하게 하기 위해, 샘플 트래킹 체인은 메타데이터를 포함할 수 있다. 샘플의 특성들, 예컨대, 1mm 샘플 두께, 암의 타입, 임상 시험 정보 등을 기술하기 위해 다양한 타입들의 메타데이터가 수집되고 샘플 상태 오브젝트 내로 통합될 수 있다. 데이터베이스는, 예컨대, OaaS 서비스의 일부로서, 관심대상의 데이터의 식별을 용이하게 하기 위해 및/또는 샘플을 특성화하기 위해 사용되는 다양한 타입들의 메타데이터를 저장하기 위해 사용될 수 있다. 이미 설명된 것들 이외의 더 많은 변경들이 본 발명의 컨셉들로부터 일탈함이 없이 본원에서 가능한 것으로 당업자들은 이해하여야 한다. 따라서, 본 발명의 기술요지는, 첨부된 청구범위의 사상에서를 제외하고는 한정되지 않아야 한다. 더욱이, 명세서 및 청구범위 양쪽을 해석할 때, 모든 용어들은 문맥에 부합하는 가장 넓은 가능한 방법으로 해석되어야 한다. 특히, 용어들 "포함한다 (comprises)" 및 "포함한 (comprising)" 은 인용된 엘리먼트들, 컴포넌트들, 또는 단계들이 명확하게 인용되지 않은 다른 엘리먼트들, 컴포넌트들, 또는 단계들과 함께 존재하거나, 또는 이용되거나, 또는 결합된다는 것을 표시하는 포괄적인 방법으로, 엘리먼트들, 컴포넌트들, 또는 단계들을 인용하는 것으로 해석되어야 한다. 명세서 또는 청구범위가 A, B, C... 및 N 으로 이루어지는 군에서 선택되는 어떤 것 중 적어도 하나를 언급하는 경우, 그 텍스트는 A 와 N, 또는 B 와 N, 등이 아닌, 그 그룹에서 오직 하나의 엘리먼트만을 필요로 하는 것으로서 해석되어야 한다.

Claims (40)

  1. 생물학적 샘플 트래킹 시스템으로서,
    샘플 트래킹 체인들을 저장하는 샘플 데이터베이스로서, 각각의 샘플 트래킹 체인은 생물학적 샘플의 라이프 사이클을 나타내는, 상기 샘플 데이터베이스; 및
    상기 샘플 데이터베이스에 커플링된 프로세서를 포함하는 샘플 트래킹 엔진을 포함하고,
    상기 샘플 트래킹 엔진은,
    상기 샘플 데이터베이스로부터의 그리고 타겟 생물학적 샘플에 대응하는 샘플 트래킹 체인에 대한 액세스를 획득하고;
    상기 샘플 트래킹 체인으로부터 이전 샘플 상태 오브젝트를 취출하며;
    상기 타겟 생물학적 샘플의 관찰된 상태의 현재 상태 표현을 생성하고;
    상기 이전 샘플 상태 오브젝트 및 상기 현재 상태 표현의 함수로서 메모리에서 현재 샘플 상태 오브젝트를 인스턴스화하고;
    상기 샘플 트래킹 체인에서 상기 현재 샘플 상태 오브젝트를 상기 이전 샘플 상태 오브젝트에 링크하며; 그리고
    상기 샘플 데이터베이스에서의 상기 샘플 트래킹 체인을 상기 현재 샘플 상태 오브젝트로 업데이트하도록
    구성되는, 생물학적 샘플 트래킹 시스템.
  2. 제 1 항에 있어서,
    상기 샘플 트래킹 체인은 환자 데이터를 포함하는, 생물학적 샘플 트래킹 시스템.
  3. 제 1 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 샘플 메타데이터를 포함하는, 생물학적 샘플 트래킹 시스템.
  4. 제 3 항에 있어서,
    상기 샘플 메타데이터는, 시간 데이터, 날짜 데이터, 절차 데이터, 진단 데이터, 이해관계자 데이터, 의료 제공자 데이터, 이미지 데이터, 지리위치 데이터, 주소 데이터, 샘플 데이터, 보험 데이터, 워크스테이션 데이터, 워크플로우 데이터, 및 기술자 명칭으로 이루어진 그룹으로부터 선택된 적어도 하나의 타입의 데이터를 포함하는, 생물학적 샘플 트래킹 시스템.
  5. 제 1 항에 있어서,
    상기 샘플 데이터베이스와 커플링된 샘플 검색 엔진을 더 포함하고,
    상기 샘플 검색 엔진은, 컴퓨터 판독가능한 유형의 비-일시적 컴퓨터 판독가능 메모리에 저장된 소프트웨어 명령들의 프로세서에 의한 실행 시에,
    타겟 생물학적 샘플의 디지털 표현을 획득하고;
    상기 디지털 표현으로부터 디지털 샘플 피처들을 도출하며; 그리고
    상기 디지털 샘플 피처들의 함수로서 상기 샘플 데이터베이스로부터 상기 샘플 트래킹 체인의 적어도 부분을 취출하도록
    구성가능한, 생물학적 샘플 트래킹 시스템.
  6. 제 1 항에 있어서,
    상기 샘플 데이터베이스는 상기 생물학적 샘플의 디지털 표현으로부터 도출된 디지털 샘플 피처들에 따라 상기 샘플 트래킹 체인들을 인덱싱하는, 생물학적 샘플 트래킹 시스템.
  7. 제 6 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 상기 디지털 샘플 피처들을 포함하는, 생물학적 샘플 트래킹 시스템.
  8. 제 6 항에 있어서,
    상기 디지털 샘플 피처들은 글로벌 샘플 피처들을 포함하는, 생물학적 샘플 트래킹 시스템.
  9. 제 6 항에 있어서,
    상기 디지털 샘플 피처들은 샘플 상태 피처들을 포함하는, 생물학적 샘플 트래킹 시스템.
  10. 제 6 항에 있어서,
    상기 디지털 샘플 피처들은, 이미지 디스크립터들, 에지 디스크립터들, 형상 디스크립터들, 컬러 디스크립터들, 및 텍스처 디스크립터들로 이루어진 그룹으로부터 선택된 적어도 하나의 타입의 디스크립터를 포함하는, 생물학적 샘플 트래킹 시스템.
  11. 제 1 항에 있어서,
    상기 타겟 생물학적 샘플은 조직 시료를 갖는 슬라이드를 포함하는, 생물학적 샘플 트래킹 시스템.
  12. 제 1 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 상기 타겟 생물학적 샘플의 2D 이미지를 나타내는, 생물학적 샘플 트래킹 시스템.
  13. 제 1 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 상기 타겟 생물학적 샘플의 3D 모델을 나타내는, 생물학적 샘플 트래킹 시스템.
  14. 제 1 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 상기 타겟 생물학적 샘플의 비-착색된 버전을 나타내는, 생물학적 샘플 트래킹 시스템.
  15. 제 1 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 상기 타겟 생물학적 샘플의 착색된 버전을 나타내는, 생물학적 샘플 트래킹 시스템.
  16. 제 1 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 상기 타겟 생물학적 샘플의 마크업 버전을 나타내는, 생물학적 샘플 트래킹 시스템.
  17. 제 1 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 상기 타겟 생물학적 샘플의 현미해부된 버전을 나타내는, 생물학적 샘플 트래킹 시스템.
  18. 제 1 항에 있어서,
    상기 샘플 트래킹 엔진은 추가적으로, 상기 샘플 트래킹 체인으로서 새로운 샘플 트래킹 체인을 생성하도록 구성가능한, 생물학적 샘플 트래킹 시스템.
  19. 제 18 항에 있어서,
    상기 이전 샘플 상태 오브젝트는 NULL 오브젝트를 포함하는, 생물학적 샘플 트래킹 시스템.
  20. 제 18 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 샘플 도너 식별자에 기초하여 생성된 기원 블록을 포함하는, 생물학적 샘플 트래킹 시스템.
  21. 제 20 항에 있어서,
    상기 샘플 도너 식별자는 환자 이름, 환자 번호, 환자 식별자, 슬라이드 식별자, 게놈 시퀀스, 주소, 보험 식별자 중 적어도 하나를 포함하는, 생물학적 샘플 트래킹 시스템.
  22. 제 1 항에 있어서,
    상기 샘플 트래킹 체인은 샘플 상태 오브젝트들의 링크된 체인을 포함하는, 생물학적 샘플 트래킹 시스템.
  23. 제 1 항에 있어서,
    상기 샘플 트래킹 체인은 블록체인을 포함하는, 생물학적 샘플 트래킹 시스템.
  24. 제 1 항에 있어서,
    상기 샘플 트래킹 체인은 의료 이력 블록체인 (HHBC) 을 포함하는, 생물학적 샘플 트래킹 시스템.
  25. 제 1 항에 있어서,
    상기 이전 샘플 상태 오브젝트는 이전 상태 해시 다이제스트를 포함하는, 생물학적 샘플 트래킹 시스템.
  26. 제 25 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 상기 현재 상태 표현 및 상기 이전 상태 해시 다이제스트에 기초하여 생성된 해시 다이제스트를 포함하는, 생물학적 샘플 트래킹 시스템.
  27. 제 1 항에 있어서,
    상기 샘플 트래킹 엔진은 추가적으로, 상기 샘플 트래킹 체인에서의 적어도 하나의 이전 샘플 상태 오브젝트와 상기 현재 샘플 상태 오브젝트 사이의 유사도를 계산함으로써 상기 타겟 생물학적 샘플을 유효화하도록 구성가능한, 생물학적 샘플 트래킹 시스템.
  28. 제 1 항에 있어서,
    상기 관찰된 상태는 상기 타겟 생물학적 샘플의 적어도 하나의 내재 특성을 포함하는, 생물학적 샘플 트래킹 시스템.
  29. 제 28 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 상기 타겟 생물학적 샘플의 상기 적어도 하나의 내재 특성으로부터 도출된 디지털 피처들을 포함하는, 생물학적 샘플 트래킹 시스템.
  30. 제 1 항에 있어서,
    상기 샘플 트래킹 체인은 복수의 샘플 트래킹 체인들을 포함하는 집합 블록체인의 일부인, 생물학적 샘플 트래킹 시스템.
  31. 제 1 항에 있어서,
    적어도 하나의 샘플 상태 오브젝트는 공개 장부로부터의 해시 다이제스트와 연관된 외부 타임스탬프를 포함하는, 생물학적 샘플 트래킹 시스템.
  32. 제 20 항에 있어서,
    상기 기원 블록은 정적 데이터를 포함하는, 생물학적 샘플 트래킹 시스템.
  33. 제 1 항에 있어서,
    샹기 샘플 트래킹 엔진은 이전 샘플 상태 오브젝트에서의 정보에 기초하여 상기 현재 상태 표현을 예측하는, 생물학적 샘플 트래킹 시스템.
  34. 제 33 항에 있어서,
    상기 샘플 트래킹 엔진은, 상기 예측이 상기 현재 상태 표현과 비교하여 유사도의 레벨 내에 있지 않은 경우에 사용자에게 통지를 제공하는, 생물학적 샘플 트래킹 시스템.
  35. 제 1 항에 있어서,
    상기 현재 샘플 상태 오브젝트는 이전 샘플 상태 오브젝트로부터의 데이터에 의해 유효화되는, 생물학적 샘플 트래킹 시스템.
  36. 제 1 항에 있어서,
    상기 샘플 트래킹 체인에서의 하나 이상의 샘플 상태 오브젝트들은 워크플로우의 프로세싱 단계로부터 초래되는 상기 생물학적 샘플의 물리적 외관에서의 변화에 대응하는, 생물학적 샘플 트래킹 시스템.
  37. 제 1 항에 있어서,
    상기 샘플 트래킹 엔진은 추가적으로,
    데이터에 대한 요청을 수신하고;
    샘플 상태 오브젝트들과 연관된 메타데이터에 기초하여 요청된 데이터를 식별하며; 그리고
    상기 샘플 상태 오브젝트들로부터의 요청된 데이터를 리턴하도록
    구성가능하고,
    리턴된 상기 데이터는 환자에 관한 식별 정보를 포함하지 않는, 생물학적 샘플 트래킹 시스템.
  38. 제 1 항에 있어서,
    상기 생물학적 샘플의 상태는 상기 샘플 트래킹 체인에 저장된 정보에 기초하여 재구성되는, 생물학적 샘플 트래킹 시스템.
  39. 컴퓨터 구현되는 방법으로서,
    샘플 트래킹 체인들을 저장하는 샘플 데이터베이스로부터 샘플 트래킹 체인에 대한 액세스를 획득하는 단계로서, 각각의 샘플 트래킹 체인은 생물학적 샘플의 라이프 사이클을 나타내고 타겟 생물학적 샘플에 대응하는, 상기 샘플 트래킹 체인에 대한 액세스를 획득하는 단계;
    상기 샘플 트래킹 체인으로부터 이전 샘플 상태 오브젝트를 취출하는 단계;
    상기 타겟 생물학적 샘플의 관찰된 상태의 현재 상태 표현을 생성하는 단계;
    상기 이전 샘플 상태 오브젝트 및 상기 현재 상태 표현의 함수로서 메모리에서 현재 샘플 상태 오브젝트를 인스턴스화하는 단계;
    상기 샘플 트래킹 체인에서 상기 현재 샘플 상태 오브젝트를 상기 이전 샘플 상태 오브젝트에 링크하는 단계; 및
    상기 샘플 데이터베이스에서의 상기 샘플 트래킹 체인을 상기 현재 샘플 상태 오브젝트로 업데이트하는 단계를 포함하는, 컴퓨터 구현되는 방법.
  40. 샘플 트래킹 체인을 생성하기 위한 컴퓨터 프로그램 제품으로서,
    상기 컴퓨터 프로그램 제품은, 명령들을 포함한 컴퓨터 판독가능 저장 매체를 포함하고,
    프로그램 명령들은 프로세서로 하여금,
    샘플 트래킹 체인들을 저장하는 샘플 데이터베이스로부터 샘플 트래킹 체인에 대한 액세스를 획득하는 것으로서, 각각의 샘플 트래킹 체인은 생물학적 샘플의 라이프 사이클을 나타내고 타겟 생물학적 샘플에 대응하는, 상기 샘플 트래킹 체인에 대한 액세스를 획득하는 것을 행하게 하고;
    상기 샘플 트래킹 체인으로부터 이전 샘플 상태 오브젝트를 취출하게 하며;
    상기 타겟 생물학적 샘플의 관찰된 상태의 현재 상태 표현을 생성하게 하고;
    상기 이전 샘플 상태 오브젝트 및 상기 현재 상태 표현의 함수로서 메모리에서 현재 샘플 상태 오브젝트를 인스턴스화하게 하고;
    상기 샘플 트래킹 체인에서 상기 현재 샘플 상태 오브젝트를 상기 이전 샘플 상태 오브젝트에 링크하게 하고; 그리고
    상기 샘플 데이터베이스에서의 상기 샘플 트래킹 체인을 상기 현재 샘플 상태 오브젝트로 업데이트하게 하도록
    상기 프로세서에 의해 실행가능한, 컴퓨터 판독가능 저장 매체를 포함하는 컴퓨터 프로그램 제품.
KR1020197011437A 2016-09-20 2017-09-19 샘플 트래킹 체인들을 통한 샘플 트래킹, 시스템들 및 방법들 KR102385775B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662396986P 2016-09-20 2016-09-20
US62/396,986 2016-09-20
PCT/US2017/052284 WO2018057520A1 (en) 2016-09-20 2017-09-19 Sample tracking via sample tracking chains, systems and methods

Publications (2)

Publication Number Publication Date
KR20190076966A true KR20190076966A (ko) 2019-07-02
KR102385775B1 KR102385775B1 (ko) 2022-04-11

Family

ID=61621155

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197011437A KR102385775B1 (ko) 2016-09-20 2017-09-19 샘플 트래킹 체인들을 통한 샘플 트래킹, 시스템들 및 방법들

Country Status (9)

Country Link
US (2) US10923215B2 (ko)
EP (1) EP3516550A4 (ko)
JP (1) JP7037565B2 (ko)
KR (1) KR102385775B1 (ko)
CN (1) CN110249350A (ko)
AU (1) AU2017330563B2 (ko)
CA (1) CA3037674C (ko)
IL (1) IL265469B2 (ko)
WO (1) WO2018057520A1 (ko)

Families Citing this family (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8874477B2 (en) 2005-10-04 2014-10-28 Steven Mark Hoffberg Multifactorial optimization system and method
US10678866B1 (en) * 2016-09-30 2020-06-09 Vasumathi Ranganathan Rules driven content network for tracking, tracing, auditing and life cycle management of information artifacts
US10419225B2 (en) 2017-01-30 2019-09-17 Factom, Inc. Validating documents via blockchain
US10963889B2 (en) * 2017-03-16 2021-03-30 Sap Se Cross-system object tracking platform
US10817873B2 (en) 2017-03-22 2020-10-27 Factom, Inc. Auditing of electronic documents
US10318834B2 (en) * 2017-05-01 2019-06-11 Intel Corporation Optimized image feature extraction
US20200160943A1 (en) * 2017-05-02 2020-05-21 Sustainable Medicine, Inc. Security system and node device used in same
US10891694B1 (en) 2017-09-06 2021-01-12 State Farm Mutual Automobile Insurance Company Using vehicle mode for subrogation on a distributed ledger
US11416942B1 (en) 2017-09-06 2022-08-16 State Farm Mutual Automobile Insurance Company Using a distributed ledger to determine fault in subrogation
US10872381B1 (en) 2017-09-06 2020-12-22 State Farm Mutual Automobile Insurance Company Evidence oracles
US11386498B1 (en) 2017-09-06 2022-07-12 State Farm Mutual Automobile Insurance Company Using historical data for subrogation on a distributed ledger
US11631477B2 (en) 2017-09-07 2023-04-18 Dmitry Shvartsman System and method for authenticated exchange of biosamples
US10873457B1 (en) 2017-09-13 2020-12-22 Inveniam.io, LLC Data structure having internal self-references suitable for immutably representing and verifying data generated over time
US20190095831A1 (en) * 2017-09-27 2019-03-28 Earth Observation Inc. System and method for preserving forests and certifying the supply chain of lumber
US11063744B2 (en) * 2017-10-20 2021-07-13 Sap Se Document flow tracking using blockchain
JP7297742B2 (ja) 2017-11-02 2023-06-26 エヌチェーン ライセンシング アーゲー ブロックチェーンをデジタルツインにリンクするための、コンピュータにより実施されるシステム及び方法
CN111386699A (zh) * 2017-11-28 2020-07-07 索尼公司 数字分类账相机和图像功能
US11036677B1 (en) * 2017-12-14 2021-06-15 Pure Storage, Inc. Replicated data integrity
US10673620B2 (en) * 2017-12-14 2020-06-02 Paypal, Inc. Blockchain validation system
US11663672B2 (en) 2017-12-29 2023-05-30 Nanthealth, Inc. User interface log validation via blockchain system and methods
US20190258991A1 (en) * 2018-02-22 2019-08-22 Idlogiq Inc. System and methods for querying the distribution path of product units within a supply chain
US11803885B2 (en) * 2018-02-28 2023-10-31 Disney Enterprises, Inc. Configuration for authenticating a virtual item
US20190303853A1 (en) * 2018-03-29 2019-10-03 Walmart Apollo, Llc System and method for supply chain verification using blockchain
US11615060B2 (en) 2018-04-12 2023-03-28 ISARA Corporation Constructing a multiple entity root of trust
US11080433B2 (en) * 2018-04-29 2021-08-03 Cryptowerk Corp. Cryptographic data storage
US11134120B2 (en) 2018-05-18 2021-09-28 Inveniam Capital Partners, Inc. Load balancing in blockchain environments
US11170366B2 (en) 2018-05-18 2021-11-09 Inveniam Capital Partners, Inc. Private blockchain services
US10671370B2 (en) * 2018-05-30 2020-06-02 Red Hat, Inc. Distributing file system states
EP3804279A4 (en) * 2018-06-01 2022-01-19 Nokia Technologies OY METHOD AND DEVICE FOR DISTRIBUTED TRUST ASSESSMENT IN A DISTRIBUTED NETWORK
US11017883B1 (en) * 2018-06-06 2021-05-25 Eggschain, Inc. Blockchain-based systems and methods for tracking donated genetic material transactions
WO2019246149A1 (en) * 2018-06-18 2019-12-26 Regenerative Medical Technologies, Inc. Systems and methods for linking and storing biologics
WO2019246188A1 (en) 2018-06-22 2019-12-26 Attestiv Inc. Atomic capture using a distributed ledger, for proof of authenticity and/or real time visual validation
CN112771620A (zh) * 2018-07-13 2021-05-07 沃特世科技爱尔兰有限公司 使用分布式账本技术来管理解析信息的技术
US20200042982A1 (en) 2018-08-06 2020-02-06 Factom Digital Contracts in Blockchain Environments
US10721069B2 (en) 2018-08-18 2020-07-21 Eygs Llp Methods and systems for enhancing privacy and efficiency on distributed ledger-based networks
WO2020039398A1 (en) * 2018-08-24 2020-02-27 Iq Universe Inc. Provenance and illicit product control system
US11940978B2 (en) 2018-09-19 2024-03-26 International Business Machines Corporation Distributed platform for computation and trusted validation
US11032063B2 (en) * 2018-09-19 2021-06-08 International Business Machines Corporation Distributed platform for computation and trusted validation
DE102018216095A1 (de) * 2018-09-21 2020-03-26 Dietrich Prof. Dr. med Reichwein Verfahren zur Erfassung und Speicherung von Daten biologischer Proben, Verfahren zur Steuerung eines biologischen Systems, Vorrichtung zur Durchführung der Verfahren sowie Verwendungen
EP3857423A4 (en) * 2018-09-26 2022-06-15 Vitro Technology Corporation SYSTEMS AND METHODS FOR CREATING A PHYSICAL DEVICE BASED ON HARDWARE UNIQUE KEY GENERATION
US10812581B2 (en) 2018-10-12 2020-10-20 Bank Of America Corporation Heterogeneous distributed ledger data curator
US11215840B2 (en) 2018-10-18 2022-01-04 International Business Machines Corporation Testing a biological sample based on sample spectrography and machine learning techniques
US11721417B2 (en) * 2018-11-07 2023-08-08 Align Technology, Inc. Multi-dimensional cryptographically secured datastores for managing medical records
US11615882B2 (en) 2018-11-07 2023-03-28 Ge Healthcare Limited Apparatus, non-transitory computer-readable storage medium, and computer-implemented method for distributed ledger management of nuclear medicine products
US11748417B2 (en) 2018-11-12 2023-09-05 Nant Holdings Ip, Llc Curation and provision of digital content
BR112021008817A2 (pt) * 2018-11-13 2021-08-10 Banqu, Inc. formas de definição e gerenciamento em uma rede confiável de registros distribuídos
WO2020106650A1 (en) 2018-11-19 2020-05-28 Nant Holdings Ip, Llc Distributed ledger tracking of event data
US10979298B2 (en) 2018-11-23 2021-04-13 International Business Machines Corporation Collaboration network and server
TWI700707B (zh) * 2018-11-28 2020-08-01 臺北醫學大學 取得電子醫療健康記錄的方法與系統
WO2020123644A1 (en) 2018-12-12 2020-06-18 Thermo Electron Scientific Instruments Llc Utilizing independently stored validation keys to enable auditing of instrument measurement data maintained in a blockchain
EP3696752A1 (en) * 2019-02-13 2020-08-19 Validicity Sweden AB Tamper evident rfid based system and method
EP3703072A1 (en) 2019-03-01 2020-09-02 AT-Biotech Traceability Information Systems, SL Method and system for monitoring and preventing errors in the use of biological and pharmaceutical products
EP3935577A4 (en) * 2019-03-08 2022-11-16 University Of Southern California IMPROVED HISTOPATHOLOGY CLASSIFICATION THROUGH MACHINE SELF-LEARNING FROM TISSUE FINGERPRINTS
CN110110547B (zh) * 2019-04-08 2021-05-28 智链万源(北京)数字科技有限公司 溯源数据处理方法及装置
US11316691B2 (en) 2019-04-15 2022-04-26 Eygs Llp Methods and systems for enhancing network privacy of multiple party documents on distributed ledger-based networks
US20200335184A1 (en) * 2019-04-19 2020-10-22 Hsblox, Inc. Tracking clinical samples and trials with distributed ledger
US11206138B2 (en) * 2019-05-02 2021-12-21 Ernst & Young U.S. Llp Biosignature-based tokenization of assets in a blockchain
US11194770B2 (en) * 2019-05-02 2021-12-07 International Business Machines Corporation Database mergeable ledgers
US10885173B2 (en) 2019-06-04 2021-01-05 Nant Holdings Ip, Llc Content authentication and validation via multi-factor digital tokens, systems, and methods
US20210005289A1 (en) * 2019-07-03 2021-01-07 TruLab, Inc. Methods, devices, and systems for managing and tracking of collection, processing, and movement of samples during clinical trials
EP3764233A1 (en) * 2019-07-08 2021-01-13 Continental Teves AG & Co. OHG Method of identifying errors in or manipulations of data or software stored in a device
US11321491B2 (en) * 2019-07-24 2022-05-03 Faro Technologies, Inc. Tracking data acquired by coordinate measurement devices through a workflow
KR102355918B1 (ko) * 2019-07-29 2022-02-07 주식회사 그루크리에이티브랩 블록체인을 이용한 전자 데이터 제공 방법 및 그 시스템
US11232439B2 (en) 2019-08-09 2022-01-25 Eygs Llp Methods and systems for preventing transaction tracing on distributed ledger-based networks
WO2019228552A2 (en) 2019-08-27 2019-12-05 Alibaba Group Holding Limited System and method for blockchain-based notification
SG11202003810RA (en) 2019-08-27 2020-05-28 Advanced New Technologies Co Ltd System and method for registering subscribable sub-states in blockchain
WO2019228554A2 (en) 2019-08-27 2019-12-05 Alibaba Group Holding Limited System and method for blockchain-based notification
EP3688686A4 (en) 2019-08-27 2020-11-11 Advanced New Technologies Co., Ltd. SYSTEM AND PROCEDURE FOR THE REGISTRATION OF SUBSCRIBABLE SUBSTATES IN A BLOCKCHAIN
JP2021057887A (ja) * 2019-09-29 2021-04-08 工藤 健司 データ構造
US11115912B1 (en) 2019-10-15 2021-09-07 Sprint Communications Company L.P. Distributed ledger directory service for wireless communication networks
AU2020387408A1 (en) 2019-11-20 2022-05-19 Eygs Llp Systems, apparatus and methods for identifying and securely storing distinguishing characteristics in a distributed ledger within a distributed ledger-based network based on fungible and non-fungible tokens
CN111312353A (zh) * 2019-11-25 2020-06-19 江西善行生物科技有限公司 一种菌群与供体免疫信息可溯源系统
CN114762052A (zh) * 2019-11-26 2022-07-15 徕卡生物系统墨尔本私人有限公司 针对患者样本的基于不可变账本的工作流程管理
CN111222016A (zh) * 2020-01-13 2020-06-02 上海彩虹鱼海洋科技股份有限公司 一种用于环境检测采测分离系统的样本编码方法
US11343075B2 (en) 2020-01-17 2022-05-24 Inveniam Capital Partners, Inc. RAM hashing in blockchain environments
US11856086B2 (en) * 2020-02-06 2023-12-26 International Business Machines Corporation Tracking and linking item-related data
EP4136600A1 (en) 2020-04-15 2023-02-22 Eygs LLP Intelligent assertion tokens for authenticating and controlling network communications using a distributed ledger
TWI753426B (zh) * 2020-05-08 2022-01-21 讀懂科技股份有限公司 線上保險金給付請求處理方法
US11356275B2 (en) 2020-05-27 2022-06-07 International Business Machines Corporation Electronically verifying a process flow
US11803762B2 (en) * 2020-06-16 2023-10-31 Semedy AG Computer-implemented knowledge management platform and a computer-implemented knowledge management method
CN112819617B (zh) * 2020-08-21 2022-06-07 支付宝(杭州)信息技术有限公司 数据上链方法及装置、电子设备、存储介质
CN112085103B (zh) * 2020-09-10 2023-06-27 北京百度网讯科技有限公司 基于历史行为的数据增强方法、装置、设备以及存储介质
CN112530531B (zh) * 2020-09-24 2023-11-21 扬州大学 基于双区块链的电子病历存储与共享方法
US10958450B1 (en) * 2020-10-15 2021-03-23 ISARA Corporation Constructing a multiple-entity root certificate data block chain
CN112417485B (zh) * 2020-11-30 2024-02-02 支付宝(杭州)信息技术有限公司 一种基于可信执行环境的模型训练方法、系统及装置
WO2022216894A2 (en) * 2021-04-07 2022-10-13 Thrive Bioscience, Inc. Method and system for performing cell operations using a verifiable data structure
CN113242131B (zh) * 2021-04-22 2023-10-24 卓尔智联(武汉)研究院有限公司 区块链跨链方法、装置、电子设备及存储介质
US20220391899A1 (en) * 2021-06-04 2022-12-08 Philip Scott Lyren Providing Digital Media with Spatial Audio to the Blockchain
US20230054501A1 (en) * 2021-08-19 2023-02-23 Twilio Inc. Using ad-hoc stored procedures for online transaction processing
US11683672B2 (en) 2021-11-04 2023-06-20 T-Mobile Innovations Llc Distributed ledger control over wireless network slices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080040151A1 (en) * 2005-02-01 2008-02-14 Moore James F Uses of managed health care data
US20100167334A1 (en) * 2008-12-30 2010-07-01 Biopath Automation, L.L.C. Systems and methods for processing tissue samples for histopathology
US20150332283A1 (en) * 2014-05-13 2015-11-19 Nant Holdings Ip, Llc Healthcare transaction validation via blockchain proof-of-work, systems and methods
US20160084862A1 (en) * 2002-12-20 2016-03-24 Dako Denmark A/S Information notification sample processing system and methods of biological slide processing
WO2016097166A1 (en) * 2014-12-17 2016-06-23 Ventana Medical Systems, Inc. Diffusion monitoring protocol for optimized tissue fixation

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000276545A (ja) * 1999-03-29 2000-10-06 Hitachi Ltd 病理画像システム
AU2101701A (en) * 1999-12-13 2001-06-18 Ppgx, Inc. Tracking of clinical study samples, information and results
WO2002048680A1 (en) 2000-12-13 2002-06-20 THE GOVERNMENT OF THE UNITED STATES OF AMERICA AS REPRESENTED BY THE SECRETARY OF THE DEPARTMENT OF HEALTH AND HUMAN SEVICES. The National Institutes of Health Method and system for processing regions of interest for objects comprising biological material
US8676509B2 (en) * 2001-11-13 2014-03-18 Dako Denmark A/S System for tracking biological samples
DE10254229B4 (de) 2002-11-20 2004-10-28 P.A.L.M. Microlaser Technologies Ag Positioniervorrichtung zum Positionieren einerAuffangvorrichtung eines Laser-Mikrodissektionssystems
US20040157220A1 (en) * 2003-02-10 2004-08-12 Purnima Kurnool Methods and apparatus for sample tracking
AU2003900780A0 (en) * 2003-02-21 2003-03-13 Vision Biosystems Limited Analysis system and procedure
US20080235055A1 (en) * 2003-07-17 2008-09-25 Scott Mattingly Laboratory instrumentation information management and control network
US10671706B2 (en) * 2006-09-21 2020-06-02 Biomedical Synergies, Inc. Tissue management system
US8484049B2 (en) * 2009-01-30 2013-07-09 Omnicell, Inc. Tissue tracking
US20110161854A1 (en) * 2009-12-28 2011-06-30 Monica Harit Shukla Systems and methods for a seamless visual presentation of a patient's integrated health information
US9760760B2 (en) 2012-01-19 2017-09-12 H. Lee Moffitt Cancer Center And Research Institute, Inc. Histology recognition to automatically score and quantify cancer grades and individual user digital whole histological imaging device
GB201202368D0 (en) * 2012-02-10 2012-03-28 Trakel Ltd Tracking method
WO2015142951A1 (en) * 2014-03-17 2015-09-24 Washington University System and method for quantifying deformation, disruption, and development in a sample
JP2016122917A (ja) * 2014-12-24 2016-07-07 パナソニックIpマネジメント株式会社 署名生成装置、署名検証装置、署名生成方法及び署名検証方法
AU2017289924A1 (en) * 2016-06-27 2019-01-24 Beckman Coulter, Inc. History logging for samples of biological material

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160084862A1 (en) * 2002-12-20 2016-03-24 Dako Denmark A/S Information notification sample processing system and methods of biological slide processing
US20080040151A1 (en) * 2005-02-01 2008-02-14 Moore James F Uses of managed health care data
US20100167334A1 (en) * 2008-12-30 2010-07-01 Biopath Automation, L.L.C. Systems and methods for processing tissue samples for histopathology
US20150332283A1 (en) * 2014-05-13 2015-11-19 Nant Holdings Ip, Llc Healthcare transaction validation via blockchain proof-of-work, systems and methods
WO2016097166A1 (en) * 2014-12-17 2016-06-23 Ventana Medical Systems, Inc. Diffusion monitoring protocol for optimized tissue fixation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Asaph Azaria 외, MedRec: Using Blockchain for Medical Data Access and Permission Management, 2016 2nd International Conference on Open and Big Data, 2016.08.24., pp25-30.* *

Also Published As

Publication number Publication date
EP3516550A4 (en) 2020-05-13
IL265469B2 (en) 2023-08-01
WO2018057520A1 (en) 2018-03-29
AU2017330563A1 (en) 2019-04-18
EP3516550A1 (en) 2019-07-31
US10923215B2 (en) 2021-02-16
CA3037674A1 (en) 2018-03-29
CA3037674C (en) 2022-05-17
US20180082043A1 (en) 2018-03-22
US20210166792A1 (en) 2021-06-03
IL265469B1 (en) 2023-04-01
JP7037565B2 (ja) 2022-03-16
JP2019534525A (ja) 2019-11-28
KR102385775B1 (ko) 2022-04-11
IL265469A (en) 2019-05-30
CN110249350A (zh) 2019-09-17
AU2017330563B2 (en) 2021-07-15

Similar Documents

Publication Publication Date Title
KR102385775B1 (ko) 샘플 트래킹 체인들을 통한 샘플 트래킹, 시스템들 및 방법들
US20220309092A1 (en) Systems and Methods for Processing Spatially Related Sequence Data Received from a Sequencing Device
Aubreville et al. A completely annotated whole slide image dataset of canine breast cancer to aid human breast cancer research
Hou et al. Dataset of segmented nuclei in hematoxylin and eosin stained histopathology images of ten cancer types
Zhao et al. Automated learning of generative models for subcellular location: building blocks for systems biology
Pyne et al. Automated high-dimensional flow cytometric data analysis
Gardner et al. Understanding mass spectrometry images: complexity to clarity with machine learning
Willoughby et al. Data management matters
Mulrane et al. Creation of a digital slide and tissue microarray resource from a multi-institutional predictive toxicology study in the rat: an initial report from the PredTox group
US11797705B1 (en) Generative adversarial network for named entity recognition
US20230136439A1 (en) Systems and methods for cloud-based federated records retention compliance orchestration, validation and enforcement
Altenburg et al. yhydra: Deep learning enables an ultra fast open search by jointly embedding ms/ms spectra and peptides of mass spectrometry-based proteomics
US20230023922A1 (en) Methods, Systems and Computer Program Products for Handling Data Records Using an Application Programming Interface (API) and Directory Management System
US20210233091A1 (en) System and method for facilitating a record of information of an organism
CN117716397A (zh) 用于处理图像以进行图像匹配的系统和方法
WO2022147003A1 (en) An adaptive machine learning system for image-based biological sample constituent analysis
Alberink et al. Interoperator test for anatomical annotation of earprints
US11894109B1 (en) Production and delivery tracking and sample verification of patient-specific therapeutics
Huacarpuma et al. A conceptual data model for transcriptome project pipeline
Kvilekval et al. Bisque: Advances in Bioimage Databases.
Crasto et al. Brain spatial normalization: indexing neuroanatomical databases
Mercurio et al. Network P2P for exploring and visualization of proteomic data: possibility of handling data and analysing them under different perspectives
Bender et al. SEMORE: SEgmentation and MORphological fingErprinting by machine learning automates super-resolution data analysis
Sirotenko Image Classification as a Service
Mercurio et al. Network P2P for exploring and visualization of proteomic data produced by two dimensional electrophoresis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant