KR102547350B1 - Apparatus and method for determining human leukocyte antigen type - Google Patents
Apparatus and method for determining human leukocyte antigen type Download PDFInfo
- Publication number
- KR102547350B1 KR102547350B1 KR1020220004045A KR20220004045A KR102547350B1 KR 102547350 B1 KR102547350 B1 KR 102547350B1 KR 1020220004045 A KR1020220004045 A KR 1020220004045A KR 20220004045 A KR20220004045 A KR 20220004045A KR 102547350 B1 KR102547350 B1 KR 102547350B1
- Authority
- KR
- South Korea
- Prior art keywords
- hla
- typing
- hla typing
- type
- algorithms
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 239000000427 antigen Substances 0.000 title claims abstract description 20
- 108091007433 antigens Proteins 0.000 title claims abstract description 20
- 102000036639 antigens Human genes 0.000 title claims abstract description 20
- 210000000265 leukocyte Anatomy 0.000 title claims abstract description 17
- 230000000295 complement effect Effects 0.000 claims abstract description 85
- 239000012472 biological sample Substances 0.000 claims abstract description 33
- 238000012300 Sequence Analysis Methods 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 88
- 238000012937 correction Methods 0.000 claims description 29
- 238000012163 sequencing technique Methods 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 23
- 239000002773 nucleotide Substances 0.000 claims description 15
- 125000003729 nucleotide group Chemical group 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims 3
- 230000002596 correlated effect Effects 0.000 claims 1
- 238000004891 communication Methods 0.000 description 15
- 108090000623 proteins and genes Proteins 0.000 description 12
- 238000012545 processing Methods 0.000 description 11
- 238000007481 next generation sequencing Methods 0.000 description 10
- 108700028369 Alleles Proteins 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 210000004369 blood Anatomy 0.000 description 7
- 239000008280 blood Substances 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- 108020004414 DNA Proteins 0.000 description 6
- 210000004027 cell Anatomy 0.000 description 6
- 238000003753 real-time PCR Methods 0.000 description 6
- 108700018351 Major Histocompatibility Complex Proteins 0.000 description 5
- 108091008874 T cell receptors Proteins 0.000 description 5
- 102000016266 T-Cell Antigen Receptors Human genes 0.000 description 5
- 210000001744 T-lymphocyte Anatomy 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 210000000056 organ Anatomy 0.000 description 4
- 230000020382 suppression by virus of host antigen processing and presentation of peptide antigen via MHC class I Effects 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- 238000002054 transplantation Methods 0.000 description 4
- 102100028972 HLA class I histocompatibility antigen, A alpha chain Human genes 0.000 description 3
- 108010075704 HLA-A Antigens Proteins 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101150076359 Mhc gene Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 210000002381 plasma Anatomy 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 102100028976 HLA class I histocompatibility antigen, B alpha chain Human genes 0.000 description 2
- 102100028971 HLA class I histocompatibility antigen, C alpha chain Human genes 0.000 description 2
- 108010058607 HLA-B Antigens Proteins 0.000 description 2
- 108010052199 HLA-C Antigens Proteins 0.000 description 2
- 108010021466 Mutant Proteins Proteins 0.000 description 2
- 102000008300 Mutant Proteins Human genes 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000011224 anti-cancer immunotherapy Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012252 genetic analysis Methods 0.000 description 2
- 238000009169 immunotherapy Methods 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000010998 test method Methods 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 238000007482 whole exome sequencing Methods 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 241001421757 Arcas Species 0.000 description 1
- 206010003445 Ascites Diseases 0.000 description 1
- 101100284398 Bos taurus BoLA-DQB gene Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108010010378 HLA-DP Antigens Proteins 0.000 description 1
- 102000015789 HLA-DP Antigens Human genes 0.000 description 1
- 108010062347 HLA-DQ Antigens Proteins 0.000 description 1
- 108010058597 HLA-DR Antigens Proteins 0.000 description 1
- 102000006354 HLA-DR Antigens Human genes 0.000 description 1
- 101001100327 Homo sapiens RNA-binding protein 45 Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 102100038823 RNA-binding protein 45 Human genes 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 208000024340 acute graft versus host disease Diseases 0.000 description 1
- 206010069351 acute lung injury Diseases 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 201000003639 autosomal recessive cerebellar ataxia Diseases 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 238000010322 bone marrow transplantation Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 210000003756 cervix mucus Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 210000001151 cytotoxic T lymphocyte Anatomy 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 230000028996 humoral immune response Effects 0.000 description 1
- 230000004727 humoral immunity Effects 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000002998 immunogenetic effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 210000003924 normoblast Anatomy 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 238000012049 whole transcriptome sequencing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6881—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/165—Mathematical modelling, e.g. logarithm, ratio
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Cell Biology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
본 개시내용은 유전자 분석에 관한 것이며, 보다 구체적으로 인간 백혈구 항원의 타입을 결정하는 것에 관한 것이다.The present disclosure relates to genetic analysis, and more specifically to determining the type of human leukocyte antigen.
인간 백혈구 항원(Human Leukocyte Antigen; HLA)은 인간의 주조직 적합성복합체(Major Histocompatibility Complex; MHC) 유전자에 의해 생성되는 당단백 분자이다. HLA는 성숙한 적혈구에는 존재하지 않지만 미성숙 적아세포(erythroblast)에서는 발현이 되며 백혈구 및/또는 혈소판 등의 혈액세포를 포함한 인체 내 모든 조직세포의 표면에 발현된다. MHC 유전자는 모든 척추동물에 존재하며 인간의 MHC 유전자를 HLA 유전자, 이로부터 발현된 산물을 HLA이라고 한다.Human Leukocyte Antigen (HLA) is a glycoprotein molecule produced by the human Major Histocompatibility Complex (MHC) gene. HLA does not exist in mature erythrocytes, but is expressed in immature erythroblasts and is expressed on the surface of all tissue cells in the human body, including blood cells such as leukocytes and/or platelets. The MHC gene is present in all vertebrates, and the human MHC gene is referred to as the HLA gene, and the product expressed therefrom is referred to as HLA.
MHC 유전자들은 자기(self) 및 비자기(non-self)의 인지, 항원 자극에 대한 면역반응, 세포성 면역과 체액성 면역의 조절 및 질병에 대한 감수성 등에 관여한다. MHC 유전자의 산물인 HLA는 고형 장기이식에서 이식된 장기의 생존에 있어서 ABO 혈액형 다음으로 중요한 항원이다. HLA는 골수이식에 있어서 이식의 성패에 가장 중요한 역할을 하는 것으로 알려져 있다. 따라서, HLA의 차이를 면역학적으로 인지하는 것이 이식된 조직에 대한 거부반응(rejection action)의 첫 단계라 볼 수 있다. 또한, 수혈요법에 있어서 HLA와 항체는 혈소판수혈불응증, 발열성 비용혈성 수혈 부작용, 급성 폐손상, 수혈 후 이식편대숙주병과 같은 여러 가지 부작용의 발생에 중요한 역할을 한다.MHC genes are involved in self and non-self recognition, immune response to antigen stimulation, regulation of cellular and humoral immunity, and susceptibility to disease. HLA, a product of the MHC gene, is the second most important antigen next to the ABO blood type in survival of the transplanted organ in solid organ transplantation. HLA is known to play the most important role in transplantation success or failure in bone marrow transplantation. Therefore, recognizing the difference in HLA immunologically can be seen as the first step of the rejection action for the transplanted tissue. In addition, in transfusion therapy, HLA and antibodies play an important role in the occurrence of various side effects such as platelet transfusion refractory, febrile nonhemorrhagic transfusion side effects, acute lung injury, and graft-versus-host disease after transfusion.
HLA는 크게 Class I 및 Class Ⅱ로 분류될 수 있다. Class I은 HLA-A, HLA-B, HLA-C로 분류되고 대부분의 유핵세포 및 혈소판에서 발현되며, 세포독성 T 세포가 바이러스에 감염된 세포나 종양세포를 인지하여 제거할 때 항원 인식(antigen recognition)에 필수적이다. HLA Class Ⅱ는 HLA-DR, HLA-DQ, HLA-DP로 분류되고 B 세포, 단핵세포, 수지상세포, 활성화된 T 세포에서 발현되며, 헬퍼 T 세포의 항원 수용체(antigen receptor)와 작용하여 세포성 및 체액성 면역반응을 유발하고, 그리고 항원제시세포에 표현된 항원을 인지할 때 필수적인 것으로 알려져 있다. HLA는 인간이 가지고 있는 유전자 중에서 가장 큰 다형성(polymorphism)을 보이는 유전자이며 인종 및 민족 간에도 빈도 차이가 존재한다. HLA can be largely classified into Class I and Class II. Class I is classified into HLA-A, HLA-B, and HLA-C, and is expressed in most nucleated cells and platelets, and antigen recognition when cytotoxic T cells recognize and remove virus-infected cells or tumor cells. ) is essential for HLA Class II is classified into HLA-DR, HLA-DQ, and HLA-DP, and is expressed in B cells, monocytes, dendritic cells, and activated T cells. and induces a humoral immune response, and is known to be essential when recognizing antigens expressed in antigen-presenting cells. HLA is a gene that shows the largest polymorphism among genes possessed by humans, and there is a frequency difference between races and ethnic groups.
정확한 HLA 타입을 결정하기 위한 HLA 타이핑은, 장기이식, 면역치료, 질병관련 연구, 친자감별과 같은 부친시험, 법의학적 이용, 유전학적 연구 등의 다양한 분야에서 필요하다. 현재까지 PCR-SSP, PCR-SSOP, 중합효소연쇄반응 시퀀싱 기반 타이핑(Polymerase Chain Reaction-Sequencing Based Typing; PCR-SBT) 기술과 차세대 염기서열 분석(Next Generation Sequencing; NGS) 방법에 기반한 다양한 HLA 타입 분석 방법들이 제시되어 왔다.HLA typing for determining the exact HLA type is required in various fields such as organ transplantation, immunotherapy, disease-related research, paternity tests such as paternity, forensic use, and genetic research. Until now, various HLA types have been analyzed based on PCR-SSP, PCR-SSOP, Polymerase Chain Reaction-Sequencing Based Typing (PCR-SBT) technologies and Next Generation Sequencing (NGS) methods. Methods have been suggested.
NGS 방법은 PCR-SBT 검사법에서 주로 시행해 오던 Class I (HLA-A, -B, -C)에 대한 엑손 2, 3, 4와 Class II (DRB1, DQB1, DPB1)에 대한 엑손 2 (또는 exon 2, 3)를 넘어 더 많은 유전자와 더 많은 엑손에 대한 분석을 동시에 시행할 수 있어 모호성 비율(ambiguity rate)을 줄이기 위해 노력해 왔던 추가적인 프라이머, 그룹 PCR 등의 요구를 없애는 효과가 있으며, 인덱싱을 이용하여 여러 표적 유전자 또는 여러 검체를 한 번에 pooling 검사하는 장점이 있다. The NGS method is based on exon 2, 3, and 4 for Class I (HLA-A, -B, -C) and exon 2 (or exon 2) for Class II (DRB1, DQB1, DPB1), which has been mainly performed in the PCR-SBT test method. , 3), more genes and more exons can be analyzed at the same time, which eliminates the need for additional primers and group PCR, which have been trying to reduce the ambiguity rate. It has the advantage of pooling multiple target genes or multiple samples at once.
그러나 IMGT-HLA database에서 제공하는 HLA 대립유전자에 기반하기 때문에 흔하게 발견되는 HLA 대립유전자에 대해서는 비교적 예측 정확도가 높으나 빈도가 낮은 대립유전자에 대해서는 정확도가 떨어지는 것으로 나타났다. 이에, HLA 타입을 보다 정확히 예측할 수 있는 신뢰도 높은 방법을 구축하는 것이 필요할 뿐만 아니라, 개체에 따라서는 NGS 후에도 PCR-SBT 검사법을 추가적으로 실시하여 정확한 타이핑이 필요한 실정이다. However, since it is based on the HLA alleles provided by the IMGT-HLA database, the prediction accuracy is relatively high for commonly found HLA alleles, but the accuracy is low for infrequent alleles. Therefore, it is not only necessary to build a highly reliable method for more accurately predicting the HLA type, but also, depending on the individual, accurate typing is required by additionally performing the PCR-SBT test method even after NGS.
또한, 최근 의료기술의 발달로 돌연변이(somatic mutation)로 인한 종양에서 생성된 신생항원(neoantigen)을 기반으로 하는 항암면역치료법이 개발되었다. 신생항원을 발굴한 후에는 이를 대상으로 종양백신이 생산될 수 있거나 또는 신생항원에 반응하여 종양을 공격할 수 있는 T 세포 수용체(T cell receptor; TCR)를 가진 T 세포가 선별되어, 선별된 T 세포를 체외에서 배양하거나 T 세포 수용체를 조작한 T 세포(TCR engineered T cell)를 제조하는 방식으로 치료제가 만들어질 수 있다. 동일한 돌연변이를 가진 환자라고 하더라도 각 환자의 HLA 종류에 따라서 해당 돌연변이 단백질이 HLA에 결합되어 신생항원으로 제시될 수 있다. 또한, 동일한 돌연변이를 가진 환자라고 하더라도 각 환자의 HLA 종류에 따라서 해당 돌연변이 단백질이 HLA에 결합되지 못하는 경우에는 신생항원이 만들어질 수 없게 된다. 따라서 HLA의 타입을 정확히 확인 또는 결정하여 신생항원 여부를 결정하는 것이 이를 기반으로 한 항암면역치료법 개발에 매우 중요하다.In addition, with the recent development of medical technology, anticancer immunotherapy based on neoantigens generated from tumors caused by somatic mutations has been developed. After a neoantigen is discovered, a tumor vaccine can be produced from it, or T cells with a T cell receptor (TCR) capable of attacking tumors in response to the neoantigen are selected, and the selected T cells are selected. A therapeutic agent may be prepared by culturing cells in vitro or by manufacturing a TCR engineered T cell (TCR engineered T cell) having a T cell receptor engineered. Even in patients with the same mutation, the mutant protein may be combined with HLA and presented as a neoantigen according to the type of HLA of each patient. In addition, even in patients with the same mutation, neoantigens cannot be produced when the corresponding mutant protein cannot bind to HLA depending on the type of HLA of each patient. Therefore, it is very important to accurately identify or determine the type of HLA to determine whether or not it is a neoantigen in the development of anti-cancer immunotherapy based thereon.
본 개시내용은 전술한 배경기술에 대응하여 안출된 것으로, 인간 백혈구 항원(HLA)의 타입을 보다 정확하고 효율적으로 판정 또는 예측하기 위한 것이다.The present disclosure has been made in response to the above background art, and is intended to more accurately and efficiently determine or predict the type of human leukocyte antigen (HLA).
본 개시내용의 기술적 과제들은 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The technical problems of the present disclosure are not limited to the technical problems mentioned above, and other technical problems not mentioned will be clearly understood by those skilled in the art from the description below.
본 개시의 일 실시예에 따라 컴퓨팅 장치에 의해 수행되는 인간 백혈구 항원(Human Leukocyte Antigen; HLA)의 타입을 결정하기 위한 방법이 개시된다. 상기 방법은, 피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득하는 단계; 및 상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑(typing) 툴(tool)들을 사용하여 상기 생물학적 시료에 대한 HLA 타입을 결정하는 단계를 포함할 수 있다.According to one embodiment of the present disclosure, a method for determining a type of Human Leukocyte Antigen (HLA) performed by a computing device is disclosed. The method may include obtaining a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from a subject; and determining the HLA type of the biological sample by using a plurality of HLA typing tools that take the result of the sequencing as an input.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들로부터 획득된 콜(call)들에 포함된 HLA 타입 후보들 및 상기 복수개의 HLA 타이핑 툴들 간의 상호 보완 스코어에 기초하여, 상기 생물학적 시료에 대한 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the step of determining the HLA type may include, based on HLA type candidates included in calls obtained from the plurality of HLA typing tools and complementary scores between the plurality of HLA typing tools, the It may include determining the HLA type for the biological sample.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수의 타이핑 툴들 중에서 콜을 제시한 툴의 개수를 결정하는 단계; 및 상기 결정된 툴의 개수에 기초하여 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type may include determining the number of tools presenting calls among the plurality of typing tools; and determining the HLA type based on the determined number of tools.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수의 타이핑 툴들 중에서 콜을 제시한 툴의 개수를 결정하는 단계; 제시된 콜들에 포함된 HLA 타입 후보들 간의 일치도를 계산하는 단계; 및 상기 결정된 툴의 개수 및 상기 계산된 일치도에 기초하여 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type may include determining the number of tools presenting calls among the plurality of typing tools; Calculating a degree of agreement between HLA type candidates included in the presented calls; and determining the HLA type based on the determined number of tools and the calculated degree of agreement.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 타이핑 툴들 간의 상호 보완 스코어를 계산하는 단계; 및 상기 상호 보완 스코어에 기초하여, 상기 생물학적 시료에 대한 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In an embodiment, the determining of the HLA type may include calculating a complementary score between any two typing tools among the plurality of HLA typing tools; and determining the HLA type of the biological sample based on the complementary score.
일 실시예에서, 상기 상호 보완 스코어는, 상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 상기 HLA 타입을 결정하는데 함께 이용될 수 있는 가능성을 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, the complementarity score may include a value quantitatively indicating the possibility that any two HLA typing tools among the plurality of HLA typing tools can be used together to determine the HLA type.
일 실시예에서, 상기 상호 보완 스코어는, 상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 함께 사용되었을 때의 상기 결정되는 HLA 타입의 정확성을 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, the complementary score may include a value quantitatively indicating the accuracy of the determined HLA type when any two HLA typing tools among the plurality of HLA typing tools are used together.
일 실시예에서, 상기 상호 보완 스코어는, 상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 함께 사용되었을 때의 상기 2개의 HLA 타이핑 툴들에서 획득된 콜들에 포함된 HLA 타입 후보들에 적용될 보정값을 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, the complementary score is a correction value to be applied to HLA type candidates included in calls obtained from two HLA typing tools when any two of the plurality of HLA typing tools are used together. It may include a value that quantitatively represents.
일 실시예에서, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴 간의 상호 보완 스코어는, 상기 생물학적 시료에 대하여 상기 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜에 대한 결과가 틀렸을 때, 상기 생물학적 시료에 대하여 상기 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜에 대한 결과의 정확성을 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, a complementary score between a first HLA typing tool and a second HLA typing tool among the plurality of HLA typing tools is a result of a first call obtained from the first HLA typing tool for the biological sample. When wrong, a value quantitatively indicative of the accuracy of the result for the second call obtained from the second HLA typing tool for the biological sample.
일 실시예에서, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴 간의 상호 보완 스코어는, 상기 제 1 HLA 타이핑 툴이 상기 제 2 HLA 타이핑 툴과 함께 사용되었을 때의 상기 결정된 HLA 타입에 대한 정확성 값이, 상기 제 1 HLA 타이핑 툴에 대해 사전결정된 제 1 정확성 값과 비교한 결과를 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, the complementary score between a first HLA typing tool and a second HLA typing tool among the plurality of HLA typing tools is the determined score when the first HLA typing tool is used together with the second HLA typing tool. The accuracy value for the HLA type may include a value quantitatively representing a result of comparison with a predetermined first accuracy value for the first HLA typing tool.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜과 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜을 조합할지 여부를 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어에 기초하여 결정하는 단계; 및 상기 제 1 콜과 상기 제 2 콜을 조합할지 여부에 대한 결정에 기초하여 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type may include determining whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools. determining based on a first complementary score between the first HLA typing tool and the second HLA typing tool; and determining the HLA type based on a decision on whether to combine the first call and the second call.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜과 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜을 조합할지 여부를, 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어, 상기 제 1 HLA 타이핑 툴에 대한 사전 결정된 제 1 정확성 값 및 상기 제 2 HLA 타이핑 툴에 대한 사전 결정된 제 2 정확성 값에 기초하여 결정하는 단계; 및 상기 제 1 콜과 상기 제 2 콜을 조합할지 여부에 대한 결정에 기초하여, 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type may include whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools, to a first complementary score between the first HLA typing tool and the second HLA typing tool, a first predetermined accuracy value for the first HLA typing tool and a second predetermined accuracy value for the second HLA typing tool determining based on; and determining the HLA type based on a determination as to whether to combine the first call and the second call.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜 및 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜에 적용될 보정값을 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어에 기초하여 결정하는 단계; 및 상기 보정값에 기초하여 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type may include determining a correction value to be applied to a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools. determining based on a first complementary score between the first HLA typing tool and the second HLA typing tool; and determining the HLA type based on the correction value.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들에 관련된 상호 보완 스코어에 적어도 부분적으로 기초하여, 상기 복수개의 HLA 타이핑 툴들을 사용하였을 때의 결정되는 상기 HLA 타입의 정확성을 예측하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type comprises determining accuracy of the HLA type when using the plurality of HLA typing tools based at least in part on a complementary score associated with the plurality of HLA typing tools. It may include predicting.
일 실시예에서, 상기 상호 보완 스코어는, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터의 제 1 결과가 실제 결과와 일치하지 않는 경우 제 2 HLA 타이핑 툴로부터의 제 2 결과가 상기 실제 결과와 일치하는 경우를 나타내는 제 1 서브 스코어; 상기 복수개의 HLA 타이핑 툴들 중 제 2 HLA 타이핑 툴로부터의 제 2 결과가 실제 결과와 일치하지 않는 경우 제 1 HLA 타이핑 툴로부터의 제 1 결과가 상기 실제 결과와 일치하는 경우를 나타내는 제 2 서브 스코어; 상기 제 1 HLA 타이핑 툴에 대해 사전 결정된 제 1 정확성 값; 및 상기 제 2 HLA 타이핑 툴에 대해 사전 결정된 제 2 정확성 값에 기초하여 연산될 수 있다.In one embodiment, the complementary score is determined by determining whether a first result from a first HLA typing tool among the plurality of HLA typing tools does not match an actual result, and a second result from a second HLA typing tool being the actual result. A first sub-score indicating the case of coincidence with; a second sub-score indicating a case in which a first result from a first HLA typing tool matches an actual result when a second result from a second HLA typing tool among the plurality of HLA typing tools does not match an actual result; a first predetermined accuracy value for the first HLA typing tool; and a predetermined second accuracy value for the second HLA typing tool.
일 실시예에서, 상기 방법은, 상기 상호 보완 스코어에 기초하여, 상기 복수개의 HLA 타이핑 툴들에 포함된 알고리즘들 간의 유사도를 결정하는 단계를 더 포함할 수 있다.In an embodiment, the method may further include determining a degree of similarity between algorithms included in the plurality of HLA typing tools based on the complementarity score.
본 개시의 일 실시예에 따라 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은 하나 이상의 프로세서에 의해 실행되는 경우 인간 백혈구 항원(Human Leukocyte Antigen; HLA)의 타입을 결정하기 위한 방법을 수행할 수 있다. 상기 방법은: 피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득하는 단계; 및 상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑 툴들을 사용하여 상기 생물학적 시료에 대한 HLA 타입을 결정하는 단계를 포함할 수 있다.According to one embodiment of the present disclosure, a computer program stored in a computer readable storage medium is disclosed. The computer program, when executed by one or more processors, may perform a method for determining the type of Human Leukocyte Antigen (HLA). The method includes: acquiring a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from a subject; and determining the HLA type of the biological sample by using a plurality of HLA typing tools that take the sequencing result as an input.
본 개시의 일 실시예에 따라, 인간 백혈구 항원(Human Leukocyte Antigen; HLA)의 타입을 결정하기 위한 컴퓨팅 장치가 개시된다. 상기 컴퓨팅 장치는, 메모리; 및 프로세서를 포함하며, 상기 프로세서는: 피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득하고; 그리고 상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑 툴들을 사용하여 상기 생물학적 시료에 대한 HLA 타입을 결정할 수 있다.According to one embodiment of the present disclosure, a computing device for determining the type of Human Leukocyte Antigen (HLA) is disclosed. The computing device may include a memory; and a processor, wherein the processor: obtains a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from the subject; In addition, the HLA type of the biological sample may be determined using a plurality of HLA typing tools that take the sequencing result as an input.
본 개시내용의 일 실시예에 따른 방법 및 장치는, 인간 백혈구 항원(HLA)의 타입을 보다 정확하고 효율적으로 판정 또는 예측하기 위한 것이다. The method and apparatus according to one embodiment of the present disclosure are intended to more accurately and efficiently determine or predict the type of human leukocyte antigen (HLA).
본 개시내용의 일 실시예에 따른 방법 및 장치는, 인간 백혈구 항원(HLA)의 타입을 결정하는 복수의 툴들 간의 유사도를 판단할 수 있다.A method and apparatus according to an embodiment of the present disclosure may determine similarity between a plurality of tools for determining the type of human leukocyte antigen (HLA).
도 1은 본 개시내용의 일 실시예에 따른 컴퓨팅 장치의 블록 구성도를 개략적으로 도시한다.
도 2는 본 개시내용의 일 실시예에 따른 HLA 타입을 결정하기 위한 예시적인 방법을 도시한다.
도 3은 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.
도 4는 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.
도 5는 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.
도 6은 본 개시내용의 일 실시예에 따른 컴퓨팅 환경의 개략도이다.1 schematically illustrates a block configuration diagram of a computing device according to an embodiment of the present disclosure.
2 illustrates an exemplary method for determining HLA type according to one embodiment of the present disclosure.
3 illustrates an example algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
4 illustrates an exemplary algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
5 depicts an exemplary algorithm for determining a complementarity score according to one embodiment of the present disclosure.
6 is a schematic diagram of a computing environment according to one embodiment of the present disclosure.
다양한 실시예들이 도면을 참조하여 설명된다. 본 명세서에서, 다양한 설명들이 본 개시내용의 이해를 제공하기 위해서 제시된다. 본 개시내용의 실시를 위한 구체적인 내용을 설명하기에 앞서, 본 개시내용의 기술적 요지와 직접적 관련이 없는 구성에 대해서는 본 발명의 기술적 요지를 흩뜨리지 않는 범위 내에서 생략하였음에 유의하여야 할 것이다. 또한, 본 명세서 및 청구범위에 사용된 용어 또는 단어는 발명자가 자신의 발명을 최선의 방법으로 설명하기 위해 적절한 용어의 개념을 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다.Various embodiments are described with reference to the drawings. In this specification, various descriptions are presented to provide an understanding of the present disclosure. Prior to describing specific details for the implementation of the present disclosure, it should be noted that configurations not directly related to the technical gist of the present disclosure have been omitted within the scope of not distracting from the technical gist of the present invention. In addition, the terms or words used in this specification and claims have meanings consistent with the technical idea of the present invention based on the principle that the inventor can define the concept of appropriate terms in order to best describe his/her invention. concept should be interpreted.
본 명세서에서 사용되는 용어 "컴포넌트", "모듈", "시스템", "부" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭하며, 상호 교환 가능하게 사용될 수 있다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정(procedure), 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있다. 일 컴포넌트는 하나의 컴퓨터 내에 로컬화 될 수 있다. 일 컴포넌트는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터의 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통해 전송되는 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다.As used herein, the terms "component", "module", "system", "unit", and the like refer to a computer-related entity, hardware, firmware, software, a combination of software and hardware, or an execution of software, and are interchangeable. can possibly be used. For example, a component may be, but is not limited to, a procedure, processor, object, thread of execution, program, and/or computer running on a processor. For example, both an application running on a computing device and a computing device may be components. One or more components may reside within a processor and/or thread of execution. A component can be localized within a single computer. A component may be distributed between two or more computers. Also, these components can execute from various computer readable media having various data structures stored thereon. Components may be connected, for example, via signals with one or more packets of data (e.g., data and/or signals from one component interacting with another component in a local system, distributed system) to other systems and over a network such as the Internet. data being transmitted) may communicate via local and/or remote processes.
더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.In addition, the term “or” is intended to mean an inclusive “or” rather than an exclusive “or”. That is, unless otherwise specified or clear from the context, “X employs A or B” is intended to mean one of the natural inclusive substitutions. That is, X uses A; X uses B; Or, if X uses both A and B, "X uses either A or B" may apply to either of these cases. Also, the term "and/or" as used herein should be understood to refer to and include all possible combinations of one or more of the listed related items.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하는 것으로 이해되어야 한다. 다만, "포함한다" 및/또는 "포함하는"이라는 용어는, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다.Also, the terms "comprises" and/or "comprising" should be understood to mean that the features and/or components are present. However, it should be understood that the terms "comprises" and/or "comprising" do not exclude the presence or addition of one or more other features, elements, and/or groups thereof. Also, unless otherwise specified or where the context clearly indicates that a singular form is indicated, the singular in this specification and claims should generally be construed to mean "one or more".
그리고, "A 또는 B 중 적어도 하나" 또는 “A 및 B 중 적어도 하나” 라는 용어는, "A만을 포함하는 경우", "B 만을 포함하는 경우", "A와 B의 구성으로 조합된 경우"를 의미하는 것으로 해석되어야 한다. In addition, the term "at least one of A or B" or "at least one of A and B" means "includes only A", "includes only B", "includes A and B in combination" should be interpreted as meaning
당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시적 논리적 구성요소들, 블록들, 모듈들, 회로들, 수단들, 로직들, 및 알고리즘들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시적 구성요소들, 블록들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있다. 다만, 그러한 구현의 결정들이 본 개시내용의 영역을 벗어나게 하는 것으로 해석되어서는 안된다.Those skilled in the art will further understand that the various illustrative logical components, blocks, modules, circuits, means, logics, and algorithms described in connection with the embodiments disclosed herein may be electronic hardware, computer software, or combinations of both. It should be recognized that it can be implemented as To clearly illustrate the interchangeability of hardware and software, various illustrative components, blocks, means, logics, modules, circuits, and steps have been described above generally in terms of their functionality. Whether such functionality is implemented in hardware or as software depends on the particular application and design constraints imposed on the overall system. Skilled artisans may implement the described functionality in varying ways for each particular application. However, such implementation decisions should not be interpreted as causing a departure from the scope of this disclosure.
제시된 실시예들에 대한 설명은 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이다. 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 발명은 여기에 제시된 실시예 들로 한정되는 것이 아니다. 본 발명은 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다. The description of the presented embodiments is provided to enable any person skilled in the art to use or practice the present invention. Various modifications to these embodiments will be apparent to those skilled in the art of this disclosure. The general principles defined herein may be applied to other embodiments without departing from the scope of this disclosure. Thus, the present invention is not limited to the embodiments presented herein. The present invention is to be accorded the widest scope consistent with the principles and novel features set forth herein.
본 개시내용에서의 제 1, 제 2, 또는 제 3 과 같이 제 N 으로 표현되는 용어들은 적어도 하나의 엔티티들을 구분하기 위해 사용된다. 예를 들어, 제 1 과 제 2로 표현된 엔티티들은 서로 동일하거나 또는 상이할 수 있다.In the present disclosure, terms expressed as Nth, such as first, second, or third, are used to distinguish at least one entity. For example, entities represented as first and second may be the same as or different from each other.
본 개시내용에서 사용되는 용어, 염기서열 분석은 염기서열을 분석할 수 있는 임의의 형태의 기법들에 의해 수행될 수 있으며, 예를 들어, 전장 유전체 염기서열 분석(whole genome sequencing), 전체 엑솜 염기서열 분석(whole exome sequencing) 또는 전체 전사체 염기서열 분석(whole transcriptome sequencing)을 포함할 수 있으나, 이에 제한되는 것은 아니다.As the term used in the present disclosure, sequencing may be performed by any type of technique capable of sequencing, for example, whole genome sequencing, whole exome base It may include, but is not limited to, whole exome sequencing or whole transcriptome sequencing.
본 개시내용에서 사용되는 용어, 피검체는 HLA 타입을 결정하기 위한 대상체 또는 개체를 의미할 수 있다. As used in the present disclosure, a subject may refer to a subject or individual for determining an HLA type.
본 개시내용에서 사용되는 용어, 시료는 HLA 타입을 결정하고자 하는 개체 또는 대상체로부터 획득된 것이라면 제한 없이 사용할 수 있으며, 예를 들어 생검 등으로 얻어진 세포나 조직, 혈액, 전혈, 혈청, 혈장, 타액, 뇌척수액, 각종 분비물, 소변 및/또는 대변 등일 수 있다. 바람직하게 시료는 혈액, 혈장, 혈청, 타액, 비액, 객담, 복수, 질 분비물 및/또는 소변으로 이루어진 군에서 선택될 수 있으며, 보다 바람직하게는 혈액, 혈장 또는 혈청일 수 있다. 상기 시료는 검출 또는 진단에 사용하기 전에 전처리할 수 있다. 예를 들어, 전처리 방법은 균질화(homogenization), 여과, 증류, 추출, 농축, 방해 성분의 불활성화, 및/또는 시약의 첨가 등을 포함할 수 있다.As used in the present disclosure, the term, sample, can be used without limitation as long as it is obtained from an individual or subject whose HLA type is to be determined, for example, cells or tissues obtained by biopsy, blood, whole blood, serum, plasma, saliva, It may be cerebrospinal fluid, various secretions, urine and/or feces, and the like. Preferably, the sample may be selected from the group consisting of blood, plasma, serum, saliva, nasal fluid, sputum, ascites, vaginal secretion and/or urine, and more preferably blood, plasma or serum. The sample may be pretreated prior to use for detection or diagnosis. For example, pretreatment methods may include homogenization, filtration, distillation, extraction, concentration, inactivation of interfering components, and/or addition of reagents, and the like.
본 개시내용에서, 생물학적 시료는 조직, 세포, 전혈, 및/또는 혈액인 것일 수 있으나, 이에 제한되는 것은 아니다.In the present disclosure, a biological sample may be tissue, cell, whole blood, and/or blood, but is not limited thereto.
본 개시내용에서 사용되는 용어, “인간 백혈구 항원(Human Leukocyte Antigen; HLA)”은 인간의 주조직적합성복합체(Major Histocompatibility Complex: MHC) 유전자에 의해 생성되는 당단백 분자로, 인간이 가지고 있는 유전자 중에서 가장 큰 다형성(polymorphism)을 보이는 유전자이다. HLA 타입을 결정하는 HLA 타이핑은 장기이식, 면역치료, 질병관련 연구, 친자감별과 같은 부친시험, 법의학적 이용, 유전학적 연구 등의 다양한 분야에서 매우 활발하게 이용될 수 있다. As used in the present disclosure, the term “Human Leukocyte Antigen (HLA)” is a glycoprotein molecule produced by the major histocompatibility complex (MHC) gene of humans, and is the most abundant among the genes possessed by humans. It is a gene with a large polymorphism. HLA typing, which determines the HLA type, can be used very actively in various fields such as organ transplantation, immunotherapy, disease-related research, paternity tests such as paternity, forensic use, and genetic research.
본 개시내용에서의 HLA 타입은 예를 들어, HLA-A 타입, HLA-B 타입 및/또는 HLA-C 타입을 포함할 수 있다.An HLA type in the present disclosure may include, for example, an HLA-A type, an HLA-B type, and/or an HLA-C type.
본 개시내용의 일 실시예에서 HLA 타이핑을 위한 복수개의 툴(tool)들이 예시적으로 개시된다. 본 개시내용에서의 툴(tool)은 유전자 분석을 위한 알고리즘을 포함할 수 있다. 예를 들어, 툴은 HLA 타이핑을 위한 알고리즘을 포함할 수 있다. 본 개시내용에서의 HLA 타이핑 방법과 툴은 서로 상호 교환 가능하게 사용될 수 있다.In one embodiment of the present disclosure, a plurality of tools for HLA typing are exemplarily disclosed. Tools in the present disclosure may include algorithms for genetic analysis. For example, the tool may include an algorithm for HLA typing. HLA typing methods and tools in the present disclosure may be used interchangeably with each other.
이하에서는 예시적인 HLA 타이핑 방법 또는 툴들에 대해서 간략히 설명하기로 한다.Exemplary HLA typing methods or tools are briefly described below.
OptiType은 2014년에 발표된 정수 선형 프로그래밍(integer linear programming)에 기반한 HLA 유전자형 결정 알고리즘으로 모든 주요 또는 소수의 HLA class I 대립유전자를 선택하여 NGS 데이터로부터 정확한 4자리의 HLA 유전자형의 예측이 가능한 방법이다. 그러나 OptiType은 정확도 및 유용성 면에서 문제점이 있는 것으로 알려져 있다 (Szolek 등의 OptiType: precision HLA typing from next-generation sequencing data. Bioinformatic, Vol. 30 no. 23 2014, pages 3310-3316, 참조).OptiType is an HLA genotype determination algorithm based on integer linear programming announced in 2014. It selects all major or minor HLA class I alleles and accurately predicts 4-digit HLA genotype from NGS data. . However, OptiType is known to have problems in terms of accuracy and usability (see Szolek et al. OptiType: precision HLA typing from next-generation sequencing data. Bioinformatic, Vol. 30 no. 23 2014, pages 3310-3316).
HLA-HD란 2017년에 일본에서 발표된 NGS 데이터에서 6자리 정밀도로 HLA 대립 유전자를 정확히 결정할 수 있는 방법이다. 자세한 사항은 문헌(Hum Mutat. 2017 Jul;38(7):788-797. doi: 10.1002/humu.23230.)(Kawaguchi, Shuji, et al. Human mutation 38.7 (2017): 788-797.)을 참조할 수 있다.HLA-HD is a method that can accurately determine HLA alleles with 6-digit precision from NGS data published in Japan in 2017. For details, see Hum Mutat. 2017 Jul;38(7):788-797. doi: 10.1002/humu.23230. (Kawaguchi, Shuji, et al. Human mutation 38.7 (2017): 788-797.) can refer
PHLAT란 RNAseq 또는 엑솜 시퀀싱 데이터를 입력값으로 사용하여 주요 클래스 I 및 클래스 II HLA 유전자의 고해상도(6 자리) 타이핑을 위해 설계된 방법이다. 자세한 사항은 문헌(Bai, Yu, David Wang, and Wen Fury. HLA Typing. Humana Press, New York, NY, 2018. 193-201.)을 참조할 수 있다.PHLAT is a method designed for high-resolution (six-digit) typing of major class I and class II HLA genes using RNAseq or exome sequencing data as input. For details, reference may be made to the literature (Bai, Yu, David Wang, and Wen Fury. HLA Typing . Humana Press, New York, NY, 2018. 193-201.).
HLAscan이란 국제 ImMunoGeneTics 프로젝트/인간 백혈구 항원(IMGT/HLA) 데이터베이스에서 HLA 시퀀스에 대한 읽기 정렬을 수행하는 방법이다. 자세한 사항은 문헌(Ka, Sojeong, et al. BMC bioinformatics 18.1 (2017): 1-11.)을 참조할 수 있다.HLAscan is a method for performing read alignment on HLA sequences from the International ImMunoGeneTics Project/Human Leukocyte Antigen (IMGT/HLA) database. For details, refer to the literature (Ka, Sojeong, et al. BMC bioinformatics 18.1 (2017): 1-11.).
HLA*LA란 선형 정렬을 변이 그래프에 투영하는 것을 기반으로 HLA 유형을 추론하는 모델로서, 전체 엑솜 및 전체 게놈 Illumina 데이터에서 정확한 HLA 유전자형의 예측이 가능한 방법이다. 자세한 사항은 문헌(Dilthey, Alexander T., et al. "HLA* LA―HLA typing from linearly projected graph alignments." Bioinformatics 35.21 (2019): 4394-4396)을 참조할 수 있다.HLA*LA is a model that infers HLA types based on projecting linear alignment onto a variance graph, and is a method capable of accurately predicting HLA genotypes from whole-exome and whole-genome Illumina data. For details, see Dilthey, Alexander T., et al. "HLA* LA-HLA typing from linearly projected graph alignments." Bioinformatics 35.21 (2019): 4394-4396.
전술한 HLA 타이핑 방법들 각각에 따른 HLA 타이핑 결과에 대한 가용성 및/또는 정확성은 상이할 수 있다. 이에 따라, 보다 정확도가 높은 최적의 HLA 타입을 결정하는 방법이 요구되고 있다.Availability and/or accuracy of HLA typing results according to each of the above HLA typing methods may be different. Accordingly, a method for determining an optimal HLA type with higher accuracy is required.
도 1은 본 개시내용의 일 실시예에 따른 컴퓨팅 장치(100)의 블록 구성도를 개략적으로 도시한다. 1 schematically illustrates a block configuration diagram of a
본 개시의 일 실시예에 따른 컴퓨팅 장치(100)는 프로세서(110) 및 메모리(130) 를 포함할 수 있다.
도 1에 도시된 컴퓨팅 장치(100)의 구성은 간략화 하여 나타낸 예시일 뿐이다. 본 개시의 일 실시예에서 컴퓨팅 장치(100)는 컴퓨팅 장치(100)의 컴퓨팅 환경을 수행하기 위한 다른 구성들이 포함될 수 있고, 개시된 구성들 중 일부만이 컴퓨팅 장치(100)를 구성할 수도 있다. The configuration of the
본 개시내용에서의 컴퓨팅 장치(100)는 본 개시내용의 실시예들을 구현하기 위한 시스템을 구성하는 노드를 의미할 수 있다. 컴퓨팅 장치(100)는 임의의 형태의 사용자 단말 또는 임의의 형태의 서버를 의미할 수 있다. 전술한 컴퓨팅 장치(100)의 컴포넌트들은 예시적인 것으로 일부가 제외될 수 있거나 또는 추가 컴포넌트가 포함될 수도 있다. 일례로, 전술한 컴퓨팅 장치(100)가 단말을 포함하는 경우, 출력부(미도시) 및 입력부(미도시)가 그 범위 내에 포함될 수 있다.The
본 개시내용에서의 컴퓨팅 장치(100)는 후술될 본 개시내용의 실시예들에 따른 기술적 특징들을 수행할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 생물학적 시료에 대한 염기 서열 분석을 수행한 결과를 입력으로 하는 복수의 HLA 타이핑 툴들로부터의 타이핑 결과에 적어도 부분적으로 기초하여 생물학적 시료에 대한 HLA 타입을 결정할 수 있다.The
일 실시예에서, 프로세서(110)는 적어도 하나의 코어로 구성될 수 있으며, 컴퓨팅 장치(100)의 중앙 처리 장치(CPU: central processing unit), 범용 그래픽 처리 장치 (GPGPU: general purpose graphics processing unit), 텐서 처리 장치(TPU: tensor processing unit) 등의 데이터 분석 및/또는 처리를 위한 프로세서를 포함할 수 있다. 프로세서(110)는 메모리(130)에 저장된 컴퓨터 프로그램을 판독하여 본 개시내용의 일 실시예에 따라, 생물학적 시료에 대한 염기 서열 분석을 수행한 결과를 입력으로 하는 복수의 HLA 타이핑 툴들로부터의 타이핑 결과에 적어도 부분적으로 기초하여 생물학적 시료에 대한 HLA 타입을 결정할 수 있다. 프로세서(110)는 메모리(130)에 저장된 컴퓨터 프로그램을 판독하여 본 개시내용의 일 실시예에 따라, 복수개의 HLA 타이핑 툴들로부터 획득된 콜(call)들에 포함된 HLA 타입 후보들 및 상기 복수개의 HLA 타이핑 툴들 간의 상호 보완 스코어에 기초하여, 상기 생물학적 시료에 대한 HLA 타입을 결정할 수 있다. In one embodiment, the
본 개시의 일 실시예에 따라 프로세서(110)는 신경망의 학습을 위한 연산을 수행할 수도 있다. 프로세서(110)는 딥러닝(DL: deep learning)에서 학습을 위한 입력 데이터의 처리, 입력 데이터에서의 피처 추출, 오차 계산, 역전파(backpropagation)를 이용한 신경망의 가중치 업데이트 등의 신경망의 학습을 위한 계산을 수행할 수 있다. 프로세서(110)의 CPU, GPGPU, 및 TPU 중 적어도 하나가 네트워크 함수의 학습을 처리할 수 있다. 예를 들어, CPU 와 GPGPU가 함께 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수 있다. 또한, 본 개시의 일 실시예에서 복수의 컴퓨팅 장치들의 프로세서들을 함께 사용하여 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수도 있다. 또한, 본 개시의 일 실시예에 따른 컴퓨팅 장치에서 수행되는 컴퓨터 프로그램은 CPU, GPGPU 또는 TPU 실행가능 프로그램일 수 있다.According to an embodiment of the present disclosure, the
추가적으로, 프로세서(110)는 통상적으로 컴퓨팅 장치(100)의 전반적인 동작을 처리할 수 있다. 예를 들어, 프로세서(110)는 컴퓨팅 장치(100)에 포함된 구성요소들을 통해 입력 또는 출력되는 데이터, 정보, 또는 신호 등을 처리하거나 저장부에 저장된 응용 프로그램을 구동함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.Additionally, the
본 개시의 일 실시예에 따르면, 메모리(130)는 프로세서(110)가 생성하거나 결정한 임의의 형태의 정보 및 컴퓨팅 장치(100)가 수신한 임의의 형태의 정보를 저장할 수 있다. 본 개시의 일 실시예에 따르면, 메모리(130)는 프로세서(110)가 본 개시의 실시예들에 따른 동작을 수행하도록 하는 컴퓨터 소프트웨어를 저장하는 저장매체 일 수 있다. 따라서, 메모리(130)는 본 개시내용에 실시예들을 수행하는 데 필요한 소프트웨어 코드, 코드의 실행 대상이 되는 데이터, 코드의 실행 결과를 저장하기 위한 컴퓨터 판독 매체들을 의미할 수 있다.According to one embodiment of the present disclosure, memory 130 may store any type of information generated or determined by
본 개시의 일 실시예에 따르면, 메모리(130)는 임의의 타입의 저장 매체를 의미할 수 있다 예를 들어, 메모리(130)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 컴퓨팅 장치(100)는 인터넷(internet) 상에서 상기 메모리(130)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다. 전술한 메모리에 대한 기재는 예시일 뿐, 본 개시내용에서 사용되는 메모리(130)는 전술한 예시들로 제한되지 않는다.According to an embodiment of the present disclosure, the memory 130 may refer to any type of storage medium. For example, the memory 130 may be a flash memory type, a hard disk type ), multimedia card micro type, card type memory (eg SD or XD memory, etc.), RAM (Random Access Memory, RAM), SRAM (Static Random Access Memory), ROM (Read-Only memory, ROM), electrically erasable programmable read-only memory (EEPROM), programmable read-only memory (PROM), magnetic memory, magnetic disk, and optical disk. The
본 개시내용에서의 통신부(미도시)는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN: Personal Area Network), 근거리 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 또한, 상기 네트워크부(150) 공지의 월드와이드웹(WWW: World Wide Web) 기반으로 동작할 수 있으며, 적외선(IrDA: Infrared Data Association) 또는 블루투스(Bluetooth)와 같이 단거리 통신에 이용되는 무선 전송 기술을 이용할 수도 있다.The communication unit (not shown) in the present disclosure may be configured regardless of its communication mode, such as wired and wireless, and may be configured in various communication networks such as a personal area network (PAN) and a wide area network (WAN). can be configured. In addition, the network unit 150 may operate based on the known World Wide Web (WWW), and a wireless transmission technology used for short-range communication such as Infrared Data Association (IrDA) or Bluetooth. can also be used.
본 개시내용에서의 컴퓨팅 장치(100)는 임의의 형태의 사용자 단말 및/또는 임의의 형태의 서버를 포함할 수 있다. 따라서, 본 개시내용의 실시예들은 서버 및/또는 사용자 단말에 의해 수행될 수 있다.The
사용자 단말은 서버 또는 다른 컴퓨팅 장치와 상호작용 가능한 임의의 형태의 단말을 포함할 수 있다. 사용자 단말은 예를 들어, 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), PDA(personal digital assistants), 슬레이트 PC(slate PC), 태블릿 PC(tablet PC) 및 울트라북(ultrabook)을 포함할 수 있다. A user terminal may include any type of terminal capable of interacting with a server or other computing device. User terminals include, for example, mobile phones, smart phones, laptop computers, personal digital assistants (PDAs), slate PCs, tablet PCs, and ultrabooks. can include
서버는 예를 들어, 마이크로프로세서, 메인프레임 컴퓨터, 디지털 프로세서, 휴대용 디바이스 및 디바이스 제어기 등과 같은 임의의 타입의 컴퓨팅 시스템 또는 컴퓨팅 장치를 포함할 수 있다. A server may include any type of computing system or computing device, such as, for example, microprocessors, mainframe computers, digital processors, portable devices and device controllers, and the like.
추가적인 실시예에서 서버는 염기 서열 정보 또는 유전자 정보를 저장 및 관리하는 엔티티를 의미할 수도 있다. 서버는 염기 서열 정보, 유전자 정보 및/또는 인덱스 정보를 저장하기 위한 저장부(미도시)를 포함할 수 있으며, 저장부는 서버내에 포함되거나 혹은 서버의 관리 하에 존재할 수 있다. 다른 예시로, 저장부는 서버 외부에 존재하여 서버와 통신가능한 형태로 구현될 수도 있다. 이 경우 서버와는 상이한 다른 외부 서버에 의해 저장부가 관리 및 제어될 수 있다.In an additional embodiment, the server may refer to an entity that stores and manages nucleotide sequence information or gene information. The server may include a storage unit (not shown) for storing nucleotide sequence information, gene information, and/or index information, and the storage unit may be included in the server or exist under the management of the server. As another example, the storage unit may exist outside the server and may be implemented in a form capable of communicating with the server. In this case, the storage unit may be managed and controlled by another external server different from the server.
도 2는 본 개시내용의 일 실시예에 따른 HLA 타입을 결정하기 위한 예시적인 방법을 도시한다. 2 illustrates an exemplary method for determining HLA type according to one embodiment of the present disclosure.
일 실시예에서, 도 2에서 도시되는 단계들은 컴퓨팅 장치(100)에 의해 수행될 수 있다. 추가적인 실시예에서, 도 2에서 도시되는 단계들 중 일부는 사용자 단말에서 수행되고 다른 일부는 서버에서 수행되는 방식과 같이 도 2에서의 단계들은 복수의 엔티티들에 의해 구현될 수도 있다.In one embodiment, the steps shown in FIG. 2 may be performed by computing
도 2에서 도시되는 바와 같이, 컴퓨팅 장치(100)는 피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득할 수 있다(210).As shown in FIG. 2 , the
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는 염기 서열 분석(예컨대, NGS)를 수행한 결과를 서버 또는 외부 엔티티 등으로부터 획득할 수 있다. 다른 실시예에서, 컴퓨팅 장치(100)는 피검체 유래의 생물학적 시료로부터 획득된 유전자 데이터(예컨대, DNA 또는 RNA)에 대한 염기 서열 분석을 수행할 수도 있다.In one embodiment of the present disclosure, the
컴퓨팅 장치(100)는 복수개의 HLA 타이핑 툴들로부터 획득된 콜들에 포함된 HLA 타입 후보들 및 복수개의 HLA 타이핑 툴들 간의 상호 보완 스코어에 기초하여, 생물학적 시료에 대한 HLA 타입을 결정할 수 있다(220).The
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는 복수의 HLA 타이핑 툴들 중에서 선택된 3개 이상의 툴(tool)들을 사용하여, 염기 서열 분석의 결과로부터 HLA 타입을 결정할 수 있다. 예를 들어, 컴퓨팅 장치는 OptiType, HLA-HD, PHLAT, HLAscan, 및 HLA*LA 중 선택된 3개 또는 4개의 조합으로부터 얻어진 HLA 타입(또는 HLA 타입 후보들)으로부터 최종 HLA 타입을 결정할 수 있다. 전술한 HLA 타이핑 툴들에 대한 명칭은 설명의 편의를 위한 예시의 목적을 사용되었으며, 구현의 양태에 따라 추가적인 HLA 타이핑 툴들이 사용될 수도 있거나 상술한 HLA 타이핑 툴들 중 일부만이 사용될 수도 있다.In one embodiment of the present disclosure, the
본 개시내용에서 HLA 타이핑 툴로부터의 콜(call)이란, HLA 타이핑 툴에서 출력되는 HLA 타이핑 결과를 의미할 수 있다. 예를 들어, 복수의 HLA 타이핑 툴들 각각으로부터 출력되는 HLA 타입 후보들이 HLA 타이핑 툴로부터의 콜들과 대응될 수 있다.In the present disclosure, a call from an HLA typing tool may mean an HLA typing result output from the HLA typing tool. For example, HLA type candidates output from each of a plurality of HLA typing tools may correspond to calls from the HLA typing tool.
복수의 HLA 타이핑 툴들 별로 정확성 및/또는 가용성이 상이할 수 있다. 본 개시내용의 일 실시예에 따른 기법은 복수의 툴들의 결과들을 신규한 알고리즘을 통해 조합함으로써, 정확성 및/또는 가용성이 높은 HLA 타이핑이 달성될 수 있다. Accuracy and/or usability may be different for each of the plurality of HLA typing tools. In the technique according to an embodiment of the present disclosure, HLA typing with high accuracy and/or usability can be achieved by combining results of a plurality of tools through a novel algorithm.
본 개시내용의 발명자들은 개인의 인간 백혈구 항원(Human Leukocyte Antigen; HLA) 타입을 보다 정확히 판정할 수 있는 방법을 예의 연구한 결과, 차세대 염기서열 분석(NGS)과 같은 염기 서열 데이터를 이용하여 보다 정확한 HLA 타입을 예측할 수 있는 최적의 방법을 개발하였는바, 이에 기초하여 본 발명을 완성하였다. The inventors of the present disclosure, as a result of intensive research on a method for more accurately determining a person's Human Leukocyte Antigen (HLA) type, more accurately use base sequence data such as next-generation sequencing (NGS). An optimal method for predicting the HLA type was developed, and based on this, the present invention was completed.
이를 통해 복수의 툴들을 조합함으로써 그리고 복수의 툴들 간의 상호 보완 스코어를 이용함으로써 HLA 타입을 정확하게 예측할 수 있으며, 이러한 HLA 타입 예측을 통해서 개별화된 의료 개입 여부를 보다 효율적으로 결정할 수 있다는 효과가 도출될 수 있다. Through this, it is possible to accurately predict the HLA type by combining a plurality of tools and by using the complementary scores between the plurality of tools, and through such HLA type prediction, the effect that individualized medical intervention can be determined more efficiently can be derived. there is.
본 개시내용의 발명자들은 복수개의 HLA 타이핑 툴들을 모두 혹은 적어도 일부 이용하는 경우 그리고 복수의 HLA 타이핑 툴들 간의 상호 보완 스코어를 이용하는 경우, 특히 HLA Class I 타이핑의 정확도가 현저히 향상됨을 확인하였는 바, 본 개시내용의 실시예들이 신뢰도가 향상된 최적의 HLA 타입 결정 방법임을 알 수 있었다. 따라서 본 발명의 일 실시예에 따른 HLA 타입 결정 방법을 이용하는 경우, 이식 성공률을 높이기 위한 조직 적합성 테스트뿐만 아니라, PCR-SBT 추가 수행 여부 판단 등 의료 개인화가 가능해질 것으로 기대된다.The inventors of the present disclosure have confirmed that the accuracy of HLA Class I typing is significantly improved when all or at least some of a plurality of HLA typing tools are used and when a mutual complement score between a plurality of HLA typing tools is used, in particular, the present disclosure It was found that the embodiments of are the optimal HLA type determination method with improved reliability. Therefore, when using the HLA type determination method according to an embodiment of the present invention, it is expected that personalization of medical care, such as determining whether to additionally perform PCR-SBT as well as histocompatibility testing to increase the transplant success rate, is expected.
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는 복수의 HLA 타이핑 툴들 중에서 콜을 제시한 툴의 개수를 결정하고 그리고 결정된 툴의 개수에 기초하여, 상기 HLA 타입을 결정할 수 있다. 각각의 HLA 타이핑 툴들은 각자의 고유 알고리즘을 통해 HLA 타이핑 결과를 포함하는 콜을 출력할 수 있다. 예컨대, 컴퓨팅 장치(100)는 콜을 제시한 툴이 총 5개이고, 5개의 툴에서 제시한 콜에 포함된 HLA 타입이 모두 일치하는 경우 또는 4개가 일치하는 경우, 일치하는 HLA 타입을 최종 HLA 타입으로 결정할 수 있다. 컴퓨팅 장치(100)는 복수의 HLA 타이핑 툴들 중에서 콜을 제시한 툴의 개수를 결정하고, 제시된 콜들에 포함된 HLA 타입 후보들 간의 일치도를 결정하고, 그리고 상기 결정된 툴의 개수 및 상기 결정된 일치도에 기초하여, 상기 HLA 타입을 결정할 수 있다. In one embodiment of the present disclosure, the
예를 들어, 콜을 제시한 툴들의 개수가 너무 적거나(예컨대, 2개의 툴에서만 콜을 제시함) 그리고/또는 콜에 포함된 HLA 타입 후보 중 서로 일치하는 HLA 타입이 2개인 경우에는 복수의 툴들로부터 획득된 HLA 타입 후보에 대한 신뢰도가 낮다고 결정될 수 있다. 반대의 경우, 콜들의 개수가 특정 임계값보다 많고 그리고/또는 콜의 포함된 HLA 타입 후보의 일치도가 특정 임계값보다 높다고 결정되는 경우, 최종 결정되는 HLA 타입의 신뢰도가 높다고 결정될 수 있다. 신뢰도가 높다고 결정되는 경우, 결정되는 HLA 타입이 최종 HLA 타입으로 결정 및 출력될 수 있다.For example, if the number of tools presenting a call is too small (eg, only two tools present a call) and/or there are two HLA type candidates among the HLA type candidates included in the call, a plurality of It may be determined that the reliability of the HLA type candidate obtained from the tools is low. In the opposite case, when it is determined that the number of calls is greater than a specific threshold and/or the degree of matching of HLA type candidates included in the call is higher than a specific threshold, it may be determined that the reliability of the finally determined HLA type is high. When it is determined that the reliability is high, the determined HLA type may be determined and output as the final HLA type.
여기서 일치도는 HLA 타이핑을 수행하는 툴에서 제시된 콜에 포함된 HLA 타입이 일치하는 콜들의 개수를 나타낼 수 있다. 예를 들어, OptiType, HLA-HD, PHLAT, HLAscan, 및 HLA*LA에서 모두 콜을 제시하였으며, 이 중 3개의 콜에 포함된 HLA 타입이 동일한 경우, 일치도는 3/5으로 표현될 수 있으며, 이 중 4개의 콜들에 포함된 HLA 타입이 동일한 경우 일치도는 4/5로 표현될 수 있다. 일치도에 대한 표현 방식 및 계산 방식을 전술한 예시에 국한되는 것은 아니며, 본 개시내용의 범위를 벗어나지 않는 한 콜에 포함된 HLA 타입의 동일성을 나타내는 임의의 형태의 방식이 일치도의 범위 내에 포함될 수 있다.Here, the degree of coincidence may indicate the number of calls in which the HLA type included in the call presented by the tool performing HLA typing matches. For example, OptiType, HLA-HD, PHLAT, HLAscan, and HLA*LA all presented calls, and if the HLA types included in three of these calls are the same, the degree of concordance can be expressed as 3/5, If the HLA types included in four of these calls are the same, the degree of concordance may be expressed as 4/5. The expression method and calculation method for the degree of concordance are not limited to the above examples, and any form of method indicating the identity of the HLA type included in the call may be included within the scope of the degree of concordance as long as it does not depart from the scope of the present disclosure. .
본 개시내용의 일 실시예에서, 컴퓨팅 장치는 복수의 툴들에서 제시한 콜들 중 사용가능한 콜들의 개수를 결정하고, 상기 사용가능한 콜들의 개수에 기초하여, 상기 HLA 타입을 결정하기 위한 일치도 기준을 생성하고, 그리고 상기 생성된 일치도 기준에 기초하여, 상기 HLA 타입을 결정할 수 있다. 여기서, 일치도 기준이란 HLA 타입을 결정하기 위한 일치도 임계치를 나타낼 수 있다. 또한, 사용가능한 콜이란 HLA 타이핑 툴에서 제시한 콜들 중 HLA 타입을 결정하는데 사용이 가능한 콜을 의미할 수 있다. 다른 실시예에서, 사용가능한 콜이란 복수의 HLA 타이핑 툴들에서 제시한 모든 콜들을 의미할 수도 있다. 이러한 예시에서는, 콜을 제시하지 않은 툴을 제외하고 나머지 툴에서 제시한 콜들이 사용가능한 콜로서 고려될 수 있다.In one embodiment of the present disclosure, a computing device determines the number of available calls among calls presented by a plurality of tools, and based on the number of available calls, generates a matching criterion for determining the HLA type. And, based on the generated matching criterion, the HLA type may be determined. Here, the match criterion may indicate a match threshold for determining the HLA type. Also, the usable call may mean a call usable for determining an HLA type among calls presented by the HLA typing tool. In another embodiment, available calls may mean all calls presented by a plurality of HLA typing tools. In this example, calls presented by the remaining tools, except for the tool that did not present the call, may be considered usable calls.
일치도 기준은 사용가능한 콜들의 개수에 따라 가변될 수 있다. 다른 예시로, 일치도 기준은 사용가능한 콜들의 개수와 콜에 포함되는 HLA 타입 후보가 무엇인지에 따라 가변될 수 있다.The consistency criterion may vary according to the number of available calls. As another example, the consistency criterion may vary depending on the number of available calls and HLA type candidates included in the calls.
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는, 복수의 HLA 타이핑 툴들 중 5개의 방법에서만 특정 타입이 제시되었을 경우, 5개의 방법에서 모두 동일하게 제시된 HLA 타입 후보를 최종 HLA 타입으로 결정할 수도 있거나, 3개 또는 4개의 방법에서 동일하게 제시된 HLA 타입 후보를 최종 HLA 타입으로 결정할 수 있으나, 본 개시내용의 범위가 이에 제한되는 것은 아니다.In one embodiment of the present disclosure, the
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는, HLA 타입을 분석하는 과정 중, 복수의 HLA 타이핑 툴들 중 하나 이상의 툴에서 다중 콜을 제시하는 경우, 상기 다중 콜을 제시한 HLA 타이핑 툴로부터의 결과는 최종 HLA 타입을 결정하는데 있어서 제외하는 것으로 결정할 수도 있다. 즉, 컴퓨팅 장치(100)는 이러한 경우, 다중 콜에 대해서는 사용 가능하지 않은 것으로 결정할 수 있으나, 이에 제한되는 것은 아니다.In one embodiment of the present disclosure, the
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는 HLA 타입을 결정하는데 있어서 복수개의 HLA 타이핑 툴들 중 어느 2개의 타이핑 툴들 간의 상호 보완 스코어를 계산하고 그리고 상기 상호 보완 스코어에 기초하여, 상기 생물학적 시료에 대한 상기 HLA 타입을 결정할 수 있다.In one embodiment of the present disclosure, the
일 실시예에서, 상호 보완 스코어는, 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 HLA 타입을 결정하는데 함께 이용될 수 있는 가능성을 정량적으로 나타내는 값을 포함할 수 있다. 예를 들어, 상호 보완 스코어는 2개의 HLA 타이핑 툴들의 조합에 대응하여 생성될 수 있다. 예를 들어, A, B, C, 및 D를 포함하는 4개의 HLA 타이핑 툴들이 존재한다고 가정할 때, A와 B, A와 C, A와 D, B와 A, B와 C, B와 D, C와 A, C와 B, C와 D, D와 A, D와 B 및 D와 C에 대응하는 개수의 상호 보완 스코어가 생성될 수 있다. 다른 예시에서, A, B, C, 및 D를 포함하는 4개의 HLA 타이핑 툴들이 존재한다고 가정할 때, A와 B, A와 C, A와 D, B와 C, B와 D, 및 C와 D에 대응하는 개수의 상호 보완 스코어가 생성될 수도 있다.In one embodiment, the complementarity score may include a value quantitatively indicating the possibility that any two HLA typing tools among a plurality of HLA typing tools can be used together to determine the HLA type. For example, a complementary score may be generated corresponding to a combination of two HLA typing tools. For example, assuming that there are four HLA typing tools including A, B, C, and D, A and B, A and C, A and D, B and A, B and C, and B and D , C and A, C and B, C and D, D and A, D and B, and D and C, the number of complementary scores corresponding to each other may be generated. In another example, assuming that there are four HLA typing tools including A, B, C, and D, A and B, A and C, A and D, B and C, B and D, and C and A number of complementary scores corresponding to D may be generated.
전술한 바와 같이, 상호 보완 스코어는 2개의 HLA 타이핑 툴들 중 어느 하나를 사용하였을 경우에 비해, 다른 하나를 함께 사용하였을 때의 보완 가능성을 나타낼 수 있다. 추가적인 실시예에서, 상호 보완 스코어는 2개가 아닌 3개 이상의 HLA 타이핑 툴들의 조합에 대한 스코어를 나타낼 수도 있다.As described above, the mutual complementation score may indicate the possibility of complementation when one of the two HLA typing tools is used together, compared to when either one of the two HLA typing tools is used. In a further embodiment, the complementary score may represent a score for a combination of three or more HLA typing tools rather than two.
일 실시예에서, 상호 보완 스코어는, 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 함께 사용되었을 때의, 상기 결정되는 HLA 타입의 정확성을 정량적으로 나타내는 값을 포함할 수 있다. 예를 들어, 하나의 HLA 타이핑 툴에서의 HLA 타이핑 결과와 실제 HLA 타입 간의 비교 결과에 대한 정확성이 70%라고 한다고 가정한다. 이러한 가정 하에서, 상기 하나의 HLA 타이핑 툴과 상이한 다른 하나의 HLA 타이핑 툴에서 출력되는 결과를 함께 참고하여 결정되는 최종 HLA 타이핑 결과에 대한 정확성이 85%라고 한다면, 이러한 2개의 HLA 타이핑 툴들 간의 상호 보완 스코어는 상대적으로 높은 값을 갖도록 설정될 수 있다. 반대로, 2개의 HLA 타이핑 툴들을 조합하더라도 하나의 HLA 타이핑 툴의 결과에 비해 정확성이 높지 않는 경우에는 상대적으로 낮은 상호 보완 스코어가 설정될 수 있다.In one embodiment, the complementary score may include a value quantitatively indicating the accuracy of the determined HLA type when any two HLA typing tools among a plurality of HLA typing tools are used together. For example, it is assumed that the accuracy of the comparison result between the HLA typing result in one HLA typing tool and the actual HLA type is 70%. Under this assumption, if the accuracy of the final HLA typing result determined by referring to the results output from the one HLA typing tool and the other HLA typing tool, which is different from the one HLA typing tool, is 85%, the mutual complement between these two HLA typing tools The score may be set to have a relatively high value. Conversely, when the accuracy is not higher than that of one HLA typing tool even when two HLA typing tools are combined, a relatively low complementary score may be set.
일 실시예에서, 상호 보완 스코어는, 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 함께 사용되었을 때의 상기 2개의 HLA 타이핑 툴들에서 획득된 콜들에 포함된 HLA 타입 후보들에 적용될 보정값을 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, the complementary score is a quantitative correction value to be applied to HLA type candidates included in calls obtained from a plurality of HLA typing tools when any two HLA typing tools are used together. It may contain a value represented by .
예를 들어, 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴을 함께 사용하였을 때, 제 1 HLA 타이핑 툴에 대한 제 1 정확성 수치값에 제 1 HLA 타이핑 툴에 대한 제 2 HLA 타이핑 툴의 조합에 따른 제 1 상호 보완 스코어링 값이 보정값으로서 추가될 수 있다. 이러한 예시에서, 제 1 HLA 타이핑 툴은 제 2 HLA 타이핑 툴과 함께 사용되는 경우 제 1 HLA 타이핑 툴에 내재된 제 1 정확성 수치값과 상기 제 1 상호 보완 스코어링에 대응되는 보정값이 합쳐진 정확성 값을 가질 수 있다.For example, when a first HLA typing tool and a second HLA typing tool are used together, a first accuracy numerical value for the first HLA typing tool is combined with a second HLA typing tool for the first HLA typing tool. A first complementary scoring value may be added as a correction value. In this example, the first HLA typing tool, when used in conjunction with the second HLA typing tool, generates an accuracy value obtained by adding a first accuracy numerical value inherent in the first HLA typing tool and a correction value corresponding to the first complementary scoring. can have
다른 예시에서, 제 2 HLA 타이핑 툴과 제 1 HLA 타이핑 툴을 함께 사용하였을 때, 제 2 HLA 타이핑 툴에 대한 제 2 정확성 수치값에 제 2 HLA 타이핑 툴에 대한 제 1 HLA 타이핑 툴의 조합에 따른 제 2 상호 보완 스코어링 값이 보정값으로서 추가될 수 있다. 이러한 예시에서, 제 2 HLA 타이핑 툴은 제 1 HLA 타이핑 툴과 함께 사용되는 경우 제 2 HLA 타이핑 툴에 내재된 제 2 정확성 수치값과 상기 제 2 상호 보완 스코어링에 대응되는 보정값이 합쳐진 정확성 값을 가질 수 있다.In another example, when the second HLA typing tool and the first HLA typing tool are used together, according to the combination of the first HLA typing tool with respect to the second HLA typing tool to the second accuracy numerical value for the second HLA typing tool. A second complementary scoring value may be added as a correction value. In this example, the second HLA typing tool, when used in conjunction with the first HLA typing tool, generates an accuracy value that is the sum of a second accuracy numerical value inherent in the second HLA typing tool and a correction value corresponding to the second complementary scoring. can have
본 개시의 일 실시예에서, 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴 간의 상호 보완 스코어는, 생물학적 시료에 대하여 상기 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜에 대한 결과가 틀렸을 때, 상기 생물학적 시료에 대하여 상기 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜에 대한 결과의 정확성을 정량적으로 나타내는 값을 포함할 수 있다. 예를 들어, 제 1 콜에 대한 결과가 틀렸을 때, 제 2 콜에 대한 결과가 맞을 가능성이 높다면, 상기 상호 보완 스코어가 높은 값으로 설정될 수 있다. In one embodiment of the present disclosure, a complementary score between a first HLA typing tool and a second HLA typing tool among a plurality of HLA typing tools is a result of a first call obtained from the first HLA typing tool for a biological sample. may include a value quantitatively indicating the accuracy of the result for the second call obtained from the second HLA typing tool for the biological sample when is wrong. For example, if the result of the first call is incorrect and the probability of the result of the second call being correct is high, the complementary score may be set to a high value.
본 개시의 일 실시예에서, 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴 간의 상호 보완 스코어는, 상기 제 1 HLA 타이핑 툴이 상기 제 2 HLA 타이핑 툴과 함께 사용되었을 때의 상기 결정된 HLA 타입에 대한 정확성 값이, 상기 제 1 HLA 타이핑 툴에 대해 사전결정된 제 1 정확성 값과 비교한 결과를 정량적으로 나타내는 값을 포함할 수도 있다. 예를 들어, 제 1 HLA 타이핑 툴에 내재된 제 1 정확성 값과 상기 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴이 함께 사용되었을 때의 정확성 값의 차이가 상호 보완 스코어를 나타낼 수 있다.In one embodiment of the present disclosure, a complementary score between a first HLA typing tool and a second HLA typing tool among a plurality of HLA typing tools is obtained when the first HLA typing tool is used together with the second HLA typing tool. The determined accuracy value for the HLA type may include a value quantitatively indicating a result of comparison with a predetermined first accuracy value for the first HLA typing tool. For example, a difference between a first accuracy value inherent in the first HLA typing tool and an accuracy value when the first HLA typing tool and the second HLA typing tool are used together may represent a complementary score.
본 개시의 일 실시예에서, 컴퓨팅 장치(100)는 상호 보완 스코어의 값에 기초하여 복수의 HLA 타이핑 툴들을 조합할지 여부를 결정할 수 있다. 예를 들어, 컴퓨팅 장치(100)는, 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜과 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜을 조합할지 여부를 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어에 기초하여 할 수 있다. 이러한 조합 여부에 대한 결정은 사전결정된 임계값과 상호 보완 스코어 간의 비교에 따라 수행될 수 있다. 또는, 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴이 조합되는 경우 제 1 HLA 타이핑 툴에 내재된 정확성 또는 제 2 HLA 타이핑 툴에 내재된 정확성을 초과하는 정확성을 가진다는 점이 상호 보완 스코어를 통해 판단되는 경우, 컴퓨팅 장치(100)는 상기 2개의 HLA 타이핑 툴들을 조합하는 것으로 결정할 수 있다. 반대로, 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴이 조합되는 경우 제 1 HLA 타이핑 툴에 내재된 정확성 또는 제 2 HLA 타이핑 툴에 내재된 정확성 미만의 정확성을 가진다는 점이 상호 보완 스코어를 통해 판단되는 경우, 컴퓨팅 장치(100)는 상기 2개의 HLA 타이핑 툴들을 조합하는 것으로 결정할 수 있다.In one embodiment of the present disclosure, the
본 개시의 일 실시예에서, 컴퓨팅 장치(100)는 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜과 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜을 조합할지 여부를, 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어, 상기 제 1 HLA 타이핑 툴에 대한 사전 결정된 제 1 정확성 값 및 상기 제 2 HLA 타이핑 툴에 대한 사전 결정된 제 2 정확성 값에 기초하여 결정할 수 있다. 예를 들어, 제 1 HLA 타이핑 툴에 내재된 제 1 정확성 값과 제 2 HLA 타이핑 툴에 내재된 제 2 정확성 값과 함께 제 1 HLA 타이핑 툴에 제 2 HLA 타이핑 툴이 조합되었을 때의 상호 보완 스코어를 인자들로 활용하여, 컴퓨팅 장치(100)는 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴을 조합하여 HLA 타이핑 결과를 출력할지 여부를 결정할 수 있다.In one embodiment of the present disclosure, the
본 개시의 일 실시예에서, 컴퓨팅 장치(100)는 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜 및 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜에 적용될 보정값을 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어에 기초하여 결정할 수 있다. 컴퓨팅 장치(100)는 보정값에 기초하여 생물학적 시료에 대응하는 HLA 타입을 결정할 수 있다. 예를 들어, 2개의 HLA 타이핑 툴로부터 획득된 콜들이 서로 일치하는 경우, 그리고 2개의 툴들 간의 상호 보완 스코어가 상대적으로 높은 값을 갖는 경우(예컨대, 사전결정된 임계값 이상의 값을 갖는 경우), 컴퓨팅 장치(100)는 상기 일치하는 2개의 콜들에 대응하는 HLA 타입으로 최종 HLA 타입을 결정할 수 있다. 이러한 예시에서, 컴퓨팅 장치(100)는 상기 2개의 HLA 타이핑 툴들 이외의 다른 HLA 타이핑 툴들로부터의 콜들과 이들의 상호 보완 스코어를 함께 고려하여, 어떠한 툴들로부터의 결과를 HLA 타이핑 결과로 사용할지를 결정할 수 있다.In one embodiment of the present disclosure, the
본 개시의 일 실시예에서, 컴퓨팅 장치(100)는 상호 보완 스코어에 기초하여 복수개의 HLA 타이핑 툴들에 포함된 알고리즘들 간의 유사도를 결정할 수 있다. 제 1 HLA 타이핑 툴에 대한 제 2 HLA 타이핑 툴의 상호 보완 스코어는 제 1 HLA 타이핑 툴의 결과가 틀렸을 때, 제 2 HLA 타이핑 툴의 결과가 맞을 가능성을 나타내는 지표로 사용될 수 있다. 이는 제 1 HLA 타이핑 툴의 타이핑 알고리즘과 제 2 HLA 타이핑 툴의 알고리즘 간의 차이를 나타내는 지표로도 활용될 수 있다. 따라서, 본 개시의 일 실시예에 따라, 컴퓨팅 장치(100)는 계산된 상호 보완 스코어에 기초하여, 각 HLA 타이핑 툴에 대한 타이핑 방식 또는 타이핑 알고리즘의 유사한 정도 혹은 차이의 정도를 계산할 수 있다.In one embodiment of the present disclosure, the
도 3은 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.3 illustrates an example algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
도 3 내지 도 5에서 기재된 HLA 타이핑 툴들은 예시적인 목적을 위해 사용된 것이며, 구현에 따라 추가적인 HLA 타이핑 툴이 사용될 수 있거나 또는 이들 중 일부만이 사용될 수도 있다. 일례로 추가적인 HLA 타이핑 툴들은 Polysolver, HLAreporter, HLAforest 및 HLAminer 등과 같이 HLA 타이핑을 위한 임의의 형태의 툴들을 포함할 수 있다.The HLA typing tools described in FIGS. 3-5 are used for illustrative purposes, and depending on the implementation, additional HLA typing tools or only some of them may be used. As an example, additional HLA typing tools may include any type of tools for HLA typing, such as Polysolver, HLAreporter, HLAforest, and HLAminer.
도 3 내지 도 5에서 예시적으로 기재된 HLA 타이핑 툴들 중 Opt는 OptiType을 나타내며, HD는 HLA-HD (HLA typing from High-quality Dictionary)를 나타내며, Phlat, SeqLA 및 kourami는 각각 그 자체로 PHLAT, seq2HLA 및 kourami를 나타내며, arcas는 arcasHLA를 나타내며, Scan은 HLAscan을 나타내며, 그리고 *LA는 HLA*LA를 나타내기 위해 사용되었다.Among the HLA typing tools illustratively described in FIGS. 3 to 5, Opt represents OptiType, HD represents HLA-HD (HLA typing from High-quality Dictionary), and Phlat, SeqLA, and kourami are PHLAT and seq2HLA, respectively, by themselves. and kourami, arcas denotes arcasHLA, Scan denotes HLAscan, and *LA was used to denote HLA*LA.
일 실시예에서, 도 3은 상호 보완 스코어를 결정하기 위한 인자 중 하나인 정정 스코어(correction score)를 표현하기 위한 예시적인 자료 구조를 도시한다.In one embodiment, FIG. 3 shows an exemplary data structure for expressing a correction score, which is one of factors for determining a complementary score.
도 3에서 참조번호 300으로 도시되는 자료 구조(300)는 8개의 HLA 타이핑 툴들 중 maintype의 HLA 타이핑 툴들 각각에 대해서 subtype의 HLA 타이핑 툴들 각각이 조합되는 경우의, maintype의 HLA 타이핑 툴에 대한 결과를 subtype의 HLA 타이핑 툴이 정정(correction)할 수 있는 스코어를 나타낸다. 상기 자료 구조(300)는 대량의 샘플들에 대해서 복수의 HLA 타이핑 툴들을 각각 조합하여 얻은 결과이다.The
도 3에서 도시되는 바와 같이, 특정 maintype의 제 1 HLA 타이핑 툴에 대한 특정 subtype의 제 2 HLA 타이핑 툴의 정정 스코어(correction score)는, 대량의 샘플들을 대상으로 한 실험에서, 제 1 HLA 타이핑 툴에 대한 결과가 틀린 횟수 정보 및 상기 제 1 HLA 타이핑 툴에 대한 결과가 틀렸을 때 제 2 HLA 타이핑 툴에 대한 결과가 맞는 횟수 정보에 기초하여 결정될 수 있다. 이러한 정정 스코어는 제 1 HLA 타이핑 툴에 대한 결과가 틀렸을 때 제 2 HLA 타이핑 툴에 대한 결과가 맞는 횟수에 대한 값이 클수록 높은 값을 가질 수 있다. 이처럼 정정 스코어는 특정한 HLA 타이핑 툴을 사용하였을 때의 결과를 다른 HLA 타이핑 툴을 통해 보정해줄 수 있는 가능성을 정량적으로 나타낸다.As shown in FIG. 3, the correction score of the second HLA typing tool of a specific subtype for the first HLA typing tool of a specific maintype is, in an experiment targeting a large number of samples, the first HLA typing tool It may be determined based on information on the number of times the result for is wrong and information on the number of times the result for the second HLA typing tool is correct when the result for the first HLA typing tool is wrong. The correction score may have a higher value as a value for the number of times that the result of the second HLA typing tool is correct when the result of the first HLA typing tool is incorrect. As such, the correction score quantitatively indicates the possibility of correcting the result of using a specific HLA typing tool through another HLA typing tool.
도 3에서 보여지는 정정 스코어의 값이 클수록 maintype의 HLA 타이핑 툴을 subtype의 HLA 타이핑 툴이 정정해줄 가능성이 높다는 것을 나타낸다. 정정 스코어의 값이 클수록 상호 보완 스코어의 값이 클 수 있다.As the value of the correction score shown in FIG. 3 increases, it indicates that the HLA typing tool of the subtype is more likely to correct the HLA typing tool of the maintype. As the value of the correction score increases, the value of the mutual complementation score may increase.
도 3에서 도시되는 예시에서, 정정 스코어의 값은 0 내지 1의 범위 내에 포함될 수 있다. 이러한 예시에서, 정정 스코어의 값이 1에 가까워질수록 해당 subtype이 해당 maintype의 결과를 정정해서 정확한 값을 출력할 가능성이 높다는 것을 의미할 수 있다.In the example shown in FIG. 3 , the value of the correction score may be included in the range of 0 to 1. In this example, the closer the value of the correction score is to 1, the higher the possibility that the subtype corrects the result of the maintype and outputs an accurate value.
도 4는 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.4 illustrates an exemplary algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
일 실시예에서, 도 4는 상호 보완 스코어를 결정하기 위한 인자 중 하나인 상호 보완 비율(complementary ratio)를 표현하기 위한 예시적인 자료 구조를 도시한다. 일례로, 도 5는 복수의 HLA 타이핑 툴들에 대한 상호 보완 비율에 대한 표를 포함할 수 있다.In one embodiment, FIG. 4 shows an exemplary data structure for expressing a complementary ratio, which is one of the factors for determining a complementary score. As an example, FIG. 5 may include a table of complementarity ratios for a plurality of HLA typing tools.
본 개시내용에서의 일 실시예에서, A라는 HLA 타이핑 툴에 대한 B라는 HLA 타이핑 툴의 상호 보완 비율이란 A에 대한 B의 정정 스코어와 B에 내재된 정확성 값에 기초하여 결정될 수 있다. 예를 들어, A라는 HLA 타이핑 툴에 대한 B라는 HLA 타이핑 툴의 상호 보완 비율은 1에서 B의 정확성 값을 차감한 값을 분모로 하여 1에서 A에 대한 B의 정정 스코어를 차감한 값을 분자로 하여 결정될 수 있다.In one embodiment of the present disclosure, the complementarity ratio of HLA typing tool B to HLA typing tool A may be determined based on the correction score of B to A and the accuracy value inherent in B. For example, the complementarity ratio of an HLA typing tool B to an HLA typing tool A is 1 minus B's accuracy value as the denominator and 1 minus B's correction score for A as the numerator. can be determined by
일례로 정확성 값은 0 내지 1 의 범위에 포함될 수 있다.For example, the accuracy value may be included in the range of 0 to 1.
본 개시내용의 추가적인 실시예에서, A라는 HLA 타이핑 툴에 대한 B라는 HLA 타이핑 툴의 상호 보완 비율이란 A에 대한 B의 정정 스코어와 A에 내재된 정확성 값에 기초하여 결정될 수 있다. 예를 들어, A라는 HLA 타이핑 툴에 대한 B라는 HLA 타이핑 툴의 상호 보완 비율은 1에서 A의 정확성 값을 차감한 값을 분모로 하여 1에서 A에 대한 B의 정정 스코어를 차감한 값을 분자로 하여 결정될 수 있다.In a further embodiment of the present disclosure, the complementarity ratio of HLA typing tool B to HLA typing tool A may be determined based on the correction score of B to A and the implicit accuracy value of A. For example, the complementarity ratio of an HLA typing tool B to an HLA typing tool A is 1 minus A's accuracy value as the denominator and 1 minus B's correction score for A as the numerator. can be determined by
일 실시예에서, 2개의 HLA 타입 툴들에 대해서 2개의 상호 보완 비율이 계산될 수 있다. 일례로, A에 대한 B의 상호 보완 비율과 B에 대한 A의 상호 보완 비율이 계산될 수 있다. 도 4에서 도시되는 바와 같이, 2개의 대응되는 HLA 타이핑 툴들에 대해서 maintype과 subtype의 관계에 따라서 2개의 상호 보완 비율이 계산될 수 있다.In one embodiment, two complementarity ratios may be calculated for two HLA type tools. In one example, the complementarity ratio of B to A and the complementarity ratio of A to B can be calculated. As shown in FIG. 4 , two complementary ratios may be calculated according to the relationship between maintype and subtype for two corresponding HLA typing tools.
일례에서, 상호 보완 비율의 값이 높을수록 subtype에 내재된 HLA 타이핑 결과에 정확성에 비해 maintype에 대한 결과를 정정해줄 가능성이 높다는 것을 의미할 수 있다. In one example, the higher the value of the complementarity ratio, the higher the probability of correcting the result for the maintype compared to the accuracy of the HLA typing result inherent in the subtype.
다른 예시에서, 상호 보완 비율의 값이 높을수록 maintype에 내재된 HLA 타이핑 정확성에 비해 subtype으로부터 결과에 따라 정정된 결과에 대응하는 정확성이 높다는 것을 의미할 수도 있다.In another example, the higher the value of the complementarity ratio, the higher the accuracy corresponding to the corrected result according to the result from the subtype compared to the HLA typing accuracy inherent in the maintype.
일 실시예에서, 상호 보완 비율의 값이 1보다 크다는 것은 것과 조합하였을 때 해당하는 HLA 타이핑 툴에 내재된 정확성을 능가(outperform)한다는 것을 의미할 수 있다.In one embodiment, the value of the complementarity ratio greater than 1 may mean that the accuracy inherent in the corresponding HLA typing tool is outperformed when combined with.
도 5는 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.5 depicts an exemplary algorithm for determining a complementarity score according to one embodiment of the present disclosure.
일 실시예에서, 도 5는 상호 보완 스코어를 표현하기 위한 예시적인 자료 구조를 도시한다. 일례로, 도 5는 복수의 HLA 타이핑 툴들에 대한 상호 보완 스코어에 대한 표를 포함할 수 있다.In one embodiment, FIG. 5 illustrates an example data structure for representing a complementary score. As an example, FIG. 5 may include a table of complementary scores for a plurality of HLA typing tools.
본 개시의 일 실시예에 따라 복수개의 HLA 타이핑 툴들의 결과를 조합할지 여부를 결정하기 위하여 컴퓨팅 장치(100)는 도 5에 도시되는 상호 보완 스코어를 사용할 수 있다. 추가적으로 본 개시의 일 실시예에 따라 복수개의 HLA 타이핑 툴들을 조합하였을 경우의 HLA 타이핑 결과에 대한 정확성을 예측하기 위하여 컴퓨팅 장치(100)는 도 5에서 도시되는 상호 보완 스코어를 사용할 수 있다.According to an embodiment of the present disclosure, the
본 개시의 추가적인 실시예에서, 컴퓨팅 장치(100)는 복수의 HLA 타이핑 툴들 간의 HLA 타이핑 알고리즘의 유사도를 판단하기 위하여 상호 보완 스코어를 사용할 수 있다. 일례로, 상대적으로 큰 상호 보완 스코어의 값을 갖는 복수의 HLA 타이핑 툴들은 서로 간의 알고리즘이 상이할 가능성이 높다는 것을 나타낸다. 또한, 상대적으로 작은 상호 보완 스코어의 값을 갖는 복수의 HLA 타이핑 툴들은 서로 간의 알고리즘이 동일할 또는 유사할 가능성이 높다는 것을 나타낸다. In a further embodiment of the present disclosure,
본 개시의 일 실시예에서, 상호 보완 스코어는, 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터의 제 1 결과가 실제 결과와 일치하지 않는 경우 제 2 HLA 타이핑 툴로부터의 제 2 결과가 상기 실제 결과와 일치하는 경우를 나타내는 제 1 서브 스코어, 복수개의 HLA 타이핑 툴들 중 제 2 HLA 타이핑 툴로부터의 제 2 결과가 실제 결과와 일치하지 않는 경우 제 1 HLA 타이핑 툴로부터의 제 1 결과가 상기 실제 결과와 일치하는 경우를 나타내는 제 2 서브 스코어, 제 1 HLA 타이핑 툴에 대해 사전 결정된 제 1 정확성 값, 및 제 2 HLA 타이핑 툴에 대해 사전 결정된 제 2 정확성 값에 기초하여 연산될 수 있다. 여기서의 제 1 서브 스코어는 제 1 HLA 타이핑 툴에 대한 제 2 HLA 타이핑 툴의 상호 보완 비율 또는 정정 스코어를 포함하며, 제 2 서브 스코어는 제 2 HLA 타이핑 툴에 대한 제 1 HLA 타이핑 툴의 상호 보완 비율 또는 정정 스코어를 포함할 수 있다.In one embodiment of the present disclosure, the complementary score is determined by determining whether a first result from a first HLA typing tool among a plurality of HLA typing tools does not match an actual result, and a second result from a second HLA typing tool being the actual result. A first sub-score indicating a case in which the result matches the actual result, and a first result from the first HLA typing tool in case the second result from the second HLA typing tool among the plurality of HLA typing tools does not match the actual result. It may be calculated based on the second sub-score indicating the case of coincidence, the first accuracy value predetermined for the first HLA typing tool, and the second accuracy value predetermined for the second HLA typing tool. Here, the first sub-score includes a complementarity ratio or correction score of the second HLA typing tool to the first HLA typing tool, and the second sub-score includes the complementary score of the first HLA typing tool to the second HLA typing tool. It can include ratios or correction scores.
일 실시예에서, 도 5에서 도시되는 바와 같이, 2개의 대응되는 HLA 타이핑 툴들에 대해서 1개의 상호 보완 스코어의 값이 산출될 수 있다.In one embodiment, as shown in FIG. 5 , a value of one complementary score may be calculated for two corresponding HLA typing tools.
예를 들어, A라는 HLA 타이핑 툴과 B라는 HLA 타이핑 툴의 상호 보완 스코어는, A라는 HLA 타이핑 툴에 대한 B라는 HLA 타이핑 툴의 상호 보완 비율과 B라는 HLA 타이핑 툴에 대한 A라는 HLA 타이핑 툴의 상호 보완 비율에 기초하여 결정될 수 있다. For example, the complementarity scores of HLA typing tool A and HLA typing tool B are the complementarity ratio of HLA typing tool B to HLA typing tool A and HLA typing tool A to HLA typing tool B. It can be determined based on the mutual complement ratio of
일례로, A와 B의 상호 보완 스코어는 A에 대한 B의 상호 보완 비율과 B에 대한 A의 상호 보완 비율을 합산한 것에 기초하여 결정될 수 있다.For example, the complementary score of A and B may be determined based on the sum of the complementary ratio of B to A and the complementary ratio of A to B.
일례로, A와 B의 상호 보완 스코어는 A에 대한 B의 상호 보완 비율과 B에 대한 A의 상호 보완 비율의 평균을 의미할 수도 있다. For example, the complementarity score of A and B may mean the average of the complementarity ratio of B to A and the complementarity of A to B.
본 개시의 일 실시예에서, A라는 HLA 타이핑 툴, B라는 HLA 타이핑 툴, C라는 HLA 타이핑 툴 및 D라는 HLA 타이핑 툴을 포함하는 총 4개의 HLA 타이핑 툴들이 HLA 타이핑 결과를 도출하는데 조합된다고 가정한다. 또한, 이러한 4개의 HLA 타이핑 툴들 각각에 대해서는 고유의 정확성 값이 맵핑되어 있다. 이러한 경우, AB, AC, AD, BC 및 CD를 포함하는 총 5개의 HLA 타이핑 툴들에 대한 조합이 결정될 수 있다. 또한, 이러한 5개의 조합들 각각에 대해서는 사전 결정된 상호 보완 스코어가 할당될 수 있다. 즉, 5개의 조합들에 대해서 총 5개의 상호 보완 스코어가 결정될 수 있다. In one embodiment of the present disclosure, it is assumed that a total of four HLA typing tools including HLA typing tool A, HLA typing tool B, HLA typing tool C, and HLA typing tool D are combined to derive an HLA typing result. do. In addition, a unique accuracy value is mapped to each of these four HLA typing tools. In this case, combinations for a total of five HLA typing tools including AB, AC, AD, BC, and CD may be determined. In addition, a predetermined complementary score may be assigned to each of these five combinations. That is, a total of five complementary scores may be determined for the five combinations.
이러한 가정 하에서, 컴퓨팅 장치(100)는 4개의 HLA 타이핑 툴들 각각에 할당된 정확성 값들과 상기 HLA 타이핑 툴들의 5개의 조합들 각각에 할당된 상호 보완 스코어에 기초하여, 상기 4개의 HLA 타이핑 툴들로부터 획득된 콜들에서의 결과 중 무엇을 최종 HLA 타이핑 결과로 선정할 지 여부를 결정할 수 있다. 또는, 대해서 총 5개의 상호 보완 스코어가 결정될 수 있다. Under these assumptions, the
이러한 가정 하에서, 컴퓨팅 장치(100)는 4개의 HLA 타이핑 툴들 각각에 할당된 정확성 값들과 상기 HLA 타이핑 툴들의 5개의 조합들 각각에 할당된 상호 보완 스코어에 기초하여, 상기 4개의 HLA 타이핑 툴들로부터 획득된 콜들을 조합할지 여부 그리고/또는 조합을 한다면 어떻게 할지를 결정할 수 있다.Under these assumptions, the
일 실시예에서, 상기 HLA 타이핑 툴들의 5개의 조합들 각각에 할당된 상호 보완 스코어는 도 5에서 도시되는 예시적인 표로부터 획득될 수 있다.In one embodiment, the complementarity score assigned to each of the five combinations of HLA typing tools can be obtained from the exemplary table shown in FIG. 5 .
일례로, 컴퓨팅 장치(100)는 A, B, C 및 D 각각에 할당된 정확성값들을 포함하는 제 1 인자, 그리고 AB, AC, AD, BC 및 CD 각각에 할당된 상호 보완 스코어의 평균을 포함하는 제 2 인자에 기초하여, 상기 4개의 HLA 타이핑 툴들로부터 획득된 콜들에서의 결과를 최종 HLA 타이핑 결과로 선정할 지 여부를 결정할 수 있다.In one example, the
일례로, 컴퓨팅 장치(100)는 A, B, C 및 D 각각에 할당된 정확성값들을 포함하는 제 1 인자, 그리고 AB, AC, AD, BC 및 CD 각각에 할당된 상호 보완 스코어의 평균과 총 HLA 타이핑 툴의 개수인 K(예컨대 4)를 연산한 제 2 인자에 기초하여, 상기 4개의 HLA 타이핑 툴들로부터 획득된 콜들에서의 결과를 최종 HLA 타이핑 결과로 선정할 지 여부를 결정할 수 있다.In one example, the
다른 예시로, 컴퓨팅 장치(100)는 AB, AC, AD, BC 및 CD 각각에 할당된 상호 보완 스코어의 총 합산값을 조합들의 개수로 나눈 중간값을 총 HLA 타이핑 툴의 개수인 K 횟수(예컨대, 4) 만큼 곱한 제 2 인자와 A, B, C 및 D 각각에 할당된 정확성값들을 포함하는 제 1 인자 간의 곱셈 연산에 기초하여, 상기 4개의 HLA 타이핑 툴들로부터 획득된 콜들에서의 결과를 최종 HLA 타이핑 결과로 선정할 지 여부를 결정할 수 있다.As another example, the
위의 수학식 1은 본 개시의 일 실시예에 따라 복수개의 HLA 타이핑 툴들의 결과를 조합할지 여부를 결정하기 위한 예시적인 계산식을 나타낸다. 추가적으로 수학식 1은 본 개시의 일 실시예에 따라 복수개의 HLA 타이핑 툴들을 조합하였을 경우의 HLA 타이핑 결과에 대한 정확성을 결정하기 위한 예시적인 계산식으로 사용될 수도 있다. 수학식 1은 예시적인 목적으로 사용된 것이며, 구현의 양태에 따라 복수의 HLA 타이핑 툴들 각각의 정확성 정보 및 복수의 HLA 타이핑 툴들 간의 상호 보완 스코어를 인자로 사용하는 다양한 형태의 수학식 또는 계산 알고리즘이 사용될 수 있다.Equation 1 above represents an exemplary calculation formula for determining whether to combine results of a plurality of HLA typing tools according to an embodiment of the present disclosure. Additionally, Equation 1 may be used as an exemplary calculation formula for determining the accuracy of an HLA typing result when a plurality of HLA typing tools are combined according to an embodiment of the present disclosure. Equation 1 is used for illustrative purposes, and various types of equations or calculation algorithms using the accuracy information of each of the plurality of HLA typing tools and the mutual complement scores between the plurality of HLA typing tools as factors according to implementation aspects can be used
상기 수학식 1에서, k는 사용되는 HLA 타이핑 툴들의 개수를 나타내며, n은 HLA 타이핑 툴들 간의 조합의 개수를 나타내며, Acc는 HLA 타이핑 툴들 각각에 할당된 정확성 값을 나타내며, 그리고 Valuecor은 HLA 타이핑 툴들의 조합에 대응하는 상호 보완 스코어를 나타낸다.In Equation 1, k represents the number of HLA typing tools used, n represents the number of combinations between HLA typing tools, Acc represents an accuracy value assigned to each of the HLA typing tools, and Value cor represents HLA typing Indicates a complementary score corresponding to a combination of tools.
전술한 수학식 1은 HLA 타이핑 툴들 각각의 정확성 정보와 HLA 타이핑 툴들 간의 조합의 상호 보완스코어 정보를 이용하여, HLA 타입을 결정하는데 사용되는 HLA 타이핑 툴들의 조합에 대한 최종 정확성 값을 산출하는데 사용될 수 있다. 일례로, 컴퓨팅 장치(100)는 전술한 수학식 1에 따른 최종 정확성 값과 사전결정된 임계값(예컨대, 99.8% 등의 값)을 비교하여, 복수의 HLA 타이핑 툴들을 조합할 지 여부 그리고/또는 복수의 HLA 타이핑 툴들로부터 획득된 HLA 타이핑 결과에 대한 신뢰도를 결정할 수 있다.Equation 1 described above can be used to calculate a final accuracy value for a combination of HLA typing tools used to determine an HLA type, using accuracy information of each of the HLA typing tools and complementary score information of a combination of the HLA typing tools. there is. For example, the
다른 예시로, 컴퓨팅 장치(100)는 전술한 수학식 1에 따른 알고리즘에 기초하여, 복수의 HLA 타이핑 툴들로부터 획득된 콜들에 대한 조합 여부를 결정할 수 있다. 다른 예시로, 컴퓨팅 장치(100)는 전술한 수학식 1에 따른 알고리즘에 기초하여, 복수의 HLA 타이핑 툴들로부터 획득된 콜들에 대한 가중치를 결정함으로써 최종 HLA 타입 결과를 결정할 수 있다.As another example, the
다른 예시로, 컴퓨팅 장치(100)는 전술한 수학식 1에 따른 알고리즘에 기초하여, 복수의 HLA 타이핑 툴들로부터 획득된 콜들에 포함된 HLA 타입 후보 값들 중 최종 HLA 타입으로 결정될 HLA 타입 후보가 무엇인지를 결정할 수 있다.As another example, the
전술한 바와 같이, 본 개시내용의 일 실시예에 따른 HLA 타이핑 방법은 복수의 HLA 타이핑 툴들을 이용하되, 복수의 HLA 타이핑 툴들 간의 상호 보완 스코어에 기초하여 복수의 HLA 타이핑 툴들로부터 획득되는 콜들로부터 보다 정확한 HLA 타이핑 결과를 획득할 수 있다.As described above, the HLA typing method according to an embodiment of the present disclosure uses a plurality of HLA typing tools, but obtains a higher score from calls obtained from a plurality of HLA typing tools based on a complementary score between the plurality of HLA typing tools. Accurate HLA typing results can be obtained.
일 실시예에서, 상호 보완 스코어의 값이 1보다 크다는 것은 것과 조합하였을 때 자신에 내재된 정확성을 능가(outperform)한다는 것을 의미할 수 있다.In one embodiment, the value of the complementarity score greater than 1 may mean that it outperforms its inherent accuracy when combined with.
본 개시내용의 추가적인 실시예에서, 전술한 HLA 타이핑 기법에 의해 HLA 타입이 결정되지 못한 경우, 컴퓨팅 장치(100)는 피검체 유래의 생물학적 시료에서 DNA 또는 RNA를 추출하여 PCR-SBT (Polymerase Chain Reaction-Sequencing Based Typing)를 실시할 수도 있다. 다른 예시로, 컴퓨팅 장치는 다른 엔티티에 의해 실행된 PCR-SBT의 실시 결과를 획득하는 방식으로 해당 결과를 얻을 수도 있다. 본 개시내용의 일 실시예에서 전술한 알고리즘에 의해 HLA 타입이 결정되지 못한 경우는, 콜에 포함된 HLA 타입의 일치도가 낮거나 혹은 상호 보완 스코어를 고려하여도 HLA 타이핑 결과에 대한 확신도가 사전결정된 임계치 미만인 상황에 해당할 수 있다. 이러한 경우, 해당 알고리즘이 출력하는 HLA 타이핑의 정확도가 떨어진다는 것을 의미할 수 있다. 이러한 경우에는 추가적인 PCR-SBT를 수행함으로써 HLA 타입 판단의 정확도를 높이는 것이 바람직할 수 있다.In a further embodiment of the present disclosure, when the HLA type is not determined by the above-described HLA typing technique, the
본 개시내용에서, 상기 PCR-SBT는 추가적인 HLA 유전자형 정보가 필요하거나 PCR-SSP 검사 결과의 판정이 애매한 상황에서 보조 검사로 이용될 수 있다. PCR-SSO 또는 RFLP의 단점은 두 대립 유전자 간의 DNA 서열에서 단일 염기 차이를 감지할 수 있지만, 변이가 프로브에 의해 감지된 특정 부위에서 발생하지 않는 한 새로운 정의되지 않은 대립 유전자를 감지할 가능성이 적다는 것이다. PCR-SBT는 원래 수동 시퀀싱 방법으로 개발되었으며 염료 라벨이 붙은 프라이머와 형광 자동 시퀀싱의 도입으로 자동화가 가능해지고 정확도가 크게 향상되었다. PCR-SBT는 대립 유전자의 염기 서열을 직접 검출하는 기술로, 정확도가 우수하지만, 시간이 오래 걸리고 비용이 비싸며 검체 처리량이 적은 단점이 있다.In the present disclosure, the PCR-SBT can be used as an auxiliary test in situations where additional HLA genotype information is required or the determination of PCR-SSP test results is ambiguous. A disadvantage of PCR-SSO or RFLP is that it can detect single-base differences in the DNA sequence between two alleles, but it is less likely to detect a new, undefined allele unless the mutation occurs at a specific site detected by the probe. It is. PCR-SBT was originally developed as a manual sequencing method, and the introduction of dye-labeled primers and fluorescence automated sequencing enabled automation and greatly improved accuracy. PCR-SBT is a technology that directly detects the nucleotide sequence of an allele, and has excellent accuracy, but it takes a long time, is expensive, and has a low sample throughput.
본 개시내용에서, PCR은 실시간 PCR일 수 있으며, 보다 구체적으로 단일 PCR 또는 멀티플렉스 PCR일 수 있으나, 이에 제한되는 것은 아니다. 본 발명에서 상기 단일 또는 멀티플렉스 실시간 PCR 반응 조건은 통상적인 조건을 취할 수 있다. 또한, 단일 실시간 PCR과 멀티플렉스 실시간 PCR 반응은 동일한 조건으로 수행될 수 있으며, 일 예로 초기 변성(initial denaturation)을 95℃에서 1분간 수행한 후, 변성(denaturation, 95℃에서 25초), 어닐링(annealing, 65℃에서 45초) 및 연장(extension, 72℃에서 30초)을 총 40회 실시하는 조건을 취할 수 있다. 본 개시내용에 사용 가능한 실시간 PCR 기기로는 AB 사의 Real-time PCR 기기 7900, 7500, 7300, Roche 사의 LightCycler 80, Stratagene 사의 Mx3000p, 및 BioRad 사의 Chromo 4 기기 등이 있으나, 이는 예시적인 목적으로 기재되는 것일 뿐 PCR 기기의 특징과 PCR 반응에 대한 구체적인 설명으로 본 개시내용의 권리범위가 제한되는 것은 아니다.In the present disclosure, PCR may be real-time PCR, and more specifically, single PCR or multiplex PCR, but is not limited thereto. In the present invention, the single or multiplex real-time PCR reaction conditions may take conventional conditions. In addition, single real-time PCR and multiplex real-time PCR reactions can be performed under the same conditions. For example, initial denaturation is performed at 95 ° C for 1 minute, followed by denaturation (25 seconds at 95 ° C) and annealing (annealing, 45 seconds at 65 ° C.) and extension (extension, 30 seconds at 72 ° C.) may be performed a total of 40 times. Real-time PCR devices usable in the present disclosure include Real-time PCR devices 7900, 7500, and 7300 from AB, LightCycler 80 from Roche, Mx3000p from Stratagene, and Chromo 4 devices from BioRad, which are described for illustrative purposes. However, the scope of the present disclosure is not limited to specific descriptions of the characteristics of the PCR device and the PCR reaction.
본 개시내용에서, 상기 PCR은 PCR-SSOP (PCR sequence-specific oligonucleotide probes) 또는 PCR-SBT (PCR sequencing-based typing)일 수 있으나, 이에 제한되는 것은 아니다.In the present disclosure, the PCR may be PCR-SSOP (PCR sequence-specific oligonucleotide probes) or PCR-SBT (PCR sequencing-based typing), but is not limited thereto.
도 6은 본 개시내용의 일 실시예에 따른 컴퓨팅 환경의 개략도이다.6 is a schematic diagram of a computing environment according to one embodiment of the present disclosure.
본 개시내용에서의 컴포넌트, 모듈 또는 부(unit)는 특정의 태스크를 수행하거나 특정의 추상 데이터 유형을 구현하는 루틴, 프로시져, 프로그램, 컴포넌트, 데이터 구조 등을 포함한다. 또한, 당업자라면 본 개시내용에서 제시되는 방법들이 단일-프로세서 또는 멀티프로세서 컴퓨팅 장치, 미니컴퓨터, 메인프레임 컴퓨터는 물론 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 장치, 마이크로프로세서-기반 또는 프로그램가능 가전 제품, 기타 등등(이들 각각은 하나 이상의 연관된 장치와 연결되어 동작할 수 있음)을 비롯한 다른 컴퓨터 시스템 구성으로 실시될 수 있다는 것을 충분히 인식할 것이다.A component, module or unit in this disclosure includes routines, procedures, programs, components, data structures, etc. that perform particular tasks or implement particular abstract data types. In addition, those skilled in the art will understand that the methods presented in this disclosure can be used in single-processor or multiprocessor computing devices, minicomputers, mainframe computers as well as personal computers, handheld computing devices, microprocessor-based or programmable consumer electronics, and the like ( It will be fully appreciated that each of these may be implemented with other computer system configurations, including those that may be operative in connection with one or more associated devices.
본 개시내용에서 설명된 실시예들은 또한 어떤 태스크들이 통신 네트워크를 통해 연결되어 있는 원격 처리 장치들에 의해 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치 둘다에 위치할 수 있다.Embodiments described in this disclosure may also be practiced in distributed computing environments where certain tasks are performed by remote processing devices that are linked through a communications network. In a distributed computing environment, program modules may be located in both local and remote memory storage devices.
컴퓨팅 장치는 통상적으로 다양한 컴퓨터 판독가능 매체를 포함한다. 컴퓨터에 의해 액세스 가능한 매체는 그 어떤 것이든지 컴퓨터 판독가능 매체가 될 수 있고, 이러한 컴퓨터 판독가능 매체는 휘발성 및 비휘발성 매체, 일시적(transitory) 및 비일시적(non-transitory) 매체, 이동식 및 비-이동식 매체를 포함한다. 제한이 아닌 예로서, 컴퓨터 판독가능 매체는 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다.A computing device typically includes a variety of computer readable media. Computer readable media can be any medium that can be accessed by a computer, including volatile and nonvolatile media, transitory and non-transitory media, removable and non-transitory media. Includes removable media. By way of example, and not limitation, computer readable media may include computer readable storage media and computer readable transmission media.
컴퓨터 판독가능 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보를 저장하는 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성 매체, 일시적 및 비-일시적 매체, 이동식 및 비이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital video disk) 또는 기타 광 디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨터에 의해 액세스될 수 있고 원하는 정보를 저장하는 데 사용될 수 있는 임의의 기타 매체를 포함하지만, 이에 한정되지 않는다.Computer readable storage media are volatile and nonvolatile media, transitory and non-transitory, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data. includes media Computer readable storage media may include RAM, ROM, EEPROM, flash memory or other memory technology, CD-ROM, digital video disk (DVD) or other optical disk storage device, magnetic cassette, magnetic tape, magnetic disk storage device or other magnetic storage device. device, or any other medium that can be accessed by a computer and used to store desired information.
컴퓨터 판독가능 전송 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 피변조 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터 등을 구현하고 모든 정보 전달 매체를 포함한다. 피변조 데이터 신호라는 용어는 신호 내에 정보를 인코딩하도록 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 의미한다. 제한이 아닌 예로서, 컴퓨터 판독가능 전송 매체는 유선 네트워크 또는 직접 배선 접속(direct-wired connection)과 같은 유선 매체, 그리고 음향, RF, 적외선, 기타 무선 매체와 같은 무선 매체를 포함한다. 상술된 매체들 중 임의의 것의 조합도 역시 컴퓨터 판독가능 전송 매체의 범위 안에 포함되는 것으로 한다.A computer readable transmission medium typically embodies computer readable instructions, data structures, program modules or other data in a modulated data signal such as a carrier wave or other transport mechanism. Including all information delivery media. The term modulated data signal means a signal that has one or more of its characteristics set or changed so as to encode information within the signal. By way of example, and not limitation, computer readable transmission media includes wired media such as a wired network or direct-wired connection, and wireless media such as acoustic, RF, infrared, and other wireless media. Combinations of any of the above are also intended to be included within the scope of computer readable transmission media.
컴퓨터(2002)를 포함하는 본 발명의 여러가지 측면들을 구현하는 예시적인 환경(2000)이 나타내어져 있으며, 컴퓨터(2002)는 처리 장치(2004), 시스템 메모리(2006) 및 시스템 버스(2008)를 포함한다. 본 명세서에서의 컴퓨터(200)는 컴퓨팅 장치와 상호 교환가능하게 사용될 수 있다. 시스템 버스(2008)는 시스템 메모리(2006)(이에 한정되지 않음)를 비롯한 시스템 컴포넌트들을 처리 장치(2004)에 연결시킨다. 처리 장치(2004)는 다양한 상용 프로세서들 중 임의의 프로세서일 수 있다. 듀얼 프로세서 및 기타 멀티프로세서 아키텍처도 역시 처리 장치(2004)로서 이용될 수 있다.An exemplary environment 2000 implementing various aspects of the present invention is shown comprising a
시스템 버스(2008)는 메모리 버스, 주변장치 버스, 및 다양한 상용 버스 아키텍처 중 임의의 것을 사용하는 로컬 버스에 추가적으로 상호 연결될 수 있는 몇가지 유형의 버스 구조 중 임의의 것일 수 있다. 시스템 메모리(2006)는 판독 전용 메모리(ROM)(2010) 및 랜덤 액세스 메모리(RAM)(2012)를 포함한다. 기본 입/출력 시스템(BIOS)은 ROM, EPROM, EEPROM 등의 비휘발성 메모리(2010)에 저장되며, 이 BIOS는 시동 중과 같은 때에 컴퓨터(2002) 내의 구성요소들 간에 정보를 전송하는 일을 돕는 기본적인 루틴을 포함한다. RAM(2012)은 또한 데이터를 캐싱하기 위한 정적 RAM 등의 고속 RAM을 포함할 수 있다.
컴퓨터(2002)는 또한 내장형 하드 디스크 드라이브(HDD)(2014)(예를 들어, EIDE, SATA), 자기 플로피 디스크 드라이브(FDD)(2016)(예를 들어, 이동식 디스켓(2018)으로부터 판독을 하거나 그에 기록을 하기 위한 것임), SSD 및 광 디스크 드라이브(2020)(예를 들어, CD-ROM 디스크(2022)를 판독하거나 DVD 등의 기타 고용량 광 매체로부터 판독을 하거나 그에 기록을 하기 위한 것임)를 포함한다. 하드 디스크 드라이브(2014), 자기 디스크 드라이브(2016) 및 광 디스크 드라이브(2020)는 각각 하드 디스크 드라이브 인터페이스(2024), 자기 디스크 드라이브 인터페이스(2026) 및 광 드라이브 인터페이스(2028)에 의해 시스템 버스(2008)에 연결될 수 있다. 외장형 드라이브 구현을 위한 인터페이스(2024)는 예를 들어, USB(Universal Serial Bus) 및 IEEE 1394 인터페이스 기술 중 적어도 하나 또는 그 둘 다를 포함한다.The
이들 드라이브 및 그와 연관된 컴퓨터 판독가능 매체는 데이터, 데이터 구조, 컴퓨터 실행가능 명령어, 기타 등등의 비휘발성 저장을 제공한다. 컴퓨터(2002)의 경우, 드라이브 및 매체는 임의의 데이터를 적당한 디지털 형식으로 저장하는 것에 대응한다. 상기에서의 컴퓨터 판독가능 저장 매체에 대한 설명이 HDD, 이동식 자기 디스크, 및 CD 또는 DVD 등의 이동식 광 매체를 언급하고 있지만, 당업자라면 집 드라이브(zip drive), 자기 카세트, 플래쉬 메모리 카드, 카트리지, 기타 등등의 컴퓨터에 의해 판독가능한 다른 유형의 저장 매체도 역시 예시적인 운영 환경에서 사용될 수 있으며 또 임의의 이러한 매체가 본 발명의 방법들을 수행하기 위한 컴퓨터 실행가능 명령어를 포함할 수 있다는 것을 잘 알 것이다.These drives and their associated computer readable media provide non-volatile storage of data, data structures, computer executable instructions, and the like. In the case of
운영 체제(2030), 하나 이상의 어플리케이션 프로그램(2032), 기타 프로그램 모듈(2034) 및 프로그램 데이터(2036)를 비롯한 다수의 프로그램 모듈이 드라이브 및 RAM(2012)에 저장될 수 있다. 운영 체제, 어플리케이션, 모듈 및/또는 데이터의 전부 또는 그 일부분이 또한 RAM(2012)에 캐싱될 수 있다. 본 발명이 여러가지 상업적으로 이용가능한 운영 체제 또는 운영 체제들의 조합에서 구현될 수 있다는 것을 잘 알 것이다.A number of program modules may be stored on the drive and
사용자는 하나 이상의 유선/무선 입력 장치, 예를 들어, 키보드(2038) 및 마우스(2040) 등의 포인팅 장치를 통해 컴퓨터(2002)에 명령 및 정보를 입력할 수 있다. 기타 입력 장치(도시 생략)로는 마이크, IR 리모콘, 조이스틱, 게임 패드, 스타일러스 펜, 터치 스크린, 기타 등등이 있을 수 있다. 이들 및 기타 입력 장치가 종종 시스템 버스(2008)에 연결되어 있는 입력 장치 인터페이스(2042)를 통해 처리 장치(2004)에 연결되지만, 병렬 포트, IEEE 1394 직렬 포트, 게임 포트, USB 포트, IR 인터페이스, 기타 등등의 기타 인터페이스에 의해 연결될 수 있다.A user may enter commands and information into the
모니터(2044) 또는 다른 유형의 디스플레이 장치도 역시 비디오 어댑터(2046) 등의 인터페이스를 통해 시스템 버스(2008)에 연결된다. 모니터(2044)에 부가하여, 컴퓨터는 일반적으로 스피커, 프린터, 기타 등등의 기타 주변 출력 장치(도시 생략)를 포함한다.A
컴퓨터(2002)는 유선 및/또는 무선 통신을 통한 원격 컴퓨터(들)(2048) 등의 하나 이상의 원격 컴퓨터로의 논리적 연결을 사용하여 네트워크화된 환경에서 동작할 수 있다. 원격 컴퓨터(들)(2048)는 워크스테이션, 서버 컴퓨터, 라우터, 퍼스널 컴퓨터, 휴대용 컴퓨터, 마이크로프로세서-기반 오락 기기, 피어 장치 또는 기타 통상의 네트워크 노드일 수 있으며, 일반적으로 컴퓨터(2002)에 대해 기술된 구성요소들 중 다수 또는 그 전부를 포함하지만, 간략함을 위해, 메모리 저장 장치(2050)만이 도시되어 있다. 도시되어 있는 논리적 연결은 근거리 통신망(LAN)(2052) 및/또는 더 큰 네트워크, 예를 들어, 원거리 통신망(WAN)(2054)에의 유선/무선 연결을 포함한다. 이러한 LAN 및 WAN 네트워킹 환경은 사무실 및 회사에서 일반적인 것이며, 인트라넷 등의 전사적 컴퓨터 네트워크(enterprise-wide computer network)를 용이하게 해주며, 이들 모두는 전세계 컴퓨터 네트워크, 예를 들어, 인터넷에 연결될 수 있다.
LAN 네트워킹 환경에서 사용될 때, 컴퓨터(2002)는 유선 및/또는 무선 통신 네트워크 인터페이스 또는 어댑터(2056)를 통해 로컬 네트워크(2052)에 연결된다. 어댑터(2056)는 LAN(2052)에의 유선 또는 무선 통신을 용이하게 해줄 수 있으며, 이 LAN(2052)은 또한 무선 어댑터(2056)와 통신하기 위해 그에 설치되어 있는 무선 액세스 포인트를 포함하고 있다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(2002)는 모뎀(2058)을 포함할 수 있거나, WAN(2054) 상의 통신 서버에 연결되거나, 또는 인터넷을 통하는 등, WAN(2054)을 통해 통신을 정하는 기타 수단을 갖는다. 내장형 또는 외장형 및 유선 또는 무선 장치일 수 있는 모뎀(2058)은 직렬 포트 인터페이스(2042)를 통해 시스템 버스(2008)에 연결된다. 네트워크화된 환경에서, 컴퓨터(2002)에 대해 설명된 프로그램 모듈들 또는 그의 일부분이 원격 메모리/저장 장치(2050)에 저장될 수 있다. 도시된 네트워크 연결이 예시적인 것이며 컴퓨터들 사이에 통신 링크를 설정하는 기타 수단이 사용될 수 있다는 것을 잘 알 것이다.When used in a LAN networking environment,
컴퓨터(1602)는 무선 통신으로 배치되어 동작하는 임의의 무선 장치 또는 개체, 예를 들어, 프린터, 스캐너, 데스크톱 및/또는 휴대용 컴퓨터, PDA(portable data assistant), 통신 위성, 무선 검출가능 태그와 연관된 임의의 장비 또는 장소, 및 전화와 통신을 하는 동작을 한다. 이것은 적어도 Wi-Fi 및 블루투스 무선 기술을 포함한다. 따라서, 통신은 종래의 네트워크에서와 같이 미리 정의된 구조이거나 단순하게 적어도 2개의 장치 사이의 애드혹 통신(ad hoc communication)일 수 있다.Computer 1602 is any wireless device or entity that is deployed and operating in wireless communication, such as printers, scanners, desktop and/or portable computers, portable data assistants (PDAs), communication satellites, and associated with wireless detectable tags. It operates to communicate with arbitrary equipment or places and telephones. This includes at least Wi-Fi and Bluetooth wireless technologies. Thus, the communication may be a predefined structure as in conventional networks or simply an ad hoc communication between at least two devices.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 개시내용의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 본 개시내용의 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.It is to be understood that the specific order or hierarchy of steps in the processes presented is an example of example approaches. Based upon design priorities, it is to be understood that the specific order or hierarchy of steps in the processes may be rearranged within the scope of the present disclosure. The method claims of this disclosure present elements of the various steps in a sample order, but are not meant to be limited to the specific order or hierarchy presented.
Claims (18)
피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 염기 서열 분석 결과를 획득하는 단계; 및
상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑(typing) 알고리즘들로부터 획득되는 타이핑 결과들에 상호 보완 스코어를 보정값으로서 적용한 보정된 타이핑 결과를 이용하여, 상기 생물학적 시료에 대한 HLA 타입을 결정하는 단계;
를 포함하며,
상기 상호 보완 스코어는:
상기 염기 서열 분석을 입력받은 복수의 HLA 타이핑 알고리즘들이 상기 HLA 타입을 결정하는데 함께 이용될 수 있는 가능성을 정량적으로 나타내는 제 1 값;
상기 염기 서열 분석을 입력받은 복수의 HLA 타이핑 알고리즘들 중 어느 하나의 HLA 타이핑 알고리즘을 사용하였을 때에 비해, 다른 HLA 타이핑 알고리즘을 함께 사용하였을 때의 상기 결정되는 HLA 타입의 신뢰도를 얼마나 높여줄 지를 정량적으로 나타내는 제 2 값; 또는
상기 염기 서열 분석을 입력받은 복수의 HLA 타이핑 알고리즘들이 함께 사용되었을 때의, 상기 결정되는 HLA 타입의 정확성을 정량적으로 나타내는 제 3 값;
중 적어도 하나를 포함하는,
방법.A method for determining the type of Human Leukocyte Antigen (HLA) performed by a computing device, comprising:
Obtaining a nucleotide sequencing result obtained by performing nucleotide sequencing on DNA or RNA obtained from a biological sample derived from a subject; and
Determine the HLA type of the biological sample by using a corrected typing result obtained by applying a mutual complement score as a correction value to typing results obtained from a plurality of HLA typing algorithms that take the sequencing result as an input doing;
Including,
The complementary score is:
a first value quantitatively representing the possibility that a plurality of HLA typing algorithms received through the sequencing analysis can be used together to determine the HLA type;
Quantitatively, how much the reliability of the determined HLA type will be increased when another HLA typing algorithm is used together, compared to when any one HLA typing algorithm among a plurality of HLA typing algorithms received through the base sequence analysis is used. a second value representing; or
a third value quantitatively indicating the accuracy of the determined HLA type when a plurality of HLA typing algorithms received through the base sequence analysis are used together;
including at least one of
method.
상기 HLA 타입을 결정하는 단계는,
상기 복수개의 HLA 타이핑 알고리즘들 중에서 타이핑 결과를 제시한 HLA 타이핑 알고리즘의 개수를 결정하는 단계; 및
상기 타이핑 결과를 제시한 HLA 타이핑 알고리즘의 개수와 상기 HLA 타입을 결정하기 위한 기준이 상호 연관되는 방식을 추가적으로 이용하여, 상기 HLA 타입을 결정하는 단계;
를 포함하는,
방법.
According to claim 1,
Determining the HLA type,
determining the number of HLA typing algorithms presenting a typing result among the plurality of HLA typing algorithms; and
determining the HLA type by additionally using a method in which the number of HLA typing algorithms presenting the typing result and a criterion for determining the HLA type are mutually correlated;
including,
method.
상기 HLA 타입을 결정하는 단계는,
상기 복수개의 HLA 타이핑 알고리즘들 중에서 타이핑 결과를 제시한 HLA 타이핑 알고리즘의 개수를 결정하는 단계;
제시된 타이핑 결과들에 포함된 HLA 타입 후보들 간의 일치하는 정도를 정량적으로 나타내는 일치도를 계산하는 단계; 및
상기 결정된 HLA 타이핑 알고리즘의 개수 및 상기 계산된 일치도를 추가적으로 이용하여, 상기 HLA 타입을 결정하는 단계;
를 포함하는,
방법.According to claim 1,
Determining the HLA type,
determining the number of HLA typing algorithms presenting a typing result among the plurality of HLA typing algorithms;
Calculating a degree of agreement quantitatively indicating a degree of agreement between HLA type candidates included in the presented typing results; and
determining the HLA type by additionally using the determined number of HLA typing algorithms and the calculated degree of agreement;
including,
method.
상기 복수개의 HLA 타이핑 알고리즘들 중 제 1 HLA 타이핑 알고리즘과 제 2 HLA 타이핑 알고리즘 간의 상호 보완 스코어는,
상기 생물학적 시료에 대하여 상기 제 1 HLA 타이핑 알고리즘으로부터 획득된 제 1 타이핑 결과가 틀렸을 때, 상기 생물학적 시료에 대하여 상기 제 2 HLA 타이핑 알고리즘으로부터 획득된 제 2 타이핑 결과의 정확성을 정량적으로 나타내는 값을 더 포함하는,
방법.According to claim 1,
The complementary score between the first HLA typing algorithm and the second HLA typing algorithm among the plurality of HLA typing algorithms,
Further comprising a value quantitatively indicating accuracy of a second typing result obtained from the second HLA typing algorithm for the biological sample when the first typing result obtained from the first HLA typing algorithm for the biological sample is incorrect doing,
method.
상기 HLA 타입을 결정하는 단계는,
상기 복수개의 HLA 타이핑 알고리즘들 중 제 1 HLA 타이핑 알고리즘으로부터 획득된 제 1 타이핑 결과와 제 2 HLA 타이핑 알고리즘으로부터 획득된 제 2 타이핑 결과를 조합할지 여부를 상기 제 1 HLA 타이핑 알고리즘과 상기 제 2 HLA 타이핑 알고리즘 간의 제 1 상호 보완 스코어와 사전결정된 임계값을 비교하는 것에 기초하여 결정하는 단계; 및
상기 제 1 상호 보완 스코어가 상기 사전결정된 임계값을 초과하는 경우, 상기 제 1 타이핑 결과와 상기 제 2 타이핑 결과를 조합하여, 상기 HLA 타입을 결정하는 단계;
를 포함하며, 그리고
상기 제 1 상호 보완 스코어는 상기 제 1 값, 상기 제 2 값 또는 상기 제 3 값 중 적어도 하나를 포함하는,
방법.
According to claim 1,
Determining the HLA type,
Whether to combine a first typing result obtained from a first HLA typing algorithm and a second typing result obtained from a second HLA typing algorithm among the plurality of HLA typing algorithms is determined by the first HLA typing algorithm and the second HLA typing algorithm. making a decision based on comparing the first inter-algorithm complementary score to a predetermined threshold; and
determining the HLA type by combining the first typing result and the second typing result when the first complementary score exceeds the predetermined threshold;
includes, and
The first complementary score includes at least one of the first value, the second value, or the third value,
method.
상기 HLA 타입을 결정하는 단계는,
상기 복수개의 HLA 타이핑 알고리즘들 중 제 1 HLA 타이핑 알고리즘으로부터 획득된 제 1 타이핑 결과와 제 2 HLA 타이핑 알고리즘으로부터 획득된 제 2 타이핑 결과를 조합할지 여부를, 상기 제 1 HLA 타이핑 알고리즘과 상기 제 2 HLA 타이핑 알고리즘 간의 제 1 상호 보완 스코어, 상기 제 1 HLA 타이핑 알고리즘에 대한 사전 결정된 제 1 정확성 값 및 상기 제 2 HLA 타이핑 알고리즘에 대한 사전 결정된 제 2 정확성 값을 인자로 활용하는 함수의 결과와 사전결정된 임계값 간의 비교를 통해 결정하는 단계; 및
상기 제 1 타이핑 결과와 상기 제 2 타이핑 결과를 조합할지 여부에 대한 결정에 기초하여, 상기 제 1 타이핑 결과와 상기 제 2 타이핑 결과를 조합하거나 혹은 조합하지 않는 방식으로 상기 HLA 타입을 결정하는 단계;
를 포함하는,
방법.
According to claim 11,
Determining the HLA type,
Whether to combine the first typing result obtained from the first HLA typing algorithm and the second typing result obtained from the second HLA typing algorithm among the plurality of HLA typing algorithms, the first HLA typing algorithm and the second HLA A result of a function using a first complementary score between typing algorithms, a predetermined first accuracy value for the first HLA typing algorithm, and a predetermined second accuracy value for the second HLA typing algorithm as factors and a predetermined threshold determining through comparison between values; and
determining the HLA type by combining or not combining the first typing result and the second typing result, based on a determination as to whether to combine the first typing result and the second typing result;
including,
method.
상기 HLA 타입을 결정하는 단계는,
상기 복수개의 HLA 타이핑 알고리즘들 중 제 1 HLA 타이핑 알고리즘으로부터 획득된 제 1 타이핑 결과의 신뢰도 및 제 2 HLA 타이핑 알고리즘으로부터 획득된 제 2 타이핑 결과의 신뢰도에 적용될 보정값을 상기 제 1 HLA 타이핑 알고리즘과 상기 제 2 HLA 타이핑 알고리즘 간의 제 1 상호 보완 스코어에 기초하여 결정하는 단계; 및
상기 보정값에 기초하여 결정된 신뢰도에 기반하여, 상기 복수개의 HLA 타이핑 알고리즘들 중 상기 HLA 타입을 결정하는데 사용할 적어도 하나의 HLA 타이핑 알고리즘을 결정하는 단계;
를 포함하는,
방법.
According to claim 1,
Determining the HLA type,
A correction value to be applied to reliability of a first typing result obtained from a first HLA typing algorithm and reliability of a second typing result obtained from a second HLA typing algorithm among the plurality of HLA typing algorithms is determined by the first HLA typing algorithm and the Determining based on the first complementary score between the second HLA typing algorithms; and
determining at least one HLA typing algorithm to be used to determine the HLA type from among the plurality of HLA typing algorithms, based on the reliability determined based on the correction value;
including,
method.
상기 복수개의 HLA 타이핑 알고리즘들에 관련된 상호 보완 스코어에 적어도 부분적으로 기초하여, 상기 염기 서열 분석을 입력받은 복수의 HLA 타이핑 알고리즘들이 함께 사용되었을 때의 상기 복수개의 HLA 타이핑 알고리즘들의 조합들 각각에 대한 정확성 값을 결정하는 단계;
를 더 포함하는,
방법.According to claim 1,
Accuracy of each of the combinations of the plurality of HLA typing algorithms when the plurality of HLA typing algorithms received from the base sequence analysis are used together, based at least in part on a complementary score related to the plurality of HLA typing algorithms determining a value;
Including more,
method.
상기 상호 보완 스코어는,
상기 복수개의 HLA 타이핑 알고리즘들 중 제 1 HLA 타이핑 알고리즘으로부터의 제 1 타이핑 결과가 실제 결과와 일치하지 않는 경우 제 2 HLA 타이핑 알고리즘으로부터의 제 2 타이핑 결과가 상기 실제 결과와 일치하게될 가능성을 정량적으로 나타내는 제 1 서브 스코어;
상기 복수개의 HLA 타이핑 알고리즘들 중 제 2 HLA 타이핑 알고리즘으로부터의 제 2 타이핑 결과가 실제 결과와 일치하지 않는 경우 제 1 HLA 타이핑 알고리즘으로부터의 제 1 타이핑 결과가 상기 실제 결과와 일치하게될 가능성을 정량적으로 나타내는 제 2 서브 스코어;
상기 제 1 HLA 타이핑 알고리즘에 대해 사전 결정된 제 1 정확성 값; 및
상기 제 2 HLA 타이핑 알고리즘에 대해 사전 결정된 제 2 정확성 값;
에 기초하여 연산되는,
방법.
According to claim 1,
The mutual complement score,
When a first typing result from a first HLA typing algorithm among the plurality of HLA typing algorithms does not match an actual result, a probability that a second typing result from a second HLA typing algorithm matches the actual result is quantitatively determined. a first sub score indicating;
If the second typing result from the second HLA typing algorithm among the plurality of HLA typing algorithms does not match the actual result, the probability that the first typing result from the first HLA typing algorithm matches the actual result is quantitatively a second sub score indicating;
a first predetermined accuracy value for the first HLA typing algorithm; and
a second pre-determined precision value for the second HLA typing algorithm;
calculated based on
method.
상기 상호 보완 스코어에 기초하여, 상기 복수개의 HLA 타이핑 알고리즘들에 포함된 알고리즘들 간의 HLA 타이핑 방식에 대한 유사도를 결정하는 단계;
를 더 포함하는,
방법.
According to claim 1,
determining a degree of similarity of an HLA typing method between algorithms included in the plurality of HLA typing algorithms based on the complementary score;
Including more,
method.
피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 염기 서열 분석 결과를 획득하는 단계; 및
상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑(typing) 알고리즘들로부터 획득되는 타이핑 결과들에 상호 보완 스코어를 보정값으로서 적용한 보정된 타이핑 결과를 이용하여, 상기 생물학적 시료에 대한 HLA 타입을 결정하는 단계;
를 포함하며,
상기 상호 보완 스코어는:
상기 염기 서열 분석을 입력받은 복수의 HLA 타이핑 알고리즘들이 상기 HLA 타입을 결정하는데 함께 이용될 수 있는 가능성을 정량적으로 나타내는 제 1 값;
상기 염기 서열 분석을 입력받은 복수의 HLA 타이핑 알고리즘들 중 어느 하나의 HLA 타이핑 알고리즘을 사용하였을 때에 비해, 다른 HLA 타이핑 알고리즘을 함께 사용하였을 때의 상기 결정되는 HLA 타입의 신뢰도를 얼마나 높여줄 지를 정량적으로 나타내는 제 2 값; 또는
상기 염기 서열 분석을 입력받은 복수의 HLA 타이핑 알고리즘들이 함께 사용되었을 때의, 상기 결정되는 HLA 타입의 정확성을 정량적으로 나타내는 제 3 값;
중 적어도 하나를 포함하는,
를 포함하는,
컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.
A computer program stored on a computer readable storage medium that, when executed by one or more processors, performs a method for determining a type of Human Leukocyte Antigen (HLA), the method comprising:
Obtaining a nucleotide sequencing result obtained by performing nucleotide sequencing on DNA or RNA obtained from a biological sample derived from a subject; and
Determine the HLA type of the biological sample by using a corrected typing result obtained by applying a mutual complement score as a correction value to typing results obtained from a plurality of HLA typing algorithms that take the sequencing result as an input doing;
Including,
The complementary score is:
a first value quantitatively representing the possibility that a plurality of HLA typing algorithms received through the sequencing analysis can be used together to determine the HLA type;
Quantitatively, how much the reliability of the determined HLA type will be increased when another HLA typing algorithm is used together, compared to when any one HLA typing algorithm among a plurality of HLA typing algorithms received through the base sequence analysis is used. a second value representing; or
a third value quantitatively indicating the accuracy of the determined HLA type when a plurality of HLA typing algorithms received through the base sequence analysis are used together;
including at least one of
including,
A computer program stored on a computer readable storage medium.
메모리; 및
프로세서를 포함하며,
상기 프로세서는:
피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 염기 서열 분석 결과를 획득하고; 그리고
상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑(typing) 알고리즘들로부터 획득되는 타이핑 결과들에 상호 보완 스코어를 보정값으로서 적용한 보정된 타이핑 결과를 이용하여, 상기 생물학적 시료에 대한 HLA 타입을 결정하며;
상기 상호 보완 스코어는:
상기 염기 서열 분석을 입력받은 복수의 HLA 타이핑 알고리즘들이 상기 HLA 타입을 결정하는데 함께 이용될 수 있는 가능성을 정량적으로 나타내는 제 1 값;
상기 염기 서열 분석을 입력받은 복수의 HLA 타이핑 알고리즘들 중 어느 하나의 HLA 타이핑 알고리즘을 사용하였을 때에 비해, 다른 HLA 타이핑 알고리즘을 함께 사용하였을 때의 상기 결정되는 HLA 타입의 신뢰도를 얼마나 높여줄 지를 정량적으로 나타내는 제 2 값; 또는
상기 염기 서열 분석을 입력받은 복수의 HLA 타이핑 알고리즘들이 함께 사용되었을 때의 상기 결정되는 HLA 타입의 정확성을 정량적으로 나타내는 제 3 값;
중 적어도 하나를 포함하는,
컴퓨팅 장치.
A computing device for determining the type of Human Leukocyte Antigen (HLA), comprising:
Memory; and
contains a processor;
The processor:
Obtaining a nucleotide sequencing result obtained by performing nucleotide sequencing on DNA or RNA obtained from a biological sample derived from a subject; and
Determine the HLA type of the biological sample by using a corrected typing result obtained by applying a mutual complement score as a correction value to typing results obtained from a plurality of HLA typing algorithms that take the sequencing result as an input and;
The complementarity score is:
a first value quantitatively representing the possibility that a plurality of HLA typing algorithms received through the sequencing analysis can be used together to determine the HLA type;
Quantitatively, how much the reliability of the determined HLA type will be increased when another HLA typing algorithm is used together, compared to when any one HLA typing algorithm among a plurality of HLA typing algorithms received through the base sequence analysis is used. a second value representing; or
a third value quantitatively indicating the accuracy of the determined HLA type when a plurality of HLA typing algorithms received through the base sequence analysis are used together;
including at least one of
computing device.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220004045A KR102547350B1 (en) | 2022-01-11 | 2022-01-11 | Apparatus and method for determining human leukocyte antigen type |
PCT/KR2022/020521 WO2023136486A1 (en) | 2022-01-11 | 2022-12-16 | Method and device for typing human leukocyte antigen |
KR1020230079087A KR20230108723A (en) | 2022-01-11 | 2023-06-20 | Apparatus and method for determining human leukocyte antigen type |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220004045A KR102547350B1 (en) | 2022-01-11 | 2022-01-11 | Apparatus and method for determining human leukocyte antigen type |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230079087A Division KR20230108723A (en) | 2022-01-11 | 2023-06-20 | Apparatus and method for determining human leukocyte antigen type |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102547350B1 true KR102547350B1 (en) | 2023-06-23 |
Family
ID=86993450
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220004045A KR102547350B1 (en) | 2022-01-11 | 2022-01-11 | Apparatus and method for determining human leukocyte antigen type |
KR1020230079087A KR20230108723A (en) | 2022-01-11 | 2023-06-20 | Apparatus and method for determining human leukocyte antigen type |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020230079087A KR20230108723A (en) | 2022-01-11 | 2023-06-20 | Apparatus and method for determining human leukocyte antigen type |
Country Status (2)
Country | Link |
---|---|
KR (2) | KR102547350B1 (en) |
WO (1) | WO2023136486A1 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160025726A1 (en) | 2013-03-15 | 2016-01-28 | Prognosys Biosciences, Inc. | Methods for detecting peptide/mhc/tcr binding |
CN111105843A (en) * | 2019-12-31 | 2020-05-05 | 杭州纽安津生物科技有限公司 | HLA type I molecule and polypeptide affinity prediction method |
KR20210110241A (en) * | 2020-02-28 | 2021-09-07 | (주)신테카바이오 | Prediction system and method of cancer immunotherapy drug Sensitivity using multiclass classification A.I based on HLA Haplotype |
-
2022
- 2022-01-11 KR KR1020220004045A patent/KR102547350B1/en active IP Right Grant
- 2022-12-16 WO PCT/KR2022/020521 patent/WO2023136486A1/en unknown
-
2023
- 2023-06-20 KR KR1020230079087A patent/KR20230108723A/en active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160025726A1 (en) | 2013-03-15 | 2016-01-28 | Prognosys Biosciences, Inc. | Methods for detecting peptide/mhc/tcr binding |
CN111105843A (en) * | 2019-12-31 | 2020-05-05 | 杭州纽安津生物科技有限公司 | HLA type I molecule and polypeptide affinity prediction method |
KR20210110241A (en) * | 2020-02-28 | 2021-09-07 | (주)신테카바이오 | Prediction system and method of cancer immunotherapy drug Sensitivity using multiclass classification A.I based on HLA Haplotype |
Non-Patent Citations (2)
Title |
---|
Front Immunol,12:688183. (2021.10.01.)* * |
Front Immunol,8:1815. (2017.12.13.)* * |
Also Published As
Publication number | Publication date |
---|---|
WO2023136486A1 (en) | 2023-07-20 |
KR20230108723A (en) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Orenbuch et al. | arcasHLA: high-resolution HLA typing from RNAseq | |
Boegel et al. | HLA typing from RNA-Seq sequence reads | |
US20200395097A1 (en) | Pan-cancer model to predict the pd-l1 status of a cancer cell sample using rna expression data and other patient data | |
CN111742059B (en) | Model for targeted sequencing | |
US20210335447A1 (en) | Methods and systems for analysis of receptor interaction | |
US20190325988A1 (en) | Method and system for rapid genetic analysis | |
JP2016540520A (en) | Methods and processes for non-invasive assessment of chromosomal changes | |
Giollo et al. | BOOGIE: predicting blood groups from high throughput sequencing data | |
US20200203016A1 (en) | Cancer tissue source of origin prediction with multi-tier analysis of small variants in cell-free dna samples | |
KR20230165259A (en) | Identification of clonal neoantigens and their use | |
Evans et al. | Genetic variant pathogenicity prediction trained using disease-specific clinical sequencing data sets | |
Kim et al. | Unraveling metagenomics through long-read sequencing: A comprehensive review | |
SoRelle et al. | Assembling and validating bioinformatic pipelines for next-generation sequencing clinical assays | |
CN116583904A (en) | Sample validation for cancer classification | |
Katayama et al. | Machine learning approaches to TCR repertoire analysis | |
Yang et al. | Tutorial: integrative computational analysis of bulk RNA-sequencing data to characterize tumor immunity using RIMA | |
Ahmad et al. | A review of genetic variant databases and machine learning tools for predicting the pathogenicity of breast cancer | |
KR20240068520A (en) | Method and apparatus for establishing t cell receptor ratio for optimal effect of t cell receptor expressing t cell therapy | |
US10540324B2 (en) | Human haplotyping system and method | |
KR102547350B1 (en) | Apparatus and method for determining human leukocyte antigen type | |
Dorigatti et al. | Predicting t cell receptor functionality against mutant epitopes | |
JP2021521857A (en) | Molecular classification of multiple myeloma and its application | |
KR102507088B1 (en) | Human leukocyte antigen typing method and medical personalization method through the same | |
KR102507111B1 (en) | Apparatus and method for determining reliability of immunopeptidome information | |
Zaim et al. | MOCHA: advanced statistical modeling of scATAC-seq data enables functional genomic inference in large human disease cohorts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
GRNT | Written decision to grant |