WO2023136486A1 - Method and device for typing human leukocyte antigen - Google Patents

Method and device for typing human leukocyte antigen Download PDF

Info

Publication number
WO2023136486A1
WO2023136486A1 PCT/KR2022/020521 KR2022020521W WO2023136486A1 WO 2023136486 A1 WO2023136486 A1 WO 2023136486A1 KR 2022020521 W KR2022020521 W KR 2022020521W WO 2023136486 A1 WO2023136486 A1 WO 2023136486A1
Authority
WO
WIPO (PCT)
Prior art keywords
hla
hla typing
tools
tool
determining
Prior art date
Application number
PCT/KR2022/020521
Other languages
French (fr)
Korean (ko)
Inventor
송성재
서정한
임채열
Original Assignee
주식회사 네오젠티씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 네오젠티씨 filed Critical 주식회사 네오젠티씨
Publication of WO2023136486A1 publication Critical patent/WO2023136486A1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6881Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for tissue or cell typing, e.g. human leukocyte antigen [HLA] probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio

Definitions

  • the present disclosure relates to genetic analysis, and more specifically to determining the type of human leukocyte antigen.
  • HLA Human Leukocyte Antigen
  • MHC Major Histocompatibility Complex
  • HLA a product of the MHC gene
  • HLA is the second most important antigen next to the ABO blood type in survival of the transplanted organ in solid organ transplantation.
  • HLA is known to play the most important role in transplantation success or failure in bone marrow transplantation. Therefore, recognizing the difference in HLA immunologically can be seen as the first step of the rejection action for the transplanted tissue.
  • HLA and antibodies play an important role in the occurrence of various side effects such as platelet transfusion refractory, febrile nonhemorrhagic transfusion side effects, acute lung injury, and graft-versus-host disease after transfusion.
  • HLA can be largely classified into Class I and Class II.
  • Class I is classified into HLA-A, HLA-B, and HLA-C, and is expressed in most nucleated cells and platelets, and antigen recognition when cytotoxic T cells recognize and remove virus-infected cells or tumor cells.
  • HLA-DR is essential for HLA Class II
  • HLA-DQ is essential for HLA Class II
  • HLA-DP is classified into HLA-DR, HLA-DQ, and HLA-DP, and is expressed in B cells, monocytes, dendritic cells, and activated T cells. and induces a humoral immune response, and is known to be essential when recognizing antigens expressed in antigen-presenting cells.
  • HLA is a gene that shows the largest polymorphism among genes possessed by humans, and there is a frequency difference between races and ethnic groups.
  • HLA typing for determining the exact HLA type is required in various fields such as organ transplantation, immunotherapy, disease-related research, paternity tests such as paternity, forensic use, and genetic research.
  • various HLA types have been analyzed based on PCR-SSP, PCR-SSOP, Polymerase Chain Reaction-Sequencing Based Typing (PCR-SBT) technologies and Next Generation Sequencing (NGS) methods. Methods have been suggested.
  • the NGS method is based on exon 2, 3, and 4 for Class I (HLA-A, -B, -C) and exon 2 (or exon 2) for Class II (DRB1, DQB1, DPB1), which has been mainly performed in the PCR-SBT test method. , 3), more genes and more exons can be analyzed at the same time, which eliminates the need for additional primers and group PCR, which have been trying to reduce the ambiguity rate. It has the advantage of pooling multiple target genes or multiple samples at once.
  • the prediction accuracy is relatively high for commonly found HLA alleles, but the accuracy is low for infrequent alleles. Therefore, it is not only necessary to build a highly reliable method for more accurately predicting the HLA type, but also, depending on the individual, accurate typing is required by additionally performing the PCR-SBT test method even after NGS.
  • neoantigens generated from tumors caused by somatic mutations has been developed.
  • a tumor vaccine can be produced from it, or T cells with a T cell receptor (TCR) capable of attacking tumors in response to the neoantigen are selected, and the selected T cells are selected.
  • TCR T cell receptor
  • a therapeutic agent may be prepared by culturing cells in vitro or by manufacturing a TCR engineered T cell (TCR engineered T cell) having a T cell receptor engineered.
  • TCR engineered T cell TCR engineered T cell having a T cell receptor engineered.
  • the mutant protein may be combined with HLA and presented as a neoantigen according to the type of HLA of each patient.
  • HLA human leukocyte antigen
  • a method for determining a type of Human Leukocyte Antigen (HLA) performed by a computing device may include obtaining a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from a subject; and determining the HLA type of the biological sample by using a plurality of HLA typing tools that take the result of the sequencing as an input.
  • HLA Human Leukocyte Antigen
  • the step of determining the HLA type may include, based on HLA type candidates included in calls obtained from the plurality of HLA typing tools and complementary scores between the plurality of HLA typing tools, the It may include determining the HLA type for the biological sample.
  • the determining of the HLA type may include determining the number of tools presenting calls among the plurality of typing tools; and determining the HLA type based on the determined number of tools.
  • the determining of the HLA type may include determining the number of tools presenting calls among the plurality of typing tools; Calculating a degree of agreement between HLA type candidates included in the presented calls; and determining the HLA type based on the determined number of tools and the calculated degree of agreement.
  • the determining of the HLA type may include calculating a complementary score between any two typing tools among the plurality of HLA typing tools; and determining the HLA type of the biological sample based on the complementary score.
  • the complementarity score may include a value quantitatively indicating the possibility that any two HLA typing tools among the plurality of HLA typing tools can be used together to determine the HLA type.
  • the complementary score may include a value quantitatively indicating the accuracy of the determined HLA type when any two HLA typing tools among the plurality of HLA typing tools are used together.
  • the complementary score is a correction value to be applied to HLA type candidates included in calls obtained from two HLA typing tools when any two of the plurality of HLA typing tools are used together. It may include a value that quantitatively represents.
  • a complementary score between a first HLA typing tool and a second HLA typing tool among the plurality of HLA typing tools is a result of a first call obtained from the first HLA typing tool for the biological sample.
  • a value quantitatively indicative of the accuracy of the result for the second call obtained from the second HLA typing tool for the biological sample is a value quantitatively indicative of the accuracy of the result for the second call obtained from the second HLA typing tool for the biological sample.
  • the complementary score between a first HLA typing tool and a second HLA typing tool among the plurality of HLA typing tools is the determined score when the first HLA typing tool is used together with the second HLA typing tool.
  • the accuracy value for the HLA type may include a value quantitatively representing a result of comparison with a predetermined first accuracy value for the first HLA typing tool.
  • the determining of the HLA type may include determining whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools. determining based on a first complementary score between the first HLA typing tool and the second HLA typing tool; and determining the HLA type based on a decision on whether to combine the first call and the second call.
  • the determining of the HLA type may include whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools, to a first complementary score between the first HLA typing tool and the second HLA typing tool, a first predetermined accuracy value for the first HLA typing tool and a second predetermined accuracy value for the second HLA typing tool determining based on; and determining the HLA type based on a determination as to whether to combine the first call and the second call.
  • the determining of the HLA type may include determining a correction value to be applied to a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools. determining based on a first complementary score between the first HLA typing tool and the second HLA typing tool; and determining the HLA type based on the correction value.
  • the determining of the HLA type comprises determining accuracy of the HLA type when using the plurality of HLA typing tools based at least in part on a complementary score associated with the plurality of HLA typing tools. It may include predicting.
  • the complementary score is determined by determining whether a first result from a first HLA typing tool among the plurality of HLA typing tools does not match an actual result, and a second result from a second HLA typing tool being the actual result.
  • a first sub-score indicating the case of coincidence with; a second sub-score indicating a case in which a first result from a first HLA typing tool matches an actual result when a second result from a second HLA typing tool among the plurality of HLA typing tools does not match an actual result; a first predetermined accuracy value for the first HLA typing tool; and a predetermined second accuracy value for the second HLA typing tool.
  • the method may further include determining a degree of similarity between algorithms included in the plurality of HLA typing tools based on the complementarity score.
  • a computer program stored in a computer readable storage medium when executed by one or more processors, may perform a method for determining the type of Human Leukocyte Antigen (HLA).
  • the method includes: acquiring a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from a subject; and determining the HLA type of the biological sample by using a plurality of HLA typing tools that take the sequencing result as an input.
  • a computing device for determining the type of Human Leukocyte Antigen (HLA) is disclosed.
  • the computing device may include a memory; and a processor, wherein the processor: obtains a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from the subject;
  • the HLA type of the biological sample may be determined using a plurality of HLA typing tools that take the sequencing result as an input.
  • the method and apparatus according to one embodiment of the present disclosure are intended to more accurately and efficiently determine or predict the type of human leukocyte antigen (HLA).
  • HLA human leukocyte antigen
  • a method and apparatus may determine similarity between a plurality of tools for determining the type of human leukocyte antigen (HLA).
  • HLA human leukocyte antigen
  • FIG. 1 schematically illustrates a block configuration diagram of a computing device according to an embodiment of the present disclosure.
  • FIG. 2 illustrates an exemplary method for determining HLA type according to one embodiment of the present disclosure.
  • FIG. 3 illustrates an example algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
  • FIG. 4 illustrates an exemplary algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
  • FIG. 5 depicts an exemplary algorithm for determining a complementarity score according to one embodiment of the present disclosure.
  • FIG. 6 is a schematic diagram of a computing environment according to one embodiment of the present disclosure.
  • a component may be, but is not limited to, a procedure, processor, object, thread of execution, program, and/or computer running on a processor.
  • an application running on a computing device and a computing device may be components.
  • One or more components may reside within a processor and/or thread of execution.
  • a component can be localized within a single computer.
  • a component may be distributed between two or more computers. Also, these components can execute from various computer readable media having various data structures stored thereon.
  • Components may be connected, for example, via signals with one or more packets of data (e.g., data and/or signals from one component interacting with another component in a local system, distributed system) to other systems and over a network such as the Internet. data being transmitted) may communicate via local and/or remote processes.
  • packets of data e.g., data and/or signals from one component interacting with another component in a local system, distributed system
  • a network such as the Internet. data being transmitted
  • the term “or” is intended to mean an inclusive “or” rather than an exclusive “or”. That is, unless otherwise specified or clear from the context, “X employs A or B” is intended to mean one of the natural inclusive substitutions. That is, X uses A; X uses B; Or, if X uses both A and B, "X uses either A or B" may apply to either of these cases. Also, the term “and/or” as used herein should be understood to refer to and include all possible combinations of one or more of the listed related items.
  • Nth such as first, second, or third
  • first, second, or third are used to distinguish at least one entity.
  • entities represented as first and second may be the same as or different from each other.
  • sequencing may be performed by any type of technique capable of sequencing, for example, whole genome sequencing, whole exome base It may include, but is not limited to, whole exome sequencing or whole transcriptome sequencing.
  • a subject may refer to a subject or individual for determining an HLA type.
  • sample can be used without limitation as long as it is obtained from an individual or subject whose HLA type is to be determined, for example, cells or tissues obtained by biopsy, blood, whole blood, serum, plasma, saliva, It may be cerebrospinal fluid, various secretions, urine and/or feces, and the like.
  • the sample may be selected from the group consisting of blood, plasma, serum, saliva, nasal fluid, sputum, ascites, vaginal secretion and/or urine, and more preferably blood, plasma or serum.
  • the sample may be pretreated prior to use for detection or diagnosis.
  • pretreatment methods may include homogenization, filtration, distillation, extraction, concentration, inactivation of interfering components, and/or addition of reagents, and the like.
  • a biological sample may be tissue, cell, whole blood, and/or blood, but is not limited thereto.
  • HLA Human Leukocyte Antigen
  • MHC major histocompatibility complex
  • An HLA type in the present disclosure may include, for example, an HLA-A type, an HLA-B type, and/or an HLA-C type.
  • a plurality of tools for HLA typing are exemplarily disclosed.
  • Tools in the present disclosure may include algorithms for genetic analysis.
  • the tool may include an algorithm for HLA typing.
  • HLA typing methods and tools in the present disclosure may be used interchangeably with each other.
  • OptiType is an HLA genotype determination algorithm based on integer linear programming announced in 2014. It selects all major or minor HLA class I alleles and accurately predicts 4-digit HLA genotype from NGS data. .
  • OptiType is known to have problems in terms of accuracy and usability (see Szolek et al. OptiType: precision HLA typing from next-generation sequencing data. Bioinformatic, Vol. 30 no. 23 2014, pages 3310-3316).
  • HLA-HD is a method that can accurately determine HLA alleles with 6-digit precision from NGS data published in Japan in 2017. For details, see Hum Mutat. 2017 Jul;38(7):788-797. doi: 10.1002/humu.23230. (Kawaguchi, Shuji, et al. Human mutation 38.7 (2017): 788-797.) can refer
  • PHLAT is a method designed for high-resolution (six-digit) typing of major class I and class II HLA genes using RNAseq or exome sequencing data as input.
  • RNAseq or exome sequencing data as input.
  • HLAscan is a method for performing read alignment on HLA sequences from the International ImMunoGeneTics Project/Human Leukocyte Antigen (IMGT/HLA) database.
  • IMGT/HLA International ImMunoGeneTics Project/Human Leukocyte Antigen
  • HLA*LA is a model that infers HLA types based on projecting linear alignment onto a variance graph, and is a method capable of accurately predicting HLA genotypes from whole-exome and whole-genome Illumina data. For details, see Dilthey, Alexander T., et al. "HLA* LA-HLA typing from linearly projected graph alignments.” Bioinformatics 35.21 (2019): 4394-4396.
  • Availability and/or accuracy of HLA typing results according to each of the above HLA typing methods may be different. Accordingly, a method for determining an optimal HLA type with higher accuracy is required.
  • FIG. 1 schematically illustrates a block configuration diagram of a computing device 100 according to one embodiment of the present disclosure.
  • Computing device 100 may include a processor 110 and a memory 130 .
  • the configuration of the computing device 100 shown in FIG. 1 is only a simplified example.
  • the computing device 100 may include other components for performing a computing environment of the computing device 100, and only some of the disclosed components may constitute the computing device 100.
  • the computing device 100 in the present disclosure may refer to a node constituting a system for implementing embodiments of the present disclosure.
  • the computing device 100 may refer to any type of user terminal or any type of server.
  • Components of the aforementioned computing device 100 are exemplary and some may be excluded or additional components may be included.
  • an output unit (not shown) and an input unit (not shown) may be included within its scope.
  • the computing device 100 in the present disclosure may perform technical features according to embodiments of the present disclosure to be described later.
  • the computing device 100 may determine the HLA type of the biological sample based at least in part on typing results from a plurality of HLA typing tools that take as input a result of performing sequencing of the biological sample. .
  • the processor 110 may include at least one core, and may include a central processing unit (CPU) or a general purpose graphics processing unit (GPGPU) of the computing device 100 . , a processor for data analysis and/or processing, such as a tensor processing unit (TPU).
  • the processor 110 reads the computer program stored in the memory 130 and, according to an embodiment of the present disclosure, typing results from a plurality of HLA typing tools that take as input a result of base sequence analysis on a biological sample.
  • the HLA type for the biological sample may be determined based, at least in part, on.
  • the processor 110 reads the computer program stored in the memory 130 and, according to an embodiment of the present disclosure, HLA type candidates included in calls obtained from a plurality of HLA typing tools and the plurality of HLAs An HLA type of the biological sample may be determined based on a complementary score between typing tools.
  • the processor 110 may perform an operation for learning a neural network.
  • the processor 110 is used for neural network learning, such as processing input data for learning in deep learning (DL), extracting features from input data, calculating errors, and updating neural network weights using backpropagation. calculations can be performed.
  • At least one of the CPU, GPGPU, and TPU of the processor 110 may process learning of the network function.
  • the CPU and GPGPU can process learning of network functions and data classification using network functions.
  • learning of a network function and data classification using a network function may be processed by using processors of a plurality of computing devices together.
  • a computer program executed in a computing device may be a CPU, GPGPU or TPU executable program.
  • the processor 110 may typically handle overall operations of the computing device 100 .
  • the processor 110 processes data, information, signals, etc. input or output through components included in the computing device 100 or drives an application program stored in a storage unit, thereby providing appropriate information or information to the user.
  • a function can be provided or processed.
  • memory 130 may store any type of information generated or determined by processor 110 and any type of information received by computing device 100 .
  • the memory 130 may be a storage medium that stores computer software that causes the processor 110 to perform operations according to embodiments of the present disclosure.
  • the memory 130 may refer to computer readable media for storing software codes necessary for performing embodiments of the present disclosure, data subject to execution of the codes, and results of execution of the codes.
  • the memory 130 may refer to any type of storage medium.
  • the memory 130 may be a flash memory type, a hard disk type ), multimedia card micro type, card type memory (eg SD or XD memory, etc.), RAM (Random Access Memory, RAM), SRAM (Static Random Access Memory), ROM (Read-Only memory, ROM), electrically erasable programmable read-only memory (EEPROM), programmable read-only memory (PROM), magnetic memory, magnetic disk, and optical disk.
  • the computing device 100 may operate in relation to a web storage that performs a storage function of the memory 130 on the Internet.
  • the description of the above memory is only an example, and the memory 130 used in the present disclosure is not limited to the above example.
  • the communication unit (not shown) in the present disclosure may be configured regardless of its communication mode, such as wired and wireless, and may be configured in various communication networks such as a personal area network (PAN) and a wide area network (WAN). can be configured.
  • the network unit 150 may operate based on the known World Wide Web (WWW), and a wireless transmission technology used for short-range communication such as Infrared Data Association (IrDA) or Bluetooth. can also be used.
  • WWW World Wide Web
  • IrDA Infrared Data Association
  • Bluetooth can also be used.
  • the computing device 100 in the present disclosure may include any type of user terminal and/or any type of server. Accordingly, embodiments of the present disclosure may be performed by a server and/or a user terminal.
  • a user terminal may include any type of terminal capable of interacting with a server or other computing device.
  • User terminals include, for example, mobile phones, smart phones, laptop computers, personal digital assistants (PDAs), slate PCs, tablet PCs, and ultrabooks.
  • PDAs personal digital assistants
  • slate PCs slate PCs
  • tablet PCs tablet PCs
  • ultrabooks can include
  • a server may include any type of computing system or computing device, such as, for example, microprocessors, mainframe computers, digital processors, portable devices and device controllers, and the like.
  • the server may refer to an entity that stores and manages nucleotide sequence information or gene information.
  • the server may include a storage unit (not shown) for storing nucleotide sequence information, gene information, and/or index information, and the storage unit may be included in the server or exist under the management of the server.
  • the storage unit may exist outside the server and may be implemented in a form capable of communicating with the server. In this case, the storage unit may be managed and controlled by another external server different from the server.
  • FIG. 2 illustrates an exemplary method for determining HLA type according to one embodiment of the present disclosure.
  • the steps shown in FIG. 2 may be performed by computing device 100 .
  • the steps in FIG. 2 may be implemented by a plurality of entities, such that some of the steps shown in FIG. 2 are performed in a user terminal and others are performed in a server.
  • the computing device 100 may obtain a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from a subject (210).
  • the computing device 100 may obtain a result of performing nucleotide sequence analysis (eg, NGS) from a server or an external entity. In another embodiment, the computing device 100 may perform nucleotide sequence analysis on genetic data (eg, DNA or RNA) obtained from a biological sample derived from a subject.
  • NGS nucleotide sequence analysis
  • the computing device 100 may perform nucleotide sequence analysis on genetic data (eg, DNA or RNA) obtained from a biological sample derived from a subject.
  • the computing device 100 may determine the HLA type of the biological sample based on the HLA type candidates included in the calls obtained from the plurality of HLA typing tools and the complementary score between the plurality of HLA typing tools (220).
  • the computing device 100 may use three or more tools selected from among a plurality of HLA typing tools to determine the HLA type from the result of sequencing. For example, the computing device may determine the final HLA type from the HLA type (or HLA type candidates) obtained from a combination of three or four selected from among OptiType, HLA-HD, PHLAT, HLAscan, and HLA*LA.
  • the names of the aforementioned HLA typing tools are used for illustrative purposes for convenience of explanation, and additional HLA typing tools may be used or only some of the aforementioned HLA typing tools may be used according to implementation aspects.
  • a call from an HLA typing tool may mean an HLA typing result output from the HLA typing tool.
  • HLA type candidates output from each of a plurality of HLA typing tools may correspond to calls from the HLA typing tool.
  • HLA typing with high accuracy and/or usability can be achieved by combining results of a plurality of tools through a novel algorithm.
  • HLA Human Leukocyte Antigen
  • NGS next-generation sequencing
  • the inventors of the present disclosure have confirmed that the accuracy of HLA Class I typing is significantly improved when all or at least some of a plurality of HLA typing tools are used and when a mutual complement score between a plurality of HLA typing tools is used, in particular, the present disclosure It was found that the embodiments of are the optimal HLA type determination method with improved reliability. Therefore, when using the HLA type determination method according to an embodiment of the present invention, it is expected that personalization of medical care, such as determining whether to additionally perform PCR-SBT as well as histocompatibility testing to increase the transplant success rate, is expected.
  • the computing device 100 may determine the number of tools that presented calls among a plurality of HLA typing tools and determine the HLA type based on the determined number of tools.
  • Each HLA typing tool may output a call including an HLA typing result through its own unique algorithm. For example, if there are a total of 5 tools presenting calls, and all HLA types included in the calls presented by the 5 tools match or all 4 tools match, the matching HLA type is selected as the final HLA type.
  • the computing device 100 determines the number of tools that present calls from among a plurality of HLA typing tools, determines the degree of agreement between HLA type candidates included in the presented calls, and based on the determined number of tools and the determined degree of agreement , It is possible to determine the HLA type.
  • the number of tools presenting a call is too small (eg, only two tools present a call) and/or there are two HLA type candidates among the HLA type candidates included in the call, a plurality of It may be determined that the reliability of the HLA type candidate obtained from the tools is low.
  • the reliability of the finally determined HLA type is high.
  • the determined HLA type may be determined and output as the final HLA type.
  • the degree of coincidence may indicate the number of calls in which the HLA type included in the call presented by the tool performing HLA typing matches.
  • OptiType, HLA-HD, PHLAT, HLAscan, and HLA*LA all presented calls, and if the HLA types included in three of these calls are the same, the degree of concordance can be expressed as 3/5, If the HLA types included in four of these calls are the same, the degree of concordance may be expressed as 4/5.
  • the expression method and calculation method for the degree of concordance are not limited to the above examples, and any form of method indicating the identity of the HLA type included in the call may be included within the scope of the degree of concordance as long as it does not depart from the scope of the present disclosure. .
  • a computing device determines the number of available calls among calls presented by a plurality of tools, and based on the number of available calls, generates a matching criterion for determining the HLA type. And, based on the generated matching criterion, the HLA type may be determined.
  • the match criterion may indicate a match threshold for determining the HLA type.
  • the usable call may mean a call usable for determining an HLA type among calls presented by the HLA typing tool.
  • available calls may mean all calls presented by a plurality of HLA typing tools. In this example, calls presented by the remaining tools, except for the tool that did not present the call, may be considered usable calls.
  • the consistency criterion may vary according to the number of available calls. As another example, the consistency criterion may vary depending on the number of available calls and HLA type candidates included in the calls.
  • the computing device 100 determines, when a specific type is presented only in five methods among a plurality of HLA typing tools, an HLA type candidate identically presented in all five methods as the final HLA type.
  • the HLA type candidate presented identically in three or four methods may be determined as the final HLA type, but the scope of the present disclosure is not limited thereto.
  • the computing device 100 during the process of analyzing the HLA type, when multiple calls are presented by one or more tools among a plurality of HLA typing tools, the HLA typing tool presenting the multiple calls
  • the result from may be determined to be excluded in determining the final HLA type. That is, the computing device 100 may determine that it is not usable for multiple calls in this case, but is not limited thereto.
  • the computing device 100 calculates a complementary score between any two typing tools among a plurality of HLA typing tools in determining the HLA type, and based on the complementary score, the biological The HLA type for the sample can be determined.
  • the complementarity score may include a value quantitatively indicating the possibility that any two HLA typing tools among a plurality of HLA typing tools can be used together to determine the HLA type.
  • a complementary score may be generated corresponding to a combination of two HLA typing tools. For example, assuming that there are four HLA typing tools including A, B, C, and D, A and B, A and C, A and D, B and A, B and C, and B and D , C and A, C and B, C and D, D and A, D and B, and D and C, the number of complementary scores corresponding to each other may be generated. In another example, assuming that there are four HLA typing tools including A, B, C, and D, A and B, A and C, A and D, B and C, B and D, and C and A number of complementary scores corresponding to D may be generated.
  • the mutual complementation score may indicate the possibility of complementation when one of the two HLA typing tools is used together, compared to when either one of the two HLA typing tools is used.
  • the complementary score may represent a score for a combination of three or more HLA typing tools rather than two.
  • the complementary score may include a value quantitatively indicating the accuracy of the determined HLA type when any two HLA typing tools among a plurality of HLA typing tools are used together. For example, it is assumed that the accuracy of the comparison result between the HLA typing result in one HLA typing tool and the actual HLA type is 70%. Under this assumption, if the accuracy of the final HLA typing result determined by referring to the results output from the one HLA typing tool and the other HLA typing tool, which is different from the one HLA typing tool, is 85%, the mutual complement between these two HLA typing tools The score may be set to have a relatively high value. Conversely, when the accuracy is not higher than that of one HLA typing tool even when two HLA typing tools are combined, a relatively low complementary score may be set.
  • the complementary score is a quantitative correction value to be applied to HLA type candidates included in calls obtained from a plurality of HLA typing tools when any two HLA typing tools are used together. It may contain a value represented by .
  • a first accuracy numerical value for the first HLA typing tool is combined with a second HLA typing tool for the first HLA typing tool.
  • a first complementary scoring value may be added as a correction value.
  • the first HLA typing tool when used in conjunction with the second HLA typing tool, generates an accuracy value obtained by adding a first accuracy numerical value inherent in the first HLA typing tool and a correction value corresponding to the first complementary scoring.
  • the second HLA typing tool when used together, according to the combination of the first HLA typing tool with respect to the second HLA typing tool to the second accuracy numerical value for the second HLA typing tool.
  • a second complementary scoring value may be added as a correction value.
  • the second HLA typing tool when used in conjunction with the first HLA typing tool, generates an accuracy value that is the sum of a second accuracy numerical value inherent in the second HLA typing tool and a correction value corresponding to the second complementary scoring.
  • a complementary score between a first HLA typing tool and a second HLA typing tool among a plurality of HLA typing tools is a result of a first call obtained from the first HLA typing tool for a biological sample.
  • a complementary score between a first HLA typing tool and a second HLA typing tool among a plurality of HLA typing tools is obtained when the first HLA typing tool is used together with the second HLA typing tool.
  • the determined accuracy value for the HLA type may include a value quantitatively indicating a result of comparison with a predetermined first accuracy value for the first HLA typing tool. For example, a difference between a first accuracy value inherent in the first HLA typing tool and an accuracy value when the first HLA typing tool and the second HLA typing tool are used together may represent a complementary score.
  • the computing device 100 may determine whether to combine a plurality of HLA typing tools based on the value of the complementarity score. For example, the computing device 100 determines whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among a plurality of HLA typing tools. based on a first complementary score between the tool and the second HLA typing tool. Determining whether or not to combine such a combination may be performed according to a comparison between a predetermined threshold and a mutual complement score.
  • the computing device 100 may determine to combine the two HLA typing tools.
  • the first HLA typing tool and the second HLA typing tool are combined, the accuracy inherent in the first HLA typing tool or the accuracy inherent in the second HLA typing tool is determined through the complementary score. In this case, the computing device 100 may determine to combine the two HLA typing tools.
  • the computing device 100 determines whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among a plurality of HLA typing tools, the based on a first complementarity score between a first HLA typing tool and a second HLA typing tool, a first predetermined accuracy value for the first HLA typing tool and a second predetermined accuracy value for the second HLA typing tool can be determined by For example, a complementary score when a first HLA typing tool is combined with a second HLA typing tool together with a first accuracy value inherent in the first HLA typing tool and a second accuracy value inherent in the second HLA typing tool. Using as factors, the computing device 100 may determine whether to output an HLA typing result by combining the first HLA typing tool and the second HLA typing tool.
  • the computing device 100 determines a correction value to be applied to a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools. It may be determined based on a first complementary score between the first HLA typing tool and the second HLA typing tool.
  • the computing device 100 may determine the HLA type corresponding to the biological sample based on the correction value. For example, when calls obtained from two HLA typing tools match each other, and when the complementary score between the two tools has a relatively high value (eg, when it has a value greater than or equal to a predetermined threshold value), computing The device 100 may determine the final HLA type as the HLA type corresponding to the two matching calls. In this example, the computing device 100 may consider calls from HLA typing tools other than the two HLA typing tools together with their complementary scores to determine which tool results to use as the HLA typing result. there is.
  • the computing device 100 may determine a degree of similarity between algorithms included in a plurality of HLA typing tools based on the complementary score.
  • the complementary score of the second HLA typing tool with respect to the first HLA typing tool may be used as an index indicating the possibility that the result of the second HLA typing tool is correct when the result of the first HLA typing tool is incorrect. This can also be used as an index indicating a difference between the typing algorithm of the first HLA typing tool and the algorithm of the second HLA typing tool.
  • the computing device 100 may calculate similarities or differences between typing methods or typing algorithms for each HLA typing tool based on the calculated complementarity score.
  • FIG. 3 illustrates an example algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
  • HLA typing tools described in FIGS. 3-5 are used for illustrative purposes, and depending on the implementation, additional HLA typing tools or only some of them may be used.
  • additional HLA typing tools may include any type of tools for HLA typing, such as Polysolver, HLAreporter, HLAforest, and HLAminer.
  • Opt represents OptiType
  • HD represents HLA-HD (HLA typing from High-quality Dictionary)
  • Phlat, SeqLA, and kourami are PHLAT and seq2HLA, respectively, by themselves.
  • arcas denotes arcasHLA
  • Scan denotes HLAscan
  • *LA was used to denote HLA*LA.
  • FIG. 3 shows an exemplary data structure for expressing a correction score, which is one of factors for determining a complementary score.
  • the data structure 300 shown by reference numeral 300 in FIG. 3 shows the result of the maintype HLA typing tool when each of the subtype HLA typing tools is combined for each of the maintype HLA typing tools among eight HLA typing tools. Indicates the score that the subtype's HLA typing tool can correct.
  • the data structure 300 is a result obtained by combining a plurality of HLA typing tools for a large amount of samples.
  • the correction score of the second HLA typing tool of a specific subtype for the first HLA typing tool of a specific maintype is, in an experiment targeting a large number of samples, the first HLA typing tool It may be determined based on information on the number of times the result for is wrong and information on the number of times the result for the second HLA typing tool is correct when the result for the first HLA typing tool is wrong.
  • the correction score may have a higher value as a value for the number of times that the result of the second HLA typing tool is correct when the result of the first HLA typing tool is incorrect. As such, the correction score quantitatively indicates the possibility of correcting the result of using a specific HLA typing tool through another HLA typing tool.
  • the value of the correction score shown in FIG. 3 increases, it indicates that the HLA typing tool of the subtype is more likely to correct the HLA typing tool of the maintype. As the value of the correction score increases, the value of the mutual complementation score may increase.
  • the value of the correction score may be included in the range of 0 to 1. In this example, the closer the value of the correction score is to 1, the higher the possibility that the subtype corrects the result of the maintype and outputs an accurate value.
  • FIG. 4 illustrates an exemplary algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
  • FIG. 4 shows an exemplary data structure for expressing a complementary ratio, which is one of the factors for determining a complementary score.
  • FIG. 5 may include a table of complementarity ratios for a plurality of HLA typing tools.
  • the complementarity ratio of HLA typing tool B to HLA typing tool A may be determined based on the correction score of B to A and the accuracy value inherent in B.
  • the complementarity ratio of an HLA typing tool B to an HLA typing tool A is 1 minus B's accuracy value as the denominator and 1 minus B's correction score for A as the numerator. can be determined by
  • the accuracy value may be included in the range of 0 to 1.
  • the complementarity ratio of HLA typing tool B to HLA typing tool A may be determined based on the correction score of B to A and the implicit accuracy value of A.
  • the complementarity ratio of an HLA typing tool B to an HLA typing tool A is 1 minus A's accuracy value as the denominator and 1 minus B's correction score for A as the numerator. can be determined by
  • two complementarity ratios may be calculated for two HLA type tools.
  • the complementarity ratio of B to A and the complementarity ratio of A to B can be calculated.
  • two complementary ratios may be calculated according to the relationship between maintype and subtype for two corresponding HLA typing tools.
  • the higher the value of the complementarity ratio the higher the probability of correcting the result for the maintype compared to the accuracy of the HLA typing result inherent in the subtype.
  • the higher the value of the complementarity ratio the higher the accuracy corresponding to the corrected result according to the result from the subtype compared to the HLA typing accuracy inherent in the maintype.
  • the value of the complementarity ratio greater than 1 may mean that the accuracy inherent in the corresponding HLA typing tool is outperformed when combined with.
  • FIG. 5 depicts an exemplary algorithm for determining a complementarity score according to one embodiment of the present disclosure.
  • FIG. 5 illustrates an example data structure for representing a complementary score.
  • FIG. 5 may include a table of complementary scores for a plurality of HLA typing tools.
  • the computing device 100 may use the complementary score shown in FIG. 5 to determine whether to combine the results of a plurality of HLA typing tools. Additionally, in order to predict the accuracy of an HLA typing result when a plurality of HLA typing tools are combined according to an embodiment of the present disclosure, the computing device 100 may use the complementary score shown in FIG. 5 .
  • computing device 100 may use a complementarity score to determine similarity of HLA typing algorithms among a plurality of HLA typing tools. For example, it indicates that a plurality of HLA typing tools having a relatively high value of complementarity score are highly likely to have different algorithms. In addition, a plurality of HLA typing tools having a relatively small complementarity score indicate that the algorithms between them are highly likely to be the same or similar.
  • the complementary score is determined by determining whether a first result from a first HLA typing tool among a plurality of HLA typing tools does not match an actual result, and a second result from a second HLA typing tool being the actual result.
  • a first sub-score indicating a case in which the result matches the actual result, and a first result from the first HLA typing tool in case the second result from the second HLA typing tool among the plurality of HLA typing tools does not match the actual result. It may be calculated based on the second sub-score indicating the case of coincidence, the first accuracy value predetermined for the first HLA typing tool, and the second accuracy value predetermined for the second HLA typing tool.
  • the first sub-score includes a complementarity ratio or correction score of the second HLA typing tool to the first HLA typing tool
  • the second sub-score includes the complementary score of the first HLA typing tool to the second HLA typing tool. It can include ratios or correction scores.
  • a value of one complementary score may be calculated for two corresponding HLA typing tools.
  • the complementarity scores of HLA typing tool A and HLA typing tool B are the complementarity ratio of HLA typing tool B to HLA typing tool A and HLA typing tool A to HLA typing tool B. It can be determined based on the mutual complement ratio of
  • the complementary score of A and B may be determined based on the sum of the complementary ratio of B to A and the complementary ratio of A to B.
  • the complementarity score of A and B may mean the average of the complementarity ratio of B to A and the complementarity of A to B.
  • HLA typing tool A HLA typing tool A
  • HLA typing tool B HLA typing tool B
  • HLA typing tool C HLA typing tool D
  • HLA typing tool D HLA typing tool D
  • a unique accuracy value is mapped to each of these four HLA typing tools.
  • combinations for a total of five HLA typing tools including AB, AC, AD, BC, and CD may be determined.
  • a predetermined complementary score may be assigned to each of these five combinations. That is, a total of five complementary scores may be determined for the five combinations.
  • the computing device 100 obtains data obtained from the four HLA typing tools based on the accuracy values assigned to each of the four HLA typing tools and the complementarity score assigned to each of the five combinations of the HLA typing tools. It is possible to determine which of the results from the calls made is selected as the final HLA typing result. Alternatively, a total of 5 mutually complementary scores may be determined.
  • the computing device 100 obtains data obtained from the four HLA typing tools based on the accuracy values assigned to each of the four HLA typing tools and the complementarity score assigned to each of the five combinations of the HLA typing tools. You can decide whether and/or what to do with the combined calls.
  • the complementarity score assigned to each of the five combinations of HLA typing tools can be obtained from the exemplary table shown in FIG. 5 .
  • the computing device 100 includes a first factor including accuracy values assigned to each of A, B, C, and D, and an average of complementary scores assigned to each of AB, AC, AD, BC, and CD. Based on the second factor, it is possible to determine whether to select the results of the calls obtained from the four HLA typing tools as the final HLA typing result.
  • the computing device 100 calculates a first factor including accuracy values assigned to A, B, C, and D, respectively, and an average and a total of complementary scores assigned to each of AB, AC, AD, BC, and CD. Based on the second factor obtained by calculating K (for example, 4), the number of HLA typing tools, it may be determined whether to select the results of calls obtained from the four HLA typing tools as the final HLA typing result.
  • K for example, 4
  • the computing device 100 divides the total sum of the complementarity scores assigned to each of AB, AC, AD, BC, and CD by the number of combinations K times, which is the total number of HLA typing tools (eg, , 4) and the first factor including the accuracy values assigned to A, B, C, and D, respectively, the results in the calls obtained from the four HLA typing tools are finalized. You can decide whether to select based on the HLA typing result.
  • Equation 1 above shows an exemplary calculation formula for determining whether to combine results of a plurality of HLA typing tools according to an embodiment of the present disclosure. Additionally, Equation 1 may be used as an exemplary calculation formula for determining the accuracy of an HLA typing result when a plurality of HLA typing tools are combined according to an embodiment of the present disclosure. Equation 1 is used for illustrative purposes, and various types of equations or calculation algorithms using the accuracy information of each of the plurality of HLA typing tools and the mutual complement scores between the plurality of HLA typing tools as factors according to implementation aspects can be used
  • Equation 1 k represents the number of HLA typing tools used, n represents the number of combinations between HLA typing tools, Acc represents an accuracy value assigned to each of the HLA typing tools, and Value cor represents HLA typing Indicates a complementary score corresponding to a combination of tools.
  • Equation 1 described above can be used to calculate a final accuracy value for a combination of HLA typing tools used to determine an HLA type, using accuracy information of each of the HLA typing tools and complementary score information of a combination of the HLA typing tools.
  • the computing device 100 compares the final accuracy value according to Equation 1 and a predetermined threshold value (eg, a value such as 99.8%) to determine whether to combine a plurality of HLA typing tools and / or Reliability of HLA typing results obtained from a plurality of HLA typing tools may be determined.
  • a predetermined threshold value eg, a value such as 99.8%
  • the computing device 100 may determine whether to combine calls obtained from a plurality of HLA typing tools based on the algorithm according to Equation 1 described above. As another example, the computing device 100 may determine a final HLA type result by determining weights for calls obtained from a plurality of HLA typing tools based on the algorithm according to Equation 1 described above.
  • the computing device 100 determines an HLA type candidate to be determined as the final HLA type among HLA type candidate values included in calls obtained from a plurality of HLA typing tools based on the algorithm according to Equation 1 described above. can decide
  • the HLA typing method uses a plurality of HLA typing tools, but obtains a higher score from calls obtained from a plurality of HLA typing tools based on a complementary score between the plurality of HLA typing tools. Accurate HLA typing results can be obtained.
  • the value of the complementarity score greater than 1 may mean that it outperforms its inherent accuracy when combined with.
  • the computing device 100 extracts DNA or RNA from a biological sample derived from a subject and uses PCR-SBT (Polymerase Chain Reaction -Sequencing Based Typing) may be performed.
  • the computing device may obtain a corresponding result by acquiring an execution result of PCR-SBT executed by another entity.
  • the degree of concordance of the HLA type included in the call is low or the degree of certainty of the HLA typing result is high even considering the mutual complement score. It may correspond to a situation below the determined threshold. In this case, it may mean that the accuracy of HLA typing output by the corresponding algorithm is reduced. In this case, it may be desirable to increase the accuracy of HLA type determination by performing additional PCR-SBT.
  • PCR-SBT can be used as an auxiliary test in situations where additional HLA genotype information is required or the determination of PCR-SSP test results is ambiguous.
  • a disadvantage of PCR-SSO or RFLP is that it can detect single-base differences in the DNA sequence between two alleles, but it is less likely to detect a new, undefined allele unless the mutation occurs at a specific site detected by the probe. It is.
  • PCR-SBT was originally developed as a manual sequencing method, and the introduction of dye-labeled primers and fluorescence automated sequencing enabled automation and greatly improved accuracy.
  • PCR-SBT is a technology that directly detects the nucleotide sequence of an allele, and has excellent accuracy, but it takes a long time, is expensive, and has a low sample throughput.
  • PCR may be real-time PCR, and more specifically may be single PCR or multiplex PCR, but is not limited thereto.
  • the single or multiplex real-time PCR reaction conditions may take conventional conditions.
  • single real-time PCR and multiplex real-time PCR reactions can be performed under the same conditions. For example, initial denaturation is performed at 95 ° C for 1 minute, followed by denaturation (95 ° C for 25 seconds), annealing (annealing, 45 seconds at 65 ° C.) and extension (extension, 30 seconds at 72 ° C.) may be performed a total of 40 times.
  • Real-time PCR devices usable in the present disclosure include Real-time PCR devices 7900, 7500, and 7300 from AB, LightCycler 80 from Roche, Mx3000p from Stratagene, and Chromo 4 devices from BioRad, which are described for illustrative purposes. However, the scope of the present disclosure is not limited to specific descriptions of the characteristics of the PCR device and the PCR reaction.
  • the PCR may be PCR-SSOP (PCR sequence-specific oligonucleotide probes) or PCR-SBT (PCR sequencing-based typing), but is not limited thereto.
  • FIG. 6 is a schematic diagram of a computing environment according to one embodiment of the present disclosure.
  • a component, module or unit in this disclosure includes routines, procedures, programs, components, data structures, etc. that perform particular tasks or implement particular abstract data types.
  • routines, procedures, programs, components, data structures, etc. that perform particular tasks or implement particular abstract data types.
  • methods presented in this disclosure can be used in single-processor or multiprocessor computing devices, minicomputers, mainframe computers as well as personal computers, handheld computing devices, microprocessor-based or programmable consumer electronics, and the like ( It will be fully appreciated that each of these may be implemented with other computer system configurations, including those that may be operative in connection with one or more associated devices.
  • Embodiments described in this disclosure may also be practiced in distributed computing environments where certain tasks are performed by remote processing devices that are linked through a communications network.
  • program modules may be located in both local and remote memory storage devices.
  • a computing device typically includes a variety of computer readable media.
  • Computer readable media can be any medium that can be accessed by a computer, including volatile and nonvolatile media, transitory and non-transitory media, removable and non-transitory media. Includes removable media.
  • Computer readable media may include computer readable storage media and computer readable transmission media.
  • Computer readable storage media are volatile and nonvolatile media, transitory and non-transitory, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data. includes media
  • Computer readable storage media may include RAM, ROM, EEPROM, flash memory or other memory technology, CD-ROM, digital video disk (DVD) or other optical disk storage device, magnetic cassette, magnetic tape, magnetic disk storage device or other magnetic storage device. device, or any other medium that can be accessed by a computer and used to store desired information.
  • a computer readable transmission medium typically embodies computer readable instructions, data structures, program modules or other data in a modulated data signal such as a carrier wave or other transport mechanism. Including all information delivery media.
  • modulated data signal means a signal that has one or more of its characteristics set or changed so as to encode information within the signal.
  • computer readable transmission media includes wired media such as a wired network or direct-wired connection, and wireless media such as acoustic, RF, infrared, and other wireless media. Combinations of any of the above are also intended to be included within the scope of computer readable transmission media.
  • An exemplary environment 2000 implementing various aspects of the present invention is shown comprising a computer 2002, which includes a processing unit 2004, a system memory 2006 and a system bus 2008. do.
  • Computer 200 herein may be used interchangeably with a computing device.
  • System bus 2008 couples system components, including but not limited to system memory 2006, to processing unit 2004.
  • Processing unit 2004 may be any of a variety of commercially available processors. Dual processors and other multiprocessor architectures may also be used as the processing unit 2004.
  • System bus 2008 may be any of several types of bus structures that may additionally be interconnected to a memory bus, a peripheral bus, and a local bus using any of a variety of commercial bus architectures.
  • System memory 2006 includes read only memory (ROM) 2010 and random access memory (RAM) 2012 .
  • the basic input/output system (BIOS) is stored in non-volatile memory 2010, such as ROM, EPROM, EEPROM, etc. BIOS is a basic set of information that helps transfer information between components within the computer 2002, such as during startup. contains routines.
  • RAM 2012 may also include high-speed RAM, such as static RAM, for caching data.
  • the computer 2002 may also read from an internal hard disk drive (HDD) 2014 (eg EIDE, SATA), a magnetic floppy disk drive (FDD) 2016 (eg a removable diskette 2018), or for writing to them), SSDs and optical disk drives 2020 (for example, for reading CD-ROM disks 2022 or reading from or writing to other high capacity optical media such as DVDs) include
  • HDD hard disk drive
  • FDD magnetic floppy disk drive
  • optical disk drives 2020 for example, for reading CD-ROM disks 2022 or reading from or writing to other high capacity optical media such as DVDs
  • the hard disk drive 2014, magnetic disk drive 2016, and optical disk drive 2020 are connected to the system bus 2008 by the hard disk drive interface 2024, magnetic disk drive interface 2026, and optical drive interface 2028, respectively.
  • the interface 2024 for external drive implementation includes, for example, at least one or both of Universal Serial Bus (USB) and IEEE 1394 interface technologies.
  • USB Universal Serial Bus
  • drives and their associated computer readable media provide non-volatile storage of data, data structures, computer executable instructions, and the like.
  • drives and media correspond to storing any data in a suitable digital format.
  • computer-readable storage media refers to HDDs, removable magnetic disks, and removable optical media such as CDs or DVDs, those skilled in the art can use zip drives, magnetic cassettes, flash memory cards, cartridges, It will be appreciated that other types of computer-readable storage media, such as those of other types, may also be used in the exemplary operating environment and that any such media may contain computer-executable instructions for performing the methods of the present invention. .
  • a number of program modules may be stored on the drive and RAM 2012, including an operating system 2030, one or more application programs 2032, other program modules 2034, and program data 2036. All or portions of the operating system, applications, modules and/or data may also be cached in RAM 2012. It will be appreciated that the present invention may be implemented in a variety of commercially available operating systems or combinations of operating systems.
  • a user may enter commands and information into the computer 2002 through one or more wired/wireless input devices, such as a keyboard 2038 and a pointing device such as a mouse 2040.
  • Other input devices may include a microphone, IR remote control, joystick, game pad, stylus pen, touch screen, and the like.
  • an input device interface 2042 that is connected to the system bus 2008, a parallel port, IEEE 1394 serial port, game port, USB port, IR interface, may be connected by other interfaces such as the like.
  • a monitor 2044 or other type of display device is also connected to the system bus 2008 through an interface such as a video adapter 2046.
  • computers typically include other peripheral output devices (not shown) such as speakers, printers, and the like.
  • Computer 2002 may operate in a networked environment using logical connections to one or more remote computers, such as remote computer(s) 2048 via wired and/or wireless communications.
  • Remote computer(s) 2048 may be workstations, server computers, routers, personal computers, handheld computers, microprocessor-based entertainment devices, peer devices, or other common network nodes, and generally relate to computer 2002.
  • the logical connections shown include wired/wireless connections to a local area network (LAN) 2052 and/or a larger network, such as a wide area network (WAN) 2054 .
  • LAN and WAN networking environments are common in offices and corporations and facilitate enterprise-wide computer networks, such as intranets, all of which can be connected to worldwide computer networks, such as the Internet.
  • computer 2002 When used in a LAN networking environment, computer 2002 is connected to local network 2052 through wired and/or wireless communication network interfaces or adapters 2056. Adapter 2056 may facilitate wired or wireless communications to LAN 2052, which also includes a wireless access point installed therein to communicate with wireless adapter 2056.
  • computer 2002 When used in a WAN networking environment, computer 2002 may include a modem 2058, be connected to a communications server on WAN 2054, or other means of establishing communications over WAN 2054, such as over the Internet. have Modem 2058, which can be internal or external and wired or wireless, is connected to system bus 2008 through serial port interface 2042.
  • program modules described for computer 2002, or portions thereof may be stored in remote memory/storage device 2050. It will be appreciated that the network connections shown are exemplary and other means of establishing a communication link between computers may be used.
  • Computer 1602 is any wireless device or entity that is deployed and operating in wireless communication, such as printers, scanners, desktop and/or portable computers, portable data assistants (PDAs), communication satellites, and associated with wireless detectable tags. It operates to communicate with arbitrary equipment or places and telephones. This includes at least Wi-Fi and Bluetooth wireless technologies. Thus, the communication may be a predefined structure as in conventional networks or simply an ad hoc communication between at least two devices.
  • wireless communication such as printers, scanners, desktop and/or portable computers, portable data assistants (PDAs), communication satellites, and associated with wireless detectable tags. It operates to communicate with arbitrary equipment or places and telephones. This includes at least Wi-Fi and Bluetooth wireless technologies. Thus, the communication may be a predefined structure as in conventional networks or simply an ad hoc communication between at least two devices.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Cell Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Disclosed is a method for typing a human leukocyte antigen (HLA), performed by a computing device. The method may comprise the steps of: obtaining a result of nucleotide sequence analysis on DNA or RNA obtained from a subject-derived biological sample; and typing a HLA for the biological sample by using results and a mutually complementary score of a plurality of HLA typing tools using the nucleotide sequence analysis result as an input. A representative drawing may be figure 2.

Description

인간 백혈구 항원의 타입을 결정하기 위한 방법 및 장치Methods and apparatus for determining the type of human leukocyte antigen
본 개시내용은 유전자 분석에 관한 것이며, 보다 구체적으로 인간 백혈구 항원의 타입을 결정하는 것에 관한 것이다.The present disclosure relates to genetic analysis, and more specifically to determining the type of human leukocyte antigen.
인간 백혈구 항원(Human Leukocyte Antigen; HLA)은 인간의 주조직 적합성복합체(Major Histocompatibility Complex; MHC) 유전자에 의해 생성되는 당단백 분자이다. HLA는 성숙한 적혈구에는 존재하지 않지만 미성숙 적아세포(erythroblast)에서는 발현이 되며 백혈구 및/또는 혈소판 등의 혈액세포를 포함한 인체 내 모든 조직세포의 표면에 발현된다. MHC 유전자는 모든 척추동물에 존재하며 인간의 MHC 유전자를 HLA 유전자, 이로부터 발현된 산물을 HLA이라고 한다.Human Leukocyte Antigen (HLA) is a glycoprotein molecule produced by the human Major Histocompatibility Complex (MHC) gene. HLA does not exist in mature erythrocytes, but is expressed in immature erythroblasts and is expressed on the surface of all tissue cells in the human body, including blood cells such as leukocytes and/or platelets. The MHC gene is present in all vertebrates, and the human MHC gene is referred to as the HLA gene, and the product expressed therefrom is referred to as HLA.
MHC 유전자들은 자기(self) 및 비자기(non-self)의 인지, 항원 자극에 대한 면역반응, 세포성 면역과 체액성 면역의 조절 및 질병에 대한 감수성 등에 관여한다. MHC 유전자의 산물인 HLA는 고형 장기이식에서 이식된 장기의 생존에 있어서 ABO 혈액형 다음으로 중요한 항원이다. HLA는 골수이식에 있어서 이식의 성패에 가장 중요한 역할을 하는 것으로 알려져 있다. 따라서, HLA의 차이를 면역학적으로 인지하는 것이 이식된 조직에 대한 거부반응(rejection action)의 첫 단계라 볼 수 있다. 또한, 수혈요법에 있어서 HLA와 항체는 혈소판수혈불응증, 발열성 비용혈성 수혈 부작용, 급성 폐손상, 수혈 후 이식편대숙주병과 같은 여러 가지 부작용의 발생에 중요한 역할을 한다.MHC genes are involved in self and non-self recognition, immune response to antigen stimulation, regulation of cellular and humoral immunity, and susceptibility to disease. HLA, a product of the MHC gene, is the second most important antigen next to the ABO blood type in survival of the transplanted organ in solid organ transplantation. HLA is known to play the most important role in transplantation success or failure in bone marrow transplantation. Therefore, recognizing the difference in HLA immunologically can be seen as the first step of the rejection action for the transplanted tissue. In addition, in transfusion therapy, HLA and antibodies play an important role in the occurrence of various side effects such as platelet transfusion refractory, febrile nonhemorrhagic transfusion side effects, acute lung injury, and graft-versus-host disease after transfusion.
HLA는 크게 Class I 및 Class Ⅱ로 분류될 수 있다. Class I은 HLA-A, HLA-B, HLA-C로 분류되고 대부분의 유핵세포 및 혈소판에서 발현되며, 세포독성 T 세포가 바이러스에 감염된 세포나 종양세포를 인지하여 제거할 때 항원 인식(antigen recognition)에 필수적이다. HLA Class Ⅱ는 HLA-DR, HLA-DQ, HLA-DP로 분류되고 B 세포, 단핵세포, 수지상세포, 활성화된 T 세포에서 발현되며, 헬퍼 T 세포의 항원 수용체(antigen receptor)와 작용하여 세포성 및 체액성 면역반응을 유발하고, 그리고 항원제시세포에 표현된 항원을 인지할 때 필수적인 것으로 알려져 있다. HLA는 인간이 가지고 있는 유전자 중에서 가장 큰 다형성(polymorphism)을 보이는 유전자이며 인종 및 민족 간에도 빈도 차이가 존재한다. HLA can be largely classified into Class I and Class II. Class I is classified into HLA-A, HLA-B, and HLA-C, and is expressed in most nucleated cells and platelets, and antigen recognition when cytotoxic T cells recognize and remove virus-infected cells or tumor cells. ) is essential for HLA Class II is classified into HLA-DR, HLA-DQ, and HLA-DP, and is expressed in B cells, monocytes, dendritic cells, and activated T cells. and induces a humoral immune response, and is known to be essential when recognizing antigens expressed in antigen-presenting cells. HLA is a gene that shows the largest polymorphism among genes possessed by humans, and there is a frequency difference between races and ethnic groups.
정확한 HLA 타입을 결정하기 위한 HLA 타이핑은, 장기이식, 면역치료, 질병관련 연구, 친자감별과 같은 부친시험, 법의학적 이용, 유전학적 연구 등의 다양한 분야에서 필요하다. 현재까지 PCR-SSP, PCR-SSOP, 중합효소연쇄반응 시퀀싱 기반 타이핑(Polymerase Chain Reaction-Sequencing Based Typing; PCR-SBT) 기술과 차세대 염기서열 분석(Next Generation Sequencing; NGS) 방법에 기반한 다양한 HLA 타입 분석 방법들이 제시되어 왔다.HLA typing for determining the exact HLA type is required in various fields such as organ transplantation, immunotherapy, disease-related research, paternity tests such as paternity, forensic use, and genetic research. Until now, various HLA types have been analyzed based on PCR-SSP, PCR-SSOP, Polymerase Chain Reaction-Sequencing Based Typing (PCR-SBT) technologies and Next Generation Sequencing (NGS) methods. Methods have been suggested.
NGS 방법은 PCR-SBT 검사법에서 주로 시행해 오던 Class I (HLA-A, -B, -C)에 대한 엑손 2, 3, 4와 Class II (DRB1, DQB1, DPB1)에 대한 엑손 2 (또는 exon 2, 3)를 넘어 더 많은 유전자와 더 많은 엑손에 대한 분석을 동시에 시행할 수 있어 모호성 비율(ambiguity rate)을 줄이기 위해 노력해 왔던 추가적인 프라이머, 그룹 PCR 등의 요구를 없애는 효과가 있으며, 인덱싱을 이용하여 여러 표적 유전자 또는 여러 검체를 한 번에 pooling 검사하는 장점이 있다. The NGS method is based on exon 2, 3, and 4 for Class I (HLA-A, -B, -C) and exon 2 (or exon 2) for Class II (DRB1, DQB1, DPB1), which has been mainly performed in the PCR-SBT test method. , 3), more genes and more exons can be analyzed at the same time, which eliminates the need for additional primers and group PCR, which have been trying to reduce the ambiguity rate. It has the advantage of pooling multiple target genes or multiple samples at once.
그러나 IMGT-HLA database에서 제공하는 HLA 대립유전자에 기반하기 때문에 흔하게 발견되는 HLA 대립유전자에 대해서는 비교적 예측 정확도가 높으나 빈도가 낮은 대립유전자에 대해서는 정확도가 떨어지는 것으로 나타났다. 이에, HLA 타입을 보다 정확히 예측할 수 있는 신뢰도 높은 방법을 구축하는 것이 필요할 뿐만 아니라, 개체에 따라서는 NGS 후에도 PCR-SBT 검사법을 추가적으로 실시하여 정확한 타이핑이 필요한 실정이다. However, since it is based on the HLA alleles provided by the IMGT-HLA database, the prediction accuracy is relatively high for commonly found HLA alleles, but the accuracy is low for infrequent alleles. Therefore, it is not only necessary to build a highly reliable method for more accurately predicting the HLA type, but also, depending on the individual, accurate typing is required by additionally performing the PCR-SBT test method even after NGS.
또한, 최근 의료기술의 발달로 돌연변이(somatic mutation)로 인한 종양에서 생성된 신생항원(neoantigen)을 기반으로 하는 항암면역치료법이 개발되었다. 신생항원을 발굴한 후에는 이를 대상으로 종양백신이 생산될 수 있거나 또는 신생항원에 반응하여 종양을 공격할 수 있는 T 세포 수용체(T cell receptor; TCR)를 가진 T 세포가 선별되어, 선별된 T 세포를 체외에서 배양하거나 T 세포 수용체를 조작한 T 세포(TCR engineered T cell)를 제조하는 방식으로 치료제가 만들어질 수 있다. 동일한 돌연변이를 가진 환자라고 하더라도 각 환자의 HLA 종류에 따라서 해당 돌연변이 단백질이 HLA에 결합되어 신생항원으로 제시될 수 있다. 또한, 동일한 돌연변이를 가진 환자라고 하더라도 각 환자의 HLA 종류에 따라서 해당 돌연변이 단백질이 HLA에 결합되지 못하는 경우에는 신생항원이 만들어질 수 없게 된다. 따라서 HLA의 타입을 정확히 확인 또는 결정하여 신생항원 여부를 결정하는 것이 이를 기반으로 한 항암면역치료법 개발에 매우 중요하다. 이와 관련된 문헌으로 대한민국 등록특허 제10-2215286호가 안출되어 있다.In addition, with the recent development of medical technology, anticancer immunotherapy based on neoantigens generated from tumors caused by somatic mutations has been developed. After a neoantigen is discovered, a tumor vaccine can be produced from it, or T cells with a T cell receptor (TCR) capable of attacking tumors in response to the neoantigen are selected, and the selected T cells are selected. A therapeutic agent may be prepared by culturing cells in vitro or by manufacturing a TCR engineered T cell (TCR engineered T cell) having a T cell receptor engineered. Even in patients with the same mutation, the mutant protein may be combined with HLA and presented as a neoantigen according to the type of HLA of each patient. In addition, even in patients with the same mutation, neoantigens cannot be produced when the corresponding mutant protein cannot bind to HLA depending on the type of HLA of each patient. Therefore, it is very important to accurately identify or determine the type of HLA to determine whether or not it is a neoantigen in the development of anti-cancer immunotherapy based thereon. As a related document, Korean Patent Registration No. 10-2215286 has been devised.
본 개시내용은 전술한 배경기술에 대응하여 안출된 것으로, 인간 백혈구 항원(HLA)의 타입을 보다 정확하고 효율적으로 판정 또는 예측하기 위한 것이다.The present disclosure has been made in response to the above background art, and is intended to more accurately and efficiently determine or predict the type of human leukocyte antigen (HLA).
본 개시내용의 기술적 과제들은 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The technical problems of the present disclosure are not limited to the technical problems mentioned above, and other technical problems not mentioned will be clearly understood by those skilled in the art from the description below.
본 개시의 일 실시예에 따라 컴퓨팅 장치에 의해 수행되는 인간 백혈구 항원(Human Leukocyte Antigen; HLA)의 타입을 결정하기 위한 방법이 개시된다. 상기 방법은, 피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득하는 단계; 및 상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑(typing) 툴(tool)들을 사용하여 상기 생물학적 시료에 대한 HLA 타입을 결정하는 단계를 포함할 수 있다.According to one embodiment of the present disclosure, a method for determining a type of Human Leukocyte Antigen (HLA) performed by a computing device is disclosed. The method may include obtaining a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from a subject; and determining the HLA type of the biological sample by using a plurality of HLA typing tools that take the result of the sequencing as an input.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들로부터 획득된 콜(call)들에 포함된 HLA 타입 후보들 및 상기 복수개의 HLA 타이핑 툴들 간의 상호 보완 스코어에 기초하여, 상기 생물학적 시료에 대한 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the step of determining the HLA type may include, based on HLA type candidates included in calls obtained from the plurality of HLA typing tools and complementary scores between the plurality of HLA typing tools, the It may include determining the HLA type for the biological sample.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수의 타이핑 툴들 중에서 콜을 제시한 툴의 개수를 결정하는 단계; 및 상기 결정된 툴의 개수에 기초하여 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type may include determining the number of tools presenting calls among the plurality of typing tools; and determining the HLA type based on the determined number of tools.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수의 타이핑 툴들 중에서 콜을 제시한 툴의 개수를 결정하는 단계; 제시된 콜들에 포함된 HLA 타입 후보들 간의 일치도를 계산하는 단계; 및 상기 결정된 툴의 개수 및 상기 계산된 일치도에 기초하여 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type may include determining the number of tools presenting calls among the plurality of typing tools; Calculating a degree of agreement between HLA type candidates included in the presented calls; and determining the HLA type based on the determined number of tools and the calculated degree of agreement.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 타이핑 툴들 간의 상호 보완 스코어를 계산하는 단계; 및 상기 상호 보완 스코어에 기초하여, 상기 생물학적 시료에 대한 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In an embodiment, the determining of the HLA type may include calculating a complementary score between any two typing tools among the plurality of HLA typing tools; and determining the HLA type of the biological sample based on the complementary score.
일 실시예에서, 상기 상호 보완 스코어는, 상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 상기 HLA 타입을 결정하는데 함께 이용될 수 있는 가능성을 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, the complementarity score may include a value quantitatively indicating the possibility that any two HLA typing tools among the plurality of HLA typing tools can be used together to determine the HLA type.
일 실시예에서, 상기 상호 보완 스코어는, 상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 함께 사용되었을 때의 상기 결정되는 HLA 타입의 정확성을 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, the complementary score may include a value quantitatively indicating the accuracy of the determined HLA type when any two HLA typing tools among the plurality of HLA typing tools are used together.
일 실시예에서, 상기 상호 보완 스코어는, 상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 함께 사용되었을 때의 상기 2개의 HLA 타이핑 툴들에서 획득된 콜들에 포함된 HLA 타입 후보들에 적용될 보정값을 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, the complementary score is a correction value to be applied to HLA type candidates included in calls obtained from two HLA typing tools when any two of the plurality of HLA typing tools are used together. It may include a value that quantitatively represents.
일 실시예에서, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴 간의 상호 보완 스코어는, 상기 생물학적 시료에 대하여 상기 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜에 대한 결과가 틀렸을 때, 상기 생물학적 시료에 대하여 상기 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜에 대한 결과의 정확성을 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, a complementary score between a first HLA typing tool and a second HLA typing tool among the plurality of HLA typing tools is a result of a first call obtained from the first HLA typing tool for the biological sample. When wrong, a value quantitatively indicative of the accuracy of the result for the second call obtained from the second HLA typing tool for the biological sample.
일 실시예에서, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴 간의 상호 보완 스코어는, 상기 제 1 HLA 타이핑 툴이 상기 제 2 HLA 타이핑 툴과 함께 사용되었을 때의 상기 결정된 HLA 타입에 대한 정확성 값이, 상기 제 1 HLA 타이핑 툴에 대해 사전결정된 제 1 정확성 값과 비교한 결과를 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, the complementary score between a first HLA typing tool and a second HLA typing tool among the plurality of HLA typing tools is the determined score when the first HLA typing tool is used together with the second HLA typing tool. The accuracy value for the HLA type may include a value quantitatively representing a result of comparison with a predetermined first accuracy value for the first HLA typing tool.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜과 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜을 조합할지 여부를 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어에 기초하여 결정하는 단계; 및 상기 제 1 콜과 상기 제 2 콜을 조합할지 여부에 대한 결정에 기초하여 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type may include determining whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools. determining based on a first complementary score between the first HLA typing tool and the second HLA typing tool; and determining the HLA type based on a decision on whether to combine the first call and the second call.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜과 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜을 조합할지 여부를, 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어, 상기 제 1 HLA 타이핑 툴에 대한 사전 결정된 제 1 정확성 값 및 상기 제 2 HLA 타이핑 툴에 대한 사전 결정된 제 2 정확성 값에 기초하여 결정하는 단계; 및 상기 제 1 콜과 상기 제 2 콜을 조합할지 여부에 대한 결정에 기초하여, 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type may include whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools, to a first complementary score between the first HLA typing tool and the second HLA typing tool, a first predetermined accuracy value for the first HLA typing tool and a second predetermined accuracy value for the second HLA typing tool determining based on; and determining the HLA type based on a determination as to whether to combine the first call and the second call.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜 및 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜에 적용될 보정값을 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어에 기초하여 결정하는 단계; 및 상기 보정값에 기초하여 상기 HLA 타입을 결정하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type may include determining a correction value to be applied to a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools. determining based on a first complementary score between the first HLA typing tool and the second HLA typing tool; and determining the HLA type based on the correction value.
일 실시예에서, 상기 HLA 타입을 결정하는 단계는, 상기 복수개의 HLA 타이핑 툴들에 관련된 상호 보완 스코어에 적어도 부분적으로 기초하여, 상기 복수개의 HLA 타이핑 툴들을 사용하였을 때의 결정되는 상기 HLA 타입의 정확성을 예측하는 단계를 포함할 수 있다.In one embodiment, the determining of the HLA type comprises determining accuracy of the HLA type when using the plurality of HLA typing tools based at least in part on a complementary score associated with the plurality of HLA typing tools. It may include predicting.
일 실시예에서, 상기 상호 보완 스코어는, 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터의 제 1 결과가 실제 결과와 일치하지 않는 경우 제 2 HLA 타이핑 툴로부터의 제 2 결과가 상기 실제 결과와 일치하는 경우를 나타내는 제 1 서브 스코어; 상기 복수개의 HLA 타이핑 툴들 중 제 2 HLA 타이핑 툴로부터의 제 2 결과가 실제 결과와 일치하지 않는 경우 제 1 HLA 타이핑 툴로부터의 제 1 결과가 상기 실제 결과와 일치하는 경우를 나타내는 제 2 서브 스코어; 상기 제 1 HLA 타이핑 툴에 대해 사전 결정된 제 1 정확성 값; 및 상기 제 2 HLA 타이핑 툴에 대해 사전 결정된 제 2 정확성 값에 기초하여 연산될 수 있다.In one embodiment, the complementary score is determined by determining whether a first result from a first HLA typing tool among the plurality of HLA typing tools does not match an actual result, and a second result from a second HLA typing tool being the actual result. A first sub-score indicating the case of coincidence with; a second sub-score indicating a case in which a first result from a first HLA typing tool matches an actual result when a second result from a second HLA typing tool among the plurality of HLA typing tools does not match an actual result; a first predetermined accuracy value for the first HLA typing tool; and a predetermined second accuracy value for the second HLA typing tool.
일 실시예에서, 상기 방법은, 상기 상호 보완 스코어에 기초하여, 상기 복수개의 HLA 타이핑 툴들에 포함된 알고리즘들 간의 유사도를 결정하는 단계를 더 포함할 수 있다.In an embodiment, the method may further include determining a degree of similarity between algorithms included in the plurality of HLA typing tools based on the complementarity score.
본 개시의 일 실시예에 따라 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램이 개시된다. 상기 컴퓨터 프로그램은 하나 이상의 프로세서에 의해 실행되는 경우 인간 백혈구 항원(Human Leukocyte Antigen; HLA)의 타입을 결정하기 위한 방법을 수행할 수 있다. 상기 방법은: 피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득하는 단계; 및 상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑 툴들을 사용하여 상기 생물학적 시료에 대한 HLA 타입을 결정하는 단계를 포함할 수 있다.According to one embodiment of the present disclosure, a computer program stored in a computer readable storage medium is disclosed. The computer program, when executed by one or more processors, may perform a method for determining the type of Human Leukocyte Antigen (HLA). The method includes: acquiring a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from a subject; and determining the HLA type of the biological sample by using a plurality of HLA typing tools that take the sequencing result as an input.
본 개시의 일 실시예에 따라, 인간 백혈구 항원(Human Leukocyte Antigen; HLA)의 타입을 결정하기 위한 컴퓨팅 장치가 개시된다. 상기 컴퓨팅 장치는, 메모리; 및 프로세서를 포함하며, 상기 프로세서는: 피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득하고; 그리고 상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑 툴들을 사용하여 상기 생물학적 시료에 대한 HLA 타입을 결정할 수 있다.According to one embodiment of the present disclosure, a computing device for determining the type of Human Leukocyte Antigen (HLA) is disclosed. The computing device may include a memory; and a processor, wherein the processor: obtains a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from the subject; In addition, the HLA type of the biological sample may be determined using a plurality of HLA typing tools that take the sequencing result as an input.
본 개시내용의 일 실시예에 따른 방법 및 장치는, 인간 백혈구 항원(HLA)의 타입을 보다 정확하고 효율적으로 판정 또는 예측하기 위한 것이다. The method and apparatus according to one embodiment of the present disclosure are intended to more accurately and efficiently determine or predict the type of human leukocyte antigen (HLA).
본 개시내용의 일 실시예에 따른 방법 및 장치는, 인간 백혈구 항원(HLA)의 타입을 결정하는 복수의 툴들 간의 유사도를 판단할 수 있다.A method and apparatus according to an embodiment of the present disclosure may determine similarity between a plurality of tools for determining the type of human leukocyte antigen (HLA).
도 1은 본 개시내용의 일 실시예에 따른 컴퓨팅 장치의 블록 구성도를 개략적으로 도시한다. 1 schematically illustrates a block configuration diagram of a computing device according to an embodiment of the present disclosure.
도 2는 본 개시내용의 일 실시예에 따른 HLA 타입을 결정하기 위한 예시적인 방법을 도시한다. 2 illustrates an exemplary method for determining HLA type according to one embodiment of the present disclosure.
도 3은 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.3 illustrates an example algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
도 4는 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.4 illustrates an exemplary algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
도 5는 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.5 depicts an exemplary algorithm for determining a complementarity score according to one embodiment of the present disclosure.
도 6은 본 개시내용의 일 실시예에 따른 컴퓨팅 환경의 개략도이다.6 is a schematic diagram of a computing environment according to one embodiment of the present disclosure.
다양한 실시예들이 도면을 참조하여 설명된다. 본 명세서에서, 다양한 설명들이 본 개시내용의 이해를 제공하기 위해서 제시된다. 본 개시내용의 실시를 위한 구체적인 내용을 설명하기에 앞서, 본 개시내용의 기술적 요지와 직접적 관련이 없는 구성에 대해서는 본 발명의 기술적 요지를 흩뜨리지 않는 범위 내에서 생략하였음에 유의하여야 할 것이다. 또한, 본 명세서 및 청구범위에 사용된 용어 또는 단어는 발명자가 자신의 발명을 최선의 방법으로 설명하기 위해 적절한 용어의 개념을 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다.Various embodiments are described with reference to the drawings. In this specification, various descriptions are presented to provide an understanding of the present disclosure. Prior to describing specific details for the implementation of the present disclosure, it should be noted that configurations not directly related to the technical gist of the present disclosure have been omitted within the scope of not distracting from the technical gist of the present invention. In addition, the terms or words used in this specification and claims have meanings consistent with the technical idea of the present invention based on the principle that the inventor can define the concept of appropriate terms in order to best describe his/her invention. concept should be interpreted.
본 명세서에서 사용되는 용어 "컴포넌트", "모듈", "시스템", "부" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭하며, 상호 교환 가능하게 사용될 수 있다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정(procedure), 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있다. 일 컴포넌트는 하나의 컴퓨터 내에 로컬화 될 수 있다. 일 컴포넌트는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터의 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통해 전송되는 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다.As used herein, the terms "component", "module", "system", "unit", and the like refer to a computer-related entity, hardware, firmware, software, a combination of software and hardware, or an execution of software, and are interchangeable. can possibly be used. For example, a component may be, but is not limited to, a procedure, processor, object, thread of execution, program, and/or computer running on a processor. For example, both an application running on a computing device and a computing device may be components. One or more components may reside within a processor and/or thread of execution. A component can be localized within a single computer. A component may be distributed between two or more computers. Also, these components can execute from various computer readable media having various data structures stored thereon. Components may be connected, for example, via signals with one or more packets of data (e.g., data and/or signals from one component interacting with another component in a local system, distributed system) to other systems and over a network such as the Internet. data being transmitted) may communicate via local and/or remote processes.
더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.In addition, the term “or” is intended to mean an inclusive “or” rather than an exclusive “or”. That is, unless otherwise specified or clear from the context, “X employs A or B” is intended to mean one of the natural inclusive substitutions. That is, X uses A; X uses B; Or, if X uses both A and B, "X uses either A or B" may apply to either of these cases. Also, the term "and/or" as used herein should be understood to refer to and include all possible combinations of one or more of the listed related items.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하는 것으로 이해되어야 한다. 다만, "포함한다" 및/또는 "포함하는"이라는 용어는, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다.Also, the terms "comprises" and/or "comprising" should be understood to mean that the features and/or components are present. However, it should be understood that the terms "comprises" and/or "comprising" do not exclude the presence or addition of one or more other features, elements, and/or groups thereof. Also, unless otherwise specified or where the context clearly indicates that a singular form is indicated, the singular in this specification and claims should generally be construed to mean "one or more".
그리고, "A 또는 B 중 적어도 하나" 또는 “A 및 B 중 적어도 하나” 라는 용어는, "A만을 포함하는 경우", "B 만을 포함하는 경우", "A와 B의 구성으로 조합된 경우"를 의미하는 것으로 해석되어야 한다. In addition, the term "at least one of A or B" or "at least one of A and B" means "includes only A", "includes only B", "includes A and B in combination" should be interpreted as meaning
당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시적 논리적 구성요소들, 블록들, 모듈들, 회로들, 수단들, 로직들, 및 알고리즘들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시적 구성요소들, 블록들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있다. 다만, 그러한 구현의 결정들이 본 개시내용의 영역을 벗어나게 하는 것으로 해석되어서는 안된다.Those skilled in the art will further understand that the various illustrative logical components, blocks, modules, circuits, means, logics, and algorithms described in connection with the embodiments disclosed herein may be electronic hardware, computer software, or combinations of both. It should be recognized that it can be implemented as To clearly illustrate the interchangeability of hardware and software, various illustrative components, blocks, means, logics, modules, circuits, and steps have been described above generally in terms of their functionality. Whether such functionality is implemented in hardware or as software depends on the particular application and design constraints imposed on the overall system. Skilled artisans may implement the described functionality in varying ways for each particular application. However, such implementation decisions should not be interpreted as causing a departure from the scope of this disclosure.
제시된 실시예들에 대한 설명은 본 개시의 기술 분야에서 통상의 지식을 가진 자가 본 발명을 이용하거나 또는 실시할 수 있도록 제공된다. 이러한 실시예들에 대한 다양한 변형들은 본 개시의 기술 분야에서 통상의 지식을 가진 자에게 명백할 것이다. 여기에 정의된 일반적인 원리들은 본 개시의 범위를 벗어남이 없이 다른 실시예들에 적용될 수 있다. 그리하여, 본 발명은 여기에 제시된 실시예 들로 한정되는 것이 아니다. 본 발명은 여기에 제시된 원리들 및 신규한 특징들과 일관되는 최광의의 범위에서 해석되어야 할 것이다. The description of the presented embodiments is provided to enable any person skilled in the art to use or practice the present invention. Various modifications to these embodiments will be apparent to those skilled in the art of this disclosure. The general principles defined herein may be applied to other embodiments without departing from the scope of this disclosure. Thus, the present invention is not limited to the embodiments presented herein. The present invention is to be accorded the widest scope consistent with the principles and novel features set forth herein.
본 개시내용에서의 제 1, 제 2, 또는 제 3 과 같이 제 N 으로 표현되는 용어들은 적어도 하나의 엔티티들을 구분하기 위해 사용된다. 예를 들어, 제 1 과 제 2로 표현된 엔티티들은 서로 동일하거나 또는 상이할 수 있다.In the present disclosure, terms expressed as Nth, such as first, second, or third, are used to distinguish at least one entity. For example, entities represented as first and second may be the same as or different from each other.
본 개시내용에서 사용되는 용어, 염기서열 분석은 염기서열을 분석할 수 있는 임의의 형태의 기법들에 의해 수행될 수 있으며, 예를 들어, 전장 유전체 염기서열 분석(whole genome sequencing), 전체 엑솜 염기서열 분석(whole exome sequencing) 또는 전체 전사체 염기서열 분석(whole transcriptome sequencing)을 포함할 수 있으나, 이에 제한되는 것은 아니다.As the term used in the present disclosure, sequencing may be performed by any type of technique capable of sequencing, for example, whole genome sequencing, whole exome base It may include, but is not limited to, whole exome sequencing or whole transcriptome sequencing.
본 개시내용에서 사용되는 용어, 피검체는 HLA 타입을 결정하기 위한 대상체 또는 개체를 의미할 수 있다. As used in the present disclosure, a subject may refer to a subject or individual for determining an HLA type.
본 개시내용에서 사용되는 용어, 시료는 HLA 타입을 결정하고자 하는 개체 또는 대상체로부터 획득된 것이라면 제한 없이 사용할 수 있으며, 예를 들어 생검 등으로 얻어진 세포나 조직, 혈액, 전혈, 혈청, 혈장, 타액, 뇌척수액, 각종 분비물, 소변 및/또는 대변 등일 수 있다. 바람직하게 시료는 혈액, 혈장, 혈청, 타액, 비액, 객담, 복수, 질 분비물 및/또는 소변으로 이루어진 군에서 선택될 수 있으며, 보다 바람직하게는 혈액, 혈장 또는 혈청일 수 있다. 상기 시료는 검출 또는 진단에 사용하기 전에 전처리할 수 있다. 예를 들어, 전처리 방법은 균질화(homogenization), 여과, 증류, 추출, 농축, 방해 성분의 불활성화, 및/또는 시약의 첨가 등을 포함할 수 있다.As used in the present disclosure, the term, sample, can be used without limitation as long as it is obtained from an individual or subject whose HLA type is to be determined, for example, cells or tissues obtained by biopsy, blood, whole blood, serum, plasma, saliva, It may be cerebrospinal fluid, various secretions, urine and/or feces, and the like. Preferably, the sample may be selected from the group consisting of blood, plasma, serum, saliva, nasal fluid, sputum, ascites, vaginal secretion and/or urine, and more preferably blood, plasma or serum. The sample may be pretreated prior to use for detection or diagnosis. For example, pretreatment methods may include homogenization, filtration, distillation, extraction, concentration, inactivation of interfering components, and/or addition of reagents, and the like.
본 개시내용에서, 생물학적 시료는 조직, 세포, 전혈, 및/또는 혈액인 것일 수 있으나, 이에 제한되는 것은 아니다.In the present disclosure, a biological sample may be tissue, cell, whole blood, and/or blood, but is not limited thereto.
본 개시내용에서 사용되는 용어, “인간 백혈구 항원(Human Leukocyte Antigen; HLA)”은 인간의 주조직적합성복합체(Major Histocompatibility Complex: MHC) 유전자에 의해 생성되는 당단백 분자로, 인간이 가지고 있는 유전자 중에서 가장 큰 다형성(polymorphism)을 보이는 유전자이다. HLA 타입을 결정하는 HLA 타이핑은 장기이식, 면역치료, 질병관련 연구, 친자감별과 같은 부친시험, 법의학적 이용, 유전학적 연구 등의 다양한 분야에서 매우 활발하게 이용될 수 있다. As used in the present disclosure, the term “Human Leukocyte Antigen (HLA)” is a glycoprotein molecule produced by the major histocompatibility complex (MHC) gene of humans, and is the most abundant among the genes possessed by humans. It is a gene with a large polymorphism. HLA typing, which determines the HLA type, can be used very actively in various fields such as organ transplantation, immunotherapy, disease-related research, paternity tests such as paternity, forensic use, and genetic research.
본 개시내용에서의 HLA 타입은 예를 들어, HLA-A 타입, HLA-B 타입 및/또는 HLA-C 타입을 포함할 수 있다.An HLA type in the present disclosure may include, for example, an HLA-A type, an HLA-B type, and/or an HLA-C type.
본 개시내용의 일 실시예에서 HLA 타이핑을 위한 복수개의 툴(tool)들이 예시적으로 개시된다. 본 개시내용에서의 툴(tool)은 유전자 분석을 위한 알고리즘을 포함할 수 있다. 예를 들어, 툴은 HLA 타이핑을 위한 알고리즘을 포함할 수 있다. 본 개시내용에서의 HLA 타이핑 방법과 툴은 서로 상호 교환 가능하게 사용될 수 있다.In one embodiment of the present disclosure, a plurality of tools for HLA typing are exemplarily disclosed. Tools in the present disclosure may include algorithms for genetic analysis. For example, the tool may include an algorithm for HLA typing. HLA typing methods and tools in the present disclosure may be used interchangeably with each other.
이하에서는 예시적인 HLA 타이핑 방법 또는 툴들에 대해서 간략히 설명하기로 한다.Exemplary HLA typing methods or tools are briefly described below.
OptiType은 2014년에 발표된 정수 선형 프로그래밍(integer linear programming)에 기반한 HLA 유전자형 결정 알고리즘으로 모든 주요 또는 소수의 HLA class I 대립유전자를 선택하여 NGS 데이터로부터 정확한 4자리의 HLA 유전자형의 예측이 가능한 방법이다. 그러나 OptiType은 정확도 및 유용성 면에서 문제점이 있는 것으로 알려져 있다 (Szolek 등의 OptiType: precision HLA typing from next-generation sequencing data. Bioinformatic, Vol. 30 no. 23 2014, pages 3310-3316, 참조).OptiType is an HLA genotype determination algorithm based on integer linear programming announced in 2014. It selects all major or minor HLA class I alleles and accurately predicts 4-digit HLA genotype from NGS data. . However, OptiType is known to have problems in terms of accuracy and usability (see Szolek et al. OptiType: precision HLA typing from next-generation sequencing data. Bioinformatic, Vol. 30 no. 23 2014, pages 3310-3316).
HLA-HD란 2017년에 일본에서 발표된 NGS 데이터에서 6자리 정밀도로 HLA 대립 유전자를 정확히 결정할 수 있는 방법이다. 자세한 사항은 문헌(Hum Mutat. 2017 Jul;38(7):788-797. doi: 10.1002/humu.23230.)(Kawaguchi, Shuji, et al. Human mutation 38.7 (2017): 788-797.)을 참조할 수 있다.HLA-HD is a method that can accurately determine HLA alleles with 6-digit precision from NGS data published in Japan in 2017. For details, see Hum Mutat. 2017 Jul;38(7):788-797. doi: 10.1002/humu.23230. (Kawaguchi, Shuji, et al. Human mutation 38.7 (2017): 788-797.) can refer
PHLAT란 RNAseq 또는 엑솜 시퀀싱 데이터를 입력값으로 사용하여 주요 클래스 I 및 클래스 II HLA 유전자의 고해상도(6 자리) 타이핑을 위해 설계된 방법이다. 자세한 사항은 문헌(Bai, Yu, David Wang, and Wen Fury. HLA Typing. Humana Press, New York, NY, 2018. 193-201.)을 참조할 수 있다.PHLAT is a method designed for high-resolution (six-digit) typing of major class I and class II HLA genes using RNAseq or exome sequencing data as input. For details, reference may be made to the literature (Bai, Yu, David Wang, and Wen Fury. HLA Typing . Humana Press, New York, NY, 2018. 193-201.).
HLAscan이란 국제 ImMunoGeneTics 프로젝트/인간 백혈구 항원(IMGT/HLA) 데이터베이스에서 HLA 시퀀스에 대한 읽기 정렬을 수행하는 방법이다. 자세한 사항은 문헌(Ka, Sojeong, et al. BMC bioinformatics 18.1 (2017): 1-11.)을 참조할 수 있다.HLAscan is a method for performing read alignment on HLA sequences from the International ImMunoGeneTics Project/Human Leukocyte Antigen (IMGT/HLA) database. For details, refer to the literature (Ka, Sojeong, et al. BMC bioinformatics 18.1 (2017): 1-11.).
HLA*LA란 선형 정렬을 변이 그래프에 투영하는 것을 기반으로 HLA 유형을 추론하는 모델로서, 전체 엑솜 및 전체 게놈 Illumina 데이터에서 정확한 HLA 유전자형의 예측이 가능한 방법이다. 자세한 사항은 문헌(Dilthey, Alexander T., et al. "HLA* LA―HLA typing from linearly projected graph alignments." Bioinformatics 35.21 (2019): 4394-4396)을 참조할 수 있다.HLA*LA is a model that infers HLA types based on projecting linear alignment onto a variance graph, and is a method capable of accurately predicting HLA genotypes from whole-exome and whole-genome Illumina data. For details, see Dilthey, Alexander T., et al. "HLA* LA-HLA typing from linearly projected graph alignments." Bioinformatics 35.21 (2019): 4394-4396.
전술한 HLA 타이핑 방법들 각각에 따른 HLA 타이핑 결과에 대한 가용성 및/또는 정확성은 상이할 수 있다. 이에 따라, 보다 정확도가 높은 최적의 HLA 타입을 결정하는 방법이 요구되고 있다.Availability and/or accuracy of HLA typing results according to each of the above HLA typing methods may be different. Accordingly, a method for determining an optimal HLA type with higher accuracy is required.
도 1은 본 개시내용의 일 실시예에 따른 컴퓨팅 장치(100)의 블록 구성도를 개략적으로 도시한다. 1 schematically illustrates a block configuration diagram of a computing device 100 according to one embodiment of the present disclosure.
본 개시의 일 실시예에 따른 컴퓨팅 장치(100)는 프로세서(110) 및 메모리(130) 를 포함할 수 있다. Computing device 100 according to an embodiment of the present disclosure may include a processor 110 and a memory 130 .
도 1에 도시된 컴퓨팅 장치(100)의 구성은 간략화 하여 나타낸 예시일 뿐이다. 본 개시의 일 실시예에서 컴퓨팅 장치(100)는 컴퓨팅 장치(100)의 컴퓨팅 환경을 수행하기 위한 다른 구성들이 포함될 수 있고, 개시된 구성들 중 일부만이 컴퓨팅 장치(100)를 구성할 수도 있다. The configuration of the computing device 100 shown in FIG. 1 is only a simplified example. In one embodiment of the present disclosure, the computing device 100 may include other components for performing a computing environment of the computing device 100, and only some of the disclosed components may constitute the computing device 100.
본 개시내용에서의 컴퓨팅 장치(100)는 본 개시내용의 실시예들을 구현하기 위한 시스템을 구성하는 노드를 의미할 수 있다. 컴퓨팅 장치(100)는 임의의 형태의 사용자 단말 또는 임의의 형태의 서버를 의미할 수 있다. 전술한 컴퓨팅 장치(100)의 컴포넌트들은 예시적인 것으로 일부가 제외될 수 있거나 또는 추가 컴포넌트가 포함될 수도 있다. 일례로, 전술한 컴퓨팅 장치(100)가 단말을 포함하는 경우, 출력부(미도시) 및 입력부(미도시)가 그 범위 내에 포함될 수 있다.The computing device 100 in the present disclosure may refer to a node constituting a system for implementing embodiments of the present disclosure. The computing device 100 may refer to any type of user terminal or any type of server. Components of the aforementioned computing device 100 are exemplary and some may be excluded or additional components may be included. For example, when the aforementioned computing device 100 includes a terminal, an output unit (not shown) and an input unit (not shown) may be included within its scope.
본 개시내용에서의 컴퓨팅 장치(100)는 후술될 본 개시내용의 실시예들에 따른 기술적 특징들을 수행할 수 있다. 예를 들어, 컴퓨팅 장치(100)는 생물학적 시료에 대한 염기 서열 분석을 수행한 결과를 입력으로 하는 복수의 HLA 타이핑 툴들로부터의 타이핑 결과에 적어도 부분적으로 기초하여 생물학적 시료에 대한 HLA 타입을 결정할 수 있다.The computing device 100 in the present disclosure may perform technical features according to embodiments of the present disclosure to be described later. For example, the computing device 100 may determine the HLA type of the biological sample based at least in part on typing results from a plurality of HLA typing tools that take as input a result of performing sequencing of the biological sample. .
일 실시예에서, 프로세서(110)는 적어도 하나의 코어로 구성될 수 있으며, 컴퓨팅 장치(100)의 중앙 처리 장치(CPU: central processing unit), 범용 그래픽 처리 장치 (GPGPU: general purpose graphics processing unit), 텐서 처리 장치(TPU: tensor processing unit) 등의 데이터 분석 및/또는 처리를 위한 프로세서를 포함할 수 있다. 프로세서(110)는 메모리(130)에 저장된 컴퓨터 프로그램을 판독하여 본 개시내용의 일 실시예에 따라, 생물학적 시료에 대한 염기 서열 분석을 수행한 결과를 입력으로 하는 복수의 HLA 타이핑 툴들로부터의 타이핑 결과에 적어도 부분적으로 기초하여 생물학적 시료에 대한 HLA 타입을 결정할 수 있다. 프로세서(110)는 메모리(130)에 저장된 컴퓨터 프로그램을 판독하여 본 개시내용의 일 실시예에 따라, 복수개의 HLA 타이핑 툴들로부터 획득된 콜(call)들에 포함된 HLA 타입 후보들 및 상기 복수개의 HLA 타이핑 툴들 간의 상호 보완 스코어에 기초하여, 상기 생물학적 시료에 대한 HLA 타입을 결정할 수 있다. In one embodiment, the processor 110 may include at least one core, and may include a central processing unit (CPU) or a general purpose graphics processing unit (GPGPU) of the computing device 100 . , a processor for data analysis and/or processing, such as a tensor processing unit (TPU). The processor 110 reads the computer program stored in the memory 130 and, according to an embodiment of the present disclosure, typing results from a plurality of HLA typing tools that take as input a result of base sequence analysis on a biological sample. The HLA type for the biological sample may be determined based, at least in part, on. The processor 110 reads the computer program stored in the memory 130 and, according to an embodiment of the present disclosure, HLA type candidates included in calls obtained from a plurality of HLA typing tools and the plurality of HLAs An HLA type of the biological sample may be determined based on a complementary score between typing tools.
본 개시의 일 실시예에 따라 프로세서(110)는 신경망의 학습을 위한 연산을 수행할 수도 있다. 프로세서(110)는 딥러닝(DL: deep learning)에서 학습을 위한 입력 데이터의 처리, 입력 데이터에서의 피처 추출, 오차 계산, 역전파(backpropagation)를 이용한 신경망의 가중치 업데이트 등의 신경망의 학습을 위한 계산을 수행할 수 있다. 프로세서(110)의 CPU, GPGPU, 및 TPU 중 적어도 하나가 네트워크 함수의 학습을 처리할 수 있다. 예를 들어, CPU 와 GPGPU가 함께 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수 있다. 또한, 본 개시의 일 실시예에서 복수의 컴퓨팅 장치들의 프로세서들을 함께 사용하여 네트워크 함수의 학습, 네트워크 함수를 이용한 데이터 분류를 처리할 수도 있다. 또한, 본 개시의 일 실시예에 따른 컴퓨팅 장치에서 수행되는 컴퓨터 프로그램은 CPU, GPGPU 또는 TPU 실행가능 프로그램일 수 있다.According to an embodiment of the present disclosure, the processor 110 may perform an operation for learning a neural network. The processor 110 is used for neural network learning, such as processing input data for learning in deep learning (DL), extracting features from input data, calculating errors, and updating neural network weights using backpropagation. calculations can be performed. At least one of the CPU, GPGPU, and TPU of the processor 110 may process learning of the network function. For example, the CPU and GPGPU can process learning of network functions and data classification using network functions. In addition, in one embodiment of the present disclosure, learning of a network function and data classification using a network function may be processed by using processors of a plurality of computing devices together. In addition, a computer program executed in a computing device according to an embodiment of the present disclosure may be a CPU, GPGPU or TPU executable program.
추가적으로, 프로세서(110)는 통상적으로 컴퓨팅 장치(100)의 전반적인 동작을 처리할 수 있다. 예를 들어, 프로세서(110)는 컴퓨팅 장치(100)에 포함된 구성요소들을 통해 입력 또는 출력되는 데이터, 정보, 또는 신호 등을 처리하거나 저장부에 저장된 응용 프로그램을 구동함으로써, 사용자에게 적절한 정보 또는 기능을 제공 또는 처리할 수 있다.Additionally, the processor 110 may typically handle overall operations of the computing device 100 . For example, the processor 110 processes data, information, signals, etc. input or output through components included in the computing device 100 or drives an application program stored in a storage unit, thereby providing appropriate information or information to the user. A function can be provided or processed.
본 개시의 일 실시예에 따르면, 메모리(130)는 프로세서(110)가 생성하거나 결정한 임의의 형태의 정보 및 컴퓨팅 장치(100)가 수신한 임의의 형태의 정보를 저장할 수 있다. 본 개시의 일 실시예에 따르면, 메모리(130)는 프로세서(110)가 본 개시의 실시예들에 따른 동작을 수행하도록 하는 컴퓨터 소프트웨어를 저장하는 저장매체 일 수 있다. 따라서, 메모리(130)는 본 개시내용에 실시예들을 수행하는 데 필요한 소프트웨어 코드, 코드의 실행 대상이 되는 데이터, 코드의 실행 결과를 저장하기 위한 컴퓨터 판독 매체들을 의미할 수 있다.According to one embodiment of the present disclosure, memory 130 may store any type of information generated or determined by processor 110 and any type of information received by computing device 100 . According to one embodiment of the present disclosure, the memory 130 may be a storage medium that stores computer software that causes the processor 110 to perform operations according to embodiments of the present disclosure. Accordingly, the memory 130 may refer to computer readable media for storing software codes necessary for performing embodiments of the present disclosure, data subject to execution of the codes, and results of execution of the codes.
본 개시의 일 실시예에 따르면, 메모리(130)는 임의의 타입의 저장 매체를 의미할 수 있다 예를 들어, 메모리(130)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 컴퓨팅 장치(100)는 인터넷(internet) 상에서 상기 메모리(130)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다. 전술한 메모리에 대한 기재는 예시일 뿐, 본 개시내용에서 사용되는 메모리(130)는 전술한 예시들로 제한되지 않는다.According to an embodiment of the present disclosure, the memory 130 may refer to any type of storage medium. For example, the memory 130 may be a flash memory type, a hard disk type ), multimedia card micro type, card type memory (eg SD or XD memory, etc.), RAM (Random Access Memory, RAM), SRAM (Static Random Access Memory), ROM (Read-Only memory, ROM), electrically erasable programmable read-only memory (EEPROM), programmable read-only memory (PROM), magnetic memory, magnetic disk, and optical disk. The computing device 100 may operate in relation to a web storage that performs a storage function of the memory 130 on the Internet. The description of the above memory is only an example, and the memory 130 used in the present disclosure is not limited to the above example.
본 개시내용에서의 통신부(미도시)는 유선 및 무선 등과 같은 그 통신 양태를 가리지 않고 구성될 수 있으며, 단거리 통신망(PAN: Personal Area Network), 근거리 통신망(WAN: Wide Area Network) 등 다양한 통신망으로 구성될 수 있다. 또한, 상기 네트워크부(150) 공지의 월드와이드웹(WWW: World Wide Web) 기반으로 동작할 수 있으며, 적외선(IrDA: Infrared Data Association) 또는 블루투스(Bluetooth)와 같이 단거리 통신에 이용되는 무선 전송 기술을 이용할 수도 있다.The communication unit (not shown) in the present disclosure may be configured regardless of its communication mode, such as wired and wireless, and may be configured in various communication networks such as a personal area network (PAN) and a wide area network (WAN). can be configured. In addition, the network unit 150 may operate based on the known World Wide Web (WWW), and a wireless transmission technology used for short-range communication such as Infrared Data Association (IrDA) or Bluetooth. can also be used.
본 개시내용에서의 컴퓨팅 장치(100)는 임의의 형태의 사용자 단말 및/또는 임의의 형태의 서버를 포함할 수 있다. 따라서, 본 개시내용의 실시예들은 서버 및/또는 사용자 단말에 의해 수행될 수 있다.The computing device 100 in the present disclosure may include any type of user terminal and/or any type of server. Accordingly, embodiments of the present disclosure may be performed by a server and/or a user terminal.
사용자 단말은 서버 또는 다른 컴퓨팅 장치와 상호작용 가능한 임의의 형태의 단말을 포함할 수 있다. 사용자 단말은 예를 들어, 휴대폰, 스마트 폰(smart phone), 노트북 컴퓨터(laptop computer), PDA(personal digital assistants), 슬레이트 PC(slate PC), 태블릿 PC(tablet PC) 및 울트라북(ultrabook)을 포함할 수 있다. A user terminal may include any type of terminal capable of interacting with a server or other computing device. User terminals include, for example, mobile phones, smart phones, laptop computers, personal digital assistants (PDAs), slate PCs, tablet PCs, and ultrabooks. can include
서버는 예를 들어, 마이크로프로세서, 메인프레임 컴퓨터, 디지털 프로세서, 휴대용 디바이스 및 디바이스 제어기 등과 같은 임의의 타입의 컴퓨팅 시스템 또는 컴퓨팅 장치를 포함할 수 있다. A server may include any type of computing system or computing device, such as, for example, microprocessors, mainframe computers, digital processors, portable devices and device controllers, and the like.
추가적인 실시예에서 서버는 염기 서열 정보 또는 유전자 정보를 저장 및 관리하는 엔티티를 의미할 수도 있다. 서버는 염기 서열 정보, 유전자 정보 및/또는 인덱스 정보를 저장하기 위한 저장부(미도시)를 포함할 수 있으며, 저장부는 서버내에 포함되거나 혹은 서버의 관리 하에 존재할 수 있다. 다른 예시로, 저장부는 서버 외부에 존재하여 서버와 통신가능한 형태로 구현될 수도 있다. 이 경우 서버와는 상이한 다른 외부 서버에 의해 저장부가 관리 및 제어될 수 있다.In an additional embodiment, the server may refer to an entity that stores and manages nucleotide sequence information or gene information. The server may include a storage unit (not shown) for storing nucleotide sequence information, gene information, and/or index information, and the storage unit may be included in the server or exist under the management of the server. As another example, the storage unit may exist outside the server and may be implemented in a form capable of communicating with the server. In this case, the storage unit may be managed and controlled by another external server different from the server.
도 2는 본 개시내용의 일 실시예에 따른 HLA 타입을 결정하기 위한 예시적인 방법을 도시한다. 2 illustrates an exemplary method for determining HLA type according to one embodiment of the present disclosure.
일 실시예에서, 도 2에서 도시되는 단계들은 컴퓨팅 장치(100)에 의해 수행될 수 있다. 추가적인 실시예에서, 도 2에서 도시되는 단계들 중 일부는 사용자 단말에서 수행되고 다른 일부는 서버에서 수행되는 방식과 같이 도 2에서의 단계들은 복수의 엔티티들에 의해 구현될 수도 있다.In one embodiment, the steps shown in FIG. 2 may be performed by computing device 100 . In a further embodiment, the steps in FIG. 2 may be implemented by a plurality of entities, such that some of the steps shown in FIG. 2 are performed in a user terminal and others are performed in a server.
도 2에서 도시되는 바와 같이, 컴퓨팅 장치(100)는 피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득할 수 있다(210).As shown in FIG. 2 , the computing device 100 may obtain a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from a subject (210).
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는 염기 서열 분석(예컨대, NGS)를 수행한 결과를 서버 또는 외부 엔티티 등으로부터 획득할 수 있다. 다른 실시예에서, 컴퓨팅 장치(100)는 피검체 유래의 생물학적 시료로부터 획득된 유전자 데이터(예컨대, DNA 또는 RNA)에 대한 염기 서열 분석을 수행할 수도 있다.In one embodiment of the present disclosure, the computing device 100 may obtain a result of performing nucleotide sequence analysis (eg, NGS) from a server or an external entity. In another embodiment, the computing device 100 may perform nucleotide sequence analysis on genetic data (eg, DNA or RNA) obtained from a biological sample derived from a subject.
컴퓨팅 장치(100)는 복수개의 HLA 타이핑 툴들로부터 획득된 콜들에 포함된 HLA 타입 후보들 및 복수개의 HLA 타이핑 툴들 간의 상호 보완 스코어에 기초하여, 생물학적 시료에 대한 HLA 타입을 결정할 수 있다(220).The computing device 100 may determine the HLA type of the biological sample based on the HLA type candidates included in the calls obtained from the plurality of HLA typing tools and the complementary score between the plurality of HLA typing tools (220).
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는 복수의 HLA 타이핑 툴들 중에서 선택된 3개 이상의 툴(tool)들을 사용하여, 염기 서열 분석의 결과로부터 HLA 타입을 결정할 수 있다. 예를 들어, 컴퓨팅 장치는 OptiType, HLA-HD, PHLAT, HLAscan, 및 HLA*LA 중 선택된 3개 또는 4개의 조합으로부터 얻어진 HLA 타입(또는 HLA 타입 후보들)으로부터 최종 HLA 타입을 결정할 수 있다. 전술한 HLA 타이핑 툴들에 대한 명칭은 설명의 편의를 위한 예시의 목적을 사용되었으며, 구현의 양태에 따라 추가적인 HLA 타이핑 툴들이 사용될 수도 있거나 상술한 HLA 타이핑 툴들 중 일부만이 사용될 수도 있다.In one embodiment of the present disclosure, the computing device 100 may use three or more tools selected from among a plurality of HLA typing tools to determine the HLA type from the result of sequencing. For example, the computing device may determine the final HLA type from the HLA type (or HLA type candidates) obtained from a combination of three or four selected from among OptiType, HLA-HD, PHLAT, HLAscan, and HLA*LA. The names of the aforementioned HLA typing tools are used for illustrative purposes for convenience of explanation, and additional HLA typing tools may be used or only some of the aforementioned HLA typing tools may be used according to implementation aspects.
본 개시내용에서 HLA 타이핑 툴로부터의 콜(call)이란, HLA 타이핑 툴에서 출력되는 HLA 타이핑 결과를 의미할 수 있다. 예를 들어, 복수의 HLA 타이핑 툴들 각각으로부터 출력되는 HLA 타입 후보들이 HLA 타이핑 툴로부터의 콜들과 대응될 수 있다.In the present disclosure, a call from an HLA typing tool may mean an HLA typing result output from the HLA typing tool. For example, HLA type candidates output from each of a plurality of HLA typing tools may correspond to calls from the HLA typing tool.
복수의 HLA 타이핑 툴들 별로 정확성 및/또는 가용성이 상이할 수 있다. 본 개시내용의 일 실시예에 따른 기법은 복수의 툴들의 결과들을 신규한 알고리즘을 통해 조합함으로써, 정확성 및/또는 가용성이 높은 HLA 타이핑이 달성될 수 있다. Accuracy and/or usability may be different for each of the plurality of HLA typing tools. In the technique according to an embodiment of the present disclosure, HLA typing with high accuracy and/or usability can be achieved by combining results of a plurality of tools through a novel algorithm.
본 개시내용의 발명자들은 개인의 인간 백혈구 항원(Human Leukocyte Antigen; HLA) 타입을 보다 정확히 판정할 수 있는 방법을 예의 연구한 결과, 차세대 염기서열 분석(NGS)과 같은 염기 서열 데이터를 이용하여 보다 정확한 HLA 타입을 예측할 수 있는 최적의 방법을 개발하였는바, 이에 기초하여 본 발명을 완성하였다. The inventors of the present disclosure, as a result of intensive research on a method for more accurately determining a person's Human Leukocyte Antigen (HLA) type, more accurately use base sequence data such as next-generation sequencing (NGS). An optimal method for predicting the HLA type was developed, and based on this, the present invention was completed.
이를 통해 복수의 툴들을 조합함으로써 그리고 복수의 툴들 간의 상호 보안 스코어를 이용함으로써 HLA 타입을 정확하게 예측할 수 있으며, 이러한 HLA 타입 예측을 통해서 개별화된 의료 개입 여부를 보다 효율적으로 결정할 수 있다는 효과가 도출될 수 있다. Through this, it is possible to accurately predict the HLA type by combining a plurality of tools and by using the mutual security score between the plurality of tools, and through such HLA type prediction, an effect that individualized medical intervention can be determined more efficiently can be derived. there is.
본 개시내용의 발명자들은 복수개의 HLA 타이핑 툴들을 모두 혹은 적어도 일부 이용하는 경우 그리고 복수의 HLA 타이핑 툴들 간의 상호 보완 스코어를 이용하는 경우, 특히 HLA Class I 타이핑의 정확도가 현저히 향상됨을 확인하였는 바, 본 개시내용의 실시예들이 신뢰도가 향상된 최적의 HLA 타입 결정 방법임을 알 수 있었다. 따라서 본 발명의 일 실시예에 따른 HLA 타입 결정 방법을 이용하는 경우, 이식 성공률을 높이기 위한 조직 적합성 테스트뿐만 아니라, PCR-SBT 추가 수행 여부 판단 등 의료 개인화가 가능해질 것으로 기대된다.The inventors of the present disclosure have confirmed that the accuracy of HLA Class I typing is significantly improved when all or at least some of a plurality of HLA typing tools are used and when a mutual complement score between a plurality of HLA typing tools is used, in particular, the present disclosure It was found that the embodiments of are the optimal HLA type determination method with improved reliability. Therefore, when using the HLA type determination method according to an embodiment of the present invention, it is expected that personalization of medical care, such as determining whether to additionally perform PCR-SBT as well as histocompatibility testing to increase the transplant success rate, is expected.
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는 복수의 HLA 타이핑 툴들 중에서 콜을 제시한 툴의 개수를 결정하고 그리고 결정된 툴의 개수에 기초하여, 상기 HLA 타입을 결정할 수 있다. 각각의 HLA 타이핑 툴들은 각자의 고유 알고리즘을 통해 HLA 타이핑 결과를 포함하는 콜을 출력할 수 있다. 예컨대, 컴퓨팅 장치(100)는 콜을 제시한 툴이 총 5개이고, 5개의 툴에서 제시한 콜에 포함된 HLA 타입이 모두 일치하는 경우 또는 4개가 일치하는 경우, 일치하는 HLA 타입을 최종 HLA 타입으로 결정할 수 있다. 컴퓨팅 장치(100)는 복수의 HLA 타이핑 툴들 중에서 콜을 제시한 툴의 개수를 결정하고, 제시된 콜들에 포함된 HLA 타입 후보들 간의 일치도를 결정하고, 그리고 상기 결정된 툴의 개수 및 상기 결정된 일치도에 기초하여, 상기 HLA 타입을 결정할 수 있다. In one embodiment of the present disclosure, the computing device 100 may determine the number of tools that presented calls among a plurality of HLA typing tools and determine the HLA type based on the determined number of tools. Each HLA typing tool may output a call including an HLA typing result through its own unique algorithm. For example, if there are a total of 5 tools presenting calls, and all HLA types included in the calls presented by the 5 tools match or all 4 tools match, the matching HLA type is selected as the final HLA type. can be determined by The computing device 100 determines the number of tools that present calls from among a plurality of HLA typing tools, determines the degree of agreement between HLA type candidates included in the presented calls, and based on the determined number of tools and the determined degree of agreement , It is possible to determine the HLA type.
예를 들어, 콜을 제시한 툴들의 개수가 너무 적거나(예컨대, 2개의 툴에서만 콜을 제시함) 그리고/또는 콜에 포함된 HLA 타입 후보 중 서로 일치하는 HLA 타입이 2개인 경우에는 복수의 툴들로부터 획득된 HLA 타입 후보에 대한 신뢰도가 낮다고 결정될 수 있다. 반대의 경우, 콜들의 개수가 특정 임계값보다 많고 그리고/또는 콜의 포함된 HLA 타입 후보의 일치도가 특정 임계값보다 높다고 결정되는 경우, 최종 결정되는 HLA 타입의 신뢰도가 높다고 결정될 수 있다. 신뢰도가 높다고 결정되는 경우, 결정되는 HLA 타입이 최종 HLA 타입으로 결정 및 출력될 수 있다.For example, if the number of tools presenting a call is too small (eg, only two tools present a call) and/or there are two HLA type candidates among the HLA type candidates included in the call, a plurality of It may be determined that the reliability of the HLA type candidate obtained from the tools is low. In the opposite case, when it is determined that the number of calls is greater than a specific threshold and/or the degree of matching of HLA type candidates included in the call is higher than a specific threshold, it may be determined that the reliability of the finally determined HLA type is high. When it is determined that the reliability is high, the determined HLA type may be determined and output as the final HLA type.
여기서 일치도는 HLA 타이핑을 수행하는 툴에서 제시된 콜에 포함된 HLA 타입이 일치하는 콜들의 개수를 나타낼 수 있다. 예를 들어, OptiType, HLA-HD, PHLAT, HLAscan, 및 HLA*LA에서 모두 콜을 제시하였으며, 이 중 3개의 콜에 포함된 HLA 타입이 동일한 경우, 일치도는 3/5으로 표현될 수 있으며, 이 중 4개의 콜들에 포함된 HLA 타입이 동일한 경우 일치도는 4/5로 표현될 수 있다. 일치도에 대한 표현 방식 및 계산 방식을 전술한 예시에 국한되는 것은 아니며, 본 개시내용의 범위를 벗어나지 않는 한 콜에 포함된 HLA 타입의 동일성을 나타내는 임의의 형태의 방식이 일치도의 범위 내에 포함될 수 있다.Here, the degree of coincidence may indicate the number of calls in which the HLA type included in the call presented by the tool performing HLA typing matches. For example, OptiType, HLA-HD, PHLAT, HLAscan, and HLA*LA all presented calls, and if the HLA types included in three of these calls are the same, the degree of concordance can be expressed as 3/5, If the HLA types included in four of these calls are the same, the degree of concordance may be expressed as 4/5. The expression method and calculation method for the degree of concordance are not limited to the above examples, and any form of method indicating the identity of the HLA type included in the call may be included within the scope of the degree of concordance as long as it does not depart from the scope of the present disclosure. .
본 개시내용의 일 실시예에서, 컴퓨팅 장치는 복수의 툴들에서 제시한 콜들 중 사용가능한 콜들의 개수를 결정하고, 상기 사용가능한 콜들의 개수에 기초하여, 상기 HLA 타입을 결정하기 위한 일치도 기준을 생성하고, 그리고 상기 생성된 일치도 기준에 기초하여, 상기 HLA 타입을 결정할 수 있다. 여기서, 일치도 기준이란 HLA 타입을 결정하기 위한 일치도 임계치를 나타낼 수 있다. 또한, 사용가능한 콜이란 HLA 타이핑 툴에서 제시한 콜들 중 HLA 타입을 결정하는데 사용이 가능한 콜을 의미할 수 있다. 다른 실시예에서, 사용가능한 콜이란 복수의 HLA 타이핑 툴들에서 제시한 모든 콜들을 의미할 수도 있다. 이러한 예시에서는, 콜을 제시하지 않은 툴을 제외하고 나머지 툴에서 제시한 콜들이 사용가능한 콜로서 고려될 수 있다.In one embodiment of the present disclosure, a computing device determines the number of available calls among calls presented by a plurality of tools, and based on the number of available calls, generates a matching criterion for determining the HLA type. And, based on the generated matching criterion, the HLA type may be determined. Here, the match criterion may indicate a match threshold for determining the HLA type. Also, the usable call may mean a call usable for determining an HLA type among calls presented by the HLA typing tool. In another embodiment, available calls may mean all calls presented by a plurality of HLA typing tools. In this example, calls presented by the remaining tools, except for the tool that did not present the call, may be considered usable calls.
일치도 기준은 사용가능한 콜들의 개수에 따라 가변될 수 있다. 다른 예시로, 일치도 기준은 사용가능한 콜들의 개수와 콜에 포함되는 HLA 타입 후보가 무엇인지에 따라 가변될 수 있다.The consistency criterion may vary according to the number of available calls. As another example, the consistency criterion may vary depending on the number of available calls and HLA type candidates included in the calls.
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는, 복수의 HLA 타이핑 툴들 중 5개의 방법에서만 특정 타입이 제시되었을 경우, 5개의 방법에서 모두 동일하게 제시된 HLA 타입 후보를 최종 HLA 타입으로 결정할 수도 있거나, 3개 또는 4개의 방법에서 동일하게 제시된 HLA 타입 후보를 최종 HLA 타입으로 결정할 수 있으나, 본 개시내용의 범위가 이에 제한되는 것은 아니다.In one embodiment of the present disclosure, the computing device 100 determines, when a specific type is presented only in five methods among a plurality of HLA typing tools, an HLA type candidate identically presented in all five methods as the final HLA type. Alternatively, the HLA type candidate presented identically in three or four methods may be determined as the final HLA type, but the scope of the present disclosure is not limited thereto.
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는, HLA 타입을 분석하는 과정 중, 복수의 HLA 타이핑 툴들 중 하나 이상의 툴에서 다중 콜을 제시하는 경우, 상기 다중 콜을 제시한 HLA 타이핑 툴로부터의 결과는 최종 HLA 타입을 결정하는데 있어서 제외하는 것으로 결정할 수도 있다. 즉, 컴퓨팅 장치(100)는 이러한 경우, 다중 콜에 대해서는 사용 가능하지 않은 것으로 결정할 수 있으나, 이에 제한되는 것은 아니다.In one embodiment of the present disclosure, the computing device 100, during the process of analyzing the HLA type, when multiple calls are presented by one or more tools among a plurality of HLA typing tools, the HLA typing tool presenting the multiple calls The result from may be determined to be excluded in determining the final HLA type. That is, the computing device 100 may determine that it is not usable for multiple calls in this case, but is not limited thereto.
본 개시내용의 일 실시예에서, 컴퓨팅 장치(100)는 HLA 타입을 결정하는데 있어서 복수개의 HLA 타이핑 툴들 중 어느 2개의 타이핑 툴들 간의 상호 보완 스코어를 계산하고 그리고 상기 상호 보완 스코어에 기초하여, 상기 생물학적 시료에 대한 상기 HLA 타입을 결정할 수 있다.In one embodiment of the present disclosure, the computing device 100 calculates a complementary score between any two typing tools among a plurality of HLA typing tools in determining the HLA type, and based on the complementary score, the biological The HLA type for the sample can be determined.
일 실시예에서, 상호 보완 스코어는, 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 HLA 타입을 결정하는데 함께 이용될 수 있는 가능성을 정량적으로 나타내는 값을 포함할 수 있다. 예를 들어, 상호 보완 스코어는 2개의 HLA 타이핑 툴들의 조합에 대응하여 생성될 수 있다. 예를 들어, A, B, C, 및 D를 포함하는 4개의 HLA 타이핑 툴들이 존재한다고 가정할 때, A와 B, A와 C, A와 D, B와 A, B와 C, B와 D, C와 A, C와 B, C와 D, D와 A, D와 B 및 D와 C에 대응하는 개수의 상호 보완 스코어가 생성될 수 있다. 다른 예시에서, A, B, C, 및 D를 포함하는 4개의 HLA 타이핑 툴들이 존재한다고 가정할 때, A와 B, A와 C, A와 D, B와 C, B와 D, 및 C와 D에 대응하는 개수의 상호 보완 스코어가 생성될 수도 있다.In one embodiment, the complementarity score may include a value quantitatively indicating the possibility that any two HLA typing tools among a plurality of HLA typing tools can be used together to determine the HLA type. For example, a complementary score may be generated corresponding to a combination of two HLA typing tools. For example, assuming that there are four HLA typing tools including A, B, C, and D, A and B, A and C, A and D, B and A, B and C, and B and D , C and A, C and B, C and D, D and A, D and B, and D and C, the number of complementary scores corresponding to each other may be generated. In another example, assuming that there are four HLA typing tools including A, B, C, and D, A and B, A and C, A and D, B and C, B and D, and C and A number of complementary scores corresponding to D may be generated.
전술한 바와 같이, 상호 보완 스코어는 2개의 HLA 타이핑 툴들 중 어느 하나를 사용하였을 경우에 비해, 다른 하나를 함께 사용하였을 때의 보완 가능성을 나타낼 수 있다. 추가적인 실시예에서, 상호 보완 스코어는 2개가 아닌 3개 이상의 HLA 타이핑 툴들의 조합에 대한 스코어를 나타낼 수도 있다.As described above, the mutual complementation score may indicate the possibility of complementation when one of the two HLA typing tools is used together, compared to when either one of the two HLA typing tools is used. In a further embodiment, the complementary score may represent a score for a combination of three or more HLA typing tools rather than two.
일 실시예에서, 상호 보완 스코어는, 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 함께 사용되었을 때의, 상기 결정되는 HLA 타입의 정확성을 정량적으로 나타내는 값을 포함할 수 있다. 예를 들어, 하나의 HLA 타이핑 툴에서의 HLA 타이핑 결과와 실제 HLA 타입 간의 비교 결과에 대한 정확성이 70%라고 한다고 가정한다. 이러한 가정 하에서, 상기 하나의 HLA 타이핑 툴과 상이한 다른 하나의 HLA 타이핑 툴에서 출력되는 결과를 함께 참고하여 결정되는 최종 HLA 타이핑 결과에 대한 정확성이 85%라고 한다면, 이러한 2개의 HLA 타이핑 툴들 간의 상호 보완 스코어는 상대적으로 높은 값을 갖도록 설정될 수 있다. 반대로, 2개의 HLA 타이핑 툴들을 조합하더라도 하나의 HLA 타이핑 툴의 결과에 비해 정확성이 높지 않는 경우에는 상대적으로 낮은 상호 보완 스코어가 설정될 수 있다.In one embodiment, the complementary score may include a value quantitatively indicating the accuracy of the determined HLA type when any two HLA typing tools among a plurality of HLA typing tools are used together. For example, it is assumed that the accuracy of the comparison result between the HLA typing result in one HLA typing tool and the actual HLA type is 70%. Under this assumption, if the accuracy of the final HLA typing result determined by referring to the results output from the one HLA typing tool and the other HLA typing tool, which is different from the one HLA typing tool, is 85%, the mutual complement between these two HLA typing tools The score may be set to have a relatively high value. Conversely, when the accuracy is not higher than that of one HLA typing tool even when two HLA typing tools are combined, a relatively low complementary score may be set.
일 실시예에서, 상호 보완 스코어는, 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 함께 사용되었을 때의 상기 2개의 HLA 타이핑 툴들에서 획득된 콜들에 포함된 HLA 타입 후보들에 적용될 보정값을 정량적으로 나타내는 값을 포함할 수 있다.In one embodiment, the complementary score is a quantitative correction value to be applied to HLA type candidates included in calls obtained from a plurality of HLA typing tools when any two HLA typing tools are used together. It may contain a value represented by .
예를 들어, 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴을 함께 사용하였을 때, 제 1 HLA 타이핑 툴에 대한 제 1 정확성 수치값에 제 1 HLA 타이핑 툴에 대한 제 2 HLA 타이핑 툴의 조합에 따른 제 1 상호 보완 스코어링 값이 보정값으로서 추가될 수 있다. 이러한 예시에서, 제 1 HLA 타이핑 툴은 제 2 HLA 타이핑 툴과 함께 사용되는 경우 제 1 HLA 타이핑 툴에 내재된 제 1 정확성 수치값과 상기 제 1 상호 보완 스코어링에 대응되는 보정값이 합쳐진 정확성 값을 가질 수 있다.For example, when a first HLA typing tool and a second HLA typing tool are used together, a first accuracy numerical value for the first HLA typing tool is combined with a second HLA typing tool for the first HLA typing tool. A first complementary scoring value may be added as a correction value. In this example, the first HLA typing tool, when used in conjunction with the second HLA typing tool, generates an accuracy value obtained by adding a first accuracy numerical value inherent in the first HLA typing tool and a correction value corresponding to the first complementary scoring. can have
다른 예시에서, 제 2 HLA 타이핑 툴과 제 1 HLA 타이핑 툴을 함께 사용하였을 때, 제 2 HLA 타이핑 툴에 대한 제 2 정확성 수치값에 제 2 HLA 타이핑 툴에 대한 제 1 HLA 타이핑 툴의 조합에 따른 제 2 상호 보완 스코어링 값이 보정값으로서 추가될 수 있다. 이러한 예시에서, 제 2 HLA 타이핑 툴은 제 1 HLA 타이핑 툴과 함께 사용되는 경우 제 2 HLA 타이핑 툴에 내재된 제 2 정확성 수치값과 상기 제 2 상호 보완 스코어링에 대응되는 보정값이 합쳐진 정확성 값을 가질 수 있다.In another example, when the second HLA typing tool and the first HLA typing tool are used together, according to the combination of the first HLA typing tool with respect to the second HLA typing tool to the second accuracy numerical value for the second HLA typing tool. A second complementary scoring value may be added as a correction value. In this example, the second HLA typing tool, when used in conjunction with the first HLA typing tool, generates an accuracy value that is the sum of a second accuracy numerical value inherent in the second HLA typing tool and a correction value corresponding to the second complementary scoring. can have
본 개시의 일 실시예에서, 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴 간의 상호 보완 스코어는, 생물학적 시료에 대하여 상기 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜에 대한 결과가 틀렸을 때, 상기 생물학적 시료에 대하여 상기 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜에 대한 결과의 정확성을 정량적으로 나타내는 값을 포함할 수 있다. 예를 들어, 제 1 콜에 대한 결과가 틀렸을 때, 제 2 콜에 대한 결과가 맞을 가능성이 높다면, 상기 상호 보완 스코어가 높은 값으로 설정될 수 있다. In one embodiment of the present disclosure, a complementary score between a first HLA typing tool and a second HLA typing tool among a plurality of HLA typing tools is a result of a first call obtained from the first HLA typing tool for a biological sample. may include a value quantitatively indicating the accuracy of the result for the second call obtained from the second HLA typing tool for the biological sample when is wrong. For example, if the result of the first call is incorrect and the probability of the result of the second call being correct is high, the complementary score may be set to a high value.
본 개시의 일 실시예에서, 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴 간의 상호 보완 스코어는, 상기 제 1 HLA 타이핑 툴이 상기 제 2 HLA 타이핑 툴과 함께 사용되었을 때의 상기 결정된 HLA 타입에 대한 정확성 값이, 상기 제 1 HLA 타이핑 툴에 대해 사전결정된 제 1 정확성 값과 비교한 결과를 정량적으로 나타내는 값을 포함할 수도 있다. 예를 들어, 제 1 HLA 타이핑 툴에 내재된 제 1 정확성 값과 상기 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴이 함께 사용되었을 때의 정확성 값의 차이가 상호 보완 스코어를 나타낼 수 있다.In one embodiment of the present disclosure, a complementary score between a first HLA typing tool and a second HLA typing tool among a plurality of HLA typing tools is obtained when the first HLA typing tool is used together with the second HLA typing tool. The determined accuracy value for the HLA type may include a value quantitatively indicating a result of comparison with a predetermined first accuracy value for the first HLA typing tool. For example, a difference between a first accuracy value inherent in the first HLA typing tool and an accuracy value when the first HLA typing tool and the second HLA typing tool are used together may represent a complementary score.
본 개시의 일 실시예에서, 컴퓨팅 장치(100)는 상호 보완 스코어의 값에 기초하여 복수의 HLA 타이핑 툴들을 조합할지 여부를 결정할 수 있다. 예를 들어, 컴퓨팅 장치(100)는, 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜과 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜을 조합할지 여부를 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어에 기초하여 할 수 있다. 이러한 조합 여부에 대한 결정은 사전결정된 임계값과 상호 보완 스코어 간의 비교에 따라 수행될 수 있다. 또는, 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴이 조합되는 경우 제 1 HLA 타이핑 툴에 내재된 정확성 또는 제 2 HLA 타이핑 툴에 내재된 정확성을 초과하는 정확성을 가진다는 점이 상호 보완 스코어를 통해 판단되는 경우, 컴퓨팅 장치(100)는 상기 2개의 HLA 타이핑 툴들을 조합하는 것으로 결정할 수 있다. 반대로, 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴이 조합되는 경우 제 1 HLA 타이핑 툴에 내재된 정확성 또는 제 2 HLA 타이핑 툴에 내재된 정확성 미만의 정확성을 가진다는 점이 상호 보완 스코어를 통해 판단되는 경우, 컴퓨팅 장치(100)는 상기 2개의 HLA 타이핑 툴들을 조합하는 것으로 결정할 수 있다.In one embodiment of the present disclosure, the computing device 100 may determine whether to combine a plurality of HLA typing tools based on the value of the complementarity score. For example, the computing device 100 determines whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among a plurality of HLA typing tools. based on a first complementary score between the tool and the second HLA typing tool. Determining whether or not to combine such a combination may be performed according to a comparison between a predetermined threshold and a mutual complement score. Alternatively, when the first HLA typing tool and the second HLA typing tool are combined, it is determined through the complementary score that the first HLA typing tool has an accuracy that exceeds the accuracy inherent in the first HLA typing tool or the accuracy inherent in the second HLA typing tool. If so, the computing device 100 may determine to combine the two HLA typing tools. Conversely, when the first HLA typing tool and the second HLA typing tool are combined, the accuracy inherent in the first HLA typing tool or the accuracy inherent in the second HLA typing tool is determined through the complementary score. In this case, the computing device 100 may determine to combine the two HLA typing tools.
본 개시의 일 실시예에서, 컴퓨팅 장치(100)는 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜과 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜을 조합할지 여부를, 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어, 상기 제 1 HLA 타이핑 툴에 대한 사전 결정된 제 1 정확성 값 및 상기 제 2 HLA 타이핑 툴에 대한 사전 결정된 제 2 정확성 값에 기초하여 결정할 수 있다. 예를 들어, 제 1 HLA 타이핑 툴에 내재된 제 1 정확성 값과 제 2 HLA 타이핑 툴에 내재된 제 2 정확성 값과 함께 제 1 HLA 타이핑 툴에 제 2 HLA 타이핑 툴이 조합되었을 때의 상호 보완 스코어를 인자들로 활용하여, 컴퓨팅 장치(100)는 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴을 조합하여 HLA 타이핑 결과를 출력할지 여부를 결정할 수 있다.In one embodiment of the present disclosure, the computing device 100 determines whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among a plurality of HLA typing tools, the based on a first complementarity score between a first HLA typing tool and a second HLA typing tool, a first predetermined accuracy value for the first HLA typing tool and a second predetermined accuracy value for the second HLA typing tool can be determined by For example, a complementary score when a first HLA typing tool is combined with a second HLA typing tool together with a first accuracy value inherent in the first HLA typing tool and a second accuracy value inherent in the second HLA typing tool. Using as factors, the computing device 100 may determine whether to output an HLA typing result by combining the first HLA typing tool and the second HLA typing tool.
본 개시의 일 실시예에서, 컴퓨팅 장치(100)는 상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜 및 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜에 적용될 보정값을 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어에 기초하여 결정할 수 있다. 컴퓨팅 장치(100)는 보정값에 기초하여 생물학적 시료에 대응하는 HLA 타입을 결정할 수 있다. 예를 들어, 2개의 HLA 타이핑 툴로부터 획득된 콜들이 서로 일치하는 경우, 그리고 2개의 툴들 간의 상호 보완 스코어가 상대적으로 높은 값을 갖는 경우(예컨대, 사전결정된 임계값 이상의 값을 갖는 경우), 컴퓨팅 장치(100)는 상기 일치하는 2개의 콜들에 대응하는 HLA 타입으로 최종 HLA 타입을 결정할 수 있다. 이러한 예시에서, 컴퓨팅 장치(100)는 상기 2개의 HLA 타이핑 툴들 이외의 다른 HLA 타이핑 툴들로부터의 콜들과 이들의 상호 보완 스코어를 함께 고려하여, 어떠한 툴들로부터의 결과를 HLA 타이핑 결과로 사용할지를 결정할 수 있다.In one embodiment of the present disclosure, the computing device 100 determines a correction value to be applied to a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools. It may be determined based on a first complementary score between the first HLA typing tool and the second HLA typing tool. The computing device 100 may determine the HLA type corresponding to the biological sample based on the correction value. For example, when calls obtained from two HLA typing tools match each other, and when the complementary score between the two tools has a relatively high value (eg, when it has a value greater than or equal to a predetermined threshold value), computing The device 100 may determine the final HLA type as the HLA type corresponding to the two matching calls. In this example, the computing device 100 may consider calls from HLA typing tools other than the two HLA typing tools together with their complementary scores to determine which tool results to use as the HLA typing result. there is.
본 개시의 일 실시예에서, 컴퓨팅 장치(100)는 상호 보완 스코어에 기초하여 복수개의 HLA 타이핑 툴들에 포함된 알고리즘들 간의 유사도를 결정할 수 있다. 제 1 HLA 타이핑 툴에 대한 제 2 HLA 타이핑 툴의 상호 보완 스코어는 제 1 HLA 타이핑 툴의 결과가 틀렸을 때, 제 2 HLA 타이핑 툴의 결과가 맞을 가능성을 나타내는 지표로 사용될 수 있다. 이는 제 1 HLA 타이핑 툴의 타이핑 알고리즘과 제 2 HLA 타이핑 툴의 알고리즘 간의 차이를 나타내는 지표로도 활용될 수 있다. 따라서, 본 개시의 일 실시예에 따라, 컴퓨팅 장치(100)는 계산된 상호 보완 스코어에 기초하여, 각 HLA 타이핑 툴에 대한 타이핑 방식 또는 타이핑 알고리즘의 유사한 정도 혹은 차이의 정도를 계산할 수 있다.In one embodiment of the present disclosure, the computing device 100 may determine a degree of similarity between algorithms included in a plurality of HLA typing tools based on the complementary score. The complementary score of the second HLA typing tool with respect to the first HLA typing tool may be used as an index indicating the possibility that the result of the second HLA typing tool is correct when the result of the first HLA typing tool is incorrect. This can also be used as an index indicating a difference between the typing algorithm of the first HLA typing tool and the algorithm of the second HLA typing tool. Accordingly, according to an embodiment of the present disclosure, the computing device 100 may calculate similarities or differences between typing methods or typing algorithms for each HLA typing tool based on the calculated complementarity score.
도 3은 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.3 illustrates an example algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
도 3 내지 도 5에서 기재된 HLA 타이핑 툴들은 예시적인 목적을 위해 사용된 것이며, 구현에 따라 추가적인 HLA 타이핑 툴이 사용될 수 있거나 또는 이들 중 일부만이 사용될 수도 있다. 일례로 추가적인 HLA 타이핑 툴들은 Polysolver, HLAreporter, HLAforest 및 HLAminer 등과 같이 HLA 타이핑을 위한 임의의 형태의 툴들을 포함할 수 있다.The HLA typing tools described in FIGS. 3-5 are used for illustrative purposes, and depending on the implementation, additional HLA typing tools or only some of them may be used. As an example, additional HLA typing tools may include any type of tools for HLA typing, such as Polysolver, HLAreporter, HLAforest, and HLAminer.
도 3 내지 도 5에서 예시적으로 기재된 HLA 타이핑 툴들 중 Opt는 OptiType을 나타내며, HD는 HLA-HD (HLA typing from High-quality Dictionary)를 나타내며, Phlat, SeqLA 및 kourami는 각각 그 자체로 PHLAT, seq2HLA 및 kourami를 나타내며, arcas는 arcasHLA를 나타내며, Scan은 HLAscan을 나타내며, 그리고 *LA는 HLA*LA를 나타내기 위해 사용되었다.Among the HLA typing tools illustratively described in FIGS. 3 to 5, Opt represents OptiType, HD represents HLA-HD (HLA typing from High-quality Dictionary), and Phlat, SeqLA, and kourami are PHLAT and seq2HLA, respectively, by themselves. and kourami, arcas denotes arcasHLA, Scan denotes HLAscan, and *LA was used to denote HLA*LA.
일 실시예에서, 도 3은 상호 보완 스코어를 결정하기 위한 인자 중 하나인 정정 스코어(correction score)를 표현하기 위한 예시적인 자료 구조를 도시한다.In one embodiment, FIG. 3 shows an exemplary data structure for expressing a correction score, which is one of factors for determining a complementary score.
도 3에서 참조번호 300으로 도시되는 자료 구조(300)는 8개의 HLA 타이핑 툴들 중 maintype의 HLA 타이핑 툴들 각각에 대해서 subtype의 HLA 타이핑 툴들 각각이 조합되는 경우의, maintype의 HLA 타이핑 툴에 대한 결과를 subtype의 HLA 타이핑 툴이 정정(correction)할 수 있는 스코어를 나타낸다. 상기 자료 구조(300)는 대량의 샘플들에 대해서 복수의 HLA 타이핑 툴들을 각각 조합하여 얻은 결과이다.The data structure 300 shown by reference numeral 300 in FIG. 3 shows the result of the maintype HLA typing tool when each of the subtype HLA typing tools is combined for each of the maintype HLA typing tools among eight HLA typing tools. Indicates the score that the subtype's HLA typing tool can correct. The data structure 300 is a result obtained by combining a plurality of HLA typing tools for a large amount of samples.
도 3에서 도시되는 바와 같이, 특정 maintype의 제 1 HLA 타이핑 툴에 대한 특정 subtype의 제 2 HLA 타이핑 툴의 정정 스코어(correction score)는, 대량의 샘플들을 대상으로 한 실험에서, 제 1 HLA 타이핑 툴에 대한 결과가 틀린 횟수 정보 및 상기 제 1 HLA 타이핑 툴에 대한 결과가 틀렸을 때 제 2 HLA 타이핑 툴에 대한 결과가 맞는 횟수 정보에 기초하여 결정될 수 있다. 이러한 정정 스코어는 제 1 HLA 타이핑 툴에 대한 결과가 틀렸을 때 제 2 HLA 타이핑 툴에 대한 결과가 맞는 횟수에 대한 값이 클수록 높은 값을 가질 수 있다. 이처럼 정정 스코어는 특정한 HLA 타이핑 툴을 사용하였을 때의 결과를 다른 HLA 타이핑 툴을 통해 보정해줄 수 있는 가능성을 정량적으로 나타낸다.As shown in FIG. 3, the correction score of the second HLA typing tool of a specific subtype for the first HLA typing tool of a specific maintype is, in an experiment targeting a large number of samples, the first HLA typing tool It may be determined based on information on the number of times the result for is wrong and information on the number of times the result for the second HLA typing tool is correct when the result for the first HLA typing tool is wrong. The correction score may have a higher value as a value for the number of times that the result of the second HLA typing tool is correct when the result of the first HLA typing tool is incorrect. As such, the correction score quantitatively indicates the possibility of correcting the result of using a specific HLA typing tool through another HLA typing tool.
도 3에서 보여지는 정정 스코어의 값이 클수록 maintype의 HLA 타이핑 툴을 subtype의 HLA 타이핑 툴이 정정해줄 가능성이 높다는 것을 나타낸다. 정정 스코어의 값이 클수록 상호 보완 스코어의 값이 클 수 있다.As the value of the correction score shown in FIG. 3 increases, it indicates that the HLA typing tool of the subtype is more likely to correct the HLA typing tool of the maintype. As the value of the correction score increases, the value of the mutual complementation score may increase.
도 3에서 도시되는 예시에서, 정정 스코어의 값은 0 내지 1의 범위 내에 포함될 수 있다. 이러한 예시에서, 정정 스코어의 값이 1에 가까워질수록 해당 subtype이 해당 maintype의 결과를 정정해서 정확한 값을 출력할 가능성이 높다는 것을 의미할 수 있다.In the example shown in FIG. 3 , the value of the correction score may be included in the range of 0 to 1. In this example, the closer the value of the correction score is to 1, the higher the possibility that the subtype corrects the result of the maintype and outputs an accurate value.
도 4는 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.4 illustrates an exemplary algorithm for determining a complementarity score, according to one embodiment of the present disclosure.
일 실시예에서, 도 4는 상호 보완 스코어를 결정하기 위한 인자 중 하나인 상호 보완 비율(complementary ratio)를 표현하기 위한 예시적인 자료 구조를 도시한다. 일례로, 도 5는 복수의 HLA 타이핑 툴들에 대한 상호 보완 비율에 대한 표를 포함할 수 있다.In one embodiment, FIG. 4 shows an exemplary data structure for expressing a complementary ratio, which is one of the factors for determining a complementary score. As an example, FIG. 5 may include a table of complementarity ratios for a plurality of HLA typing tools.
본 개시내용에서의 일 실시예에서, A라는 HLA 타이핑 툴에 대한 B라는 HLA 타이핑 툴의 상호 보완 비율이란 A에 대한 B의 정정 스코어와 B에 내재된 정확성 값에 기초하여 결정될 수 있다. 예를 들어, A라는 HLA 타이핑 툴에 대한 B라는 HLA 타이핑 툴의 상호 보완 비율은 1에서 B의 정확성 값을 차감한 값을 분모로 하여 1에서 A에 대한 B의 정정 스코어를 차감한 값을 분자로 하여 결정될 수 있다.In one embodiment of the present disclosure, the complementarity ratio of HLA typing tool B to HLA typing tool A may be determined based on the correction score of B to A and the accuracy value inherent in B. For example, the complementarity ratio of an HLA typing tool B to an HLA typing tool A is 1 minus B's accuracy value as the denominator and 1 minus B's correction score for A as the numerator. can be determined by
일례로 정확성 값은 0 내지 1 의 범위에 포함될 수 있다.For example, the accuracy value may be included in the range of 0 to 1.
본 개시내용의 추가적인 실시예에서, A라는 HLA 타이핑 툴에 대한 B라는 HLA 타이핑 툴의 상호 보완 비율이란 A에 대한 B의 정정 스코어와 A에 내재된 정확성 값에 기초하여 결정될 수 있다. 예를 들어, A라는 HLA 타이핑 툴에 대한 B라는 HLA 타이핑 툴의 상호 보완 비율은 1에서 A의 정확성 값을 차감한 값을 분모로 하여 1에서 A에 대한 B의 정정 스코어를 차감한 값을 분자로 하여 결정될 수 있다.In a further embodiment of the present disclosure, the complementarity ratio of HLA typing tool B to HLA typing tool A may be determined based on the correction score of B to A and the implicit accuracy value of A. For example, the complementarity ratio of an HLA typing tool B to an HLA typing tool A is 1 minus A's accuracy value as the denominator and 1 minus B's correction score for A as the numerator. can be determined by
일 실시예에서, 2개의 HLA 타입 툴들에 대해서 2개의 상호 보완 비율이 계산될 수 있다. 일례로, A에 대한 B의 상호 보완 비율과 B에 대한 A의 상호 보완 비율이 계산될 수 있다. 도 4에서 도시되는 바와 같이, 2개의 대응되는 HLA 타이핑 툴들에 대해서 maintype과 subtype의 관계에 따라서 2개의 상호 보완 비율이 계산될 수 있다.In one embodiment, two complementarity ratios may be calculated for two HLA type tools. In one example, the complementarity ratio of B to A and the complementarity ratio of A to B can be calculated. As shown in FIG. 4 , two complementary ratios may be calculated according to the relationship between maintype and subtype for two corresponding HLA typing tools.
일례에서, 상호 보완 비율의 값이 높을수록 subtype에 내재된 HLA 타이핑 결과에 정확성에 비해 maintype에 대한 결과를 정정해줄 가능성이 높다는 것을 의미할 수 있다. In one example, the higher the value of the complementarity ratio, the higher the probability of correcting the result for the maintype compared to the accuracy of the HLA typing result inherent in the subtype.
다른 예시에서, 상호 보완 비율의 값이 높을수록 maintype에 내재된 HLA 타이핑 정확성에 비해 subtype으로부터 결과에 따라 정정된 결과에 대응하는 정확성이 높다는 것을 의미할 수도 있다.In another example, the higher the value of the complementarity ratio, the higher the accuracy corresponding to the corrected result according to the result from the subtype compared to the HLA typing accuracy inherent in the maintype.
일 실시예에서, 상호 보완 비율의 값이 1보다 크다는 것은 것과 조합하였을 때 해당하는 HLA 타이핑 툴에 내재된 정확성을 능가(outperform)한다는 것을 의미할 수 있다.In one embodiment, the value of the complementarity ratio greater than 1 may mean that the accuracy inherent in the corresponding HLA typing tool is outperformed when combined with.
도 5는 본 개시내용의 일 실시예에 따라 상호 보완 스코어를 결정하기 위한 예시적인 알고리즘을 도시한다.5 depicts an exemplary algorithm for determining a complementarity score according to one embodiment of the present disclosure.
일 실시예에서, 도 5는 상호 보완 스코어를 표현하기 위한 예시적인 자료 구조를 도시한다. 일례로, 도 5는 복수의 HLA 타이핑 툴들에 대한 상호 보완 스코어에 대한 표를 포함할 수 있다.In one embodiment, FIG. 5 illustrates an example data structure for representing a complementary score. As an example, FIG. 5 may include a table of complementary scores for a plurality of HLA typing tools.
본 개시의 일 실시예에 따라 복수개의 HLA 타이핑 툴들의 결과를 조합할지 여부를 결정하기 위하여 컴퓨팅 장치(100)는 도 5에 도시되는 상호 보완 스코어를 사용할 수 있다. 추가적으로 본 개시의 일 실시예에 따라 복수개의 HLA 타이핑 툴들을 조합하였을 경우의 HLA 타이핑 결과에 대한 정확성을 예측하기 위하여 컴퓨팅 장치(100)는 도 5에서 도시되는 상호 보완 스코어를 사용할 수 있다.According to an embodiment of the present disclosure, the computing device 100 may use the complementary score shown in FIG. 5 to determine whether to combine the results of a plurality of HLA typing tools. Additionally, in order to predict the accuracy of an HLA typing result when a plurality of HLA typing tools are combined according to an embodiment of the present disclosure, the computing device 100 may use the complementary score shown in FIG. 5 .
본 개시의 추가적인 실시예에서, 컴퓨팅 장치(100)는 복수의 HLA 타이핑 툴들 간의 HLA 타이핑 알고리즘의 유사도를 판단하기 위하여 상호 보완 스코어를 사용할 수 있다. 일례로, 상대적으로 큰 상호 보완 스코어의 값을 갖는 복수의 HLA 타이핑 툴들은 서로 간의 알고리즘이 상이할 가능성이 높다는 것을 나타낸다. 또한, 상대적으로 작은 상호 보완 스코어의 값을 갖는 복수의 HLA 타이핑 툴들은 서로 간의 알고리즘이 동일할 또는 유사할 가능성이 높다는 것을 나타낸다. In a further embodiment of the present disclosure, computing device 100 may use a complementarity score to determine similarity of HLA typing algorithms among a plurality of HLA typing tools. For example, it indicates that a plurality of HLA typing tools having a relatively high value of complementarity score are highly likely to have different algorithms. In addition, a plurality of HLA typing tools having a relatively small complementarity score indicate that the algorithms between them are highly likely to be the same or similar.
본 개시의 일 실시예에서, 상호 보완 스코어는, 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터의 제 1 결과가 실제 결과와 일치하지 않는 경우 제 2 HLA 타이핑 툴로부터의 제 2 결과가 상기 실제 결과와 일치하는 경우를 나타내는 제 1 서브 스코어, 복수개의 HLA 타이핑 툴들 중 제 2 HLA 타이핑 툴로부터의 제 2 결과가 실제 결과와 일치하지 않는 경우 제 1 HLA 타이핑 툴로부터의 제 1 결과가 상기 실제 결과와 일치하는 경우를 나타내는 제 2 서브 스코어, 제 1 HLA 타이핑 툴에 대해 사전 결정된 제 1 정확성 값, 및 제 2 HLA 타이핑 툴에 대해 사전 결정된 제 2 정확성 값에 기초하여 연산될 수 있다. 여기서의 제 1 서브 스코어는 제 1 HLA 타이핑 툴에 대한 제 2 HLA 타이핑 툴의 상호 보완 비율 또는 정정 스코어를 포함하며, 제 2 서브 스코어는 제 2 HLA 타이핑 툴에 대한 제 1 HLA 타이핑 툴의 상호 보완 비율 또는 정정 스코어를 포함할 수 있다.In one embodiment of the present disclosure, the complementary score is determined by determining whether a first result from a first HLA typing tool among a plurality of HLA typing tools does not match an actual result, and a second result from a second HLA typing tool being the actual result. A first sub-score indicating a case in which the result matches the actual result, and a first result from the first HLA typing tool in case the second result from the second HLA typing tool among the plurality of HLA typing tools does not match the actual result. It may be calculated based on the second sub-score indicating the case of coincidence, the first accuracy value predetermined for the first HLA typing tool, and the second accuracy value predetermined for the second HLA typing tool. Here, the first sub-score includes a complementarity ratio or correction score of the second HLA typing tool to the first HLA typing tool, and the second sub-score includes the complementary score of the first HLA typing tool to the second HLA typing tool. It can include ratios or correction scores.
일 실시예에서, 도 5에서 도시되는 바와 같이, 2개의 대응되는 HLA 타이핑 툴들에 대해서 1개의 상호 보완 스코어의 값이 산출될 수 있다.In one embodiment, as shown in FIG. 5 , a value of one complementary score may be calculated for two corresponding HLA typing tools.
예를 들어, A라는 HLA 타이핑 툴과 B라는 HLA 타이핑 툴의 상호 보완 스코어는, A라는 HLA 타이핑 툴에 대한 B라는 HLA 타이핑 툴의 상호 보완 비율과 B라는 HLA 타이핑 툴에 대한 A라는 HLA 타이핑 툴의 상호 보완 비율에 기초하여 결정될 수 있다. For example, the complementarity scores of HLA typing tool A and HLA typing tool B are the complementarity ratio of HLA typing tool B to HLA typing tool A and HLA typing tool A to HLA typing tool B. It can be determined based on the mutual complement ratio of
일례로, A와 B의 상호 보완 스코어는 A에 대한 B의 상호 보완 비율과 B에 대한 A의 상호 보완 비율을 합산한 것에 기초하여 결정될 수 있다.For example, the complementary score of A and B may be determined based on the sum of the complementary ratio of B to A and the complementary ratio of A to B.
일례로, A와 B의 상호 보완 스코어는 A에 대한 B의 상호 보완 비율과 B에 대한 A의 상호 보완 비율의 평균을 의미할 수도 있다. For example, the complementarity score of A and B may mean the average of the complementarity ratio of B to A and the complementarity of A to B.
본 개시의 일 실시예에서, A라는 HLA 타이핑 툴, B라는 HLA 타이핑 툴, C라는 HLA 타이핑 툴 및 D라는 HLA 타이핑 툴을 포함하는 총 4개의 HLA 타이핑 툴들이 HLA 타이핑 결과를 도출하는데 조합된다고 가정한다. 또한, 이러한 4개의 HLA 타이핑 툴들 각각에 대해서는 고유의 정확성 값이 맵핑되어 있다. 이러한 경우, AB, AC, AD, BC 및 CD를 포함하는 총 5개의 HLA 타이핑 툴들에 대한 조합이 결정될 수 있다. 또한, 이러한 5개의 조합들 각각에 대해서는 사전 결정된 상호 보완 스코어가 할당될 수 있다. 즉, 5개의 조합들에 대해서 총 5개의 상호 보완 스코어가 결정될 수 있다. In one embodiment of the present disclosure, it is assumed that a total of four HLA typing tools including HLA typing tool A, HLA typing tool B, HLA typing tool C, and HLA typing tool D are combined to derive an HLA typing result. do. In addition, a unique accuracy value is mapped to each of these four HLA typing tools. In this case, combinations for a total of five HLA typing tools including AB, AC, AD, BC, and CD may be determined. In addition, a predetermined complementary score may be assigned to each of these five combinations. That is, a total of five complementary scores may be determined for the five combinations.
이러한 가정 하에서, 컴퓨팅 장치(100)는 4개의 HLA 타이핑 툴들 각각에 할당된 정확성 값들과 상기 HLA 타이핑 툴들의 5개의 조합들 각각에 할당된 상호 보완 스코어에 기초하여, 상기 4개의 HLA 타이핑 툴들로부터 획득된 콜들에서의 결과 중 무엇을 최종 HLA 타이핑 결과로 선정할 지 여부를 결정할 수 있다. 또는, 대해서 총 5개의 상호 보완 스코어가 결정될 수 있다. Under these assumptions, the computing device 100 obtains data obtained from the four HLA typing tools based on the accuracy values assigned to each of the four HLA typing tools and the complementarity score assigned to each of the five combinations of the HLA typing tools. It is possible to determine which of the results from the calls made is selected as the final HLA typing result. Alternatively, a total of 5 mutually complementary scores may be determined.
이러한 가정 하에서, 컴퓨팅 장치(100)는 4개의 HLA 타이핑 툴들 각각에 할당된 정확성 값들과 상기 HLA 타이핑 툴들의 5개의 조합들 각각에 할당된 상호 보완 스코어에 기초하여, 상기 4개의 HLA 타이핑 툴들로부터 획득된 콜들을 조합할지 여부 그리고/또는 조합을 한다면 어떻게 할지를 결정할 수 있다.Under these assumptions, the computing device 100 obtains data obtained from the four HLA typing tools based on the accuracy values assigned to each of the four HLA typing tools and the complementarity score assigned to each of the five combinations of the HLA typing tools. You can decide whether and/or what to do with the combined calls.
일 실시예에서, 상기 HLA 타이핑 툴들의 5개의 조합들 각각에 할당된 상호 보완 스코어는 도 5에서 도시되는 예시적인 표로부터 획득될 수 있다.In one embodiment, the complementarity score assigned to each of the five combinations of HLA typing tools can be obtained from the exemplary table shown in FIG. 5 .
일례로, 컴퓨팅 장치(100)는 A, B, C 및 D 각각에 할당된 정확성값들을 포함하는 제 1 인자, 그리고 AB, AC, AD, BC 및 CD 각각에 할당된 상호 보완 스코어의 평균을 포함하는 제 2 인자에 기초하여, 상기 4개의 HLA 타이핑 툴들로부터 획득된 콜들에서의 결과를 최종 HLA 타이핑 결과로 선정할 지 여부를 결정할 수 있다.In one example, the computing device 100 includes a first factor including accuracy values assigned to each of A, B, C, and D, and an average of complementary scores assigned to each of AB, AC, AD, BC, and CD. Based on the second factor, it is possible to determine whether to select the results of the calls obtained from the four HLA typing tools as the final HLA typing result.
일례로, 컴퓨팅 장치(100)는 A, B, C 및 D 각각에 할당된 정확성값들을 포함하는 제 1 인자, 그리고 AB, AC, AD, BC 및 CD 각각에 할당된 상호 보완 스코어의 평균과 총 HLA 타이핑 툴의 개수인 K(예컨대 4)를 연산한 제 2 인자에 기초하여, 상기 4개의 HLA 타이핑 툴들로부터 획득된 콜들에서의 결과를 최종 HLA 타이핑 결과로 선정할 지 여부를 결정할 수 있다.In one example, the computing device 100 calculates a first factor including accuracy values assigned to A, B, C, and D, respectively, and an average and a total of complementary scores assigned to each of AB, AC, AD, BC, and CD. Based on the second factor obtained by calculating K (for example, 4), the number of HLA typing tools, it may be determined whether to select the results of calls obtained from the four HLA typing tools as the final HLA typing result.
다른 예시로, 컴퓨팅 장치(100)는 AB, AC, AD, BC 및 CD 각각에 할당된 상호 보완 스코어의 총 합산값을 조합들의 개수로 나눈 중간값을 총 HLA 타이핑 툴의 개수인 K 횟수(예컨대, 4) 만큼 곱한 제 2 인자와 A, B, C 및 D 각각에 할당된 정확성값들을 포함하는 제 1 인자 간의 곱셈 연산에 기초하여, 상기 4개의 HLA 타이핑 툴들로부터 획득된 콜들에서의 결과를 최종 HLA 타이핑 결과로 선정할 지 여부를 결정할 수 있다.As another example, the computing device 100 divides the total sum of the complementarity scores assigned to each of AB, AC, AD, BC, and CD by the number of combinations K times, which is the total number of HLA typing tools (eg, , 4) and the first factor including the accuracy values assigned to A, B, C, and D, respectively, the results in the calls obtained from the four HLA typing tools are finalized. You can decide whether to select based on the HLA typing result.
Figure PCTKR2022020521-appb-img-000001
Figure PCTKR2022020521-appb-img-000001
위의 수학식 1은 본 개시의 일 실시예에 따라 복수개의 HLA 타이핑 툴들의 결과를 조합할지 여부를 결정하기 위한 예시적인 계산식을 나타낸다. 추가적으로 수학식 1은 본 개시의 일 실시예에 따라 복수개의 HLA 타이핑 툴들을 조합하였을 경우의 HLA 타이핑 결과에 대한 정확성을 결정하기 위한 예시적인 계산식으로 사용될 수도 있다. 수학식 1은 예시적인 목적으로 사용된 것이며, 구현의 양태에 따라 복수의 HLA 타이핑 툴들 각각의 정확성 정보 및 복수의 HLA 타이핑 툴들 간의 상호 보완 스코어를 인자로 사용하는 다양한 형태의 수학식 또는 계산 알고리즘이 사용될 수 있다.Equation 1 above shows an exemplary calculation formula for determining whether to combine results of a plurality of HLA typing tools according to an embodiment of the present disclosure. Additionally, Equation 1 may be used as an exemplary calculation formula for determining the accuracy of an HLA typing result when a plurality of HLA typing tools are combined according to an embodiment of the present disclosure. Equation 1 is used for illustrative purposes, and various types of equations or calculation algorithms using the accuracy information of each of the plurality of HLA typing tools and the mutual complement scores between the plurality of HLA typing tools as factors according to implementation aspects can be used
상기 수학식 1에서, k는 사용되는 HLA 타이핑 툴들의 개수를 나타내며, n은 HLA 타이핑 툴들 간의 조합의 개수를 나타내며, Acc는 HLA 타이핑 툴들 각각에 할당된 정확성 값을 나타내며, 그리고 Valuecor은 HLA 타이핑 툴들의 조합에 대응하는 상호 보완 스코어를 나타낸다.In Equation 1, k represents the number of HLA typing tools used, n represents the number of combinations between HLA typing tools, Acc represents an accuracy value assigned to each of the HLA typing tools, and Value cor represents HLA typing Indicates a complementary score corresponding to a combination of tools.
전술한 수학식 1은 HLA 타이핑 툴들 각각의 정확성 정보와 HLA 타이핑 툴들 간의 조합의 상호 보완스코어 정보를 이용하여, HLA 타입을 결정하는데 사용되는 HLA 타이핑 툴들의 조합에 대한 최종 정확성 값을 산출하는데 사용될 수 있다. 일례로, 컴퓨팅 장치(100)는 전술한 수학식 1에 따른 최종 정확성 값과 사전결정된 임계값(예컨대, 99.8% 등의 값)을 비교하여, 복수의 HLA 타이핑 툴들을 조합할 지 여부 그리고/또는 복수의 HLA 타이핑 툴들로부터 획득된 HLA 타이핑 결과에 대한 신뢰도를 결정할 수 있다.Equation 1 described above can be used to calculate a final accuracy value for a combination of HLA typing tools used to determine an HLA type, using accuracy information of each of the HLA typing tools and complementary score information of a combination of the HLA typing tools. there is. For example, the computing device 100 compares the final accuracy value according to Equation 1 and a predetermined threshold value (eg, a value such as 99.8%) to determine whether to combine a plurality of HLA typing tools and / or Reliability of HLA typing results obtained from a plurality of HLA typing tools may be determined.
다른 예시로, 컴퓨팅 장치(100)는 전술한 수학식 1에 따른 알고리즘에 기초하여, 복수의 HLA 타이핑 툴들로부터 획득된 콜들에 대한 조합 여부를 결정할 수 있다. 다른 예시로, 컴퓨팅 장치(100)는 전술한 수학식 1에 따른 알고리즘에 기초하여, 복수의 HLA 타이핑 툴들로부터 획득된 콜들에 대한 가중치를 결정함으로써 최종 HLA 타입 결과를 결정할 수 있다.As another example, the computing device 100 may determine whether to combine calls obtained from a plurality of HLA typing tools based on the algorithm according to Equation 1 described above. As another example, the computing device 100 may determine a final HLA type result by determining weights for calls obtained from a plurality of HLA typing tools based on the algorithm according to Equation 1 described above.
다른 예시로, 컴퓨팅 장치(100)는 전술한 수학식 1에 따른 알고리즘에 기초하여, 복수의 HLA 타이핑 툴들로부터 획득된 콜들에 포함된 HLA 타입 후보 값들 중 최종 HLA 타입으로 결정될 HLA 타입 후보가 무엇인지를 결정할 수 있다.As another example, the computing device 100 determines an HLA type candidate to be determined as the final HLA type among HLA type candidate values included in calls obtained from a plurality of HLA typing tools based on the algorithm according to Equation 1 described above. can decide
전술한 바와 같이, 본 개시내용의 일 실시예에 따른 HLA 타이핑 방법은 복수의 HLA 타이핑 툴들을 이용하되, 복수의 HLA 타이핑 툴들 간의 상호 보완 스코어에 기초하여 복수의 HLA 타이핑 툴들로부터 획득되는 콜들로부터 보다 정확한 HLA 타이핑 결과를 획득할 수 있다.As described above, the HLA typing method according to an embodiment of the present disclosure uses a plurality of HLA typing tools, but obtains a higher score from calls obtained from a plurality of HLA typing tools based on a complementary score between the plurality of HLA typing tools. Accurate HLA typing results can be obtained.
일 실시예에서, 상호 보완 스코어의 값이 1보다 크다는 것은 것과 조합하였을 때 자신에 내재된 정확성을 능가(outperform)한다는 것을 의미할 수 있다.In one embodiment, the value of the complementarity score greater than 1 may mean that it outperforms its inherent accuracy when combined with.
본 개시내용의 추가적인 실시예에서, 전술한 HLA 타이핑 기법에 의해 HLA 타입이 결정되지 못한 경우, 컴퓨팅 장치(100)는 피검체 유래의 생물학적 시료에서 DNA 또는 RNA를 추출하여 PCR-SBT (Polymerase Chain Reaction-Sequencing Based Typing)를 실시할 수도 있다. 다른 예시로, 컴퓨팅 장치는 다른 엔티티에 의해 실행된 PCR-SBT의 실시 결과를 획득하는 방식으로 해당 결과를 얻을 수도 있다. 본 개시내용의 일 실시예에서 전술한 알고리즘에 의해 HLA 타입이 결정되지 못한 경우는, 콜에 포함된 HLA 타입의 일치도가 낮거나 혹은 상호 보완 스코어를 고려하여도 HLA 타이핑 결과에 대한 확신도가 사전결정된 임계치 미만인 상황에 해당할 수 있다. 이러한 경우, 해당 알고리즘이 출력하는 HLA 타이핑의 정확도가 떨어진다는 것을 의미할 수 있다. 이러한 경우에는 추가적인 PCR-SBT를 수행함으로써 HLA 타입 판단의 정확도를 높이는 것이 바람직할 수 있다.In a further embodiment of the present disclosure, when the HLA type is not determined by the above-described HLA typing technique, the computing device 100 extracts DNA or RNA from a biological sample derived from a subject and uses PCR-SBT (Polymerase Chain Reaction -Sequencing Based Typing) may be performed. As another example, the computing device may obtain a corresponding result by acquiring an execution result of PCR-SBT executed by another entity. In an embodiment of the present disclosure, when the HLA type is not determined by the above-described algorithm, the degree of concordance of the HLA type included in the call is low or the degree of certainty of the HLA typing result is high even considering the mutual complement score. It may correspond to a situation below the determined threshold. In this case, it may mean that the accuracy of HLA typing output by the corresponding algorithm is reduced. In this case, it may be desirable to increase the accuracy of HLA type determination by performing additional PCR-SBT.
본 개시내용에서, 상기 PCR-SBT는 추가적인 HLA 유전자형 정보가 필요하거나 PCR-SSP 검사 결과의 판정이 애매한 상황에서 보조 검사로 이용될 수 있다. PCR-SSO 또는 RFLP의 단점은 두 대립 유전자 간의 DNA 서열에서 단일 염기 차이를 감지할 수 있지만, 변이가 프로브에 의해 감지된 특정 부위에서 발생하지 않는 한 새로운 정의되지 않은 대립 유전자를 감지할 가능성이 적다는 것이다. PCR-SBT는 원래 수동 시퀀싱 방법으로 개발되었으며 염료 라벨이 붙은 프라이머와 형광 자동 시퀀싱의 도입으로 자동화가 가능해지고 정확도가 크게 향상되었다. PCR-SBT는 대립 유전자의 염기 서열을 직접 검출하는 기술로, 정확도가 우수하지만, 시간이 오래 걸리고 비용이 비싸며 검체 처리량이 적은 단점이 있다.In the present disclosure, the PCR-SBT can be used as an auxiliary test in situations where additional HLA genotype information is required or the determination of PCR-SSP test results is ambiguous. A disadvantage of PCR-SSO or RFLP is that it can detect single-base differences in the DNA sequence between two alleles, but it is less likely to detect a new, undefined allele unless the mutation occurs at a specific site detected by the probe. It is. PCR-SBT was originally developed as a manual sequencing method, and the introduction of dye-labeled primers and fluorescence automated sequencing enabled automation and greatly improved accuracy. PCR-SBT is a technology that directly detects the nucleotide sequence of an allele, and has excellent accuracy, but it takes a long time, is expensive, and has a low sample throughput.
본 개시내용에서, PCR은 실시간 PCR일 수 있으며, 보다 구체적으로 단일 PCR 또는 멀티플렉스 PCR일 수 있으나, 이에 제한되는 것은 아니다. 본 발명에서 상기 단일 또는 멀티플렉스 실시간 PCR 반응 조건은 통상적인 조건을 취할 수 있다. 또한, 단일 실시간 PCR과 멀티플렉스 실시간 PCR 반응은 동일한 조건으로 수행될 수 있으며, 일 예로 초기 변성(initial denaturation)을 95℃에서 1분간 수행한 후, 변성(denaturation, 95℃에서 25초), 어닐링(annealing, 65℃에서 45초) 및 연장(extension, 72℃에서 30초)을 총 40회 실시하는 조건을 취할 수 있다. 본 개시내용에 사용 가능한 실시간 PCR 기기로는 AB 사의 Real-time PCR 기기 7900, 7500, 7300, Roche 사의 LightCycler 80, Stratagene 사의 Mx3000p, 및 BioRad 사의 Chromo 4 기기 등이 있으나, 이는 예시적인 목적으로 기재되는 것일 뿐 PCR 기기의 특징과 PCR 반응에 대한 구체적인 설명으로 본 개시내용의 권리범위가 제한되는 것은 아니다.In the present disclosure, PCR may be real-time PCR, and more specifically may be single PCR or multiplex PCR, but is not limited thereto. In the present invention, the single or multiplex real-time PCR reaction conditions may take conventional conditions. In addition, single real-time PCR and multiplex real-time PCR reactions can be performed under the same conditions. For example, initial denaturation is performed at 95 ° C for 1 minute, followed by denaturation (95 ° C for 25 seconds), annealing (annealing, 45 seconds at 65 ° C.) and extension (extension, 30 seconds at 72 ° C.) may be performed a total of 40 times. Real-time PCR devices usable in the present disclosure include Real-time PCR devices 7900, 7500, and 7300 from AB, LightCycler 80 from Roche, Mx3000p from Stratagene, and Chromo 4 devices from BioRad, which are described for illustrative purposes. However, the scope of the present disclosure is not limited to specific descriptions of the characteristics of the PCR device and the PCR reaction.
본 개시내용에서, 상기 PCR은 PCR-SSOP (PCR sequence-specific oligonucleotide probes) 또는 PCR-SBT (PCR sequencing-based typing)일 수 있으나, 이에 제한되는 것은 아니다.In the present disclosure, the PCR may be PCR-SSOP (PCR sequence-specific oligonucleotide probes) or PCR-SBT (PCR sequencing-based typing), but is not limited thereto.
도 6은 본 개시내용의 일 실시예에 따른 컴퓨팅 환경의 개략도이다.6 is a schematic diagram of a computing environment according to one embodiment of the present disclosure.
본 개시내용에서의 컴포넌트, 모듈 또는 부(unit)는 특정의 태스크를 수행하거나 특정의 추상 데이터 유형을 구현하는 루틴, 프로시져, 프로그램, 컴포넌트, 데이터 구조 등을 포함한다. 또한, 당업자라면 본 개시내용에서 제시되는 방법들이 단일-프로세서 또는 멀티프로세서 컴퓨팅 장치, 미니컴퓨터, 메인프레임 컴퓨터는 물론 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 장치, 마이크로프로세서-기반 또는 프로그램가능 가전 제품, 기타 등등(이들 각각은 하나 이상의 연관된 장치와 연결되어 동작할 수 있음)을 비롯한 다른 컴퓨터 시스템 구성으로 실시될 수 있다는 것을 충분히 인식할 것이다.A component, module or unit in this disclosure includes routines, procedures, programs, components, data structures, etc. that perform particular tasks or implement particular abstract data types. In addition, those skilled in the art will understand that the methods presented in this disclosure can be used in single-processor or multiprocessor computing devices, minicomputers, mainframe computers as well as personal computers, handheld computing devices, microprocessor-based or programmable consumer electronics, and the like ( It will be fully appreciated that each of these may be implemented with other computer system configurations, including those that may be operative in connection with one or more associated devices.
본 개시내용에서 설명된 실시예들은 또한 어떤 태스크들이 통신 네트워크를 통해 연결되어 있는 원격 처리 장치들에 의해 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치 둘다에 위치할 수 있다.Embodiments described in this disclosure may also be practiced in distributed computing environments where certain tasks are performed by remote processing devices that are linked through a communications network. In a distributed computing environment, program modules may be located in both local and remote memory storage devices.
컴퓨팅 장치는 통상적으로 다양한 컴퓨터 판독가능 매체를 포함한다. 컴퓨터에 의해 액세스 가능한 매체는 그 어떤 것이든지 컴퓨터 판독가능 매체가 될 수 있고, 이러한 컴퓨터 판독가능 매체는 휘발성 및 비휘발성 매체, 일시적(transitory) 및 비일시적(non-transitory) 매체, 이동식 및 비-이동식 매체를 포함한다. 제한이 아닌 예로서, 컴퓨터 판독가능 매체는 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다.A computing device typically includes a variety of computer readable media. Computer readable media can be any medium that can be accessed by a computer, including volatile and nonvolatile media, transitory and non-transitory media, removable and non-transitory media. Includes removable media. By way of example, and not limitation, computer readable media may include computer readable storage media and computer readable transmission media.
컴퓨터 판독가능 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보를 저장하는 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성 매체, 일시적 및 비-일시적 매체, 이동식 및 비이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital video disk) 또는 기타 광 디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨터에 의해 액세스될 수 있고 원하는 정보를 저장하는 데 사용될 수 있는 임의의 기타 매체를 포함하지만, 이에 한정되지 않는다.Computer readable storage media are volatile and nonvolatile media, transitory and non-transitory, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data. includes media Computer readable storage media may include RAM, ROM, EEPROM, flash memory or other memory technology, CD-ROM, digital video disk (DVD) or other optical disk storage device, magnetic cassette, magnetic tape, magnetic disk storage device or other magnetic storage device. device, or any other medium that can be accessed by a computer and used to store desired information.
컴퓨터 판독가능 전송 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 피변조 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터 등을 구현하고 모든 정보 전달 매체를 포함한다. 피변조 데이터 신호라는 용어는 신호 내에 정보를 인코딩하도록 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 의미한다. 제한이 아닌 예로서, 컴퓨터 판독가능 전송 매체는 유선 네트워크 또는 직접 배선 접속(direct-wired connection)과 같은 유선 매체, 그리고 음향, RF, 적외선, 기타 무선 매체와 같은 무선 매체를 포함한다. 상술된 매체들 중 임의의 것의 조합도 역시 컴퓨터 판독가능 전송 매체의 범위 안에 포함되는 것으로 한다.A computer readable transmission medium typically embodies computer readable instructions, data structures, program modules or other data in a modulated data signal such as a carrier wave or other transport mechanism. Including all information delivery media. The term modulated data signal means a signal that has one or more of its characteristics set or changed so as to encode information within the signal. By way of example, and not limitation, computer readable transmission media includes wired media such as a wired network or direct-wired connection, and wireless media such as acoustic, RF, infrared, and other wireless media. Combinations of any of the above are also intended to be included within the scope of computer readable transmission media.
컴퓨터(2002)를 포함하는 본 발명의 여러가지 측면들을 구현하는 예시적인 환경(2000)이 나타내어져 있으며, 컴퓨터(2002)는 처리 장치(2004), 시스템 메모리(2006) 및 시스템 버스(2008)를 포함한다. 본 명세서에서의 컴퓨터(200)는 컴퓨팅 장치와 상호 교환가능하게 사용될 수 있다. 시스템 버스(2008)는 시스템 메모리(2006)(이에 한정되지 않음)를 비롯한 시스템 컴포넌트들을 처리 장치(2004)에 연결시킨다. 처리 장치(2004)는 다양한 상용 프로세서들 중 임의의 프로세서일 수 있다. 듀얼 프로세서 및 기타 멀티프로세서 아키텍처도 역시 처리 장치(2004)로서 이용될 수 있다.An exemplary environment 2000 implementing various aspects of the present invention is shown comprising a computer 2002, which includes a processing unit 2004, a system memory 2006 and a system bus 2008. do. Computer 200 herein may be used interchangeably with a computing device. System bus 2008 couples system components, including but not limited to system memory 2006, to processing unit 2004. Processing unit 2004 may be any of a variety of commercially available processors. Dual processors and other multiprocessor architectures may also be used as the processing unit 2004.
시스템 버스(2008)는 메모리 버스, 주변장치 버스, 및 다양한 상용 버스 아키텍처 중 임의의 것을 사용하는 로컬 버스에 추가적으로 상호 연결될 수 있는 몇가지 유형의 버스 구조 중 임의의 것일 수 있다. 시스템 메모리(2006)는 판독 전용 메모리(ROM)(2010) 및 랜덤 액세스 메모리(RAM)(2012)를 포함한다. 기본 입/출력 시스템(BIOS)은 ROM, EPROM, EEPROM 등의 비휘발성 메모리(2010)에 저장되며, 이 BIOS는 시동 중과 같은 때에 컴퓨터(2002) 내의 구성요소들 간에 정보를 전송하는 일을 돕는 기본적인 루틴을 포함한다. RAM(2012)은 또한 데이터를 캐싱하기 위한 정적 RAM 등의 고속 RAM을 포함할 수 있다. System bus 2008 may be any of several types of bus structures that may additionally be interconnected to a memory bus, a peripheral bus, and a local bus using any of a variety of commercial bus architectures. System memory 2006 includes read only memory (ROM) 2010 and random access memory (RAM) 2012 . The basic input/output system (BIOS) is stored in non-volatile memory 2010, such as ROM, EPROM, EEPROM, etc. BIOS is a basic set of information that helps transfer information between components within the computer 2002, such as during startup. contains routines. RAM 2012 may also include high-speed RAM, such as static RAM, for caching data.
컴퓨터(2002)는 또한 내장형 하드 디스크 드라이브(HDD)(2014)(예를 들어, EIDE, SATA), 자기 플로피 디스크 드라이브(FDD)(2016)(예를 들어, 이동식 디스켓(2018)으로부터 판독을 하거나 그에 기록을 하기 위한 것임), SSD 및 광 디스크 드라이브(2020)(예를 들어, CD-ROM 디스크(2022)를 판독하거나 DVD 등의 기타 고용량 광 매체로부터 판독을 하거나 그에 기록을 하기 위한 것임)를 포함한다. 하드 디스크 드라이브(2014), 자기 디스크 드라이브(2016) 및 광 디스크 드라이브(2020)는 각각 하드 디스크 드라이브 인터페이스(2024), 자기 디스크 드라이브 인터페이스(2026) 및 광 드라이브 인터페이스(2028)에 의해 시스템 버스(2008)에 연결될 수 있다. 외장형 드라이브 구현을 위한 인터페이스(2024)는 예를 들어, USB(Universal Serial Bus) 및 IEEE 1394 인터페이스 기술 중 적어도 하나 또는 그 둘 다를 포함한다.The computer 2002 may also read from an internal hard disk drive (HDD) 2014 (eg EIDE, SATA), a magnetic floppy disk drive (FDD) 2016 (eg a removable diskette 2018), or for writing to them), SSDs and optical disk drives 2020 (for example, for reading CD-ROM disks 2022 or reading from or writing to other high capacity optical media such as DVDs) include The hard disk drive 2014, magnetic disk drive 2016, and optical disk drive 2020 are connected to the system bus 2008 by the hard disk drive interface 2024, magnetic disk drive interface 2026, and optical drive interface 2028, respectively. ) can be connected to The interface 2024 for external drive implementation includes, for example, at least one or both of Universal Serial Bus (USB) and IEEE 1394 interface technologies.
이들 드라이브 및 그와 연관된 컴퓨터 판독가능 매체는 데이터, 데이터 구조, 컴퓨터 실행가능 명령어, 기타 등등의 비휘발성 저장을 제공한다. 컴퓨터(2002)의 경우, 드라이브 및 매체는 임의의 데이터를 적당한 디지털 형식으로 저장하는 것에 대응한다. 상기에서의 컴퓨터 판독가능 저장 매체에 대한 설명이 HDD, 이동식 자기 디스크, 및 CD 또는 DVD 등의 이동식 광 매체를 언급하고 있지만, 당업자라면 집 드라이브(zip drive), 자기 카세트, 플래쉬 메모리 카드, 카트리지, 기타 등등의 컴퓨터에 의해 판독가능한 다른 유형의 저장 매체도 역시 예시적인 운영 환경에서 사용될 수 있으며 또 임의의 이러한 매체가 본 발명의 방법들을 수행하기 위한 컴퓨터 실행가능 명령어를 포함할 수 있다는 것을 잘 알 것이다.These drives and their associated computer readable media provide non-volatile storage of data, data structures, computer executable instructions, and the like. In the case of computer 2002, drives and media correspond to storing any data in a suitable digital format. Although the description of computer-readable storage media above refers to HDDs, removable magnetic disks, and removable optical media such as CDs or DVDs, those skilled in the art can use zip drives, magnetic cassettes, flash memory cards, cartridges, It will be appreciated that other types of computer-readable storage media, such as those of other types, may also be used in the exemplary operating environment and that any such media may contain computer-executable instructions for performing the methods of the present invention. .
운영 체제(2030), 하나 이상의 어플리케이션 프로그램(2032), 기타 프로그램 모듈(2034) 및 프로그램 데이터(2036)를 비롯한 다수의 프로그램 모듈이 드라이브 및 RAM(2012)에 저장될 수 있다. 운영 체제, 어플리케이션, 모듈 및/또는 데이터의 전부 또는 그 일부분이 또한 RAM(2012)에 캐싱될 수 있다. 본 발명이 여러가지 상업적으로 이용가능한 운영 체제 또는 운영 체제들의 조합에서 구현될 수 있다는 것을 잘 알 것이다.A number of program modules may be stored on the drive and RAM 2012, including an operating system 2030, one or more application programs 2032, other program modules 2034, and program data 2036. All or portions of the operating system, applications, modules and/or data may also be cached in RAM 2012. It will be appreciated that the present invention may be implemented in a variety of commercially available operating systems or combinations of operating systems.
사용자는 하나 이상의 유선/무선 입력 장치, 예를 들어, 키보드(2038) 및 마우스(2040) 등의 포인팅 장치를 통해 컴퓨터(2002)에 명령 및 정보를 입력할 수 있다. 기타 입력 장치(도시 생략)로는 마이크, IR 리모콘, 조이스틱, 게임 패드, 스타일러스 펜, 터치 스크린, 기타 등등이 있을 수 있다. 이들 및 기타 입력 장치가 종종 시스템 버스(2008)에 연결되어 있는 입력 장치 인터페이스(2042)를 통해 처리 장치(2004)에 연결되지만, 병렬 포트, IEEE 1394 직렬 포트, 게임 포트, USB 포트, IR 인터페이스, 기타 등등의 기타 인터페이스에 의해 연결될 수 있다.A user may enter commands and information into the computer 2002 through one or more wired/wireless input devices, such as a keyboard 2038 and a pointing device such as a mouse 2040. Other input devices (not shown) may include a microphone, IR remote control, joystick, game pad, stylus pen, touch screen, and the like. Although these and other input devices are often connected to the processing unit 2004 through an input device interface 2042 that is connected to the system bus 2008, a parallel port, IEEE 1394 serial port, game port, USB port, IR interface, may be connected by other interfaces such as the like.
모니터(2044) 또는 다른 유형의 디스플레이 장치도 역시 비디오 어댑터(2046) 등의 인터페이스를 통해 시스템 버스(2008)에 연결된다. 모니터(2044)에 부가하여, 컴퓨터는 일반적으로 스피커, 프린터, 기타 등등의 기타 주변 출력 장치(도시 생략)를 포함한다.A monitor 2044 or other type of display device is also connected to the system bus 2008 through an interface such as a video adapter 2046. In addition to the monitor 2044, computers typically include other peripheral output devices (not shown) such as speakers, printers, and the like.
컴퓨터(2002)는 유선 및/또는 무선 통신을 통한 원격 컴퓨터(들)(2048) 등의 하나 이상의 원격 컴퓨터로의 논리적 연결을 사용하여 네트워크화된 환경에서 동작할 수 있다. 원격 컴퓨터(들)(2048)는 워크스테이션, 서버 컴퓨터, 라우터, 퍼스널 컴퓨터, 휴대용 컴퓨터, 마이크로프로세서-기반 오락 기기, 피어 장치 또는 기타 통상의 네트워크 노드일 수 있으며, 일반적으로 컴퓨터(2002)에 대해 기술된 구성요소들 중 다수 또는 그 전부를 포함하지만, 간략함을 위해, 메모리 저장 장치(2050)만이 도시되어 있다. 도시되어 있는 논리적 연결은 근거리 통신망(LAN)(2052) 및/또는 더 큰 네트워크, 예를 들어, 원거리 통신망(WAN)(2054)에의 유선/무선 연결을 포함한다. 이러한 LAN 및 WAN 네트워킹 환경은 사무실 및 회사에서 일반적인 것이며, 인트라넷 등의 전사적 컴퓨터 네트워크(enterprise-wide computer network)를 용이하게 해주며, 이들 모두는 전세계 컴퓨터 네트워크, 예를 들어, 인터넷에 연결될 수 있다. Computer 2002 may operate in a networked environment using logical connections to one or more remote computers, such as remote computer(s) 2048 via wired and/or wireless communications. Remote computer(s) 2048 may be workstations, server computers, routers, personal computers, handheld computers, microprocessor-based entertainment devices, peer devices, or other common network nodes, and generally relate to computer 2002. Although many or all of the described components are included, for brevity, only memory storage device 2050 is shown. The logical connections shown include wired/wireless connections to a local area network (LAN) 2052 and/or a larger network, such as a wide area network (WAN) 2054 . Such LAN and WAN networking environments are common in offices and corporations and facilitate enterprise-wide computer networks, such as intranets, all of which can be connected to worldwide computer networks, such as the Internet.
LAN 네트워킹 환경에서 사용될 때, 컴퓨터(2002)는 유선 및/또는 무선 통신 네트워크 인터페이스 또는 어댑터(2056)를 통해 로컬 네트워크(2052)에 연결된다. 어댑터(2056)는 LAN(2052)에의 유선 또는 무선 통신을 용이하게 해줄 수 있으며, 이 LAN(2052)은 또한 무선 어댑터(2056)와 통신하기 위해 그에 설치되어 있는 무선 액세스 포인트를 포함하고 있다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(2002)는 모뎀(2058)을 포함할 수 있거나, WAN(2054) 상의 통신 서버에 연결되거나, 또는 인터넷을 통하는 등, WAN(2054)을 통해 통신을 정하는 기타 수단을 갖는다. 내장형 또는 외장형 및 유선 또는 무선 장치일 수 있는 모뎀(2058)은 직렬 포트 인터페이스(2042)를 통해 시스템 버스(2008)에 연결된다. 네트워크화된 환경에서, 컴퓨터(2002)에 대해 설명된 프로그램 모듈들 또는 그의 일부분이 원격 메모리/저장 장치(2050)에 저장될 수 있다. 도시된 네트워크 연결이 예시적인 것이며 컴퓨터들 사이에 통신 링크를 설정하는 기타 수단이 사용될 수 있다는 것을 잘 알 것이다.When used in a LAN networking environment, computer 2002 is connected to local network 2052 through wired and/or wireless communication network interfaces or adapters 2056. Adapter 2056 may facilitate wired or wireless communications to LAN 2052, which also includes a wireless access point installed therein to communicate with wireless adapter 2056. When used in a WAN networking environment, computer 2002 may include a modem 2058, be connected to a communications server on WAN 2054, or other means of establishing communications over WAN 2054, such as over the Internet. have Modem 2058, which can be internal or external and wired or wireless, is connected to system bus 2008 through serial port interface 2042. In a networked environment, program modules described for computer 2002, or portions thereof, may be stored in remote memory/storage device 2050. It will be appreciated that the network connections shown are exemplary and other means of establishing a communication link between computers may be used.
컴퓨터(1602)는 무선 통신으로 배치되어 동작하는 임의의 무선 장치 또는 개체, 예를 들어, 프린터, 스캐너, 데스크톱 및/또는 휴대용 컴퓨터, PDA(portable data assistant), 통신 위성, 무선 검출가능 태그와 연관된 임의의 장비 또는 장소, 및 전화와 통신을 하는 동작을 한다. 이것은 적어도 Wi-Fi 및 블루투스 무선 기술을 포함한다. 따라서, 통신은 종래의 네트워크에서와 같이 미리 정의된 구조이거나 단순하게 적어도 2개의 장치 사이의 애드혹 통신(ad hoc communication)일 수 있다.Computer 1602 is any wireless device or entity that is deployed and operating in wireless communication, such as printers, scanners, desktop and/or portable computers, portable data assistants (PDAs), communication satellites, and associated with wireless detectable tags. It operates to communicate with arbitrary equipment or places and telephones. This includes at least Wi-Fi and Bluetooth wireless technologies. Thus, the communication may be a predefined structure as in conventional networks or simply an ad hoc communication between at least two devices.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 개시내용의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 본 개시내용의 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.It is to be understood that the specific order or hierarchy of steps in the processes presented is an example of example approaches. Based upon design priorities, it is to be understood that the specific order or hierarchy of steps in the processes may be rearranged within the scope of the present disclosure. The method claims of this disclosure present elements of the various steps in a sample order, but are not meant to be limited to the specific order or hierarchy presented.
상기와 같이 발명의 실시를 위한 최선의 형태에서 관련 내용을 기술하였다.As described above, the related contents have been described in the best mode for carrying out the invention.
인간 백혈구 항원의 타입을 결정하기 위한 디바이스, 시스템 등에 사용될 수 있다.devices, systems, etc., for determining the type of human leukocyte antigen.

Claims (18)

  1. 컴퓨팅 장치에 의해 수행되는 인간 백혈구 항원(Human Leukocyte Antigen; HLA)의 타입을 결정하기 위한 방법으로서,A method for determining the type of Human Leukocyte Antigen (HLA) performed by a computing device, comprising:
    피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득하는 단계; 및Obtaining a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from a subject; and
    상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑(typing) 툴(tool)들을 사용하여 상기 생물학적 시료에 대한 HLA 타입을 결정하는 단계;determining an HLA type for the biological sample using a plurality of HLA typing tools that take the result of the sequencing as an input;
    를 포함하는,including,
    방법.method.
  2. 제 1 항에 있어서,According to claim 1,
    상기 HLA 타입을 결정하는 단계는,Determining the HLA type,
    상기 복수개의 HLA 타이핑 툴들로부터 획득된 콜(call)들에 포함된 HLA 타입 후보들 및 상기 복수개의 HLA 타이핑 툴들 간의 상호 보완 스코어에 기초하여, 상기 생물학적 시료에 대한 상기 HLA 타입을 결정하는 단계;determining the HLA type of the biological sample based on HLA type candidates included in calls obtained from the plurality of HLA typing tools and complementary scores between the plurality of HLA typing tools;
    를 포함하는,including,
    방법.method.
  3. 제 1 항에 있어서,According to claim 1,
    상기 HLA 타입을 결정하는 단계는,Determining the HLA type,
    상기 복수의 타이핑 툴들 중에서 콜을 제시한 툴의 개수를 결정하는 단계; 및determining the number of tools presenting calls among the plurality of typing tools; and
    상기 결정된 툴의 개수에 기초하여 상기 HLA 타입을 결정하는 단계;determining the HLA type based on the determined number of tools;
    를 포함하는,including,
    방법.method.
  4. 제 1 항에 있어서,According to claim 1,
    상기 HLA 타입을 결정하는 단계는,Determining the HLA type,
    상기 복수의 타이핑 툴들 중에서 콜을 제시한 툴의 개수를 결정하는 단계; determining the number of tools presenting calls among the plurality of typing tools;
    제시된 콜들에 포함된 HLA 타입 후보들 간의 일치도를 계산하는 단계; 및Calculating a degree of agreement between HLA type candidates included in the presented calls; and
    상기 결정된 툴의 개수 및 상기 계산된 일치도에 기초하여 상기 HLA 타입을 결정하는 단계;determining the HLA type based on the determined number of tools and the calculated degree of agreement;
    를 포함하는,including,
    방법.method.
  5. 제 1 항에 있어서,According to claim 1,
    상기 HLA 타입을 결정하는 단계는,Determining the HLA type,
    상기 복수개의 HLA 타이핑 툴들 중 어느 2개 또는 그 이상의 타이핑 툴들 간의 상호 보완 스코어를 계산하는 단계; 및calculating a complementary score between any two or more of the plurality of HLA typing tools; and
    상기 상호 보완 스코어에 기초하여, 상기 생물학적 시료에 대한 상기 HLA 타입을 결정하는 단계;Based on the complementarity score, determining the HLA type of the biological sample;
    를 포함하는,including,
    방법.method.
  6. 제 5 항에 있어서,According to claim 5,
    상기 상호 보완 스코어는,The mutual complement score,
    상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 상기 HLA 타입을 결정하는데 함께 이용될 수 있는 가능성을 정량적으로 나타내는 값을 포함하는,Including a value quantitatively indicating the possibility that any two HLA typing tools of the plurality of HLA typing tools can be used together to determine the HLA type,
    방법.method.
  7. 제 5 항에 있어서,According to claim 5,
    상기 상호 보완 스코어는,The mutual complement score,
    상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 함께 사용되었을 때의 상기 결정되는 HLA 타입의 정확성을 정량적으로 나타내는 값을 포함하는,Including a value quantitatively indicating the accuracy of the determined HLA type when any two HLA typing tools among the plurality of HLA typing tools are used together,
    방법.method.
  8. 제 5 항에 있어서,According to claim 5,
    상기 상호 보완 스코어는,The mutual complement score,
    상기 복수개의 HLA 타이핑 툴들 중 어느 2개의 HLA 타이핑 툴들이 함께 사용되었을 때의 상기 2개의 HLA 타이핑 툴들에서 획득된 콜들에 포함된 HLA 타입 후보들에 적용될 보정값을 정량적으로 나타내는 값을 포함하는,A value indicating quantitatively a correction value to be applied to HLA type candidates included in calls obtained from the two HLA typing tools when any two of the plurality of HLA typing tools are used together,
    방법.method.
  9. 제 5 항에 있어서,According to claim 5,
    상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴 간의 상호 보완 스코어는, The complementary score between the first HLA typing tool and the second HLA typing tool among the plurality of HLA typing tools,
    상기 생물학적 시료에 대하여 상기 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜에 대한 결과가 틀렸을 때, 상기 생물학적 시료에 대하여 상기 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜에 대한 결과의 정확성을 정량적으로 나타내는 값을 포함하는,Quantitatively indicating the accuracy of the result of the second call obtained from the second HLA typing tool for the biological sample when the result of the first call obtained from the first HLA typing tool for the biological sample is incorrect containing the value
    방법.method.
  10. 제 5 항에 있어서,According to claim 5,
    상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴과 제 2 HLA 타이핑 툴 간의 상호 보완 스코어는, The complementary score between the first HLA typing tool and the second HLA typing tool among the plurality of HLA typing tools,
    상기 제 1 HLA 타이핑 툴이 상기 제 2 HLA 타이핑 툴과 함께 사용되었을 때의 상기 결정된 HLA 타입에 대한 정확성 값이, 상기 제 1 HLA 타이핑 툴에 대해 사전결정된 제 1 정확성 값과 비교한 결과를 정량적으로 나타내는 값을 포함하는, Quantitatively comparing a result of comparing an accuracy value for the determined HLA type when the first HLA typing tool is used together with the second HLA typing tool with a predetermined first accuracy value for the first HLA typing tool containing a value representing
    방법.method.
  11. 제 1 항에 있어서,According to claim 1,
    상기 HLA 타입을 결정하는 단계는,Determining the HLA type,
    상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜과 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜을 조합할지 여부를 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어에 기초하여 결정하는 단계; 및A decision between the first HLA typing tool and the second HLA typing tool determines whether to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools. 1 determining based on the complementary score; and
    상기 제 1 콜과 상기 제 2 콜을 조합할지 여부에 대한 결정에 기초하여 상기 HLA 타입을 결정하는 단계;determining the HLA type based on a decision whether to combine the first call with the second call;
    를 포함하는,including,
    방법.method.
  12. 제 11 항에 있어서,According to claim 11,
    상기 HLA 타입을 결정하는 단계는,Determining the HLA type,
    상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜과 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜을 조합할지 여부를, 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어, 상기 제 1 HLA 타이핑 툴에 대한 사전 결정된 제 1 정확성 값 및 상기 제 2 HLA 타이핑 툴에 대한 사전 결정된 제 2 정확성 값에 기초하여 결정하는 단계; 및Whether or not to combine a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools is determined between the first HLA typing tool and the second HLA typing tool. determining based on a first complementary score, a first predetermined accuracy value for the first HLA typing tool and a second predetermined accuracy value for the second HLA typing tool; and
    상기 제 1 콜과 상기 제 2 콜을 조합할지 여부에 대한 결정에 기초하여, 상기 HLA 타입을 결정하는 단계;determining the HLA type based on a decision whether to combine the first call with the second call;
    를 포함하는,including,
  13. 제 1 항에 있어서,According to claim 1,
    상기 HLA 타입을 결정하는 단계는,Determining the HLA type,
    상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터 획득된 제 1 콜 및 제 2 HLA 타이핑 툴로부터 획득된 제 2 콜에 적용될 보정값을 상기 제 1 HLA 타이핑 툴과 상기 제 2 HLA 타이핑 툴 간의 제 1 상호 보완 스코어에 기초하여 결정하는 단계; 및A correction value to be applied to a first call obtained from a first HLA typing tool and a second call obtained from a second HLA typing tool among the plurality of HLA typing tools is determined by determining a difference between the first HLA typing tool and the second HLA typing tool. 1 determining based on the complementary score; and
    상기 보정값에 기초하여 상기 HLA 타입을 결정하는 단계;determining the HLA type based on the correction value;
    를 포함하는,including,
    방법.method.
  14. 제 5 항에 있어서,According to claim 5,
    상기 HLA 타입을 결정하는 단계는,Determining the HLA type,
    상기 복수개의 HLA 타이핑 툴들에 관련된 상호 보완 스코어에 적어도 부분적으로 기초하여, 상기 복수개의 HLA 타이핑 툴들을 사용하였을 때의 결정되는 상기 HLA 타입의 정확성을 예측하는 단계;predicting accuracy of the determined HLA type when using the plurality of HLA typing tools based at least in part on a complementarity score associated with the plurality of HLA typing tools;
    를 포함하는,including,
    방법.method.
  15. 제 5 항에 있어서,According to claim 5,
    상기 상호 보완 스코어는,The mutual complement score,
    상기 복수개의 HLA 타이핑 툴들 중 제 1 HLA 타이핑 툴로부터의 제 1 결과가 실제 결과와 일치하지 않는 경우 제 2 HLA 타이핑 툴로부터의 제 2 결과가 상기 실제 결과와 일치하는 경우를 나타내는 제 1 서브 스코어;a first sub-score indicating a case in which a first result from a first HLA typing tool among the plurality of HLA typing tools does not match an actual result and a second result from a second HLA typing tool matches the actual result;
    상기 복수개의 HLA 타이핑 툴들 중 제 2 HLA 타이핑 툴로부터의 제 2 결과가 실제 결과와 일치하지 않는 경우 제 1 HLA 타이핑 툴로부터의 제 1 결과가 상기 실제 결과와 일치하는 경우를 나타내는 제 2 서브 스코어;a second sub-score indicating a case in which a first result from a first HLA typing tool matches an actual result when a second result from a second HLA typing tool among the plurality of HLA typing tools does not match an actual result;
    상기 제 1 HLA 타이핑 툴에 대해 사전 결정된 제 1 정확성 값; 및a first predetermined accuracy value for the first HLA typing tool; and
    상기 제 2 HLA 타이핑 툴에 대해 사전 결정된 제 2 정확성 값;a second pre-determined accuracy value for the second HLA typing tool;
    에 기초하여 연산되는,calculated based on
    방법.method.
  16. 제 2 항에 있어서,According to claim 2,
    상기 상호 보완 스코어에 기초하여, 상기 복수개의 HLA 타이핑 툴들에 포함된 알고리즘들 간의 유사도를 결정하는 단계;determining a degree of similarity between algorithms included in the plurality of HLA typing tools based on the complementary score;
    를 더 포함하는,Including more,
    방법.method.
  17. 컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 하나 이상의 프로세서에 의해 실행되는 경우 인간 백혈구 항원(Human Leukocyte Antigen; HLA)의 타입을 결정하기 위한 방법을 수행하며, 상기 방법은:A computer program stored on a computer readable storage medium that, when executed by one or more processors, performs a method for determining a type of Human Leukocyte Antigen (HLA), the method comprising:
    피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득하는 단계; 및Obtaining a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from a subject; and
    상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑 툴들을 사용하여 상기 생물학적 시료에 대한 HLA 타입을 결정하는 단계;determining the HLA type of the biological sample using a plurality of HLA typing tools that take the result of the sequencing as an input;
    를 포함하는,including,
    컴퓨터 판독가능 저장 매체에 저장된 컴퓨터 프로그램.A computer program stored on a computer readable storage medium.
  18. 인간 백혈구 항원(Human Leukocyte Antigen; HLA)의 타입을 결정하기 위한 컴퓨팅 장치로서,A computing device for determining the type of Human Leukocyte Antigen (HLA), comprising:
    메모리; 및Memory; and
    프로세서를 포함하며,contains a processor;
    상기 프로세서는:The processor:
    피검체 유래의 생물학적 시료로부터 획득된 DNA 또는 RNA에 대한 염기 서열 분석을 수행한 결과를 획득하고; 그리고Obtaining a result of performing nucleotide sequence analysis on DNA or RNA obtained from a biological sample derived from the subject; and
    상기 염기 서열 분석 결과를 입력으로 하는 복수개의 HLA 타이핑 툴들을 사용하여 상기 생물학적 시료에 대한 HLA 타입을 결정하는,Determining the HLA type for the biological sample using a plurality of HLA typing tools that take the sequencing result as an input,
    컴퓨팅 장치.computing device.
PCT/KR2022/020521 2022-01-11 2022-12-16 Method and device for typing human leukocyte antigen WO2023136486A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020220004045A KR102547350B1 (en) 2022-01-11 2022-01-11 Apparatus and method for determining human leukocyte antigen type
KR10-2022-0004045 2022-01-11

Publications (1)

Publication Number Publication Date
WO2023136486A1 true WO2023136486A1 (en) 2023-07-20

Family

ID=86993450

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/020521 WO2023136486A1 (en) 2022-01-11 2022-12-16 Method and device for typing human leukocyte antigen

Country Status (2)

Country Link
KR (2) KR102547350B1 (en)
WO (1) WO2023136486A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111105843A (en) * 2019-12-31 2020-05-05 杭州纽安津生物科技有限公司 HLA type I molecule and polypeptide affinity prediction method
KR20210110241A (en) * 2020-02-28 2021-09-07 (주)신테카바이오 Prediction system and method of cancer immunotherapy drug Sensitivity using multiclass classification A.I based on HLA Haplotype

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105358984B (en) 2013-03-15 2020-02-18 普罗格诺西斯生物科学公司 Methods for detecting peptide/MHC/TCR binding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111105843A (en) * 2019-12-31 2020-05-05 杭州纽安津生物科技有限公司 HLA type I molecule and polypeptide affinity prediction method
KR20210110241A (en) * 2020-02-28 2021-09-07 (주)신테카바이오 Prediction system and method of cancer immunotherapy drug Sensitivity using multiclass classification A.I based on HLA Haplotype

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ANTTI LARJO, ROBERT EVELEIGH, ELINA KILPELäINEN, TONY KWAN, TOMI PASTINEN, SATU KOSKELA, JUKKA PARTANEN: "Accuracy of Programs for the Determination of Human Leukocyte Antigen Alleles from Next-Generation Sequencing Data", FRONTIERS IN IMMUNOLOGY, vol. 8, XP055737144, DOI: 10.3389/fimmu.2017.01815 *
DOUILLARD VENCESLAS, CASTELLI ERICK C., MACK STEVEN J., HOLLENBACH JILL A., GOURRAUD PIERRE-ANTOINE, VINCE NICOLAS, LIMOU SOPHIE: "Approaching Genetics Through the MHC Lens: Tools and Methods for HLA Research", FRONTIERS IN GENETICS, vol. 12, XP093081329, DOI: 10.3389/fgene.2021.774916 *
LEE MISEON, SEO JEONG-HAN, SONG SUNGJAE, SONG IN HYE, KIM SU YEON, KIM YOUNG-AE, GONG GYUNGYUB, KIM JEONG EUN, LEE HEE JIN: "A New Human Leukocyte Antigen Typing Algorithm Combined With Currently Available Genotyping Tools Based on Next-Generation Sequencing Data and Guidelines to Select the Most Likely Human Leukocyte Antigen Genotype", FRONTIERS IN IMMUNOLOGY, vol. 12, XP093081333, DOI: 10.3389/fimmu.2021.688183 *

Also Published As

Publication number Publication date
KR20230108723A (en) 2023-07-18
KR102547350B1 (en) 2023-06-23

Similar Documents

Publication Publication Date Title
Heather et al. High-throughput sequencing of the T-cell receptor repertoire: pitfalls and opportunities
Norman et al. Sequences of 95 human MHC haplotypes reveal extreme coding variation in genes other than highly polymorphic HLA class I and II
Mendes et al. Identification of strain-specific B-cell epitopes in Trypanosoma cruzi using genome-scale epitope prediction and high-throughput immunoscreening with peptide arrays
Natri et al. Genome-wide DNA methylation and gene expression patterns reflect genetic ancestry and environmental differences across the Indonesian archipelago
Soto et al. High frequency of shared clonotypes in human T cell receptor repertoires
Hassan et al. De novo reconstruction of the Toxoplasma gondii transcriptome improves on the current genome annotation and reveals alternatively spliced transcripts and putative long non-coding RNAs
Thielen et al. Genomic diversity of SARS-CoV-2 during early introduction into the Baltimore–Washington metropolitan area
WO2019139363A1 (en) Method for detecting circulating tumor dna in sample including acellular dna and use thereof
JP2018500625A (en) Method, system and process for de novo assembly of sequencing leads
Chen et al. In silico tools for accurate HLA and KIR inference from clinical sequencing data empower immunogenetics on individual-patient and population scales
US20220310200A1 (en) Methods for identifying and using disease-associated antigens
SoRelle et al. Assembling and validating bioinformatic pipelines for next-generation sequencing clinical assays
Farahani et al. Frequency of HLA Alleles in a Group of Severe COVID-19 Iranian patients
Kang et al. Mapping the dynamic genetic regulatory architecture of HLA genes at single-cell resolution
Dezordi et al. on behalf of the Fiocruz COVID-19 Genomic Surveillance Network
Katayama et al. Machine learning approaches to TCR repertoire analysis
Grace et al. Candidates for balancing selection in Leishmania donovani complex parasites
Tang et al. Sequencing of a Chinese tetralogy of Fallot cohort reveals clustering mutations in myogenic heart progenitors
WO2023136486A1 (en) Method and device for typing human leukocyte antigen
US10540324B2 (en) Human haplotyping system and method
January 3rd et al. HLA-C* 04: 01 is a genetic risk allele for severe course of COVID-19
Hullegie-Peelen et al. Virus-specific TRM cells of both donor and recipient origin reside in human kidney transplants
WO2024101698A1 (en) Method and apparatus for establishing t cell receptor ratio for optimal effectiveness of t cell receptor expression t cell therapy
Hung et al. Genetic diversity and structural complexity of the killer-cell immunoglobulin-like receptor gene complex: A comprehensive analysis using human pangenome assemblies
WO2020235721A1 (en) Method for discovering marker for predicting risk of depression or suicide using multi-omics analysis, marker for predicting risk of depression or suicide, and method for predicting risk of depression or suicide using multi-omics analysis

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22920815

Country of ref document: EP

Kind code of ref document: A1