WO2024053860A1 - 유전 정보 분석 결과 제공 방법 및 시스템 - Google Patents

유전 정보 분석 결과 제공 방법 및 시스템 Download PDF

Info

Publication number
WO2024053860A1
WO2024053860A1 PCT/KR2023/010796 KR2023010796W WO2024053860A1 WO 2024053860 A1 WO2024053860 A1 WO 2024053860A1 KR 2023010796 W KR2023010796 W KR 2023010796W WO 2024053860 A1 WO2024053860 A1 WO 2024053860A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
output
area
browser
gene
Prior art date
Application number
PCT/KR2023/010796
Other languages
English (en)
French (fr)
Inventor
이종근
박성열
권영오
Original Assignee
주식회사 지놈인사이트테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220167819A external-priority patent/KR102623609B1/ko
Application filed by 주식회사 지놈인사이트테크놀로지 filed Critical 주식회사 지놈인사이트테크놀로지
Publication of WO2024053860A1 publication Critical patent/WO2024053860A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis

Definitions

  • the present disclosure relates to a method of providing genetic information analysis results, and specifically, to a method and system for providing genetic information analysis results to a user using a user interface that includes a plurality of browsers.
  • the project compares the base sequence of the test subject with the reference base sequence to identify the base sequence of the test subject in which a mutation occurred, and derives a disease correlation for the test subject based on the identified base sequence. It can be done.
  • Next Generation Sequencing performs sequencing by synthesis of fragmented DNA (deoxyribonucleic acid) to generate a large amount of base sequences.
  • DNA fragments are read and an image file in which the bases are displayed with a fluorescent substance is created.
  • the fluorescent material included in the image file is converted into a base sequence, which is a set of computer-readable characters, and the base sequence is aligned (mapped) based on the reference base sequence. By comparing the aligned base sequence and the reference sequence, the location and gene where the mutation occurred are identified.
  • a report predicting human disease is generated and provided to medical experts. Based on the report, medical experts can predict the test subject's disease early or accurately diagnose the test subject's disease. Through this, an appropriate treatment plan can be established.
  • medical experts also check detailed analysis results and/or related data that serve as the basis for writing reports in order to establish more accurate treatment plans.
  • medical professionals can access the database and search for patient-related data. For example, if a medical professional wants to check all analysis data for a specific chromosome and genetic information associated with a specific chromosome, a medical professional must access the database and search each data one by one. At this time, medical experts can search for the data through search using search terms.
  • This method of medical experts accessing databases and obtaining necessary data can reduce the medical experts' work efficiency and convenience.
  • the present disclosure provides a method for providing genetic information analysis results, a computer program stored in a recording medium, and a device (system) to solve the above problems.
  • the present disclosure may be implemented in various ways, including as a method, device (system), and/or a computer program stored in a computer-readable storage medium.
  • a method of providing genetic information analysis results performed by at least one processor includes outputting a user interface for providing genetic information analysis results for a specimen, and a user interface received through the user interface. In response to the input, outputting interactive response information including detailed information of the genetic information analysis result to at least one area included in the user interface, wherein the first area included in the user interface includes: A list of genes associated with a specific disease is output, and in the second area included in the user interface, a first browser for visualizing and exploring information about variants obtained by analysis of the sample is output, In the third area included in the user interface, a second browser for searching sequence information obtained by analyzing a specimen may be displayed.
  • the step of outputting responsive response information to at least one area included in the user interface includes receiving a user input for selecting a gene in which a specific mutation has occurred from the list of genes output to the first area, In response to a user input for selecting a gene, controlling a first browser to output a region of a gene in which a specific mutation has occurred, and in response to a user input for selecting a gene in which a specific mutation has occurred, a gene in which a specific mutation has occurred among sequence information It may include controlling the second browser to output the area.
  • the step of controlling the second browser includes outputting a graphic object indicating the location of a specific mutation within the area output to the second browser, and the method of providing genetic information analysis results includes controlling the second browser.
  • the method may further include outputting detailed information about a specific mutation among the genetic information analysis results for the sample through a second browser.
  • the step of controlling the second browser includes obtaining a list of transcription models associated with a gene in which a specific mutation has occurred, based on the priority of each of the plurality of transcription models included in the transcription model list, to output It may include determining a target transcription model and controlling the second browser to output amino acid sequence information including a result transcribed and translated through the determined target transcription model.
  • the step of controlling the second browser includes, when it is determined that the first amino acid associated with the gene in which a specific mutation occurred is different from the second amino acid translated from the reference base sequence, the amino acid indicating the difference between the first amino acid and the second amino acid. and controlling a second browser to output change information, and the amino acid change information may be output in association with the position of a specific mutation within the sequence information.
  • the step of outputting responsive response information to at least one area included in the user interface includes controlling the second browser to output a list of transcription models, and receiving a user input for selecting a specific transcription model from the list of transcription models. and controlling the second browser so that amino acid sequence information including the results transcribed and translated through a specific transcription model is output.
  • a specific disease is identified based on the disease code included in the patient information, and the gene list may include at least one gene in which a mutation associated with the specific disease occurs among mutations found in the sample.
  • the specific disease is a cancer-related disease
  • the gene list includes a first driver list including at least one gene in which a mutation related to the cause of the disease has occurred among the mutations found in the sample, and a list of genes among the mutations found in the sample.
  • a second driver list including at least one gene in which a mutation related to disease suppression has occurred may be included.
  • the label of at least one gene included in the first driver list is visualized in the first area using a first graphic element
  • the label of at least one gene included in the second driver list is visualized in the first area using a second graphic element. It can be visualized in the first area.
  • the step of outputting a graphic object associated with the location of a specific mutation in the area output to the second browser, and outputting responsive response information to at least one area included in the user interface includes receiving a user input for selecting a graphic object.
  • the method may include controlling the second browser to enlarge and display a region associated with a specific mutation among the sequence information.
  • letters associated with at least one of the base where the mutation occurred or the amino acid identifier may be displayed.
  • the method of providing genetic information analysis results includes receiving a user's comment through a comment input box included in the fourth area of the user interface and providing the received user's comment to at least one other user participating in a project related to the sample. Additional steps may be included.
  • Tumor mutation burden statistics may be included for at least one of indels for the sample or structural variants (SVs) for the sample.
  • the step of outputting responsive response information to at least one area included in the user interface includes obtaining second information associated with a plot of the burden of tumor mutations for other specimens, and combining the first information and the second information. It may include the step of relating and outputting.
  • the step of outputting responsive response information to at least one area included in the user interface includes receiving a user input requesting comparison of a specific mutation among mutations found in a sample, and It may further include obtaining detailed information about the mutation and outputting the detailed information about the specific mutation found in the sample by correlating it with the detailed information about the specific mutation found in other samples.
  • an input box where a gene name is entered is displayed in the first area, and the method of providing genetic information analysis results further includes receiving the gene name input through the input box and adding the gene of the received name to the gene list. It can be included.
  • a computer program stored in a computer-readable recording medium may be provided.
  • a computing device includes a memory, and at least one processor connected to the memory and configured to execute at least one computer-readable program included in the memory, wherein the at least one program is Output a user interface for providing genetic information analysis results, respond to user input received through the user interface, and include interactive response information in the user interface containing details of the genetic information analysis results.
  • a list of genes associated with a specific disease is displayed in a first area included in the user interface, and a list of genes associated with a specific disease is displayed in at least one area included in the user interface.
  • a first browser for visualizing and exploring information about the variant is output, and a third area included in the user interface is for exploring sequence information obtained by analysis of the sample.
  • a second browser may be output.
  • various information related to genetic information analysis results can be efficiently provided through a plurality of areas included in the user interface.
  • a user interface that can interactively view and explore a large amount of genetic information analysis results may be provided.
  • the user interface includes a first browser capable of visualizing and browsing information about mutations found in the sample, and information about the base sequence, amino acid sequence, and/or mutation obtained by analysis of the sample.
  • a second browser that can explore detailed information is included, and the user can easily explore the entire base sequence and genetic information together using the first and second browsers.
  • a first browser and a second browser are linked to each other, so that when information output from one browser changes, information output from the other browser may change corresponding to the changed information.
  • the user can identify linked information according to a specific input or search, thereby improving convenience in using the browser.
  • different graphic objects may be used to output different types of mutations to the first browser. Accordingly, users can intuitively identify the type of mutation that occurred in the base sequence and easily determine the occurrence pattern of various types of mutation.
  • a specific mutation is emphasized by a pointer, an area where mutations are dense is automatically enlarged, or a plurality of mutations located in a dense region are rotated.
  • Graphic processing such as highlighting may be performed. Accordingly, even if the mutations are dense, each mutation can be conveniently and accurately identified by the user.
  • a region associated with the selected specific gene such as a corresponding chromosome or gene
  • the sequence and/or other mutation-related information may be automatically output to the second browser. Accordingly, the user can easily change the information displayed on the first browser and the second browser by selecting a gene.
  • FIG. 1 is an exemplary diagram schematically illustrating an information processing system and its service provision environment according to embodiments of the present disclosure.
  • Figure 2 is a schematic diagram showing a configuration in which an information processing system according to an embodiment of the present disclosure is connected to enable communication with a plurality of user terminals.
  • Figure 3 is a block diagram showing the internal configuration of a user terminal and an information processing system according to an embodiment of the present disclosure.
  • Figure 4 is a diagram illustrating an initial screen displayed when login authentication is successful according to an embodiment of the present disclosure.
  • FIG. 5 is a diagram illustrating the layout of the fifth area of FIG. 4 according to an embodiment of the present disclosure.
  • Figure 6 is a diagram illustrating a user interface including a first browser and a second browser according to an embodiment of the present disclosure.
  • FIG. 7 is a diagram illustrating the layout of the second area of FIG. 6 according to an embodiment of the present disclosure.
  • FIG. 8 is an enlarged view of the third sub-area of FIG. 7.
  • FIG. 9 is an enlarged view of the fourth sub-area where the first browser of FIG. 7 is output.
  • FIG. 10 is a diagram illustrating another example of a first information output area including structural variations visualized through different graphic objects.
  • FIG. 11 is a diagram illustrating an example of graphic object processing when graphic objects associated with structural variation are dense.
  • FIG. 12 is a diagram illustrating another example of graphic object processing when graphic objects associated with structural variation are dense.
  • FIG. 13 is a diagram illustrating another example of graphic object processing when graphic objects associated with structural variation are dense.
  • Figure 14 is a diagram illustrating an enlarged area in the first browser.
  • Figure 15 is a diagram illustrating a screen of a first browser on which two chromosomes are displayed according to an embodiment of the present disclosure.
  • FIG. 16 is a diagram illustrating in more detail the fifth sub-area where the second browser of FIG. 7 is displayed.
  • Figure 17 is a diagram illustrating a screen on which detailed information about a mutation is output according to an embodiment of the present disclosure.
  • Figure 18 is a diagram illustrating an information output area set to enlarge and display a specific region of the base sequence and amino acid sequence.
  • Figure 19 is a diagram illustrating a second browser where a list of transcription models is output.
  • Figure 20 is a diagram illustrating a screen of a first browser on which information associated with a specific chromosome is displayed, according to an embodiment of the present disclosure.
  • Figure 21 is a diagram illustrating a screen of a second browser that operates in conjunction with a gene associated with a chromosome selected in the first browser.
  • Figure 22 is a diagram illustrating a screen of a first browser and a screen of a second browser that are operated based on mutation information selected from the driver list.
  • Figure 23 is a diagram showing another example of a screen of a first browser and a screen of a second browser that operates based on mutation information selected from the driver list.
  • FIG. 24 is an enlarged view of the sixth sub-area of FIG. 7.
  • Figure 25 is a diagram illustrating a screen of a first browser and a screen of a second browser operating based on a gene selected from a gene list according to an embodiment of the present disclosure.
  • FIG. 26 is an enlarged view of the seventh sub-area of FIG. 7.
  • FIG. 27 is an enlarged view of the eighth sub-area of FIG. 7.
  • Figure 28 is a flowchart for explaining a method of providing genetic information analysis results according to an embodiment of the present disclosure.
  • a modulee' or 'unit' refers to a software or hardware component, and the 'module' or 'unit' performs certain roles.
  • 'module' or 'unit' is not limited to software or hardware.
  • a 'module' or 'unit' may be configured to reside on an addressable storage medium and may be configured to run on one or more processors.
  • a 'module' or 'part' refers to components such as software components, object-oriented software components, class components and task components, processes, functions and properties. , procedures, subroutines, segments of program code, drivers, firmware, microcode, circuits, data, databases, data structures, tables, arrays, or variables.
  • Components and 'modules' or 'parts' may be combined into smaller components and 'modules' or 'parts' or further components and 'modules' or 'parts'.
  • a 'module' or 'unit' may be implemented with a processor and memory.
  • 'Processor' should be interpreted broadly to include general-purpose processors, central processing units (CPUs), microprocessors, digital signal processors (DSPs), controllers, microcontrollers, state machines, etc.
  • 'processor' may refer to an application-specific integrated circuit (ASIC), programmable logic device (PLD), field programmable gate array (FPGA), etc.
  • ASIC application-specific integrated circuit
  • PLD programmable logic device
  • FPGA field programmable gate array
  • 'Processor' refers to a combination of processing devices, for example, a combination of a DSP and a microprocessor, a combination of a plurality of microprocessors, a combination of one or more microprocessors in combination with a DSP core, or any other such combination of configurations. You may. Additionally, 'memory' should be interpreted broadly to include any electronic component capable of storing electronic information.
  • RAM random access memory
  • ROM read-only memory
  • NVRAM non-volatile random access memory
  • PROM programmable read-only memory
  • EPROM erasable-programmable read-only memory
  • a memory is said to be in electronic communication with a processor if the processor can read information from and/or write information to the memory.
  • the memory integrated into the processor is in electronic communication with the processor.
  • 'system' may include at least one of a server device and a cloud device, but is not limited thereto.
  • a system may consist of one or more server devices.
  • the system may consist of one or more cloud devices (e.g., sequencing devices, etc.).
  • the system may be operated with a server device and a cloud device configured together.
  • a component when a component is described as being 'connected', 'coupled' or 'connected' to another component, the component may be directly connected or connected to the other component. , it should be understood that another component may be 'connected', 'combined', or 'connected' between each component.
  • 'comprises' and/or 'comprising' means that the mentioned component, step, operation, and/or element includes one or more other components, steps, or operations. and/or the presence or addition of elements.
  • a 'graphic element' may be graphic-based data including at least one of a shape, color, or text.
  • a specific graphic element may be a specific shape, a specific color, and/or a specific text.
  • a 'graphic object' is formed by including at least one graphic element and may be graphic-based information that a user can visually identify.
  • a graphic object may be implemented as a specific shape with a specific color.
  • the first graphic object may be a figure of a first type having a first color and a first size
  • the second graphic object may be a figure of a second type having a second color and a second size.
  • 'genetic information analysis results' may refer to the results of analyzing the whole genome or a part of the whole genome (eg, a specific chromosome, a specific gene, a target panel, etc.).
  • analysis information for the entire genome, analysis information for a specific chromosome, analysis information for a specific gene, and analysis information for the target panel are not distinguished, but are referred to as 'genome analysis information'. Please note that it is mentioned.
  • 'first browser' may refer to an application program for supporting the search for mutations among genome analysis information.
  • the first browser may provide a view of mutations discovered across the entire genome.
  • 'second browser' may refer to an application program for supporting search of sequence information obtained as a result of genome analysis at the level of a gene unit.
  • the sequence information may include an RNA (Ribonucleic acid) sequence in which a portion of a DNA sequence is transcribed by a transcription model and/or an amino acid sequence translated corresponding to such sequences.
  • RNA Ribonucleic acid
  • the first browser and/or the second browser may be implemented using various programming tools such as JavaScript, Hypertext Markup Language (HTLM), and Application Programming Interface (API).
  • JavaScript Hypertext Markup Language
  • HTTPLM Hypertext Markup Language
  • API Application Programming Interface
  • a 'base' is a unit constituting a base sequence and may be a component of nucleotides.
  • the base may be expressed as one of 'A' for adenine, 'C' for cytosine, 'G' for guanine, and 'T' for thymine. You can.
  • the 'base sequence' may be composed of a plurality of bases arranged.
  • a base sequence may contain multiple known chromosomes.
  • a 'variation' may be identified as a portion of the base sequence of a sample that differs from the reference base sequence.
  • variation may include variants/variants, mutations, etc.
  • mutation may refer to a phenomenon in which a base sequence is added, changed, and/or deleted due to some reason (e.g., DNA damage, replication error, etc.).
  • a 'DNA library' is genetic material that is the subject of sequencing processed into a form suitable for analysis by a sequencing device.
  • a DNA library may contain numerous DNA fragments obtained from cells (i.e., specimens) of one or more test subjects.
  • the 'marking code' may be a code related to a base included in a DNA fragment.
  • the marking code may be image data.
  • the properties of the marking code can be used.
  • distinct fluorescent materials may be used as attributes of the marking code.
  • the first marking code may be marked as a first fluorescent material representing adenine
  • the second marking code may be marked as a second fluorescent material representing cytosine.
  • the third marking code may be expressed as a third fluorescent material representing guanine
  • the fourth marking code may be represented as a fourth fluorescent material representing thymine.
  • 'marking data' may be data including one or more marking codes.
  • marking data may be an image file.
  • a DNA library 10 containing a DNA sample of a test subject may be created. For example, cells (i.e., specimens) from a subject being analyzed (e.g., a patient) are collected, and the cells are stored in a test tube with a predetermined solution and undergo pretreatment such as heating and centrifugation. A DNA library 10 containing countless DNA fragments obtained from cells can be created.
  • the DNA library 10 may include only a DNA sample obtained from one test subject, but may typically include DNA samples obtained from a plurality of test subjects. For example, a DNA sample generated from cells of a first test subject and a DNA sample generated from cells of a second test subject may be included together in the DNA library 10. That is, sequencing work for two or more test subjects can be performed simultaneously by the sequencing device 120.
  • the DNA library 10 may be mounted on a flow cell, and the flow cell may be input into the sequencing device 120. In some embodiments, any method that can introduce DNA library 10 into sequencing device 120 may be used.
  • the sequencing device 120 may identify the base type of each DNA fragment included in the DNA library 10 and generate marking data including a marking code corresponding to the identified base type. According to one embodiment, the sequencing device 120 identifies one base contained in each DNA fragment at every cycle, generates a marking code corresponding to the identified base, and adds the generated marking code to the marking data. Marking data can be updated by recording. The sequencing device 120 may generate one image file representing marking codes generated for all DNA fragments every cycle. Marking data may be a set of image files generated every cycle and may be stored in a storage device that the information processing system 110 can access. When a certain cycle (eg, 300 cycles) elapses, marking data 20 including marking codes generated in all cycles may be generated. According to one embodiment, a plurality of marking data 20 corresponding to the number of DNA fragments may be generated by the sequencing device 120.
  • the information processing system 110 may be a system that analyzes base sequences and outputs a genetic information analysis result report 30 including the analysis results. For example, once the generation of marking data 20 is completed in the sequencing device 120, the information processing system 110 may generate a base sequence based on the marking data 20. According to one embodiment, a plurality of marking data 20 corresponding to the number of DNA fragments are generated by the sequencing device 120, and the information processing system 110 includes a number of reads corresponding to the number of DNA fragments. Base sequences can be generated. For example, when the DNA library 10 includes n DNA fragments (where n is a natural number), the sequencing device 120 may generate n pieces of marking data 20 in a specific cycle. Subsequently, the information processing system 110 may generate a base sequence for a specimen containing n reads based on the n marking data 20.
  • the sequencing device 120 outputs marking data 20 and the information processing system 110 generates a base sequence from the marking data 20, but in other embodiments, the sequencing device ( 120) may output a base sequence (eg, FASTQ file) instead of marking data 20.
  • a base sequence eg, FASTQ file
  • the information processing system 110 compares the base sequence for the sample and the reference base sequence, aligns the base sequence for the sample, and compares the difference between the aligned base sequence and the reference sequence, Multiple mutations found in a sample can be identified.
  • the information processing system 110 may generate a genetic information analysis result report 30 including genetic information analysis results based on a plurality of mutations discovered from the sample.
  • the genetic information analysis result report 30 may include the genetic information analysis result and any information associated therewith, such as the location of mutations found in the sample, the type of each mutation, It may include, but is not limited to, statistical information about analysis results, information related to tumor mutational burden (TMB), and information related to mutation signatures.
  • the genetic information analysis result report 30 may further include information on the patient from whom the sample was collected, a list of drivers related to a specific disease, and detailed information on the mutated gene.
  • the genetic information analysis result report 30 may be provided to a user (eg, medical staff) using a user interface, as will be described later.
  • the user interface is a means for conveniently providing base sequence analysis results, and can provide interactive response information including detailed information on genetic information analysis results to the user based on user input. For example, when a user selects a specific mutation, chromosome and genetic information related to the mutation may be output through the user interface.
  • a user interface may be output on a display means included in or connected to the information processing system 110, and information related to genome analysis may be output through the user interface.
  • the information processing system 110 may transmit information related to genome analysis to a user terminal through a network, and the user terminal may output information related to genome analysis received through a user interface.
  • Figure 2 is a schematic diagram showing a configuration in which the information processing system 230 according to an embodiment of the present disclosure is connected to communicate with a plurality of user terminals 210_1, 210_2, and 210_3. As shown, a plurality of user terminals 210_1, 210_2, and 210_3 may be connected to an information processing system 230 that can provide genetic information analysis results for a sample through the network 220.
  • the information processing system 110 of FIG. 1 may be the same system as the information processing system 230 of FIG. 2 .
  • information processing system 230 may include one or more server devices and/or databases capable of storing, providing, and executing executable programs (e.g., downloadable applications) and data, such as genetic information analysis services, or It may include one or more distributed computing devices and/or distributed databases based on cloud computing services.
  • the genetic information analysis service provided by the information processing system 230 may be provided to the user through a genetic information analysis service-related application installed on each of a plurality of user terminals 210_1, 210_2, and 210_3.
  • the information processing system 230 transmits part or all of the genetic information analysis result report to the user terminals 210_1, 210_2, and 210_3, and the user terminals 210_1, 210_2, and 210_3 transmit the genetic information analysis results through the user interface. You can print the data included in the report.
  • a plurality of user terminals 210_1, 210_2, and 210_3 may be computing devices capable of communicating with the information processing system 230 through the network 220.
  • the network 220 may be configured to enable communication between a plurality of user terminals 210_1, 210_2, and 210_3 and the information processing system 230.
  • the network 220 may be, for example, a wired network such as Ethernet, a wired home network (Power Line Communication), a telephone line communication device, and RS-serial communication, a mobile communication network, a wireless LAN (WLAN), It may consist of wireless networks such as Wi-Fi, Bluetooth, and ZigBee, or a combination thereof.
  • the communication method is not limited, and includes communication methods that utilize communication networks that the network 220 may include (e.g., mobile communication networks, wired Internet, wireless Internet, broadcasting networks, satellite networks, etc.) as well as user terminals (210_1, 210_2, 210_3) ) may also include short-range wireless communication between the network 220 may include (e.g., mobile communication networks, wired Internet, wireless Internet, broadcasting networks, satellite networks, etc.) as well as user terminals (210_1, 210_2, 210_3) ) may also include short-range wireless communication between the network 220 may include (e.g., mobile communication networks, wired Internet, wireless Internet, broadcasting networks, satellite networks, etc.) as well as user terminals (210_1, 210_2, 210_3) ) may also include short-range wireless communication between the network 220 may include (e.g., mobile communication networks, wired Internet, wireless Internet, broadcasting networks, satellite networks, etc.) as well as user terminals (210_1, 210_2, 210_3)
  • a plurality of user terminals 210_1, 210_2, and 210_3 may receive some or all of the data included in the genetic information analysis result report from the information processing system 230 using the genetic information analysis service and related applications.
  • the user terminals 210_1, 210_2, and 210_3 may receive some or all of the data included in the genetic information analysis result report from the information processing system 230 using a web browser.
  • the user terminals 210_1, 210_2, and 210_3 may output some information (eg, detailed information on the genetic information analysis results) included in the genetic information analysis result report using a user interface described later.
  • the user terminals 210_1, 210_2, and 210_3 When the user terminals 210_1, 210_2, and 210_3 receive a user input for selecting a specific menu or a specific graphic object in the user interface, they may output interactive response information corresponding to the user input.
  • the responsive response information may include detailed information about the genetic information analysis results.
  • the user terminals 210_1, 210_2, and 210_3 may transmit a data request associated with the user input to the information processing system 230. Thereafter, the user terminals 210_1, 210_2, and 210_3 may receive data associated with the user input (eg, detailed information on genetic information analysis results) from the information processing system 230 and output it through a user interface.
  • data associated with the user input eg, detailed information on genetic information analysis results
  • the mobile phone terminal (210_1), tablet terminal (210_2), and PC terminal (210_3) are shown as examples of user terminals, but they are not limited thereto, and the user terminals (210_1, 210_2, 210_3) use wired and/or wireless communication.
  • This may be any computing device capable of installing and executing an application or a web browser.
  • user terminals may include smartphones, mobile phones, navigation systems, computers, laptops, digital broadcasting terminals, PDAs (Personal Digital Assistants), PMPs (Portable Multimedia Players), tablet PCs, etc.
  • three user terminals (210_1, 210_2, 210_3) are shown as communicating with the information processing system 230 through the network 220, but this is not limited to this, and a different number of user terminals are connected to the network ( It may be configured to communicate with the information processing system 230 through 220).
  • the user terminal and the information processing system are shown to communicate as separate devices, but this is only an example, and the genetic information analysis-related configuration and/or functions provided by the user terminal and the genetic information processing system that provide Information analysis-related components and/or functions may be implemented in one computing device.
  • FIG. 3 is a block diagram showing the internal configuration of the user terminal 210 and the information processing system 230 according to an embodiment of the present disclosure.
  • the user terminal 210 may refer to any computing device capable of executing an application related to a genetic information analysis service, a web browser providing a genetic information analysis service, etc., and capable of wired/wireless communication.
  • FIG. 2 may include a mobile phone terminal (210_1), a tablet terminal (210_2), a PC terminal (210_3), etc.
  • the user terminal 210 may include a memory 312, a processor 314, a communication module 316, and an input/output interface 318.
  • information processing system 230 may include memory 332, processor 334, communication module 336, and input/output interface 338.
  • the user terminal 210 and the information processing system 230 are configured to communicate information and/or data through the network 220 using respective communication modules 316 and 336. It can be.
  • the input/output device 320 may be configured to input information and/or data to the user terminal 210 through the input/output interface 318 or to output information and/or data generated from the user terminal 210.
  • Memories 312 and 332 may include any non-transitory computer-readable recording medium. According to one embodiment, the memories 312 and 332 are non-permanent mass storage devices such as read only memory (ROM), disk drive, solid state drive (SSD), flash memory, etc. It can be included. As another example, non-perishable mass storage devices such as ROM, SSD, flash memory, disk drive, etc. may be included in the user terminal 210 or the information processing system 230 as a separate persistent storage device that is distinct from memory. In addition, the memories 312 and 332 include an operating system and at least one program code (for example, an application associated with a genetic information analysis service installed and running on the user terminal 210 or a web browser that provides a genetic information analysis service, etc. code, etc.) can be stored.
  • ROM read only memory
  • SSD solid state drive
  • flash memory etc. It can be included.
  • non-perishable mass storage devices such as ROM, SSD, flash memory, disk drive, etc. may be included in the user terminal 210 or the
  • These software components may be loaded from a computer-readable recording medium separate from the memories 312 and 332.
  • This separate computer-readable recording medium may include a recording medium directly connectable to the user terminal 210 and the information processing system 230, for example, a floppy drive, disk, tape, DVD/CD- It may include computer-readable recording media such as ROM drives and memory cards.
  • software components may be loaded into the memories 312 and 332 through a communication module rather than a computer-readable recording medium. For example, at least one program is loaded into memory 312, 332 based on a computer program installed by files provided over the network 220 by developers or a file distribution system that distributes installation files for applications. It can be.
  • the processors 314 and 334 may be configured to process instructions of a computer program by performing basic arithmetic, logic, and input/output operations. Instructions may be provided to the processors 314 and 334 by memories 312 and 332 or communication modules 316 and 336. For example, the processors 314 and 334 may be configured to execute instructions received according to program codes stored in a recording device such as the memory 312 and 332.
  • the communication modules 316 and 336 may provide a configuration or function for the user terminal 210 and the information processing system 230 to communicate with each other through the network 220, and may provide a configuration or function for the user terminal 210 and/or information processing.
  • the system 230 may provide a configuration or function for communicating with other user terminals or other systems (for example, a separate cloud system, etc.). For example, a request (e.g., a request for detailed information about genetic information analysis results, etc.) or data generated by the processor 314 of the user terminal 210 according to a program code stored in a recording device such as the memory 312. It may be transmitted to the information processing system 230 through the network 220 under the control of the communication module 316.
  • control signals, commands, or data (e.g., detailed information related to genetic information analysis results, etc.) provided under the control of the processor 334 of the information processing system 230 is connected to the communication module 336 and the network. It may be received by the user terminal 210 through the communication module 316 of the user terminal 210 via 220.
  • the input/output interface 318 may be a means for interfacing with the input/output device 320.
  • input devices may include devices such as cameras, keyboards, microphones, mice, etc., including audio sensors and/or image sensors
  • output devices may include devices such as displays, speakers, haptic feedback devices, etc. You can.
  • the input/output interface 318 may be a means for interfacing with a device that has components or functions for performing input and output, such as a touch screen, integrated into one.
  • the processor 314 of the user terminal 210 uses information and/or data provided by the information processing system 230 or another user terminal when processing instructions of a computer program loaded in the memory 312. A service screen, etc.
  • the input/output device 320 is shown not to be included in the user terminal 210, but the present invention is not limited to this and may be configured as a single device with the user terminal 210. Additionally, the input/output interface 338 of the information processing system 230 may be connected to the information processing system 230 or means for interfacing with a device (not shown) for input or output that the information processing system 230 may include. It can be. In FIG. 3 , the input/output device 320 is shown not to be included in the user terminal 210, but the present invention is not limited to this and may be configured as a single device with the user terminal 210. Additionally, the input/output interface 338 of the information processing system 230 may be connected to the information processing system 230 or means for interfacing with a device (not shown) for input or output that the information processing system 230 may include. It can be. In FIG.
  • the input/output interfaces 318 and 338 are shown as elements configured separately from the processors 314 and 334, but the present invention is not limited thereto, and the input/output interfaces 318 and 338 may be configured to be included in the processors 314 and 334. there is.
  • the user terminal 210 and information processing system 230 may include more components than those in FIG. 3 . However, there is no need to clearly show most prior art components. According to one embodiment, the user terminal 210 may be implemented to include at least some of the input/output devices 320 described above. Additionally, the user terminal 210 may further include other components such as a transceiver, a global positioning system (GPS) module, a camera, various sensors, and a database.
  • GPS global positioning system
  • the user terminal 210 may include components generally included in a smartphone, such as an acceleration sensor, a gyro sensor, an image sensor, a proximity sensor, a touch sensor, Various components such as an illuminance sensor, a camera module, various physical buttons, buttons using a touch panel, input/output ports, and a vibrator for vibration may be implemented to be further included in the user terminal 210.
  • a smartphone such as an acceleration sensor, a gyro sensor, an image sensor, a proximity sensor, a touch sensor, Various components such as an illuminance sensor, a camera module, various physical buttons, buttons using a touch panel, input/output ports, and a vibrator for vibration may be implemented to be further included in the user terminal 210.
  • the processor 314 While a program for an application, web browser, etc. that provides a genetic information analysis service is being operated, the processor 314 operates a touch screen, keyboard, camera including an audio sensor and/or an image sensor, a microphone, etc. connected to the input/output interface 318. It is possible to receive input or selected text, images, videos, voices, and/or actions through an input device, and store the received text, images, videos, voices, and/or actions in the memory 312 or store them in the communication module. It can be provided to the information processing system 230 through 316 and network 220.
  • the processor 314 of the user terminal 210 manages, processes, and/or stores information and/or data received from the input/output device 320, other user terminals, the information processing system 230, and/or a plurality of external systems. It can be configured to do so. Information and/or data processed by processor 314 may be provided to information processing system 230 via communication module 316 and network 220.
  • the processor 314 of the user terminal 210 may transmit information and/or data to the input/output device 320 through the input/output interface 318 and output the information. For example, the processor 314 outputs the received information and/or data, so that the received information and/or data is displayed on the screen of the user terminal 210, using a display device included in or connected to the user terminal 210. You can control it.
  • the processor 334 of the information processing system 230 may be configured to manage, process, and/or store information and/or data received from a plurality of user terminals 210 and/or a plurality of external systems. Information and/or data processed by the processor 334 may be provided to the user terminal 210 through the communication module 336 and the network 220.
  • the information processing system 230 may include at least one database for storing a genetic information analysis result report including genome analysis information.
  • the information processing system 230 may store a report on the results of genetic information analysis for each sample and may store identification information of at least one sample included in each project.
  • a project may include a report on the results of genetic information analysis for at least one sample.
  • the genetic information analysis result report includes the location of each mutation, the type of each mutation, patient information from which the sample was collected, statistical information on the analysis result, comment information on the analysis result, a list of drivers related to a specific disease, and the mutation. It may include information about the gene that occurred, information related to the tumor mutational burden (TMB), and information related to the mutation signature.
  • TMB tumor mutational burden
  • Detailed information included in the genetic information analysis result report may be output to at least one area included in the user interface.
  • the database can store user information including the user's ID and password, name, date of birth, mobile phone number, email address, etc. Additionally, the database can store information (i.e., member information) of multiple users participating in each project. According to one embodiment, the database may store a list of key mutations associated with each disease. For example, a first list of key mutations associated with a first disease may be stored in a database, and a second list of key mutations associated with a second disease may be stored in a database.
  • the list of key mutations may include mutations known in the art to be important in the associated disease.
  • the database may store a list of genes associated with each of one or more diseases.
  • the gene list may include labels for genes in which mutations have occurred that are known to be important in the disease.
  • FIG. 4 is a diagram illustrating an initial screen 400 displayed when login authentication is successful, according to an embodiment of the present disclosure. As illustrated in FIG. 4 , when the user terminal accesses the information processing system and successfully logs in, the initial screen 400 as shown in FIG. 4 may be output to the user terminal.
  • the initial screen 400 may be configured with a layout divided into a plurality of areas.
  • the initial screen 400 includes a first area 410 including a menu button, a second area 420 including a project selection menu, a third area 430 indicating the location of the current menu, It may be composed of a fourth area 440 that displays logged-in user information and a fifth area 450 that displays statistical information on the analysis results of each sample included in the project and brief information for each sample.
  • a first sub-menu for checking statistical information and a second sub-menu for checking information on analysis results may be output. Additionally, when a menu included in the first area 410 is selected, various submenus in addition to the first submenu and the second submenu may be output together. By selecting a submenu, the user can obtain related information.
  • the second area 420 may include a project selection menu used to output a list of projects in which a user who has successfully logged in is participating.
  • a list of projects assigned to the user may be displayed on the user terminal.
  • Figure 4 illustrates that a menu related to statistics on next-generation sequencing (NGS Statistics) is being used.
  • User information including the user's login ID may be output in the fourth area 440.
  • the fifth area 450 brief information and statistical information about each sample included in the project can be output.
  • the statistical information output to the fifth area 450 will be described in detail with reference to FIG. 5 .
  • the user can select another project using the project selection menu included in the second area 420.
  • a second project that is different from the first project displayed on the initial screen 400 is selected through the project selection menu, statistical information and brief information about the analysis results for each sample included in the second project are displayed in the fifth area (450). ) can be output.
  • FIG. 5 is a diagram illustrating the layout of the fifth area 450 of FIG. 4 according to an embodiment of the present disclosure.
  • the fifth area 450 included in the initial screen 400 may be configured with a layout including a plurality of sub-areas 510 to 560.
  • brief information about the analysis results for each sample may be displayed in the first sub-area 510.
  • brief information about the analysis results may include a sample ID for the specimen, a quality level for the analysis results, tumor identification information, and the date the analysis was completed. For example, if the quality of the analysis result is good, it may be indicated as 'Pass', and if the quality of the analysis result is poor, 'Fail' or 'Warning' may be indicated depending on the quality level.
  • Statistical information on Tumor Mutational Burden may be output in the second sub-area 520.
  • statistical information on the burden of tumor mutations can be output for each single nucleotide variation, indel (Insertion & Deletion), and structural variant (SV).
  • indel Insertion & Deletion
  • SV structural variant
  • statistical information can be calculated based on all samples included in the project.
  • the regions corresponding to the tumor mutation burden are divided into a certain number, and the number of discoveries of the tumor mutation burden for each region may be output in the second sub-region 520 in the form of a graph.
  • Statistical information about sequencing quality for a project may be output in the third sub-area 530. For example, statistics on the sequencing quality of each sample included in the project may be calculated, and the calculated statistics may be output in graphic form to the third sub-area 530.
  • the fourth sub-region 540 statistical information on mutations in driver genes related to a specific disease (eg, cancer) may be output.
  • Statistical information output from the fourth sub-area 540 may be generated based on analysis results of mutations found in each sample included in the project.
  • the number of discoveries of each mutation related to the tumor-causing gene (oncogene) is displayed in the form of a bar graph, and at the bottom of the fourth sub-region 540, the tumor suppressor gene and The number of discoveries for each associated mutation is illustrated as output as a bar graph.
  • the ratio of tumor cells to normal cells may be displayed in graphic form.
  • the ratio of tumor cells to normal cells is calculated for each predetermined section, and each ratio calculated in this way can be output in the form of a graph in the corresponding section.
  • the degree of ploidy may be output in the form of a graph.
  • the degree of ploidy of each sample included in the project is calculated for each predetermined section, and each degree of ploidy calculated in this way can be output in the form of a graph in the corresponding section.
  • a user interface including a first browser and a second browser that can check the analysis results for the selected sample in detail is displayed. It can be.
  • FIG. 6 is a diagram illustrating a user interface 600 including a first browser and a second browser, according to an embodiment of the present disclosure. As illustrated in FIG. 6, the user interface 600 may be configured with a layout in which a plurality of areas 610, 620, and 630 are partitioned.
  • a menu for selecting a project and sample may be displayed in the first area 610 included in the user interface 600.
  • the project list and sample list can be output through the user interface 600.
  • the second area 620 may include multiple browsers and multiple sub-areas. A description of the layout of the second area 620 will be described later with reference to FIG. 7 .
  • the third area 630 included in the user interface 600 may include a comment input box for exchanging comments with other users participating in the project.
  • the information processing system at least one of the email addresses, contact information, or terminal IP addresses of users participating in each project may be stored.
  • the comment may be provided to other users participating in the project.
  • the information processing system obtains the comment entered by the user, identifies the project associated with the sample being output through the user interface, and then selects at least one other project participating in the identified project.
  • User comments can be provided to the user.
  • the information processing system may transmit the comment to another user's email or a user terminal owned by another user.
  • FIG. 7 is a diagram illustrating the layout of the second area 620 of FIG. 6 according to an embodiment of the present disclosure. As illustrated in FIG. 7 , the second area 620 where the analysis results for the sample are output may be configured in a layout including a plurality of sub-areas 710 to 780.
  • Patient information and statistical information about sequencing results may be output in the first sub-area 710. As illustrated in FIG. 7, patient information including disease-related codes and disease identification information (e.g., cancer identification information) and statistical information about sequencing results for specimens may be output to the first sub-area 710. .
  • disease-related codes and disease identification information e.g., cancer identification information
  • statistical information about sequencing results for specimens may be output to the first sub-area 710.
  • Sample analysis information may be output in the second sub-area 720.
  • the search interpretation information may be comments recorded by a professional analyst. That is, a professional analyst can interpret the sequencing results for the specimen, enter comments on the sequencing results in advance and store them in the information processing system, and when the comments on the sequencing results are stored in this way, they are stored in the second sub-area 720. Comments written by professional analysts can be output.
  • a driver list including a list of genes related to a specific disease (eg, cancer) and associated with mutations found in the sample may be displayed.
  • the driver list is associated with a specific disease and may include a list of genes in which mutations occurred and information about mutations found in the sample.
  • the driver list is illustrated as a disease related to cancer.
  • the driver list may include a list of oncogene drivers and a list of tumor suppressor drivers.
  • the gene label in which the cancer-causing mutation occurred may be included in the list of cancer-causing drivers and output to the third sub-region 730.
  • a gene label that has a mutation that limits or eliminates the cancer-suppressing function may be included in the list of cancer-suppressing drivers and output to the third sub-region 730.
  • a first browser that can search for mutations found in the sample across the entire base sequence may be displayed.
  • the first browser may provide a view of mutations discovered across the entire genome.
  • the user can enlarge or zoom in on a specific region within the entire base sequence and select only a region corresponding to at least one chromosome from the genome. Additionally, the user can perform various search tasks for mutations found in the sample using the first browser.
  • responsive response information based on genome analysis information may be output to the fourth sub-area 740 in response to the user input. Responsive response information may include various detailed information about the results of genetic information analysis of the sample.
  • Responsive response information may include various detailed information about the results of genetic information analysis of the sample.
  • a second browser used to search detailed information about sequence information and other mutations obtained by analyzing a specimen may be displayed.
  • the second browser may enable search of sequence information obtained as a result of genome analysis at the level of a gene unit.
  • the user can use the second browser to enlarge the amino acid information area and check the differences between the reference amino acid and the mutated amino acid. Additionally, the user can perform various search tasks related to genetic information using the second browser.
  • Responsive response information may include genetic information about mutations.
  • the genetic information may include exons associated with the mutated gene, amino acid sequences transcribed and translated from the base sequence, untranslated regions that are not translated from the base sequence, domain information, etc. You can. The various functions provided by the second browser will be described in detail later with reference to FIGS. 16 to 19.
  • a list of genes associated with a specific disease may be displayed in the sixth sub-region 760.
  • the gene list may include at least one gene label in which a key mutation associated with a particular disease occurs.
  • a list of genes associated with a specific disease may be stored in advance in an information processing system, and the information processing system may include the gene list in genome analysis information for a specimen.
  • a specific disease may be identified, and the information processing system extracts a list of genes associated with the identified specific disease from the database, and converts the extracted gene list into genome analysis information.
  • the specific disease is illustrated as being cancer.
  • the gene list output to the sixth sub-region 760 includes genes associated with mutations found in the sample. Labels and gene labels not found from the sample are included, and the driver list output to the third sub-region 730 may include only gene labels associated with mutations found from the sample.
  • the gene label may be a gene name.
  • Information related to the tumor mutational burden of the specimen may be output in the seventh sub-area 770.
  • Mutation burden statistical information for each single nucleotide variation, indel, and structural variant (SV) for the sample is calculated and displayed in the seventh sub-region 770 in the form of a graph. You can. Information related to the tumor mutation burden output from the seventh sub-region 770 will be described in detail later with reference to FIG. 26.
  • Information related to the mutational signature for the specimen may be output in the eighth sub-area 780.
  • Information associated with the mutation signature may include single base substitution (SBS) signature information and indel signature information. Mutation signature information output from the eighth sub-area 780 will be described in detail later with reference to FIG. 27.
  • SBS single base substitution
  • FIG. 8 is an enlarged view of the third sub-area 730 of FIG. 7.
  • a driver list including a list of genes associated with a specific disease (eg, cancer) and associated with mutations found in the sample may be displayed.
  • the gene list may include at least one gene label.
  • the driver list includes an oncogene driver list 810 and a tumor suppressor driver list 820.
  • the cancer-causing driver list 810 includes the 'MYCN' gene label and mutation information in which base 'C' is replaced with 'T' in the gene with the 'MYCN' gene label
  • the cancer-suppressing driver list 820 includes the 'CNTNAP2' gene label and the 'MEN1' gene label, and additionally includes information on mutations that occurred in genes with the 'CNTNAP2' gene label and the 'MEN1' gene label, respectively.
  • the gene label and mutation information included in the cancer-causing driver list 810 may be visualized using a first graphic element (eg, a first color) and output to the third sub-area 730.
  • Gene labels and mutation information included in the cancer suppression driver list 820 may be visualized using a second graphic element (eg, a second color) and output to the third sub-area 730.
  • the gene label and mutation information are illustrated as being separated by a separator (:).
  • At least one link icon 830 to 870 capable of accessing an external database may be displayed in the third sub-area 730 adjacent to the label of each gene.
  • Each link icon (830 to 870) is a means of accessing an external database that provides at least one of a detailed description of each mutation, comment information, treatment method, effect due to the treatment method, etc., and the link icon (830 to 870) 870) may include link addresses of different external databases.
  • the first link icon 830 provides a link to access a first external database (e.g., “OncoKB” database) that provides at least one of a detailed description of the mutation, comment information, treatment method, or effect due to the treatment method. It can be included.
  • a first external database e.g., “OncoKB” database
  • the user interface accesses the first external database to obtain at least one of a detailed description of the mutation, comment information, a treatment method, or an effect due to the treatment method, and the obtained A web page containing information can be output.
  • the first link icon 830 may be activated and output to the third sub-area 730 when information associated with the gene label output to the third sub-area 730 is included in the first external database.
  • the second link icon 840 may provide access to a second external database (e.g., the “CIVIC” database) that provides at least one of a detailed description of the mutation, comment information, a treatment method, or an effect resulting from the treatment method. May contain links.
  • a second external database e.g., the “CIVIC” database
  • the user interface accesses the second external database to obtain at least one of a detailed description of the mutation, comment information, a treatment method, or an effect due to the treatment method, and obtains this. You can output a web page containing the information provided.
  • the second link icon 840 may be activated and output to the third sub-area 730 when information associated with the gene label output to the third sub-area 730 is included in the second external database.
  • the third link icon 850 provides access to a third external database (e.g., “Ensembl” database) that provides at least one of a detailed description of the mutation, comment information, treatment method, or effect due to the treatment method. May contain links.
  • the third link icon 850 may be activated and output to the third sub-area 730 when information associated with the gene label output to the third sub-area 730 is included in the third external database.
  • the fourth link icon 860 provides access to a fourth external database (e.g., the “UCSC Genome Institute” database) that provides at least one of a detailed description of the mutation, comment information, a treatment method, or an effect resulting from the treatment method.
  • the fifth link icon 870 is a fifth external database (e.g., “ClinicalTrials. gov” database).
  • the fourth link icon 860 can be activated and output to the third sub-area 730 when information associated with the gene label is included in the fourth external database, and the fifth link icon 870 is associated with the gene label. If information is included in the fifth external database, it may be activated and output to the third sub-area 730.
  • FIG. 9 is an enlarged view of the fourth sub-area 740 where the first browser of FIG. 7 is displayed.
  • the first browser includes a menu area 910 where at least one chromosome can be selected, a chromosome display area 920 where chromosome identification information is displayed, structural variation, and copy number.
  • the first information output area 930 where number) information is output, point mutation and allelic copy number information (for example, the copy number of the chromosome received from the father and the copy number of the chromosome received from the mother) a second information output area 940 where the number of copies), etc.
  • a gene label output area 950 where labels of genes in which mutations are found or not found are output, and the type of mutation to be displayed visually in the first browser is filtered. It may be configured with a layout that includes a filtering area 960 used to do so.
  • Information output to each of the menu area 910, the first information output area 930, the second information output area 940, and the gene label output area 950 can be controlled through the first browser.
  • a list of chromosomes included in the base sequence can be displayed.
  • One or more chromosomes may be selected from the chromosome list, and only information related to the selected chromosome may be selected and output to the first information output area 930, the second information output area 940, and the gene label output area 950. 1 Browser can be controlled.
  • Identification information for each chromosome may be displayed in the chromosome display area 920. In Figure 9, it is illustrated that all chromosomes are printed.
  • a pattern in which the copy number of each region/position of the genome is plotted with black dots may be displayed in the first information output area 930 through the first browser. Additionally, point mutations and structural mutations may be visualized through the first browser and output to the first information output area 930.
  • a graphic object associated with a structural mutation discovered from a specimen may be visualized and output to the first information output area 930. At this time, at least one of the shape or color of the graphic object is determined based on the type of target structural mutation to be visualized, and the size (e.g., width) of the graphic object is determined based on the area (position range) of the target structural mutation. may be determined and visualized in the first information output area 930.
  • the first information output area 930 of FIG. 9 illustrates that five structural mutations are visualized and output, and the colors and/or shapes are visualized differently depending on the type of structural mutation.
  • Information about the copy number for each allele may be output in the second information output area 940.
  • the copy number of one allele e.g., the copy number of the allele received from the mother
  • a first graphic element e.g., a first color
  • another The copy number of an allele e.g., the copy number of a paternal allele
  • a second graphical element e.g., a second color
  • point mutations found from base sequences may be visualized and output in the second information output area 940.
  • a graphical element that visualizes the mutation may be determined. For example, the mutation 'C>A', where base 'C' is substituted for 'A', can be visualized using a third graphical element, and 'C>G', where base 'C' is substituted for 'G'.
  • the mutation can be visualized using a fourth graphic element, and the 'C>T' mutation, where base 'C' is replaced with 'T', can be visualized using a fifth graphic element.
  • each gene associated with a major mutation associated with a specific disease can be output in association with its location. Additionally, among the genes associated with major mutations displayed in the gene label output area 950, genes associated with mutations found in the sample can be visualized using separate graphic elements. According to one embodiment, among genes associated with major mutations, genes found in a sample and included in a list of cancer-causing drivers may be visualized in the gene label output area 950 using a sixth graphic element. Additionally, among the genes associated with major mutations, genes discovered from the sample and included in the cancer suppressor driver list can be visualized in the gene label output area 950 using a seventh graphic element.
  • genes associated with mutations not found in the sample can be visualized in the gene label output area 950 using the eighth graphic element.
  • the 'MYCN' gene included in the cancer-causing driver is visualized using a third color as the sixth graphic element, and the 'CNTNAP2' and 'MEN1' genes included in the cancer-suppressing driver list are visualized as the seventh graphic element. 4 Colors are used to visualize, and genes related to major mutations not found in the specimen, such as 'ARID1A' and 'RIT1', are visualized using the 5th color as the 8th graphic element.
  • the filtering area 960 includes first filter objects capable of filtering structural variations output to the first information output area 930 and a second filter capable of filtering the variations output to the second information output area 940. Can contain objects.
  • First filter objects included in the filtering area 960 may include objects related to structural variation.
  • the first filter objects are a 'DEL' object representing a structural mutation associated with deletion, a 'DUP' object representing a structural mutation associated with duplication, and a '5to5INV' object representing a structural mutation associated with inversion.
  • ' object, a '3to3INV' object, and a 'TRA' object representing structural variation associated with translocation.
  • the number in parentheses next to each object may be the number of corresponding structural mutations found in the sample.
  • information on a type of structural variation associated with the filter object selected by the user may be selected and visually displayed in the first information output area 930.
  • information about a type of structural variation i.e., a graphic object associated with a structural variation
  • information about a type of structural variation i.e., a graphic object associated with a structural variation
  • the user can select information about the structural mutation to be confirmed and output it to the first information output area 930.
  • Second filter objects included in the filtering area 960 may include objects associated with mutations other than structural mutations.
  • the second filter objects include a 'Major Allele' object representing the copy number of the allele received from one of the mother and father, and a 'Minor Allele' object representing the copy number of the allele received from the other one of the mother and father. It can be included.
  • the 'Major Allele' object represents the copy number of the allele received from the mother
  • the 'Minor Allele' object may represent the copy number of the allele received from the father.
  • the 'Minor Allele' object can represent the copy number of the allele received from the mother.
  • the second filter objects may include a plurality of objects associated with point mutations.
  • objects associated with point mutations are 'C>A' object, 'C>G' object, 'C>T' object, 'T>A' object, 'T>C' object, and 'T>G'. It is illustrated as being an object.
  • the second filter objects may include an 'ins' object related to insertion and a 'del' object related to base deletion. The number in parentheses next to each object may be the number of corresponding mutations detected from the base sequence.
  • the copy number and/or mutation associated with an object selected from among the second filter objects is selected and displayed visually in the second information output area 940, and the copy number and/or mutation associated with an object not selected from among the second filter objects is selected. Mutations may be removed or made invisible in the second information output area 940.
  • the user can select the paternal/maternal copy number and/or mutation to be confirmed and output them to the second information output area 940.
  • FIG. 10 is a diagram illustrating another example of the first information output area 1000 including structural variations visualized through different graphic objects. As illustrated in FIG. 10 , a graphic object associated with the type of structural variation is determined by the first browser, and this graphic object may be visualized in the first information output area 1000.
  • a first type of structural variation 1010 associated with an inversion of n numbers (where n is a natural number) of bases may be visualized in the first information output area 1000 using a first graphic object.
  • a second type of structural variation 1020 associated with an inversion of m numbers of bases may be visualized in the first information output area 1000 using a second graphic object.
  • a third type of structural variation 1030 associated with base translocation may be visualized in the first information output area 1000 using a third graphic object.
  • a fourth type of structural variation 1040 associated with a base deletion may be visualized in the first information output area 1000 using a fourth graphic object.
  • FIG. 10 when the types of structural variations 1010 to 1040 are different, different graphic objects may be used to visualize the structural variations 1010 to 1040. For example, graphic objects having different colors and/or shapes may be used for different types of structural variations 1010 to 1040.
  • graphic objects related to structural variations may be concentrated and output to the first information output area. For example, when a plurality of structural mutations are found in a specific region of the base sequence, graphic objects related to the structural mutations may be densely distributed in the specific region. In this case, graphic objects related to each structural variation may be visualized overlapping, which may deteriorate user readability.
  • the density of graphic objects associated with the structural variation is calculated, and if the calculated density exceeds a predetermined threshold, various graphic processing may be performed to improve readability. For example, the density of graphic objects may be calculated based on the number of graphic objects located within a threshold distance.
  • various graphic processing may be performed to improve readability.
  • the density of graphic objects may be calculated based on the area where graphic objects are visualized within a predetermined unit area. In this case, when the calculated density of graphic objects is greater than or equal to a threshold, various graphic processing may be performed to improve readability.
  • the closeness of graphic objects can be calculated in various ways.
  • FIG. 11 is a diagram illustrating an example of graphic object processing when graphic objects associated with structural variation are dense.
  • the area 1112 including the critical distance is the dense area 1112 where the graphic objects are densely located.
  • a dense area 1112 whose horizontal width is a predetermined distance from the critical distance may be determined.
  • the density of graphic objects is calculated based on the area in which at least one graphic object is visualized within a predetermined unit area, and when the calculated density of graphic objects is greater than or equal to a threshold value, the density of graphic objects including the corresponding graphic object is calculated.
  • the area may be determined to be a dense area.
  • the pointer moves to the first graphic object 1122 among the plurality of graphic objects, as in the second screen 1120. It can be located in .
  • the first browser may be controlled so that the first graphic object 1122 where the pointer is located is highlighted. Additionally or alternatively, the first browser may be controlled so that among graphic objects included in the dense area 1112, objects other than the first graphic object 1122 where the pointer is located are removed or blurred. In the second screen 1120 of FIG. 11, the line thickness of the graphic object 1122 where the pointer is located becomes thicker, and the remaining objects are blurred.
  • the line thickness of the second graphic object 1132 where the pointer is located becomes thicker and emphasized, and objects other than the second graphic object 1122 are
  • the first browser can be controlled to be removed or dimmed.
  • FIG. 12 is a diagram illustrating another example of graphic object processing when graphic objects associated with structural variation are dense.
  • the area 1212 including the critical distance is a dense area where graphic objects are densely located. It can be determined as (1212).
  • the density of graphic objects is calculated based on the area in which at least one graphic object is visualized within a predetermined unit area, and when the calculated density of graphic objects is greater than or equal to a threshold value, the density of graphic objects including the corresponding graphic object is calculated.
  • the area may be determined to be a dense area.
  • the first browser may be controlled so that a plurality of graphic objects located in the dense area 1212 rotate at regular time intervals and are highlighted.
  • the first browser may be controlled so that the first, second, and third graphic objects included in the dense area 1212 are rotated, highlighted, and visualized in that order.
  • the line of the emphasized graphic object may become thick, and graphic objects other than the emphasized object may be blurred or removed.
  • the order of the second screen 1220 in which the first graphic object is emphasized the third screen 1230 in which the second graphic object is emphasized, and the fourth screen 1240 in which the third graphic object is emphasized.
  • the first browser can be controlled to rotate to .
  • FIG. 13 is a diagram illustrating another example of graphic object processing when graphic objects associated with structural variation are dense.
  • the area 1312 including the critical distance is a dense area where graphic objects are densely located. It can be determined as (1312).
  • the density of graphic objects is calculated based on the area in which at least one graphic object is visualized within a predetermined unit area, and when the calculated density of graphic objects is greater than or equal to a threshold value, the density of graphic objects including the corresponding graphic object is calculated.
  • the area may be determined to be a dense area.
  • the first browser may be controlled so that the dense area 1312 is automatically enlarged or zoomed in for a predetermined time and displayed, as shown in the second screen 1320 of FIG. 13.
  • the first browser may be controlled to display the dense area enlarged or zoomed in as shown in the second screen 1320.
  • the first browser in response to the pointer being positioned on a graphic object included in the dense area 1312, the first browser may be controlled to display the dense area enlarged or zoomed in, as shown in the second screen 1320.
  • the dense area 1312 may be visualized using a separate graphic element so that the user can perceive the dense area 1312.
  • the separate graphic element may include at least one of color, pattern, or shape.
  • the dense area 1312 may be determined whether a user input for selecting a graphic object included in the dense area 1312 is received. If it is determined that no user input for selecting a graphic object included in the dense area 1312 is received for a predetermined period of time, the enlarged dense area 1312 is reduced to its original size or the zoomed-in dense area 1312 is restored to its original size.
  • the first browser can be controlled to zoom out. That is, if the dense area 1312 is enlarged or zoomed in, but a graphic object included in the dense area 1312 is not selected for a predetermined period of time, the dense area 1312 may be returned to its original state.
  • the first browser may be controlled to return the enlarged or zoomed-in dense area 1312 to its original state. That is, after the pointer is positioned in the dense area 1312, if it moves out of the dense area 1312, the enlarged or zoomed-in dense area 1312 may be reduced to its original size or zoomed out.
  • the area selected by the user in the first browser may be enlarged.
  • the first information output area 930 and the second information output area 940 of FIG. 9 may be enlarged based on the user's input.
  • the user can select an area to be enlarged by dragging the pointer, and the area selected by the user can be enlarged or zoomed in and displayed through the first browser.
  • users can enlarge or zoom in on a desired area through touch gestures such as pinch zoom.
  • FIG. 14 is a diagram illustrating an enlarged area 1400 in the first browser. As illustrated in FIG. 14, when a partial area included in the first information output area and/or the second information output area included in the first browser is dragged, the dragged area 1430 is enlarged or zoomed in to display the first information. It may be output to the output area and/or the second information output area.
  • Figure 14 illustrates that a partial region 1430 included in the second chromosome is enlarged or zoomed in and printed. As illustrated in Figure 14, when only a partial region of the entire nucleotide sequence region is output, location information 1410 of the output region is output, and a link icon 1420 providing information related to the output region is activated. and can be output.
  • a plurality of chromosomes included in the genome may be selected and output.
  • the Chromosome menu included in the menu area 910 illustrated in FIG. 9 may be selected to output a chromosome list, and information on a plurality of chromosomes selected from the chromosome list may be output through the first browser.
  • the information output area is divided into numbers corresponding to the number of chromosomes selected through the first browser, and information associated with each of the selected plurality of chromosomes may be output in the divided information output area.
  • FIG. 15 is a diagram illustrating a screen 1500 of a first browser on which two chromosomes are displayed, according to an embodiment of the present disclosure.
  • Figure 15 illustrates that only chromosomes 7 and 14 are selected, and information related to chromosomes 7 and 14 is output through the first browser.
  • the information output area may be divided into two through the first browser (1510, 1520).
  • information related to chromosome 7 may be output in the divided first region 1510
  • information related to chromosome 14 may be output in the divided second region 1520.
  • one or three or more chromosomes may be selected from the chromosome list included in the Chromosome menu, and in this case, chromosome-related information corresponding to the selected number may be output in the information output area.
  • a specific type of structural variation is discovered from a plurality of chromosomes, and information (eg, visualized information) associated with the specific type of structural variation may be displayed in the first browser at the discovered position. For example, if a specific type of structural mutation is found in both chromosome 2 and chromosome 15, a specific structure is displayed in each of the region associated with chromosome 2 and the region associated with chromosome 15 among the first information output area of the first browser. Visualization information about mutations may be output.
  • the first browser may receive a user input for selecting a specific type of structural variation. For example, user input may be received to select visualization information associated with a specific type of structural variant or to select a filter object associated with a specific type of structural variant.
  • the first browser may be controlled to output only information related to at least one chromosome in which a specific type of structural mutation has been discovered. For example, when a specific type of structural variant is found on both chromosomes 2 and 15, and a user input selecting a specific type of structural variant is received, only the information associated with chromosome 2 and the information associated with chromosome 15 are displayed.
  • the first browser can be controlled so that output is output in this first browser.
  • the information output area of the first browser is divided by the number of chromosomes involved, and information associated with each chromosome may be output in the divided information output area.
  • FIG. 16 is a diagram illustrating in more detail the fifth sub-area 750 where the second browser of FIG. 7 is displayed.
  • the second browser has a transcription model area 1610 where the currently selected transcription model is output, and location information where information about the position of the positive strand in the DNA double helix is output.
  • the sequence information may include an RNA (Ribonucleic acid) sequence in which a portion of a DNA sequence is transcribed by a transcription model and/or an amino acid sequence translated corresponding to such sequences.
  • RNA Ribonucleic acid
  • Identification information (e.g., name) for the currently selected transcription model may be output in the transcription model area 1610, and the location range (coordinate range) of this transcription model may be output in the position information area 1620. If the transcription model is changed, the identification information output to the transcription model area 1610 and the position information output to the position information area 1620 may change, and the sequence information output to the information output area 1640 may also change. You can.
  • an external database that provides at least one of the following: a detailed description of the gene being output in the output area 1640 and well-known mutations related to the gene, comment information, treatment method, effect due to the treatment method, etc.
  • a link icon that can be accessed may be displayed.
  • the method of activating the link icon may be the same as the method of activating the link icon described with reference to FIG. 8.
  • each variation can be visualized in the information output area 1640 using different graphic objects depending on the type.
  • a missense mutation can be visualized in the information output area 1640 using a first graphic object in the form of a circle in a first color
  • a truncating mutation can be in the form of a circle in a second color.
  • a second graphic object having a can be used to visualize in the information output area 1640
  • the transition associated with inframe insertion can be done by using a third graphic object having a first color and a downward arrow shape. It can be visualized in the information output area 1640.
  • various graphic objects may be used so that the corresponding type of variation can be visualized in the information output area 1640 .
  • a DNA base sequence, an RNA sequence in which the DNA base sequence is transcribed, an amino acid sequence translated corresponding to such sequences, and/or other genetic information may be output.
  • the information output area 1640 includes an exon associated with the selected gene, an amino acid sequence translated from the base sequence, a base sequence region subject to translation, an untranslated region that is not translated from the base sequence, Domain information, etc. may be output.
  • a nucleotide sequence region subject to translation a plurality of bases obtained from the sample can be output, and the mutated bases and the bases of the reference nucleotide sequence that serve as a standard for comparison can be output together.
  • amino acid sequence region a plurality of amino acid identifiers with translated bases may be output.
  • amino acid change information including an amino acid identifier where a mutation occurred and an amino acid identifier at a position corresponding to the amino acid where a mutation occurred in the amino acid sequence according to the reference base sequence may be output in the amino acid information area.
  • the reference base sequence may be a base sequence that serves as a standard for alignment.
  • the reference amino acid may be an RNA sequence in which some bases included in the reference sequence are transcribed, or an amino acid sequence translated from such an RNA sequence.
  • the reference amino acid can be used as reference information to determine whether the amino acid has mutated.
  • the reference base may be a base included in the reference base sequence, and the reference amino acid identifier may be an amino acid identifier included in the reference amino acid.
  • the user can check how the base sequence is translated into amino acids according to the transcription model and determine how the mutation found in the base sequence of the sample affects the amino acid sequence. You can.
  • the section from '0' to '465aa' illustrated in Figure 16 may be an amino acid region translated from a partial region of the base sequence.
  • the numbers '1', '2', and '3' written in the boxes illustrated in FIG. 16 may indicate that the intron region is excluded and the exon region is numbered in the DNA.
  • mutation information about the base and information about amino acids changed compared to the reference amino acid may be output. That is, amino acid change information indicating the difference between the amino acid being compared and the reference amino acid may be output to the information output area 1640.
  • amino acid change information indicating the difference between the amino acid being compared and the reference amino acid may be output to the information output area 1640.
  • the dragged area may be enlarged and output in the information output area 1640.
  • the output area 1640 is enlarged, the amino acid identifier and characters related to the base are displayed, allowing the user to identify the mutated base and amino acid identifier.
  • a graphic object 1660 may be output to the information output area 1640 in association with the location of a mutation in the selected gene. As described above, a graphic object 1660 related to the type of mutation may be output to the information output area 1640.
  • a pointer may be used to select the graphic object 1660 output to the information output area 1640. That is, a user input selected by the mutation-related graphic object 1660 output to the information output area 1640 may be received. In response to a user input selected by the graphic object 1660, detailed information about the corresponding mutation may be output.
  • FIG. 17 is a diagram illustrating a screen 1700 on which detailed information about mutations is displayed, according to an embodiment of the present disclosure. As illustrated in FIG. 17 , detailed information 1710 about the mutation may be output in response to a user input in which a graphic object 1660 associated with the mutation is selected.
  • Detailed information on the analysis results of the mutation (1710) includes chromosomal information, base position information related to the location of the mutation, HGVSc information related to the mutation in DNA, HGVSp information related to the amino acid mutation, and reference allele at the position. It may include '# of ref.READ' information and '# of alt.READ' information related to the count number of the trait (allele), VAF (Variant allele frequency) value, and TCF value.
  • the TCF value is the proportion of samples that have the corresponding mutation, and may be a value deduced arithmetically by combining various surrounding information.
  • details 1710 about the results of the analysis of mutations may include other items, such as COSMIC and ClinVar, PolyPhen, SIFT, etc.
  • PolyPhen and SIFT may be the result of inferring the effect of the mutation on the function of the gene based on the conservation of the sequence (for example, the degree to which the exact same sequence exists in monkeys).
  • user input requesting comparison for a specific mutation associated with graphical object 1660 may be received.
  • the information processing system may receive a comparison request for a specific mutation from the user terminal, and may identify other specimens included in the project associated with the specimen in response to receiving the comparison request. Subsequently, the information processing system can extract detailed information about specific mutations found in other identified specimens from the database and transmit them to the user terminal.
  • the user terminal can output the detailed information about the specific mutation found in the sample and the detailed information about the specific mutation found in other samples through the user interface. Detailed information about each associated mutation can be displayed on one screen through the user interface. Accordingly, users can compare detailed information about different samples through one screen.
  • the user terminal can store all information related to the project. With all information related to the project stored in the user terminal, when a user input requesting comparison of a specific mutation associated with the graphic object 1660 is received, the user terminal provides genome analysis information to other samples from the saved project information. It is possible to extract and obtain detailed information about a specific mutation from the extracted genome analysis information. Subsequently, the user terminal can associate detailed information about the specific mutation found in the sample with detailed information about the specific mutation found in other samples and output it through the user interface.
  • the amino acid region associated with the mutation may be automatically enlarged.
  • Figure 18 is a diagram illustrating an information output area 1800 set to enlarge and display a specific region of the base sequence and amino acid sequence.
  • a specific region of the amino acid sequence and a specific region of the base sequence associated with a specific mutation may be enlarged or zoomed in and displayed.
  • the letters associated with each mutated base and amino acid identifier are enlarged and displayed, allowing the user to recognize the base and amino acid identifier with the naked eye.
  • amino acid change information 1810 including the identifier of the reference amino acid and the mutated amino acid identifier may be output to the information output area 1800.
  • the amino acid change information 1810 of FIG. 18 includes 'C' as the base of the reference sequence, 'T' as the base mutated in the sample, 'P' as the reference amino acid identifier, and 'L' as the mutated amino acid identifier. This is illustrated as being included.
  • the amino acid change information (1810) in FIG. 18 compared to the reference base sequence, the base of the sample is mutated from 'C' to 'T', and compared to the reference amino acid, the amino acid of the sample is changed from 'P' to 'L'. It can be interpreted as a mutation.
  • An enlarged screen as shown in Figure 18 can also be achieved through dragging a pointer or a touch gesture. That is, when the area associated with FIG. 18 is dragged through the pointer, the area illustrated in FIG. 18 may be enlarged and displayed.
  • a list of transcription models from which a transcription model can be selected may be displayed in the second browser.
  • the transcription model list may include multiple transcription models associated with some regions within the base sequence. For example, when a first region spanning from the first point to the second point within the entire base sequence is selected, a plurality of transcription models capable of transcribing and translating part or all of the first region are included in the transcription model list. may be included in
  • the information processing system transcribes and translates the base sequence obtained from the specimen through each transcription model, and includes the results translated through each transcription model in the genome analysis information.
  • FIG. 19 is a diagram illustrating a second browser 1900 in which a list of transcription models is output.
  • a transcription model list 1910 may be output.
  • the second browser may be controlled to reflect results transcribed and translated by the selected specific transcription model.
  • each transcription model may have a priority. These priorities may be predetermined based on conditions such as frequency of use, may be pre-assigned by an expert analyst, or may be determined through text ascending/descending order.
  • the transcription model list may change in relation to the area.
  • the target transcription model to be output to the second browser may be determined based on the priority of each transcription model included in the transcription model list. That is, based on the priority of each transcription model included in the transcription model list, the transcription model with the highest priority is determined as the target transcription model, and genetic information including the results transcribed and translated through the determined target transcription model is second. It can be output through a browser.
  • the first browser and the second browser may operate in conjunction with each other based on the selected specific chromosome.
  • FIG. 20 is a diagram illustrating a screen 2000 of a first browser on which information associated with a specific chromosome is displayed, according to an embodiment of the present disclosure.
  • information (2010) related to the location and size of chromosome 1 is output, and only information related to chromosome 1 is selected and output in the information output area (2020). It is illustrated.
  • information output to the second browser may also be changed.
  • FIG. 21 is a diagram illustrating a screen 2100 of a second browser that operates in conjunction with a gene associated with a chromosome selected in the first browser.
  • a list of transcription models capable of transcribing and translating the specific gene 'ARID1A' region contained in chromosome 1 is obtained, and based on the priority of each transcription model included in the transcription model list, A target transcription model to be output may be determined.
  • Information 2110 related to the determined target transcription model may be output through the second browser. Additionally, information 2120 related to the area and size to be transcribed and translated through the target transcription model may be output through the second browser. Additionally, genetic information 2130 including results transcribed and translated by the target transcription model may be output through the second browser.
  • genetic information associated with the specific chromosome may be displayed in the second browser.
  • the first browser and the second browser can be controlled to output information related to the selected mutation information/gene label.
  • FIG. 22 is a diagram illustrating a screen 2210 of a first browser and a screen 2220 of a second browser operated based on mutation information selected from the driver list. For example, in response to user input selecting 'CNTNAP2' and/or mutation information related to 'CNTNAP2' from the driver list, only information related to the 7th chromosome where the 'CNTNAP2' gene is located is displayed in the information output area through the first browser. It can be output at (2214). That is, when the user selects 'CNTNAP2' and/or a mutation related to 'CNTNAP2' from the driver list, only chromosome 7 where the 'CNTNAP2' gene is found is selected and output to the information output area 2214 through the first browser.
  • Information 2212 indicating that the chromosome related to the 'CNTNAP2' gene is chromosome 7 may be output through the first browser, and in addition, the gene label 'CNTNAP2' 2216 may be output through the first browser.
  • a list of transcription models associated with the region where the 'CNTNAP2' gene is located on the 7th chromosome is obtained, and a target transcription model can be determined based on the priority of each transcription model included in the transcription model list.
  • Genetic information including results transcribed and translated by the target transcription model may be output to the information output area 2224 through the second browser.
  • information 2222 including identification information of the target transcription model and a location area translated into the target transcription model may be output through the second browser.
  • the information output to each of the first browser and the second browser can be changed together by selecting mutation information/gene label included in the driver list.
  • FIG. 23 is a diagram illustrating another example of a first browser screen 2310 and a second browser screen 2320 that operate based on mutation information selected from the driver list. For example, in response to a user input selecting 'MYCN' and/or mutation information related to 'MYCN' from the driver list, only information related to the second chromosome where the 'MYCN' gene is located is displayed in the information output area through the first browser. It can be output at (2314). Information 2312 indicating that the chromosome related to the 'MYCN' gene is chromosome 2 may be output through the first browser, and in addition, 'MYCN' 2316, a gene label, may be output through the first browser.
  • a list of transcription models associated with the location region where the 'MYCN' gene is located in the second chromosome is obtained, and a target transcription model can be determined based on the priority of each transcription model included in the obtained transcription model list.
  • Genetic information including results transcribed and translated by the target transcription model may be output to the information output area 2324 through the second browser.
  • information 2322 including identification information of the target transcription model and a location area translated into the target transcription model may be output through the second browser.
  • FIG. 24 is an enlarged view of the sixth sub-area 760 of FIG. 7. As illustrated in FIG. 24 , as illustrated in the enlarged sixth sub-region 760, a list (2420 to 2440) of genes in which major mutations associated with a specific disease occur can be output. For example, this list 2420 to 2440 may include labels of genes in which representative mutations associated with a particular cancer are found.
  • an input box 2410 where major genes can be added can be displayed.
  • the user can add a gene label associated with a specific mutation to the gene list by entering the gene label into the input box 2410.
  • Gene lists 2420 to 2440 may include gene labels visualized with different graphic elements for each gene type.
  • the gene label 2420 found in the sample and included in the cancer-causing driver (Oncogene driver) list is visualized using the first graphic element and is displayed in the sixth sub-region. It can be output at (760).
  • the gene label 2430 found in the sample and included in the tumor suppressor driver list is visualized using a second graphic element to form a sixth sub-region 760. It can be output to .
  • a gene label 2440 associated with a mutation not found in the sample may be visualized using a third graphic element and output in the sixth sub-region 760.
  • the first graphic element is illustrated as a first color
  • the second graphic element as a second color
  • the third graphic element as a third color.
  • the gene label added to the gene list through the input box 2410 may be visualized using the fourth graphic element and output to the sixth sub-area 760.
  • information on each of the first browser and the second browser may be changed in conjunction with each other based on the selected specific gene label.
  • FIG. 25 is a diagram illustrating a screen 2510 of a first browser and a screen 2520 of a second browser operating based on a gene selected from a gene list, according to an embodiment of the present disclosure.
  • information related to the third chromosome where the 'SETD2' gene is located may be output to the information output area 2514 through the first browser.
  • 'SETD2' is a gene for which no mutation was found in the sample.
  • the gene list may also include labels of major genes for which mutations were not found in the sample, and accordingly, user input to select the 'SETD2' gene for which no mutations were found in the sample from the gene list. This can be received.
  • chromosome 3 where the 'SETD2' gene is located can be selected and output to the information output area 2514 through the first browser.
  • Information 2512 about chromosome 3 where the 'SETD2' gene is located can be output through the first browser, and in addition, the label 2516 of the 'SETD2' gene can be output through the first browser.
  • a list of transcription models used to transcribe and translate the 'SETD2' gene region is obtained, and a target transcription model can be determined based on the priority of each transcription model included in the transcription model list.
  • Genetic information including the results translated by the target transcription model may be output to the information output area 2524 through the second browser.
  • information 2522 including identification information of the target transcription model and a location area translated by the target transcription model may be output through the second browser.
  • the information displayed on each of the first browser and the second browser can be changed by selecting a mutation included in the main mutation list.
  • FIG. 26 is an enlarged view of the seventh sub-area 770 of FIG. 7.
  • information related to a plot about the tumor mutational burden of a specimen (hereinafter referred to as a 'tumor mutation burden plot') may be output in the seventh sub-area 770.
  • the information associated with the plot for tumor mutation burden may include statistical information about different types of mutations.
  • mutation burden statistical information for each single nucleotide variation (SNV), indel (insertion and deletion), and structural variant (SV) found in the sample is calculated and presented in graph form. 7 It can be output to sub-area 770.
  • a tumor mutation burden plot for the single nucleotide sequence variation (SNV) of the sample is calculated, and graphic elements related to the tumor mutation burden plot for the calculated single nucleotide variation (SNV) (This Case in Figure 26) ) can be output in the single nucleotide variation (SNV) distribution graph.
  • the tumor mutation burden plot for single nucleotide variation (SNV) is illustrated as calculated at 1.13/Mbps.
  • a tumor mutation burden plot for the indels discovered from the sample is calculated, and graphic elements related to the tumor mutation burden plot for the calculated indels (This Case in FIG. 26) can be output from the indel distribution graph.
  • the tumor mutation burden plot for indels is illustrated as calculated at 0.15/Mbps.
  • a tumor mutation burden plot for the structural variants (SVs) found in the specimen is calculated, and a graphical element (This Case in Figure 26) related to the tumor mutation burden plot for the calculated structural variants is output in the structural variant distribution graph. It can be.
  • the tumor mutation burden plot for structural mutations is illustrated as calculated at 1.61/Mbps.
  • user input requesting comparison of tumor mutational burden may be received through a user interface.
  • the information processing system may receive a request for comparison of tumor mutation burden from the user terminal, and in response to receiving the comparison request, the information processing system may receive a comparison request from the project containing the sample or all projects stored in the information processing system 230. Specimens can be identified. Subsequently, the information processing system may extract information associated with the tumor mutation burden plot for other identified samples from the database and transmit it to the user terminal. Subsequently, the user terminal may associate the information related to the tumor mutation burden plot for the sample and the information related to the tumor mutation burden plot for other samples and output the information through the user interface.
  • Information related to the tumor mutation burden plot for related samples and other samples can be displayed on one screen through the user interface.
  • statistical information related to the tumor mutation burden plot for other samples and statistical information related to the tumor mutation burden plot for the sample e.g., statistical information related to FIG. 26
  • all information related to the project can be stored in the user terminal.
  • information related to the project stored in the user terminal when a user input requesting a comparison of the tumor mutation burden is received, information related to the tumor mutation burden plot for other samples can be extracted from the saved project information. .
  • the user terminal can output information related to the tumor mutation burden plot for the sample and information related to the tumor mutation burden plot for other samples through the user interface.
  • FIG. 27 is an enlarged view of the eighth sub-area 780 of FIG. 7.
  • mutational signature information about the specimen may be output to the eighth sub-area 780.
  • Mutation signature information may include SBS mutation information and indel mutation information.
  • information 2710 to 2740 output to the fourth sub-area 780 may be output in the form of a graph.
  • first SBS variation information 2710 including the occupancy ratio for each SBS category may be output to the eighth sub-area 780.
  • the SBS category may include SBS1, SBS4, SBS5, SBS40, etc.
  • the SBS mutations discovered from the sample are SBS1, SBS4, SBS5, and SBS40, and the proportions occupied by each of SBS1, SBS4, SBS5, and SBS40 in the total SBS are calculated, and the calculated proportions are output in the form of a donut graph. It is illustrated.
  • SBS4 and SBS1 are Etc. It is illustrated as being included in the area, etc. When a pointer is moved to an area and then clicked (or touched), the ratio occupied by SBS4 and SBS1 can be output in a donut graph.
  • the reference SBS variation information is information that serves as a standard for calculating SBS cosine similarity, and may be pre-stored in the information processing system and/or user terminal or in any storage medium accessible by the information processing system and/or user terminal. You can. In Figure 27, it is illustrated that the SBS cosine similarity is 0.965.
  • mutations associated with SBS are classified according to mutation type (i.e., C>A, C>G, C>T, T>A, T>C, and T>G), and the proportion of each type is calculated.
  • the included second SBS variation information 2720 may be output to the eighth sub-area 780.
  • a bar graph showing the ratio of each SBS mutation type may be included in the second SBS mutation information 2720 and output in the eighth sub-area 780.
  • first indel mutation information 2730 including the occupancy ratio for each indel category may be output to the eighth sub-region 780.
  • the indel category may include various indels such as ID1, ID2, ID3, ID4, ID5, ID6, etc.
  • the indel mutations found in the sample are ID1, ID2, ID3, ID4, ID5, ID6, ID9, ID10, ID12, ID14, ID17, and ID18, and the proportion of each indel in all indels is calculated, and the calculated ratio This is illustrated as being output to the eighth sub-area 780 in the form of a donut graph.
  • indel mutations other than ID2 and ID7 are Etc. It is illustrated as being included in the area, etc. When the pointer is moved to an area and then clicked (or touched), the proportion of indel mutations of other types other than ID2 and ID7 can be output in a donut graph.
  • the cosine similarity between the reference indel mutation information and the indel mutation information analyzed from the sample is calculated, and the calculated indel cosine similarity may be included in the first indel mutation information 2730.
  • the reference indel mutation information is information that serves as a standard for calculating indel cosine similarity, and may be stored in advance in the information processing system and/or user terminal. In Figure 27, it is illustrated that the indel cosine similarity is 0.998.
  • mutations related to indels are classified according to mutation type (i.e., 1bp deletion, 1bp insertion, etc.), and second indel information 2740, including the proportion of each classified mutation type, is stored in the 8th sub-region 780. can be output to . As illustrated in FIG. 27 , a bar graph showing the ratio of each type of indel mutation may be output in the eighth sub-region 780.
  • FIG. 28 is a flowchart illustrating a method 2800 for providing genetic information analysis results according to an embodiment of the present disclosure.
  • the method shown in FIG. 28 is only an example to achieve the purpose of the present disclosure, and of course, some steps may be added or deleted as needed. Additionally, the method shown in FIG. 28 may be performed by at least one processor included in the information processing system and/or at least one processor included in the user terminal. For convenience of explanation, it will be described that each step shown in FIG. 28 is performed by a processor included in the user terminal shown in FIG. 3.
  • the processor may output a user interface to provide genetic information analysis results for the sample (S2810).
  • a list of genes associated with a specific disease is displayed in the first area included in the user interface, and the second area included in the user interface is used to visualize and explore information about mutations obtained by analysis of a sample.
  • the first browser for may be output.
  • a second browser for searching sequence information obtained by analysis of a specimen may be displayed in the third area included in the user interface.
  • the first browser and the second browser may operate in conjunction with each other.
  • the processor may output interactive response information including detailed information about the genetic information analysis results to at least one area included in the user interface in response to the user input received through the user interface. (S2820).
  • the processor may receive a user input for selecting a gene in which a specific mutation has occurred from a list of genes output in the first region. Subsequently, the processor may control the first browser to output the region of the gene in which the selected specific mutation occurs in response to a user input for selecting a specific mutation. Additionally, the processor may control the second browser to output the region of the gene in which the specific mutation occurred among the sequence information in response to a user input for selecting the gene in which the specific mutation occurred.
  • a graphic object indicating the location of a specific mutation may be displayed within the area displayed on the second browser.
  • the processor may output detailed information about a specific mutation among the genetic information analysis results for the sample through a second browser.
  • the processor obtains a list of transcription models associated with a gene in which a specific mutation has occurred, determines a target transcription model to be output based on the priority of each of the plurality of transcription models included in the transcription model list, and then determines the target transcription model to be output.
  • the second browser can be controlled so that amino acid sequence information including the results transcribed and translated through the target transcription model is output.
  • the processor when the processor determines that the first amino acid associated with the gene in which a specific mutation occurred is different from the second amino acid translated from the reference base sequence, the processor provides amino acid change information indicating the difference between the first amino acid and the second amino acid. You can control the second browser to output.
  • amino acid change information can be output in association with the location of a specific mutation within the sequence information.
  • the processor may control the second browser to output a list of transcription models. Subsequently, in response to receiving a user input for selecting a specific transcription model from a list of transcription models, the processor may control the second browser to output amino acid sequence information including results transcribed and translated through the specific transcription model. .
  • a specific disease is identified based on a disease code included in patient information, and the gene list may include at least one gene in which a mutation associated with the specific disease occurs among mutations found in the sample.
  • the specific disease is a disease related to cancer
  • the gene list includes a first driver list including at least one gene in which a mutation related to the cause of the disease occurs among the mutations found in the sample and a list of genes used to suppress the disease among the mutations found in the sample.
  • a second driver list containing at least one gene in which a related mutation has occurred may be included.
  • the processor visualizes the label of at least one gene included in the first driver list in the first area using a first graphic element, and displays the label of at least one gene included in the second driver list in the first region. 2 It can be visualized in the first area using graphic elements.
  • a graphic object associated with the location of a specific mutation may be displayed within the area displayed on the second browser. Additionally, in response to receiving a user input for selecting a graphic object, the processor may control the second browser to display an enlarged sequence information area associated with a specific mutation among the sequence information. In the enlarged area, letters associated with at least one of the mutated base or amino acid identifier may be displayed.
  • the processor receives a user's comment through a comment input box included in the fourth area of the user interface and then provides the received user's comment to at least one other user participating in a project related to the sample. You can.
  • the processor may acquire first information associated with a plot about the tumor mutation burden for the specimen and output the obtained first information to the fifth area of the user interface.
  • the first information may include tumor mutation burden statistics for at least one of a single base sequence mutation for the sample, an indel for the sample, or a structural mutation for the sample.
  • the processor may obtain second information associated with a plot of tumor mutation burden for other specimens, and output the first information and second information in association with each other through a user interface.
  • the processor may obtain detailed information about a specific mutation found in another sample in response to receiving a user input requesting comparison of a specific mutation among mutations found in the sample.
  • the processor can then output the correlation between detailed information about the specific mutation found in the sample and detailed information about the specific mutation found in other samples.
  • an input box where a gene name is input may be displayed in the first region.
  • the processor may add the gene of the received name to the gene list.
  • the processor may receive a user input for selecting a specific chromosome or a specific gene through the first browser.
  • the processor may control the second browser to output a region corresponding to the specific chromosome or specific gene selected from sequence information in response to a user input for selecting a specific chromosome or specific gene.
  • the processor may control the first browser to display only a region corresponding to at least one chromosome associated with the specific chromosome or specific gene.
  • labels of genes associated with multiple mutations found in a sample may be output in association with the location of each gene. For example, the label of a gene related to a mutation related to causing a disease may be visualized using a first graphic element, and the label of a gene related to a mutation related to suppressing a disease may be visualized using a second graphic element. Additionally, the label of a gene associated with a mutation not found in the sample among the list of mutations associated with the disease may be visualized using a third graphic element through the first browser.
  • each structural mutation discovered from the sample may be visualized through the first browser using a number of graphic objects corresponding to the number of structural mutations.
  • the first browser may determine at least one of the shape, color, or size of the graphic object based on the type of target structural variation to be expressed.
  • the graphical object can be visualized via the first browser with a range corresponding to the region of the target structural variation.
  • the processor may determine whether the number of graphic objects greater than a threshold is located within the threshold distance.
  • the processor in response to determining that more than a threshold number of graphic objects are located within a threshold distance and that a pointer is located on a specific graphic object included in the threshold distance, the processor sends the first browser to highlight and visualize the specific graphic object where the pointer is located. can be controlled. Additionally or alternatively, the processor may control the first browser so that, among graphic objects included within the threshold distance, graphic objects other than the specific graphic object on which the pointer is located are removed or blurred.
  • the processor controls the first browser to highlight and visualize graphic objects located within the threshold distance while rotating at preset time intervals. You can.
  • the processor determines the area including the threshold distance to be a dense area, and when it is detected that the pointer is located in the dense area, The first browser can be controlled to expand the dense area.
  • the processor may control the first browser to visualize the dense area using the fourth graphical element.
  • the processor determines whether a user input for selecting a graphic object included in a dense area is received and then, in response to determining that a user input for selecting a graphic object included in the dense area is not received for a predetermined period of time, the first browser can be controlled to reduce the enlarged dense area to its original size. If the processor detects that the pointer leaves the dense area after the dense area is enlarged, the processor may control the first browser to reduce the enlarged dense area to its original size.
  • the processor in response to receiving a user input for selecting a plurality of chromosomes through the first browser, may control the first browser to output information associated with the selected plurality of chromosomes.
  • the first browser may divide the information output area into numbers corresponding to the number of selected chromosomes and output information associated with each of the selected plurality of chromosomes on the divided screen.
  • information about at least one structural variant is output to the first browser, and the processor displays the first browser in response to receiving a user input for selecting a specific structural variant, so that the selected specific structural variant is found.
  • the first browser can be controlled so that only information related to at least one chromosome is output.
  • filter objects for each mutation type may be displayed on the user interface.
  • the processor receives a user input for selecting at least one filter object from among the output filter objects for each mutation type, and in response to receiving the user input for selecting at least one filter object, selects a filter object selected from the information about the obtained mutation.
  • the first browser can be controlled so that only information about mutations corresponding to is selected and output.
  • the above-described method may be provided as a computer program stored in a computer-readable recording medium for execution on a computer.
  • Media may be used to continuously store executable programs on a computer, or may be temporarily stored for execution or download.
  • the medium may be a variety of recording or storage means in the form of a single or several pieces of hardware combined. It is not limited to a medium directly connected to a computer system and may be distributed over a network. Examples of media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical recording media such as CD-ROMs and DVDs, magneto-optical media such as floptical disks, and There may be something configured to store program instructions, including ROM, RAM, flash memory, etc. Additionally, examples of other media include recording or storage media managed by app stores that distribute applications, sites or servers that supply or distribute various other software, etc.
  • the processing units used to perform the techniques include one or more ASICs, DSPs, digital signal processing devices (DSPDs), programmable logic devices (PLDs). ), field programmable gate arrays (FPGAs), processors, controllers, microcontrollers, microprocessors, electronic devices, and other electronic units designed to perform the functions described in this disclosure. , a computer, or a combination thereof.
  • the various illustrative logical blocks, modules, and circuits described in connection with this disclosure may be general-purpose processors, DSPs, ASICs, FPGAs or other programmable logic devices, discrete gate or transistor logic, discrete hardware components, or It may be implemented or performed as any combination of those designed to perform the functions described in.
  • a general-purpose processor may be a microprocessor, but in the alternative, the processor may be any conventional processor, controller, microcontroller, or state machine.
  • a processor may also be implemented as a combination of computing devices, such as a DSP and a microprocessor, a plurality of microprocessors, one or more microprocessors in conjunction with a DSP core, or any other configuration.
  • RAM random access memory
  • ROM read-only memory
  • NVRAM non-volatile random access memory
  • PROM on computer-readable media such as programmable read-only memory (EPROM), electrically erasable PROM (EEPROM), flash memory, compact disc (CD), magnetic or marked data storage devices, etc. It may also be implemented as stored instructions. Instructions may be executable by one or more processors and may cause the processor(s) to perform certain aspects of the functionality described in this disclosure.
  • Computer-readable media includes both computer storage media and communication media, including any medium that facilitates transfer of a computer program from one place to another.
  • Storage media may be any available media that can be accessed by a computer.
  • such computer readable media may include RAM, ROM, EEPROM, CD-ROM or other optical disk storage, magnetic disk storage or other magnetic storage devices, or the desired program code in the form of instructions or data structures. It can be used to transfer or store data and can include any other media that can be accessed by a computer. Any connection is also properly termed a computer-readable medium.
  • disk and disk include CD, laser disk, optical disk, digital versatile disc (DVD), floppy disk, and Blu-ray disk, where disks are usually magnetic. It reproduces data optically, while discs reproduce data optically using lasers. Combinations of the above should also be included within the scope of computer-readable media.
  • a software module may reside in RAM memory, flash memory, ROM memory, EPROM memory, EEPROM memory, registers, hard disk, removable disk, CD-ROM, or any other form of storage medium known.
  • An exemplary storage medium may be coupled to the processor such that the processor may read information from or write information to the storage medium. Alternatively, the storage medium may be integrated into the processor.
  • the processor and storage medium may reside within an ASIC. ASIC may exist within the user terminal. Alternatively, the processor and storage medium may exist as separate components in the user terminal.

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Biochemistry (AREA)
  • Library & Information Science (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 개시는 적어도 하나의 프로세서에 의해 수행되는 유전 정보 분석 결과 제공 방법을 제공한다. 이 방법은 검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력하는 단계 및 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 유전 정보 분석 결과의 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계를 포함할 수 있다. 사용자 인터페이스에 포함된 제1 영역에는, 특정 질병과 연관된 유전자 목록이 출력되고, 사용자 인터페이스에 포함된 제2 영역에는, 검체의 분석에 의해 획득된 변이(variant)에 관한 정보를 시각화하고(visualize) 탐색하기 위한 제1 브라우저가 출력되고, 사용자 인터페이스에 포함된 제3 영역에는, 검체의 분석에 의해 획득된 서열 정보(sequence)를 탐색하기 위한 제2 브라우저가 출력될 수 있다.

Description

유전 정보 분석 결과 제공 방법 및 시스템
본 개시는 유전 정보 분석 결과 제공 방법에 관한 것으로, 구체적으로, 복수의 브라우저를 포함하는 사용자 인터페이스를 이용하여 유전 정보 분석 결과를 사용자에게 제공하는 방법 및 시스템에 관한 것이다.
최근 들어, 인간 질병과 관련된 유전자(gene)를 밝히기 위한 연구가 활발하게 진행되고 있다. 이 중에서 인체의 유전 정보를 가지고 있는 전장유전체 (genome)을 해독해 유전자 지도(genetic map)를 작성하고 이를 분석해, 인간의 질병 발생을 미리 예상하거나 발생한 질병을 진단하는 프로젝트가 활발하게 진행되고 있다.
프로젝트는 질병을 예측 또는 진단하기 위하여, 피검사자의 염기서열과 레퍼런스 염기서열을 비교하여 변이가 발생한 피검사자의 염기서열을 식별하고, 식별된 염기서열에 기초하여 피검사자에 대한 질병 상관관계를 도출하는 업무를 수행할 수 있다.
이러한 프로젝트를 효과적으로 실현하기 위하여, 차세대 염기서열 분석(NGS, Next Generation Sequencing) 기술이 이용되고 있다. 차세대 염기서열 분석 기술은 분절화된(fragmented) DNA(deoxyribonucleic acid)를 합성을 통한 염기분석(sequencing by synthesis)을 수행하여, 대량의 염기서열을 생성한다. 예컨대, 일루미나 회사의 시퀀싱 장치를 이용하여 차세대 염기서열 분석을 수행하는 경우, DNA 조각(fragment)을 판독하여 염기를 형광 물질로 표시한 이미지 파일이 생성된다. 그 후, 이미지 파일에 포함된 형광 물질이 컴퓨터가 판독 가능한 문자들의 집합인 염기서열로 변환되고, 염기서열이 레퍼런스 염기서열에 기초하여 정렬(매핑)된다. 정렬된 염기서열과 레퍼런스 염기서열을 비교하여, 변이가 발생된 위치와 유전자가 식별된다.
변이가 발생된 위치와 유전자에 기초하여, 인간의 질병을 예측한 보고서가 생성되어 의료 전문가에게 제공되고, 의료 전문가는 보고서에 기초하여 피검사자의 질병을 조기에 예측하거나 피검사자의 질병에 대한 정확한 진단을 통해 적절한 치료 계획을 수립할 수 있다.
한편, 의료 전문가는 보다 정확한 치료 계획을 수립하기 위해서, 보고서 작성에 기초가 되는 세부 분석 결과 및/또는 관련 데이터를 확인하기도 한다. 이 경우, 의료 전문가는 데이터베이스로 접근(access)하여 환자 관련 데이터를 검색할 수 있다. 예컨대, 특정 염색체에 대한 분석 데이터 및 특정 염색체와 연관된 유전자 정보를 모두 확인하고자 하는 경우, 의료 전문가는 데이터베이스로 접근하여 각각의 데이터를 일일이 검색해야 한다. 이때, 의료 전문가는 검색어를 통한 검색을 통해서 해당 데이터를 검색할 수 있다.
이렇게 의료 전문가가 데이터베이스로 접근하여, 필요한 데이터를 획득하는 방식은, 의료 전문가의 작업 효율과 편의성을 저하시킬 수 있다.
한편, 보고서 작성에 기초가 되는 세부 분석 결과 및/또는 관련 데이터의 일부를 제공하는 애플리케이션이 제공되고 있다. 그런데 이러한 애플리케이션은 단편적이거나 획일적인 세부 데이터만을 제공할 뿐, 의료 전문가가 요구하는 다양한 정보를 제공하지 못하고 있다.
본 개시는 상기와 같은 문제점을 해결하기 위한 유전 정보 분석 결과 제공 방법, 기록매체에 저장된 컴퓨터 프로그램 및 장치(시스템)를 제공한다.
본 개시는 방법, 장치(시스템) 및/또는 컴퓨터 판독 가능 저장 매체에 저장된 컴퓨터 프로그램을 포함한 다양한 방식으로 구현될 수 있다.
본 개시의 일 실시예에 따르면, 적어도 하나의 프로세서에 의해서 수행되는 유전 정보 분석 결과 제공 방법은, 검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력하는 단계 및 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 유전 정보 분석 결과의 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계를 포함하고, 사용자 인터페이스에 포함된 제1 영역에는, 특정 질병과 연관된 유전자 목록이 출력되고, 사용자 인터페이스에 포함된 제2 영역에는, 검체의 분석에 의해 획득된 변이(variant)에 관한 정보를 시각화하고(visualize) 탐색하기 위한 제1 브라우저가 출력되고, 사용자 인터페이스에 포함된 제3 영역에는, 검체의 분석에 의해 획득된 서열 정보(sequence)를 탐색하기 위한 제2 브라우저가 출력될 수 있다.
또한, 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는, 제1 영역에 출력된 유전자 목록 중에서 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력을 수신하는 단계, 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력에 응답하여, 특정 돌연변이가 발생한 유전자의 영역이 출력되도록 제1 브라우저를 제어하는 단계 및 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력에 응답하여, 서열 정보 중에서 특정 돌연변이가 발생한 유전자의 영역이 출력되도록 제2 브라우저를 제어하는 단계를 포함할 수 있다.
또한, 제2 브라우저를 제어하는 단계는, 제2 브라우저에 출력된 영역 내에서 특정 돌연변이의 위치를 나타내는 그래픽 객체를 출력하는 단계를 포함하고, 유전 정보 분석 결과 제공 방법은, 제2 브라우저를 제어하는 단계 이후에, 그래픽 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 검체에 대한 유전 정보 분석 결과 중 특정 돌연변이에 관한 세부 정보를 제2 브라우저를 통해 출력하는 단계를 더 포함할 수 있다.
또한, 제2 브라우저를 제어하는 단계는, 특정 돌연변이가 발생한 유전자와 연관된 전사 모델(transcription model) 목록을 획득하는 단계, 전사 모델 목록에 포함된 복수의 전사 모델 각각의 우선순위에 기초하여, 출력될 타깃 전사 모델을 결정하는 단계 및 결정된 타깃 전사 모델을 통해 전사되어 번역된 결과를 포함하는 아미노산 서열 정보가 출력되도록, 제2 브라우저를 제어하는 단계를 포함할 수 있다.
또한, 제2 브라우저를 제어하는 단계는, 특정 돌연변이가 발생한 유전자와 연관된 제1 아미노산이 레퍼런스 염기서열로부터 번역된 제2 아미노산과 상이하다고 판정된 경우, 제1 아미노산과 제2 아미노산의 차이를 나타내는 아미노산 변경 정보가 출력되도록 제2 브라우저를 제어하는 단계를 포함하고, 아미노산 변경 정보는, 서열 정보 내에서 특정 돌연변이의 위치와 연관하여 출력될 수 있다.
또한, 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는, 전사 모델 목록이 출력되도록 제2 브라우저를 제어하는 단계, 전사 모델 목록에서 특정 전사 모델을 선택하는 사용자 입력을 수신하는 단계 및 특정 전사 모델을 통해 전사되어 번역된 결과를 포함하는 아미노산 서열 정보가 출력되도록, 제2 브라우저를 제어하는 단계를 포함할 수 있다.
또한, 환자 정보에 포함된 질병 코드에 기초하여, 특정 질병이 식별되고, 유전자 목록은, 검체로부터 발견된 돌연변이들 중에서, 특정 질병과 연관된 돌연변이가 발생한 적어도 하나의 유전자를 포함할 수 있다.
또한, 특정 질병은 암과 연관된 질병이고, 유전자 목록은, 검체로부터 발견된 돌연변이들 중에서 질병의 유발에 관련된 돌연변이가 발생된 적어도 하나의 유전자를 포함하는 제1 드라이버 목록 및 검체로부터 발견된 돌연변이들 중에서 질병의 억제에 관련된 돌연변이가 발생한 적어도 하나의 유전자를 포함하는 제2 드라이버 목록을 포함할 수 있다.
또한, 제1 드라이버 목록에 포함된 적어도 하나의 유전자의 레이블은 제1 그래픽 요소가 이용되어 제1 영역에서 시각화되고, 제2 드라이버 목록에 포함된 적어도 하나의 유전자 레이블은 제2 그래픽 요소가 이용되어 제1 영역에서 시각화될 수 있다.
또한, 제2 브라우저에 출력된 영역 내에 특정 돌연변이의 위치와 연관된 그래픽 객체가 출력되고, 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는, 그래픽 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 서열 정보 중에서 특정 돌연변이와 연관된 영역이 확대되어 출력되도록 제2 브라우저를 제어하는 단계를 포함할 수 있다.
또한, 확대된 서열 정보 영역에는, 변이가 발생한 염기(base) 또는 아미노산 식별자 중 적어도 하나와 연관된 문자가 디스플레이될 수 있다.
또한, 유전 정보 분석 결과 제공 방법은 사용자 인터페이스의 제4 영역에 포함된 코멘트 입력란을 통해 사용자의 코멘트를 수신하는 단계 및 검체와 연관된 프로젝트에 참여 중인 적어도 하나의 타 사용자에게 수신된 사용자의 코멘트를 제공하는 단계를 더 포함할 수 있다.
또한, 검체에 대한 종양 변이 부담에 대한 플롯(Plot)과 연관된 제1 정보가 사용자 인터페이스의 제5 영역을 통해 출력되고, 제1 정보는 검체에 대한 단일 염기서열 변이(Single Nucleotide Variation), 검체에 대한 인델(indel) 또는 검체에 대한 구조 변이(SV: Structural Variants) 중 적어도 하나에 대한 종양 변이 부담 통계를 포함할 수 있다.
또한, 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는, 타 검체에 대한 종양 변이 부담에 대한 플롯과 연관된 제2 정보를 획득하는 단계 및 제1 정보와 제2 정보를 연관시켜 출력하는 단계를 포함할 수 있다.
또한, 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는, 검체로부터 발견된 돌연변이들 중에서 특정 돌연변이에 대한 비교를 요청하는 사용자 입력을 수신하는 단계, 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 획득하는 단계 및 검체로부터 발견된 특정 돌연변이에 대한 세부 정보 및 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 연관시켜 출력하는 단계를 더 포함할 수 있다.
또한, 제1 영역에는 유전자 명칭이 입력되는 입력란이 출력되고, 유전 정보 분석 결과 제공 방법은, 입력란을 통해서 입력된 유전자 명칭을 수신하는 단계 및 수신된 명칭의 유전자를 유전자 목록에 추가하는 단계를 더 포함할 수 있다.
상술한 유전 정보 분석 결과 제공 방법을 컴퓨터에서 실행하기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램이 제공될 수 있다.
본 개시의 일 실시예에 따른 컴퓨팅 장치는, 메모리, 및 메모리와 연결되고, 메모리에 포함된 컴퓨터 판독 가능한 적어도 하나의 프로그램을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 적어도 하나의 프로그램은, 검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력하고, 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 유전 정보 분석 결과의 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하기 위한 명령어들을 포함하고, 사용자 인터페이스에 포함된 제1 영역에는, 특정 질병과 연관된 유전자 목록이 출력되고, 사용자 인터페이스에 포함된 제2 영역에는, 검체의 분석에 의해 획득된 변이(variant)에 관한 정보를 시각화하고(visualize) 탐색하기 위한 제1 브라우저가 출력되고, 사용자 인터페이스에 포함된 제3 영역에는, 검체의 분석에 의해 획득된 서열 정보(sequence)를 탐색하기 위한 제2 브라우저가 출력될 수 있다.
본 개시의 일부 실시예에 따르면, 사용자 인터페이스에 포함된 복수의 영역을 통해서 유전 정보 분석 결과에 연관된 다양한 정보가 효율적으로 제공될 수 있다.
본 개시의 일부 실시예에 따르면, 방대한 분량의 유전 정보 분석 결과를 인터랙티브하게 조회 및 탐색할 수 있는 사용자 인터페이스가 제공될 수 있다.
본 개시의 일부 실시예에 따르면, 사용자 인터페이스에는 검체에서 발견된 변이에 관한 정보를 시각화하고 탐색할 수 있는 제1 브라우저 및 검체의 분석에 의해 획득된 염기서열, 아미노산 서열, 및/또는 변이에 대한 세부 정보를 탐색할 수 있는 제2 브라우저가 포함되고, 사용자는 제1 브라우저와 제2 브라우저를 이용하여 손쉽게 전체 염기서열과 유전자 정보를 함께 탐색할 수 있다.
본 개시의 일부 실시예에 따르면, 제1 브라우저와 제2 브라우저가 서로 연동되어, 하나의 브라우저에서 출력되는 정보가 변경되면, 변경된 정보에 상응하여 다른 하나의 브라우저에서 출력되는 정보가 변경될 수 있다. 이러한 구성 하에서, 사용자는 특정 입력이나 검색에 따른 연동된 정보를 파악할 수 있기 때문에, 브라우저 사용에 있어서의 편의성이 향상될 수 있다.
본 개시의 일부 실시예에 따르면, 제1 브라우저 내에서 상이한 유형의 변이가 출력되는 경우, 상이한 그래픽 객체가 이용되어 각기 다른 유형의 변이가 제1 브라우저에 출력될 수 있다. 이에 따라, 사용자는 염기서열에서 발생된 변이의 유형을 직관적으로 식별하고 다양한 유형의 변이들의 발생 양상을 손쉽게 파악할 수 있다.
본 개시의 일부 실시예에 따르면, 제1 브라우저 내에서 변이가 밀집되어 위치된 경우, 포인터에 의해서 특정 변이가 강조되거나 변이가 밀집된 영역이 자동적으로 확대되거나, 또는 밀집 영역에 위치한 복수의 변이가 로테이션되어 강조되는 등의 그래픽 처리가 수행될 수 있다. 이에 따라, 변이가 밀집되어 있어도 각 변이가 편리하고 정확하게 사용자에 의해 식별될 수 있다.
본 개시의 일부 실시예에 따르면, 드라이버 목록 또는 유전자 목록에 포함된 특정 유전자가 선택되면, 선택된 특정 유전자와 연관된 영역, 예컨대 해당 염색체 또는 유전자가 제1 브라우저에 자동적으로 출력되고, 선택된 유전자와 연관된 영역의 서열 및/또는 기타 변이 관련 정보가 제2 브라우저에 자동적으로 출력될 수 있다. 이에 따라, 사용자는 유전자를 선택하는 것을 통해서, 제1 브라우저와 제2 브라우저에 출력되는 정보를 손쉽게 변경할 수 있다.
본 개시의 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급되지 않은 다른 효과들은 청구범위의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자('통상의 기술자'라 함)에게 명확하게 이해될 수 있을 것이다.
본 개시의 실시예들은, 이하 설명하는 첨부 도면들을 참조하여 설명될 것이며, 여기서 유사한 참조 번호는 유사한 요소들을 나타내지만, 이에 한정되지는 않는다.
도 1은 본 개시의 일 실시예들에 따른 정보 처리 시스템과 그의 서비스 제공 환경을 개략적으로 설명하기 위한 예시적인 도면이다.
도 2는 본 개시의 일 실시예에 따른 정보 처리 시스템이 복수의 사용자 단말과 통신 가능하도록 연결된 구성을 나타내는 개요도이다.
도 3은 본 개시의 일 실시예에 따른 사용자 단말 및 정보 처리 시스템의 내부 구성을 나타내는 블록도이다.
도 4는 본 개시의 일 실시예에 따른 로그인 인증에 성공한 경우에 출력되는 초기 화면을 예시하는 도면이다.
도 5는 본 개시의 일 실시예에 따른 도 4의 제5 영역에 대한 레이아웃을 예시하는 도면이다.
도 6은 본 개시의 일 실시예에 따른 제1 브라우저와 제2 브라우저를 포함하는 사용자 인터페이스를 예시하는 도면이다.
도 7은 본 개시의 일 실시예에 따른 도 6의 제2 영역에 대한 레이아웃을 예시하는 도면이다.
도 8은 도 7의 제3 서브 영역을 확대한 도면이다.
도 9는 도 7의 제1 브라우저가 출력된 제4 서브 영역을 확대한 도면이다.
도 10은 서로 다른 그래픽 객체를 통해서 시각화된 구조 변이를 포함하는 제1 정보 출력 영역에 대한 다른 예시를 나타내는 도면이다.
도 11은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 일 예시를 나타내는 도면이다.
도 12은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 다른 예시를 나타내는 도면이다.
도 13은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 또 다른 예시를 나타내는 도면이다.
도 14는 제1 브라우저에서 확대된 영역을 예시하는 도면이다.
도 15는 본 개시의 일 실시예에 따른 2개의 염색체가 출력된 제1 브라우저의 화면을 예시하는 도면이다.
도 16은 도 7의 제2 브라우저가 출력된 제5 서브 영역을 보다 자세히 도시한 도면이다.
도 17은 본 개시의 일 실시예에 따른 돌연변이에 대한 세부 정보가 출력되는 화면을 예시하는 도면이다.
도 18은 염기서열 및 아미노산 서열 중 특정 영역이 확대되어 디스플레이되도록 설정된 정보 출력 영역을 예시하는 도면이다.
도 19는 전사 모델 목록이 출력된 제2 브라우저를 예시하는 도면이다.
도 20은 본 개시의 일 실시예에 따른, 특정 염색체와 연관된 정보가 출력된 제1 브라우저의 화면을 예시하는 도면이다.
도 21은 제1 브라우저에서 선택된 염색체와 연관된 유전자와 연동하여 동작하는 제2 브라우저의 화면을 예시하는 도면이다.
도 22는 드라이버 목록에서 선택된 돌연변이 정보에 기초하여 동작되는 제1 브라우저의 화면과 제2 브라우저의 화면을 예시하는 도면이다.
도 23은 드라이버 목록에서 선택된 돌연변이 정보에 기초하여 동작하는 제1 브라우저의 화면과 제2 브라우저의 화면에 대한 다른 예시를 나타내는 도면이다.
도 24는 도 7의 제6 서브 영역을 확대한 도면이다.
도 25는 본 개시의 일 실시예에 따른 유전자 목록에서 선택된 유전자에 기초하여 동작하는 제1 브라우저의 화면과 제2 브라우저의 화면을 예시하는 도면이다.
도 26은 도 7의 제7 서브 영역을 확대한 도면이다.
도 27은 도 7의 제8 서브 영역을 확대한 도면이다.
도 28은 본 개시의 일 실시예에 따른 유전 정보 분석 결과 제공 방법을 설명하기 위한 흐름도이다.
이하, 본 개시의 실시를 위한 구체적인 내용을 첨부된 도면을 참조하여 상세히 설명한다. 다만, 이하의 설명에서는 본 개시의 요지를 불필요하게 흐릴 우려가 있는 경우, 널리 알려진 기능이나 구성에 관한 구체적 설명은 생략하기로 한다.
첨부된 도면에서, 동일하거나 대응하는 구성요소에는 동일한 참조부호가 부여되어 있다. 또한, 이하의 실시예들의 설명에 있어서, 동일하거나 대응되는 구성요소를 중복하여 기술하는 것이 생략될 수 있다. 그러나, 구성요소에 관한 기술이 생략되어도, 그러한 구성요소가 어떤 실시예에 포함되지 않는 것으로 의도되지는 않는다.
개시된 실시예의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 개시는 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 개시가 완전하도록 하고, 본 개시가 통상의 기술자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것일 뿐이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 개시된 실시예에 대해 구체적으로 설명하기로 한다. 본 명세서에서 사용되는 용어는 본 개시에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 관련 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서, 본 개시에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 개시의 전반에 걸친 내용을 토대로 정의되어야 한다.
본 명세서에서의 단수의 표현은 문맥상 명백하게 단수인 것으로 특정하지 않는 한, 복수의 표현을 포함한다. 또한, 복수의 표현은 문맥상 명백하게 복수인 것으로 특정하지 않는 한, 단수의 표현을 포함한다. 명세서 전체에서 어떤 부분이 어떤 구성요소를 포함한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.
또한, 명세서에서 사용되는 '모듈' 또는 '부'라는 용어는 소프트웨어 또는 하드웨어 구성요소를 의미하며, '모듈' 또는 '부'는 어떤 역할들을 수행한다. 그렇지만, '모듈' 또는 '부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '모듈' 또는 '부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서, '모듈' 또는 '부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 또는 변수들 중 적어도 하나를 포함할 수 있다. 구성요소들과 '모듈' 또는 '부'들은 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '모듈' 또는 '부'들로 결합되거나 추가적인 구성요소들과 '모듈' 또는 '부'들로 더 분리될 수 있다.
본 개시의 일 실시예에 따르면, '모듈' 또는 '부'는 프로세서 및 메모리로 구현될 수 있다. '프로세서'는 범용 프로세서, 중앙 처리 장치(CPU), 마이크로프로세서, 디지털 신호 프로세서(DSP), 제어기, 마이크로제어기, 상태 머신 등을 포함하도록 넓게 해석되어야 한다. 몇몇 환경에서, '프로세서'는 주문형 반도체(ASIC), 프로그램가능 로직 디바이스(PLD), 필드 프로그램가능 게이트 어레이(FPGA) 등을 지칭할 수도 있다. '프로세서'는, 예를 들어, DSP와 마이크로프로세서의 조합, 복수의 마이크로프로세서들의 조합, DSP 코어와 결합한 하나 이상의 마이크로프로세서들의 조합, 또는 임의의 다른 그러한 구성들의 조합과 같은 처리 디바이스들의 조합을 지칭할 수도 있다. 또한, '메모리'는 전자 정보를 저장 가능한 임의의 전자 컴포넌트를 포함하도록 넓게 해석되어야 한다. '메모리'는 임의 액세스 메모리(RAM), 판독-전용 메모리(ROM), 비-휘발성 임의 액세스 메모리(NVRAM), 프로그램가능 판독-전용 메모리(PROM), 소거-프로그램가능 판독 전용 메모리(EPROM), 전기적으로 소거가능 PROM(EEPROM), 플래쉬 메모리, 자기 또는 마킹 데이터 저장장치, 레지스터들 등과 같은 프로세서-판독가능 매체의 다양한 유형들을 지칭할 수도 있다. 프로세서가 메모리로부터 정보를 판독하고/하거나 메모리에 정보를 기록할 수 있다면 메모리는 프로세서와 전자 통신 상태에 있다고 불린다. 프로세서에 집적된 메모리는 프로세서와 전자 통신 상태에 있다.
본 개시에서, '시스템'은 서버 장치와 클라우드 장치 중 적어도 하나의 장치를 포함할 수 있으나, 이에 한정되는 것은 아니다. 예를 들어, 시스템은 하나 이상의 서버 장치로 구성될 수 있다. 다른 예로서, 시스템은 하나 이상의 클라우드 장치(예: 염기서열 분석 장치 등)로 구성될 수 있다. 또 다른 예로서, 시스템은 서버 장치와 클라우드 장치가 함께 구성되어 동작될 수 있다.
또한, 이하의 실시예들에서 사용되는 제1, 제2, A, B, (a), (b) 등의 용어는 어떤 구성요소를 다른 구성요소와 구별하기 위해 사용되는 것일 뿐, 그 용어에 의해 해당 구성요소의 본질이나 차례 또는 순서 등이 한정되지는 않는다.
또한, 이하의 실시예들에서, 어떤 구성요소가 다른 구성요소에 '연결', '결합' 또는 '접속'된다고 기재된 경우, 그 구성요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성요소 사이에 또 다른 구성요소가 '연결', '결합' 또는 '접속'될 수도 있다고 이해되어야 한다.
또한, 이하의 실시예들에서 사용되는 '포함한다(comprises)' 및/또는 '포함하는(comprising)'은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
본 개시의 다양한 실시예들을 설명하기에 앞서, 사용되는 용어에 대하여 설명하기로 하기로 한다.
본 개시의 실시예에서, '그래픽 요소(graphic element)'는 도형, 색상 또는 텍스트 중 적어도 하나를 포함한 그래픽 기반의 데이터일 수 있다. 예컨대, 특정 그래픽 요소는 특정 도형, 특정 색상 및/또는 특정 텍스트일 수 있다.
본 개시의 실시예들에서, '그래픽 객체(graphic object)'는 적어도 하나의 그래픽 요소가 포함되어 형성된 것으로서, 사용자가 육안으로 식별할 수 있는 그래픽 기반의 정보일 수 있다. 예컨대, 그래픽 객체는 특정 색상을 가지는 특정 형태의 도형으로 구현될 수 있다. 가령, 제1 그래픽 객체는 제1 색상과 제1 크기를 가지는 제1 형태의 도형일 수 있고, 제2 그래픽 객체는 제2 색상과 제2 크기를 가지는 제2 형태의 도형일 수 있다.
본 개시의 실시예들에서, '유전 정보 분석 결과'란 전장유전체(whole genome) 또는 전장유전체의 일부(예컨대, 특정 염색체, 특정 유전자, 타깃 패널 등)를 분석한 결과를 지칭할 수 있다. 설명의 편의를 위하여 본 개시의 실시예들에서는 전장유전체에 대한 분석 정보, 특정 염색체에 대한 분석 정보, 특정 유전자에 대한 분석 정보, 타깃 패널에 대한 분석 정보를 구분하지 않고, '유전체 분석 정보'로 지칭하였음에 유의한다.
본 개시의 실시예들에서, '제1 브라우저(browser)'는 유전체 분석 정보 중에서 변이들의 탐색을 지원하는 위한 응용 프로그램을 지칭할 수 있다. 몇몇 실시예에서, 제1 브라우저는 전장유전체 전 영역에서 발견된 변이들을 조망할 수 있는 뷰를 제공할 수 있다.
본 개시의 실시예들에서, '제2 브라우저'는 유전체 분석 결과 획득된 서열 정보를 유전자 단위의 수준에서 탐색을 지원하기 위한 응용 프로그램을 지칭할 수 있다. 여기서, 서열 정보는 전사 모델(Transcription Model)에 의해 DNA 서열의 일부 영역이 전사된 RNA(Ribonucleic acid) 서열 및/또는, 그러한 서열들에 대응되어 번역된 아미노산 서열을 포함할 수 있다.
제1 브라우저 및/또는 제2 브라우저는 자바스크립트, HTLM(Hypertext Markup Language), API(Application Programming Interface) 등과 같은 다양한 프로그래밍 도구가 이용되어 구현될 수 있다.
본 개시의 실시예들에서, '염기(base)'는 염기서열을 구성하는 단위로서 뉴클레오타이드의 구성 성분일 수 있다. 예컨대, 염기는 아데닌(adenine)을 나타내는 'A', 사이토신(cytosine)을 나타내는 'C' 및 구아닌(Guanine)을 나타내는 'G' 및 타이민(thymine)을 나타내는 'T' 중에서 어느 하나로 표현될 수 있다.
본 개시의 실시예들에서, '염기서열'은 복수의 염기가 배열되어 구성된 것일 수 있다. 염기서열은 이미 알려진 복수 개의 염색체를 포함할 수 있다.
본 개시의 실시예들에서, '변이'는 검체의 염기서열 중에서 레퍼런스 염기서열과 차이가 있는 부분으로서 식별될 수 있다. 여기서, 변이는 변종/이형(variant), 돌연변이(mutation) 등을 포함할 수 있다. 또한, 변이는 어떤 이유(예: DNA 손상, 복제 오류 등)에 의해 염기서열이 추가, 변경 및/또는 삭제되는 현상을 지칭할 수 있다.
본 개시의 실시예들에서, 'DNA 라이브러리'는 시퀀싱의 대상이 되는 유전 물질을 시퀀싱 장치가 분석하기에 적합한 형태로 처리한 것이다. DNA 라이브러리에는 하나 이상의 피검사자들의 세포(즉, 검체)로부터 획득된 무수히 많은 DNA 조각들(DNA fragments)을 포함될 수 있다.
본 개시의 실시예들에서, '마킹 코드'는 DNA 조각에 포함된 염기와 관련된 코드일 수 있다. 일 실시예에서, 마킹 코드는 이미지 데이터일 수 있다. 마킹 코드를 표기할 때, 마킹 코드의 속성이 이용될 수 있다. 몇몇 실시예에 따르면, 마킹 코드의 속성으로서, 서로 구별되는 형광 물질이 이용될 수 있다. 예컨대, 제1 마킹 코드는 아데닌(adenine)을 나타내는 제1 형광 물질로서 표기될 수 있고, 제2 마킹 코드는 사이토신(cytosine)을 나타내는 제2 형광 물질로 표기될 수 있다. 다른 예로서, 제3 마킹 코드는 구아닌(Guanine)을 나타내는 제3 형광 물질로 표기될 수 있고, 제4 마킹 코드는 타이민(thymine)을 나타내는 제4 형광 물질로 표기될 수 있다.
본 개시의 실시예들에서, '마킹 데이터'는 하나 이상의 마킹 코드를 포함하는 데이터일 수 있다. 예컨대, 마킹 데이터는 이미지 파일일 수 있다.
이하, 본 개시의 다양한 실시예들에 대하여 첨부된 도면에 따라 상세하게 설명한다.
도 1은 본 개시의 일 실시예들에 따른 정보 처리 시스템(110)과 그의 서비스 제공 환경을 개략적으로 설명하기 위한 예시적인 도면이다. 먼저, 피검사자의 DNA 시료를 포함한 DNA 라이브러리(10)가 생성될 수 있다. 예컨대, 분석 대상이 되는 피검사자(예컨대, 환자)의 세포(즉, 검체)가 채취되고, 세포가 소정의 용액과 함께 실험관에 보관된 상태에서 가열되고 원심 분리되는 등의 전처리 작업을 통해서, 피검사자의 세포로부터 획득된 무수히 많은 DNA 조각들을 포함하는 DNA 라이브러리(10)가 만들어질 수 있다.
DNA 라이브러리(10)에는 한 명의 피검사자로부터 획득된 DNA 시료만이 포함될 수도 있지만, 통상적으로 복수의 피검사자들로부터 획득된 DNA 시료들이 포함될 수 있다. 예컨대, 제1 피검사자의 세포로부터 생성된 DNA 시료와 제2 피검사자의 세포로부터 생성된 DNA 시료가 DNA 라이브러리(10)에 함께 포함될 수 있다. 즉, 둘 이상의 피검사자에 대한 시퀀싱 작업이 시퀀싱 장치(120)에 의해서 한 번에 동시에 수행될 수 있다.
DNA 라이브러리(10)가 플로우 셀(flow cell)에 장착되고, 플로우 셀이 시퀀싱 장치(120)로 투입될 수 있다. 몇몇 실시예에서는, DNA 라이브러리(10)를 시퀀싱 장치(120)로 투입시킬 수 있는 임의의 방법이 이용될 수 있다.
시퀀싱 장치(120)는 DNA 라이브러리(10)에 포함된 각 DNA 조각의 염기 유형을 식별하고, 식별된 염기 유형과 대응되는 마킹 코드를 포함하는 마킹 데이터를 생성할 수 있다. 일 실시예에 따르면, 시퀀싱 장치(120)는 매 주기마다, 각 DNA 조각에 포함된 하나의 염기를 식별하고, 식별된 염기에 대응되는 마킹 코드를 생성하고, 생성된 마킹 코드를 마킹 데이터에 추가적으로 기록함으로써 마킹 데이터를 업데이트를 할 수 있다. 시퀀싱 장치(120)는 매 주기마다, 모든 DNA 조각에 대하여 생성된 마킹 코드들을 표현하는 하나의 이미지 파일을 생성할 수 있다. 마킹 데이터는 매 주기마다 생성된 이미지 파일들의 집합일 수 있으며, 정보 처리 시스템(110)이 접근(access)할 수 있는 저장 장치에 저장될 수 있다. 일정한 주기(예컨대, 300 주기)가 경과되면, 모든 주기에서 생성된 마킹 코드들을 포함하는 마킹 데이터(20)가 생성될 수 있다. 일 실시예에 따르면, DNA 조각의 개수에 상응하는 다수의 마킹 데이터(20)가 시퀀싱 장치(120)에 의해 생성될 수 있다.
정보 처리 시스템(110)은 염기서열을 분석하고, 분석된 결과를 포함한 유전 정보 분석 결과 리포트(30)를 출력하는 시스템일 수 있다. 가령, 정보 처리 시스템(110)은 시퀀싱 장치(120)에서 마킹 데이터(20)의 생성이 완료되면, 마킹 데이터(20)에 기초하여 염기서열을 생성할 수 있다. 일 실시예에 따르면, DNA 조각의 개수에 상응하는 다수의 마킹 데이터(20)가 시퀀싱 장치(120)에 의해 생성되고, 정보 처리 시스템(110)은 DNA 조각 개수와 상응하는 개수의 리드들을 포함하는 염기서열을 생성할 수 있다. 예컨대, DNA 라이브러리(10)에 n개(여기서, n은 자연수)의 DNA 조각이 포함된 경우, 시퀀싱 장치(120)는 특정 주기에 n개의 마킹 데이터(20)를 생성할 수 있다. 이어서, 정보 처리 시스템(110)은 n개의 마킹 데이터(20)에 기초하여 n개의 리드를 포함하는 검체에 대한 염기서열을 생성할 수 있다.
지금까지는, 시퀀싱 장치(120)가 마킹 데이터(20)를 출력하고, 정보 처리 시스템(110)이 마킹 데이터(20)로부터 염기서열을 생성하는 실시예를 설명하였지만, 이와 다른 실시예에서는 시퀀싱 장치(120)가 마킹 데이터(20) 대신에 염기서열(예컨대, FASTQ 파일)을 출력할 수도 있다.
또한, 정보 처리 시스템(110)은 검체에 대한 염기서열과 레퍼런스 염기서열을 비교하여, 검체에 대한 염기서열을 정렬(align)하고, 정렬된 염기서열과 레퍼런스 염기서열 간의 차이를 비교하는 것을 통해, 검체로부터 발견되는 복수의 변이를 식별할 수 있다. 정보 처리 시스템(110)은 검체로부터 발견된 복수의 변이들에 기초하여, 유전 정보 분석 결과를 포함하는 유전 정보 분석 결과 리포트(30)를 생성할 수 있다. 예를 들어, 유전 정보 분석 결과 리포트(30)는 유전 정보 분석 결과 및 그와 연관된 임의의 정보를 포함할 수 있는데, 예를 들어, 검체로부터 발견된 돌연변이의 위치, 각 돌연변이의 유형(type), 분석 결과에 대한 통계 정보, 종양 변이 부담(Tumor Mutational Burden: TMB)과 관련된 정보, 돌연변이 시그니처(signature)와 관련된 정보 등을 포함할 수 있으나 이에 한정되지 않는다. 또한 유전 정보 분석 결과 리포트(30)는 검체를 채취한 환자의 정보, 특정 질병과 관련된 드라이버 목록, 돌연변이가 발생한 유전자에 대한 세부 정보 등을 더 포함할 수 있다.
여기서, 유전 정보 분석 결과 리포트(30)는 후술하는 바와 같이, 사용자 인터페이스를 이용하여 사용자(예컨대, 의료진)에게 제공될 수 있다. 여기서, 사용자 인터페이스는 염기서열의 분석 결과를 편리하게 제공하기 위한 수단으로서, 사용자 입력에 기초하여 유전 정보 분석 결과에 대한 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자에게 제공할 수 있다. 예를 들어, 사용자가 특정 돌연변이를 선택하면, 돌연변이와 관련된 염색체와 유전자 정보가 사용자 인터페이스를 통해 출력될 수 있다.
정보 처리 시스템(110)에 포함되거나 또는 연결된 디스플레이 수단에 사용자 인터페이스가 출력되고, 사용자 인터페이스를 통해서 유전체 분석과 관련된 정보가 출력될 수 있다. 다른 예로서, 정보 처리 시스템(110)은 네트워크를 통하여 사용자 단말로 유전체 분석과 관련된 정보를 전송하고, 사용자 단말은 사용자 인터페이스를 통해서 수신된 유전체 분석과 관련된 정보를 출력할 수 있다.
도 2는 본 개시의 일 실시예에 따른 정보 처리 시스템(230)이 복수의 사용자 단말(210_1, 210_2, 210_3)과 통신 가능하도록 연결된 구성을 나타내는 개요도이다. 도시된 바와 같이, 복수의 사용자 단말(210_1, 210_2, 210_3)은 네트워크(220)를 통해 검체에 대한 유전 정보 분석 결과를 제공할 수 있는 정보 처리 시스템(230)과 연결될 수 있다. 예를 들어, 도 1의 정보 처리 시스템(110)은 도 2의 정보 처리 시스템(230)과 동일한 시스템일 수 있다.
일 실시예에서, 정보 처리 시스템(230)은 유전 정보 분석 서비스 등을 실행 가능한 프로그램(예를 들어, 다운로드 가능한 애플리케이션) 및 데이터를 저장, 제공 및 실행할 수 있는 하나 이상의 서버 장치 및/또는 데이터베이스, 또는 클라우드 컴퓨팅 서비스 기반의 하나 이상의 분산 컴퓨팅 장치 및/또는 분산 데이터베이스를 포함할 수 있다. 일 실시예에서, 정보 처리 시스템(230)에 의해 제공되는 유전 정보 분석 서비스는 복수의 사용자 단말(210_1, 210_2, 210_3) 각각에 설치된 유전 정보 분석 서비스 관련 애플리케이션 등을 통해 사용자에게 제공될 수 있다. 예컨대, 정보 처리 시스템(230)은 유전 정보 분석 결과 리포트의 일부 또는 전부를 사용자 단말(210_1, 210_2, 210_3)로 전송하고, 사용자 단말(210_1, 210_2, 210_3)은 사용자 인터페이스를 통하여 유전 정보 분석 결과 리포트에 포함된 데이터를 출력할 수 있다.
복수의 사용자 단말(210_1, 210_2, 210_3)은 네트워크(220)를 통해 정보 처리 시스템(230)과 통신할 수 있는 컴퓨팅 장치일 수 있다. 네트워크(220)는 복수의 사용자 단말(210_1, 210_2, 210_3)과 정보 처리 시스템(230) 사이의 통신이 가능하도록 구성될 수 있다. 네트워크(220)는 설치 환경에 따라, 예를 들어, 이더넷(Ethernet), 유선 홈 네트워크(Power Line Communication), 전화선 통신 장치 및 RS-serial 통신 등의 유선 네트워크, 이동통신망, WLAN(Wireless LAN), Wi-Fi, Bluetooth 및 ZigBee 등과 같은 무선 네트워크 또는 그 조합으로 구성될 수 있다. 통신 방식은 제한되지 않으며, 네트워크(220)가 포함할 수 있는 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망, 위성망 등)을 활용하는 통신 방식만 아니라 사용자 단말(210_1, 210_2, 210_3) 사이의 근거리 무선 통신 역시 포함될 수 있다.
복수의 사용자 단말(210_1, 210_2, 210_3)은 유전 정보 분석 서비스와 관련 애플리케이션을 이용하여 유전 정보 분석 결과 리포트에 포함된 데이터의 일부 또는 전부를 정보 처리 시스템(230)으로부터 수신할 수 있다. 다른 예로서, 사용자 단말(210_1, 210_2, 210_3)은 웹 브라우저를 이용하여 유전 정보 분석 결과 리포트에 포함된 데이터의 일부 또는 전부를 정보 처리 시스템(230)으로부터 수신할 수 있다. 사용자 단말(210_1, 210_2, 210_3)은 후술하는 사용자 인터페이스를 이용하여, 유전 정보 분석 결과 리포트에 포함된 일부 정보(예컨대, 유전 정보 분석 결과에 대한 세부 정보)를 출력할 수 있다. 사용자 단말(210_1, 210_2, 210_3)은 사용자 인터페이스에서 특정 메뉴 또는 특정 그래픽 객체가 선택되는 사용자 입력이 수신되면, 사용자 입력에 상응한 반응형(interactive) 응답 정보를 출력할 수 있다. 여기서, 반응형 응답 정보는 유전 정보 분석 결과에 대한 세부 정보를 포함할 수 있다.
일 실시예에 따르면, 사용자 단말(210_1, 210_2, 210_3)은 사용자 인터페이스를 통해서 사용자 입력이 수신되면, 이 사용자 입력과 연관된 데이터 요청을 정보 처리 시스템(230)으로 전송할 수 있다. 그 후, 사용자 단말(210_1, 210_2, 210_3)은 정보 처리 시스템(230)으로부터 사용자 입력과 연관된 데이터(예컨대, 유전 정보 분석 결과에 대한 세부 정보)를 수신하여 사용자 인터페이스를 통해 출력할 수 있다.
도 2에서 휴대폰 단말(210_1), 태블릿 단말(210_2) 및 PC 단말 (210_3)이 사용자 단말의 예로서 도시되었으나, 이에 한정되지 않으며, 사용자 단말(210_1, 210_2, 210_3)은 유선 및/또는 무선 통신이 가능하고 애플리케이션 또는 웹 브라우저 등이 설치되어 실행될 수 있는 임의의 컴퓨팅 장치일 수 있다. 예를 들어, 사용자 단말은, 스마트폰, 휴대폰, 내비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC 등을 포함할 수 있다. 또한, 도 2에는 3개의 사용자 단말(210_1, 210_2, 210_3)이 네트워크(220)를 통해 정보 처리 시스템(230)과 통신하는 것으로 도시되어 있으나, 이에 한정되지 않으며, 상이한 수의 사용자 단말이 네트워크(220)를 통해 정보 처리 시스템(230)과 통신하도록 구성될 수도 있다. 도 2에서는 사용자 단말과 정보 처리 시스템이 별도의 장치로서 통신하도록 도시되어 있으나, 이는 일 실시예에 불과하며, 사용자 단말에서 제공하는 유전 정보 분석 관련 구성 및/또는 기능과 정보 처리 시스템을 제공하는 유전 정보 분석 관련 구성 및/또는 기능이 하나의 컴퓨팅 장치에 구현될 수 있다.
도 3은 본 개시의 일 실시예에 따른 사용자 단말(210) 및 정보 처리 시스템(230)의 내부 구성을 나타내는 블록도이다. 사용자 단말(210)은 유전 정보 분석 서비스와 연관된 애플리케이션, 유전 정보 분석 서비스를 제공하는 웹 브라우저 등을 실행 가능하고, 유/무선 통신이 가능한 임의의 컴퓨팅 장치를 지칭할 수 있으며, 예를 들어, 도 2의 휴대폰 단말(210_1), 태블릿 단말(210_2), PC 단말(210_3) 등을 포함할 수 있다.
도시된 바와 같이, 사용자 단말(210)은 메모리(312), 프로세서(314), 통신 모듈(316) 및 입출력 인터페이스(318)를 포함할 수 있다. 이와 유사하게, 정보 처리 시스템(230)은 메모리(332), 프로세서(334), 통신 모듈(336) 및 입출력 인터페이스(338)를 포함할 수 있다. 도 3에 도시된 바와 같이, 사용자 단말(210) 및 정보 처리 시스템(230)은 각각의 통신 모듈(316, 336)을 이용하여 네트워크(220)를 통해 정보 및/또는 데이터를 통신할 수 있도록 구성될 수 있다. 또한, 입출력 장치(320)는 입출력 인터페이스(318)를 통해 사용자 단말(210)에 정보 및/또는 데이터를 입력하거나 사용자 단말(210)로부터 생성된 정보 및/또는 데이터를 출력하도록 구성될 수 있다.
메모리(312, 332)는 비-일시적인 임의의 컴퓨터 판독 가능한 기록매체를 포함할 수 있다. 일 실시예에 따르면, 메모리(312, 332)는 ROM(read only memory), 디스크 드라이브, SSD(solid state drive), 플래시 메모리(flash memory) 등과 같은 비소멸성 대용량 저장 장치(permanent mass storage device)를 포함할 수 있다. 다른 예로서, ROM, SSD, 플래시 메모리, 디스크 드라이브 등과 같은 비소멸성 대용량 저장 장치는 메모리와는 구분되는 별도의 영구 저장 장치로서 사용자 단말(210) 또는 정보 처리 시스템(230)에 포함될 수 있다. 또한, 메모리(312, 332)에는 운영체제와 적어도 하나의 프로그램 코드(예를 들어, 사용자 단말(210)에 설치되어 구동되는 유전 정보 분석 서비스와 연관된 애플리케이션 또는 유전 정보 분석 서비스를 제공하는 웹 브라우저 등을 위한 코드 등)가 저장될 수 있다.
이러한 소프트웨어 구성요소들은 메모리(312, 332)와는 별도의 컴퓨터에서 판독가능한 기록매체로부터 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독가능한 기록매체는 이러한 사용자 단말(210) 및 정보 처리 시스템(230)에 직접 연결가능한 기록 매체를 포함할 수 있는데, 예를 들어, 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록매체를 포함할 수 있다. 다른 예로서, 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록매체가 아닌 통신 모듈을 통해 메모리(312, 332)에 로딩될 수도 있다. 예를 들어, 적어도 하나의 프로그램은 개발자들 또는 애플리케이션의 설치 파일을 배포하는 파일 배포 시스템이 네트워크(220)를 통해 제공하는 파일들에 의해 설치되는 컴퓨터 프로그램에 기반하여 메모리(312, 332)에 로딩될 수 있다.
프로세서(314, 334)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(312, 332) 또는 통신 모듈(316, 336)에 의해 프로세서(314, 334)로 제공될 수 있다. 예를 들어, 프로세서(314, 334)는 메모리(312, 332)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.
통신 모듈(316, 336)은 네트워크(220)를 통해 사용자 단말(210)과 정보 처리 시스템(230)이 서로 통신하기 위한 구성 또는 기능을 제공할 수 있으며, 사용자 단말(210) 및/또는 정보 처리 시스템(230)이 다른 사용자 단말 또는 다른 시스템(일례로 별도의 클라우드 시스템 등)과 통신하기 위한 구성 또는 기능을 제공할 수 있다. 일례로, 사용자 단말(210)의 프로세서(314)가 메모리(312) 등과 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청(예컨대, 유전 정보 분석 결과에 대한 세부 정보에 대한 요청 등) 또는 데이터는 통신 모듈(316)의 제어에 따라 네트워크(220)를 통해 정보 처리 시스템(230)으로 전달될 수 있다. 역으로, 정보 처리 시스템(230)의 프로세서(334)의 제어에 따라 제공되는 제어 신호, 명령 또는 데이터(예컨대, 유전 정보 분석 결과와 관련된 세부 정보 등) 중 적어도 하나가 통신 모듈(336)과 네트워크(220)를 거쳐 사용자 단말(210)의 통신 모듈(316)을 통해 사용자 단말(210)에 수신될 수 있다.
입출력 인터페이스(318)는 입출력 장치(320)와의 인터페이스를 위한 수단일 수 있다. 일 예로서, 입력 장치는 오디오 센서 및/또는 이미지 센서를 포함한 카메라, 키보드, 마이크로폰, 마우스 등의 장치를, 그리고 출력 장치는 디스플레이, 스피커, 햅틱 피드백 디바이스(haptic feedback device) 등과 같은 장치를 포함할 수 있다. 다른 예로, 입출력 인터페이스(318)는 터치스크린 등과 같이 입력과 출력을 수행하기 위한 구성 또는 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 사용자 단말(210)의 프로세서(314)가 메모리(312)에 로딩된 컴퓨터 프로그램의 명령을 처리함에 있어서 정보 처리 시스템(230)이나 다른 사용자 단말이 제공하는 정보 및/또는 데이터를 이용하여 구성되는 서비스 화면 등이 입출력 인터페이스(318)를 통해 디스플레이에 표시될 수 있다. 도 3에서는 입출력 장치(320)가 사용자 단말(210)에 포함되지 않도록 도시되어 있으나, 이에 한정되지 않으며, 사용자 단말(210)과 하나의 장치로 구성될 수 있다. 또한, 정보 처리 시스템(230)의 입출력 인터페이스(338)는 정보 처리 시스템(230)과 연결되거나 정보 처리 시스템(230)이 포함할 수 있는 입력 또는 출력을 위한 장치(미도시)와의 인터페이스를 위한 수단일 수 있다. 도 3에서는 입출력 인터페이스(318, 338)가 프로세서(314, 334)와 별도로 구성된 요소로서 도시되었으나, 이에 한정되지 않으며, 입출력 인터페이스(318, 338)가 프로세서(314, 334)에 포함되도록 구성될 수 있다.
사용자 단말(210) 및 정보 처리 시스템(230)은 도 3의 구성요소들보다 더 많은 구성요소들을 포함할 수 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 일 실시예에 따르면, 사용자 단말(210)은 상술된 입출력 장치(320) 중 적어도 일부를 포함하도록 구현될 수 있다. 또한, 사용자 단말(210)은 트랜시버(transceiver), GPS(Global Positioning system) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수 있다. 예를 들어, 사용자 단말(210)이 스마트폰인 경우, 일반적으로 스마트폰이 포함하고 있는 구성요소를 포함할 수 있으며, 예를 들어, 가속도 센서, 자이로 센서, 이미지 센서, 근접 센서, 터치 센서, 조도 센서, 카메라 모듈, 각종 물리적인 버튼, 터치패널을 이용한 버튼, 입출력 포트, 진동을 위한 진동기 등의 다양한 구성요소들이 사용자 단말(210)에 더 포함되도록 구현될 수 있다.
유전 정보 분석 서비스를 제공하는 애플리케이션, 웹 브라우저 등을 위한 프로그램이 동작되는 동안에, 프로세서(314)는 입출력 인터페이스(318)와 연결된 터치 스크린, 키보드, 오디오 센서 및/또는 이미지 센서를 포함한 카메라, 마이크로폰 등의 입력 장치를 통해 입력되거나 선택된 텍스트, 이미지, 영상, 음성 및/또는 동작 등을 수신할 수 있으며, 수신된 텍스트, 이미지, 영상, 음성 및/또는 동작 등을 메모리(312)에 저장하거나 통신 모듈(316) 및 네트워크(220)를 통해 정보 처리 시스템(230)에 제공할 수 있다.
사용자 단말(210)의 프로세서(314)는 입출력 장치(320), 다른 사용자 단말, 정보 처리 시스템(230) 및/또는 복수의 외부 시스템으로부터 수신된 정보 및/또는 데이터를 관리, 처리 및/또는 저장하도록 구성될 수 있다. 프로세서(314)에 의해 처리된 정보 및/또는 데이터는 통신 모듈(316) 및 네트워크(220)를 통해 정보 처리 시스템(230)에 제공될 수 있다. 사용자 단말(210)의 프로세서(314)는 입출력 인터페이스(318)를 통해 입출력 장치(320)로 정보 및/또는 데이터를 전송하여, 출력할 수 있다. 예를 들면, 프로세서(314)는 수신된 정보 및/또는 데이터를 출력함으로써, 수신된 정보 및/또는 데이터가 사용자 단말(210)의 화면에 표시되도록 사용자 단말(210)에 포함되거나 연결된 디스플레이 장치를 제어할 수 있다.
정보 처리 시스템(230)의 프로세서(334)는 복수의 사용자 단말(210) 및/또는 복수의 외부 시스템으로부터 수신된 정보 및/또는 데이터를 관리, 처리 및/또는 저장하도록 구성될 수 있다. 프로세서(334)에 의해 처리된 정보 및/또는 데이터는 통신 모듈(336) 및 네트워크(220)를 통해 사용자 단말(210)에 제공할 수 있다.
도면에 도시되지 않았으나, 정보 처리 시스템(230)은 유전체 분석 정보를 포함하는 유전 정보 분석 결과 리포트를 저장하기 위한 적어도 하나의 데이터베이스를 포함할 수 있다. 일 실시예에 따르면, 정보 처리 시스템(230)은 검체별 유전 정보 분석 결과 리포트를 저장할 수 있으며, 각 프로젝트에 포함된 적어도 하나의 검체의 식별정보를 저장할 수 있다. 이에 따라, 하나에 프로젝트에는 적어도 하나의 검체에 대한 유전 정보 분석 결과 리포트가 포함될 수 있다. 여기서, 유전 정보 분석 결과 리포트는 각 돌연변이 위치, 각 돌연변이의 유형(type), 검체를 채취한 환자 정보, 분석 결과에 대한 통계 정보, 분석 결과에 대한 코멘트 정보, 특정 질병과 관련된 드라이버 목록, 돌연변이가 발생한 유전자에 대한 정보, 종양 변이 부담(Tumor Mutational Burden: TMB)과 관련된 정보, 돌연변이 시그니처(signature)와 관련된 정보 등을 포함할 수 있다. 유전 정보 분석 결과 리포트에 포함된 세부 정보가 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력될 수 있다.
또한, 데이터베이스는 사용자의 아이디와 비밀번호, 성명, 생년월일, 모바일 전화번호, 이메일 주소 등을 포함하는 사용자 정보를 저장할 수 있다. 또한, 데이터베이스는 각 프로젝트에 참여중인 복수의 사용자의 정보(즉, 멤버 정보)를 저장할 수 있다. 일 실시예에 따르면, 데이터베이스는 각각의 질병과 연관된 주요 돌연변이 목록을 저장할 수 있다. 예컨대, 제1 질병과 연관된 제1 주요 돌연변이 목록이 데이터베이스에 저장될 수 있고, 제2 질병과 연관된 제2 주요 돌연변이 목록이 데이터베이스에 저장될 수 있다. 여기서 주요 돌연변이 목록은 연관된 질병에서 중요하다고 해당 분야에 알려진 돌연변이를 포함할 수 있다. 또한, 데이터베이스는 하나 이상의 질병의 각각과 연관된 유전자 목록을 저장할 수 있다. 여기서, 유전자 목록은 질병에서 중요하다고 알려진 돌연변이가 발생한 유전자에 대한 레이블을 포함할 수 있다.
도 4는 본 개시의 일 실시예에 따른, 로그인 인증에 성공한 경우에 출력되는 초기 화면(400)을 예시하는 도면이다. 도 4에 예시된 바와 같이, 사용자 단말이 정보 처리 시스템에 접속하여 로그인에 성공하면, 도 4와 같은 초기 화면(400)이 사용자 단말에 출력될 수 있다.
초기 화면(400)은 복수의 영역이 구획된 레이아웃으로 구성될 수 있다. 일 실시예에 따르면, 초기 화면(400)에는 메뉴 버튼이 포함된 제1 영역(410), 프로젝트 선택 메뉴를 포함하는 제2 영역(420), 현재 메뉴의 위치를 나타내는 제3 영역(430), 로그인한 사용자 정보를 나타내는 제4 영역(440) 및 프로젝트에 포함된 각 검체의 분석 결과에 대한 통계 정보 및 검체별 간략 정보가 출력되는 제5 영역(450)으로 구성될 수 있다.
제1 영역(410)에 포함된 메뉴가 선택되면, 통계 정보를 확인할 수 있는 제1 서브 메뉴 및 분석 결과에 대한 정보를 확인할 수 있는 제2 서브 메뉴가 출력될 수 있다. 또한, 제1 영역(410)에 포함된 메뉴가 선택되면, 제1 서브 메뉴 및 제2 서브 메뉴 이외에 다양한 서브 메뉴가 함께 출력될 수 있다. 서브 메뉴를 선택하는 것을 통해, 사용자는 관련 정보를 획득할 수 있다.
제2 영역(420)에는 로그인에 성공한 사용자가 참여중인 프로젝트 목록을 출력하는데 이용되는 프로젝트 선택 메뉴가 포함될 수 있다. 프로젝트 선택 메뉴가 선택되면, 사용자에게 할당된 프로젝트 목록이 사용자 단말에 출력될 수 있다.
제3 영역(430)에는 현재 사용중인 메뉴에 대한 정보가 출력될 수 있다. 도 4에서는 차세대 염기서열 분석에 대한 통계(NGS Statistics)와 관련된 메뉴가 이용 중임이 예시되어 있다.
제4 영역(440)에는 사용자의 로그인 아이디를 포함하는 사용자 정보가 출력될 수 있다.
제5 영역(450)에는 프로젝트에 포함된 각 검체에 대한 간략 정보와 통계 정보가 출력될 수 있다. 제5 영역(450)에 출력되는 통계 정보에 대한 설명은 도 5를 참조하여 자세하게 설명하기로 한다.
사용자는 제2 영역(420)에 포함된 프로젝트 선택 메뉴를 이용하여, 다른 프로젝트를 선택할 수 있다. 프로젝트 선택 메뉴를 통해서, 초기 화면(400)에 출력된 제1 프로젝트와 상이한 제2 프로젝트가 선택되면, 제2 프로젝트에 포함된 각 검체별 분석 결과에 대한 통계 정보와 간략 정보가 제5 영역(450)에 출력될 수 있다.
도 5는 본 개시의 일 실시예에 따른, 도 4의 제5 영역(450)에 대한 레이아웃을 예시하는 도면이다. 도 5를 참조하면, 초기 화면(400)에 포함된 제5 영역(450)은 복수의 서브 영역(510 내지 560)을 포함하는 레이아웃으로 구성될 수 있다.
제1 서브 영역(510)에는 각 검체에 대한 분석 결과에 대한 간략 정보가 출력될 수 있다. 예컨대, 분석 결과에 대한 간략 정보는 검체에 대한 샘플 ID, 분석 결과에 대한 품질 정도, 종양 식별정보, 분석 완료된 날짜 등을 포함할 수 있다. 예컨대, 분석 결과에 대한 품질 정도가 좋은 상태는 'Pass'로 표기되고, 분석 결과에 대한 품질 정도가 좋지 않으면 품질 정도에 따라 'Fail' 또는 ' Warning'이 표기될 수 있다.
제2 서브 영역(520)에는 종양 변이 부담(Tumor Mutational Burden)에 통계 정보가 출력될 수 있다. 도 5에 예시된 바와 같이, 단일 염기서열 변이(single nucleotide variation), 인델(indel: Insertion & Deletion), 구조 변이(SV: Structural Variants) 각각에 대한 종양 변이 부담의 통계 정보가 출력될 수 있다. 여기서, 통계 정보는 프로젝트에 포함된 모든 검체를 기초로 산출될 수 있다. 도 5에 예시된 바와 같이, 종양 변이 부담에 해당하는 영역이 일정 개수로 분할되고, 각 영역별로 종양 변이 부담의 발견 횟수가 그래프 형태로 제2 서브 영역(520)에 출력될 수 있다.
제3 서브 영역(530)에는 프로젝트에 대한 시퀀싱 품질에 대한 통계 정보가 출력될 수 있다. 예컨대, 프로젝트에 포함된 각 검체의 시퀀싱 품질에 대한 통계가 산출되고, 산출된 통계가 그래픽 형태로 제3 서브 영역(530)에 출력될 수 있다.
제4 서브 영역(540)에는 특정 질병(예컨대, 암)과 관련된 드라이버 유전자에 대한 돌연변이들의 통계 정보가 출력될 수 있다. 제4 서브 영역(540)에서 출력되는 통계 정보는 프로젝트에 포함된 각 검체로부터 발견된 돌연변이들에 대한 분석 결과를 기초로 생성될 수 있다. 제4 서브 영역(540)의 상부에는 종양 유발 유전자(oncogene)와 관련된 각 돌연변이의 발견 횟수가 막대 그래프 형태로 출력되고, 제4 서브 영역(540)의 하부에는 종양 억제 유전자(Tumor Suppressor Gene)와 연관된 각 돌연변이의 발견 횟수가 막대 그래프로서 출력되는 것으로 예시되어 있다.
제5 서브 영역(550)에는 정상세포 대비 종양세포의 비율이 그래픽 형태로 출력될 수 있다. 여기서, 미리 결정된 구간별로 정상세포 대비 종양세포의 비율이 산출되고, 이렇게 산출된 각 비율을 해당 구간에서 그래프 형태로서 출력될 수 있다.
제6 서브 영역(560)은 배수성(ploidy) 정도가 그래프 형태로 출력될 수 있다. 일 실시예에 따르면, 미리 결정된 구간별로 프로젝트에 포함된 각 검체의 배수성 정도가 산출되고, 이렇게 산출된 각 배수성 정도가 해당 구간에서 그래프 형태로서 출력될 수 있다.
한편, 도 5의 제1 서브 영역(510)에 포함된 각 검체 중에서 어느 하나가 선택되면, 선택된 검체에 대한 분석 결과를 상세하게 확인할 수 있는 제1 브라우저와 제2 브라우저를 포함하는 사용자 인터페이스가 출력될 수 있다.
도 6은 본 개시의 일 실시예에 따른, 제1 브라우저와 제2 브라우저를 포함하는 사용자 인터페이스(600)를 예시하는 도면이다. 도 6에 예시된 바와 같이, 사용자 인터페이스(600)는 복수의 영역(610, 620, 630)이 구획된 레이아웃으로 구성될 수 있다.
사용자 인터페이스(600)에 포함된 제1 영역(610)에는 프로젝트 및 검체를 선택할 수 있는 메뉴가 출력될 수 있다. 해당 메뉴가 선택되면, 프로젝트 목록 및 검체 목록이 사용자 인터페이스(600)를 통해 출력될 수 있다.
사용자 인터페이스(600)에 포함된 제2 영역(620)에는 검체 분석 결과에 대한 세부 정보가 출력될 수 있다. 제2 영역(620)은 복수의 브라우저와 복수의 서브 영역을 포함할 수 있다. 제2 영역(620)의 레이아웃에 대한 설명은 도 7을 참조하여 후술하기로 한다.
사용자 인터페이스(600)에 포함된 제3 영역(630)에는 프로젝트에 참여한 다른 사용자와 코멘트를 주고받을 수 있는 코멘트 입력란을 포함할 수 있다. 정보 처리 시스템에서는 각 프로젝트에 참여한 사용자들의 이메일 주소, 연락처 또는 단말 IP 주소 중에서 적어도 하나가 저장될 수 있다. 특정 사용자가 제3 영역(630)의 코멘트 입력란에 코멘트를 입력하면, 프로젝트에 참여한 타 사용자에게 코멘트가 제공될 수 있다. 예컨대, 사용자가 코멘트 입력란에 코멘트를 입력하면, 정보 처리 시스템은 사용자가 입력한 코멘트를 획득하고, 사용자 인터페이스를 통해서 출력중인 검체와 연관된 프로젝트를 식별한 후, 식별된 프로젝트에 참여중인 적어도 하나의 타 사용자에게 사용자의 코멘트를 제공할 수 있다. 이때, 정보 처리 시스템은 타 사용자의 이메일 또는 타 사용자가 보유한 사용자 단말로 코멘트를 전송할 수 있다.
도 7은 본 개시의 일 실시예에 따른, 도 6의 제2 영역(620)에 대한 레이아웃을 예시하는 도면이다. 도 7에 예시된 바와 같이, 검체에 대한 분석 결과가 출력되는 제2 영역(620)은 복수의 서브 영역(710 내지 780)을 포함하는 레이아웃으로 구성될 수 있다.
제1 서브 영역(710)에는 환자의 정보와 시퀀싱 결과에 대한 통계 정보가 출력될 수 있다. 도 7에 예시된 바와 같이, 질병 관련 코드 및 질병 식별정보(예컨대, 암 식별정보)를 포함하는 환자 정보 및 검체에 대한 시퀀싱 결과에 대한 통계 정보가 제1 서브 영역(710)에 출력될 수 있다.
제2 서브 영역(720)에는 검체 해석 정보가 출력될 수 있다. 검색 해석 정보는 전문 분석가에 의해 기록된 코멘트일 수 있다. 즉, 전문 분석가가 검체에 대한 시퀀싱 결과를 해석하고, 시퀀싱 결과에 대한 코멘트를 사전에 입력하여 정보 처리 시스템에 저장할 수 있고, 이렇게 시퀀싱 결과에 대한 코멘트가 저장된 경우, 제2 서브 영역(720)에 전문 분석가에 의해 작성된 코멘트가 출력될 수 있다.
제3 서브 영역(730)에는 특정 질병(예컨대, 암)과 관련되며 검체로부터 발견된 돌연변이와 연관된 유전자 목록을 포함하는 드라이버 목록이 출력될 수 있다. 여기서, 드라이버 목록은 특정 질병과 연관되며 검체로부터 발견된 돌연변이가 발생한 유전자 목록 및 돌연변이에 대한 정보를 포함할 수 있다. 도 7에서는 드라이버 목록이 암과 연관된 질병인 것으로 예시되어 있다. 드라이버 목록은 암 유발 드라이버(Oncogene driver) 목록 및 암 억제 드라이버(Tumor suppressor driver) 목록을 포함할 수 있다. 검체로부터 발견된 돌연변이들 중에서 암을 유발하는 돌연변이가 발생한 유전자 레이블이 암 유발 드라이버 목록에 포함되어 제3 서브 영역(730)에 출력될 수 있다. 또한, 검체로부터 발견된 돌연변이들 중에서 암을 억제하는 기능을 제한하거나 소실시키는 돌연변이가 발생한 유전자 레이블이 암 억제 드라이버 목록에 포함되어 제3 서브 영역(730)에 출력될 수 있다.
제4 서브 영역(740)에는 검체로부터 발견된 변이들을 염기서열 전 영역에서 탐색할 수 있는 제1 브라우저가 출력될 수 있다. 몇몇 실시예에서, 제1 브라우저는 전장유전체 전 영역에서 발견된 변이들을 조망할 수 있는 뷰를 제공할 수 있다. 사용자는 제1 브라우저를 이용하여 전체 염기서열 내의 특정 영역을 확대 또는 줌인할 수 있고, 유전체 중에서 적어도 하나의 염색체에 해당하는 영역만을 선택할 수 있다. 또한, 사용자는 제1 브라우저를 이용하여 검체로부터 발견된 변이들에 대한 다양한 탐색 작업을 수행할 수 있다. 제1 브라우저 또는 사용자 인터페이스(600)의 다른 영역을 통해서 사용자 입력이 수신되면, 이 사용자 입력에 응답하여 유전체 분석 정보에 기초한 반응형 응답 정보가 제4 서브 영역(740)에 출력될 수 있다. 반응형 응답 정보는 검체의 유전 정보 분석 결과에 대한 다양한 세부 정보를 포함할 수 있다. 제1 브라우저에서 제공하는 다양한 기능에 대해서는, 도 9 내지 도 15를 참조하여 자세하게 후술하기로 한다.
제5 서브 영역(750)에는 검체의 분석에 의해 획득된 서열 정보(sequence) 및 기타 변이에 관한 세부 정보를 탐색하는데 이용되는 제2 브라우저가 출력될 수 있다. 몇몇 실시예에서, 제2 브라우저는 유전체 분석 결과로서 획득된 서열 정보를 유전자 단위의 수준에서 탐색 가능하게 할 수 있다. 사용자는 제2 브라우저를 이용하여 아미노산 정보 영역을 확대할 수 있고, 레퍼런스 아미노산과 변이가 발생한 아미노산 간의 차이점을 확인할 수 있다. 또한, 사용자는 제2 브라우저를 이용하여 유전자 정보와 관련된 다양한 탐색 작업을 수행할 수 있다.
제2 브라우저 또는 사용자 인터페이스(600)의 다른 영역을 통해서 사용자 입력이 수신되면, 이 사용자 입력에 응답하여 유전체 분석 정보에 기초한 반응형 응답 정보가 제5 서브 영역(750)에 출력될 수 있다. 반응형 응답 정보는 돌연변이에 대한 유전자 정보를 포함할 수 있다. 여기서, 유전자 정보는 돌연변이가 발생한 유전자와 연관된 엑손(exon), 염기서열로부터 전사 및 번역된 아미노산(amino acid) 서열, 염기서열로부터 번역되지 않은 비번역 영역(Untranslated Region), 도메인 정보 등을 포함할 수 있다. 제2 브라우저에서 제공하는 다양한 기능에 대해서는, 도 16 내지 도 19를 참조하여 자세하게 후술하기로 한다.
제6 서브 영역(760)에는 특정 질병과 연관된 유전자 목록이 출력될 수 있다. 여기서, 유전자 목록은 특정 질병과 연관된 주요 돌연변이가 발생하는 적어도 하나의 유전자 레이블을 포함할 수 있다. 일 실시예에 따르면, 특정 질병과 연관된 유전자 목록이 정보 처리 시스템에 미리 저장될 수 있고, 정보 처리 시스템은 검체에 대한 유전체 분석 정보에 유전자 목록을 포함시킬 수 있다. 일 실시예에 따르면, 환자 정보에 포함된 질병 코드에 기초하여, 특정 질병이 식별될 수 있고, 정보 처리 시스템은 식별된 특정 질병과 연관된 유전자 목록을 데이터베이스로부터 추출하고, 추출한 유전자 목록을 유전체 분석 정보에 포함시킬 수 있다. 본 개시에서는 특정 질병이 암인 것으로 예시되어 있다.
제3 서브 영역(730)에 포함된 드라이버 목록과 제6 서브 영역(760)에 포함된 유전자 목록을 비교하면, 제6 서브 영역(760)에 출력되는 유전자 목록에는 검체로부터 발견된 돌연변이와 연관된 유전자 레이블 및 검체로부터 발견되지 않은 유전자 레이블이 포함되고, 제3 서브 영역(730)에 출력되는 드라이버 목록에는 검체로부터 발견된 돌연변이와 연관된 유전자 레이블만이 포함될 수 있다. 여기서, 유전자 레이블은, 유전자 명칭일 수 있다.
제7 서브 영역(770)에는 검체의 종양 변이 부담(Tumor Mutational Burden)과 관련된 정보가 출력될 수 있다. 검체에 대한 단일 염기서열 변이(single nucleotide variation), 인델(indel), 구조 변이(SV: Structural Variants) 각각에 대한 변이 부담 통계 정보가 산출되어, 그래프 형태로 제7 서브 영역(770)에 출력될 수 있다. 제7 서브 영역(770)에서 출력되는 종양 변이 부담과 연관된 정보는 도 26을 참조하여 자세하게 후술하기로 한다.
제8 서브 영역(780)에는 검체에 대한 변이 시그니처(Mutational Signature)와 연관된 정보가 출력될 수 있다. 변이 시그니처와 연관된 정보는 단일 염기 치환(Single Base Substitution, 이하 'SBS'로 지칭함) 시그니처 정보와 인델 시그니처 정보를 포함할 수 있다. 제8 서브 영역(780)에서 출력되는 변이 시그니처 정보는 도 27을 참조하여 자세하게 후술하기로 한다.
도 8은 도 7의 제3 서브 영역(730)을 확대한 도면이다. 제3 서브 영역(730)에는 특정 질병(예컨대, 암)과 연관되고 검체로부터 발견된 돌연변이와 연관된 유전자 목록을 포함하는 드라이버 목록이 출력될 수 있다. 여기서, 유전자 목록은 적어도 하나의 유전자 레이블을 포함할 수 있다.
도 8에 예시된 바와 같이, 분석 대상이 되는 질병이 암과 연관된 질병인 경우, 드라이버 목록은 암 유발 드라이버(Oncogene driver) 목록(810) 및 암 억제 드라이버(Tumor suppressor driver) 목록(820)을 포함할 수 있다. 도 8에서는 암 유발 드라이버 목록(810)에는 'MYCN' 유전자 레이블 및 'MYCN' 유전자 레이블을 가지는 유전자에서 염기 'C'가 'T'로 치환된 돌연변이 정보가 포함되고, 암 억제 드라이버 목록(820)에는 'CNTNAP2' 유전자 레이블 및 'MEN1' 유전자 레이블이 포함되고, 추가적으로 'CNTNAP2' 유전자 레이블 와 'MEN1' 유전자 레이블을 가지는 유전자들에 각각 발생한 돌연변이 정보가 포함된 것으로 예시되어 있다. 또한, 암 유발 드라이버 목록(810)에 포함된 유전자 레이블과 돌연변이 정보는 제1 그래픽 요소(예컨대, 제1 색상)이 이용되어 시각화되어 제3 서브 영역(730)에 출력될 수 있다. 암 억제 드라이버 목록(820)에 포함된 유전자 레이블과 돌연변이 정보는 제2 그래픽 요소(예컨대, 제2 색상)가 이용되어 시각화되어 제3 서브 영역(730)에 출력될 수 있다. 도 8에서는 유전자 레이블과 돌연변이 정보가 구분자(:)를 통해서 구분된 것으로 예시되어 있다.
각각의 유전자의 레이블과 인접하여 외부 데이터베이스로 접속할 수 있는 적어도 하나의 링크 아이콘(830 내지 870)이 제3 서브 영역(730)에 출력될 수 있다.
각각의 링크 아이콘(830 내지 870)은 각 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법, 치료 방법으로 인한 효과 등 중 적어도 하나를 제공하는 외부 데이터베이스로 접근할 수 있는 수단으로서, 링크 아이콘(830 내지 870)별로 서로 다른 외부 데이터베이스의 링크 주소를 포함할 수 있다.
제1 링크 아이콘(830)은 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 제공하는 제1 외부 데이터베이스(예컨대, "OncoKB" 데이터베이스)로 접근할 수 있는 링크를 포함할 수 있다. 제1 링크 아이콘(830)이 클릭 또는 터치되는 경우, 사용자 인터페이스는 제1 외부 데이터베이스로 접근하여 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 획득하고, 획득된 정보를 포함하는 웹 페이지를 출력할 수 있다. 제1 링크 아이콘(830)은 제3 서브 영역(730)에 출력된 유전자 레이블과 연관된 정보가 제1 외부 데이터베이스에 포함된 경우에, 활성화되어 제3 서브 영역(730)에 출력될 수 있다.
유사하게, 제2 링크 아이콘(840)은 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 제공하는 제2 외부 데이터베이스(예컨대, "CIVIC" 데이터베이스)로 접근할 수 있는 링크를 포함할 수 있다. 제2 링크 아이콘(840)이 클릭 또는 터치되는 경우, 사용자 인터페이스는 제2 외부 데이터베이스로 접근하여 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 획득하고, 이 획득된 정보를 포함하는 웹 페이지를 출력할 수 있다. 제2 링크 아이콘(840)은 제3 서브 영역(730)에 출력된 유전자 레이블과 연관된 정보가 제2 외부 데이터베이스에 포함된 경우에, 활성화되어 제3 서브 영역(730)에 출력될 수 있다.
또한, 제3 링크 아이콘(850)은 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 제공하는 제3 외부 데이터베이스(예컨대, "Ensembl" 데이터베이스)로 접근할 수 있는 링크를 포함할 수 있다. 제3 링크 아이콘(850)은 제3 서브 영역(730)에 출력된 유전자 레이블과 연관된 정보가 제3 외부 데이터베이스에 포함된 경우에, 활성화되어 제3 서브 영역(730)에 출력될 수 있다. 마찬가지로, 제4 링크 아이콘(860)은 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 제공하는 제4 외부 데이터베이스(예컨대, "UCSC 지놈 연구소" 데이터베이스)로 접근할 수 있는 링크를 포함할 수 있고, 제5 링크 아이콘(870)은 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법 또는 치료 방법으로 인한 효과 중 적어도 하나를 제공하는 제5 외부 데이터베이스(예컨대, "ClinicalTrials.gov" 데이터베이스)로 접근할 수 있는 링크를 포함할 수 있다. 제4 링크 아이콘(860)은 유전자 레이블과 연관된 정보가 제4 외부 데이터베이스에 포함된 경우에 활성화되어 제3 서브 영역(730)에 출력될 수 있고, 제5 링크 아이콘(870)은 유전자 레이블과 연관된 정보가 제5 외부 데이터베이스에 포함된 경우에, 활성화되어 제3 서브 영역(730)에 출력될 수 있다.
도 9는 도 7의 제1 브라우저가 출력된 제4 서브 영역(740)을 확대한 도면이다. 도 9에 예시된 바와 같이, 제1 브라우저는 적어도 하나의 염색체를 선택할 수 있는 메뉴 영역(910), 염색체 식별정보가 표시되는 염색체 표시 영역(920), 구조 변이(structural variation) 및 복제수(copy number) 정보가 출력되는 제1 정보 출력 영역(930), 점 돌연변이(point mutation) 및 서열로서 구분되는(allelic) 복제수 정보(예를 들어, 부계로부터 받은 염색체의 복제수와 모계로부터 받은 염색체의 복제수) 등이 출력되는 제2 정보 출력 영역(940), 변이가 발견되었거나 발견되지 않은 유전자의 레이블이 출력되는 유전자 레이블 출력 영역(950) 및 제1 브라우저에 가시적으로 출력할 변이의 유형을 필터링하는데 이용되는 필터링 영역(960)을 포함하는 레이아웃으로 구성될 수 있다.
메뉴 영역(910), 제1 정보 출력 영역(930), 제2 정보 출력 영역(940), 유전자 레이블 출력 영역(950) 각각에 출력되는 정보는 제1 브라우저를 통해 제어될 수 있다.
메뉴 영역(910)에 포함된 Chromosome 메뉴가 선택되면 염기서열에 포함된 염색체 목록이 출력될 수 있다. 염색체 목록 중에서 하나 이상의 염색체가 선택될 수 있으며, 선택된 염색체와 관련된 정보만이 선별되어 제1 정보 출력 영역(930), 제2 정보 출력 영역(940) 및 유전자 레이블 출력 영역(950)에 출력되도록 제1 브라우저가 제어될 수 있다.
염색체 표시 영역(920)에는 각 염색체의 식별정보가 출력될 수 있다. 도 9에서는 모든 염색체가 출력된 것으로 예시되어 있다.
제1 브라우저를 통해 제1 정보 출력 영역(930)에는 유전체 각 영역/위치의 복제수(copy number)를 검은색 점으로 표시(plotting)한 패턴이 출력될 수 있다. 추가적으로, 제1 브라우저를 통해 점 돌연변이 및 구조 변이가 시각화되어 제1 정보 출력 영역(930)에 출력될 수 있다. 일 실시예에 따르면, 검체로부터 발견된 구조 변이와 연관된 그래픽 객체가 시각화되어 제1 정보 출력 영역(930)에 출력될 수 있다. 이때, 시각화하고자 하는 타깃 구조 돌연변이의 유형(type)에 기초하여 그래픽 객체의 형태 또는 색상 중 적어도 하나가 결정되고, 타깃 구조 돌연변이의 영역(위치 범위)에 기초하여 그래픽 객체의 크기(예컨대, 폭)가 결정되어 제1 정보 출력 영역(930)에 시각화될 수 있다.
도 9의 제1 정보 출력 영역(930)은 5개의 구조 변이가 시각화되어 출력되고 있음이 예시되어 있으며, 구조 변이 유형에 따라 색상 및/또는 형태가 상이하게 시각화된 것으로 예시되어 있다.
제2 정보 출력 영역(940)에는 대립 형질(allele) 별 복제수에 대한 정보가 출력될 수 있다. 도 9의 제2 정보 출력 영역(940)에는 하나의 대립 형질의 복제수(예컨대 모계로부터 받은 대립 형질의 복제수)가 제1 그래픽 요소(예컨대, 제1 색상)가 이용되어 시각화되고, 또 다른 대립 형질의 복제수(예컨대, 부계로부터 받은 대립 형질의 복제수)가 제2 그래픽 요소(예컨대, 제2 색상)가 이용되어 시각화된 것으로 예시되어 있다.
또한, 제2 정보 출력 영역(940)에는 염기서열로부터 발견된 점 돌연변이가 시각화되어 출력될 수 있다. 변이의 유형에 기초하여 변이를 시각화하는 그래픽 요소가 결정될 수 있다. 예를 들어, 염기 'C'가 'A'로 치환된 'C>A' 변이는 제3 그래픽 요소가 이용되어 시각화될 수 있고, 염기 'C'가 'G'로 치환된 'C>G' 변이는 제4 그래픽 요소가 이용되어 시각화될 수 있으며, 염기 'C'가 'T'로 치환된 'C>T' 변이는 제5 그래픽 요소가 이용되어 시각화될 수 있다.
유전자 레이블 출력 영역(950)에는 특정 질병과 연관된 주요 돌연변이와 연관된 유전자들 각각이 그 위치와 연관되어 출력될 수 있다. 또한, 유전자 레이블 출력 영역(950)에 출력되는 주요 돌연변이와 연관된 유전자들 중에서, 검체로부터 발견된 돌연변이와 연관된 유전자는 별도의 그래픽 요소를 이용하여 시각화할 수 있다. 일 실시예에 따르면, 주요 돌연변이와 연관된 유전자들 중에서, 검체로부터 발견되고 암 유발 드라이버 목록에 포함되는 유전자는 제6 그래픽 요소가 이용되어 유전자 레이블 출력 영역(950)에 시각화될 수 있다. 또한, 주요 돌연변이와 연관된 유전자들 중에서, 검체로부터 발견되고 암 억제 드라이버 목록에 포함된 유전자는 제7 그래픽 요소가 이용되어 유전자 레이블 출력 영역(950)에 시각화될 수 있다. 또한, 주요 돌연변이와 연관된 유전자들 중에서 검체로부터 발견되지 않은 돌연변이와 연관된 유전자는 제8 그래픽 요소가 이용되어 유전자 레이블 출력 영역(950)에 시각화될 수 있다. 도 9에서는 암 유발 드라이버에 포함된 'MYCN' 유전자는 제6 그래픽 요소로서 제3 색상이 이용되어 시각화되고, 암 억제 드라이버 목록에 포함된 'CNTNAP2'과 'MEN1' 유전자는 제7 그래픽 요소로서 제4 색상이 이용되어 시각화되고, 검체로부터 발견되지 않은 주요 돌연변이들과 관련이 있는 유전자들인 'ARID1A', 'RIT1' 등은 제8 그래픽 요소로서 제5 색상이 이용되어 시각화된 것으로 예시되어 있다.
필터링 영역(960)에는 제1 정보 출력 영역(930)에 출력된 구조 변이를 필터링할 수 있는 제1 필터 객체들과 제2 정보 출력 영역(940)에 출력된 변이를 필터링할 수 있는 제2 필터 객체들을 포함할 수 있다.
필터링 영역(960)에 포함된 제1 필터 객체들은 구조 변이와 관련된 객체들을 포함할 수 있다. 도 9에는 제1 필터 객체들은 결실(deletion)과 연관된 구조 변이를 나타내는 'DEL' 객체, 중복(duplication)과 연관된 구조 변이를 나타내는 'DUP' 객체, 역위(inversion)와 관련된 구조 변이를 나타내는 '5to5INV' 객체와 '3to3INV' 객체 및 전좌(translocation)와 관련된 구조 변이를 나타내는 'TRA' 객체를 포함할 수 있다. 각 객체 옆에 위치한 괄호 안의 숫자는 검체 내에서 발견된 해당 구조 돌연변이의 개수일 수 있다.
제1 필터 객체들 중에서 사용자에 의해서 선택된 필터 객체와 연관된 유형의 구조 변이에 대한 정보(즉, 구조 변이와 연관된 그래픽 객체)가 선별되어 제1 정보 출력 영역(930)에 가시적으로 출력될 수 있다. 또한, 제1 필터 객체들 중에서 사용자에 의해서 선택되지 않은 필터 객체와 연관된 유형의 구조 변이에 대한 정보(즉, 구조 변이와 연관된 그래픽 객체)가 제1 정보 출력 영역(930)에서 제거 또는 비가시화될 수 있다. 제1 필터 객체들에 포함된 객체를 선택하는 것을 통해, 사용자는 확인하고자 하는 구조 변이에 대한 정보를 선별하여 제1 정보 출력 영역(930)에 출력시킬 수 있다.
필터링 영역(960)에 포함된 제2 필터 객체들은 구조 변이 이외의 변이와 연관된 객체들을 포함할 수 있다. 도 9에는 제2 필터 객체들은 모계와 부계 중 어느 하나로부터 받은 대립 형질의 복제수를 나타내는 'Major Allele' 객체, 모계와 부계 중 다른 하나로부터 받은 대립 형질의 복제수를 나타내는 'Minor Allele' 객체를 포함할 수 있다. 여기서, 'Major Allele' 객체가 모계로부터 받은 대립 형질의 복제수를 나타내면, 'Minor Allele' 객체는 부계로부터 받은 대립 형질의 복제수를 나타낼 수 있다. 반대로, 'Major Allele' 객체가 부계로부터 받은 대립 형질의 복제수를 나타내면 'Minor Allele' 객체는 모계로부터 받은 대립 형질의 복제수를 나타낼 수 있다.
또한, 제2 필터 객체들은 점 돌연변이와 연관된 복수의 객체를 포함할 수 있다. 도 9에서는 점 돌연변이와 연관된 객체들이, 'C>A' 객체, 'C>G' 객체, 'C>T' 객체, 'T>A' 객체, 'T>C' 객체 및 'T>G' 객체인 것으로 예시되어 있다. 추가적으로 제2 필터 객체들은 삽입(insertion)과 관련된 'ins' 객체, 염기 결손(deletion)과 관련된 'del' 객체를 포함할 수 있다. 각 객체 옆에 위치한 괄호 안의 숫자는 염기서열로부터 검출된 해당 변이의 개수일 수 있다.
제2 필터 객체들 중에서 선택된 객체와 연관된 복제수 및/또는 변이가 선별되어 제2 정보 출력 영역(940)에 가시적으로 출력되고, 제2 필터 객체들 중에서 선택되지 않은 객체와 연관된 복제수 및/또는 변이는 제2 정보 출력 영역(940)에서 제거 또는 비가시화될 수 있다. 제2 필터 객체들에 포함된 객체를 선택하는 것을 통해, 사용자는 확인하고자 하는 부계/모계 복제수 및/또는 변이를 선별하여 제2 정보 출력 영역(940)에 출력시킬 수 있다.
도 10은 서로 다른 그래픽 객체를 통해서 시각화된 구조 변이를 포함하는 제1 정보 출력 영역(1000)에 대한 다른 예시를 나타내는 도면이다. 도 10에 예시된 바와 같이, 제1 브라우저에 의해 구조 변이의 유형(type)과 연관되는 그래픽 객체가 결정되고, 이 그래픽 객체가 제1 정보 출력 영역(1000)에 시각화될 수 있다.
n 개수(여기서, n은 자연수임)의 염기가 역위된 것과 연관된 제1 유형의 구조 변이(1010)는 제1 그래픽 객체가 이용되어 제1 정보 출력 영역(1000)에 시각화될 수 있다. 또한, m 개수(여기서, m은 자연수임)의 염기가 역위된 것과 연관된 제2 유형의 구조 변이(1020)는 제2 그래픽 객체가 이용되어 제1 정보 출력 영역(1000)에 시각화될 수 있다. 염기가 전좌(translocation)된 것과 연관된 제3 유형의 구조 변이(1030)는 제3 그래픽 객체가 이용되어 제1 정보 출력 영역(1000)에 시각화될 수 있다. 또한, 염기가 결실(deletion)된 것과 연관된 제4 유형의 구조 변이(1040)는 제4 그래픽 객체가 이용되어 제1 정보 출력 영역(1000)에 시각화될 수 있다.
도 10에 예시된 바와 같이, 구조 변이(1010 내지 1040)의 유형이 상이한 경우, 서로 상이한 그래픽 객체가 이용되어 구조 변이(1010 내지 1040)가 시각화될 수 있다. 예컨대, 서로 다른 유형의 구조 변이들(1010 내지 1040)은 각기 다른 색상 및/또는 형태를 가지는 그래픽 객체가 이용될 수 있다.
한편, 구조 변이와 관련된 그래픽 객체들이 밀집되어 제1 정보 출력 영역에 출력될 수 있다. 가령, 염기서열의 특정 영역에서 구조 변이가 복수 개로 발견된 경우에, 특정 영역에 구조 변이와 연관된 그래픽 객체들이 밀집되어 분포될 수 있다. 이러한 경우, 각 구조 변이와 관련된 그래픽 객체들이 중첩되어 시각화될 수 있고, 이에 따라 사용자의 가독성이 저하될 수 있다. 이러한 상황을 대비하여, 구조 변이와 연관된 그래픽 객체의 밀집도가 산출되고, 산출된 밀집도가 미리 결정된 임계값을 초과하는 경우, 가독성을 향상시키기 위한 다양한 그래픽 처리가 수행될 수 있다. 예컨대, 임계거리 이내에 위치한 그래픽 객체의 개수에 기초하여, 그래픽 객체의 밀집도가 산출될 수 있다. 이 경우, 구조 변이와 관련된 임계치 이상의 그래픽 객체들이 임계거리 이내에 포함되어 위치한 경우에, 가독성을 향상시키기 위한 다양한 그래픽 처리가 수행될 수 있다. 다른 예로서, 미리 결정된 단위 면적 내에 그래픽 객체가 시각화된 면적에 기초하여, 그래픽 객체의 밀집도가 산출될 수 있다. 이 경우, 산출된 그래픽 객체의 밀집도가 임계값 이상인 경우에 가독성을 향상시키기 위한 다양한 그래픽 처리가 수행될 수 있다. 이 외에, 다양한 방법으로 그래픽 객체들의 밀접도가 산출될 수 있다.
도 11은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 일 예시를 나타내는 도면이다. 도 11의 제1 화면(1110)에 예시된 바와 같이, 구조 변이와 연관된 그래픽 객체들이 임계거리 이내에 밀집하여 위치한 경우, 임계거리를 포함하는 영역(1112)이 그래픽 객체들이 밀집되어 있는 밀집 영역(1112)인 것으로 결정될 수 있다. 가령, 임계거리에서 소정의 거리만큼을 가로 폭으로 하는 밀집 영역(1112)이 결정될 수 있다. 일 실시예에 따르면, 임계치 이상의 그래픽 객체들이 임계거리에 포함되어 위치하는지 여부가 판정되고, 임계치 이상의 그래픽 객체들이 임계거리에 포함되어 위치하는 경우에, 임계거리를 포함하는 영역이 밀집 영역으로 결정될 수 있다. 몇몇 실시예에 따르면, 미리 결정된 단위 면적 내에 적어도 하나의 그래픽 객체가 시각화된 면적에 기초하여, 그래픽 객체의 밀집도가 산출되고, 산출된 그래픽 객체의 밀집도가 임계값 이상인 경우에 해당 그래픽 객체를 포함하는 영역이 밀집 영역으로 결정될 수 있다.
밀집 영역(1112)에 임계치 이상의 그래픽 객체들이 위치하거나 밀집 영역(1112)의 밀집도가 임계값 이상인 상태에서, 제2 화면(1120)과 같이 포인터가 복수의 그래픽 객체들 중에서 제1 그래픽 객체(1122)에 위치할 수 있다. 이 경우, 포인터가 위치한 제1 그래픽 객체(1122)가 강조될 수 있도록, 제1 브라우저가 제어될 수 있다. 추가적으로 또는 대안적으로, 밀집 영역(1112)에 포함된 그래픽 객체들 중에서 포인터가 위치한 제1 그래픽 객체(1122) 이외에 다른 객체들은 제거되거나 흐리게 되도록 제1 브라우저가 제어될 수 있다. 도 11의 제2 화면(1120)에서는 포인터가 위치한 그래픽 객체(1122)의 선 두께가 두꺼워지고, 나머지 객체들은 흐리게 처리되는 것으로 예시되어 있다.
포인터가 제1 객체(1122)에서 제2 객체(1132)로 이동한 경우, 포인터가 위치한 제2 그래픽 객체(1132)의 선 두께가 굵어져서 강조되고, 제2 그래픽 객체(1122) 이외에 다른 객체들은 제거되거나 흐리게 되도록 제1 브라우저가 제어될 수 있다.
도 12은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 다른 예시를 나타내는 도면이다. 도 12의 제1 화면(1210)에 예시된 바와 같이, 구조 변이와 연관된 임계치 이상의 그래픽 객체들이 임계거리 이내에 밀집하여 위치한 경우, 임계거리를 포함하는 영역(1212)이 그래픽 객체들이 밀집되어 있는 밀집 영역(1212)으로 결정될 수 있다. 몇몇 실시예에 따르면, 미리 결정된 단위 면적 내에 적어도 하나의 그래픽 객체가 시각화된 면적에 기초하여, 그래픽 객체의 밀집도가 산출되고, 산출된 그래픽 객체의 밀집도가 임계값 이상인 경우에 해당 그래픽 객체를 포함하는 영역이 밀집 영역으로 결정될 수 있다.
밀집 영역(1212)이 결정된 것에 응답하여, 밀집 영역(1212)에 위치한 복수의 그래픽 객체들이 일정 시간 간격으로 로테이션하면서 강조되도록, 제1 브라우저가 제어될 수 있다. 예컨대, 밀집 영역(1212)에 포함된 제1 그래픽 객체, 제2 그래픽 객체 및 제3 그래픽 객체 순으로 로테이션되면서 강조되어 시각화될 수 있도록, 제1 브라우저가 제어될 수 있다. 이때, 강조되는 그래픽 객체의 선이 굵게 될 수 있고, 강조되는 객체 이외의 그래픽 객체들은 흐리게 처리되거나 제거될 수 있다.
도 12에 예시된 바와 같이, 제1 그래픽 객체가 강조되는 제2 화면(1220), 제2 그래픽 객체가 강조되는 제3 화면(1230) 및 제3 그래픽 객체가 강조되는 제4 화면(1240) 순서로 로테이션되도록, 제1 브라우저가 제어될 수 있다.
도 13은 구조 변이와 연관된 그래픽 객체들이 밀집된 경우에, 그래픽 객체 처리에 대한 또 다른 예시를 나타내는 도면이다. 도 13의 제1 화면(1310)에 예시된 바와 같이, 구조 변이와 연관된 임계치 이상의 그래픽 객체들이 임계거리 이내에 밀집하여 위치한 경우, 임계거리를 포함하는 영역(1312)이 그래픽 객체들이 밀집되어 있는 밀집 영역(1312)으로 결정될 수 있다. 몇몇 실시예에 따르면, 미리 결정된 단위 면적 내에 적어도 하나의 그래픽 객체가 시각화된 면적에 기초하여, 그래픽 객체의 밀집도가 산출되고, 산출된 그래픽 객체의 밀집도가 임계값 이상인 경우에 해당 그래픽 객체를 포함하는 영역이 밀집 영역으로 결정될 수 있다.
밀집 영역(1312)이 결정된 것에 응답하여, 도 13의 제2 화면(1320)과 같이 밀집 영역(1312)이 미리 결정된 시간만큼 자동적으로 확대 또는 줌인되어 출력되도록 제1 브라우저가 제어될 수 있다. 다른 예로서, 밀집 영역(1312) 내에 포인터가 위치하는 것에 응답하여, 제2 화면(1320)과 같이 밀집 영역이 확대 또는 줌인되어 출력되도록 제1 브라우저가 제어될 수 있다. 또 다른 예로서, 밀집 영역(1312)에 포함된 그래픽 객체에 포인터가 위치하는 것에 응답하여, 제2 화면(1320)과 같이 밀집 영역이 확대 또는 줌인되어 출력되도록 제1 브라우저가 제어될 수 있다.
일 실시예에 따르면, 밀집 영역(1312)에 대해서 사용자가 인지할 수 있도록, 별도의 그래픽 요소가 이용되어 밀집 영역(1312)이 시각화될 수 있다. 여기서, 별도의 그래픽 요소는 색상, 무늬 또는 도형 중 적어도 하나를 포함할 수 있다.
한편, 밀집 영역(1312)에 포함된 그래픽 객체를 선택하는 사용자 입력이 수신되는지 여부가 판정될 수 있다. 미리 결정된 시간 동안에 밀집 영역(1312)에 포함된 그래픽 객체를 선택하는 사용자 입력이 수신되지 않는다고 판정되면, 확대된 밀집 영역(1312)이 원래의 크기로 축소되거나 줌인된 밀집 영역(1312)이 원래대로 줌아웃되도록 제1 브라우저가 제어될 수 있다. 즉, 밀집 영역(1312)이 확대 또는 줌인되었으나, 미리 결정된 시간 동안에 밀집 영역(1312)에 포함된 그래픽 객체가 선택되지 않은 경우에, 밀집 영역(1312)은 원래의 상태로 복귀될 수 있다.
추가적으로 또는 대안적으로, 포인터가 밀집 영역(1312)에 위치한 후에 벗어나는 것이 감지되는 경우, 확대 또는 줌인된 밀집 영역(1312)이 원래 상태로 복귀되도록 제1 브라우저가 제어될 수 있다. 즉, 포인터가 밀집 영역(1312)에 위치한 후에, 밀집 영역(1312) 밖으로 벗어난 경우, 확대 또는 줌인된 밀집 영역(1312)이 원래의 크기로 축소되거나 줌아웃될 수 있다.
한편, 제1 브라우저에서 사용자가 선택한 영역이 확대될 수 있다. 가령, 도 9의 제1 정보 출력 영역(930)과 제2 정보 출력 영역(940)이 사용자의 입력에 기초하여 확대될 수 있다. 사용자는 포인터를 드래그하여 확대하고자 하는 영역을 선택할 수 있고, 제1 브라우저를 통해 사용자에 의해 선택된 영역이 확대 또는 줌인되어 출력될 수 있다. 또한 사용자는 핀치 줌(pinch zoom) 등의 터치 제스처를 통하여 원하는 영역을 확대 또는 줌인할 수 있다.
도 14는 제1 브라우저에서 확대된 영역(1400)을 예시하는 도면이다. 도 14에 예시된 바와 같이, 제1 브라우저에 포함된 제1 정보 출력 영역 및/또는 제2 정보 출력 영역에 포함된 일부 영역이 드래그 되면, 드래그된 영역(1430)이 확대 또는 줌인되어 제1 정보 출력 영역 및/또는 제2 정보 출력 영역에 출력될 수 있다.
도 14에서는 2번째 염색체에 포함된 일부 영역(1430)이 확대 내지는 줌인되어 출력된 것을 예시하고 있다. 도 14에 예시된 바와 같이, 염기서열 전체 영역 중 일부 영역만이 출력되는 경우, 출력된 영역의 위치 정보(1410)가 출력되고, 출력된 영역과 연관된 정보를 제공하는 링크 아이콘(1420)이 활성화되어 출력될 수 있다.
한편, 유전체에 포함된 염색체들 중에서 복수 개가 선택되어 출력될 수 있다. 가령, 도 9에 예시된 메뉴 영역(910)에 포함된 Chromosome 메뉴가 선택되어 염색체 목록이 출력되고, 염색체 목록 중에서 선택된 복수 개의 염색체에 대한 정보가 제1 브라우저를 통해 출력될 수 있다. 복수 개의 염색체가 선택된 경우, 제1 브라우저를 통해서 선택된 염색체 개수와 상응하는 개수로 정보 출력 영역이 분할되고, 선택된 복수의 염색체 각각과 연관된 정보는 분할된 정보 출력 영역에 출력될 수 있다.
도 15는 본 개시의 일 실시예에 따른, 2개의 염색체가 출력된 제1 브라우저의 화면(1500)을 예시하는 도면이다. 도 15에서는 7번 염색체와 14번 염색체만이 선택되고, 7번 염색체 및 14번 염색체와 연관된 정보가 제1 브라우저를 통해 출력되는 것이 예시되어 있다. 가령, Chromosome 메뉴에 포함된 염색체 목록이 출력되고, 염색체 목록 중에서 7번 염색체와 14번 염색체가 선택되면, 제1 브라우저를 통해 정보 출력 영역이 두 개로 분할(1510, 1520)될 수 있다. 이 경우, 분할된 제1 영역(1510)에 7번 염색체와 연관된 정보가 출력되고, 분할된 제2 영역(1520)에 14번 염색체와 연관된 정보가 출력될 수 있다.
한편, Chromosome 메뉴에 포함된 염색체 목록에서 1개 또는 3개 이상의 염색체가 선택될 수 있고, 이 경우, 선택된 개수에 해당하는 염색체 관련 정보가 정보 출력 영역에 출력될 수 있다.
한편, 특정 유형의 구조 변이가 복수의 염색체로부터 발견되고, 그 발견된 위치에 특정 유형의 구조 변이와 연관된 정보(예컨대, 시각화된 정보)가 제1 브라우저에 출력될 수 있다. 예컨대, 특정 유형의 구조 변이가 2번 염색체와 15번 염색체에서 모두에서 발견된 경우, 제1 브라우저의 제1 정보 출력 영역 중에서, 2번 염색체와 연관된 영역 및 15번 염색체와 연관된 영역 각각에 특정 구조 변이에 대한 시각화 정보가 출력될 수 있다. 이렇게 특정 유형의 구조 변이와 연관된 시각화 정보가 복수의 염색체 영역에 위치한 상태에서, 제1 브라우저는 특정 유형의 구조 변이를 선택하는 사용자 입력을 수신할 수 있다. 가령, 특정 유형의 구조 변이와 연관된 시각화 정보를 선택하거나, 특정 유형의 구조 변이와 연관된 필터 객체를 선택하는 사용자 입력이 수신될 수 있다.
이 경우, 특정 유형의 구조 변이가 발견된 적어도 하나의 염색체와 관련된 정보만이 출력되도록 제1 브라우저가 제어될 수 있다. 예컨대, 특정 유형의 구조 변이가 2번 염색체와 15번 염색체에서 모두에서 발견된 상태에서, 특정 유형의 구조 변이를 선택한 사용자 입력을 수신하면, 2번 염색체와 연관된 정보와 15번 염색체와 연관된 정보만이 제1 브라우저에서 출력되도록, 제1 브라우저가 제어될 수 있다. 이 경우, 관련 염색체의 개수만큼 제1 브라우저의 정보 출력 영역이 분할되고, 염색체 각각과 연관된 정보는 분할된 정보 출력 영역에 출력될 수 있다.
도 16은 도 7의 제2 브라우저가 출력된 제5 서브 영역(750)을 보다 자세히 도시한 도면이다. 도 16에 예시된 바와 같이, 제2 브라우저는 현재 선택된 전사 모델(Transcription Model)이 출력되는 전사 모델 영역(1610), DNA 이중 나선 중에서 양성 가닥(positive strand)의 위치에 대한 정보가 출력되는 위치 정보 영역(1620), 외부 데이터베이스로 접속할 수 있는 링크 아이콘이 출력되는 아이콘 영역(1630), 돌연변이에 대한 서열 정보가 출력되는 정보 출력 영역(1640) 및 그래픽 객체별 변이 유형을 설명하는 설명 영역(1650)을 포함하는 레이아웃으로 구성될 수 있다. 여기서, 서열 정보는 전사 모델에 의해 DNA 서열의 일부 영역이 전사된 RNA(Ribonucleic acid) 서열 및/또는, 그러한 서열들에 대응되어 번역된 아미노산 서열을 포함할 수 있다.
현재 선택된 전사 모델에 대한 식별정보(예컨대, 이름)이 전사 모델 영역(1610)에 출력되고, 이 전사 모델의 위치 범위(좌표 범위)가 위치 정보 영역(1620)에 출력될 수 있다. 전사 모델이 변경되는 경우 전사 모델 영역(1610)에 출력된 식별정보와 위치 정보 영역(1620)에 출력된 위치 정보가 변경될 수 있고, 더불어 정보 출력 영역(1640)에 출력되는 서열 정보도 변경될 수 있다.
아이콘 영역(1630)에는 출력 영역(1640)에 출력되고 있는 유전자 및 해당 유전자와 관련하여 잘 알려진 돌연변이에 대한 상세 설명, 코멘트 정보, 치료 방법, 치료 방법으로 인한 효과 등 중 적어도 하나를 제공하는 외부 데이터베이스로 접근할 수 있는 링크 아이콘이 출력될 수 있다. 링크 아이콘이 활성화되는 방법은, 도 8을 참조하여 설명한 링크 아이콘에 대한 활성화 방법과 동일할 수 있다.
설명 영역(1650)에 기재된 바와 같이, 각각의 변이는 유형에 따라 서로 상이한 그래픽 객체가 이용되어, 정보 출력 영역(1640)에서 시각화될 수 있다. 예컨대, 과오돌연변이(Missense Mutation)는 제1 색상의 원 형태를 가지는 제1 그래픽 객체가 이용되어 정보 출력 영역(1640)에서 시각화될 수 있고, 절단형 돌연변이(Truncating Mutation)는 제2 색상의 원 형태를 가지는 제2 그래픽 객체가 이용되어 정보 출력 영역(1640)에서 시각화될 수 있고, 인프레임 삽입(Inframe Insertion)과 연관된 변이는 제1 색상 및 아래 방향의 화살표 형태를 가지는 제3 그래픽 객체가 이용되어 정보 출력 영역(1640)에서 시각화될 수 있다. 이외에도, 설명 영역(1650)에 예시된 바와 같이, 다양한 그래픽 객체가 이용되어, 해당 유형의 변이가 정보 출력 영역(1640)에서 시각화될 수 있다.
정보 출력 영역(1640)에는 DNA 염기서열, DNA 염기서열이 전사된 RNA 서열, 그러한 서열들에 대응되어 번역된 아미노산 서열, 및/또는 기타 유전자 정보가 출력될 수 있다. 정보 출력 영역(1640)에는 선택된 유전자와 연관된 엑손(exon), 염기서열로부터 번역된 아미노산(amino acid) 서열, 번역 대상이 되는 염기서열 영역, 염기서열로부터 번역되지 않는 비번역 영역(Untranslated Region), 도메인 정보 등이 출력될 수 있다. 번역 대상이 되는 염기서열 영역에는 검체로부터 획득된 복수의 염기가 출력될 수 있으며, 변이가 발생한 염기와 비교의 기준이 되는 레퍼런스 염기 서열의 염기가 함께 출력될 수 있다. 아미노산 서열 영역에는 염기들이 번역된 복수의 아미노산 식별자들이 출력될 수 있다. 또한, 아미노산 정보 영역에는 변이가 발생한 아미노산 식별자와, 레퍼런스 염기서열에 따른 아미노산 서열에서 변이가 발생한 아미노산과 대응되는 위치의 아미노산 식별자를 포함하는 아미노산 변경 정보가 출력될 수 있다.
여기서, 레퍼런스 염기서열은 정렬의 기준이 되는 염기서열일 수 있다. 또한, 레퍼런스 아미노산은 레퍼런스 염기서열에 포함된 일부 염기들이 전사된 RNA 서열, 그러한 RNA 서열로부터 번역된 아미노산 서열일 수 있다. 레퍼런스 아미노산은 아미노산이 변이되었는지를 판정하는데 기준 정보로서 이용될 수 있다. 또한, 레퍼런스 염기는 레퍼런스 염기서열에 포함된 염기이고, 레퍼런스 아미노산 식별자는 레퍼런스 아미노산에 포함된 아미노산 식별자일 수 있다.
정보 출력 영역(1640)에 출력된 정보를 통해서, 사용자는 전사 모델에 따라 염기서열이 아미노산으로 어떻게 번역되는지를 확인할 수 있고, 검체의 염기서열에서 발견된 돌연변이가 아미노산 서열에 어떻게 영향을 미치는지를 파악할 수 있다.
도 16에 예시된 '0'에서부터 '465aa'까지의 구간은, 염기서열의 일부 영역으로부터 번역된 아미노산 영역일 수 있다. 또한, 도 16에 예시된 네모 안에 기재된 숫자 '1', '2' 및 '3'은, DNA 중에 인트론(Intron) 영역이 배제되고 엑손(Exon) 영역이 넘버링된 것일 수 있다.
또한, 정보 출력 영역(1640)은 최하단에는 염기(base)에 대한 변이 정보, 또한 레퍼런스 아미노산과 비교하여 변경된 아미노산 정보가 출력될 수 있다. 즉, 비교 대상이 되는 아미노산과 레퍼런스 아미노산 간의 차이를 나타내는 아미노산 변경 정보가 정보 출력 영역(1640)에 출력될 수 있다. 제2 브라우저의 특정 영역이 드래그되는 경우에, 드래그된 영역이 확대되어 정보 출력 영역(1640)에 출력될 수 있다. 출력 영역(1640)이 확대되면 아미노산 식별자와 염기와 관련된 문자(character)가 디스플레이 되고, 이를 통해 사용자는 돌연변이가 발생한 염기와 아미노산 식별자를 파악할 수 있다.
일 실시예에 따르면, 선택된 유전자에서 돌연변이가 위치와 연관하여, 그래픽 객체(1660)가 정보 출력 영역(1640)에 출력될 수 있다. 앞서 설명한 바와 같이, 돌연변이의 유형에 연관된 그래픽 객체(1660)가 정보 출력 영역(1640)에 출력될 수 있다.
포인터가 이용되어 정보 출력 영역(1640)에 출력된 그래픽 객체(1660)가 선택될 수 있다. 즉, 정보 출력 영역(1640)에 출력된 돌연변이 관련 그래픽 객체(1660)가 선택하는 사용자 입력이 수신될 수 있다. 그래픽 객체(1660)가 선택하는 사용자 입력에 응답하여, 해당 돌연변이에 대한 세부 정보가 출력될 수 있다.
도 17은 본 개시의 일 실시예에 따른, 돌연변이에 대한 세부 정보가 출력되는 화면(1700)을 예시하는 도면이다. 도 17에 예시된 바와 같이, 돌연변이와 연관된 그래픽 객체(1660)가 선택되는 사용자 입력에 응답하여, 돌연변이에 대한 세부 정보(1710)가 출력될 수 있다.
돌연변이의 분석 결과에 대한 세부 정보(1710)는 염색체 정보, 돌연변이의 위치와 연관된 베이스 포지션(base position) 정보, DNA에서의 변이와 관련된 HGVSc 정보, 아미노산 변이와 관련된 HGVSp 정보, 해당 포지션에서의 레퍼런스 대립 형질(allele)의 카운트 개수와 관련된 '# of ref.READ' 정보와 '# of alt.READ' 정보, VAF(Variant allele frequency) 값 및 TCF 값 등을 포함할 수 있다. 여기서, TCF 값은 검체에서 해당 돌연변이를 가지고 있는 비율로서, 주변의 여러 정보를 조합하여 산술적으로 추론한 값일 수 있다. 추가적으로, 돌연변이의 분석 결과에 대한 세부 정보(1710)는 기타 항목, 즉, COSMIC 및 ClinVar, PolyPhen, SIFT 등을 포함할 수 있다. 여기서, PolyPhen 및 SIFT는 서열의 보존도(예컨대, 원숭이에도 완전 똑같은 서열이 존재하는지에 대한 정도) 등을 토대로 해당 변이가 유전자의 기능에 미칠 영향을 추론한 결과일 수 있다.
일 실시예에 따르면, 그래픽 객체(1660)와 연관되는 특정 돌연변이에 대한 비교를 요청하는 사용자 입력이 수신될 수 있다. 이 경우, 정보 처리 시스템은 사용자 단말로부터 특정 돌연변이에 대한 비교 요청을 수신할 수 있고, 비교 요청을 수신하는 것에 응답하여 검체와 연관된 프로젝트에 포함된 타 검체를 식별할 수 있다. 이어서, 정보 처리 시스템은 식별된 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 데이터베이스로부터 추출하여 사용자 단말로 전송할 수 있다. 이 경우, 사용자 단말은 검체로부터 발견된 특정 돌연변이에 대한 세부 정보 및 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 연관시켜 사용자 인터페이스를 통해 출력할 수 있다. 연관된 각 돌연변이에 대한 세부 정보는 사용자 인터페이스를 통해 한 화면에 출력될 수 있다. 이에 따라, 사용자는 한 화면을 통해서 서로 다른 검체에 대한 세부 정보를 비교할 수 있다.
한편, 사용자 단말은 프로젝트와 연관된 모든 정보를 저장할 수 있다. 이렇게 프로젝트와 연관된 모든 정보가 사용자 단말에 저장된 상태에서, 그래픽 객체(1660)와 연관된 특정 돌연변이에 대한 비교를 요청하는 사용자 입력이 수신되면, 사용자 단말은 저장중인 프로젝트 정보로부터 타 검체에 유전체 분석 정보를 추출하고, 추출된 유전체 분석 정보로부터 특정 돌연변이에 대한 세부 정보를 획득할 수 있다. 이어서, 사용자 단말은 검체로부터 발견된 특정 돌연변이에 대한 세부 정보 및 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 연관시켜 사용자 인터페이스를 통해 출력할 수 있다
한편, 돌연변이와 연관된 그래픽 객체(1660)가 선택되는 경우, 돌연변이와 연관된 아미노산 영역이 자동적으로 확대될 수 있다.
도 18은 염기서열 및 아미노산 서열 중 특정 영역이 확대되어 디스플레이되도록 설정된 정보 출력 영역(1800)을 예시하는 도면이다. 특정 돌연변이와 연관된 그래픽 객체(1660)를 선택하는 사용자 입력에 응답하여, 특정 돌연변이와 연관된 아미노산 서열의 특정 영역과 염기서열의 특정 영역이 확대 또는 줌인되어 디스플레이될 수 있다. 아미노산 서열 및 염기서열의 특정 영역들이 줌인되어 디스플레이됨에 따라, 변이가 발생한 염기와 아미노산 식별자 각각과 연관된 문자가 확대되어 디스플레이되고, 이에 따라 사용자는 육안으로 염기와 아미노산 식별자를 인지할 수 있다.
아미노산이 레퍼런스 아미노산과 상이하다고 판정된 경우, 레퍼런스 아미노산의 식별자와 변이된 아미노산 식별자를 포함하는 아미노산 변경 정보(1810)가 정보 출력 영역(1800)에 출력될 수 있다.
도 18의 아미노산 변경 정보(1810)에는, 레퍼런스 염기서열의 염기로서 'C', 검체에서 변이된 염기로서 'T'가 포함되고, 레퍼런스 아미노산 식별자로서 'P' 및 변이된 아미노산 식별자로서 'L'이 포함된 것으로 예시되어 있다. 도 18의 아미노산 변경 정보(1810)에 따르면, 레퍼런스 염기서열과 비교하여 검체의 염기가 'C'에서 'T'로 변이되고, 레퍼런스 아미노산과 비교하여 검체의 아미노산이 'P'에서 'L'로 변이된 것으로 해석될 수 있다.
도 18과 같은 확대 화면은 포인터의 드래그 또는 터치 제스처를 통해서도 달성될 수 있다. 즉, 포인터를 통해 도 18과 연관된 영역을 드래그되면 도 18에 예시된 영역이 확대되어 출력될 수 있다.
제2 브라우저에는 전사 모델을 선택할 수 있는 전사 모델 목록이 출력될 수 있다. 전사 모델 목록은 염기서열 내에서 일부 영역과 연관된 복수의 전사 모델을 포함할 수 있다. 예를 들어, 전체 염기서열 내에서 제1 지점과 제2 지점까지의 범위를 가지는 제1 영역이 선택된 경우, 제1 영역의 일부 또는 전부를 전사 및 번역할 수 있는 복수의 전사 모델이 전사 모델 목록에 포함될 수 있다.
일 실시예에 따르면, 정보 처리 시스템은 검체로부터 획득된 염기서열을 각각의 전사 모델을 통해서 전사 및 번역하고, 각각의 전사 모델을 통해 번역된 결과를 유전체 분석 정보에 포함시킬 수 있다.
도 19는 전사 모델 목록이 출력된 제2 브라우저(1900)를 예시하는 도면이다. 전사 모델 목록을 요구하는 사용자 입력이 수신되는 것에 응답하여, 전사 모델 목록(1910)이 출력될 수 있다. 전사 모델 목록(1910)에 포함된 전사 모델 중에서 특정 전사 모델을 선택하는 사용자 입력이 수신되는 것에 응답하여, 선택된 특정 전사 모델에 의해서 전사 및 번역된 결과를 반영하도록 제2 브라우저가 제어될 수 있다.
한편, 각각의 전사 모델은 우선순위를 가질 수 있다. 이러한 우선순위는 사용 빈도 등과 같은 조건에 기초하여 미리 결정될 수 있으며, 전문 분석가가 사전에 지정한 것일 수 있고, 또는 텍스트 오름차순/내림차순을 통해 결정될 수 있다.
제1 브라우저에서 출력되는 영역이 변경되면, 해당 영역과 연관되어 전사 모델 목록이 변경될 수 있다. 이렇게 전사 모델 목록이 변경되는 경우에, 전사 모델 목록에 포함된 각 전사 모델의 우선순위에 기초하여, 제2 브라우저에 출력될 타깃 전사 모델이 결정될 수 있다. 즉, 전사 모델 목록에 포함된 전사 모델별 우선순위를 기초로, 최우선 순위를 가지는 전사 모델이 타깃 전사 모델로 결정되고, 결정된 타깃 전사 모델을 통해서 전사 및 번역된 결과를 포함하는 유전자 정보가 제2 브라우저를 통해 출력될 수 있다.
한편, 제1 브라우저에서 특정 염색체가 선택되면, 선택된 특정 염색체에 기초하여 제1 브라우저와 제2 브라우저가 서로 연동되어 동작할 수 있다.
도 20은 본 개시의 일 실시예에 따른, 특정 염색체와 연관된 정보가 출력된 제1 브라우저의 화면(2000)을 예시하는 도면이다. 도 20에서는 1번 염색체가 선택된 것에 응답하여, 1번 염색체의 위치 정보 및 크기와 관련된 정보(2010)가 출력되고, 1번 염색체와 관련된 정보만이 선별되어 정보 출력 영역(2020)에 출력된 것으로 예시되어 있다.
제1 브라우저를 통해 1번 염색체와 연관된 정보가 출력되는 것에 응답하여, 제2 브라우저에 출력되는 정보도 변경될 수 있다.
도 21은 제1 브라우저에서 선택된 염색체와 연관된 유전자와 연동하여 동작하는 제2 브라우저의 회면(2100)을 예시하는 도면이다. 도 21에 예시된 바와 같이, 1번 염색체에 포함된 특정 유전자 'ARID1A' 영역을 전사 및 번역할 수 있는 전사 모델 목록이 획득되고, 전사 모델 목록에 포함된 각 전사 모델의 우선순위에 기초하여, 출력될 타깃 전사 모델이 결정될 수 있다.
결정된 타깃 전사 모델과 관련된 정보(2110)가 제2 브라우저를 통해 출력될 수 있다. 또한, 타깃 전사 모델을 통해 전사 및 번역되는 영역 및 크기와 관련된 정보(2120)가 제2 브라우저를 통해 출력될 수 있다. 또한, 타깃 전사 모델에 의해 전사 및 번역된 결과를 포함하는 유전자 정보(2130)가 제2 브라우저에 통해 출력될 수 있다.
상술한 바와 같이, 제1 브라우저에서 특정 염색체가 선택되면, 특정 염색체와 연관된 유전자 정보가 제2 브라우저에 출력될 수 있다.
한편, 드라이버 목록에서 특정 돌연변이 정보/유전자 레이블이 선택되면, 선택된 돌연변이 정보/유전자 레이블과 연관된 정보가 출력되도록 제1 브라우저와 제2 브라우저가 제어될 수 있다.
도 22는 드라이버 목록에서 선택된 돌연변이 정보에 기초하여 동작되는 제1 브라우저의 화면(2210)과 제2 브라우저의 화면(2220)을 예시하는 도면이다. 가령, 드라이버 목록에서 'CNTNAP2' 및/또는 'CNTNAP2'과 관련된 돌연변이 정보를 선택하는 사용자 입력에 응답하여, 'CNTNAP2' 유전자가 위치하는 7번째 염색체에 관련된 정보만이 제1 브라우저를 통해 정보 출력 영역(2214)에 출력될 수 있다. 즉, 사용자가 드라이버 목록에서 'CNTNAP2' 및/또는 'CNTNAP2'와 관련된 돌연변이를 선택할 경우, 'CNTNAP2' 유전자가 발견된 7번 염색체만이 선별되어 제1 브라우저를 통해 정보 출력 영역(2214)에 출력될 수 있다. 'CNTNAP2' 유전자와 관련된 염색체가 7번 염색체임을 나타내는 정보(2212)가 제1 브라우저를 통해 출력되고, 더불어 유전자 레이블인 'CNTNAP2'(2216)가 제1 브라우저를 통해 출력될 수 있다.
또한, 7번째 염색체에서 'CNTNAP2' 유전자가 위치하는 영역과 연관된 전사 모델 목록이 획득되고, 전사 모델 목록에 포함된 각 전사 모델의 우선순위에 기초로 타깃 전사 모델이 결정될 수 있다. 타깃 전사 모델에 의해서 전사 및 번역된 결과를 포함하는 유전자 정보가 제2 브라우저를 통해 정보 출력 영역(2224)에 출력될 수 있다. 또한, 타깃 전사 모델의 식별정보 및 타깃 전사 모델에 번역된 위치 영역을 포함하는 정보(2222)가 제2 브라우저를 통해 출력될 수 있다.
상술한 바와 같이, 드라이버 목록에 포함된 돌연변이 정보/유전자 레이블을 선택하는 것을 통해서, 제1 브라우저와 제2 브라우저 각각에 출력되는 정보가 함께 변경될 수 있다.
도 23은 드라이버 목록에서 선택된 돌연변이 정보에 기초하여 동작하는 제1 브라우저의 화면(2310)과 제2 브라우저의 화면(2320)에 대한 다른 예시를 나타내는 도면이다. 가령, 드라이버 목록에서 'MYCN' 및/또는 'MYCN'과 관련된 돌연변이 정보를 선택하는 사용자 입력에 응답하여, 'MYCN' 유전자가 위치하는 2번째 염색체에 관련된 정보만이 제1 브라우저를 통해 정보 출력 영역(2314)에 출력될 수 있다. 'MYCN' 유전자와 관련된 염색체가 2번 염색체임을 나타내는 정보(2312)가 제1 브라우저를 통해 출력되고, 더불어 유전자 레이블인 'MYCN'(2316)이 제1 브라우저를 통해 출력될 수 있다.
또한, 2번째 염색체에서 'MYCN' 유전자가 위치하는 위치 영역과 연관된 전사 모델 목록이 획득되고, 획득된 전사 모델 목록에 포함된 각 전사 모델의 우선순위에 기초로 타깃 전사 모델이 결정될 수 있다. 타깃 전사 모델에 의해서 전사 및 번역된 결과를 포함하는 유전자 정보가 제2 브라우저를 통해 정보 출력 영역(2324)에 출력될 수 있다. 또한, 타깃 전사 모델의 식별정보 및 타깃 전사 모델에 번역된 위치 영역을 포함하는 정보(2322)가 제2 브라우저를 통해 출력될 수 있다.
도 24는 도 7의 제6 서브 영역(760)을 확대한 도면이다. 도 24에 예시된 바와 같이, 확대된 제6 서브 영역(760)에 예시된 바와 같이, 특정 질병과 연관된 주요 돌연변이가 발생하는 유전자의 목록(2420 내지 2440)이 출력될 수 있다. 가령, 이 목록(2420 내지 2440)은 특정 암과 연관된 대표적인 돌연변이들이 발견되는 유전자들의 레이블을 포함할 수 있다.
제6 서브 영역(760)에는 주요 유전자를 추가할 수 있는 입력란(2410)이 출력될 수 있다. 사용자는 유전자 레이블을 입력란(2410)에 입력함으로써, 유전자 목록에 특정 돌연변이와 연관된 유전자 레이블을 추가할 수 있다.
유전자 목록(2420 내지 2440)에는 유전자 유형별로 상이한 그래픽 요소로 시각화된 유전자 레이블이 포함될 수 있다. 일 실시예에 따르면, 유전자 목록에 포함된 유전자들 중에서, 검체로부터 발견되고 더불어 암 유발 드라이버(Oncogene driver) 목록에 포함된 유전자 레이블(2420)이 제1 그래픽 요소를 이용하여 시각화되어 제6 서브 영역(760)에 출력될 수 있다. 또한, 유전자 목록에 포함된 유전자들 중에서, 검체로부터 발견되고 더불어 암 억제 드라이버(Tumor suppressor driver) 목록에 포함된 유전자 레이블(2430)이 제2 그래픽 요소를 이용하여 시각화되어 제6 서브 영역(760)에 출력될 수 있다. 게다가, 유전자 목록에 포함된 유전자들 중에서, 검체로부터 발견되지 않은 돌연변이와 연관된 유전자 레이블(2440)이 제3 그래픽 요소를 이용하여 시각화되어 제6 서브 영역(760)에 출력될 수 있다. 도 24에서는 제1 그래픽 요소는 제1 색상이고, 제2 그래픽 요소는 제2 색상이며, 제3 그래픽 요소는 제3 색상인 것으로 예시되어 있다.
도면에 도시되지 않았으나, 입력란(2410)을 통해서 유전자 목록에 추가된 유전자 레이블이 제4 그래픽 요소를 이용되어 시각화되어 제6 서브 영역(760)에 출력될 수 있다.
본 개시의 일 실시예에 따르면, 유전자 목록에 포함된 특정 유전자 레이블이 선택되면, 선택된 특정 유전자 레이블에 기초하여 제1 브라우저와 제2 브라우저 각각의 정보가 연동하여 변경될 수 있다.
도 25는 본 개시의 일 실시예에 따른, 유전자 목록에서 선택된 유전자에 기초하여 동작하는 제1 브라우저의 화면(2510)과 제2 브라우저의 화면(2520)을 예시하는 도면이다. 가령, 유전자 목록에서 'SETD2'를 선택하는 사용자 입력에 응답하여, 'SETD2' 유전자가 위치한 3번째 염색체에 관련된 정보가 제1 브라우저를 통해 정보 출력 영역(2514)에 출력될 수 있다. 여기서, 'SETD2'는 검체로부터 돌연변이가 발견되지 않은 유전자임을 유의해야 한다. 즉, 본 개시의 실시예에 따르면, 유전자 목록에는 검체로부터 돌연변이가 발견되지 않은 주요 유전자의 레이블도 포함될 수 있고, 이에 따라 유전자 목록 중에서 검체로부터 돌연변이가 발견되지 않은 'SETD2' 유전자를 선택하는 사용자 입력이 수신될 수 있다.
이런 경우, 'SETD2' 유전자가 위치한 3번 염색체가 선별되어 제1 브라우저를 통해 정보 출력 영역(2514)에 출력될 수 있다. 'SETD2' 유전자가 위치한 3번 염색체에 관한 정보(2512)가 제1 브라우저를 통해 출력되고, 더불어 'SETD2' 유전자의 레이블(2516)이 제1 브라우저를 통해 출력될 수 있다.
또한, 'SETD2' 유전자 영역을 전사 및 번역하는데 이용되는 전사 모델 목록이 획득되고, 전사 모델 목록에 포함된 각 전사 모델의 우선순위에 기초로 타깃 전사 모델이 결정될 수 있다. 타깃 전사 모델이 의해서 번역된 결과를 포함하는 유전자 정보가 제2 브라우저를 통해서 정보 출력 영역(2524)에 출력될 수 있다. 또한, 타깃 전사 모델의 식별정보 및 타깃 전사 모델에 의해 번역된 위치 영역을 포함하는 정보(2522)가 제2 브라우저를 통해서 출력될 수 있다.
상술한 바와 같이, 주요 돌연변이 목록에 포함된 돌연변이를 선택하는 것을 통해서, 제1 브라우저와 제2 브라우저 각각에 출력되는 정보가 함께 변경될 수 있다.
도 26은 도 7의 제7 서브 영역(770)을 확대한 도면이다. 도 26에 예시된 바와 같이, 제7 서브 영역(770)에는 검체의 종양 변이 부담(Tumor Mutational Burden)에 대한 플롯(이하, '종양 변이 부담 플롯'으로 지칭함)과 연관된 정보가 출력될 수 있다. 여기서, 종양 변이 부담에 대한 플롯과 연관된 정보는 서로 다른 유형의 변이에 대한 통계 정보를 포함할 수 있다.
예컨대, 검체로부터 발견된 단일 염기서열 변이(SNV: single nucleotide variation), 인델(indel, 삽입 및 삭제), 구조 변이(SV: Structural Variants) 각각에 대한 변이 부담 통계 정보가 산출되어, 그래프 형태로 제7 서브 영역(770)에 출력될 수 있다. 즉, 검체의 단일 염기서열 변이(SNV)에 대한 종양 변이 부담 플롯이 산출되고, 산출된 단일 염기서열 변이(SNV)에 대한 종양 변이 부담 플롯(Plot)과 관련된 그래픽 요소(도 26에서 This Case임)가 단일 염기서열 변이(SNV) 분포 그래프에서 출력될 수 있다. 도 26에서는 단일 염기서열 변이(SNV)에 대한 종양 변이 부담 플롯이 1.13/Mbps로 산출된 것으로 예시되어 있다.
또한, 검체로부터 발견된 인델에 대한 종양 변이 부담 플롯이 산출되고, 산출된 인델에 대한 종양 변이 부담 플롯과 관련된 그래픽 요소(도 26에서 This Case임)가 인델 분포 그래프에서 출력될 수 있다. 도 26에서는 인델에 대한 종양 변이 부담 플롯이 0.15/Mbps로 산출된 것으로 예시되어 있다.
추가적으로, 검체로부터 발견된 구조 변이(SV)에 대한 종양 변이 부담 플롯이 산출되고, 산출된 구조 변이에 대한 종양 변이 부담 플롯과 관련된 그래픽 요소(도 26에서 This Case임)가 구조 변이 분포 그래프에서 출력될 수 있다. 도 26에서는 구조 변이에 대한 종양 변이 부담 플롯이 1.61/Mbps로 산출된 것으로 예시되어 있다.
한편, 몇몇 실시예에서 종양 변이 부담에 대한 비교를 요청하는 사용자 입력이 사용자 인터페이스를 통해서 수신될 수 있다. 이 경우, 정보 처리 시스템은 사용자 단말로부터 종양 변이 부담에 대한 비교 요청을 수신할 수 있으며, 비교 요청을 수신하는 것에 응답하여, 검체가 포함된 프로젝트 또는 정보 처리 시스템(230)에 저장된 모든 프로젝트로부터 타 검체를 식별할 수 있다. 이어서, 정보 처리 시스템은 식별된 타 검체에 대한 종양 변이 부담 플롯과 연관된 정보를 데이터베이스로부터 추출하여 사용자 단말로 전송할 수 있다. 이어서, 사용자 단말은 검체에 대한 종양 변이 부담 플롯 관련 정보 및 타 검체에 대한 종양 변이 부담 플롯 관련 정보를 연관시켜 사용자 인터페이스를 통해 출력할 수 있다. 연관된 검체 및 타 검체에 대한 종양 변이 부담 플롯 관련 정보는 사용자 인터페이스를 통해 한 화면에 출력될 수 있다. 가령, 타 검체에 대한 종양 변이 부담 플롯 관련 통계 정보와 검체에 대한 종양 변이 부담 플롯 관련 통계 정보(예컨대, 도 26과 관련된 통계 정보)가 한 화면에서 비교될 수 있도록, 사용자 인터페이스에 출력될 수 있다.
한편, 사용자 단말에서 프로젝트와 연관된 모든 정보가 저장될 수 있다. 이렇게 프로젝트와 연관된 모든 정보가 사용자 단말에 저장된 상태에서, 종양 변이 부담에 대한 비교를 요청하는 사용자 입력이 수신되면, 저장중인 프로젝트 정보로부터 타 검체에 대한 종양 변이 부담 플롯과 연관된 정보가 추출될 수 있다. 이어서, 사용자 단말은 검체에 대한 종양 변이 부담 플롯과 관련된 정보 및 타 검체에 대한 종양 변이 부담 플롯 관련과 정보를 연관시켜 사용자 인터페이스를 통해 출력할 수 있다.
도 27은 도 7의 제8 서브 영역(780)을 확대한 도면이다. 도 27에 예시된 바와 같이, 검체에 대한 변이 시그니처(Mutational Signature) 정보가 제8 서브 영역(780)에 출력될 수 있다. 변이 시그니처 정보는 SBS 변이 정보와 인델 변이 정보를 포함할 수 있다. 도 27에 예시된 바와 같이 제4 서브 영역(780)에 출력되는 정보(2710 내지 2740)는 그래프 형태로 출력될 수 있다.
도 27에 예시된 바와 같이, SBS 카테고리별로 점유하는 비율을 포함하는 제1 SBS 변이 정보(2710)가 제8 서브 영역(780)에 출력될 수 있다. 여기서, SBS 카테고리는 SBS1, SBS4, SBS5, SBS40 등을 포함할 수 있다. 도 27에서는 검체로부터 발견된 SBS 변이가 SBS1, SBS4, SBS5 및 SBS40이고, SBS1, SBS4, SBS5 및 SBS40 각각이 전체 SBS에서 점유하는 비율이 산출된 후, 산출된 비율이 도넛 그래프 형태로 출력된 것으로 예시되어 있다. 도 27에서는 SBS4와 SBS1이 Etc. 영역에 포함된 것으로 예시되어 있고, Etc. 영역에 포인터가 이동한 후 클릭(또는 터치)되는 경우에, SBS4와 SBS1이 차지하는 비율이 도넛 그래프에서 출력될 수 있다.
또한, 레퍼런스 SBS 변이 정보와 검체로부터 분석된 SBS 변이 정보 간의 코사인 유사도(Cosine Similarity)가 산출되고, 산출된 SBS 코사인 유사도가 제1 SBS 변이 정보(2710)에 포함될 수 있다. 여기서, 레퍼런스 SBS 변이 정보는 SBS 코사인 유사도를 산출하기 위한 기준이 되는 정보로서, 정보 처리 시스템 및/또는 사용자 단말에 미리 저장되거나 정보 처리 시스템 및/또는 사용자 단말에 의해 접근 가능한 임의의 저장 매체에 될 수 있다. 도 27에서는 SBS 코사인 유사도가 0.965인 것으로 예시되어 있다.
추가적으로, SBS와 관련된 변이들이 변이 유형(즉, C>A, C>G, C>T, T>A, T>C 및 T>G)에 따라 구분되고, 구분된 각 변이 유형이 차지하는 비율을 포함하는 제2 SBS 변이 정보(2720)가 제8 서브 영역(780)에 출력될 수 있다. 도 27에 도시된 바와 같이, SBS 변이 유형별 비율을 나타내는 막대 그래프가 제2 SBS 변이 정보(2720)에 포함되어 제8 서브 영역(780)에 출력될 수 있다.
또한, 인델 카테고리별로 점유하는 비율을 포함하는 제1 인델 변이 정보(2730)가 제8 서브 영역(780)에 출력될 수 있다. 여기서, 인델 카테고리는 ID1, ID2, ID3, ID4, ID5, ID6 등과 같은 다양한 인델들을 포함할 수 있다. 도 27에서는 검체로부터 발견된 인델 변이가 ID1, ID2, ID3, ID4, ID5, ID6, ID9, ID10, ID12, ID14, ID17 및 ID18이고, 전체 인델에서 각 인델이 차지하는 비율이 산출되고, 산출된 비율이 도넛 그래프 형태로 제8 서브 영역(780)에 출력된 것으로 예시되어 있다. 도 27에서는 ID2와 ID7 이외의 인델 변이는 Etc. 영역에 포함된 것으로 예시되어 있고, Etc. 영역에 포인터가 이동한 후 클릭(또는 터치)되는 경우에, ID2와 ID7 이외의 기타 유형의 인델 변이가 차지하는 비율이 도넛 그래프에서 출력될 수 있다.
추가적으로, 레퍼런스 인델 변이 정보와 검체로부터 분석된 인델 변이 정보 간의 코사인 유사도가 산출되고, 산출된 인델 코사인 유사도가 제1 인델 변이 정보(2730)에 포함될 수 있다. 여기서, 레퍼런스 인델 변이 정보는 인델 코사인 유사도를 산출하기 위한 기준이 되는 정보로서, 정보 처리 시스템 및/또는 사용자 단말에 미리 저장될 수 있다. 도 27에서는 인델 코사인 유사도가 0.998인 것으로 예시되어 있다.
또한, 인델과 관련된 변이들이 변이 유형(즉, 1bp deletion, 1bp insertion 등)에 따라 구분되고, 구분된 각 변이 유형이 차지하는 비율을 포함하는 제2 인델 정보(2740)가 제8 서브 영역(780)에 출력될 수 있다. 도 27에 예시된 바와 같이, 인델 변이 유형별 비율을 나타내는 막대 그래프가 제8 서브 영역(780)에 출력될 수 있다.
도 28은 본 개시의 일 실시예에 따른, 유전 정보 분석 결과 제공 방법(2800)을 설명하기 위한 흐름도이다. 도 28에 도시된 방법은, 본 개시의 목적을 달성하기 위한 일 실시예일 뿐이며, 필요에 따라 일부 단계가 추가되거나 삭제될 수 있음은 물론이다. 또한, 도 28에 도시된 방법은 정보 처리 시스템에 포함된 적어도 하나의 프로세서 및/또는 사용자 단말에 포함된 적어도 하나의 프로세서에 의해서 수행될 수 있다. 설명의 편의를 위해서 도 3에 도시된 사용자 단말에 포함된 프로세서에 의해서, 도 28에 도시된 각 단계가 수행되는 것으로 설명하기로 한다.
프로세서는 검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력할 수 있다(S2810). 일 실시예에 따르면, 사용자 인터페이스에 포함된 제1 영역에는 특정 질병과 연관된 유전자 목록이 출력되고, 사용자 인터페이스에 포함된 제2 영역에는 검체의 분석에 의해 획득된 변이에 관한 정보를 시각화하고 탐색하기 위한 제1 브라우저가 출력될 수 있다. 또한, 사용자 인터페이스에 포함된 제3 영역에는 검체의 분석에 의해 획득된 서열 정보를 탐색하기 위한 제2 브라우저가 출력될 수 있다. 일 실시예에 따르면, 제1 브라우저와 제2 브라우저는 서로 연동되어 동작될 수 있다.
그 후, 프로세서는 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 유전 정보 분석 결과에 대한 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력할 수 있다(S2820).
일 실시예에 따르면, 프로세서는 제1 영역에 출력된 유전자 목록 중에서 특정 돌연변이가 발생한 유전자 선택하는 사용자 입력을 수신할 수 있다. 이어서, 프로세서는 특정 돌연변이를 선택하는 사용자 입력에 응답하여, 선택된 특정 돌연변이가 발생한 유전자의 영역이 출력되도록 제1 브라우저를 제어할 수 있다. 또한, 프로세서는 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력에 응답하여 서열 정보 중에서 특정 돌연변이가 발생한 유전자의 영역이 출력되도록 제2 브라우저를 제어할 수 있다.
일 실시예에 따르면, 제2 브라우저에 출력된 영역 내에서 특정 돌연변이의 위치를 나타내는 그래픽 객체가 출력될 수 있다. 프로세서는 그래픽 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 검체에 대한 유전 정보 분석 결과 중 특정 돌연변이에 관한 세부 정보를 제2 브라우저를 통해 출력할 수 있다.
일 실시예에 따르면, 프로세서는 특정 돌연변이가 발생한 유전자와 연관된 전사 모델 목록을 획득하고, 전사 모델 목록에 포함된 복수의 전사 모델 각각의 우선순위에 기초하여, 출력될 타깃 전사 모델을 결정한 후, 결정된 타깃 전사 모델을 통해 전사되어 번역된 결과를 포함하는 아미노산 서열 정보가 출력되도록, 제2 브라우저를 제어할 수 있다.
일 실시예에 따르면, 프로세서는 특정 돌연변이가 발생한 유전자와 연관된 제1 아미노산이 레퍼런스 염기서열로부터 번역된 제2 아미노산과 상이하다고 판정된 경우, 제1 아미노산과 제2 아미노산의 차이를 나타내는 아미노산 변경 정보가 출력되도록 제2 브라우저를 제어할 수 있다. 여기서, 아미노산 변경 정보는 서열 정보 내에서 특정 돌연변이의 위치와 연관하여 출력될 수 있다.
일 실시예에 따르면, 프로세서는 전사 모델 목록이 출력되도록 제2 브라우저를 제어할 수 있다. 이어서, 프로세서는 전사 모델 목록에서 특정 전사 모델을 선택하는 사용자 입력을 수신하는 것에 응답하여, 특정 전사 모델을 통해 전사되어 번역된 결과를 포함하는 아미노산 서열 정보가 출력되도록 제2 브라우저를 제어할 수 있다.
일 실시예에 따르면, 환자 정보에 포함된 질병 코드에 기초하여 특정 질병이 식별되고, 유전자 목록은 검체로부터 발견된 돌연변이들 중에서 특정 질병과 연관된 돌연변이가 발생한 적어도 하나의 유전자를 포함할 수 있다.
특정 질병은 암과 연관된 질병이고, 유전자 목록은 검체로부터 발견된 돌연변이들 중에서 질병의 유발에 관련된 돌연변이가 발생한 적어도 하나의 유전자를 포함하는 제1 드라이버 목록 및 검체로부터 발견된 돌연변이들 중에서 질병의 억제에 관련된 돌연변이가 발생한 적어도 하나의 유전자를 포함하는 제2 드라이버 목록을 포함할 수 있다. 일 실시예에 따르면, 프로세서는 제1 드라이버 목록에 포함된 적어도 하나의 유전자의 레이블을 제1 그래픽 요소를 이용하여 제1 영역에서 시각화하고, 제2 드라이버 목록에 포함된 적어도 하나의 유전자 레이블을 제2 그래픽 요소를 이용하여 제1 영역에서 시각화할 수 있다.
일 실시예에 따르면, 제2 브라우저에 출력된 영역 내에 특정 돌연변이의 위치와 연관된 그래픽 객체가 출력될 수 있다. 또한, 프로세서는 그래픽 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 서열 정보 중에서 특정 돌연변이와 연관된 서열 정보 영역이 확대되어 출력되도록 제2 브라우저를 제어할 수 있다. 확대된 영역에는, 변이가 발생한 염기 또는 아미노산 식별자 중 적어도 하나와 연관된 문자가 디스플레이될 수 있다.
일 실시예에 따르면, 프로세서는 사용자 인터페이스의 제4 영역에 포함된 코멘트 입력란을 통해 사용자의 코멘트를 수신한 후, 검체와 연관된 프로젝트에 참여 중인 적어도 하나의 타 사용자에게 수신된 사용자의 코멘트를 제공할 수 있다.
일 실시예에 따르면, 프로세서는 검체에 대한 종양 변이 부담에 대한 플롯(Plot)과 연관된 제1 정보를 획득하여, 획득된 제1 정보를 사용자 인터페이스의 제5 영역에 출력할 수 있다. 제1 정보는 검체에 대한 단일 염기서열 변이, 검체에 대한 인델 또는 검체에 대한 구조 변이 중 적어도 하나에 대한 종양 변이 부담 통계를 포함할 수 있다.
일 실시예에 따르면, 프로세서는 타 검체에 대한 종양 변이 부담에 대한 플롯과 연관된 제2 정보를 획득하고, 사용자 인터페이스를 통해 제1 정보와 제2 정보를 연관시켜 출력할 수 있다.
일 실시예에 따르면, 프로세서는 검체로부터 발견된 돌연변이들 중에서 특정 돌연변이에 대한 비교를 요청하는 사용자 입력을 수신하는 것에 응답하여, 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 획득할 수 있다. 이어서, 프로세서는 검체로부터 발견된 특정 돌연변이에 대한 세부 정보 및 타 검체로부터 발견된 특정 돌연변이에 대한 세부 정보를 연관시켜 출력할 수 있다.
일 실시예에 따르면, 제1 영역에는 유전자 명칭이 입력되는 입력란이 출력될 수 있다. 프로세서는 입력란을 통해서 입력된 유전자 명칭을 수신하는 것에 응답하여, 수신된 명칭의 유전자를 유전자 목록에 추가할 수 있다.
일 실시예에 따르면, 프로세서는 제1 브라우저를 통해 특정 염색체 또는 특정 유전자를 선택하는 사용자 입력을 수신할 수 있다. 프로세서는 특정 염색체 또는 특정 유전자를 선택하는 사용자 입력에 응답하여, 서열 정보 중에서 선택된 특정 염색체 또는 특정 유전자에 해당하는 영역이 출력되도록 제2 브라우저를 제어할 수 있다. 또한, 프로세서는 특정 염색체 또는 특정 유전자를 선택하는 사용자 입력을 수신하는 것에 응답하여, 특정 염색체 또는 특정 유전자와 연관된 적어도 하나의 염색체에 상응하는 영역만이 출력되도록 제1 브라우저를 제어할 수 있다.
일 실시예에 따르면, 검체로부터 발견된 복수의 돌연변이와 관련된 유전자의 레이블이, 각 유전자의 위치와 연관하여 출력될 수 있다. 가령, 질병의 유발에 관련된 돌연변이와 관련된 유전자의 레이블은 제1 그래픽 요소가 이용되어 시각화되고, 질병의 억제에 관련된 돌연변이와 관련된 유전자의 레이블은 제2 그래픽 요소가 이용되어 시각화될 수 있다. 또한, 질병과 연관된 돌연변이 목록 중에서 검체에서 발견되지 않은 돌연변이와 연관된 유전자의 레이블은 제1 브라우저를 통해 제3 그래픽 요소가 이용되어 시각화될 수 있다.
일 실시예에 따르면, 검체로부터 발견된 각 구조 변이는 제1 브라우저를 통해 구조 돌연변이 개수와 상응하는 개수의 그래픽 객체가 이용되어 시각화될 수 있다. 제1 브라우저는 표현하고자 하는 타깃 구조 변이의 유형에 기초하여 그래픽 객체의 형태, 색상 또는 크기 중 적어도 하나를 결정할 수 있다. 그래픽 객체는 제1 브라우저를 통해 타깃 구조 변이의 영역과 상응하는 범위로 시각화될 수 있다.
일 실시예에 따르면, 프로세서는 임계치 이상 개수의 그래픽 객체들이 임계거리에 포함되어 위치하는지 여부를 판정할 수 있다.
예컨대, 프로세서는 임계치 이상 개수의 그래픽 객체들이 임계거리에 포함되어 위치하고 임계거리에 포함된 특정 그래픽 객체에 포인터가 위치한다고 판정하는 것에 응답하여, 포인터가 위치한 특정 그래픽 객체가 강조되어 시각화되도록 제1 브라우저를 제어할 수 있다. 추가적으로 또는 대안적으로, 프로세서는 임계거리 내에 포함된 그래픽 객체들 중에서, 포인터가 위치한 특정 그래픽 객체를 제외한 다른 그래픽 객체가 제거되거나 흐리게 되도록 제1 브라우저를 제어할 수 있다.
다른 예로서, 프로세서는 임계치 이상 개수의 그래픽 객체들이 임계거리 내에 포함된다고 판정하는 것에 응답하여, 임계거리 내에 포함되어 위치한 그래픽 객체들이 미리 설정된 시간 간격으로 로테이션되면서 강조되어 시각화되도록 제1 브라우저를 제어할 수 있다.
또 다른 예로서, 프로세서는 임계치 이상 개수의 그래픽 객체들이 임계거리에 포함된다고 판정하는 것에 응답하여, 임계거리를 포함하는 영역을 밀집 영역으로 결정하고, 포인터가 밀집 영역에 위치하는 것이 감지되는 경우, 밀집 영역이 확대되도록 제1 브라우저를 제어할 수 있다. 프로세서는 밀집 영역이 제4 그래픽 요소를 이용하여 시각화되도록 제1 브라우저를 제어할 수 있다. 또한, 프로세서는 밀집 영역에 포함된 그래픽 객체를 선택하는 사용자 입력이 수신되는지 여부를 판정한 후, 미리 결정된 시간 동안에 밀집 영역에 포함된 그래픽 객체를 선택하는 사용자 입력이 수신되지 않는다고 판정하는 것에 응답하여, 확대된 밀집 영역이 원래의 크기로 축소되도록 제1 브라우저를 제어할 수 있다. 프로세서는 밀집 영역이 확대된 후에, 포인터가 밀집 영역에 벗어나는 것이 감지되는 경우, 확대된 밀집 영역이 원래의 크기로 축소되도록 제1 브라우저를 제어할 수 있다.
일 실시예에 따르면, 프로세서는 제1 브라우저를 통해 복수의 염색체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 선택된 복수 염색체와 연관된 정보가 출력되도록 제1 브라우저를 제어할 수 있다. 이 경우, 제1 브라우저는 선택된 염색체 개수와 상응하는 개수로 정보 출력 영역을 분할하고, 선택된 복수의 염색체 각각과 연관된 정보를 분할된 화면에 출력할 수 있다.
일 실시예에 따르면, 제1 브라우저에는 적어도 하나의 구조 변이에 대한 정보가 출력되고, 프로세서는 제1 브라우저를 특정 구조 변이를 선택하는 사용자 입력을 수신하는 것에 응답하여, 선택된 특정 구조 변이가 발견된 적어도 하나의 염색체와 연관된 정보만이 출력되도록 제1 브라우저를 제어할 수 있다.
일 실시예에 따르면, 사용자 인터페이스에는, 변이 유형별 필터 객체가 출력될 수 있다. 프로세서는 출력된 변이 유형별 필터 객체 중에서 적어도 하나의 필터 객체를 선택하는 사용자 입력을 수신하고, 적어도 하나의 필터 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 획득된 변이에 관한 정보 중에서 선택된 필터 객체와 상응하는 변이에 관한 정보만이 선별되어 출력되도록 제1 브라우저를 제어할 수 있다.
상술한 흐름도 및 상술한 설명은 일 예시일 뿐이며, 일부 실시예에서는 다르게 구현될 수 있다. 예를 들어, 일부 실시예에서는 각 단계의 순서가 바뀌거나, 일부 단계가 반복 수행되거나, 일부 단계가 생략되거나, 일부 단계가 추가될 수 있다.
상술한 방법은 컴퓨터에서 실행하기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램으로 제공될 수 있다. 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일수도 있다. 또한, 매체는 단일 또는 수개 하드웨어가 결합된 형태의 다양한 기록 수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 애플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.
본 개시의 방법, 동작 또는 기법들은 다양한 수단에 의해 구현될 수도 있다. 예를 들어, 이러한 기법들은 하드웨어, 펌웨어, 소프트웨어, 또는 이들의 조합으로 구현될 수도 있다. 본원의 개시와 연계하여 설명된 다양한 예시적인 논리적 블록들, 모듈들, 회로들, 및 알고리즘 단계들은 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양자의 조합들로 구현될 수도 있음을 통상의 기술자들은 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 대체를 명확하게 설명하기 위해, 다양한 예시적인 구성요소들, 블록들, 모듈들, 회로들, 및 단계들이 그들의 기능적 관점에서 일반적으로 위에서 설명되었다. 그러한 기능이 하드웨어로서 구현되는지 또는 소프트웨어로서 구현되는 지의 여부는, 특정 애플리케이션 및 전체 시스템에 부과되는 설계 요구사항들에 따라 달라진다. 통상의 기술자들은 각각의 특정 애플리케이션을 위해 다양한 방식들로 설명된 기능을 구현할 수도 있으나, 그러한 구현들은 본 개시의 범위로부터 벗어나게 하는 것으로 해석되어서는 안 된다.
하드웨어 구현에서, 기법들을 수행하는 데 이용되는 프로세싱 유닛들은, 하나 이상의 ASIC들, DSP들, 디지털 신호 프로세싱 디바이스들(digital signal processing devices; DSPD들), 프로그램가능 논리 디바이스들(programmable logic devices; PLD들), 필드 프로그램가능 게이트 어레이들(field programmable gate arrays; FPGA들), 프로세서들, 제어기들, 마이크로제어기들, 마이크로프로세서들, 전자 디바이스들, 본 개시에 설명된 기능들을 수행하도록 설계된 다른 전자 유닛들, 컴퓨터, 또는 이들의 조합 내에서 구현될 수도 있다.
따라서, 본 개시와 연계하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 및 회로들은 범용 프로세서, DSP, ASIC, FPGA나 다른 프로그램 가능 논리 디바이스, 이산 게이트나 트랜지스터 로직, 이산 하드웨어 컴포넌트들, 또는 본원에 설명된 기능들을 수행하도록 설계된 것들의 임의의 조합으로 구현되거나 수행될 수도 있다. 범용 프로세서는 마이크로프로세서일 수도 있지만, 대안으로, 프로세서는 임의의 종래의 프로세서, 제어기, 마이크로제어기, 또는 상태 머신일 수도 있다. 프로세서는 또한, 컴퓨팅 디바이스들의 조합, 예를 들면, DSP와 마이크로프로세서, 복수의 마이크로프로세서들, DSP 코어와 연계한 하나 이상의 마이크로프로세서들, 또는 임의의 다른 구성의 조합으로서 구현될 수도 있다.
펌웨어 및/또는 소프트웨어 구현에 있어서, 기법들은 랜덤 액세스 메모리(random access memory; RAM), 판독 전용 메모리(read-only memory; ROM), 비휘발성 RAM(non-volatile random access memory; NVRAM), PROM(programmable read-only memory), EPROM(erasable programmable read-only memory), EEPROM(electrically erasable PROM), 플래시 메모리, 컴팩트 디스크(compact disc; CD), 자기 또는 마킹 데이터 스토리지 디바이스 등과 같은 컴퓨터 판독가능 매체 상에 저장된 명령들로서 구현될 수도 있다. 명령들은 하나 이상의 프로세서들에 의해 실행 가능할 수도 있고, 프로세서(들)로 하여금 본 개시에 설명된 기능의 특정 양태들을 수행하게 할 수도 있다.
소프트웨어로 구현되는 경우, 상술된 기법들은 하나 이상의 명령들 또는 코드로서 컴퓨터 판독 가능한 매체 상에 저장되거나 또는 컴퓨터 판독 가능한 매체를 통해 전송될 수도 있다. 컴퓨터 판독가능 매체들은 한 장소에서 다른 장소로 컴퓨터 프로그램의 전송을 용이하게 하는 임의의 매체를 포함하여 컴퓨터 저장 매체들 및 통신 매체들 양자를 포함한다. 저장 매체들은 컴퓨터에 의해 액세스될 수 있는 임의의 이용 가능한 매체들일 수도 있다. 비제한적인 예로서, 이러한 컴퓨터 판독가능 매체는 RAM, ROM, EEPROM, CD-ROM 또는 다른 광학 디스크 스토리지, 자기 디스크 스토리지 또는 다른 자기 스토리지 디바이스들, 또는 소망의 프로그램 코드를 명령들 또는 데이터 구조들의 형태로 이송 또는 저장하기 위해 사용될 수 있으며 컴퓨터에 의해 액세스될 수 있는 임의의 다른 매체를 포함할 수 있다. 또한, 임의의 접속이 컴퓨터 판독가능 매체로 적절히 칭해진다.
예를 들어, 소프트웨어가 동축 케이블, 광섬유 케이블, 연선, 디지털 가입자 회선 (DSL), 또는 적외선, 무선, 및 마이크로파와 같은 무선 기술들을 사용하여 웹사이트, 서버, 또는 다른 원격 소스로부터 전송되면, 동축 케이블, 광섬유 케이블, 연선, 디지털 가입자 회선, 또는 적외선, 무선, 및 마이크로파와 같은 무선 기술들은 매체의 정의 내에 포함된다. 본원에서 사용된 디스크(disk) 와 디스크(disc)는, CD, 레이저 디스크, 광 디스크, DVD(digital versatile disc), 플로피디스크, 및 블루레이 디스크를 포함하며, 여기서 디스크들(disks)은 보통 자기적으로 데이터를 재생하고, 반면 디스크들(discs)은 레이저를 이용하여 광학적으로 데이터를 재생한다. 위의 조합들도 컴퓨터 판독가능 매체들의 범위 내에 포함되어야 한다.
소프트웨어 모듈은, RAM 메모리, 플래시 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터들, 하드 디스크, 이동식 디스크, CD-ROM, 또는 공지된 임의의 다른 형태의 저장 매체 내에 상주할 수도 있다. 예시적인 저장 매체는, 프로세가 저장 매체로부터 정보를 판독하거나 저장 매체에 정보를 기록할 수 있도록, 프로세서에 연결될 수 있다. 대안으로, 저장 매체는 프로세서에 통합될 수도 있다. 프로세서와 저장 매체는 ASIC 내에 존재할 수도 있다. ASIC은 유저 단말 내에 존재할 수도 있다. 대안으로, 프로세서와 저장 매체는 유저 단말에서 개별 구성요소들로서 존재할 수도 있다.
이상 설명된 실시예들이 하나 이상의 독립형 컴퓨터 시스템에서 현재 개시된 주제의 양태들을 활용하는 것으로 기술되었으나, 본 개시는 이에 한정되지 않고, 네트워크나 분산 컴퓨팅 환경과 같은 임의의 컴퓨팅 환경과 연계하여 구현될 수도 있다. 또 나아가, 본 개시에서 주제의 양상들은 복수의 프로세싱 칩들이나 장치들에서 구현될 수도 있고, 스토리지는 복수의 장치들에 걸쳐 유사하게 영향을 받게 될 수도 있다. 이러한 장치들은 PC들, 네트워크 서버들, 및 휴대용 장치들을 포함할 수도 있다.
본 명세서에서는 본 개시가 일부 실시예들과 관련하여 설명되었지만, 본 개시의 발명이 속하는 기술분야의 통상의 기술자가 이해할 수 있는 본 개시의 범위를 벗어나지 않는 범위에서 다양한 변형 및 변경이 이루어질 수 있다. 또한, 그러한 변형 및 변경은 본 명세서에 첨부된 특허청구의 범위 내에 속하는 것으로 생각되어야 한다.

Claims (18)

  1. 적어도 하나의 프로세서에 의해서 수행되는 유전 정보 분석 결과 제공 방법에 있어서,
    검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력하는 단계; 및
    상기 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 상기 유전 정보 분석 결과의 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계
    를 포함하고,
    상기 사용자 인터페이스에 포함된 제1 영역에는, 특정 질병과 연관된 유전자 목록이 출력되고,
    상기 사용자 인터페이스에 포함된 제2 영역에는, 상기 검체의 분석에 의해 획득된 변이(variant)에 관한 정보를 시각화하고(visualize) 탐색하기 위한 제1 브라우저가 출력되고,
    상기 사용자 인터페이스에 포함된 제3 영역에는, 상기 검체의 분석에 의해 획득된 서열 정보(sequence)를 탐색하기 위한 제2 브라우저가 출력되는,
    유전 정보 분석 결과 제공 방법.
  2. 제1항에 있어서,
    상기 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는,
    상기 제1 영역에 출력된 유전자 목록 중에서 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력을 수신하는 단계;
    상기 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력에 응답하여, 상기 특정 돌연변이가 발생한 유전자의 영역이 출력되도록 상기 제1 브라우저를 제어하는 단계; 및
    상기 특정 돌연변이가 발생한 유전자를 선택하는 사용자 입력에 응답하여, 상기 서열 정보 중에서 상기 특정 돌연변이가 발생한 유전자의 영역이 출력되도록 상기 제2 브라우저를 제어하는 단계
    를 포함하는, 유전 정보 분석 결과 제공 방법.
  3. 제2항에 있어서,
    상기 제2 브라우저를 제어하는 단계는,
    상기 제2 브라우저에 출력된 영역 내에서 상기 특정 돌연변이의 위치를 나타내는 그래픽 객체를 출력하는 단계를 포함하고,
    상기 방법은,
    상기 제2 브라우저를 제어하는 단계 이후에, 상기 그래픽 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 상기 검체에 대한 유전 정보 분석 결과 중 상기 특정 돌연변이에 관한 세부 정보를 상기 제2 브라우저를 통해 출력하는 단계
    를 더 포함하는, 유전 정보 분석 결과 제공 방법.
  4. 제2항에 있어서,
    상기 제2 브라우저를 제어하는 단계는,
    상기 특정 돌연변이가 발생한 유전자와 연관된 전사 모델(transcription model) 목록을 획득하는 단계;
    상기 전사 모델 목록에 포함된 복수의 전사 모델 각각의 우선순위에 기초하여, 출력될 타깃 전사 모델을 결정하는 단계; 및
    상기 결정된 타깃 전사 모델을 통해 전사되어 번역된 결과를 포함하는 아미노산 서열 정보가 출력되도록, 상기 제2 브라우저를 제어하는 단계
    를 포함하는, 유전 정보 분석 결과 제공 방법.
  5. 제2항에 있어서,
    상기 제2 브라우저를 제어하는 단계는,
    상기 특정 돌연변이가 발생한 유전자와 연관된 제1 아미노산이 레퍼런스 염기서열로부터 번역된 제2 아미노산과 상이하다고 판정된 경우, 상기 제1 아미노산과 상기 제2 아미노산의 차이를 나타내는 아미노산 변경 정보가 출력되도록 상기 제2 브라우저를 제어하는 단계를 포함하고,
    상기 아미노산 변경 정보는, 상기 서열 정보 내에서 상기 특정 돌연변이의 위치와 연관하여 출력되는, 유전 정보 분석 결과 제공 방법.
  6. 제1항에 있어서,
    상기 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는,
    전사 모델 목록이 출력되도록 상기 제2 브라우저를 제어하는 단계;
    상기 전사 모델 목록에서 특정 전사 모델을 선택하는 사용자 입력을 수신하는 단계; 및
    상기 특정 전사 모델을 통해 전사되어 번역된 결과를 포함하는 아미노산 서열 정보가 출력되도록, 상기 제2 브라우저를 제어하는 단계
    를 포함하는, 유전 정보 분석 결과 제공 방법.
  7. 제1항에 있어서,
    환자 정보에 포함된 질병 코드에 기초하여, 상기 특정 질병이 식별되고,
    상기 유전자 목록은, 상기 검체로부터 발견된 돌연변이들 중에서, 상기 특정 질병과 연관된 돌연변이가 발생한 적어도 하나의 유전자를 포함하는, 유전 정보 분석 결과 제공 방법.
  8. 제1항에 있어서,
    상기 유전자 목록은, 상기 검체로부터 발견된 돌연변이들 중에서 질병의 유발에 관련된 돌연변이가 발생된 적어도 하나의 유전자를 포함하는 제1 드라이버 목록 및 상기 검체로부터 발견된 돌연변이들 중에서 질병의 억제에 관련된 돌연변이가 발생한 적어도 하나의 유전자를 포함하는 제2 드라이버 목록을 포함하는, 유전 정보 분석 결과 제공 방법.
  9. 제8항에 있어서,
    상기 제1 드라이버 목록에 포함된 적어도 하나의 유전자의 레이블은 제1 그래픽 요소가 이용되어 상기 제1 영역에서 시각화되고, 상기 제2 드라이버 목록에 포함된 적어도 하나의 유전자 레이블은 제2 그래픽 요소가 이용되어 상기 제1 영역에서 시각화되는, 유전 정보 분석 결과 제공 방법.
  10. 제1항에 있어서,
    상기 제2 브라우저에 출력된 영역 내에 특정 돌연변이의 위치와 연관된 그래픽 객체가 출력되고,
    상기 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는,
    상기 그래픽 객체를 선택하는 사용자 입력을 수신하는 것에 응답하여, 상기 서열 정보 중에서 상기 특정 돌연변이와 연관된 서열 정보 영역이 확대되어 출력되도록 상기 제2 브라우저를 제어하는 단계
    를 포함하는, 유전 정보 분석 결과 제공 방법.
  11. 제10항에 있어서,
    상기 확대된 서열 정보 영역에는, 변이가 발생한 염기(base) 또는 아미노산 식별자 중 적어도 하나와 연관된 문자가 디스플레이되는, 유전 정보 분석 결과 제공 방법.
  12. 제1항에 있어서,
    상기 사용자 인터페이스의 제4 영역에 포함된 코멘트 입력란을 통해 사용자의 코멘트를 수신하는 단계; 및
    상기 검체와 연관된 프로젝트에 참여 중인 적어도 하나의 타 사용자에게 상기 수신된 사용자의 코멘트를 제공하는 단계
    를 더 포함하는, 유전 정보 분석 결과 제공 방법.
  13. 제1항에 있어서,
    상기 검체에 대한 종양 변이 부담에 대한 플롯(Plot)과 연관된 제1 정보가 상기 사용자 인터페이스의 제5 영역을 통해 출력되고,
    상기 제1 정보는 상기 검체에 대한 단일 염기서열 변이(Single Nucleotide Variation), 상기 검체에 대한 인델(indel) 또는 상기 검체에 대한 구조 변이(SV: Structural Variants) 중 적어도 하나에 대한 종양 변이 부담 통계를 포함하는, 유전 정보 분석 결과 제공 방법.
  14. 제13항에 있어서,
    상기 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는,
    타 검체에 대한 종양 변이 부담에 대한 플롯과 연관된 제2 정보를 획득하는 단계; 및
    상기 제1 정보와 상기 제2 정보를 연관시켜 출력하는 단계
    를 포함하는, 유전 정보 분석 결과 제공 방법.
  15. 제1항에 있어서,
    상기 반응형 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하는 단계는,
    상기 검체로부터 발견된 돌연변이들 중에서 특정 돌연변이에 대한 비교를 요청하는 사용자 입력을 수신하는 단계;
    타 검체로부터 발견된 상기 특정 돌연변이에 대한 세부 정보를 획득하는 단계; 및
    상기 검체로부터 발견된 상기 특정 돌연변이에 대한 세부 정보 및 상기 타 검체로부터 발견된 상기 특정 돌연변이에 대한 세부 정보를 연관시켜 출력하는 단계
    를 더 포함하는, 유전 정보 분석 결과 제공 방법.
  16. 제1항에 있어서,
    상기 제1 영역에는 유전자 명칭이 입력되는 입력란이 출력되고,
    상기 방법은,
    상기 입력란을 통해서 입력된 유전자 명칭을 수신하는 단계; 및
    상기 수신된 명칭의 유전자를 상기 유전자 목록에 추가하는 단계
    를 더 포함하는, 유전 정보 분석 결과 제공 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 따른 방법을 컴퓨터에서 실행하기 위해 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램.
  18. 컴퓨팅 장치로서,
    메모리; 및
    상기 메모리와 연결되고, 상기 메모리에 포함된 컴퓨터 판독 가능한 적어도 하나의 프로그램을 실행하도록 구성된 적어도 하나의 프로세서
    를 포함하고,
    상기 적어도 하나의 프로그램은,
    검체에 대한 유전 정보 분석 결과를 제공하기 위한 사용자 인터페이스를 출력하고, 상기 사용자 인터페이스를 통해 수신된 사용자 입력에 응답하여, 상기 유전 정보 분석 결과의 세부 정보를 포함하는 반응형(interactive) 응답 정보를 사용자 인터페이스에 포함된 적어도 하나의 영역에 출력하기 위한 명령어들을 포함하고,
    상기 사용자 인터페이스에 포함된 제1 영역에는, 특정 질병과 연관된 유전자 목록이 출력되고,
    상기 사용자 인터페이스에 포함된 제2 영역에는, 상기 검체의 분석에 의해 획득된 변이(variant)에 관한 정보를 시각화하고(visualize) 탐색하기 위한 제1 브라우저가 출력되고,
    상기 사용자 인터페이스에 포함된 제3 영역에는, 상기 검체의 분석에 의해 획득된 서열 정보(sequence)를 탐색하기 위한 제2 브라우저가 출력되는, 컴퓨팅 장치.
PCT/KR2023/010796 2022-09-05 2023-07-26 유전 정보 분석 결과 제공 방법 및 시스템 WO2024053860A1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2022-0112416 2022-09-05
KR20220112416 2022-09-05
KR1020220167819A KR102623609B1 (ko) 2022-09-05 2022-12-05 유전 정보 분석 결과 제공 방법 및 시스템
KR10-2022-0167819 2022-12-05

Publications (1)

Publication Number Publication Date
WO2024053860A1 true WO2024053860A1 (ko) 2024-03-14

Family

ID=87933636

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/010796 WO2024053860A1 (ko) 2022-09-05 2023-07-26 유전 정보 분석 결과 제공 방법 및 시스템

Country Status (4)

Country Link
US (1) US20240079094A1 (ko)
EP (1) EP4332974A1 (ko)
KR (1) KR20240033688A (ko)
WO (1) WO2024053860A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120042060A (ko) * 2010-10-22 2012-05-03 삼성에스디에스 주식회사 유전 정보를 표시하는 시스템 및 방법
KR101967248B1 (ko) * 2012-08-16 2019-04-10 삼성전자주식회사 개인의 유전 정보를 분석하는 방법 및 장치
KR20210094783A (ko) * 2020-01-22 2021-07-30 가톨릭대학교 산학협력단 Ngs 분석에서의 질병 관련 유전자 선별 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120042060A (ko) * 2010-10-22 2012-05-03 삼성에스디에스 주식회사 유전 정보를 표시하는 시스템 및 방법
KR101967248B1 (ko) * 2012-08-16 2019-04-10 삼성전자주식회사 개인의 유전 정보를 분석하는 방법 및 장치
KR20210094783A (ko) * 2020-01-22 2021-07-30 가톨릭대학교 산학협력단 Ngs 분석에서의 질병 관련 유전자 선별 방법 및 장치

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PEARCE THOMAS M., NIKIFOROVA MARINA N., ROY SOMAK: "Interactive Browser-Based Genomics Data Visualization Tools for Translational and Clinical Laboratory Applications", THE JOURNAL OF MOLECULAR DIAGNOSTICS, AMERICAN SOCIETY FOR INVESTIGATIVE PATHOLOGY AND THE ASSOCIATION FOR MOLECULAR PATHOLOGY, vol. 21, no. 6, 1 November 2019 (2019-11-01), pages 985 - 993, XP093082444, ISSN: 1525-1578, DOI: 10.1016/j.jmoldx.2019.06.005 *
SHIN JAEMOON, JEON JUNBEOM, JUNG DAWOON, KIM KIYONG, KIM YUN JOONG, JEONG DONG-HOON, YOON JEEHEE: "PhenGenVar: A User-Friendly Genetic Variant Detection and Visualization Tool for Precision Medicine", JOURNAL OF PERSONALIZED MEDICINE, vol. 12, no. 959, pages 1 - 11, XP093082442, DOI: 10.3390/jpm12060959 *

Also Published As

Publication number Publication date
US20240079094A1 (en) 2024-03-07
EP4332974A1 (en) 2024-03-06
KR20240033688A (ko) 2024-03-12

Similar Documents

Publication Publication Date Title
WO2014088342A1 (en) Display device and method of controlling the same
WO2019027259A1 (en) APPARATUS AND METHOD FOR PROVIDING SUMMARY INFORMATION USING ARTIFICIAL INTELLIGENCE MODEL
WO2017095040A1 (en) User terminal device and displaying method thereof
WO2014046440A1 (en) User terminal device and network server apparatus for providing evaluation information and methods thereof
EP3602334A1 (en) Apparatus and method for providing summarized information using an artificial intelligence model
WO2016018039A1 (en) Apparatus and method for providing information
WO2015030564A1 (en) Display apparatus, portable device and screen display methods thereof
WO2016093518A1 (en) Method and apparatus for arranging objects according to content of background image
WO2016137167A1 (en) Terminal
WO2015026122A1 (en) User terminal device for displaying map and method thereof
WO2012043932A1 (ko) 키보드 제어 장치 및 그 방법
WO2014046493A1 (en) User terminal device and display method thereof
WO2013085334A1 (en) User terminal device and method for displaying background screen thereof
WO2017105018A1 (en) Electronic apparatus and notification displaying method for electronic apparatus
WO2014129864A1 (en) An apparatus for providing a cursor in electronic devices and a method thereof
WO2016208920A1 (en) Input device, electronic apparatus for receiving signal from input device and controlling method thereof
WO2020180034A1 (ko) 사용자 선택 기반의 정보를 제공하는 방법 및 장치
WO2018056642A2 (en) Electronic device and method thereof for managing applications
EP4004695A1 (en) Electronic apparatus and controlling method thereof
WO2016140393A1 (ko) 이동 단말기 및 그의 동작 방법
WO2017065582A1 (en) Electronic device sharing content with an external device and method for sharing content thereof
WO2019135553A1 (en) Electronic device, control method thereof, and computer readable recording medium
WO2017069548A1 (ko) 복잡계 네트워크에서의 집합 관계 분석 시각화 장치 및 그 방법
WO2013119007A1 (ko) 아이디어 휠 기반의 데이터 생성 장치
WO2024053860A1 (ko) 유전 정보 분석 결과 제공 방법 및 시스템

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23863341

Country of ref document: EP

Kind code of ref document: A1