WO2023048481A1 - 인공지능을 이용한 원발부위불명암 진단 방법 - Google Patents

인공지능을 이용한 원발부위불명암 진단 방법 Download PDF

Info

Publication number
WO2023048481A1
WO2023048481A1 PCT/KR2022/014191 KR2022014191W WO2023048481A1 WO 2023048481 A1 WO2023048481 A1 WO 2023048481A1 KR 2022014191 W KR2022014191 W KR 2022014191W WO 2023048481 A1 WO2023048481 A1 WO 2023048481A1
Authority
WO
WIPO (PCT)
Prior art keywords
gene expression
expression pattern
tissue
pattern information
cancer
Prior art date
Application number
PCT/KR2022/014191
Other languages
English (en)
French (fr)
Inventor
이용흔
김이랑
강지훈
Original Assignee
주식회사 온코크로스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220059550A external-priority patent/KR20230043664A/ko
Application filed by 주식회사 온코크로스 filed Critical 주식회사 온코크로스
Priority to US18/278,887 priority Critical patent/US20240062851A1/en
Publication of WO2023048481A1 publication Critical patent/WO2023048481A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Definitions

  • the present invention relates to a method for diagnosing cancer of unknown primary site using artificial intelligence, and more particularly, detects the primary site of cancer using information on the gene expression level in tissues where cancer has metastasized, but excludes the effect of gene expression in metastatic tissues. It relates to a method for diagnosing cancer of unknown primary site using artificial intelligence, which can further improve the accuracy of diagnosis by doing so.
  • a tumor in a state in which the tumor does not stop at a certain size and constantly proliferates and invades surrounding normal cells is defined as a malignant tumor, that is, cancer.
  • Cancer can be divided into primary cancer, in which cancer cell tissues first settle down, and metastatic cancer, which is generated in other organs by moving cancer cells from the primary organ along blood vessels or lymphatic vessels.
  • the primary site can be identified through pathological examination of the sample, but in some cases, the primary site cannot be identified even after immunohistochemical staining, molecular genetic testing, and tumor marker testing are performed. It is called CUP (Carcinoma of Unknown Primary).
  • the primary site of cancer of unknown primary site by using the gene expression pattern of a sample collected from the lesion site.
  • the primary site in the state in which specific gene expression patterns appearing for each primary cancer are learned, the primary site can be specified by comparing the learned specific gene expression pattern for each primary cancer with the gene expression information of the sample obtained from the lesion site.
  • the diagnosis method using gene expression pattern information has the advantage of relatively accurately diagnosing the primary site when accurate gene expression patterns are obtained from metastatic cancer tissue, but gene expression information includes gene expression patterns and metastasis caused by primary cancer. There was a problem in that it was difficult to obtain an accurate gene expression pattern in the sample because gene expression patterns derived from the tissue itself were mixed.
  • the present invention has been made to solve the above problems, and provides a method for diagnosing cancer of unknown primary site using artificial intelligence that can specify a primary site using gene expression pattern information of a sample obtained from metastatic cancer tissue.
  • An object of the present invention is to provide a method for diagnosing cancer of unknown primary site using artificial intelligence capable of isolating only gene expression patterns resulting from primary cancer from samples obtained from metastatic cancer tissue.
  • a method for diagnosing cancer of unknown primary site using artificial intelligence includes generating gene expression pattern information of a sample taken from a tissue in which metastasis has occurred, the metastatic cancer removing the gene expression pattern information derived from the previously learned tissue from the gene expression pattern information of the sample collected from the tissue where the gene expression pattern information from the tissue was removed and the previously learned gene expression pattern information Comparing gene expression pattern information for each cancer type and specifying a primary site of a sample collected from a tissue in which the metastatic cancer has occurred.
  • the sample collected from the tissue in which the metastasis has occurred may include normal tissue and cancer tissue of the organ in which the metastasis has occurred.
  • the tissue-derived gene expression pattern information may be specific gene expression pattern information expressed in normal tissues of an organ.
  • the gene expression pattern information for each cancer type may be specific gene expression pattern information expressed in a cancer tissue of which a primary site is specified.
  • the step of removing gene expression pattern information derived from the pre-learned tissue from the gene expression pattern information of the sample collected from the metastatic cancer-generated tissue may include the metastatic cancer-generated tissue Converting the gene expression pattern information of the sample taken from the sample into a first vector Converting the gene expression pattern information derived from the tissue into a second vector and performing a difference operation of the second vector with respect to the first vector steps may be included.
  • the step of specifying the primary site of the sample collected from the metastatic cancer tissue may include specifying at least one of a plurality of pre-learned primary sites.
  • the step of specifying the primary site of the sample collected from the metastatic cancer tissue may include outputting a probability value for each primary site.
  • the gene expression pattern information of the sample collected from the metastatic cancer tissue, the gene expression pattern information derived from the tissue, and the gene expression pattern information derived from the tissue are removed.
  • Pattern information may be RNA sequence information.
  • the RNA sequence information may be mRNA sequence information.
  • an apparatus for diagnosing cancer of unknown primary site using artificial intelligence includes a memory storing one or more instructions and executing the stored one or more instructions to collect metastatic cancer from tissue.
  • An operation of generating gene expression pattern information of one sample, an operation of removing gene expression pattern information derived from a pre-learned tissue from gene expression pattern information of a sample collected from a tissue in which metastasis has occurred Includes a processor that performs an operation of comparing the gene expression pattern information from which the gene expression pattern information has been removed with the previously learned gene expression pattern information for each cancer type and an operation of specifying a primary site of a sample collected from a tissue in which the metastatic cancer has occurred do.
  • FIG. 1 is an exemplary diagram for explaining an apparatus 100 for diagnosing cancer of unknown primary site using artificial intelligence according to an embodiment of the present invention.
  • FIG. 2 is a flowchart illustrating a method for diagnosing cancer of unknown primary site using artificial intelligence according to an embodiment of the present invention.
  • FIG. 3 is a diagram for explaining a gene expression pattern of a sample obtained from metastatic cancer tissue according to an embodiment of the present invention.
  • FIG. 4 is a diagram for explaining gene expression pattern information learned by an apparatus for diagnosing primary cancer of unknown primary site using artificial intelligence according to an embodiment of the present invention.
  • FIG. 5 is a conceptual diagram for explaining a method for specifying a primary site of cancer of unknown primary site by acquiring gene expression pattern information resulting from cancer occurring at the primary site according to an embodiment of the present invention.
  • FIG. 6 is a diagram for explaining a method of performing a difference operation between gene expression patterns represented by feature vectors according to an embodiment of the present invention.
  • FIG. 7 is a diagram visualizing pre-learned gene expression pattern information for each tissue according to an embodiment of the present invention.
  • FIGS. 8 and 9 are diagrams for comparing gene expression patterns before and after excluding gene expression patterns derived from tissues in which metastasis occurred.
  • first, second, A, B, (a), and (b) may be used. These terms are only used to distinguish the component from other components, and the nature, sequence, or order of the corresponding component is not limited by the term.
  • gene expression pattern information means various types of data related to gene expression. For example, it may mean data on transcripts, proteomes, and the like. Or data on DNA sequence information, RNA sequence information, RNA or DNA expression level, expression ratio, expression position, expression distribution, etc. may be included.
  • FIG. 1 is an exemplary diagram for explaining an apparatus 100 for diagnosing cancer of unknown primary site using artificial intelligence according to an embodiment of the present invention.
  • the apparatus 100 for diagnosing cancer of unknown primary site using artificial intelligence receives gene expression pattern information by cancer type and gene expression pattern information by tissue as learning data, and queries. As data, gene expression pattern information of samples obtained from metastatic cancer tissue is input.
  • Gene expression pattern information for each type of cancer means gene expression pattern information of a cancer tissue in which a primary site is specified.
  • it means a gene expression pattern of a sample obtained from a cancer tissue whose primary site is the liver, a gene expression pattern of a sample obtained from a cancer tissue whose primary site is the lung, and the like.
  • the gene expression pattern may be RNA sequence information, more specifically, mRNA sequence information.
  • Tissue-specific gene expression pattern information refers to gene expression pattern information derived from long-term tissues. Different combinations of genes are expressed in various organs constituting the body, so gene expression pattern information is different for each tissue. Tissue-specific gene expression patterns may also be RNA sequence information, more specifically, mRNA sequence information.
  • receiving gene expression pattern information for each cancer type and gene expression pattern information for each tissue as learning data means receiving input of a plurality of gene expression pattern information in which the primary site is labeled.
  • the gene expression pattern information labeled with the primary site is GEO (Gene Expression Omnibus), Array Express, TCGA (The Cancer Genome Atlas Program), ICGs (Iterative Clustering and Guide-Gene selection), GTEx ( It may be data crawled from databases such as Genotype Tissue Expression).
  • GEO Gene Expression Omnibus
  • Array Express Array Express
  • TCGA Cancer Genome Atlas Program
  • ICGs Iterative Clustering and Guide-Gene selection
  • GTEx It may be data crawled from databases such as Genotype Tissue Expression.
  • the apparatus 100 for diagnosing cancer of unknown primary site using artificial intelligence uses labeled learning data to determine gene expression patterns of cancers whose primary sites are specified and genes derived from tissues in which metastases have occurred. Characteristics of the expression pattern are derived.
  • the resulting value according to an embodiment of the present invention may be output in the form of specifying at least one of a plurality of learned primary parts or outputting a probability value for each primary part.
  • the primary site of the metastatic cancer is output in the form of "liver", or the probability that the primary site is "liver” is X%, The probability of being "lung” can be output as Y% or the like.
  • FIG. 1 illustrates an example in which the apparatus 100 for diagnosing primary cancer of unknown primary site using artificial intelligence is implemented as a single computing device
  • the apparatus 100 for diagnosing primary cancer of unknown primary region using artificial intelligence is physically or logically It may be implemented as a plurality of computing devices separated by .
  • a first function of the apparatus 100 for diagnosing cancer of unknown primary site using artificial intelligence may be implemented in a first computing device and a second function may be implemented in a second computing device.
  • a specific function of the apparatus 100 for diagnosing cancer of unknown primary site using artificial intelligence may be implemented in a plurality of computing devices.
  • FIG. 2 is a flowchart illustrating a method for diagnosing cancer of unknown primary site using artificial intelligence according to an embodiment of the present invention.
  • each step is performed in the apparatus 100 for diagnosing cancer of unknown primary site using artificial intelligence.
  • a sample taken from a tissue in which metastasis has occurred may include normal tissue and cancer tissue of an organ in which metastasis has occurred.
  • gene expression pattern information may be obtained by performing transcriptional genome sequencing on the sample.
  • gene expression pattern information according to an embodiment of the present invention may be RNA sequence information, more specifically, mRNA sequence information.
  • the gene expression pattern information derived from the pre-learned tissue is removed from the gene expression pattern information of the sample collected from the metastatic cancer tissue (S220).
  • tissue-derived gene expression pattern information refers to gene expression pattern information specifically expressed in a tissue in which metastasis has occurred.
  • the organ in which metastasis has occurred is "lung"
  • gene expression pattern information originating from a tissue is removed from gene expression pattern information of a sample collected from a metastatic cancer tissue, only gene expression pattern information originating from a primary cancer remains.
  • FIG. 3 is a diagram for explaining a gene expression pattern of a sample obtained from metastatic cancer tissue according to an embodiment of the present invention.
  • Tissue fragments according to one embodiment of the present invention may be collected in a form of cutting into a predetermined size to include cancer tissue of unknown primary site and normal tissue of an organ.
  • gene expression pattern information 300 of the sample obtained from the metastatic cancer tissue can be obtained.
  • gene expression pattern information 300 of a sample obtained from metastatic cancer tissue may be expressed as an expression level for each gene.
  • the x-axis of the gene expression pattern information 300 of samples acquired from metastatic cancer tissue shown in FIG. 3 means a plurality of discretely arranged genes
  • the y-axis means the relative or absolute expression level of the gene.
  • gene expression pattern information 310 obtained from metastatic cancer tissues, gene expression patterns derived from cancers generated in the primary site and gene expression patterns derived from organ tissues in which metastatic cancers occurred are mixed. .
  • the first gene expression information 310 is derived from the lung, which is an organ tissue where metastasis has occurred.
  • a gene expression pattern (311) and a gene expression pattern (313) resulting from a cancer occurring in a primary site are mixed.
  • the gene expression pattern information 310 acquired from metastatic cancer tissue is directly compared with the gene expression pattern information for each cancer type with a specific primary site, the gene expression pattern derived from the organ tissue in which metastatic cancer occurred acts as noise, resulting in gene expression pattern information. It is impossible to accurately specify the primary site only.
  • gene expression pattern information 310 acquired from metastatic cancer tissues, gene expression pattern information 313 resulting from organ tissues in which metastatic cancer has occurred, acting as noise, should be excluded.
  • FIG. 4 is a diagram for explaining gene expression pattern information learned by an apparatus for diagnosing primary cancer of unknown primary site using artificial intelligence according to an embodiment of the present invention.
  • the apparatus 100 for diagnosing cancer of unknown primary site may store gene expression pattern information 410 of tissue learned through a plurality of learning data and gene expression pattern information 420 for each cancer type.
  • the gene expression pattern information 410 of a tissue means a specific gene expression pattern appearing in a normal tissue of an organ. For example, it refers to a gene expression pattern specifically expressed in a normal tissue of the lung, a gene expression pattern specifically expressed in a normal tissue of the liver, and the like.
  • the gene expression pattern information 420 for each type of cancer means a gene expression pattern specifically appearing in a cancer tissue in which a primary site is specified. For example, it means a gene expression pattern specifically appearing in a cancer tissue whose primary site is the lung, and a gene expression pattern specifically appearing in a cancer tissue whose primary site is the liver.
  • FIG. 5 is a conceptual diagram for explaining a method for specifying a primary site of cancer of unknown primary site by acquiring gene expression pattern information resulting from cancer occurring at the primary site according to an embodiment of the present invention.
  • the apparatus 100 for diagnosing cancer of unknown primary site using artificial intelligence generates gene expression pattern information 300 of metastatic cancer tissues through sequencing of samples collected from metastatic cancer tissues ( S510).
  • the gene expression pattern information 300 of metastatic cancer tissue may be expression levels of genes specified by mRNA sequence information.
  • the gene expression pattern information 410 of a pre-learned tissue means a normal tissue of an organ in which a pre-learned metastatic cancer has occurred, as described above.
  • the gene expression pattern information 300 of metastatic cancer tissue and the gene expression pattern information 410 of tissue may be displayed as a feature vector on a multidimensional space.
  • the difference operation between the gene expression pattern information 300 of metastatic cancer tissue and the gene expression pattern information 410 of previously learned tissue is based on the difference between the gene expression feature vector of metastatic cancer tissue and the gene expression feature vector of the tissue. It can be done.
  • Pure gene expression pattern information 420 for each type of cancer excluding gene expression pattern information 410 derived from a tissue in which metastasis has occurred may be obtained through the above-described difference operation.
  • the gene expression pattern information 420 for each cancer type is acquired through the difference operation, the similarity with the previously learned gene expression pattern information for each cancer type is calculated, and the primary part of the gene expression pattern with the highest similarity is the primary part of the metastatic cancer. Up is specified (S530).
  • the primary site of metastatic cancer is specified as the liver.
  • the gene expression pattern information 420 for each cancer type obtained through the difference operation is most similar to the gene expression pattern of cancer tissue whose primary site is the lung, the primary site of metastatic cancer is specified as the lung.
  • FIG. 6 is a diagram for explaining a method of performing a difference operation between gene expression patterns represented by feature vectors according to an embodiment of the present invention.
  • FIG. 6 shows gene expression pattern information of metastatic cancer tissue expressed as a vector, tissue gene expression pattern information, and gene expression pattern information for each cancer type.
  • the first vector 610 is the gene expression pattern information 300 of the metastatic cancer tissue described in FIG. 5 and the second vector 620 is the gene expression pattern information of the tissue.
  • the first vector 610 and the second vector 620 have been described as vectors located on a two-dimensional space as an example, but they may actually be vectors displayed on a multi-dimensional space.
  • vectors displayed on a multi-dimensional space may be converted into vectors displayed on a 2-dimensional space by applying a dimensionality reduction technique.
  • dimensionality reduction techniques include Uniform Manifold Approximation and Projection (UMAP), Locally Linear Embedding (LLE), Multi-Dimesional Sacling (MDS), Principal Component Analysis (PCA), Singular Value Decomposition (SVD), and Non-negative Matrix (NMF). factorization), but is not limited thereto, and dimensionality reduction techniques widely known in the art may be applied without limitation.
  • the difference operation decomposes the first vector 610 and the second vector 620 for each component (eg, an x-axis component and a y-axis component), and then performs a difference operation between the same components. It can be carried out in the form of
  • the third vector 640 may be calculated by adding the first vector 610 and the inverse vector 630.
  • a specific method of performing a difference operation between the first vector 610 and the second vector 620 is not limited thereto, and other general-purpose algorithms may be applied.
  • FIG. 7 is a diagram visualizing pre-learned gene expression pattern information for each tissue according to an embodiment of the present invention.
  • data as shown in FIG. 7 can be obtained by learning and visualizing gene expression patterns of samples taken from normal tissues.
  • gene expression patterns are visualized on a two-dimensional space as an example, but gene expression patterns may be arranged on a multi-dimensional space.
  • a cluster shown in FIG. 7 means a pattern of genes expressed in the same tissue.
  • the first cluster 710 refers to gene expression patterns in normal tissues of the liver
  • the second cluster 720 refers to gene expression patterns in normal tissues of salivary glands.
  • the learned gene expression pattern for each tissue shown in FIG. 7 can be used to remove gene expression patterns caused by the tissue itself, which acts as noise in samples taken from tissues in which metastasis has occurred.
  • FIGS. 8 and 9 are diagrams for comparing gene expression patterns before and after excluding gene expression patterns derived from tissues in which metastasis occurred.
  • FIG. 8 shows gene expression patterns of samples collected from metastatic cancer tissue with a specified primary site. That is, in the gene expression pattern shown in FIG. 8 , a gene expression pattern derived from a metastatic cancer tissue and a gene expression pattern derived from a primary cancer are mixed.
  • FIG. 9 shows a gene expression pattern in which the gene expression pattern derived from the metastatic cancer tissue itself is removed. That is, the markers shown in FIG. 9 refer to gene expression patterns derived from the primary cancer itself. In FIG. 9 , since markers having the same color are clustered, the location of the primary cancer can be specified only by the gene expression pattern.
  • FIG. 10 is a functional block diagram illustrating an apparatus for diagnosing primary cancer of unknown primary site using artificial intelligence according to another embodiment of the present invention.
  • an apparatus for diagnosing cancer of unknown primary site using artificial intelligence 1000 includes one or more processors 1010, a memory 1020 for loading a computer program executed by the processor 1010, It may include a bus 1030 , a communication interface 1040 , and a storage 1050 storing a computer program 1060 .
  • FIG. 10 only components related to the embodiment of the present disclosure are shown in FIG. 10 . Accordingly, those of ordinary skill in the art to which this disclosure belongs may know that other general-purpose components may be further included in addition to the components shown in FIG. 10 . That is, the apparatus 1000 for diagnosing cancer of unknown primary site using artificial intelligence may further include various components in addition to the components shown in FIG. 10 . Alternatively, the apparatus 1000 for diagnosing cancer of unknown primary site using artificial intelligence may be configured except for some of the components shown in FIG. 10 .
  • the processor 1010 may control the overall operation of each component of the apparatus 1000 for diagnosing cancer of unknown primary site using artificial intelligence.
  • the processor 1010 may include at least one of a Central Processing Unit (CPU), a Micro Processor Unit (MPU), a Micro Controller Unit (MCU), a Graphic Processing Unit (GPU), or any type of processor well known in the art. can be configured to include Also, the processor 1010 may perform an operation for at least one application or program for executing a method/operation according to embodiments of the present disclosure.
  • the apparatus 1000 for diagnosing cancer of unknown primary site using artificial intelligence may include one or more processors.
  • Memory 1020 may store various data, commands and/or information. Memory 1020 may load one or more computer programs 1060 from storage 1050 to execute a method according to embodiments of the present disclosure. Memory 1020 may be implemented as volatile memory such as RAM, but is not limited thereto.
  • the bus 1030 may provide a communication function between components of the apparatus 1030 for diagnosing cancer of unknown primary site using artificial intelligence.
  • the bus 1030 may be implemented as various types of buses such as an address bus, a data bus, and a control bus.
  • the communication interface 1040 may support wired/wireless Internet communication of the apparatus 1000 for diagnosing cancer of unknown primary site using artificial intelligence. Also, the communication interface 1040 may support various communication methods other than internet communication. To this end, the communication interface 1040 may include a communication module well known in the art of the present disclosure. In some embodiments, communication interface 1040 may be omitted.
  • the storage 1050 may non-temporarily store the one or more programs 1060 .
  • the storage 1050 may be non-volatile memory such as read only memory (ROM), erasable programmable ROM (EPROM), electrically erasable programmable ROM (EEPROM), flash memory, or the like, a hard disk, a removable disk, or a device well known in the art. It may be configured to include any known type of computer-readable recording medium.
  • Computer program 1060 may then include one or more instructions that, when loaded into memory 1020, cause processor 1010 to perform a method/operation in accordance with various embodiments of the present disclosure. there is. That is, the processor 1010 may perform methods/operations according to various embodiments of the present disclosure by executing the one or more instructions.
  • the computer program 1060 may generate gene expression pattern information of a sample collected from a tissue in which metastasis has occurred, and pre-learned from the gene expression pattern information of a sample taken from a tissue in which metastasis has occurred.
  • An instruction for performing an operation for specifying a primary site of a sample taken from a tissue may be included.
  • the technical idea of the present disclosure described with reference to FIGS. 1 to 10 so far may be implemented as computer readable code on a computer readable medium.
  • the computer-readable recording medium may be, for example, a removable recording medium (CD, DVD, Blu-ray disc, USB storage device, removable hard disk) or a fixed recording medium (ROM, RAM, computer-equipped hard disk).
  • ROM, RAM, computer-equipped hard disk can
  • the computer program recorded on the computer-readable recording medium may be transmitted to another computing device through a network such as the Internet, installed in the other computing device, and thus used in the other computing device.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Immunology (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)

Abstract

인공지능을 이용한 원발부위불명암 진단 방법이 게시된다. 본 발명의 일 실시예 따른 인공지능을 이용한 원발부위불명암 진단 방법은, 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보를 생성하는 단계, 상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보에서 기 학습된 조직에서 기인한 유전자 발현 패턴 정보를 제거하는 단계, 상기 조직에서 기인한 유전자 발현 패턴 정보가 제거된 유전자 발현 패턴 정보와 기 학습된 암종별 유전자 발현 패턴 정보를 비교하는 단계 및 상기 전이암이 발생된 조직에서 채취한 샘플의 원발부위를 특정하는 단계를 포함한다.

Description

인공지능을 이용한 원발부위불명암 진단 방법
본 발명은 인공지능을 이용한 원발부위불명암 진단 방법에 관한 것으로, 보다 상세하게는 암이 전이된 조직의 유전자 발현량 정보를 이용하여 암의 원발부위를 검출하되 전이 조직에서의 유전자 발현 효과를 배제함으로써 진단의 정확성을 보다 향상시킬 수 있는 인공지능을 이용한 원발부위불명암 진단 방법에 관한 것이다.
신체를 이루는 가장 작은 단위인 세포는 나름의 질서와 자체적인 조절 기능을 가지고 그 수의 균형을 유지한다. 하지만 불상의 원인으로 인해 사멸되는 세포보다 사멸되는 세포보다 새로 만들어지는 세포 수가 더 많게 되었을 때 불필요한 여분의 세포들은 맡은 역할을 제대로 수행하지 못하고 한 곳에 덩어리 채 뭉쳐서 자리를 잡게 된다.
이러한 형태를 종양이라고 하는데, 종양이 일정 크기에서 멈추지 않고 끊임없이 증식하여 주변의 정상적인 세포들까지 침습한 상태의 종양을 악성 종양, 즉, 암으로 정의한다.
암은 암세포조직이 처음 자리를 잡고 생성되기 시작한 원발암과 암세포가 원발장기로부터 혈관이나 림프관을 따라 이동하여 다른 장기에 발생된 전이암으로 구분할 수 있다.
전이암은 원발암과 생화학적 특성을 공유하므로 전이암이 발생된 위치와 상관없이 전이암에는 원발암에 적용되는 치료방법에 준하는 치료방법이 적용된다. 따라서, 최적의 치료제나 치료 방법을 선택하는데 있어 암의 원발부위를 특정하는 단계가 선행되어야 한다.
대부분의 전이암은 샘플의 병리검사 등을 통해 원발부위를 특정할 수 있으나 면역조직화학염색법, 분자유전학검사법, 종양표지자 검사 등을 시행해도 원발부위를 특정할 수 없는 경우가 있는바 이를 원발부위불명암(CUP : Carcinoma of Unknown Primary)이라고 한다.
전체 암 환자의 약 3~5%가 원발부위불명암인 것으로 추정되며 상술한 바와 같이 적절한 치료제나 치료방법을 특정할 수 없어 일반 암환자 대비 예후가 매우 좋지 않은 것으로 보고되고 있다.
한편, 최근에는 병변부위에서 채취한 샘플의 유전자 발현 패턴을 이용하여 원발부위불명암의 원발부위를 특정하고자 하는 시도가 이루어지고 있다. 상술한 방법에 따르면, 원발암별로 나타나는 특이적인 유전자 발현 패턴을 학습시킨 상태에서 학습된 원발암별 특이적 유전자 발현 패턴과 병변부위에서 획득한 샘플의 유전자 발현 정보를 비교하여 원발부위를 특정할 수 있게 된다.
유전자 발현 패턴 정보를 이용한 진단 방법의 경우, 전이암 조직으로부터 정확한 유전자 발현 패턴을 취득하면 원발부위를 비교적 정확하게 진단할 수 있다는 장점이 있으나, 유전자 발현 정보에 원발암에서 기인한 유전자 발현0 패턴과 전이된 조직 자체에서 기인한 유전자 발현 패턴이 혼재되어 있어 샘플에서 정확한 유전자 발현 패턴을 취득하는데 어려움이 있다는 문제점이 있었다.
이에, 진단의 정확성을 높일 수 있는 새로운 형태의 인공지능을 이용한 원발부위불명암 진단 방법에 대한 필요성이 대두되었다.
본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로, 전이암 조직에서 취득한 샘플의 유전자 발현 패턴 정보를 이용하여 원발부위를 특정할 수 있는 인공지능을 이용한 원발부위불명암 진단 방법을 제공하는데 있다.
본 발명의 목적은 전이암 조직에서 획득한 샘플에서 원발암에서 기인한 유전자 발현 패턴만을 분리할 수 있는 인공지능을 이용한 원발부위불명암 진단 방법을 제공하는데 있다.
본 발명의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않는 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.
상술한 목적을 달성하기 위한 본 발명의 일 실시예에 따른 인공지능을 이용한 원발부위불명암 진단 방법은, 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보를 생성하는 단계, 상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보에서 기 학습된 조직에서 기인한 유전자 발현 패턴 정보를 제거하는 단계, 상기 조직에서 기인한 유전자 발현 패턴 정보가 제거된 유전자 발현 패턴 정보와 기 학습된 암종별 유전자 발현 패턴 정보를 비교하는 단계 및 상기 전이암이 발생된 조직에서 채취한 샘플의 원발부위를 특정하는 단계를 포함한다.
본 발명의 일 실시예에 따르면, 상기 전이암이 발생된 조직에서 채취한 샘플은, 상기 전이암이 발생된 장기의 정상 조직 및 암조직을 포함할 수 있다.
본 발명의 일 실시예에 따르면, 상기 조직에서 기인한 유전자 발현 패턴 정보는, 장기의 정상 조직에서 발현되는 특이적인 유전자 발현 패턴 정보일 수 있다.
본 발명의 일 실시예에 따르면, 상기 암종별 유전자 발현 패턴 정보는 원발부위가 특정된 암조직에서 발현되는 특이적인 유전자 발현 패턴 정보일 수 있다.
본 발명의 일 실시예에 따르면, 상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보에서 기 학습된 조직에서 기인한 유전자 발현 패턴 정보를 제거하는 단계는, 상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보를 제1 벡터로 변환하는 단계 상기 조직에서 기인한 유전자 발현 패턴 정보를 제2 벡터로 변환하는 단계 및 상기 제1 벡터에 대한 상기 제2 벡터의 차연산을 수행하는 단계를 포함할 수 있다.
본 발명의 일 실시예에 따르면, 상기 전이암이 발생된 조직에서 채취한 샘플의 원발부위를 특정하는 단계는, 기 학습된 복수의 원발부위 중 적어도 하나를 특정하는 단계를 포함할 수 있다.
본 발명의 일 실시예에 따르면, 상기 전이암이 발생된 조직에서 채취한 샘플의 원발부위를 특정하는 단계는, 원발부위 별로 확률값을 출력하는 단계를 포함할 수 있다.
본 발명의 일 실시예에 따르면, 상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보, 상기 조직에서 기인한 유전자 발현 패턴 정보 및 상기 조직에서 기인한 유전자 발현 패턴 정보가 제거된 유전자 발현 패턴 정보는 RNA 서열 정보일 수 있다.
본 발명의 일 실시예에 따르면, 상기 RNA 서열 정보는 mRNA 서열 정보일 수 있다.
본 발명의 또 다른 실시예에 따른 인공지능을 이용한 원발부위불명암 진단 장치는, 하나 이상의 인스트럭션들(instructions)를 저장하는 메모리 및 상기 저장된 하나 이상의 인스트럭션을 실행시킴으로써, 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보를 생성하는 동작, 상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보에서 기 학습된 조직에서 기인한 유전자 발현 패턴 정보를 제거하는 동작, 상기 조직에서 기인한 유전자 발현 패턴 정보가 제거된 유전자 발현 패턴 정보와 기 학습된 암종별 유전자 발현 패턴 정보를 비교하는 동작 및 상기 전이암이 발생된 조직에서 채취한 샘플의 원발부위를 특정하는 동작을 수행하는 프로세서를 포함한다.
상술한 원발부위불명암 진단 방법에 따르면, 유전자 발현 패턴을 이용하여 원발부위불명암의 원발부위를 특정하는데 있어 전이암이 발생된 조직에서 기인한 유전자 발현 패턴을 배제할 수 있으므로 진단의 정확성을 보다 향상시킬 수 있게 된다는 효과를 달성할 수 있다.
도 1은 본 발명의 일 실시예에 따른 인공지능을 이용한 원발부위불명암 진단 장치(100)를 설명하기 위한 예시적인 도면이다.
도 2는 본 발명의 일 실시예에 따른 인공지능을 이용한 원발부위불명암 진단 방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 일 실시예에 따라 전이암 조직에서 획득한 샘플의 유전자 발현 패턴을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따라 인공지능을 이용한 원발부위불명암 진단 장치가 학습한 유전자 발현 패턴 정보들을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따라 원발부위에 발생한 암으로부터 기인한 유전자 발현 패턴 정보를 취득하여 원발부위불명암의 원발부위를 특정하는 방법을 설명하기 위한 개념도이다.
도 6은 본 발명의 일 실시예에 따라 특징 벡터로 표현되는 유전자 발현 패턴간에 차연산을 수행하는 방법을 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에 따라 기 학습된 조직별 유전자 발현 패턴 정보를 시각화한 도면이다.
도 8 및 도 9는 전이암이 발생된 조직에서 기인한 유전자 발현 패턴을 제외하기 전·후 유전자 발현 패턴을 비교하기 위한 도면이다.
이하, 첨부된 도면을 참조하여 본 개시의 바람직한 실시예들을 상세히 설명한다. 본 개시의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 개시의 기술적 사상은 이하의 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 이하의 실시예들은 본 개시의 기술적 사상을 완전하도록 하고, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 본 개시의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 개시의 기술적 사상은 청구항의 범주에 의해 정의될 뿐이다.
각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성 요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 개시를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 개시의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 개시를 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
또한, 본 개시의 구성요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성요소를 다른 구성요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성요소 사이에 또 다른 구성요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
본 개시에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는 (comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
본 개시에 대한 설명에 앞서, 이하의 실시예들에서 사용되는 몇몇 용어들에 대하여 명확하게 하기로 한다.
이하의 실시예들에서, 유전자 발현 패턴 정보란 유전자 발현과 관련한 다양한 유형의 데이터를 의미한다. 예를 들어, 전사체, 단백질체 등에 관한 데이터를 의미할 수 있다. 또는 DNA 서열 정보, RNA 서열 정보, RNA 또는 DNA 발현량, 발현 비율, 발현 위치, 발현 분포 등에 관한 데이터를 포함할 수 있다.
이하, 본 개시의 다양한 실시예들에 대하여 첨부된 도면에 따라 상세하게 설명하도록 한다.
도 1은 본 발명의 일 실시예에 따른 인공지능을 이용한 원발부위불명암 진단 장치(100)를 설명하기 위한 예시적인 도면이다.
도 1에 도시된 바와 같이 본 발명의 일 실시예에 따른 인공지능을 이용한 원발부위불명암 진단 장치(100)는 학습 데이터로 암종별 유전자 발현 패턴 정보 및 조직별 유전자 발현 패턴 정보를 입력받고, 쿼리 데이터로 전이암 조직에서 취득한 샘플의 유전자 발현 패턴 정보를 입력 받는다.
암종별 유전자 발현 패턴 정보란, 원발부위가 특정된 암 조직의 유전자 발현 패턴 정보를 의미한다. 예를 들어, 원발부위가 간인 암조직에서 획득한 샘플의 유전자 발현 패턴, 원발부위가 폐인 암조직에서 획득한 샘플의 유전자 발현 패턴 등을 의미한다. 본 발명의 일 실시예에 다른 유전자 발현 패턴은 RNA 서열 정보, 보다 상세하게는 mRNA 서열 정보일 수 있다.
조직별 유전자 발현 패턴 정보란, 장기의 조직에서 기인한 유전자 발현 패턴 정보를 의미한다. 신체를 구성하는 다양한 장기들은 각각 서로 다른 유전자들의 조합이 발현된 것이므로 조직별로 그 유전자 발현 패턴 정보가 서로 다르게 나타난다. 조직별 유전자 발현 패턴도 RNA 서열 정보, 보다 상세하게는 mRNA 서열 정보일 수 있다.
한편, 암종별 유전자 발현 패턴 정보 및 조직별 유전자 발현 패턴 정보를 학습 데이터로 입력 받는다는 것의 의미는 원발부위가 레이블된 다수의 유전자 발현 패턴 정보를 입력받는 것을 의미한다.
본 발명의 일 실시예에 따른 원발부위가 레이블된 유전자 발현 패턴 정보들은 GEO(Gene Expression Omnibus), Array Express, TCGA(The Cancer Genome Atlas Program), ICGs(Iterative Clustering and Guide-Gene selcection), GTEx(Genotype Tissue Expression) 등과 같은 데이터베이스에서 크롤링한 데이터들일 수 있다.
본 발명의 일 실시예에 따른 인공지능을 이용한 원발부위불명암 진단 장치(100)는 레이블링된 학습 데이터를 이용하여 원발부위가 특정된 암의 유전자 발현 패턴 및 전이암이 발생된 조직에서 기인한 유전자 발현 패턴의 특징들을 도출한다.
학습이 완료된 상태에서 쿼리 데이터로 전이암 조직에서 취득한 샘플의 유전자 발현 패턴 정보가 입력되면 전이암의 원발부위를 결과값으로 출력한다.
본 발명의 일 실시예에 따른 결과값은 학습된 복수의 원발부위 중 적어도 하나를 특정하거나, 원발부위 별로 확률값을 출력하는 형태로 출력될 수 있다.
예를 들어, 전이암 조직에서 취득된 샘플의 유전자 발현 패턴 정보가 쿼리 데이터로 입력되면 해당 전이암의 원발부위가 "간"이라는 형태로 출력하거나, 원발부위가 "간"일 확률은 X%, "폐"일 확률은 Y% 등으로 출력될 수 있다.
한편, 도 1에서는 인공지능을 이용한 원발부위불명암 진단 장치(100)가 하나의 컴퓨팅 장치로 구현된 것을 예로서 도시하고 있으나, 인공지능을 이용한 원발부위불명암 진단 장치(100)는 물리적 또는 논리적으로 구분되는 복수의 컴퓨팅 장치로 구현될 수도 있다. 이 경우, 인공지능을 이용한 원발부위불명암 진단 장치(100)의 제1 기능은 제1 컴퓨팅 장치에서 구현되고 제2 기능은 제2 컴퓨팅 장치에서 구현될 수 있다. 또는 인공지능을 이용한 원발부위불명암 진단 장치(100)의 특정 기능이 복수의 컴퓨팅 장치에서 구현될 수도 있다.
이하에서는, 입력 데이터들을 이용하여 출력 데이터인 원발부위불명암의 원발부위를 출력하는 방법에 대해 상세하게 설명하도록 한다.
도 2는 본 발명의 일 실시예에 따른 인공지능을 이용한 원발부위불명암 진단 방법을 설명하기 위한 흐름도이다.
이하에서는 설명의 편의를 위하여 각 단계를 수행하는 주체를 생략하도록 한다. 다만, 본 발명이 속하는 기술분야의 통상의 기술자라면 각 단계가 는 인공지능을 이용한 원발부위불명암 진단 장치(100)에서 수행됨을 이해할 수 있다.
먼저, 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보를 생성한다(S210). 본 발명의 일 실시예에 따라 전이암이 발생된 조직에서 채취한 샘플에는 전이암이 발생된 장기의 정상 조직 및 암조직이 포함되어 있을 수 있다.
또한, 유전자 발현 패턴 정보는 상기 샘플에 대한 전사유전체 시퀀싱을 수행하여 획득된 것일 수 있다. 구체적으로, 본 발명의 일 실시예에 따른 유전자 발현 패턴 정보는 RNA 서열 정보, 보다 상세하게는 mRNA 서열 정보일 수 있다.
이후, 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보에서 기 학습된 조직에서 기인한 유전자 발현 패턴 정보를 제거한다(S220).
여기에서, 조직에서 기인한 유전자 발현 패턴 정보는 전이암이 발생된 조직에서 특이적으로 발현되는 유전자 발현 패턴 정보를 의미한다. 예를 들어, 전이암이 발생된 장기가 "폐"인 경우, "페"에서 발현되는 특이적인 유전자 발현 패턴 정보를 의미한다.
전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보에서 조직에서 기인한 유전자 발현 패턴 정보를 제거하면, 원발암에서 기인한 유전자 발현 패턴 정보만이 남게 된다.
따라서, 전이암이 발생된 장기 조직에서 기인한 유전자 발현 패턴 정보가 제거된 유전자 발현 패턴 정보와 기 학습된 암종별 유전자 발현 패턴 정보를 비교하면(S530), 전이암의 원발 부위를 특정할 수 있게 된다(S540).
이하에서는, 샘플의 유전자 발현 패턴 정보를 이용하여 원발부위를 특정하는 방법에 대해 보다 상세하게 설명하도록 한다.
도 3은 본 발명의 일 실시예에 따라 전이암 조직에서 획득한 샘플의 유전자 발현 패턴을 설명하기 위한 도면이다.
전이암 조직에서의 유전자 발현 패턴을 획득하기 위해 전이암이 발생한 장기에서의 조직을 획득한다.
본 발명의 일 실시예에 따른 조직의 소편은 원발부위불명암 조직과 장기의 정상 조직이 포함되도록 소정의 크기로 절취하는 형태로 채취될 수 있다.
상술한 방법으로 채취한 샘플에 대해 전사유전체 시퀀싱을 수행하면 전이암 조직에서 취득한 샘플의 유전자 발현 패턴 정보(300)를 획득할 수 있다.
본 발명의 일 실시예에 따라 전이암 조직에서 취득한 샘플의 유전자 발현 패턴 정보(300)는 유전자별 발현량으로 표현될 수 있다. 구체적으로, 도 3에 도시된 전이암 조직에서 취득한 샘플의 유전자 발현 패턴 정보(300)의 x축은 이산적으로 나열된 복수의 유전자들을 의미하고, y축은 해당 유전자의 상대적 또는 절대적 발현량을 의미한다.
*도 3에 도시된 바와 같이, 전이암 조직에서 취득한 유전자 발현 패턴 정보(310)에는 원발부위에서 발생한 암으로부터 기인한 유전자 발현 패턴과 전이암이 발생한 장기 조직으로부터 기인한 유전자 발현 패턴이 혼재되어 있다.
예를 들어, 도 3에 도시된 전이암이 발생된 장기가 "폐"인 경우, 병변부위에서 채취한 유전자 발현 패턴 정보 중 제1 유전자 발현 정보(310)에는 전이암이 발생한 장기 조직인 폐로부터 기인한 유전자 발현 패턴(311)과 원발부위에서 발생한 암으로부터 기인한 유전자 발현 패턴(313)이 혼재되어 있다.
전이암 조직에서 취득한 유전자 발현 패턴 정보(310)와 원발부위가 특정된 암종별 유전자 발현 패턴 정보를 직접 비교하는 경우 전이암이 발생한 장기 조직에서 기인한 유전자 발현 패턴이 노이즈로 작용하여 유전자 발현 패턴 정보만으로 원발부위를 정확하게 특정할 수 없게 된다.
따라서, 전이암 조직에서 취득한 유전자 발현 패턴 정보(310)에서 노이즈로 작용하는 전이암이 발생한 장기 조직에서 기인한 유전자 발형 패턴 정보(313)를 배제해야 한다.
이하에서는, 전이암 조직에서 취득한 샘플의 유전자 발현 패턴 정보에서 원발부위에서 발생한 암으로부터 기인한 유전자 발현 패턴을 추출하는 방법에 대해 설명하도록 한다.
도 4는 본 발명의 일 실시예에 따라 인공지능을 이용한 원발부위불명암 진단 장치가 학습한 유전자 발현 패턴 정보들을 설명하기 위한 도면이다.
본 발명의 일 실시예에 따른 원발부위불명암 진단 장치(100)는 다수의 학습 데이터로 학습한 조직의 유전자 발현 패턴 정보(410) 및 암종별 유전자 발현 패턴 정보(420)을 저장할 수 있다.
조직의 유전자 발현 패턴 정보(410)는 장기의 정상 조직에서 나타나는 특이적인 유전자 발현 패턴을 의미한다. 예를 들어, 폐의 정상 조직에서 특이적으로 나타나는 유전자 발현 패턴, 간의 정상 조직에서 특이적으로 나타나는 유전자 발현 패턴 등을 의미한다.
암종별 유전자 발현 패턴 정보(420)는 원발부위가 특정된 암조직에서 특이적으로 나타나는 유전자 발현 패턴을 의미한다. 예를 들어, 원발부위가 폐인 암조직에서 특이적으로 나타나는 유전자 발현 패턴, 원발부위가 간인 암조직에서 특이적으로 나타나는 유전자 발현 패턴을 의미한다.
상기 학습된 데이터를 이용하면 전이암 조직에서 취득한 샘플의 유전자 발현 패턴 정보에서에서 원발부위에 발생한 암으로부터 기인한 유전자 발현 패턴 정보를 취득할 수 있게 된다.
도 5는 본 발명의 일 실시예에 따라 원발부위에 발생한 암으로부터 기인한 유전자 발현 패턴 정보를 취득하여 원발부위불명암의 원발부위를 특정하는 방법을 설명하기 위한 개념도이다.
본 발명의 일 실시예에 따른 인공지능을 이용한 원발부위불명암 진단 장치(100)는 전이암 조직에서 채취한 샘플의 염기서열분석을 통해 전이암 조직의 유전자 발현 패턴 정보(300)를 생성한다(S510).
본 발명의 일 실시예에 따른 전이암 조직의 유전자 발현 패턴 정보(300)은 mRNA 서열 정보로 특정되는 유전자들의 발현량일 수 있다.
이후, 전이암 조직의 유전자 발현 패턴 정보(300)와 기 학습된 조직의 유전자 발현 패턴 정보(410)의 차연산을 수행하여 암종별 유전자 발현 패턴 정보(420)를 산출한다(S520). 여기에서, 기 학습된 조직의 유전자 발현 패턴 정보(410)는 상술한 바와 같이 기 학습된 전이암이 발생된 장기의 정상 조직을 의미한다.
본 발명의 일 실시예에 따른 전이암 조직의 유전자 발현 패턴 정보(300) 및 조직의 유전자 발현 패턴 정보(410)는 다차원 공간상에서의 특징 벡터로 표시될 수 있다.
따라서, 전이암 조직의 유전자 발현 패턴 정보(300)와 기 학습된 조직의 유전자 발현 패턴 정보(410)의 차연산은 전이암 조직의 유전자 발현 특징 벡터와 조직의 유전자 발현 특징 벡터 간의 차연상을 통해 이루어질 수 있다.
상술한 차연산을 통해 전이암이 발생된 조직에서 기인한 유전자 발현 패턴 정보(410)가 배제된 순수한 암종별 유전자 발현 패턴 정보(420)를 획득할 수 있다.
상기 차연산을 통해 암종별 유전자 발현 패턴 정보(420)가 획득되면 이를 기 학습된 암종별 유전자 발현 패턴 정보와의 유사도를 계산하여 유사도가 가장 높은 유전자 발현 패턴의 원발부위를 상기 전이암의 원발부위로 특정한다(S530).
예를 들어, 차연산을 통해 획득한 암종별 유전자 발현 패턴 정보(420)가 원발부위가 간인 암조직의 유전자 발현 패턴과 가장 유사한 경우 전이암의 원발부위를 간으로 특정한다.
마찬가지로, 차연산을 통해 획득한 암종별 유전자 발현 패턴 정보(420)가 원발부위가 폐인 암조직의 유전자 발현 패턴과 가장 유사한 경우 전이암의 원발부위를 폐로 특정한다.
상술한 원발부위불명암 진단 방법에 따르면, 유전자 발현 패턴을 이용하여 원발부위불명암의 원발부위를 특정하는데 있어 전이암이 발생된 조직에서 기인한 유전자 발현 패턴을 배제할 수 있으므로 진단의 정확성을 보다 향상시킬 수 있게 된다는 효과를 달성할 수 있다.
도 6은 본 발명의 일 실시예에 따라 특징 벡터로 표현되는 유전자 발현 패턴간에 차연산을 수행하는 방법을 설명하기 위한 도면이다.
도 6에는 벡터로 표현된 전이암 조직의 유전자 발현 패턴 정보, 조직의 유전자 발현 패턴 정보 및 암종별 유전자 발현 패턴 정보가 도시되어 있다.
구체적으로, 제1 벡터(610)는 도 5에서 설명한 전이암 조직의 유전자 발현 패턴 정보(300)이고 제2 벡터(620)는 조직의 유전자 발현 패턴 정보이다.
도 6에서는 제1 벡터(610) 및 제2 벡터(620)가 2차원 공간상에 위치하는 벡터인 것을 예로 들어 설명하였으나, 실제로는 다차원 공간상에 표시되는 벡터일 수도 있다.
또는 다차원 공간상에 표시되는 벡터들에 대해 차원 축소 기법을 적용하여 2차원 공간상에 표시되는 벡터로 전환한 것일 수 있다. 차원 축소 기법의 예로는 UMAP(Uniform Manifold Approximation and Projection), LLE(Locally Linear Embedding), MDS(Multi-Dimesional Sacling), PCA(Principal Component Analysis), SVD(Singular Value Decomposition), NMF(Non-negative Matrix Factorization) 등을 들 수 있으나 이에 한정되는 것은 아니며 당해 기술 분야에서 널리 알려진 차원 축소 기법이 제한없이 적용될 수 있다.
전이암 조직의 유전자 발현 패턴 정보에 대응되는 제1 벡터(610) 및 조직의 유전자 발현 패턴 정보에 대응되는 제2 벡터(620)로부터 암종별 유전자 발현 패턴 정보(630)에 대응되는 제3 벡터(630)를 산출하기 위해 제1 벡터(610)와 제2 벡터(620)에 차연산을 수행한다.
본 발명의 일 실시예에 따른 차연산은 제1 벡터(610) 및 제2 벡터(620)를 각 성분(예를들어, x축 성분 및 y축 성분)별로 분해한 후 동일 성분끼리 차연산을 수행하는 형태로 수행될 수 있다.
또는 제2 벡터(620)의 역벡터(630)를 중간 벡터로 산출한 후, 제1 벡터(610)와 역벡터(630)를 합하여 제3 벡터(640)를 산출할 수도 있다.
다만, 제1 벡터(610) 및 제2 벡터(620)간에 차연산을 수행하는 구체적인 방법은 이에 한정되지 않으며 다른 범용적인 알고리즘이 적용될 수 있음을 물론이다.
도 7은 본 발명의 일 실시예에 따라 기 학습된 조직별 유전자 발현 패턴 정보를 시각화한 도면이다.
신체를 구성하는 다양한 장기들은 각각 서로 다른 유전자들의 조합이 발현된 것이므로 조직별로 그 유전자 발현 패턴 정보가 서로 다르게 나타난다. 즉, 암세포가 포함되지 않은 장기의 정상 조직은 장기의 유형별로 특이적으로 발현되는 유전자 패턴이 있다.
따라서, 정상 조직에서 채취한 샘플들의 유전자 발현 패턴을 학습하고 이를 시각화하면 도 7에 도시된 바와 같은 데이터를 얻을 수 있다. 도 7에서는 이해의 편의를 위하여 2차원 공간상에 유전자 발현 패턴이 시각화된 것을 예로 들었으나, 다차원 공간상에 유전자 발현 패턴이 배치되도록 구현할 수 있다.
도 7에 도시된 군집(cluster)는 동일 조직에서 발현된 유전자 패턴을 의미한다.
예를 들어, 제1 군집(710)은 간의 정상 조직에서의 유전자 발현 패턴을 의미하고 제2 군집(720)은 침샘의 정상 조직에서의 유전자 발현 패턴을 의미한다.
도 7에 도시된 학습된 조직별 유전자 발현 패턴은 앞서 설명한 바와 같이, 전이암이 발생된 조직에서 채취한 샘플에서 노이즈로 작용하는 조직 자체에서기인하는 유전자 발현 패턴을 제거하는데 사용될 수 있다.
도 8 및 도 9는 전이암이 발생된 조직에서 기인한 유전자 발현 패턴을 제외하기 전·후 유전자 발현 패턴을 비교하기 위한 도면이다.
도 8에는 원발부위가 특정된 전이암 조직에서 채취한 샘플의 유전자 발현 패턴이 도시되어 있다. 즉, 도 8에 도시된 유전자 발현 패턴에는 전이암이 발생한 조직에서 기인한 유전자 발현 패턴 및 원발암에서 기인한 유전자 발현 패턴이 혼재되어 있다.
원발부위가 같은 암들은 같은 색상으로 표시되는데, 도 8에 도시된 바와 같이 다양한 색상들의 마커들이 혼재되어 있어 유전자 발현 패턴만으로는 원발부위를 특정하는데 어려움이 있다.
예를 들어, 2차원 공간상의 특정 위치에 서로 다른 색상을 가지는 복수의 마커들이 위치하는바, 해당 샘플에 발생된 암의 원발부위를 명확하게 특정할 수 없게 된다.
반면, 도 9는 전이암이 발생된 조직 자체에서 기인한 유전자 발현 패턴이 제거된 유전자 발현 패턴이 도시되어 있다. 즉, 도 9에 도시된 마커들은 원발암 자체에서 기인한 유전자 발현 패턴들을 의미한다. 도 9에는 동일한 색상을 가지는 마커들이 군집을 이루고 있는바 유전자 발현 패턴만으로 원발암의 위치를 특정할 수 있게 된다.
따라서, 전이암 조직에서 채취한 샘플의 유전자 발현 패턴으로부터 원발부위를 명확하게 특정할 수 있게 된다는 효과를 달성할 수 있다.
도 10은 본 발명의 또 다른 실시예에 따른 인공지능을 이용한 원발부위불명암 진단 장치를 설명하기 위한 기능 블록도이다.
도 10에 도시된 바와 같이, 인공지능을 이용한 원발부위불명암 진단 장치(1000)는 하나 이상의 프로세서(1010), 프로세서(1010)에 의하여 수행되는 컴퓨터 프로그램을 로드(load)하는 메모리(1020), 버스(1030), 통신 인터페이스(1040), 컴퓨터 프로그램(1060)을 저장하는 스토리지(1050)를 포함할 수 있다.
다만, 도 10에는 본 개시의 실시예와 관련 있는 구성요소들만이 도시되어 있다. 따라서, 본 개시가 속한 기술분야의 통상의 기술자라면 도 10에 도시된 구성요소들 외에 다른 범용적인 구성요소들이 더 포함될 수 있음을 알 수 있다. 즉, 인공지능을 이용한 원발부위불명암 진단 장치(1000)에는, 도 10에 도시된 구성요소 이외에도 다양한 구성요소가 더 포함될 수 있다. 또는, 인공지능을 이용한 원발부위불명암 진단 장치(1000)는 도 10에 도시된 구성요소 중 일부를 제외하고 구성될 수도 있다.
프로세서(1010)는 인공지능을 이용한 원발부위불명암 진단 장치(1000)의 각 구성의 전반적인 동작을 제어할 수 있다. 프로세서(1010)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 개시의 기술 분야에 잘 알려진 임의의 형태의 프로세서 중 적어도 하나를 포함하여 구성될 수 있다. 또한, 프로세서(1010)는 본 개시의 실시예들에 따른 방법/동작을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 인공지능을 이용한 원발부위불명암 진단 장치(1000)는 하나 이상의 프로세서를 구비할 수 있다.
메모리(1020)는 각종 데이터, 명령 및/또는 정보를 저장할 수 있다. 메모리(1020)는 본 개시의 실시예들에 따른 방법을 실행하기 위하여 스토리지(1050)로부터 하나 이상의 컴퓨터 프로그램(1060)을 로드할 수 있다. 메모리(1020)는 RAM과 같은 휘발성 메모리로 구현될 수 있을 것이나, 이에 한정되는 것은 아니다.
다음으로, 버스(1030)은 인공지능을 이용한 원발부위불명암 진단 장치(1030)의 구성요소 간 통신 기능을 제공할 수 있다. 버스(1030)은 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.
다음으로, 통신 인터페이스(1040)는 인공지능을 이용한 원발부위불명암 진단 장치(1000)의 유무선 인터넷 통신을 지원할 수 있다. 또한, 통신 인터페이스(1040)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 통신 인터페이스(1040)는 본 개시의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다. 몇몇 실시예들에서, 통신 인터페이스(1040)는 생략될 수도 있다.
다음으로, 스토리지(1050)는 상기 하나 이상의 프로그램(1060)을 비임시적으로 저장할 수 있다. 스토리지(1050)는 ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 개시가 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.
다음으로, 컴퓨터 프로그램(1060)은 메모리(1020)에 로드될 때 프로세서(1010)로 하여금 본 개시의 다양한 실시예들에 따른 방법/동작을 수행하도록 하는 하나 이상의 인스트럭션들(instructions)을 포함할 수 있다. 즉, 프로세서(1010)는 상기 하나 이상의 인스트럭션들을 실행함으로써, 본 개시의 다양한 실시예들에 따른 방법/동작들을 수행할 수 있다.
예를 들어, 컴퓨터 프로그램(1060)은 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보를 생성하는 동작, 상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보에서 기 학습된 조직에서 기인한 유전자 발현 패턴 정보를 제거하는 동작, 상기 조직에서 기인한 유전자 발현 패턴 정보가 제거된 유전자 발현 패턴 정보와 기 학습된 암종별 유전자 발현 패턴 정보를 비교하는 동작 및 상기 전이암이 발생된 조직에서 채취한 샘플의 원발부위를 특정하는 동작을 수행하도록 하는 인스트럭션을 포함할 수 있다.
지금까지 도 1 내지 도 10을 참조하여 설명된 본 개시의 기술적 사상은 컴퓨터가 읽을 수 있는 매체 상에 컴퓨터가 읽을 수 있는 코드로 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는, 예를 들어 이동형 기록 매체(CD, DVD, 블루레이 디스크, USB 저장 장치, 이동식 하드 디스크)이거나, 고정식 기록 매체(ROM, RAM, 컴퓨터 구비 형 하드 디스크)일 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체에 기록된 상기 컴퓨터 프로그램은 인터넷 등의 네트워크를 통하여 다른 컴퓨팅 장치에 전송되어 상기 다른 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 다른 컴퓨팅 장치에서 사용될 수 있다.
이상에서, 본 개시의 실시예를 구성하는 모든 구성요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 개시의 기술적 사상이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 개시의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.
도면에서 동작들이 특정한 순서로 도시되어 있지만, 반드시 동작들이 도시된 특정한 순서로 또는 순차적 순서로 실행되어야만 하거나 또는 모든 도시 된 동작들이 실행되어야만 원하는 결과를 얻을 수 있는 것으로 이해되어서는 안 된다. 특정 상황에서는, 멀티태스킹 및 병렬 처리가 유리할 수도 있다. 더욱이, 위에 설명한 실시예들에서 다양한 구성들의 분리는 그러한 분리가 반드시 필요한 것으로 이해되어서는 안 되고, 설명된 프로그램 컴포넌트들 및 시스템들은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키지 될 수 있음을 이해하여야 한다.
이상 첨부된 도면을 참조하여 본 개시의 실시예들을 설명하였지만, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자는 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 본 개시가 다른 구체적인 형태로도 실시될 수 있다는 것을 이해할 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 개시의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 개시에 의해 정의되는 기술적 사상의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (10)

  1. 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보를 생성하는 단계;
    상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보에서 기 학습된 조직에서 기인한 유전자 발현 패턴 정보를 제거하는 단계;
    상기 조직에서 기인한 유전자 발현 패턴 정보가 제거된 유전자 발현 패턴 정보와 기 학습된 암종별 유전자 발현 패턴 정보를 비교하는 단계; 및
    상기 전이암이 발생된 조직에서 채취한 샘플의 원발부위를 특정하는 단계를 포함하는 인공지능을 이용한 원발부위불명암 진단 방법.
  2. 제1항에 있어서,
    상기 전이암이 발생된 조직에서 채취한 샘플은,
    상기 전이암이 발생된 장기의 정상 조직 및 암조직을 포함하는 인공지능을 이용한 원발부위불명암 진단 방법.
  3. 제1항에 있어서,
    상기 조직에서 기인한 유전자 발현 패턴 정보는,
    장기의 정상 조직에서 발현되는 특이적인 유전자 발현 패턴 정보인 인공지능을 이용한 원발부위불명암 진단 방법.
  4. 제1항에 있어서,
    상기 암종별 유전자 발현 패턴 정보는
    원발부위가 특정된 암조직에서 발현되는 특이적인 유전자 발현 패턴 정보인 인공지능을 이용한 원발부위불명암 진단 방법.
  5. 제1항에 있어서,
    상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보에서 기 학습된 조직에서 기인한 유전자 발현 패턴 정보를 제거하는 단계는,
    상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보를 제1 벡터로 변환하는 단계;
    상기 조직에서 기인한 유전자 발현 패턴 정보를 제2 벡터로 변환하는 단계; 및
    상기 제1 벡터에 대한 상기 제2 벡터의 차연산을 수행하는 단계를 포함하는 인공지능을 이용한 원발부위불명암 진단 방법.
  6. 제1항에 있어서,
    상기 전이암이 발생된 조직에서 채취한 샘플의 원발부위를 특정하는 단계는,
    기 학습된 복수의 원발부위 중 적어도 하나를 특정하는 단계를 포함하는 인공지능을 이용한 원발부위불명암 진단 방법.
  7. 제1항에 있어서,
    상기 전이암이 발생된 조직에서 채취한 샘플의 원발부위를 특정하는 단계는,
    원발부위 별로 확률값을 출력하는 단계를 포함하는 인공지능을 이용한 원발부위불명암 진단 방법.
  8. 제1항에 있어서,
    상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보, 상기 조직에서 기인한 유전자 발현 패턴 정보 및 상기 조직에서 기인한 유전자 발현 패턴 정보가 제거된 유전자 발현 패턴 정보는 RNA 서열 정보인 인공지능을 이용한 원발부위불명암 진단 방법.
  9. 제8항에 있어서,
    상기 RNA 서열 정보는 mRNA 서열 정보인 인공지능을 이용한 원발부위불명암 진단 방법.
  10. 하나 이상의 인스트럭션들(instructions)를 저장하는 메모리; 및
    상기 저장된 하나 이상의 인스트럭션을 실행시킴으로써,
    전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보를 생성하는 동작,
    상기 전이암이 발생된 조직에서 채취한 샘플의 유전자 발현 패턴 정보에서 기 학습된 조직에서 기인한 유전자 발현 패턴 정보를 제거하는 동작,
    상기 조직에서 기인한 유전자 발현 패턴 정보가 제거된 유전자 발현 패턴 정보와 기 학습된 암종별 유전자 발현 패턴 정보를 비교하는 동작 및
    상기 전이암이 발생된 조직에서 채취한 샘플의 원발부위를 특정하는 동작을 수행하는 프로세서를 포함하는,
    인공지능을 이용한 원발부위불명암 진단 장치.
PCT/KR2022/014191 2021-09-24 2022-09-22 인공지능을 이용한 원발부위불명암 진단 방법 WO2023048481A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US18/278,887 US20240062851A1 (en) 2021-09-24 2022-09-22 Method for diagnosing cancer of unknown primary site by using artificial intelligence

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20210126398 2021-09-24
KR10-2021-0126398 2021-09-24
KR10-2022-0059550 2022-05-16
KR1020220059550A KR20230043664A (ko) 2021-09-24 2022-05-16 인공지능을 이용한 원발부위불명암 진단 방법

Publications (1)

Publication Number Publication Date
WO2023048481A1 true WO2023048481A1 (ko) 2023-03-30

Family

ID=85720932

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2022/014191 WO2023048481A1 (ko) 2021-09-24 2022-09-22 인공지능을 이용한 원발부위불명암 진단 방법

Country Status (2)

Country Link
US (1) US20240062851A1 (ko)
WO (1) WO2023048481A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100084619A (ko) * 2007-10-31 2010-07-27 로세타 제노믹스 리미티드 마이크로―RNA/miRNA 의 감별 검출을 이용한 특정 암에 대한 진단 및 예후
US20110312530A1 (en) * 2007-03-27 2011-12-22 Rosetta Genomics Ltd Gene expression signature for classification of tissue of origin of tumor samples
KR20150138575A (ko) * 2014-05-30 2015-12-10 국립암센터 마이크로rna 프로파일을 이용한 간내 선암의 원발부위 예측방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110312530A1 (en) * 2007-03-27 2011-12-22 Rosetta Genomics Ltd Gene expression signature for classification of tissue of origin of tumor samples
KR20100084619A (ko) * 2007-10-31 2010-07-27 로세타 제노믹스 리미티드 마이크로―RNA/miRNA 의 감별 검출을 이용한 특정 암에 대한 진단 및 예후
KR20150138575A (ko) * 2014-05-30 2015-12-10 국립암센터 마이크로rna 프로파일을 이용한 간내 선암의 원발부위 예측방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MONZON FEDERICO A; MEDEIROS FABIOLA; LYONS-WEILER MAUREEN; HENNER W DAVID: "Identification of tissue of origin in carcinoma of unknown primary with a microarray-based gene expression test", DIAGNOSTIC PATHOLOGY, vol. 5, no. 1, 13 January 2010 (2010-01-13), pages 1 - 9, XP021069308, ISSN: 1746-1596 *
TANG WEI, WAN SHIXIANG, YANG ZHEN, TESCHENDORFF ANDREW E, ZOU QUAN: "Tumor origin detection with tissue-specific miRNA and DNA methylation markers", BIOINFORMATICS, vol. 34, no. 3, 1 February 2018 (2018-02-01), GB , pages 398 - 406, XP093054365, ISSN: 1367-4803, DOI: 10.1093/bioinformatics/btx622 *

Also Published As

Publication number Publication date
US20240062851A1 (en) 2024-02-22

Similar Documents

Publication Publication Date Title
WO2022149894A1 (ko) 병리 검체에 대한 판단 결과를 제공하는 인공 뉴럴 네트워크의 학습 방법, 및 이를 수행하는 컴퓨팅 시스템
Windhager et al. An end-to-end workflow for multiplexed image processing and analysis
CN105637098B (zh) 用于比对序列的方法和系统
WO2020096098A1 (ko) 어노테이션 작업 관리 방법, 이를 지원하는 장치 및 시스템
WO2021194056A1 (en) Method for training deep learning network based on artificial intelligence and learning device using the same
Wang et al. Computational resources for ribosome profiling: from database to Web server and software
CN104302781A (zh) 一种检测染色体结构异常的方法及装置
WO2022124725A1 (ko) 화합물과 단백질의 상호작용 예측 방법, 장치 및 컴퓨터 프로그램
Riordan et al. Automated analysis and classification of histological tissue features by multi-dimensional microscopic molecular profiling
WO2019235828A1 (ko) 투 페이스 질병 진단 시스템 및 그 방법
WO2021125744A1 (en) Method and system for providing interpretation information on pathomics data
Kats et al. SpatialDE2: fast and localized variance component analysis of spatial transcriptomics
WO2020022733A1 (ko) 전장유전체 시퀀싱 기반의 염색체 이상 검출 방법 및 그 용도
WO2017126943A1 (ko) 염색체 이상 판단 방법
WO2016117812A1 (ko) 암 바이오마커의 성능 평가 장치 및 방법
WO2022197044A1 (ko) 뉴럴 네트워크를 이용한 방광병변 진단 방법 및 그 시스템
Dixon et al. Spatially resolved transcriptomics and the kidney: many opportunities
WO2023048481A1 (ko) 인공지능을 이용한 원발부위불명암 진단 방법
WO2015053480A1 (ko) 생물학적 샘플 분석 시스템 및 방법
WO2023090709A1 (ko) 염색체 구조의 상태 정보를 이용한 세포 분석 장치 및 방법
WO2023043086A1 (ko) 막 단백질 정보를 이용한 치료 타깃 유전자 발굴 방법 및 분석장치
WO2022103175A1 (ko) 키메라 항원 수용체를 위한 타깃 항원 발굴 방법 및 분석 장치
WO2020184782A1 (ko) 공통 유전자 추출에 의한 다중 암 분류 방법
CN108733974B (zh) 一种基于高通量测序的线粒体序列拼接及拷贝数测定的方法
WO2022124736A1 (ko) 웹툰 컨텐츠 재배치 방법 및 그 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22873185

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 18278887

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2022873185

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2022873185

Country of ref document: EP

Effective date: 20240327