KR20170059069A - 대사 이상 질환 진단 장치 및 그 방법 - Google Patents

대사 이상 질환 진단 장치 및 그 방법 Download PDF

Info

Publication number
KR20170059069A
KR20170059069A KR1020150162860A KR20150162860A KR20170059069A KR 20170059069 A KR20170059069 A KR 20170059069A KR 1020150162860 A KR1020150162860 A KR 1020150162860A KR 20150162860 A KR20150162860 A KR 20150162860A KR 20170059069 A KR20170059069 A KR 20170059069A
Authority
KR
South Korea
Prior art keywords
gene
disease
metabolic
mutation
concentration
Prior art date
Application number
KR1020150162860A
Other languages
English (en)
Other versions
KR101795662B1 (ko
Inventor
이경아
김종원
박인호
Original Assignee
연세대학교 산학협력단
에스디지노믹스 주식회사
사회복지법인 삼성생명공익재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단, 에스디지노믹스 주식회사, 사회복지법인 삼성생명공익재단 filed Critical 연세대학교 산학협력단
Priority to KR1020150162860A priority Critical patent/KR101795662B1/ko
Priority to PCT/KR2016/013131 priority patent/WO2017086675A1/ko
Publication of KR20170059069A publication Critical patent/KR20170059069A/ko
Application granted granted Critical
Publication of KR101795662B1 publication Critical patent/KR101795662B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G06F19/34
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G06F19/22
    • G06F19/28
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/10Ontologies; Annotations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/20Heterogeneous data integration
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Bioethics (AREA)
  • Analytical Chemistry (AREA)
  • Electrochemistry (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

본 발명은 대사 이상 질환을 진단하는 장치와 그 방법에 관한 것이다.
본 발명에 따른 대사 이상 질환 검사 장치는, 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단부, 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별부, 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류부, 상기 분류된 유전자 상태에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별부, 및 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석부를 포함할 수 있다.

Description

대사 이상 질환 진단 장치 및 그 방법{Apparatus and Method for Diagnosis of metabolic disease}
본 발명은 대사 이상 질환을 진단하는 장치와 그 방법에 관한 것이다.
선천성 대사 이상 질환은 특정 유전자의 돌연변이 등으로 인해 해당 유전자가 관여하는 생화학적 대사 경로에 문제가 발생하여, 독성 전구 물질이 체내에 축적되거나 필수 대사 물질을 충분히 생산해내지 못함으로 인해 발생하는 질환이다. 이와 같은 선천성 대사 이상 질환의 대부분은 진단이 늦어지면 인체에 치명적 문제를 일으키므로, 조기에 진단하여 예방할 수 있도록 검사할 필요가 있다.
기존에 이와 같은 선천성 대사 이상 질환을 검사하는 방법으로는 텐덤 질량분석법과 유전체 시퀀싱 방법 등이 존재하고 있다.
먼저 텐덤 질량 분석법은 신체에서 채취한 혈액 여과지 검체(dried blood spots)에서 추출한 샘플을 탠덤 질량분석기(MS/MS)에 넣어 샘플 내의 존재하는 대사 물질들의 농도를 측정하고, 각 대사 물질의 농도가 이상이 있는지를 확인하는 방법이다. 그러나 위 기존 방법에 있어서는, 특정 대사 물질의 농도 이상을 결정하는 기준 값(cut-offs)의 결정이 쉽지 않고, 특정 대사 물질의 농도가 기준 값 근처의 값이 나온 경우에 양성 및 음성을 판단하는데 어려움이 있다. 또한 농도 이상으로 판정된 하나의 대사 물질이 여러 종류의 대사 질환과 관련되어 있는 경우가 있어, 정확한 대사 질환 판단이 어렵다는 문제점이 있다.
한편 유전체 시퀀싱 방법은 대사 질환 또는 유전 질환과 관련된 여러 유전자들에 존재하는 유전자 변이들을 검출하고, 상기 검출된 유전자 변이들이 특정 대사 이상 질환과 관련이 있는지를 유전자 변이 데이터베이스를 검색하여 확인하는 방법이다. 하지만, 위 기존 방법의 경우는 검출된 많은 수의 유전자 변이들에 실제로 임상적 의미가 있는지 여부를 확정하기에 어려움이 있다. 많은 경우, 검출된 유전자 변이에 대하여 기존에 보고된 참고 자료를 찾을 수가 없어 임상적으로 의미가 불확실한 (Variant of Uncertain Significance) 상태로 보고가 될 수 밖에 없고, 하나의 유전자가 아니라 여러 유전자에서 유전자 변이가 검출되기 때문에 하나의 질환으로 특정하기가 어렵다는 문제점이 있다.
(특허문헌 0001) 일본공개특허공보 제2011-85427호(2011.04.28.)
본 발명이 해결하고자 하는 과제는 질량분석 기반 검사가 이용하는 대사물질의 농도 정보와, 유전자 시퀀싱 방법이 이용하는 유전자 변이 정보를 통합적으로 이용하여, 검체에 대한 대사 이상 질환을 검사하는 장치 및 그에 관한 방법을 제공하는 것이다.
상기 과제를 해결하기 위해, 본 발명의 일 유형에 따른 대사 이상 질환 검사 장치는, 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단부, 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별부, 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류부, 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별부, 및 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석부를 포함할 수 있다.
여기서 상기 대사 이상 질환 검사 장치는 유전자 서열 정보 데이터를 입력받아, 상기 유전자 변이를 검출하고 변이의 종류를 분류하여 상기 유전자 변이 자료를 생성하는 유전자 변이 검출부를 더 포함할 수 있다.
여기서 상기 대사물질 농도 이상 판단부는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정하는 것을 특징으로 할 수 있다.
여기서 상기 대사물질 연관 질환 선별부는 대사물질-대사질환 연관성 데이터베이스를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별할 수 있다.
여기서 상기 유전자 상태 분류부는 상기 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 제거하여, 상기 유전자 상태를 분류할 상기 유전자 변이에 대한 필터링을 수행하는 필터링부를 포함하는 것을 특징으로 할 수 있다.
여기서 상기 유전자 상태 분류부는 사용자의 선택 입력을 수신하고, 그에 따라 상기 유전자 변이 자료 중 상기 유전자 상태를 분류할 상기 유전자 변이를 선택하는 선택부를 포함할 수 있다.
여기서 상기 유전자 상태 분류부는 상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류하는 변이 분류부를 포함할 수 있다.
여기서 상기 변이 분류부는 상기 유전자 변이에 대하여 상기 염기서열변이에 따른 유전자 상태를 분류하되, 동형접합(homozygote), 이형접합(heterozygote), 이중 대립형질 변이(bi-allelic variants), 복합 이형접합(compound heterozygote) 중 적어도 어느 하나 이상으로 분류하는 것을 특징으로 할 수 있다.
여기서 상기 변이 분류부는 상기 유전자 변이에 대하여 상기 유전자 복제 수 변이에 따른 유전자 상태를 분류하되, 복제 수 증가, 복제 수 변이 미발견, 이형접합 삭제(heterozygote deletion), 동형접합 삭제(homozygote deletion), 단가접합 삭제(hemizygote deletion) 중 적어도 어느 하나 이상으로 분류하는 것을 특징으로 할 수 있다.
상기 유전자 연관 질환 선별부는 유전자 변이 데이터베이스를 참조하여, 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 상기 유전자 연관 질환을 검색하여 선별하는 것을 특징으로 할 수 있다.
여기서 상기 유전자 연관 질환 선별부는 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 선별한 유전자 연관 질환의 선별 정확도를 설정하는 것을 특징으로 할 수 있다.
여기서 상기 유전자 연관 질환 선별부는, 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류가 동형접합(homozygote), 복합 이형접합(compound heterozygote), 동형접합 삭제(homozygote deletion), 단가접합 삭제(hemizygote deletion) 중 적어도 어느 하나에 해당하는지 여부, 또는 상기 선별한 유전자 연관 질환의 개수에 따라, 상기 선별 정확도를 설정하는 것을 특징으로 할 수 있다.
여기서 상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 것을 특징으로 할 수 있다.
여기서 상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수를 산출하는 것을 특징으로 할 수 있다.
여기서 상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 상기 대사 이상 질환의 선별 정확도를 설정하는 것을 특징으로 할 수 있다.
여기서 상기 통합 분석부는 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보에 따라 상기 검체에 대한 상기 대사 이상 질환을 판단하는 것을 특징으로 할 수 있다.
상기 과제를 해결하기 위해, 본 발명의 일 유형에 따른 대사 이상 질환 검사 방법은, 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단 단계, 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별 단계, 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류 단계, 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별 단계, 및 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석 단계를 포함할 수 있다.
여기서 상기 대사물질 농도 이상 판단 단계는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정할 수 있다.
여기서 상기 대사물질 연관 질환 선별 단계는 대사물질-대사질환 연관성 데이터베이스를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별할 수 있다.
여기서 상기 유전자 상태 분류 단계는 상기 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 제거하여, 상기 유전자 상태를 분류할 상기 유전자 변이에 대한 필터링을 수행하는 필터링 단계, 및 상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류하는 변이 분류 단계를 포함할 수 있다.
여기서 상기 통합 분석 단계는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수 또는 상기 대사 이상 질환의 선별 정확도 중 적어도 어느 하나 이상을 설정하는 것을 특징으로 할 수 있다.
본 발명에 따른 대사 이상 질환 검사 장치 및 그에 관한 방법에 의하면, 대사 물질 농도 이상 기반 분석 방법과 유전체 변이 기반 분석 방법을 함께 이용하여, 보다 정확하게 검체의 대사 이상 질환 보유 여부를 보다 진단할 수 있는 효과가 있다.
도 1은 본 발명에 따른 대사 이상 질환 검사 장치의 블록도이다.
도 2는 대사 이상 질환이 대사물질 농도 이상 표지 및 유전자와 연관되어 있음을 나타내는 참고도이다.
도 3의 (a)는 대사물질-대사질환 연관성 데이터베이스(10)가 테이블의 형태로 각 대사물질 농도 이상 표지에 대응하는 대사물질 연관 질환을 저장하는 일 예를 나타내는 참고도이다.
도 3의 (b)는 유전자 변이 데이터베이스(10)가 테이블의 형태로 각 유전자에 대응하는 유전자 연관 질환을 저장하는 일 예를 나타내는 참고도이다.
도 4는 대사물질 농도 이상 판단부(100)와 대사물질 연관 질환 선별부(200)의 동작을 설명하기 위한 참고도이다.
도 5는 유전자 변이 검출부(50)의 세부 블록도이다.
도 6은 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 테이블 형태로 나타낸 참고도이다.
도 7은 유전자 상태 분류부(300)의 세부 블록도이다.
도 8은 유전자 상태 분류부(300), 유전자 연관 질환 선별부(400)의 동작을 설명하기 위한 참고도이다.
도 9는 통합 분석부(500)의 분석 결과의 일 예를 나타내는 참고도이다.
도 10는 상기 본 발명에 따른 대사 이상 질환 검사 방법의 흐름도이다.
도 11은 유전자 상태 분류 단계(S300)의 세부 흐름도이다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다. 또한, 이하에서 본 발명의 바람직한 실시예를 설명할 것이나, 본 발명의 기술적 사상은 이에 한정하거나 제한되지 않고 당업자에 의해 변형되어 다양하게 실시될 수 있음은 물론이다.
선천성 대사 이상 질환은 특정 유전자의 돌연변이 등으로 인해 해당 유전자가 관여하는 생화학적 대사 경로에 문제가 발생하여, 독성 전구 물질이 체내에 축적되거나 필수 대사 물질을 충분히 생산해내지 못함으로 인해 발생하는 질환이다. 이와 같은 선천성 대사 이상 질환의 대부분은 진단이 늦어지면 인체에 치명적 문제를 일으키므로, 조기에 진단하여 예방할 수 있도록 검사할 필요가 있다. 특히 신생아에 대한 선천성 대사이상 질환의 보유 유무에 대한 선별 검사가 정확하게 이루어지는 것이 중요하다.
기존에 이와 같은 선천성 대사 이상 질환을 검사하는 방법으로는 텐덤 질량분석법(MS/MS)과 유전체 시퀀싱 방법 등이 존재하고 있다.
먼저 텐덤 질량 분석법은 신체에서 채취한 혈액 여과지 검체(dried blood spots)에서 추출한 샘플을 탠덤 질량분석기(MS/MS)를 이용하여 분석하여, 샘플 내의 존재하는 대사 물질들의 농도를 측정하고, 각 대사 물질의 농도가 이상이 있는지를 확인하는 방법이다. 그러나 텐덤 질량 분석법에 있어서는, 특정 대사 물질의 농도 이상을 결정하는 기준 값(cut-offs)의 결정이 쉽지 않고, 특정 대사 물질의 농도가 기준 값 근처의 값이 나온 경우에 양성 및 음성을 판단하는데 어려움이 있다. 또한 농도 이상으로 판정된 하나의 대사 물질이 여러 종류의 대사 질환과 관련되어 있는 경우가 있어, 정확한 대사 질환 판단이 어렵다는 문제점이 있다.
한편 유전체 시퀀싱 방법은 대사 질환 또는 유전 질환과 관련된 여러 유전자들에 존재하는 유전자 변이들을 검출하고, 상기 검출된 유전자 변이들이 특정 대사 이상 질환과 관련이 있는지를 HGMD 등의 유전자 변이 데이터베이스를 검색하거나 또는 참고 문헌을 검색하여 확인하는 방법이다. 예를 들면, Parabase Genomics 사의 NewbornDxTM는 신생아 대사질환 및 유전질환과 관련되어 있는 약 500 여 개의 유전자들에 대한 유전자 변이들을 동시에 검출하는 서비스를 제공한다. 하지만, 유전체 시퀀싱 방법의 경우는 검출된 많은 수의 유전자 변이들에 실제로 임상적 의미가 있는지 여부를 확정하기에 어려움이 있다. 또한 검출된 유전자 변이 중 일반 인구에서 발견하기 어려운 희귀 변이(rare variants)에 대하여는 기존의 유전자 변이 데이터베이스 또는 참고 자료에서 관련 정보를 찾을 수가 없어 임상적으로 의미가 불확실한 (Variant of Uncertain Significance, VUS) 상태로 보고가 될 수 밖에 없다. 또한 하나의 유전자가 아니라 여러 유전자에서 유전자 변이가 검출되기 때문에 하나의 질환으로 특정하기가 어렵다는 문제점이 있고, 특히 여러 유전자에서 VUS 유전자 변이가 검출될 가능성이 높기 때문에 임상적 해석을 내리기가 더 어렵다는 문제점이 있다.
이에 본 발명은 질량분석 기반 검사가 이용하는 대사물질의 농도 정보와, 유전자 시퀀싱 방법이 이용하는 유전자 변이 정보를 통합적으로 이용하여, 검체에 대한 대사 이상 질환을 검사하는 장치 및 그에 관한 방법을 제공하고자 한다.
이하에서는 본 발명의 일 실시예에 따른 대사 이상 질환 검사 장치의 세부 구성에 대하여 보다 상세하게 설명한다.
도 1은 상기 본 발명에 따른 대사 이상 질환 검사 장치의 블록도이다.
본 발명에 따른 대사 이상 질환 검사 장치는 대사물질 농도 이상 판단부(100), 대사물질 연관 질환 선별부(200), 유전자 상태 분류부(300), 유전자 연관 질환 선별부(400), 통합 분석부(500)를 포함할 수 있다.
여기서 본 발명에 따른 대사 이상 질환 검사 장치는 각 구성요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 또한 필요에 따라 각 구성요소들은 각각 하나의 독립적인 하드웨어로 구현되거나 각 하드웨어에 포함될 수도 있다. 또한 본 발명에 따른 대사 이상 질환 검사 장치는 소프트웨어 프로그램으로 구현되어 프로세서 또는 신호 처리 모듈 위에서 동작할 수 있고, 또는 하드웨어의 형태로 구현되어 각종 프로세서, 칩(Chip), 반도체, 소자 등에 포함될 수도 있다. 또한 본 발명에 따른 대사 이상 질환 검사 장치는 컴퓨터, 각종 임베디드 시스템 또는 디바이스 상에서 하드웨어 또는 소프트웨어 모듈의 형태로 포함되어 동작할 수 있다. 바람직하게는 본 발명에 따른 대사 이상 질환 검사 장치는 네트워크와 연결된 서버에서 구현되거나 서버에 포함될 수 있고, 이하 설명할 대사물질-대사질환 연관선 데이터베이스 및 유전자 변이 데이터베이스와 연동하여 동작할 수 있다. 또는 본 발명에 따른 대사 이상 질환 검사 장치는 독립적인 컴퓨터 장치에서 구현되거나 이에 포함될 수 있고, 상기 컴퓨터 장치가 대사물질-대사질환 연관선 데이터베이스 및 유전자 변이 데이터베이스를 내부 저장 장치에 저장할 수도 있다.
대사물질 농도 이상 판단부(100)는 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단한다.
대사물질 연관 질환 선별부(200)는 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별한다.
유전자 상태 분류부(300)는 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류한다.
유전자 연관 질환 선별부(400)는 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별한다.
통합 분석부(500)는 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정한다.
도 2는 대사 이상 질환(D)이 대사물질 농도 이상 표지(M) 및 유전자(G)와 모두 연관되어 있음을 나타내는 참고도이다. 예를 들면 Phenylalanine의 증가라는 대사물질 농도 이상 표지(M)는 Phenylkentonuria, GTP cyclohydrolase deficiency 등의 대사 이상 질환(D)과 연관될 수 있고, PAH 유전자와 관련성이 있는 대사 이상 질환(D)으로 Phenylkentonuria가 있을 수 있다.
통합 분석부(500)는 도 2와 같이 대사 이상 질환(D)이 대사물질 농도 이상 표지(M) 및 유전자(G)와 모두 연관되어 있다는 사실에 기초하여, 대사물질 농도 이상 판단부(100) 및 대사물질 연관 질환 선별부(200)의 동작에 따라 대사물질농도 이상이 발생한 대사물질에 관하여 선별된 대사물질 연관 질환과, 유전자 상태 분류부(300) 및 유전자 연고나 질환 선별부(400)의 동작에 따라 유전자 변이와 연관된 유전자 연관 질환 중에서, 대사물질 농도 이상과 유전자 변이의 상태에 관한 정보를 함께 이용하여 검체의 대사 이상 질환이 무엇인지를 판단할 수 있다.
이하에서는 대사물질 농도 이상 판단부(100)의 동작에 대하여 보다 상세히 설명한다.
대사물질 농도 이상 판단부(100)는 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단한다.
예를 들면 대사물질 농도 이상 판단부(100)는 대사물질 Phenylalanine에 대한 대사물질농도가 150으로 입력되었고, 대사물질 Phenylalanine에 대하여 미리 설정된 기준 농도가 "≤ 120 μmol/L"인 경우, 상기 대사물질농도가 기준 농도보다 크기 때문에 상기 대사물질농도가 이상에 해당한다고 판단할 수 있다.
여기서 대사물질 농도 이상 판단부(100)는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정할 수 있다.
여기서 대사물질농도의 이상 표지는 농도의 증가 또는 감소에 따라 미리 정해진 표지(marker)로써, 필요에 따라 미리 설정될 수 있다. 예를 들면 상기 대사물질농도의 이상 표지는 '증가', '약간 증가', '감소', '약간 감소'로 설정될 수 있고, 각 표지는 미리 설정된 임계치 또는 임계 비율에 따라 구분될 수 있다. 예를 들어 30% 이상 증가하는 경우를 '증가', 30% 이하로 증가하는 경우를 '약간 증가'로 구분할 수 있다.
위 예에서 대사물질 Phenylalanine의 대사물질농도가 150으로 기준 농도보다 30만큼 증가하였으므로, 이와 같은 경우 대사물질농도의 이상 표지는 '약간 증가'로 결정할 수 있다.
대사물질 농도 이상 판단부(100)는 검체에 대한 복수개의 대사물질에 대하여 각 입력받은 대사물질농도의 이상 여부를 판단하여, 적어도 하나 이상의 대사물질에 있어서 대사물질농도의 이상을 판단할 수 있다. 예를 들면 대사물질 농도 이상 판단부(100)는 대사물질 m1과 대사물질 m2에 대하여 각각 대사물질농도의 이상이 있음을 판단할 수 있고, 또한 그에 따라 대사물질 m1에 대한 대사물질농도의 이상 표지로 M1을, 대사물질 m2에 대한 대사물질농도의 이상 표지로 M2를 결정할 수 있다.
다음으로는 대사물질 연관 질환 선별부(200)의 동작에 대하여 보다 상세히 설명한다.
대사물질 연관 질환 선별부(200)는 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별한다.
예를 들면 대사물질 m1에 대하여 대사물질농도에 이상이 있는 것으로 판단된 경우, 대사물질 m1에 대응하는 대사물질 연관 질환으로 D1을 선별할 수 있다. 또한 여기서 대사물질 연관 질환 선별부(200)는 하나의 대사물질에 대하여 복수개의 대사 물질 연관 질환을 선별할 수도 있다. 이와 같은 경우 예를 들면 대사물질 m1에 대응하는 대사물질 연관 질환으로 D1, D2를 선별할 수도 있다.
여기서 대사물질 연관 질환 선별부(200)는 대사물질농도의 이상 표지에 대응하는 대사물질 연관 질환을 선별할 수 있다. 위의 예에서 대사물질 m1에 대하여 대사물질농도의 이상 표지가 M1으로 결정된 경우, M1 표지에 대응하는 대사물질 연관 질환으로 D1이나 또는 D1, D2를 선별할 수 있다.
또한 여기서 대사물질 연관 질환 선별부(200)는 복수개의 대사물질에 대하여 대사물질농도에 이상이 있는 것으로 판단된 경우, 각 대사물질농도의 이상과 관련된 대사물질 연관 질환을 모두 선별할 수도 있다. 예를 들면 대사물질 m1, m2에 대하여 대사물질농도의 이상이 판단된 경우, m1과 관련된 대사물질 연관 질환으로 D1, D2를 선별하고, m2와 관련된 대사물질 연관 질환으로 D3을 선별할 수 있다.
여기서 대사물질 연관 질환 선별부(200)는 대사물질-대사질환 연관성 데이터베이스(10)를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별할 수 있다.
여기서 대사물질-대사질환 연관성 데이터베이스(10)는 각 대사물질 농도 이상 표지에 대응하는 대사 이상 질환을 대사물질 연관 질환으로 하여 저장할 수 있다. 예를 들면 대사물질-대사질환 연관성 데이터베이스(10)는 테이블의 형태로 각 대사물질 농도 이상 표지에 대응하는 대사물질 연관 질환을 저장할 수 있다.
도 3의 (a)는 대사물질-대사질환 연관성 데이터베이스(10)가 테이블(M2D 테이블)의 형태로 각 대사물질 농도 이상 표지에 대응하는 대사물질 연관 질환을 저장하는 일 예를 나타내는 참고도이다.
도 4는 대사물질 농도 이상 판단부(100)와 대사물질 연관 질환 선별부(200)의 동작을 설명하기 위한 참고도이다. 도 4와 같이 대사물질농도가 주어진 경우 대사물질 농도 이상 판단부(100)는 Phenylalanine에 대하여 대사물질농도의 이상 표지가 '약간 증가'임을 판단할 수 있고, 대사물질 연관 질환 선별부(200)는 Phenylalanine의 '약간 증가'에 해당하는 대사물질 연관 질환을 대사물질-대사질환 연관성 데이터베이스(10)에서 검색하여 선별할 수 있다.
여기서 본 발명에 다른 대사 이상 질환 검사 장치는 필요에 따라 유전자 변이 검출부(50)를 더 포함할 수도 있다.
유전자 변이 검출부(50)는 유전자 서열 정보 데이터를 입력받아, 상기 유전자 변이를 검출하고 변이의 종류를 분류하여 상기 유전자 변이 자료를 생성한다.
여기서 유전자 서열 정보 데이터는 예를 들어 유전자 변이를 검출하기 위한 데이터로 복수개의 DNA 단편에 대한 서열 정보 데이터가 될 수 있다. 예를 들면 NGS(next generation sequencing) 기법으로 생산된 수만 내지 수백만 개의 짧은 DNA 단편에 대한 서열 정보 데이터가 될 수 있다. 여기서 유전자 서열 정보 데이터는 예를 들면 NGS 시퀀싱 장치에서 생산되어 fastq 형태 또는 bam 파일 형태로 저장된 데이터가 될 수 있다.
유전자 변이로는 유전자의 염기서열에 대한 변이가 있을 수 있고, 또는 유전자의 복제 수에 대한 변이가 있을 수 있다.
도 5는 유전자 변이 검출부(50)의 세부 블록도이다.
유전자 변이 검출부(50)는 염기서열 변이 검출부(51) 또는 유전자 복제수 변이 검출부(52) 중 적어도 어느 하나 이상을 포함할 수 있다.
염기서열 변이 검출부(51)는 상기 입력받은 유전자 서열 정보 데이터에서 염기서열에 변이가 발생한 유전자 변이를 검출할 수 있다. 여기서 염기서열 변이 검출부(51)는 짧은 DNA 단편에 대한 서열 정보(sequencing reads)를 인간 참조 게놈(reference genome) (hg19 등)에 맵핑하고, 특정 영역에 맵핑된 서열 정보(sequencing reads)와 참조 게놈(reference genome)과의 불일치 부분을 찾아 염기서열의 변이를 검출할 수 있다.
유전자 복제수 변이 검출부(52)는 다음과 같은 단계를 거쳐 유전자 복제수 변이를 검출할 수 있다.
여기서 유전자 복제수 변이 검출부(52)는 PCR 기반의 target enrichment를 수행하여 인간 게놈에서 특정 관심 영역 (예, 대사 이상과 관련되어 있는 유전자들의 영역) 만을 선택적으로 증폭시킨 후 NGS를 수행하여 얻은 유전자 서열 정보 데이터에 대하여 유전자 복제수 변이를 검출할 수 있다.
먼저 유전자 복제수 변이 검출부(52)는 각 샘플에 대한 amplicon 별 reads count 값 계산할 수 있다. 여기서 NGS 원시 데이터(fastq)를 bwa 또는 torrent suite 등의 S/W 활용하는 등의 통상의 방법으로 reference genome에 맵핑한 후, 특정 amplicon 영역에 mapping되는 sequencing reads의 개수를 계산할 수 있다. 이때 두 개 이상의 amplicons과 겹치는 read의 경우에는 두 amplicon 중 더 많은 부분이 겹치는 amplicon 에만 assign하여 계산할 수 있다.
다음으로 유전자 복제수 변이 검출부(52)는 Normalized Reads Count 계산할 수 있다. 여기서 각 샘플 별로 amplicon에 대한 raw reads count 값을 해당 샘플의 전체 amplicons의 raw reads count 값에 대한 median 값 또는 mean 값 등의 대표 통계 값으로 나누어 각 amplicon에 대한 normalized reads count 값을 계산할 수 있다.
다음으로 유전자 복제수 변이 검출부(52)는 Baseline construction을 수행할 수 있다. 여기서 3개 이상의 표준샘플들에 대한 시퀀싱 데이터를 활용하여 각 amplicon별로 normalized reads count에 대한 통계 모델을 구축할 수 있고, 이때 각 amplicon별로 구축한 통계 모델을 baseline 이라고 한다. 여기서 각 amplicon에 대한 통계 모델은 가장 간단하게는 평균과 분산으로 이루어진 정규분포를 생각할 수 있다.{Baseline(ampk) = N(μk,σk2)} 여기서 k 번째 amplicon은 평균 μk, 표준편차 σk 를 갖는 정규분포의 통계 모델을 보인다.
다음으로 유전자 복제수 변이 검출부(52)는 유전자 복제수 변이 검출할 수 있다. 여기서 특정 검체의 시퀀싱 데이터로부터 각 amplicon 별로 normalized reads count 값을 구하고, 해당 amplicon의 baseline의 평균값과 대비한 log2 fold change 값과 baseline으로부터 평균에서 벗어난 정도에 대한 통계적 유의 값인 p-value 계산할 수 있다. 다음으로 특정 Exon에 포함된 amplicon에 대한 log2 fold change 값과 p-value를 통합하여 해당 exon에 대한 복제 수 상태를 추론할 수 있고, 이때 각 exon 에 대하여 전체 exon에 포함된 amplicons의 50% 이상의 amplicon이 log2 fold change 값과 p-value 값이 특정 값 이하인 경우(예, Heterozygote Deletion: log2 fold change < -0.75 & p-value < 0.05, Homozygote Deletion: log2 fold change < - 1.5 & p-value < 0.05) 해당 엑손에 유전자 복제수 변이가 있다고 판단할 수 있다.
여기서 유전자 복제수 변이 검출부(52)는 특정 Gene에 포함된 amplicon에 대한 log2 fold 값과 p-value를 통합하여 해당 gene에 대한 복제 수 상태를 추론할 수 있고, 이때 각 gene 에 대하여 전체 gene에 포함된 amplicons의 50% 이상의 amplicon이 log2 fold change 값과 p-value 값이 특정 값 이하인 경우(예, Heterozygote Deletion: log2 fold change < -0.75 & p-value < 0.05, Homozygote Deletion: log2 fold change < - 1.5 & p-value < 0.05) 해당 유전자에 유전자 복제수 변이가 있다고 판단할 수 있다.
다음으로는 유전자 상태 분류부(300)의 동작에 대하여 보다 상세히 설명한다.
유전자 상태 분류부(300)는 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류한다.
여기서 유전자 변이는 유전자 서열 정보를 표준 참조 서열과 비교하여 검체의 유전자가 다른 염기조성을 갖는 것을 의미할 수 있고, 여기서 포준 참조 서열은 예를 들면 hg19 또는 hg38 등이 될 수 있다.
도 6은 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 테이블 형태로 나타낸 참고도이다.
여기서 유전자 상태 분류부(300)는 유전자 변이 검출부(50)에서 상세히 설명한 바와 같이 유전자 서열 정보 데이터로부터 검출된 유전자 변이에 관한 정보를 입력받을 수 있다.
도 7은 유전자 상태 분류부(300)의 세부 블록도이다.
여기서 유전자 상태 분류부(300)는 필요에 따라 필터링부(310)를 포함할 수 있다.
필터링부(310)는 상기 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 필터링하여 제거할 수 있다.
검체에 대한 유전자 서열 정보를 표준 참조 서열과 비교하여 유전자 변이를 검출하였다고 하더라도, 특정 유전자 변이가 질환의 원인이 되는 유전자 변이인지 아니면 단순한 다형성(polymorphism) 인지를 구분하여야, 검체의 질환 여부를 판단할 수 있다. 따라서 필터링부(310)는 유전자 변이 중 단순 다형성에 해당하는 것을 제거한다.
여기서 단순 다형성에 해당하는 유전자 변이는 특정 인구 집단에 대하여 유전자 변이가 소정의 비율 이상으로 발생하는 유전자 변이를 의미할 수 있다. 이와 같이 특정 인구 집단에 대하여 일반적으로 발생할 수 있는 다형성이고 질환과는 관계성이 없다고 볼 수 있기 때문에, 단순 다형성으로 분류하여 필터링하는 것이 바람직하다.
예를 들면 검체의 유전자 변이 데이터를 각 인종 별로 대립 형질 빈도수(allele frequency) 값이 계산되거나 계산할 수 있는 있는 유전자 변이 DB에서 어느 한 인구에서라도 대립 형질 빈도수 값이 소정의 임계 값 이상이 되는 유전자 변이들을 단순 다형성에 해당하는 것으로 정의할 수 있다. 여기서 유전자 변이 DB는 예를 들어 dbSNP, 1000 genomes, ESP6500, ExAC 등이 될 수 있다. 예를 들면 필터링부(310)는 대립 형질 빈도수가 3% 이상이 되는 유전자 변이들을 단순 다형성으로 사전에 정의하고, 이에 해당하는 유전자 변이들을 상술한 바와 같이 필터링하여 제거할 수 있다. 또한 여기서 상기 임계 값은 필요에 따라 3%가 아닌 1% 또는 5%등 다양한 값으로 설정될 수 있음은 물론이다.
여기서 유전자 상태 분류부(300)는 필요에 따라 선택부(320)를 포함할 수 있다.
선택부(320)는 사용자의 선택 입력을 수신하고, 그에 따라 상기 유전자 변이 자료 중 상기 유전자 상태를 분류할 상기 유전자 변이를 선택할 수 있다. 선택부(320)를 통하여 사용자는 이후 분석에 특정 유전자 변이를 포함시킬지 여부를 선택할 수 있다. 여기서 사용자의 선택 입력은 키보드, 마우스, 터치 스크린 등의 다양한 사용자 인터페이스 장치를 이용하여 장치에 입력된 정보가 될 수 있다. 그리고 선택부(320)는 유전자 변이에 관한 정보를 출력할 수 있고, 상기 출력된 정보는 디스플레이 장치 등을 통하여 사용자에게 제공될 수 있다.
여기서 사용자에게 제공되는 유전자 변이에 관한 정보는 일반 인구군에서의 발생 빈도에 관한 정보, 질환 원인 유전자 변이 DB (예, ClinVar, HGMD, KMD 등) 에서의 등재 여부에 관한 정보, 내부 유전자 변이 DB 에서의 판단 여부에 관한 정보, in-silico tools (SIFT, Polyphen2, MutationTaster 등) 에서의 예측 값에 관한 정보 중 어느 하나 이상을 포함할 수 있다. 여기서 내부 유전자 변이 DB는 각 유전자의 염기서열 변이 별로 병원성(Pathogenic, VP), 병원성 가능(Likely Pathogenic, VLP), 양성(Benign, VB), 양성 가능(Likely Benign, VLB), 불확실(Uncertain Significance, VUS)으로 구분하여 저장해놓은 데이터베이스가 될 수 있다.
여기서 유전자 상태 분류부(300)는 필터링부(310)와 선택부(320) 중 적어도 어느 하나 이상을 포함할 수 있고, 필터링부(310)의 필터링 결과 또는 선택부(320)의 선택 결과에 대하여 유전자 상태를 분류할 수 있다. 유전자 상태 분류부(300)는 필터링부(310)와 선택부(320) 모두를 포함하는 경우, 필터링부(310)의 필터링을 수행한 다음 선택부(320)에서의 선택에 따라 유전자 상태를 분류할 유전자 변이를 선택할 수도 있다.
여기서 유전자 상태 분류부(300)는 변이 분류부(330)를 포함할 수 있다.
변이 분류부(330)는 유전자 상태 분류부(300)가 입력받은 유전자 변이 자료에 포함된 유전자 변이에 대하여 유전자 상태를 분류할 수 있다. 여기서 유전자 상태 분류부(300)가 필터링부(310)를 포함하는 경우, 변이 분류부(330)는 필터링부(310)에서 필터링된 후의 유전자 변이 자료에 포함된 유전자 변이에 대하여 유전자 상태를 분류할 수 있다. 또한 여기서 유전자 상태 분류부(300)가 선택부(320)를 포함하는 경우, 변이 분류부(330)는 선택부(320)에 의하여 선택된 유전자 변이에 대하여 유전자 상태를 분류할 수 있다.
변이 분류부(330)는 상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류할 수 있다. 즉 변이 분류부(330)는 유전자 변이가 염기서열 변이에 따른 유전자 상태 중 어느 상태에 해당하는지를 분류할 수 있고, 또는/또한 유전자 변이가 유전자 복제 수 변이에 따른 유전자 상태 중 어느 상태에 해당하는지를 분류할 수도 있다.
여기서 변이 분류부(330)는 상기 유전자 변이에 대하여 상기 염기서열변이에 따른 유전자 상태를 분류하되, 동형접합(homozygote), 이형접합(heterozygote), 이중 대립형질 변이(bi-allelic variants), 복합 이형접합(compound heterozygote) 중 적어도 어느 하나 이상으로 분류할 수 있다.
여기서 염기서열 변이에 따른 유전자 상태는 동형접합(homozygote, HO), 이형접합(heterozygote, HE), 이중 대립형질 변이(bi-allelic variants, BI), 복합 이형접합(compound heterozygote, CE) 중 어느 하나가 될 수 있다.
상기 염기서열 변이에 따른 유전자 상태는 하기 표 1과 같이 정의될 수 있다.
유전자 상태 정 의
HO(Homozygote) 유전자에 포함된 최소 하나의 유전자 변이가 homozygote 변이인 경우.
CE(Compound Heterozygotes) 유전자에 두 개 이상의 heterozygotes 유전자 변이가 있는 경우, 또는 최소 두 개의 heterozygotes 유전자 변이가 서로 다른 두 대립 염색체 상에 존재하는지가 확인된 경우
BI(Bi-Allelic Heterozygotes) 유전자에 두 개 이상의 heterozygotes 유전자 변이가 있지만, 유전자 변이들의 서로 다른 두 대립 염색체 상에 존재하는지 여부가 확인되지 않았거나, 모든 유전자 변이들이 하나의 동일한 염색체 상에서만 존재하는 경우
HE (Heterozygote) 유전자에 단 하나의 유전자 변이만 있으며, 해당 유전자 변이가 heterozygote인 경우
여기서 변이 분류부(330)는 상기 유전자 변이에 대하여 상기 유전자 복제 수 변이에 따른 유전자 상태를 분류하되, 복제 수 증가(Gain), 복제수 변이 미발견(Neutral), 이형접합 삭제(heterozygote deletion, HED), 동형접합 삭제(homozygote deletion) 또는 단가접합 삭제(hemizygote deletion)(HOD) 중 적어도 어느 하나 이상으로 분류할 수 있다. 여기서 HOD는 동형접합 삭제(homozygote deletion) 또는 단가접합 삭제(hemizygote deletion) 중 어느 하나의 상태를 모두 지칭하는 약어로 사용한다.
상기 유전자 복제 수 변이에 따른 유전자 상태는 하기 표 2와 같이 정의될 수 있다.
유전자 상태 정의
HOD(Homozygote Deletion or Hemizygote Deletion) 유전자 전부 또는 유전자의 특정 부분이 두 개의 대립 염색체에서 모두 deletion 된 경우 (homozygote deletion) 또는 성 염색체처럼 하나의 세포 내에 하나의 염색체만 있는 경우에는 해당 염색체에서 유전자 전부 또는 유전자의 특정 부분이 deletion 된 경우(Hemizygote deletion)를 포함.
HED(Heterozygote Deletion) 유전자 전부 또는 유전자의 특정 부분이 두 개의 대립 염색체 중 하나의 대립 염색체상에서만 deletion 된 경우(heterozygote deletion).
Neutral 유전자에 대한 복제수 변이가 발견되지 않은 경우
Gain 유전자 전부 또는 유전자의 특정 부위에 대한 복제수가 증가한 경우
여기서 변이 분류부(330)는 유전자 변이 검출부(50)에서 유전자 변이의 유전자 상태 중 일부 또는 전부가 분류되어 유전자 변이 자료에 해당 분류 정보가 포함된 경우, 해당 유전자 변이에 대하여 기 분류된 유전자 상태에 관한 정보를 그대로 이용하여, 유전자 변이에 대한 유전자 상태를 결정할 수도 있다.
다음으로는 유전자 연관 질환 선별부(400)에 대하여 보다 상세히 설명한다.
유전자 연관 질환 선별부(400)는 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별한다. 여기서 유전자 연관 질환 선별부(400)는 유전자 변이 자료에 포함된 유전자 변이 중에서 필터링부(310) 또는 선택부(320)에 의하여 필터링되거나 선택된 결과, 남은 유전자 변이 즉 남아서 유전자 상태가 분류된 유전자 변이에 대하여 유전자 연관 질환을 선별할 수 있다.
여기서 유전자 연관 질환 선별부(400)는 유전자 변이 데이터베이스(20)를 참조하여, 상기 유전자 상태가 분류된 유전자 변이에 대응하는 상기 유전자 연관 질환을 검색하여 선별할 수 있다.
예를 들어 유전자 연관 질환 선별부(400)는 유전자 변이 G1에 대응하는 유전자 연관 질환으로 D1을 유전자 변이 데이터베이스(20)에서 검색하여 선별할 수 있다. 또는 경우에 따라 유전자 연관 질환으로 복수 개를 선별할 수도 있다(D1, D2).
여기서 유전자 변이 데이터베이스(10)는 각 유전자 또는 유전자의 변이에 대응하는 대사 이상 질환을 유전자 연관 질환으로 하여 저장할 수 있다. 예를 들면 유전자 변이 데이터베이스(10)는 테이블의 형태로 각 유전자 또는 유전자 변이에 대응하는 유전자 연관 질환을 저장할 수 있다.
도 3의 (b)는 유전자 변이 데이터베이스(10)가 테이블(G2D 테이블)의 형태로 각 유전자에 대응하는 유전자 연관 질환을 저장하는 일 예를 나타내는 참고도이다.
여기서 유전자 연관 질환 선별부(400)는 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 선별한 유전자 연관 질환의 선별 정확도를 설정할 수 있다. 여기서 선별 정확도는 상기 유전자 변이에 대응하는 유전자 연관 질환이 어느 정도의 정확도를 가지고 선별된 것인지를 나타내는 정도 또는 매칭된 정도를 나타내는 값으로, 미리 정의된 복수개의 값 중 어느 하나로 설정될 수 있다. 예를 들면 상기 선별 정확도는 1 내지 4단계를 가질 수 있고, 각 단계는 선별 정확도가 높은 순서대로 1 단계는 '일치'(Consistent with), 2 단계는 '가능성 상'(Most likely), 3 단계는 '의심'(Rule Out, R/O), 4 단계는 '가능성 하'(Less likely)로 설정될 수 있다. 여기서 상기 선별 정확도의 각 단계가 4단계가 아닌 다른 수의 단계가 될 수 있고, 각 단계의 이름이 필요에 따라 다른 이름으로 설정될 수 있음은 물론이다.
여기서 유전자 연관 질환 선별부(400)는, 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류가 동형접합(homozygote, HO), 복합 이형접합(compound heterozygote, CE), 동형접합 삭제(homozygote deletion) 또는 단가접합 삭제(hemizygote deletion)(HOD) 중 적어도 어느 하나에 해당하는지 여부, 또는 상기 선별한 유전자 연관 질환의 개수에 따라, 상기 선별 정확도를 설정할 수 있다.
여기서 유전자 연관 질환 선별부(400)는 유전자 상태 분류부(300)에 의하여 분류된 유전자 상태에 대응하는 유전자 변이
바람직하게는 유전자 연관 질환 선별부(400)는 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류와 유전자 연관 질환의 개수에 관하여, 도 12의 표 3에 기재된 것과 같은 기준 및 조건에 따라 선별된 유전자 연관 질환의 선별 정확도를 설정할 수 있다.
도 8은 유전자 상태 분류부(300), 유전자 연관 질환 선별부(400)의 동작을 설명하기 위한 참고도이다. 도 8과 같이 검체의 유전자 변이에 관한 정보가 입력되면 유전자 상태 분류부(300)가 유전자 변이의 종류에 따라 유전자 상태를 분류할 수 있고, 유전자 연관 질환 선별부(400)가 분류한 유전자 상태 정보를 이용하여 유전자 연관 질환을 선별할 수 있다.
다음으로는 통합 분석부(500)의 동작에 대하여 보다 상세히 설명한다.
통합 분석부(500)는 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정한다.
여기서 통합 분석부(500)는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정할 수 있다.
여기서 통합 분석부(500)는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수를 산출할 수 있다. 여기서 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보는 상기 매칭 점수가 될 수 있다. 여기서 상기 매칭 점수는 소정의 범위를 가지는 점수가 될 수 있고, 또는 순위를 나타내는 순위 점수가 될 수 있고, 필요에 따라 기타 다양한 방식으로 표현될 수 있다. 예를 들면 상기 매칭 점수는 0 점 내지 M 점의 범위를 가지는 점수의 형태로 표현될 수 있고, 또는 1 순위 내지 N 순위의 범위를 가지는 순위 점수가 될 수도 있다.
예를 들면 통합 분석부(500)는 도 13의 표 4와 같이 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보와 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보에 따라 상기 매칭 점수를 1 내지 6 중에서 결정할 수 있다.
또한 통합 분석부(500)는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 상기 대사 이상 질환의 선별 정확도를 설정할 수 있다.
여기서 대사 이상 질환의 선별 정확도는 상술한 바 유전자 연관 질환의 선별 정확도와 유사하게 정의될 수 있다. 즉 대사 이상 질환의 선별 정확도는 대사 이상 질환이 어느 정도의 정확도를 가지고 선별된 것인지를 나타내는 정도 또는 매칭된 정도를 나타내는 값으로, 미리 정의된 복수개의 값 중 어느 하나로 설정될 수 있다. 예를 들면 상기 선별 정확도는 1 내지 4단계를 가질 수 있고, 각 단계는 선별 정확도가 높은 순서대로 1 단계는 '일치'(Consistent with), 2 단계는 '가능성 상'(Most likely), 3 단계는 '의심'(Rule Out, R/O), 4 단계는 '가능성 하'(Less likely)로 설정될 수 있다. 여기서 상기 선별 정확도의 각 단계가 4단계가 아닌 다른 수의 단계가 될 수 있고, 각 단계의 이름이 필요에 따라 다른 이름으로 설정될 수 있음은 물론이다.
바람직하게는 통합 분석부(500)는 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보와 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보에 따라 상기 매칭 점수를 결정한 다음, 상기 매칭 점수를 더 이용하여 상기 대사 이상 질환의 선별 정확도를 설정할 수 있다.
예를 들면 통합 분석부(500)는 도 13의 표 4와 같이 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보와 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보에 따라 상기 매칭 점수를 1 내지 6 중에서 결정한 다음, 대사 이상 질환에 대한 선별 정확도를 최종적으로 설정할 수 있다.
여기서 통합 분석부(500)는 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보에 따라 상기 검체에 대한 상기 대사 이상 질환을 판단할 수 있다. 여기서 도 13의 표 4에서 매칭 점수가 소정의 기준 이하로 낮은(순위가 소정의 기준 이상으로 가장 높은) 후보 질환이 해당 검체의 대사 이상 질환이라고 판단할 수 있고, 또한 대사 이상 질환에 대한 선별 정확도에 따라 해당 검체에 대하여 대사 이상 질환이 어느 정도의 정확도를 가지고 선별되었는지 여부를 판단할 수 있다.
상기 표 4에서 상위순위 질환이라 함은, 후보 질환이 2개 이상 존재할 경우, 후보 질환 중 더 높은 매칭 점수를 갖는 질환을 상위순위 질환이라 지칭한다.
예를 들어 A라는 후보 질환이 매칭 점수 1을 갖고, B라는 후보 질환이 매칭 점수 2를 가질 경우, 매칭 점수 1을 갖는 후보 질환이 우선적으로 고려될 수 있는 질환이므로, 통합 분석부(500)는 매칭 점수 2를 갖는 B 질환에 대하여는 Less Likely 라는 대사 이상 질환의 선별 정확도를 설정할 수 있다. 여기서 만일 매칭 점수가 B보다 높은 질환이 없는 경우는 B 질환에 대하여 Most Likely라는 선별 정확도를 설정할 수 있다.
여기서 매칭 점수는 순위 점수의 형태로 나타나므로 더 작은 숫자가 더 높은 매칭 점수를 가지는 것으로 정의할 수 있다. 즉 예를 들면 매칭 점수 1이 매칭 점수 2 보다 상위 순위가 된다. 여기서 매칭 점수는 필요에 따라 다양한 값이나 순서를 가지도록 정의되어 사용될 수 있음은 물론이다.
여기서 만일 동률의 최고 높은 매칭 점수를 갖는 후보 질환이 2개 이상인 경우는 해당 후보 질환들에 대해서는 상위순위 질환이 없는 것으로 하여 선별 정확도를 설정할 수도 있다.
도 9는 통합 분석부(500)의 분석 결과의 일 예를 나타내는 참고도이다.
본 발명의 또 다른 실시예에 따른 대사 이상 질환 검사 방법은 대사물질 농도 이상 판단 단계(S100), 대사물질 연관 질환 선별 단계(S200), 유전자 상태 분류 단계(S300), 유전자 연관 질환 선별 단계(S400), 통합 분석 단계(S500)를 포함할 수 있다. 여기서 상기 대사 이상 질환 검사 방법은 도 1 내지 도 8을 참조하면서 상세히 설명한 본 발명에 따른 대사 이상 질환 검사 장치가 동작하는 방법과 동일한 방식으로 동작할 수 있다. 또한 상기 대사 이상 질환 검사 방법은 본 발명에 따른 대사 이상 질환 검사 장치의 각 구성 부분에 의하여 상술한 바와 같이 수행될 수 있다. 이에 중복되는 부분은 생략하고 간략하게 설명한다.
도 10은 상기 본 발명에 따른 대사 이상 질환 검사 방법의 흐름도이다.
대사물질 농도 이상 판단 단계(S100)는 검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단한다.
대사물질 연관 질환 선별 단계(S200)는 상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별한다.
유전자 상태 분류 단계(S300)는 상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류한다.
유전자 연관 질환 선별 단계(S400)는 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별한다.
통합 분석 단계(S500)는 상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정한다.
여기서 대사물질 농도 이상 판단 단계(S100)는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정할 수 있다.
다음으로 대사물질 연관 질환 선별 단계(S200)는 대사물질-대사질환 연관성 데이터베이스(10)를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별할 수 있다.
여기서 유전자 상태 분류 단계(S300)는 필터링 단계(S310), 변이 분류 단계(S320)를 포함할 수 있다.
도 11은 유전자 상태 분류 단계(S300)의 세부 흐름도이다.
필터링 단계(S310)는 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 필터링하여 제거하여, 상기 유전자 상태를 분류할 상기 유전자 변이에 대한 필터링을 수행할 수 있다.
변이 분류 단계(S320)는 상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류한다.
유전자 연관 질환 선별 단계(S400)는 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 선별한 유전자 연관 질환의 선별 정확도를 설정할 수 있다.
통합 분석 단계(S500)는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수 또는 상기 대사 이상 질환의 선별 정확도 중 적어도 어느 하나 이상을 설정할 수 있다.
이상에서 설명한 본 발명의 실시예를 구성하는 모든 구성요소들이 하나로 결합하거나 결합하여 동작하는 것으로 기재되어 있다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.
또한, 그 모든 구성요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 또한, 이와 같은 컴퓨터 프로그램은 USB 메모리, CD 디스크, 플래쉬 메모리 등과 같은 컴퓨터가 읽을 수 있는 기록매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 기록매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.
또한, 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 상세한 설명에서 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서, 본 발명에 개시된 실시예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.
100 : 대사물질 농도 이상 판단부
200 : 대사물질 연관 질환 선별부
300 : 유전자 상태 분류부
310 : 필터링부
320 : 선택부
330 : 변이 분류부
400 : 유전자 연관 질환 선별부
500 : 통합 분석부
10 : 대사물질-대사질환 연관성 DB
20 : 유전자 변이 DB
50 : 유전자 변이 검출부
51 : 염기서열 변이 검출부
52 : 유전자 복제수 변이 검출부
S100 : 대사물질 농도 이상 판단 단계
S200 : 대사물질 연관 질환 선별 단계
S300 : 유전자 상태 분류 단계
S310 : 필터링 단계
S320 : 변이 분류 단계
S400 : 유전자 연관 질환 선별 단계
S500 : 통합 분석 단계

Claims (20)

  1. 대사 이상 질환 검사 장치에 있어서,
    검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단부;
    상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별부;
    상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류부;
    상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별부; 및
    상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석부를 포함하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  2. 제1항에 있어서,
    유전자 서열 정보 데이터를 입력받아, 상기 유전자 변이를 검출하고 변이의 종류를 분류하여 상기 유전자 변이 자료를 생성하는 유전자 변이 검출부를 더 포함하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  3. 제1항에 있어서,
    상기 대사물질 농도 이상 판단부는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  4. 제3항에 있어서,
    상기 대사물질 연관 질환 선별부는 대사물질-대사질환 연관성 데이터베이스를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  5. 제1항에 있어서,
    상기 유전자 상태 분류부는 상기 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 제거하여, 상기 유전자 상태를 분류할 상기 유전자 변이에 대한 필터링을 수행하는 필터링부를 포함하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  6. 제1항에 있어서,
    상기 유전자 상태 분류부는 사용자의 선택 입력을 수신하고, 그에 따라 상기 유전자 변이 자료 중 상기 유전자 상태를 분류할 상기 유전자 변이를 선택하는 선택부를 포함하는 것을 특징으로 하는 대상 이상 질환 검사 장치.
  7. 제1항에 있어서,
    상기 유전자 상태 분류부는 상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류하는 변이 분류부를 포함하는 것을 특징으로 하는 대상 이상 질환 검사 장치.
  8. 제7항에 있어서,
    상기 변이 분류부는 상기 유전자 변이에 대하여 상기 염기서열변이에 따른 유전자 상태를 분류하되, 동형접합(homozygote), 이형접합(heterozygote), 이중 대립형질 변이(bi-allelic variants), 복합 이형접합(compound heterozygote) 중 적어도 어느 하나 이상으로 분류하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  9. 제7항에 있어서,
    상기 변이 분류부는 상기 유전자 변이에 대하여 상기 유전자 복제 수 변이에 따른 유전자 상태를 분류하되, 복제 수 증가, 복제 수 변이 미발견, 이형접합 삭제(heterozygote deletion), 동형접합 삭제(homozygote deletion), 단가접합 삭제(hemizygote deletion) 중 적어도 어느 하나 이상으로 분류하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  10. 제1항에 있어서,
    상기 유전자 연관 질환 선별부는 유전자 변이 데이터베이스를 참조하여, 상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 상기 유전자 연관 질환을 검색하여 선별하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  11. 제1항에 있어서,
    상기 유전자 연관 질환 선별부는 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 선별한 유전자 연관 질환의 선별 정확도를 설정하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  12. 제11항에 있어서,
    상기 유전자 연관 질환 선별부는, 상기 선별한 유전자 연관 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류가 동형접합(homozygote), 복합 이형접합(compound heterozygote), 동형접합 삭제(homozygote deletion), 단가접합 삭제(hemizygote deletion) 중 적어도 어느 하나에 해당하는지 여부, 또는 상기 선별한 유전자 연관 질환의 개수에 따라, 상기 선별 정확도를 설정하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  13. 제1항에 있어서,
    상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  14. 제13항에 있어서,
    상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수를 산출하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  15. 제13항에 있어서,
    상기 통합 분석부는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 상기 대사 이상 질환의 선별 정확도를 설정하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  16. 제1항에 있어서,
    상기 통합 분석부는 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보에 따라 상기 검체에 대한 상기 대사 이상 질환을 판단하는 것을 특징으로 하는 대사 이상 질환 검사 장치.
  17. 대사 이상 질환 검사 방법에 있어서,
    검체에 대한 각 대사물질 별 대사물질농도 값을 입력받고, 상기 입력받은 대사물질농도를 상기 대사물질 별 기준 농도와 비교하여 상기 대사물질농도의 이상 여부를 판단하는 대사물질 농도 이상 판단 단계;
    상기 대사물질농도에 이상이 있는 것으로 판단된 상기 대사물질에 대응하는 대사물질 연관 질환을 선별하는 대사물질 연관 질환 선별 단계;
    상기 검체에 대하여 검출된 유전자 변이에 관한 정보를 포함하는 유전자 변이 자료를 입력받고, 상기 유전자 변이를 미리 정해진 복수개의 유전자 상태 중 어느 하나로 분류하는 유전자 상태 분류 단계;
    상기 유전자 상태가 분류된 상기 유전자 변이에 대응하는 유전자 연관 질환을 선별하는 유전자 연관 질환 선별 단계; 및
    상기 선별한 대사물질 연관 질환 또는 유전자 연관 질환에 포함된 질환을 후보 질환으로 설정하고, 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 따라 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 정보를 결정하는 통합 분석 단계를 포함하는 것을 특징으로 하는 대사 이상 질환 검사 방법.
  18. 제17항에 있어서,
    상기 대사물질 농도 이상 판단 단계는 상기 대사물질농도를 상기 기준 농도와 비교하여, 농도의 증감 여부 또는 증감의 정도에 따라 상기 대사물질농도의 이상 표지를 결정하고,
    상기 대사물질 연관 질환 선별 단계는 대사물질-대사질환 연관성 데이터베이스를 참조하여, 상기 결정한 대사물질농도의 이상 표지에 대응하는 상기 대사물질 연관 질환을 검색하여 선별하는 것을 특징으로 하는 대사 이상 질환 검사 방법.
  19. 제17항에 있어서, 상기 유전자 상태 분류 단계는
    상기 입력받은 유전자 변이 자료에서 단순 다형성(polymorphism)에 해당하는 상기 유전자 변이를 제거하여, 상기 유전자 상태를 분류할 상기 유전자 변이에 대한 필터링을 수행하는 필터링 단계; 및
    상기 유전자 변이 자료에 포함된 각 상기 유전자 변이를 상기 유전자 상태 중 어느 하나로 분류하되, 염기서열변이에 따른 유전자 상태 또는 유전자 복제 수 변이에 따른 유전자 상태 중 적어도 어느 하나 이상을 분류하는 변이 분류 단계;를 포함하는 것을 특징으로 하는 대상 이상 질환 검사 방법.
  20. 제17항에 있어서,
    상기 통합 분석 단계는 상기 후보 질환에 대응하는 상기 유전자 변이의 상기 유전자 상태의 종류에 관한 정보와, 상기 후보 질환이 상기 대사물질 연관 질환 또는 유전자 연관 질환에 모두 해당하는지 또는 어느 하나에 해당하는지 여부에 관한 정보를 이용하여, 상기 후보 질환이 상기 검체의 대사 이상 질환에 해당하는지 여부에 관한 매칭 점수 또는 상기 대사 이상 질환의 선별 정확도 중 적어도 어느 하나 이상을 설정하는 것을 특징으로 하는 대사 이상 질환 검사 방법.
KR1020150162860A 2015-11-19 2015-11-19 대사 이상 질환 진단 장치 및 그 방법 KR101795662B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020150162860A KR101795662B1 (ko) 2015-11-19 2015-11-19 대사 이상 질환 진단 장치 및 그 방법
PCT/KR2016/013131 WO2017086675A1 (ko) 2015-11-19 2016-11-15 대사 이상 질환 진단 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150162860A KR101795662B1 (ko) 2015-11-19 2015-11-19 대사 이상 질환 진단 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20170059069A true KR20170059069A (ko) 2017-05-30
KR101795662B1 KR101795662B1 (ko) 2017-11-13

Family

ID=58717580

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150162860A KR101795662B1 (ko) 2015-11-19 2015-11-19 대사 이상 질환 진단 장치 및 그 방법

Country Status (2)

Country Link
KR (1) KR101795662B1 (ko)
WO (1) WO2017086675A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111540407A (zh) * 2020-04-13 2020-08-14 中南大学湘雅医院 一种整合多种神经发育性疾病筛选候选基因的方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102147847B1 (ko) 2018-11-29 2020-08-25 가천대학교 산학협력단 질환 진단 보조를 위한 데이터 분석 방법 및 시스템
CN110322963B (zh) * 2019-07-04 2024-01-30 成都新基因格生物科技有限公司 一种新生儿遗传代谢病检测分析方法、装置及系统
KR102574100B1 (ko) 2022-06-07 2023-09-01 (재)씨젠의료재단 신생아의 선천성 대사 이상 검사에 대한 소견 생성 자료 제공 시스템
KR102574098B1 (ko) 2022-06-07 2023-09-01 (재)씨젠의료재단 신생아의 선천성 대사 이상 검사에 대한 소견 생성 자료 제공 방법 및 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2377213A1 (en) * 2001-03-20 2002-09-20 Ortho-Clinical Diagnostics, Inc. Method for providing clinical diagnostic services
JP5236856B2 (ja) * 2001-11-09 2013-07-17 ライフ テクノロジーズ コーポレーション 遺伝子発現プロファイルを用いる病気の同定、観測及び治療及び生物学的状態の同定
CA2671267A1 (en) * 2006-11-30 2008-06-05 Navigenics Inc. Genetic analysis systems and methods
KR102144088B1 (ko) * 2013-05-14 2020-08-13 솔젠트 (주) 유전자 검사에 기초하여 소아에게 권장 식이 정보를 제공하는 방법 및 이 방법에 사용되는 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111540407A (zh) * 2020-04-13 2020-08-14 中南大学湘雅医院 一种整合多种神经发育性疾病筛选候选基因的方法
CN111540407B (zh) * 2020-04-13 2023-06-27 中南大学湘雅医院 一种整合多种神经发育性疾病筛选候选基因的方法

Also Published As

Publication number Publication date
KR101795662B1 (ko) 2017-11-13
WO2017086675A1 (ko) 2017-05-26

Similar Documents

Publication Publication Date Title
KR101795662B1 (ko) 대사 이상 질환 진단 장치 및 그 방법
CN109887548B (zh) 基于捕获测序的ctDNA占比的检测方法及检测装置
Capriotti et al. Predicting the insurgence of human genetic diseases associated to single point protein mutations with support vector machines and evolutionary information
Navarro et al. Chromosomal speciation and molecular divergence--accelerated evolution in rearranged chromosomes
Kong et al. Measuring coverage and accuracy of whole-exome sequencing in clinical context
US11043283B1 (en) Systems and methods for automating RNA expression calls in a cancer prediction pipeline
CN108920899B (zh) 一种基于目标区域测序的单个外显子拷贝数变异预测方法
CN109767810B (zh) 高通量测序数据分析方法及装置
CN111341383B (zh) 一种检测拷贝数变异的方法、装置和存储介质
AU2018367488B2 (en) Systems and methods for determining microsatellite instability
US20200294624A1 (en) Systems and methods for enriching for cancer-derived fragments using fragment size
Muller et al. OutLyzer: software for extracting low-allele-frequency tumor mutations from sequencing background noise in clinical practice
CN111968701A (zh) 检测指定基因组区域体细胞拷贝数变异的方法和装置
CN111139291A (zh) 一种单基因遗传性疾病高通量测序分析方法
CN115394357B (zh) 用于判断样本配对或污染的位点组合及其筛选方法和应用
CN109461473B (zh) 胎儿游离dna浓度获取方法和装置
CN113789371A (zh) 一种基于批次矫正的拷贝数变异的检测方法
WO2019132010A1 (ja) 塩基配列における塩基種を推定する方法、装置及びプログラム
Kaiser et al. Automated structural variant verification in human genomes using single-molecule electronic DNA mapping
Hayes Computational analysis of structural variation in cancer genomes
CN114566213A (zh) 家系高通量测序数据的单亲二倍体分析方法及其系统
CN113195741A (zh) 从循环核酸中鉴定全基因组序列数据中的全局序列特征
Alioto et al. A comprehensive assessment of somatic mutation calling in cancer genomes
CN113793641B (zh) 一种从fastq文件中快速判断样本性别的方法
Padre Modeling Sequencing Artifacts in Artificial Low Frequency Cancer Data

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant