KR20090105921A - Genetic analysis systems and methods - Google Patents

Genetic analysis systems and methods Download PDF

Info

Publication number
KR20090105921A
KR20090105921A KR1020097013756A KR20097013756A KR20090105921A KR 20090105921 A KR20090105921 A KR 20090105921A KR 1020097013756 A KR1020097013756 A KR 1020097013756A KR 20097013756 A KR20097013756 A KR 20097013756A KR 20090105921 A KR20090105921 A KR 20090105921A
Authority
KR
South Korea
Prior art keywords
individual
phenotype
risk
profile
genotype
Prior art date
Application number
KR1020097013756A
Other languages
Korean (ko)
Inventor
디에트리치 에이. 스테판
멜리사 플로렌 필리포네
제니퍼 웨슬
미첼 카길
에란 할페린
Original Assignee
네이비제닉스 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/781,679 external-priority patent/US20080131887A1/en
Application filed by 네이비제닉스 인크. filed Critical 네이비제닉스 인크.
Publication of KR20090105921A publication Critical patent/KR20090105921A/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/172Haplotypes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Physiology (AREA)
  • Ecology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Food Science & Technology (AREA)
  • Urology & Nephrology (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Hematology (AREA)
  • Biomedical Technology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention provides methods of determining a Genetic Composite Index score by assessing the association between an individual's genotype and at least one disease or condition. The assessment comprises comparing an individual's genomic profile with a database of medically relevant genetic variations that have been established to associate with at least one disease or condition.

Description

유전자 분석 시스템 및 방법{GENETIC ANALYSIS SYSTEMS AND METHODS}Genetic analysis system and method {GENETIC ANALYSIS SYSTEMS AND METHODS}

본 발명은 유전자 분석 시스템 및 방법에 관한 것이다.The present invention relates to genetic analysis systems and methods.

인간 게놈의 서열 결정과 그 외 최근에 이루어진 인간 유전체학의 발달로 인하여, 임의의 2인 간 게놈 구조의 유사성이 99.9% 이상이라는 사실을 알게 되었다. 개체 간 DNA상에서 일어나는 비교적 소수의 변이로 인하여, 표현형 형질에 차이가 생기는 것이며, 또한 이는 다수의 인간 질병, 다양한 질병에 대한 감수성, 그리고 질병 치료에 대한 반응과도 관련되어 있다. 개체 간 DNA 변이는 암호화 부위와 비 암호화 부위 둘 다에서 발생하며, 이와 같은 변이로서는 게놈 DNA 서열 내 특정 위치에 존재하는 염기들에서 일어나는 변이와, DNA의 삽입 및 결실을 포함한다. 게놈 내 하나의 염기 위치에서 발생하는 변이를 단일 뉴클레오티드 다형성(Single Nucleotide Polymorphism) 즉, "SNP"라고 부른다.Due to the sequencing of the human genome and other recent advances in human genomics, it has been found that the similarity of any two human genome structures is greater than 99.9%. Due to the relatively small number of mutations that occur on DNA between individuals, differences in phenotypic traits arise, which are also associated with a number of human diseases, susceptibility to various diseases, and response to disease treatment. DNA variations between individuals occur at both coding and non-coding sites, including variations that occur at bases present at specific positions in the genomic DNA sequence, and insertion and deletion of DNA. Variations that occur at one base position in the genome are called Single Nucleotide Polymorphisms, or "SNPs."

SNP는 인간의 게놈에 있어서 비교적 흔히 발생하는 것은 아니지만, 인간 게놈 내에서 1,200 염기쌍마다 대략 1회 발생하는 것처럼, 개체 간에 다수 회의 DNA 서열 변이를 일으킨다(국제 햅 맵 프로젝트(HapMap Project; www.hapmap.org) 참조). 인간의 유전 정보를 보다 많이 활용할 수 있게 되었기 때문에, SNP의 복잡도(complexity)에 관하여도 점차 이해할 수 있게 되었다. 뿐만 아니라, 게놈 내에 SNP가 발생하는 것은 다양한 질병과 병태의 존재 및/또는 이에 대한 감수성과 상관되어 있음을 알게 되었다.SNPs are not relatively common in the human genome, but cause multiple DNA sequence mutations between individuals, as occurs approximately once every 1,200 base pairs in the human genome (International HapMap Project; www.hapmap. org)). As human genetic information becomes more available, the complexity of SNPs can also be understood. Furthermore, it has been found that the development of SNPs in the genome is correlated with the presence and / or susceptibility to various diseases and conditions.

인간 유전학에 있어서의 이와 같은 상관관계가 밝혀지고 또한 이 분야에서 계속 발전이 있으므로 인하여, 일반적으로 의학적 처치와 개인 건강에 관한 문제는 맞춤 방식으로 진행되고 있고, 또한 환자는 여러 가지 요인들 중에서 각자의 게놈 정보를 고려하여 적당한 의학적 선택과 기타 선택을 하게 될 것이다. 그러므로, 개인에게 알맞은 의학적 결정과 기타 결정을 제공할 각 개인의 게놈에 특이적인 정보를 환자와 간병인(caregiver)에게 제공할 필요가 있는 것이다.Because of this correlation in human genetics and further developments in this area, problems related to medical care and personal health generally progress in a customized way, and patients are also able to Considering genomic information, you will make appropriate medical and other choices. Therefore, it is necessary to provide patients and caregivers with information specific to each individual's genome that will provide medical and other decisions appropriate for the individual.

발명의 개요Summary of the Invention

본 발명은 다음의 단계들을 포함하는 개체 유전자형의 상관관계를 평가하는 방법을 제공한다: a) 개체의 유전자 시료를 얻는 단계, b) 개체에 대한 게놈 프로필을 생성하는 단계, c) 개체의 게놈 프로필을, 인간 유전자형과 표현형의 상관관계에 대하여 현재 규명되어 있는 데이터베이스와 비교함으로써, 개체의 유전자형과 표현형의 상관관계를 결정하는 단계, d) 상기 단계 c)로부터 얻어진 결과를 개체나 이 개체를 담당하는 캐어 매니저(care manager)에게 보고하는 단계, e) 인간 유전자형의 부가적인 상관관계가 규명됨에 따라서 이와 같은 인간 유전자형의 부가적 상관관계로써 인간 유전자형의 상관관계에 관한 데이터베이스를 갱신하는 단계, f) 상기 단계 c)로부터 얻어진 개체의 게놈 프로필 또는 이의 일부를 인간 유전자형의 부가적 상관관계와 비교하고, 개체의 유전자형의 부가적 상관관계를 측정함으로써, 개체의 유전자형의 상관관계를 갱신하는 단계, 그리고 g) 상기 단계 f)로부터 얻어진 결과를 개체나 그 개체를 담당하는 캐어 매니저에게 보고하는 단계.The present invention provides a method for assessing the correlation of an individual's genotype comprising the following steps: a) obtaining a genetic sample of the individual, b) generating a genomic profile for the individual, c) genomic profile of the individual Determining the correlation between the genotype and the phenotype of the individual by comparing the database of human genotypes and phenotypes with the currently identified database; d) determining the correlation between the individual genotype and the phenotype; Reporting to the care manager, e) updating the database of human genotype correlations with such additional correlations of human genotypes as additional correlations of human genotypes have been identified, f) Compare the genomic profile of the individual obtained from step c) or a portion thereof with additional correlations of the human genotype And by measuring an additional correlation of the object's genotype relationship, updating the relationship between the object genotype, and g) the step of reporting the result obtained from step f) to a care manager for the object or the object.

본 발명은 또한 다음의 단계들을 포함하는, 개체의 유전자형의 상관관계를 평가하는 비즈니스 방법을 추가로 제공한다: a) 개체의 유전자 시료를 얻는 단계; b) 개체에 관한 게놈 프로필을 형성하는 단계; c) 개체의 게놈 프로필을 인간 유전자형의 상관관계에 관한 데이터베이스와 비교함으로써, 개체의 유전자형의 상관관계를 측정하는 단계; d) 보안이 유지되는 방식으로 어느 한 개체에 관한 유전자형의 상관관계를 측정한 결과를 그 개체에게 제공하는 단계; e) 인간 유전자형의 부가적 상관관계가 규명됨에 따라서, 인간 유전자형의 부가적 상관관계로써 인간 유전자형의 상관관계를 갱신하는 단계; f) 개체의 게놈 프로필 또는 이의 일부를 부가의 인간 유전자형의 상관관계과 비교하고, 개체의 부가적인 유전자형의 상관관계를 측정함으로써, 개체의 유전자형의 상관관계를 갱신하는 단계; 그리고 g) 개체 유전자형의 상관관계를 갱신한 결과를 그 개체를 담당하는 건강 관리 매니저(health care manager) 개인에게 제공하는 단계.The present invention further provides a business method for assessing the correlation of a genotype of an individual, comprising the following steps: a) obtaining a genetic sample of the individual; b) forming a genomic profile for the individual; c) determining the individual's genotype correlations by comparing the individual's genomic profile with a database of human genotype correlations; d) providing the subject with a result of measuring a genotype correlation for a subject in a secure manner; e) updating the human genotype correlation as an additional correlation of the human genotype as the additional correlation of the human genotype is identified; f) updating the individual's genotype correlations by comparing the individual's genomic profile or a portion thereof with additional human genotype correlations and measuring the individual's additional genotype correlations; And g) providing a result of updating the correlation of the individual genotypes to a health care manager individual in charge of the individual.

본 발명의 다른 측면은 다음의 단계들을 포함하는, 개체에 관한 표현형 프로필을 형성하는 방법에 관한 것이다: a) 룰(rule)들을 포함하는 룰 세트(rule set)를 제공하는 단계로서, 여기서 각각의 룰은 하나 이상의 유전자형과 하나 이상의 표현형 사이의 상관관계를 나타내는 것인 단계, b) 다수의 개체들 각각에 관한 게놈 프로필을 포함하는 데이터 세트를 제공하는 단계로서, 여기서 각각의 게놈 프로필은 다수의 유전자형을 포함하는 것인 단계, c) 상기 룰 세트를 하나 이상의 새로운 룰로 주기적으로 갱신하는 단계로서, 여기서 하나 이상의 새로운 룰은 유전자형과 표현형(상기 룰 세트 중 각각의 룰과는 원래부터 상관되어 있지 않음) 간의 상관관계를 나타내는 것인 단계; d) 각각의 새로운 룰을 개체들 중 한 명 이상의 게놈 프로필에 적용시켜, 그 개체의 하나 이상의 유전자형을 개체에 관한 하나 이상의 표현형과 상관시키는 단계, 그리고 임의로는, e) 개체의 표현형 프로필을 포함하는 리포트를 작성하는 단계.Another aspect of the invention is directed to a method of forming a phenotype profile for an individual, comprising the following steps: a) providing a rule set comprising rules, wherein each of the The rule indicating a correlation between one or more genotypes and one or more phenotypes, b) providing a data set comprising genomic profiles for each of the plurality of individuals, wherein each genomic profile is a plurality of genotypes. C) periodically updating the rule set with one or more new rules, wherein the one or more new rules are genotype and phenotype (not originally correlated with each of the rules in the rule set). Indicating a correlation between; d) applying each new rule to the genomic profile of one or more of the individuals, correlating one or more genotypes of that individual with one or more phenotypes about the individual, and optionally, e) comprising the phenotype profile of the individual Steps to create a report.

본 발명은 또한 a) 룰들을 포함하는 룰 세트로서, 각각의 룰은 하나 이상의 유전자형과 하나 이상의 표현형 사이의 상관관계를 나타내는 것인 룰 세트; b) 상기 룰 세트를 하나 이상의 새로운 룰로 주기적으로 갱신하는 암호로서, 하나 이상의 새로운 룰은 룰 세트 중 원래부터 서로 상관되지 않았던 유전자형 및 표현형 사이의 상관관계를 나타내는 것인 암호; c) 다수의 개체들의 게놈 프로필을 포함하는 데이터베이스; d) 룰 세트를 개체의 게놈 프로필에 적용하여, 그 개체에 대한 표현형 프로필을 측정하는 암호; 그리고 e) 각각의 개체에 대한 보고를 생성하는 암호를 포함하는 시스템을 제공하기도 한다.The invention also relates to a set of rules comprising a) rules, each rule representing a correlation between one or more genotypes and one or more phenotypes; b) a cipher that periodically updates the rule set with one or more new rules, wherein the one or more new rules indicate a correlation between genotypes and phenotypes that were not originally correlated with each other in the rule set; c) a database comprising genomic profiles of a plurality of individuals; d) applying a rule set to an individual's genomic profile to determine a phenotype profile for that individual; And e) provide a system that includes a password to generate a report for each entity.

본 발명의 다른 측면은 보안 방식(secure manner) 또는 비-보안 방식(non-secure manner)으로 네트워크 상에서 전송하는 것과, 전술한 바와 같은 방법들 그리고 시스템들에 관한 것이다.Another aspect of the invention relates to transmitting on a network in a secure manner or a non-secure manner, and to the methods and systems as described above.

참고 문헌에 관한 인용Citations on Bibliography

본 명세서에 언급된 모든 공보 및 특허 출원들은, 각각의 개별 공보 또는 특허 출원이 참고용으로 특별히 그리고 별도로 인용되어 있다고 기재되어 있는 것처럼, 본원에 동일한 정도로 참고용으로 인용되어 있다.All publications and patent applications mentioned in this specification are herein incorporated by reference to the same extent as if each individual publication or patent application were specifically and separately cited for reference.

도면의 간단한 설명Brief description of the drawings

도 1은 본 발명의 방법에 관한 측면들을 설명해 주는 공정도(flow chart)이다.1 is a flow chart illustrating aspects of the method of the present invention.

도 2는 게놈 DNA 품질 제어 측정법에 관한 예를 나타내는 것이다.2 shows an example of a genomic DNA quality control assay.

도 3은 혼성화 품질 제어 측정법에 관한 예를 나타내는 것이다.3 shows an example of a hybridization quality control measurement method.

도 4는 공개된 문헌으로부터 얻어진 각각의 유전자형과 테스트 SNP의 상관관계, 및 이오 인한 효과를 예측한 결과에 관한 표를 나타내는 것이다. A∼I는 단일 위치 유전자형의 상관관계를 나타내는 것이고; J는 2개의 위치 간 유전자형의 상관관계를 나타내는 것이며; K는 3개의 위치 간 유전자형의 상관관계를 나타내는 것이고; L)은 A∼K에 사용된 민족성과 국가명에 관한 축약어 인덱스를 나타내는 것이며; M)은 A∼K의 간략한 표현형 명칭에 대한 축약어, 유전율 그리고 유전율에 관한 참조 인덱스(reference index)를 나타내는 것이다. Figure 4 shows a table of the results of predicting the correlation between each genotype and the test SNP obtained from the published literature, and the effect due to error. A to I show a correlation of single position genotype; J indicates genotype correlation between two positions; K represents a genotype correlation between three positions; L) represents an abbreviation index for ethnicity and country name used in A to K; M) stands for the abbreviation, permittivity, and reference index for permittivity for the short phenotype names A to K.

도 5a∼5j는 효과에 관하여 예측한 결과와 각각의 유전자형의 상관관계에 관한 표를 나타내는 것이다.5A to 5J show tables of correlations between the results predicted for the effects and the respective genotypes.

도 6a∼6f는 각각의 유전자형의 상관관계와 상대적 위험도에 관하여 예측한 결과에 관한 표를 나타내는 것이다.6A to 6F show tables of prediction results regarding correlations and relative risks of respective genotypes.

도 7은 리포트를 예시한 것이다. 7 illustrates a report.

도 8은 네트워크상 게놈 프로필 및 표현형 프로필의 분석 및 전송을 위한 시스템을 개략적으로 나타내는 것이다.8 schematically depicts a system for analysis and transmission of genomic and phenotype profiles on a network.

도 9는 본원의 비즈니스 방법에 관한 측면을 나타내는 공정도이다. 9 is a flowchart showing aspects of the business method of the present application.

도 10은 상대적 위험도에 관한 예측치에 유병율(prevalence) 예측치가 미치는 효과를 나타내는 것이다. 하디-바인베르크 평형(Hardy-Weinberg Equilibrium)을 가정하였을 때, 각각의 그래프는 집단 내 대립 형질의 발현 빈도(frequency)에 관한 상이한 수치와 상응한다. 흑색 선 2개는 교차비(odds ratio)가 9 및 6인 경우를, 적색 선 2개는 6 및 4인 경우를, 그리고 청색 선 2개는 교차비가 3 및 2인 경우이다. 10 shows the effect of a prevalence prediction on the prediction of relative risk. Assuming a Hardy-Weinberg Equilibrium, each graph corresponds to a different value for the frequency of expression of alleles in the population. Two black lines are for the odds ratios of 9 and 6, two red lines are for the 6 and 4 cases, and two blue lines are for the crossing ratios of 3 and 2.

도 11은 상대적 위험 예측치에 대립 형질 발현 빈도 예측치가 미치는 효과를 나타내는 것이다. 각각의 그래프는 집단 내 상이한 유병율 수치와 상응한다. 흑색 선 2개는 교차비가 9 및 6인 경우를, 적색 선 2개는 6 및 4인 경우를, 그리고 청색 선 2개는 교차비가 3 및 2인 경우이다. 11 shows the effect of allele frequency predictions on relative risk estimates. Each graph corresponds to different prevalence values in the population. Two black lines are the case where the crossing ratio is 9 and 6, two red lines are the case when the 6 and 4, and two blue lines are the case where the crossing ratio is 3 and 2.

도 12는 상이한 모델에 관한 절대치의 페어와이즈 비교(Pairwise Comparison) 결과를 나타내는 것이다.12 shows the results of a pairwise comparison of absolute values for different models.

도 13은 상이한 모델을 기초로 한 등급 수치(GCI 스코어)의 페어와이즈 비교 결과를 나타내는 것이다. 상이한 쌍들 간 스페어맨(Spearman) 상관관계를 표 2에 제시하였다.FIG. 13 shows pairwise comparison results of grade values (GCI scores) based on different models. Spearman correlations between different pairs are shown in Table 2.

도 14는 GCI 스코어에 대한 유병율 리포트 결과를 나타내는 것이다. 임의의 유병율 수치들 중 2개 사이의 스피어맨 상관성은 0.99 이상이다.14 shows the prevalence report results for the GCI score. The Spearman correlation between two of any prevalence figures is at least 0.99.

도 15는 개인화된(personalized) 포털에 있는 예시적 웹 페이지를 나타내는 것이다. 15 illustrates an example web page in a personalized portal.

도 16은 전립선 암에 관한 개인 위험도를 제시하는, 개인화된 포털의 예시적 웹 페이지를 나타내는 것이다.FIG. 16 illustrates an example web page of a personalized portal that presents personal risk for prostate cancer.

도 17은 크론병에 대한 개체의 위험도를 제시하는, 개인화된 포털에 있는 예시적 웹 페이지를 나타내는 것이다.17 shows an example web page in a personalized portal that presents the risk of an individual with Crohn's disease.

도 18은 2개의 SNP를 사용하는 햅 맵을 기초로 한, 다발성 경화증에 대한 GCI 스코어의 막대 그래프를 나타내는 것이다.FIG. 18 shows a bar graph of the GCI score for multiple sclerosis based on a hap map using two SNPs.

도 19는 다발성 경화증에 있어서 개체의 평생 위험도(lifetime risk)를, GCI 플러스를 이용하여 측정한 결과를 나타내는 것이다.FIG. 19 shows the results of measuring the lifetime risk of an individual in multiple sclerosis using GCI Plus. FIG.

도 20은 크론병에 관한 GCI 스코어에 관한 막대 그래프를 나타내는 것이다.20 shows a bar graph relating to GCI score for Crohn's disease.

도 21은 다중 위치 상관관계에 관한 표를 나타내는 것이다.21 shows a table of multiple position correlations.

도 22는 SNP 및 표현형의 상관관계에 관한 표를 나타내는 것이다.Figure 22 shows a table of the correlation between SNPs and phenotypes.

도 23은 표현형 및 유병율에 관한 표를 나타내는 것이다. 23 shows a table relating to phenotype and prevalence.

도 24는 도 21, 도 22 및 도 25에 표시된 축약어들을 모아놓은 것이다.FIG. 24 is a collection of abbreviations shown in FIGS. 21, 22, and 25.

도 25는 SNP 및 표현형의 상관관계에 관한 표를 나타내는 것이다.Figure 25 shows a table of correlations between SNPs and phenotypes.

발명의 상세한 설명Detailed description of the invention

본 발명은 개체나 개체들로 이루어진 그룹의, 저장되어 있던 게놈 프로필을 기초로 하여 표현형 프로필을 생성하고, 또한 저장되어 있던 게놈 프로필을 기초로 하여 원래의 표현형 프로필 및 갱신된 표현형 프로필을 용이하게 생성하기 위한 방법 및 시스템을 제공한다. 게놈 프로필은 개체로부터 얻어진 생물학적 시료들로부터 유전자형을 측정함으로써 생성된다. 개체들로부터 얻어진 생물학적 시료들은 유전자 시료를 얻을 수 있는 임의의 시료일 수 있다. 시료는 구강을 면봉으로 긁어낸 것, 타액, 혈액, 머리카락 또는 기타 임의의 유형의 조직 시료로부터 유래할 수 있다. 이후, 유전자형은 생물학적 시료로부터 측정될 수 있다. 유전자형은 임의의 유전자 변이체 또는 생물 마커 예를 들어, 단일 뉴클레오티드 다형성(SNP), 단상형 또는 게놈 서열일 수 있다. 유전자형은 개체의 전체 게놈 서열일 수 있다. 유전자형은 수 천개 또는 수 백만개의 데이터 포인트(data point)를 생성하는 고 처리량 분석법 예를 들어, 공지 SNP 대부분 또는 전부에 관한 마이크로어레이 분석법으로부터 얻을 수 있다. 기타 구체예에서, 유전자형은 또한 고 처리량 서열 결정법에 의해 결정될 수도 있다.The present invention creates phenotype profiles based on stored genomic profiles of individuals or groups of individuals, and also easily generates original phenotype profiles and updated phenotype profiles based on stored genomic profiles. It provides a method and system for. Genomic profiles are generated by measuring genotypes from biological samples obtained from an individual. Biological samples obtained from the subjects can be any sample from which a genetic sample can be obtained. The sample may be derived from scraping a mouth with a swab, saliva, blood, hair or any other type of tissue sample. The genotype can then be determined from the biological sample. The genotype can be any genetic variant or biological marker, eg, single nucleotide polymorphism (SNP), monomorphic or genomic sequence. The genotype may be the entire genome sequence of the individual. Genotypes can be obtained from high throughput assays that generate thousands or millions of data points, for example, microarray assays for most or all of the known SNPs. In other embodiments, genotypes may also be determined by high throughput sequencing.

유전자형은 개체에 대한 게놈 프로필을 형성한다. 게놈 프로필은 디지털 방식으로 저장되며, 표현형 프로필을 얻고자 하는 시점 중 임의의 시점에 용이하게 접근할 수 있다. 표현형 프로필은, 유전자형과 표현형을 상관시키거나 연관시키는 룰을 적용함으로써 생성된다. 룰은 유전자형과 표현형 사이의 상관관계를 설명해 주는 과학적 연구 결과를 기초로 하여 정하여질 수 있다. 상관관계는 한 명 이상의 전문가로 이루어진 위원회에 의해 보완 또는 입증될 수 있다. 상기 룰을 개체의 게놈 프로필에 적용시킴으로써, 개체의 유전자형과 표현형 사이의 연관 관계를 측정할 수 있다. 이와 같이 하여 개체에 대한 표현형 프로필이 측정될 것이다. 측정 결과는 개체의 유전자형과 소정의 표현형 사이의 양의 연관 관계에 있을 수 있으므로, 개체는 소정의 표현형을 가지거나 또는 그 표현형을 발현하게 될 것이다. 대안적으로, 개체는 소정의 표현형을 가지지 않거나 또는 발현하지 않을 것이다. 다른 구체예에서, 측정 결과는 개체가 가지고 있거나 또는 표현형을 발현하게 될 위험 인자, 예측치 또는 확률일 수 있다.Genotypes form a genomic profile for an individual. Genomic profiles are stored digitally and can be easily accessed at any point in time to obtain a phenotype profile. Phenotype profiles are generated by applying rules that correlate or associate genotypes with phenotypes. Rules can be established based on scientific findings that explain the correlation between genotypes and phenotypes. Correlations may be supplemented or substantiated by a committee of one or more experts. By applying these rules to an individual's genomic profile, the association between the individual's genotype and phenotype can be determined. In this way the phenotype profile for the individual will be measured. The measurement result may be in a positive association between the subject's genotype and the given phenotype, so that the individual will have or will express the phenotype. Alternatively, the individual will not have or have a predetermined phenotype. In other embodiments, the result of the measurement can be a risk factor, prediction or probability that the individual will have or develop a phenotype.

측정은 다수의 룰을 기초로 하여 이루어질 수 있는데, 예를 들어, 다수의 룰은 게놈 프로필에 적용되어, 특이한 표현형과 개체의 유전자형의 연관 관계를 결정할 수 있다. 측정 결과는 또한 개체에게 특이한 인자들 예를 들어, 민족성, 성별, 생활 방식(예를 들어, 식습관 및 운동 습관), 연령, 환경(예를 들어, 거주 위치), 가족의 병력, 개체의 병력, 그리고 기타 공지의 표현형들을 통합할 수도 있다. 특이한 인자들은, 현존하는 룰들에 이 인자들을 포함시켜 수정함으로써 통합될 수 있다. 대안적으로, 별도의 룰들은 이와 같은 인자들에 의해 형성될 수 있으며, 또한 현존하는 룰을 적용한 이후 개체에 대한 표현형 측정 결과에 적용될 수 있다. Measurements can be made based on a number of rules, for example, a number of rules can be applied to a genomic profile to determine the association of a particular phenotype with an individual's genotype. Measurement results may also include factors specific to the individual, such as ethnicity, sex, lifestyle (eg, eating habits and exercise habits), age, environment (eg, location of residence), family history, individual history, And other known phenotypes. Specific factors can be incorporated by modifying them by including them in existing rules. Alternatively, separate rules can be formed by such factors, and can also be applied to the phenotypic measurement results for an individual after applying existing rules.

표현형은 임의의 측정 가능한 형질 또는 특성 예를 들어, 임의의 질병에 대한 감수성 또는 약물 치료에 관한 반응을 포함할 수 있다. 포함될 수 있는 기타 표현형으로서는, 신체적 형질과 정신적인 형질 예를 들어, 키, 체중, 머리카락 색, 눈 색, 일광 화상에 대한 감수성, 크기, 기억력, 지능, 낙천성 수준 그리고 전체적인 질병 소인이 있다. 표현형은 또한 다른 개체나 유기체에 대한 유전적인 비교 결과를 포함할 수도 있다. 예를 들어, 어느 한 개체는 자신의 게놈 프로필과 유명 인사의 게놈 프로필 사이의 유사성에 관심이 있을 수 있다. 뿐만 아니라, 자신의 게놈 프로필이 기타 유기체 예를 들어, 박테리아, 식물 또는 기타 동물에 비교되도록 할 수도 있다.Phenotypes can include any measurable trait or characteristic, such as a response to sensitivity or drug treatment to any disease. Other phenotypes that may be included are physical and mental traits such as height, weight, hair color, eye color, sensitivity to sunburn, size, memory, intelligence, optimistic levels and overall disease predisposition. Phenotypes may also include genetic comparisons to other individuals or organisms. For example, an individual may be interested in the similarity between his genomic profile and the celebrity's genomic profile. In addition, their genomic profiles may be compared to other organisms such as bacteria, plants or other animals.

아울러, 개체를 대상으로 측정된 상관 표현형들을 모으면 그 개체에 대한 표현형 프로필이 포함된다. 표현형 프로필은 온-라인 포털에 의해 입수 가능하다. 대안적으로, 임의의 시점에서, 표현형 프로필은 리포트 용지로 제공될 수 있으며, 추후 갱신시에도 리포트 용지로 제공될 수 있다. 표현형 프로필은 또한 온-라인 포털에 의해 제공될 수도 있다. 온-라인 포털은 임의로는 보안 온-라인 포털일 수 있다. 표현형 프로필은 가입자 즉, 표현형과 유전자형 사이의 상관관계에 관한 룰을 형성하고, 개체의 게놈 프로필을 결정하며, 게놈 프로필에 룰을 적용시켜, 개체의 표현형 프로필을 형성하는 서비스에 가입을 한 사람만 입수할 수 있다. 뿐만 아니라, 비 가입자도 접근할 수 있는데, 다만, 이들은 제한된 범위 내에서 자신의 표현형 프로필 및/또는 이에 관한 리포트를 입수할 수 있거나, 또는 초기 리포트 또는 형성된 표현형 프로필을 가질 수는 있지만, 갱신된 리포트는 가입 신청을 한 경우에만 얻을 수 있을 것이다. 건강 관리 매니저 및 건강 관리 제공자 예를 들어, 간병인, 전문의 및 유전 상담자도 표현형 프로필을 입수할 수 있다.In addition, the collection of correlation phenotypes measured for an individual includes a phenotype profile for that individual. Phenotype profiles are available by on-line portal. Alternatively, at any point in time, the phenotype profile may be provided in a report sheet, and may also be provided in a report sheet upon further update. The phenotype profile may also be provided by the on-line portal. The on-line portal can optionally be a secure on-line portal. A phenotype profile is a subscriber, that is, only a person who forms a rule about the correlation between the phenotype and the genotype, determines the individual's genomic profile, and applies the rule to the genomic profile to form the individual's phenotype profile. You can get it. In addition, non-subscribers may access, provided they are able to obtain their phenotype profile and / or report about it within a limited scope, or may have an initial report or a phenotype profile formed, but with an updated report You will only be able to get this if you apply. Health care managers and health care providers, such as caregivers, specialists, and genetic counselors, may also obtain phenotype profiles.

본 발명의 다른 측면에서, 게놈 프로필은 가입자와 비-가입자에 대해 형성되며, 디지털 방식으로 저장될 수 있으나, 표현형 프로필과 리포트는 가입자만이 입수할 수 있다. 다른 변형 예에서, 가입자와 비-가입자는 유전자형과 표현형 프로필을 입수할 수는 있지만, 비-가입자의 경우는 제한적으로 입수 가능하거나, 또는 제한된 범위의 리포트를 받을 수 있는 반면에, 가입자는 온전한 것을 입수할 수 있고 또한 리포트 전부를 얻을 수 있다. 다른 구체예에서, 가입자와 비-가입자는 둘 다 처음에는 온전히 접근할 수 있거나 또는 초기에 작성된 리포트 전부를 얻을 수 있지만, 가입자만이 저장되어 있는 자신의 게놈 프로필을 기초로 하여 갱신된 리포트를 받을 수 있다.In another aspect of the invention, genomic profiles are formed for subscribers and non-subscribers and can be stored digitally, but phenotype profiles and reports are only available to subscribers. In other variations, subscribers and non-subscribers may obtain genotype and phenotype profiles, while non-subscribers may receive limited availability or receive a limited range of reports, while subscribers may be intact. You can get it and get all the reports. In other embodiments, both the subscriber and the non-subscriber can both get full access initially or get all the initial reports, but only the subscriber will receive updated reports based on their genomic profile stored. Can be.

본 발명의 다른 측면에서, 다수의 유전자 마커와 하나 이상의 질병 또는 병태를 연관시킨 정보는 통합 및 분석되어, 유전자 종합 지수(Genetic Composite Index; GCI) 스코어가 얻어진다. 이와 같은 스코어는 공지된 위험 인자와 기타 정보 및 가정 예를 들어, 대립 형질의 발현 빈도 및 질병의 유병율 등을 통합한다. 상기 GCI는 유전자 마커 세트들에 의한 복합적인 효과와 질병 또는 병태를 연관시킨 결과를 정량적으로 예측하는데 사용될 수 있다. 상기 GCI 스코어는 유전학 분야에서 훈련을 받지 않은 사람들에게, 현재 과학적인 연구 결과를 기초로 하여 자신의 질병에 관한 각각의 위험도를 관련 집단과 비교한 결과에 대한, 신뢰성이 있으며(즉, 확고하며), 이해하기 쉽고/쉽거나, 직감할 수 있는 감각을 제공하는데 사용할 수 있다. 상기 GCI 스코어는 GCI 플러스 스코어를 생성하는데 사용될 수 있다. 상기 GCI 플러스 스코어는 모든 GCI 가정 예를 들어, 병태의 위험도(예를 들어, 평생 위험도), 연령별 유병율 및/또는 연령별 발생률을 포함할 수 있다. 이후, 개체에 대한 평생 위험도는 GCI 플러스 스코어로서 계산될 수 있는데, 여기서, 이 GCI 플러스 스코어는 개체의 GCI 스코어를 평균 GCI 스코어로 나눈 값에 비례한다. 평균 GCI 스코어는 혈통이 유사한 사람들의 집단 예를 들어, 백인, 아시아 사람, 동인도 사람, 또는 기타 공통된 혈통을 가지는 사람들의 집단으로부터 측정될 수 있다. 이 집단들은 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55 또는 60명 이상의 사람들을 포함할 수 있다. 몇몇 구체예에서, 평균은 75, 80, 95 또는 100명 이상의 사람들로부터 측정될 수 있다. GCI 플러스 스코어는, 개체에 대한 GCI 스코어를 측정하고, 이 GCI 스코어를 평균 상대 위험도로 나눈 다음, 병태 또는 표현형에 대한 평생 위험도로 곱함으로써 결정될 수 있다. 예를 들어, 도 22 및/또는 도 25로부터 얻어진 데이터를 도 24의 정보와 함께 사용함으로써 예를 들어, 도 19의 GCI 플러스 스코어를 계산할 수 있다. In another aspect of the invention, information that associates multiple genetic markers with one or more diseases or conditions is integrated and analyzed to obtain a Genetic Composite Index (GCI) score. This score incorporates known risk factors and other information and assumptions such as the frequency of expression of alleles and the prevalence of disease. The GCI can be used to quantitatively predict the outcome of associating a complex effect with a set of genetic markers with a disease or condition. The GCI score is reliable (ie firm) for those who are not trained in the field of genetics, as a result of comparing each risk for their disease with the relevant groups based on current scientific research. It can be used to provide a sense that is easy to understand and / or intuitive. The GCI score can be used to generate a GCI Plus score. The GCI Plus score may include all GCI assumptions, such as the risk of a condition (eg, lifetime risk), age prevalence, and / or age incidence. The lifetime risk for an individual can then be calculated as a GCI Plus score, where the GCI Plus score is proportional to the individual's GCI score divided by the average GCI score. The average GCI score can be measured from a group of people with similar lineages, such as Caucasians, Asians, East Indians, or other groups of people with a common lineage. These groups may include 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55 or 60 or more people. In some embodiments, the mean can be measured from 75, 80, 95 or 100 or more people. The GCI Plus score can be determined by measuring the GCI score for an individual, dividing this GCI score by the average relative risk, and then multiplying by the lifetime risk for the condition or phenotype. For example, by using the data obtained from FIGS. 22 and / or 25 together with the information of FIG. 24, for example, the GCI plus score of FIG. 19 can be calculated.

본 발명은 본원에 제시된 GCI 스코어를 사용하는 것을 포함하는데, 당 업자는, 본원에 기술된 GCI 스코어 대신에, GCI 플러스 스코어 또는 이의 변형된 수치를 사용할 수 있음을 쉽게 알 수 있을 것이다. The present invention includes the use of the GCI scores presented herein, and one of ordinary skill in the art will readily appreciate that instead of the GCI scores described herein, the GCI Plus scores or modified values thereof may be used.

하나의 구체예에서, GCI 스코어는 대상 질병 또는 병태 각각에 대해 메겨질 수 있다. 이와 같은 GCI 스코어를 수집하여 개체에 대한 위험도 프로필을 형성할 수 있다. 상기 GCI 스코어는 디지털 방식으로 저장될 수 있으므로, 임의의 시점에 용이하게 입수하여 위험도 프로필을 형성할 수 있다. 위험도 프로필은 광범위한 질병군 예를 들어, 암, 심장병, 대사성 질환, 정신 질환, 골 질환 또는 연령별 발병 질환에 의해 갱신될 수 있다. 광범위한 질병 군은 또한 하위 카테고리로 나누어질 수도 있다. 예를 들어, 광범위한 군 예를 들어, 암에 있어서, 암의 하위 카테고리는 예를 들어, 유형(육종, 암종 또는 백혈병 등)이나 조직의 특이성(신경, 유방, 난소, 정소, 전립선, 골, 림프 소절, 췌장, 식도, 위, 간, 뇌, 폐, 신장 등)에 의해 나열될 수 있다.In one embodiment, the GCI score can be scored for each of the subject disease or condition. Such GCI scores can be collected to form a risk profile for the individual. The GCI score can be stored digitally, so that it can be easily obtained at any point in time to form a risk profile. The risk profile can be updated by a wide range of disease groups, such as cancer, heart disease, metabolic disease, psychiatric disease, bone disease or age-specific onset disease. Extensive disease groups may also be divided into subcategories. For example, in a broad group of cancers, for example, cancer, subcategories of cancer may include, for example, type (sarcoma, carcinoma, or leukemia, etc.) or tissue specificity (nerve, breast, ovary, testis, prostate, bone, lymph). Section, pancreas, esophagus, stomach, liver, brain, lung, kidney, etc.).

다른 구체예에서, GCI 스코어는 개체에 대해서 메겨져서, 개체에 한 가지 이상의 질병 또는 병태가 나타날 위험도 또는 이 질병 또는 병태에 대한 감수성에 관한 정보를 그 개체가 쉽게 이해하도록 만든다. 하나의 구체예에서, 다수의 GCI 스코어는 상이한 질병 또는 병태에 대해 메겨진다. 다른 구체예에서, 하나 이상의 GCI 스코어는 온-라인 포털을 통해서 얻을 수 있다. 대안적으로, 하나 이상의 GCI 스코어는 리포트 용지의 형태로서 제공될 수 있으며, 추후 이 GCI 스코어는 역시 리포트 용지의 형태로서 갱신된다. 하나의 구체예에서, 가입자 즉, 서비스 신청을 한 개체는 하나 이상의 GCI 스코어를 입수하게 된다. 대안적인 구체예에서, 비-가입자도 입수할 수 있는데, 이 경우, 이들 비-가입자는 자신의 GCI 스코어 중 하나 이상에 제한된 범위 내에서 접근할 수 있거나, 또는 자신의 GCI 스코어들 중 하나 이상에 대한 초기 작성 리포트를 가질 수 있지만, 갱신된 리포트는 가입을 신청한 사람에게만 제공될 것이다. 다른 구체예에서, 건강 관리 매니저 및 건강 관리 제공자들 예를 들어, 간병인, 전문의 및 유전 상담자들도 개체의 GCI 스코어 중 하나 이상을 입수할 수도 있다.In another embodiment, a GCI score is scored for an individual to make it easier for the individual to understand information about the risk of developing one or more diseases or conditions or susceptibility to the disease or condition. In one embodiment, multiple GCI scores are scored for different diseases or conditions. In other embodiments, one or more GCI scores can be obtained through the on-line portal. Alternatively, one or more GCI scores may be provided in the form of a report sheet, which is subsequently updated as a form of report sheet. In one embodiment, the subscriber, ie the individual applying for service, will receive one or more GCI scores. In alternative embodiments, non-subscribers may also be available, in which case these non-subscribers have limited access to one or more of their GCI scores, or one or more of their GCI scores. You can have an initial written report for the report, but the updated report will be available only to the person who signed up for the subscription. In other embodiments, health care managers and health care providers, such as caregivers, specialists, and genetic counselors, may also obtain one or more of an individual's GCI score.

기본 가입 모델(basic subscription model)도 존재할 수 있다. 기본 가입시 가입자가 현존하는 모든 룰을 자신의 게놈 프로필에 적용시키거나, 또는 현존하는 룰의 하위 세트를 자신의 게놈 프로필에 적용시키도록 선택할 수 있을 경우, 표현형 프로필을 제공할 수 있다. 예를 들어, 기본 가입자는 소송을 제기할 수 있는 질병의 표현형에 대한 룰만을 적용하도록 선택할 수 있다. 기본 가입은 가입 군들 내에서 상이한 수준을 나타낼 수 있다. 예를 들어, 이와 같이 상이한 수준은, 가입자가 자신의 게놈 프로필과 상관시키고 싶어하는 표현형의 수, 또는 가입자 자신의 표현형 프로필을 입수할 수 있는 사람의 수에 따라서 달라질 수 있다. 기본 가입에 있어서 다른 수준은 개체에 특이적인 인자들 예를 들어, 이미 공지된 표현형 예를 들어, 연령, 성별 또는 병력, 자신의 표현형 프로필에 특이적인 인자들을 통합하는 것일 수 있다. 기본 가입에 관한 또 다른 수준은 개체가 질병이나 병태에 대한 하나 이상의 GCI 스코어를 얻을 수 있게 할 수 있다. 이와 같은 수준에 대한 변형 예는 또한, 하나 이상의 GCI 스코어를 생성하는데 사용된 분석법을 변형시킴으로 인하여 하나 이상의 GCI 스코어에도 임의의 변화가 발생하면, 그 개체가, 발생할 질병이나 병태에 대한 하나 이상의 GCI 스코어를 자동으로 갱신하도록 지정할 수 있도록 할 수도 있다. 몇몇 구체예에서, 개체는 이메일, 음성 메시지, 문자 메시지, 우편 배달 또는 팩스에 의해 자동으로 갱신되었음을 통보받을 수 있다.There may also be a basic subscription model. At base subscription, a phenotype profile can be provided if the subscriber can choose to apply all existing rules to his genomic profile, or to apply a subset of existing rules to his genomic profile. For example, the primary subscriber may choose to apply only the rules for phenotypes of diseases that may be brought to action. Basic subscriptions may exhibit different levels within the subscription groups. For example, such different levels may vary depending on the number of phenotypes the subscriber wants to correlate with his or her genomic profile, or the number of people who can obtain the subscriber's own phenotype profile. Another level of basic enrollment may be incorporating factors specific to an individual, such as already known phenotypes, such as age, gender or medical history, factors specific to their phenotype profile. Another level of base enrollment may enable an individual to obtain one or more GCI scores for a disease or condition. Modifications to this level also indicate that if any change occurs in one or more GCI scores by modifying the assay used to generate one or more GCI scores, the subject may have one or more GCI scores for the disease or condition that will occur. You can also specify to update automatically. In some embodiments, the subject may be notified that it has been automatically updated by email, voice message, text message, postal delivery or fax.

가입자들은 또한 표현형 프로필과 이 표현형에 대한 정보 예를 들어, 표현형에 대한 유전 정보 및 의학 정보를 담고 있는 리포트를 받을 수도 있다. 예를 들어, 집단 내 표현형의 유병율, 상관관계에 대하여 사용되었던 유전자 변이체, 표현형을 발현하는 분자 기작, 표현형에 대한 치료법, 표현형에 따른 치료법의 선택 옵션, 그리고 보호 조치가 리포트에 포함될 수 있다. 다른 구체예에서, 상기 리포트는 또한 정보 예를 들어, 개체의 유전자형과 다른 개체 예를 들어, 유명 인사 또는 기타 저명 인사의 유전자형 사이의 유사성을 포함할 수도 있다. 유사성에 대한 정보로서는 상동성%, 동일한 변이체의 수, 그리고 유사할 수 있는 표현형이 있을 수 있으나, 이에 한정되는 것은 아니다. 이와 같은 리포트는 또한 하나 이상의 GCI 스코어를 포함할 수도 있다. Subscribers may also receive a report containing a phenotype profile and information about the phenotype, eg, genetic and medical information about the phenotype. For example, the report may include the prevalence of phenotypes in the population, the genetic variants used for correlation, the molecular mechanisms expressing the phenotype, the treatment for the phenotype, options for the selection of therapies according to the phenotype, and protective measures. In another embodiment, the report may also include similarities between the information, for example, the genotype of the individual and the genotype of another individual, such as a celebrity or other celebrity. Information on similarity may include, but is not limited to,% homology, number of identical variants, and phenotypes that may be similar. Such a report may also include one or more GCI scores.

이 리포트는 또한, 리포트를 온-라인 상으로 신청할 경우, 표현형에 대한 추가 정보를 포함하는 다른 사이트에 링크시킬 수 있거나, 동일한 표현형 또는 하나 이상의 유사한 표현형을 가지는 사람들로 이루어진 온-라인 친목회와 이들의 게시판에 링크시킬 수 있거나, 온-라인 유전 상담자 또는 전문의에게 링크시킬 수 있거나, 또는 유전 상담자나 전문의와의 전화 상담 스케쥴 또는 방문 상담 스케쥴을 잡을 수 있도록 링크시킬 수 있다. 만일 리포트가 용지의 형태를 띤다면, 상기 정보는 전술한 링크의 웹사이트 주소, 또는 유전 상담자나 전문의의 전화 번호 및 주소일 수 있다. 가입자는 또한 어느 표현형을 자신의 표현형 프로필에 포함시킬지, 그리고 어느 정보를 그의 리포트에 포함시킬지를 선택할 수 있다. 표현형 프로필과 리포트는 또한 개체의 건강 관리 매니저 또는 건강 관리 제공자 예를 들어, 간병인, 전문의, 정신과 의사, 심리학자, 임상의 또는 유전 상담자가 입수할 수도 있다. 가입자는 표현형 프로필과 리포트, 또는 이것의 일부를 이와 같은 개체의 건강 관리 매니저 또는 건강 관리 제공자가 입수할 수 있도록 할지 여부를 선택할 수 있다.The report may also link to other sites that contain additional information about the phenotype, or, if you apply for the report on-line, on-line social gatherings of people with the same phenotype or one or more similar phenotypes and their Link to a bulletin board, link to an on-line genetic counselor or specialist, or link to schedule telephone counseling or visit counseling with a genetic counselor or specialist. If the report is in the form of a sheet of paper, the information may be the website address of the aforementioned link, or the telephone number and address of the genetic counselor or specialist. The subscriber can also choose which phenotypes to include in his phenotype profile and which information to include in his report. Phenotype profiles and reports may also be obtained by an individual's healthcare manager or healthcare provider, such as a caregiver, specialist, psychiatrist, psychologist, clinician or genetic counselor. The subscriber can choose whether to make the phenotype profile and reports, or portions thereof, available to the health care manager or health care provider of such an individual.

본 발명은 또한 가입의 고급 수준을 포함할 수도 있다. 가입의 고급 수준은 초기 표현형 프로필과 리포트를 작성한 후 가입자의 게놈 프로필을 디지털 방식으로 유지하고, 표현형 프로필과 최신의 연구 결과로부터 얻어진, 갱신 상관관계를 포함하는 리포트를 작성할 기회를 가입자에게 부여한다. 다른 구체예에서, 가입자들은 위험도 프로필과 최신의 연구 결과로부터 갱신된 상관관계를 포함하는 리포트를 작성할 기회를 가진다. 연구를 통하여, 유전자형과 표현형, 질병 또는 병태 사이의 상관관계를 새로이 규명해 냈을 때, 이와 같은 새로운 상관관계를 기초로 하는 룰이 새로이 형성될 것이며, 또한 이와 같이 새로이 정해진 룰은 이미 저장되어 보관되고 있는 게놈 프로필에 적용될 수 있다. 새로운 룰은 원래부터 임의의 표현형과 상관되지 않은 유전자형과 상관시킬 수 있거나, 새로운 표현형과 유전자형을 상관시킬 수 있거나, 현존하는 상관관계를 수정할 수 있거나, 또는 유전자형과 질병 또는 병태 사이에서 새로이 발견된 연관 관계를 기초로 하는 GCI 스코어를 조정하는 기초를 제공할 수 있다. 가입자들은 이메일이나 기타 전자 수단을 통하여 새로운 상관관계를 통보받을 수 있으며, 만일 그 표현형이 목적으로 하는 것일 경우, 가입자들은 새로운 상관관계로써 자신의 표현형 프로필을 갱신하도록 선택할 수 있다. 가입자들은 지정된 기간(예를 들어, 3개월, 6개월 또는 1년) 동안, 갱신할 때마다, 또는 다수 회, 또는 무한정 갱신하는 것에 대해 비용을 내도록 가입 조건을 선택할 수 있다. 다른 가입 수준에서는, 새로운 룰이 새로운 상관관계를 기초로 하여 형성될 때마다, 개체의 표현형 프로필 또는 위험도 프로필을 갱신할 때를 개체가 선택하게 하는 대신에, 가입자가 자신의 표현형 프로필 또는 위험도 프로필을 자동으로 갱신하도록 할 수 있다.The invention may also include an advanced level of subscription. The high level of subscription gives the subscriber the opportunity to create an initial phenotype profile and report, then digitally maintain the subscriber's genomic profile, and create a report that includes an update correlation derived from the phenotype profile and the latest research results. In another embodiment, subscribers have the opportunity to create a report that includes an updated correlation from the risk profile and the latest study results. When research reveals new correlations between genotypes and phenotypes, diseases, or conditions, new rules based on these new correlations will be formed, and these newly defined rules will already be stored and stored. Can be applied to a genomic profile. New rules can correlate with genotypes not originally associated with any phenotype, correlate new phenotypes with genotypes, modify existing correlations, or newly discovered associations between genotypes and diseases or conditions A basis for adjusting GCI scores based on relationships can be provided. Subscribers may be informed of new correlations via email or other electronic means, and if the phenotype is the purpose, the subscribers may choose to update their phenotype profile with the new correlation. Subscribers can select a subscription condition to pay for a renewal for a specified period of time (eg, 3 months, 6 months or 1 year), each renewal, or multiple, or indefinitely. At other subscription levels, whenever a new rule is formed based on a new correlation, instead of allowing the entity to choose when to update the entity's phenotype profile or risk profile, the subscriber may choose to update their phenotype profile or risk profile. It can be updated automatically.

가입의 다른 측면에서, 가입자들은 비-가입자를 표현형과 유전자형 사이의 상관관계에 관한 룰을 생성하는 서비스에 위탁할 수도 있으며, 개체의 게놈 프로필을 측정하고, 이 룰을 게놈 프로필에 적용시켜 개체의 표현형 프로필을 생성시킬 수 있다. 가입자에 의해 위탁된 위탁자는 가입자에게 상기 서비스 가입시 지불 비용을 할인받거나, 또는 현존하는 가입 조건을 갱신할 수도 있다. 위탁된 개체들은 제한된 시간에 자유롭게 정보를 얻을 수 있으며, 또는 가입 가격도 할인받을 수 있다.In another aspect of subscription, subscribers may entrust non-subscribers to services that generate rules relating to the correlation between phenotype and genotype, measure the genomic profile of the individual, and apply this rule to the genomic profile to You can create phenotype profiles. The consignor entrusted by the subscriber may be entitled to a discount on the cost of the subscription to the service, or to renew existing subscription conditions. Entrusted entities can get information freely for a limited time, or can get a discounted subscription price.

표현형 프로필과 리포트, 그리고 위험도 프로필과 리포트는 인간 및 비-인간인 개체에 대해서 작성될 수 있다. 예를 들어, 상기 개체들로서는 기타 포유류 예를 들어, 소, 말, 양, 개 또는 고양이를 포함할 수 있다. 본원에 사용된 가입자란 용어는, 한 가지 이상의 서비스를 구입 또는 이에 관한 비용을 내고 서비스를 신청한 사람인 개체를 의미한다. 서비스로서는 다음과 같은 것들 중 하나 이상을 포함할 수 있으나, 이에 한정되는 것은 아니다: 가입자 자신 또는 다른 개체 예를 들어, 가입자의 자녀 또는 애완 동물의 게놈 프로필을 측정하도록 만드는 것, 표현형 프로필을 생성하는 것, 표현형 프로필을 갱신하는 것, 그리고 게놈 및 표현형 프로필을 기초로 하여 리포트를 작성하는 것.Phenotype profiles and reports, and risk profiles and reports, can be prepared for human and non-human entities. For example, the subjects may include other mammals such as cattle, horses, sheep, dogs, or cats. The term subscriber, as used herein, refers to an individual who is the person who purchased or paid for one or more services. Services may include, but are not limited to, one or more of the following: making the subscriber's or other individuals, for example, measuring the genomic profile of the subscriber's child or pet, generating a phenotype profile To update the phenotype profile, and to generate a report based on the genomic and phenotype profile.

본 발명의 다른 측면에 있어서, 개체에 대한 표현형 프로필을 얻기 위하여 "현장에서 진행되는(field-deployed)" 기작을 통해 상기와 같은 개체로부터 수집할 수 있다. 바람직한 구체예에서, 개체는 유전 정보를 기초로 하여 형성된 초기의 표현형 프로필을 나타낼 수 있다. 예를 들어, 상이한 표현형에 대한 위험 인자와, 제안된 치료법 또는 예방 수단을 포함하는 초기의 표현형 프로필이 형성된다. 예를 들어, 프로필은 임의의 병태에 사용할 수 있는 의약품 정보 및/또는 식습관 변화 또는 운동 방식에 관한 제안을 포함할 수 있다. 개체는 웹 포털 또는 전화를 통하여, 전문의 또는 유전 상담자와 상담 또는 연락해서, 표현형 프로필에 관해 토론하도록 선택할 수 있다. 개체는 임의의 조치에 관한 과정 예를 들어, 특이적인 의약품을 섭취하는 것이나 식습관을 바꾸는 것 등을 취하도록 결정할 수 있다. In another aspect of the present invention, it is possible to collect from such an individual through a "field-deployed" mechanism to obtain a phenotype profile for the individual. In a preferred embodiment, the individual may exhibit an initial phenotype profile formed based on genetic information. For example, an initial phenotype profile is formed that includes risk factors for different phenotypes and suggested therapeutic or prophylactic measures. For example, the profile may include drug information and / or suggestions regarding dietary changes or modes of exercise that may be used for any condition. The individual may choose to discuss the phenotype profile by consulting or contacting a specialist or genetic counselor via a web portal or telephone. The individual may decide to take courses of any action, such as taking specific medicines or changing their eating habits.

이후, 개체는 자신의 신체 조건상의 변화와 위험 인자에서 발생할 수 있는 변화를 평가하도록 생물학적 시료를 제출할 수 있다. 개체는 게놈 프로필과 표현형 프로필을 형성하는 기관(또는 유관 기관 예를 들어, 유전자 프로필과 표현형 프로필을 형성하는 물질을 다루는 기관)에 생물학적 시료를 직접 제출함으로써 측정되는 변화를 나타낼 수 있다. 대안적으로, 개체는 "현장에서 진행되는" 기작을 이용할 수 있는데, 이 경우, 상기 개체는 자신의 타액, 혈액 또는 기타 생물학적 시료를 가정에서 검출 장치에 담아 보내어, 이것을 제3자에 의해 분석을 하게 한 다음, 데이터가 다른 표현형 프로필에 통합되도록 전송시킬 수 있다. 예를 들어, 개체는 심근 경색(MI)에 대한 평생 위험도가 증가한 개체를 알려주는 유전자 데이터를 기초로 하는, 초기 작성 표현형 보고서를 받을 수 있다. 이 리포트는 또한 MI 위험도를 감소시키는 예방 수단 예를 들어, 콜레스테롤 강하 약품 및 식습관 변화에 관한 제안을 제공할 수도 있다. 개체는 유전 상담자 또는 전문의와 연락을 취하여 리포트와 예방 수단에 대해 의논하는 것을 선택할 수 있고, 또한 식습관을 바꿀 것을 결정할 수 있다. 일정 기간 동안 식습관을 새롭게 바꾼 후, 각 개체는 자신의 전담 전문의로 하여금 콜레스테롤 수준을 측정하게 할 수 있다. 새로운 정보(콜레스테롤 수준)는, 심근 경색 및/또는 기타 병태에 대한 새로운 위험 인자를 포함하여, 게놈 정보, 및 개체에 대한 새로운 표현형 프로필을 형성하는데 사용된 새로운 정보와 함께, (예를 들어, 인터넷을 통해) 개체에 전송될 수 있다. The subject may then submit a biological sample to evaluate changes in his or her physical condition and possible changes in risk factors. An individual may exhibit a change measured by submitting a biological sample directly to an organ that forms a genomic profile and a phenotype profile (or an organ that handles a substance that forms a gene profile and a phenotype profile). Alternatively, an individual may use a "on-site" mechanism, in which the individual sends his saliva, blood or other biological sample to a detection device at home, where it can be analyzed by a third party. The data can then be sent for integration into other phenotype profiles. For example, an individual may receive an initial written phenotype report based on genetic data indicating an individual with increased lifetime risk for myocardial infarction (MI). This report may also provide suggestions for prevention measures, such as cholesterol-lowering drugs and dietary changes, which reduce the risk of MI. The individual may choose to contact a genetic counselor or specialist to discuss reports and preventive measures, and may also decide to change eating habits. After a renewal of dietary habits over a period of time, each individual can have his or her dedicated specialist measure cholesterol levels. New information (cholesterol levels), along with new information used to form new phenotype profiles for individuals, including new risk factors for myocardial infarction and / or other conditions (eg, the Internet). Can be sent to the object.

개체는 또한 "현장에서 진행되는" 기작 또는 직접적인 기작을 활용하여, 특정 의약품에 대한 개별 반응을 측정할 수도 있다. 예를 들어, 개체는 측정된 약물 반응을 나타낼 수 있으며, 이때 얻어진 정보는 더욱 효과적인 치료법을 결정하는데 사용될 수 있다. 측정 가능한 정보로서는 대사 물질 수준, 글루코스 수준, 이온(예를 들어, 칼슘, 나트륨, 칼륨 및 철) 수준, 비타민, 혈구 갯 수, 체 질량 지수(BMI), 단백질 수준, 전사물 수준, 심박 등을 포함하나, 이에 한정되는 것은 아니며, 이러한 정보들은 용이하게 실행할 수 있는 방법에 의해 측정될 수 있고, 또한 수정된 전체 위험도 예측 스코어를 측정하는 초기의 게놈 프로필을 통합하는 알고리즘으로 나누어질 수 있다.Individuals may also measure individual responses to particular medications by utilizing "on-site" or direct mechanisms. For example, an individual may exhibit a measured drug response, and the information obtained may be used to determine a more effective treatment. Measurable information includes metabolite levels, glucose levels, ion (eg, calcium, sodium, potassium, and iron) levels, vitamins, blood cell counts, body mass index (BMI), protein levels, transcript levels, heart rate, and more. Including but not limited to, such information may be measured by methods that can be readily implemented, and may also be divided into algorithms that incorporate an initial genomic profile that measures a modified overall risk prediction score.

"생물학적 시료"란 용어는, 개체로부터 분리할 수 있는 임의의 생물학적 시료들 예를 들어, 유전 물질이 분리될 수 있는 시료들을 의미한다. 본원에 사용된 "유전 시료"란 용어는, 개체로부터 얻어지거나 유래된 DNA 및/또는 RNA를 의미한다. The term "biological sample" refers to any biological sample that can be separated from an individual, for example, a sample from which genetic material can be separated. As used herein, the term "genetic sample" refers to DNA and / or RNA obtained or derived from an individual.

본원에 사용된 바와 같이, "게놈"이라는 용어는 인간 세포의 핵 내에서 발견되는 염색체 DNA의 완전한 상보체를 의미하는 것이다. "게놈 DNA"란 용어는, 인간 세포의 핵 내에 천연 상태에서 존재하는 하나 이상의 염색체 DNA 분자 또는 염색체 DNA 분자의 일부를 의미한다.As used herein, the term "genome" refers to the complete complement of chromosomal DNA found in the nucleus of human cells. The term "genomic DNA" refers to one or more chromosomal DNA molecules or portions of chromosomal DNA molecules that exist in nature in the nucleus of a human cell.

"게놈 프로필"이란 용어는, 개체의 유전자에 관한 정보 예를 들어, 특정 SNP의 존부 또는 돌연 변이 발생 여부에 관한 정보의 세트를 의미한다. 게놈 프로필은 개체의 유전자형을 포함한다. 게놈 프로필은 또한 개체의 실질적으로 완전한 게놈 서열일 수도 있다. 몇몇 구체예에서, 게놈 프로필은 개체의 완전한 게놈 서열의 60% 이상, 80% 이상, 또는 95% 이상일 수 있다. 게놈 프로필은 개체의 완전한 게놈 서열의 약 100%일 수 있다. 게놈 프로필에 관한 설명에 있어서, "그의 일부"란, 전체 게놈의 게놈 프로필 하위 세트에 관한 게놈 프로필을 의미한다. The term "genomic profile" refers to a set of information about a gene of an individual, such as the presence or absence of a particular SNP or whether a mutation occurs. Genomic profiles include the genotype of an individual. The genomic profile may also be the substantially complete genomic sequence of the individual. In some embodiments, the genomic profile may be at least 60%, at least 80%, or at least 95% of an individual's complete genomic sequence. The genomic profile may be about 100% of the complete genomic sequence of the individual. In the context of genomic profiles, “part thereof” means genomic profile for a subset of genomic profiles of the entire genome.

"유전자형"이란 용어는, 개체의 DNA에 관한 특이적인 유전자 구성을 의미한다. 유전자형은 개체의 유전자 변이체 및 마커를 포함할 수 있다. 유전자 마커 및 변이체로서는 뉴클레오티드 반복부, 뉴클레오티드 삽입부, 뉴클레오티드 결실부, 염색체 전좌 부, 염색체 중복 부 또는 복제 수 변이를 포함할 수 있다. 복제 수 변이로서는 초 위성체 반복부(microsatelite repeat), 뉴클레오티드 반복부, 동원체 반복부, 또는 텔로미어 반복부를 포함할 수 있다. 유전자형은 또한 SNP, 반수체형(haplotype) 또는 이배체형(diplotype)일 수도 있다. 반수체형은 위치 또는 대립 형질을 의미하는 것일 수 있다. 반수체형은 또한 통계학적으로 연관되어 있으며, 단일 염색 분체 상에 존재하는 단일 뉴클레오티드 다형성(SNP) 세트를 의미하는 것일 수도 있다. 이배체형은 반수체형의 세트이다.The term "genotype" refers to the specific genetic makeup of an individual's DNA. Genotypes may include genetic variants and markers of an individual. Genetic markers and variants may include nucleotide repeats, nucleotide insertions, nucleotide deletions, chromosomal translocations, chromosomal duplications or copy number variations. The copy number variation may include microsatelite repeats, nucleotide repeats, centriole repeats, or telomere repeats. Genotypes may also be SNPs, haplotypes or diplotypes. Haplotype may mean a position or allele. Haplotypes are also statistically related and may refer to a single nucleotide polymorphism (SNP) set present on a single chromosome. The diploid is a set of haploids.

단일 뉴클레오티드 다형성 또는 "SNP"란 용어는, 인간 집단 중 임의의 위치들에 존재하는 질소 함유 염기의 동일성과 관련하여, 다양성을 예를 들어, 1% 이상 나타내는 염색체상의 특정 위치를 의미하는 것이다. 예를 들어, 어느 한 개체가 소정의 유전자의 특정 뉴클레오티드 위치에 아데노신(A)을 가질 수 있을 경우, 다른 개체는 이 위치에 시토신(C), 구아닌(G) 또는 티민(T)을 가질 수 있으며, 그 결과 이와 같은 특정 위치에 SNP가 존재하게 되는 것이다.The term single nucleotide polymorphism or “SNP” refers to a specific location on a chromosome that exhibits diversity, for example, at least 1%, with respect to the identity of nitrogen-containing bases present at any of the positions of the human population. For example, if one individual may have adenosine (A) at a specific nucleotide position of a given gene, the other individual may have cytosine (C), guanine (G) or thymine (T) at this position As a result, the SNP is present at this specific position.

본원에 사용된 "SNP 게놈 프로필"이란 용어는, 어느 한 개체의 전체 게놈 DNA 서열에 전체적으로 존재하는 SNP 위치의 소정의 개체 DNA의 염기 함량을 의미하는 것이다. "SNP 프로필"이란, 전체 게놈 프로필을 의미하는 것일 수 있거나, 또는 이의 일부분 예를 들어, 특정 유전자 또는 유전자 세트와 연관될 수 있는, 보다 국소화된 SNP 프로필을 의미하는 것일 수 있다. As used herein, the term “SNP genomic profile” refers to the base content of a given individual DNA at an SNP position that is entirely present in the entire genomic DNA sequence of an individual. "SNP profile" may mean an entire genome profile, or it may mean a more localized SNP profile that may be associated with, for example, a particular gene or set of genes.

"표현형"이란 용어는, 개체의 정량적 형질 또는 특성을 나타내는 데 사용된다. 표현형으로서는 의학적 병태와 비-의학적 병태를 포함하나, 이에 한정되는 것은 아니다. 의학적 병태로서는 질병 및 질환을 포함한다. 표현형으로서는 또한 신체적 형질 예를 들어, 머리카락 색, 생리학적 형질 예를 들어, 폐활량, 정신적 형질 예를 들어, 기억 보유력, 감정적 형질 예를 들어, 화를 제어할 수 있는 능력, 인종 예를 들어, 민족적 배경, 가계 예를 들어, 어떠한 개체가 기원된 지점, 그리고 연령 예를 들어, 기대 연령(age expectancy) 또는 상이한 표현형이 발현되기 시작하는 연령을 포함할 수 있으나, 이에 한정되는 것은 아니다. 표현형은 또한 단일 유전 즉, 하나의 유전자가 표현형과 상관될 수 있는 경우이거나, 또는 다 인자 유전 즉, 하나 이상의 유전자가 표현형과 상관될 수 있는 경우인 것으로 생각된다. The term "phenotype" is used to denote a quantitative trait or characteristic of an individual. Phenotypes include, but are not limited to, medical and non-medical conditions. Medical conditions include diseases and disorders. Phenotypes also include physical traits such as hair color, physiological traits such as spirometry, mental traits such as memory retention, emotional traits such as the ability to control anger, race eg ethnic It may include, but is not limited to, a background, a family, for example, a point from which an individual originated, and an age, such as age expectancy or age at which a different phenotype begins to develop. Phenotypes are also contemplated as being the case where a single heredity, ie, one gene can be correlated with a phenotype, or where a multifactor inheritance, ie, when more than one gene can be correlated with a phenotype.

"룰"이란 용어는, 유전자형과 표현형 사이의 상관관계를 정의하는데 사용된다. 이 룰은 수치 예를 들어, 백분율, 위험 인자, 또는 신뢰도 스코어(confidence score)에 의한 상관관계를 정의할 수 있다. 룰은 다수의 유전자형과 표현형의 상관관계를 통합할 수 있다. "룰 세트"는 하나 이상의 룰을 포함한다. "새로운 룰"은 현재 존재하지 않는, 유전자형과 표현형 사이의 상관관계를 나타내는 룰일 수 있다. 새로운 룰은 또한 표현형과 상관되지 않은 유전자형과 상관될 수 있다. 새로운 룰은 또한, 표현형과 이미 상관되어 있던 유전자형과, 원래는 상관되지 않았던 표현형을 상관시킬 수 있다. "새로운 룰"은 또한 기타 인자들 예를 들어, 다른 룰에 의해 수정된 현존하는 룰일 수도 있다. 현존하는 룰은 개체의 알려진 특성들 예를 들어, 민족성, 가계, 거주 지형, 성별, 연령, 가족력 또는 기타 예전에 규명된 표현형을 통해 수정될 수 있다.The term "rule" is used to define a correlation between genotype and phenotype. This rule can define correlations by numerical values, such as percentages, risk factors, or confidence scores. Rules can incorporate multiple genotype and phenotype correlations. A "rule set" includes one or more rules. A "new rule" may be a rule that does not currently exist, indicating a correlation between genotype and phenotype. New rules can also be correlated with genotypes that are not correlated with the phenotype. The new rule can also correlate genotypes that have already been correlated with phenotypes and phenotypes that were not originally correlated. The "new rule" may also be an existing rule modified by other factors, such as other rules. Existing rules can be modified through known characteristics of the individual, such as ethnicity, pedigree, habitat, gender, age, family history or other previously identified phenotypes.

본원에 있어서 "유전자형의 상관관계"가 이용된다 함은, 개체의 유전자형 예를 들어, 임의의 돌연 변이 또는 돌연 변이들의 발생과, 표현형 예를 들어, 특정 질병, 병태, 신체적 상태 및/또는 정신적 상태에 대한 소인이 만들어질 가능성이 있음이 규명됨을 의미한다. 특이적인 유전자형의 존재 하에서 임의의 표현형이 관찰될 빈도는 유전자형의 상관 정도 또는 특정 표현형의 발현 가능성을 결정한다. 예를 들어, 본원에 상세히 기술되어 있는 바와 같이, 아포지질단백질 E4 아형을 생성하는 SNP는 알츠하이머병의 조기 발병 소인이 형성되는 것과 상관되어 있다. 유전자형의 상관관계란 또한, 표현형에 대한 소인이 아닌 상관관계, 또는 음의 상관관계를 의미할 수도 있다. 유전자형의 상관관계는 또한 표현형을 발현하거나 또는 표현형을 발현할 소인이 만들어질 개체에 대한 예측 결과를 나타낼 수도 있다. 유전자형의 상관관계는 수치 예를 들어, 백분율, 상대적인 위험 인자, 효과에 대한 예측 결과, 또는 신뢰도 스코어에 의해 표시될 수 있다.As used herein, “genotype correlation” is used to refer to the occurrence of a genotype of an individual, such as any mutation or mutation, and a phenotype, such as a particular disease, condition, physical condition, and / or mental state. It means that there is a possibility of a postmark being created for. The frequency with which any phenotype is observed in the presence of specific genotypes determines the degree of correlation of the genotypes or the likelihood of expression of a particular phenotype. For example, as described in detail herein, SNPs that produce apolipoprotein E4 subtypes are associated with the formation of premature onset of Alzheimer's disease. Genotype correlations may also mean non-prestige correlations or negative correlations for phenotypes. Genotype correlations may also represent predictive results for an individual to express a phenotype or to be predisposed to express a phenotype. Genotype correlations can be indicated by numerical values such as percentages, relative risk factors, predictive results for effects, or confidence scores.

"표현형 프로필(phenotype profile)"이란 용어는, 개체의 유전자형 또는 유전자형들과 상관된 다수의 표현형을 모아놓은 것을 의미한다. 표현형 프로필은 하나 이상의 룰을 게놈 프로필, 또는 게놈 프로필에 적용된 유전자형의 상관관계에 관한 정보 에 적용시킴으로써 형성된 정보를 포함할 수 있다. 다수의 유전자형과 표현형이 상관관계에 있다는 룰을 적용함으로써 표현형 프로필을 얻을 수 있다. 확률이나 예측치 예를 들어, 백분율, 수치로 나타낸 위험 인자 또는 수치로 나타낸 신뢰 구간으로서 표시할 수 있다. 확률은 또한 고, 중 또는 저로 나타낼 수도 있다. 표현형 프로필은 또한 표현형의 발현 여부나, 표현형의 발현 위험도를 나타낼 수도 있다. 예를 들어, 표현형 프로필은 푸른 눈(blue eye)의 발현 여부 또는 당뇨병 발병의 위험도가 높은지 여부를 나타낼 수 있다. 표현형 프로필은 또한 예상되는 예후, 치료 효능, 또는 의학적 병태의 치료에 대한 반응을 나타낼 수도 있다.The term "phenotype profile" means a collection of multiple phenotypes correlated with an individual's genotype or genotypes. The phenotype profile may comprise information formed by applying one or more rules to a genomic profile, or to information about the correlation of genotypes applied to the genomic profile. Phenotypic profiles can be obtained by applying the rule that multiple genotypes and phenotypes are correlated. Probabilities or predictions can be expressed as percentages, numerical risk factors or numerical confidence intervals. Probabilities can also be expressed as high, medium or low. The phenotype profile may also indicate whether the phenotype is expressed or the risk of expression of the phenotype. For example, the phenotype profile may indicate whether blue eyes are present or whether the risk of developing diabetes is high. The phenotype profile may also indicate an expected prognosis, therapeutic efficacy, or response to treatment of a medical condition.

위험도 프로필(risk profile)이란 용어는, 하나 이상의 질병이나 병태에 대한 GCI 스코어를 모아놓은 것을 의미한다. GCI 스코어는 한 가지 이상의 질병이나 병태를 포함하는 개체의 유전자형 간의 연관 관계에 관한 분석 결과를 기초로 한다. 뿐만 아니라, 위험도 프로필은 질병 카테고리로 분류된 GCI 스코어를 나타낼 수 있다. 또한, 위험도 프로필은, 특정 개체의 연령 또는 다양한 위험 인자들이 조정됨에 따라서 GCI 스코어가 어떻게 변하는지를 예측하는 것에 관한 정보를 나타낼 수 있다. 예를 들어, 특정 질병에 대한 GCI 스코어는 섭취 음식에 변화를 주었을 때의 효과 또는 휘하여진 예방 수단(금연, 약물 복용, 이중 근치적 유방 절제술, 자궁 적출술)에 의한 효과를 고려할 수 있다. GCI 스코어는 측정 수치, 그래픽 디스플레이, 청각 반응 또는 전술한 것들의 임의의 조합으로서 표시될 수 있다.The term risk profile refers to a collection of GCI scores for one or more diseases or conditions. GCI scores are based on analysis of associations between genotypes of individuals with one or more diseases or conditions. In addition, the risk profile may represent GCI scores classified into disease categories. In addition, the risk profile may indicate information about predicting how the GCI score changes as the age of a particular individual or various risk factors are adjusted. For example, the GCI score for a particular disease may take into account the effects of a change in the ingested food or the effects of warped prevention measures (non-smoking, drug use, dual radical mastectomy, hysterectomy). GCI scores can be displayed as measured values, graphical display, auditory response, or any combination of the foregoing.

본원에 사용된 "온-라인 포털(on-line portal)"이란 용어는, 컴퓨터 및 인터넷 웹사이트, 전화 또는 이와 유사하게 정보를 얻을 수 있는 기타 수단들을 사용함으로써, 개체가 용이하게 입수할 수 있는 정보의 공급원을 의미한다. 상기 온-라인 포털은 보안 웹사이트일 수 있다. 상기 웹사이트는 기타 보안 웹사이트 및 비-보안 웹사이트에 대한 링크를 제공할 수 있는데, 예를 들어, 보안 웹사이트와 개체의 표현형 프로필, 또는 비-보안 웹사이트 예를 들어, 구체적인 표현형을 공유하는 개체의 게시판에 대한 링크를 제공할 수 있다. As used herein, the term “on-line portal” refers to an object readily available to an individual by using computer and internet websites, telephones or similar means of obtaining information. Means a source of information. The on-line portal may be a secure website. The website may provide links to other secure websites and non-secure websites, for example, to share a phenotype profile of a secure website and an entity, or a non-secure website, for example a specific phenotype. It can provide a link to the bulletin board of an object.

달리 언급하지 않는 한, 본 발명을 수행함에 있어서는 당 업자에게 알려진 분자 생물학, 세포 생물학, 생화학 및 면역학에 관한 종래의 기술과 지식을 이용할 수 있다. 이와 같은 종래의 기술로서는 핵산 분리법, 중합체 어레이 합성법, 혼성화 방법, 결찰 방법, 그리고 표지를 이용하여 혼성화 여부를 검출하는 방법을 포함한다. 적당한 기술에 관한 구체예가 본원에 예시 및 인용되어 있다. 그러나, 기타 균등한 범위에 있는 종래 방법도 사용할 수 있다. 기타 종래의 기술과 지식을 표준적인 실험 매뉴얼과 교과서[예를 들어, Genome Analysis: A Laboratory Manual Series (Vols. I-IV), PCR Primer: A Laboratory Manual, Molecular Cloning: A Laboratory Manual(상기 문헌은 모두 Cold Spring Harbor Laboratory Press에서 출판함); Stryer, L. (1995) Biochemistry (4th Ed.) Freeman, New York; Gait, "Oligonucleotide Synthesis: A Practical Approach" 1984, IRL Press, London, Nelson and Cox (2000); Lehninger, Principles of Biochemistry 3rd Ed., W.H. Freeman Pub., New York, N.Y.; 및 Berg외 다수 (2002) Biochemistry, 5th Ed., W.H. Freeman Pub., New York, N.Y.; 상기 문헌들은 모든 목적으로서 본원에 그 자체로 참고 문헌으로 인용되어 있음]에서 살펴볼 수 있다.Unless otherwise stated, conventional techniques and knowledge of molecular biology, cell biology, biochemistry, and immunology known to those skilled in the art can be utilized in practicing the present invention. Such conventional techniques include nucleic acid separation, polymer array synthesis, hybridization, ligation, and methods for detecting hybridization using labels. Embodiments of suitable techniques are illustrated and cited herein. However, other conventional methods in the same range can also be used. Other conventional techniques and knowledge can be found in standard laboratory manuals and textbooks [e.g., Genome Analysis: A Laboratory Manual Series (Vols. I-IV), PCR Primer: A Laboratory Manual, Molecular Cloning: A Laboratory Manual. All published by the Cold Spring Harbor Laboratory Press); Stryer, L. (1995) Biochemistry (4th Ed.) Freeman, New York; Gait, "Oligonucleotide Synthesis: A Practical Approach" 1984, IRL Press, London, Nelson and Cox (2000); Lehninger, Principles of Biochemistry 3rd Ed., W.H. Freeman Pub., New York, N. Y .; And Berg et al. (2002) Biochemistry, 5th Ed., W.H. Freeman Pub., New York, N. Y .; These documents are incorporated by reference in their entirety herein for all purposes.

본 발명의 방법은 개체에게 표현형과 관련된 분자 정보를 제공하기 위해 개체의 게놈 프로필을 분석하는 것을 포함한다. 본원에 기술되어 있는 바와 같이, 개체는 자신의 게놈 프로필이 형성된 유전자 시료를 제공한다. 개체의 게놈 프로필에 관한 데이터는, 확립되어 입증된 인간 유전자형의 상관관계에 관한 데이터베이스에 대한 프로필을 비교함으로써, 유전자형의 상관관계에 대한 의문을 갖게 한다. 상기 확립되어 입증된 유전자형의 상관관계에 관한 데이터베이스는, 상호 검토된 문헌과 특정 분야 예를 들어, 유전학, 전염병학 또는 통계학 분야에 속하는 1인 이상의 숙련자로 이루어진 위원회에 의해 추가로 판단 및 보완된 사실로부터 얻을 수 있다. 바람직한 구체예에서, 룰은 보완된 유전자형의 상관관계를 기초로 만들어지며, 개체의 게놈 프로필에 적용되어 표현형 프로필을 형성한다. 해석 및 보충 정보와 함께, 개체의 게놈 프로필 및 표현형 프로필을 분석한 결과는 개체의 건강 관리 매니저 개인에게 제공되며, 그 결과, 개체의 건강 관리를 자신이 원하는 바대로 선택할 권한이 개별적으로 부여된다.The methods of the present invention comprise analyzing the genomic profile of an individual to provide the individual with molecular information related to the phenotype. As described herein, an individual provides a genetic sample in which his genomic profile has been formed. Data on the genomic profile of an individual raises the question of genotype correlations by comparing profiles against databases of established and proven human genotype correlations. The above established and validated database of genotype correlations is based on the facts further determined and supplemented by mutually reviewed literature and by a committee of one or more practitioners within a specific field, for example, genetics, epidemiology or statistics. You can get it. In a preferred embodiment, the rules are made based on complementary genotype correlations and applied to the individual's genomic profile to form a phenotype profile. The results of analyzing the individual's genomic profile and phenotype profile, along with interpretation and supplemental information, are provided to the individual's healthcare manager individual, and as a result, are individually authorized to select the individual's healthcare as desired.

본 발명의 방법을 도 1에 도시하였는데, 여기서, 처음에 개체의 게놈 프로필이 형성된다. 개체의 게놈 프로필은 유전자 변이 또는 마커를 기초로 하여, 개체의 유전자에 대한 정보를 포함할 것이다. 유전자 변이는 게놈 프로필을 구성하는 유전자형이다. 이와 같은 유전자 변이 또는 마커로서는, 단일 뉴클레오티드 다형성, 단일 및/또는 다수의 뉴클레오티드 반복부, 단일 및/또는 다수의 뉴클레오티드 결실부, 초 위성체 반복부(통상적으로 5∼1,000개의 반복 단위를 포함하는 소수의 뉴클레오티드 반복부), 디-뉴클레오티드 반복부, 트리-뉴클레오티드 반복부, 서열 재배열 부(전좌 부 및 중복 부 포함) 및 복제 수 변이(특정 위치의 결실 및 추가) 등을 포함하나, 이에 한정되는 것은 아니다. 기타 유전자 변이로서는 염색체 중복 및 전좌, 그리고 동원체 및 텔로미어 반복부를 포함한다.The method of the present invention is shown in FIG. 1, where a genomic profile of an individual is initially formed. The genomic profile of an individual will include information about the gene of the individual based on the genetic variation or marker. Genetic variation is the genotype that makes up the genomic profile. Such genetic variations or markers include single nucleotide polymorphisms, single and / or multiple nucleotide repeats, single and / or multiple nucleotide deletions, hypersatellite repeats (usually a few including 5 to 1,000 repeat units). Nucleotide repeats), di-nucleotide repeats, tri-nucleotide repeats, sequence rearrangements (including translocations and overlapping portions), and copy number variations (deletions and additions of specific positions), etc. no. Other genetic variations include chromosomal duplications and translocations, as well as isotope and telomere repeats.

유전자형은 또한 반수체형 및 이배체형을 포함할 수도 있다. 몇몇 구체예에서, 게놈 프로필은 100,000개, 300,000개, 500,000개 또는 1,000,000개 이상의 유전자형을 가질 수 있다. 몇몇 구체예에서, 게놈 프로필은 실질적으로 개체의 완전한 게놈 서열일 수 있다. 기타 구체예에서, 게놈 프로필은 개체의 완전한 게놈 서열의 60% 이상, 80% 이상 또는 95% 이상이다. 게놈 프로필은 개체의 완전한 게놈 서열의 약 100%일 수 있다. 표적을 포함하는 유전자 시료로서는, 증폭되지 않은 게놈 DNA 또는 RNA 시료, 또는 증폭된 DNA(또는 cDNA)를 포함하나, 이에 한정되는 것은 아니다. 상기 표적은 특정 목적을 가지는 유전자 마커를 포함하는 게놈 DNA의 특정 부위일 수 있다.Genotypes may also include haplotypes and diplotypes. In some embodiments, the genomic profile may have more than 100,000, 300,000, 500,000, or 1,000,000 genotypes. In some embodiments, the genomic profile can be substantially the complete genomic sequence of the individual. In other embodiments, the genomic profile is at least 60%, at least 80% or at least 95% of an individual's complete genomic sequence. The genomic profile may be about 100% of the complete genomic sequence of the individual. Gene samples that include a target include, but are not limited to, non-amplified genomic DNA or RNA samples, or amplified DNA (or cDNA). The target may be a specific site of genomic DNA comprising a genetic marker with a specific purpose.

도 1의 단계 102에서는, 개체의 유전자 시료를 개체의 생물학적 시료로부터 분리한다. 이와 같은 생물학적 시료로서는 혈액, 머리카락, 피부, 타액, 정액, 소변, 분변(fecal material), 땀, 협측 조직 및 다양한 체 조직을 포함하나, 이에 한정되는 것은 아니다. 몇몇 구체예에서, 조직 시료는 개체에 의해 직접 수집될 수 있는데, 예를 들어, 협측 시료는 그 개체가 자신의 불의 내부를 면봉으로 훔침으로써 얻을 수 있다. 기타 시료들 예를 들어, 타액, 정액, 소변, 분변 또는 땀도 개체 자신에 의해 공급될 수 있다. 기타 생물학적 시료는 건강 관리 전문가 예를 들어, 사혈 전문의, 간호사 또는 전문의에 의해 취하여질 수 있다. 예를 들어, 혈액 시료는 간호사에 의해 개체로부터 수집할 수 있다. 조직 생검은 건강 관리 전문가에 의해 진행될 수 있으며, 시료를 효율적으로 얻기 위한 키트도 건강 관리 전문가가 사용할 수 있다. 소량의 조직이나 체액 시료를 제거하기 위해, 겉에 싸여있던 작은 관을 제거하거나 바늘을 사용할 수 있다.In step 102 of FIG. 1, the genetic sample of the individual is separated from the biological sample of the individual. Such biological samples include, but are not limited to, blood, hair, skin, saliva, semen, urine, fecal material, sweat, buccal tissue and various body tissues. In some embodiments, the tissue sample may be collected directly by the subject, for example, the buccal sample may be obtained by the subject stealing the interior of his fire with a swab. Other samples such as saliva, semen, urine, feces or sweat may also be supplied by the subject itself. Other biological samples may be taken by a health care professional, such as a hematologist, nurse or specialist. For example, a blood sample can be collected from an individual by a nurse. Tissue biopsies can be performed by a health care professional, and kits for efficiently obtaining samples are also available to health care professionals. To remove small amounts of tissue or bodily fluid samples, small envelopes can be removed or needles can be used.

몇몇 구체예에서, 개체의 생물학적 시료를 담기 위한 시료 수집 용기가 장착된 키트가 개체에게 제공된다. 상기 키트는 또한 개체를 위한 설명서 즉, 사용자가 자신의 시료를 직접 수집할 수 있도록 해주는(머리카락, 소변, 땀 또는 타액을 얼마나 많이 수집해야 하는지를 알려주는) 설명서를 제공할 수도 있다. 상기 키트는 또한 개체가 조직 시료를 건강 관리 전문가에 의해 수집하도록 하는 설명서를 포함할 수도 있다. 상기 키트는 제3자에 의해 시료를 수집할 수 있는 장소(location)도 포함할 수 있는데, 예를 들어, 키트는 개체로부터 시료를 수집하는 의료 시설에 제공될 수 있는 것이다. 상기 키트는 또한, 유전 물질이 단계 104에서 생물학적 시료로부터 분리되는 경우, 시료 처리 시설로 보내어질 시료에 대한 회수용 포장 단위도 제공할 수 있다.In some embodiments, a kit is provided to a subject equipped with a sample collection container for holding a biological sample of the subject. The kit may also provide instructions for the individual, that is, instructions that allow the user to collect his or her own sample (which indicates how much hair, urine, sweat or saliva should be collected). The kit may also include instructions to allow the individual to collect a tissue sample by a health care professional. The kit can also include a location where a sample can be collected by a third party, for example, the kit can be provided to a medical facility that collects a sample from an individual. The kit may also provide a recoverable packaging unit for the sample to be sent to the sample processing facility when the genetic material is separated from the biological sample in step 104.

DNA 또는 RNA와 같은 유전자 시료는 널리 공지된 몇몇 생화학적 방법 및 분자 생물학적 방법 중 임의의 방법에 따라서, 생물학적 시료로부터 분리될 수 있다[예를 들어, Sambrook외 다수, Molecular Cloning: A Laboratory Manual (Cold Spring Harbor Laboratory, New York)(1989) 참조]. 생물학적 시료로부터 DNA 또는 RNA를 분리하기 위한 키트 및 시약 몇 개가 시판중에 있다[예를 들어, DNA 제노텍(DNA Genotek), 젠트라 시스템즈(Gentra Systems), 키아젠(Qiagen), 앰비온(Ambion)사 및 기타 공급 업체로부터 시판중에 있음]. 협측 시료용 키트도 시중에서 용이하게 구입할 수 있는데, 예를 들어, 마스터앰프(MasterAmp)™ 협측 도말 DNA 추출 키트(Buccal Swab DNA extraction kit)(Epicentre Biotechnologies)와, 혈액 시료로부터 DNA를 추출하기 위한 키트인 엑스트랙트-N-앰프(Extract-N-Amp)™(Sigma Aldrich)가 있다. 기타 조직으로부터 유래하는 DNA는, 단백질 분해 효소와 열로써 조직을 분해하고, 이 시료를 원심 분리하며, 페놀-클로로포름을 이용하여 원치 않는 물질을 추출해낸 다음, DNA를 수성 상에 잔류시킴으로써 얻을 수 있다. 이후, DNA는 에탄올 침전법에 의해 추가로 분리될 수 있다.Gene samples such as DNA or RNA can be isolated from biological samples according to any of several well-known biochemical and molecular biological methods (eg, Sambrook et al., Molecular Cloning: A Laboratory Manual (Cold). Spring Harbor Laboratory, New York (1989). Several kits and reagents for separating DNA or RNA from biological samples are commercially available (eg, DNA Genotek, Gentra Systems, Qiagen, Ambiion). And commercially available from other suppliers]. Buccal sample kits are also readily available on the market, such as MasterAmp ™ Buccal Swab DNA extraction kit (Epicentre Biotechnologies) and kits for extracting DNA from blood samples. There is an Extract-N-Amp ™ (Sigma Aldrich). DNA derived from other tissues can be obtained by digesting the tissue with proteolytic enzymes and heat, centrifuging the sample, extracting the unwanted material with phenol-chloroform, and then leaving the DNA in the aqueous phase. . The DNA can then be further separated by ethanol precipitation.

바람직한 구체예에서, 게놈 DNA는 타액으로부터 분리된다. 예를 들어, DNA 자가 수집 키트 기술(DNA Genotek)을 이용하여, 개체는 임상 처리를 위해 타액 표본을 수집한다. 상기 시료를 편리하게 저장하여 이를 실온에 놓아둘 수 있다. 상기 시료를 처리하기 위해서 적당한 실험실에 보낸 후, 통상적으로 50℃에서, 1시간 이상 동안 수집 키트 공급업체에 의해 제공된 시약을 사용하여, 이 시료를 열 변성시키고 단백질 분해 효소로 분해하여 DNA를 분리한다. 그 다음, 상기 시료를 원심 분리하고, 상청액을 에탄올로 침전시킨다. 이때 생성된 DNA 펠릿을 이후의 분석 과정에 적당한 완충액 중에 현탁한다. In a preferred embodiment, the genomic DNA is isolated from saliva. For example, using DNA self-collection kit technology (DNA Genotek), an individual collects saliva samples for clinical processing. The sample can be conveniently stored and left at room temperature. After sending the sample to a suitable laboratory for processing, typically at 50 ° C., using a reagent provided by a collection kit supplier for at least 1 hour, the sample is thermally denatured and digested with proteolytic enzymes to separate DNA. . The sample is then centrifuged and the supernatant is precipitated with ethanol. The resulting DNA pellet is suspended in a buffer suitable for subsequent analysis.

다른 구체예에서, RNA는 유전자 시료로서 사용될 수 있다. 특히, 발현된 유전자 변형은 mRNA로부터 동정될 수 있다. "메신저 RNA" 또는 "mRNA"라는 용어에는, 전구-mRNA 전사체(들), 전사체의 프로세싱 중간체, 번역을 앞둔 성숙한 mRNA(들), 그리고 유전자 또는 유전자들의 전사체, 또는 mRNA 전사체(들)로부터 유래하는 핵산을 포함하나, 이에 한정되는 것은 아니다. 전사체 프로세싱으로서는 스플라이싱(splicing), 에디팅(editing) 및 분해(degradation)를 포함할 수 있다. 본원에 사용된 바와 같이, mRNA 전사체로부터 유래하는 핵산이란, mRNA 전사체 또는 이의 종속 서열이 합성된 것이 궁극적으로 주형으로서 사용된 핵산을 의미한다. 그러므로, mRNA로부터 역전사된 cDNA, cDNA로부터 증폭된 DNA, 증폭된 DNA로부터 전사된 RNA 등은 모두 mRNA 전사체로부터 유래된다. RNA는 당 업계에 공지된 방법 예를 들어, 팩스젠(PAXgene)™ 블러드 RNA 시스템즈(PreAnalytiX)를 이용하여 미분획 전혈로부터 RNA를 분리하는 방법을 이용하여, 몇몇 체 조직 중 임의의 것으로부터 분리될 수 있다. 통상적으로, mRNA는 cDNA를 역전사하는데 사용될 것이며, 이후 이것은 유전자 변형 분석을 위해 사용 또는 증폭될 것이다.In other embodiments, RNA can be used as a genetic sample. In particular, expressed genetic modifications can be identified from mRNA. The term "messenger RNA" or "mRNA" includes pro-mRNA transcript (s), processing intermediates of transcripts, mature mRNA (s) for translation, and transcripts of genes or genes, or mRNA transcript (s). Nucleic acids derived from, but are not limited thereto. Transcript processing may include splicing, editing, and degradation. As used herein, a nucleic acid derived from an mRNA transcript refers to a nucleic acid in which the synthesis of an mRNA transcript or a dependent sequence thereof is ultimately used as a template. Therefore, cDNA reverse-transcribed from mRNA, DNA amplified from cDNA, RNA transcribed from amplified DNA, and the like are all derived from mRNA transcripts. RNA can be isolated from any of several body tissues using methods known in the art, such as the separation of RNA from unfractionated whole blood using PAXgene ™ Blood RNA Systems (PreAnalytiX). Can be. Typically, mRNA will be used to reverse transcribe cDNA, which will then be used or amplified for genetic modification analysis.

게놈 프로필 분석법을 수행하기에 앞서서, 유전자 시료는 통상적으로 DNA 또는 RNA로부터 역전사된 cDNA로부터 증폭될 것이다. DNA는 다수의 방법(대부분 PCR을 이용함)에 의해 증폭될 수 있다. 예를 들어, 문헌[PCR Technology: Principles and Applications for DNA Amplification (Ed. H. A. Erlich, Freeman Press, NY, N. Y., 1992); PCR Protocols: A Guide to Methods and Applications (Eds. Innis,외 다수, Academic Press, San Diego, Calif, 1990); Mattila외 다수, Nucleic Acids Res. 19, 4967 (1991); Eckert외 다수, PCR Methods and Applications 1, 17 (1991); PCR (Eds. McPherson외 다수, IRL Press, Oxford); 및 미국 특허 제4,683,202호, 동 제4,683,195호, 동 제4,800,159호, 동 제4,965,188호, 및 동 제5,333,675호; 상기 문헌들은 각각 모든 목적을 위해 그 자체로서 참고용으로 본원에 인용되어 있음]을 참조할 수 있다.Prior to performing genomic profile analysis, genetic samples will typically be amplified from cDNA reverse transcribed from DNA or RNA. DNA can be amplified by a number of methods (mostly using PCR). See, eg, PCR Technology: Principles and Applications for DNA Amplification (Ed. H. A. Erlich, Freeman Press, NY, N. Y., 1992); PCR Protocols: A Guide to Methods and Applications (Eds. Innis, et al., Academic Press, San Diego, Calif, 1990); Mattila et al., Nucleic Acids Res. 19, 4967 (1991); Eckert et al., PCR Methods and Applications 1, 17 (1991); PCR (Eds. McPherson et al., IRL Press, Oxford); And US Pat. Nos. 4,683,202, 4,683,195, 4,800,159, 4,965,188, and 5,333,675; Each of which is hereby incorporated by reference in its entirety for all purposes.

기타 적당한 증폭법으로서는 리가제 연쇄 반응(LCR)[예를 들어, Wu and Wallace, Genomics 4, 560 (1989), Landegren외 다수, Science 241, 1077 (1988) 및 Barringer외 다수 Gene 89: 117 (1990)], 전사 증폭법[Kwoh외 다수, Proc. Natl. Acad. Sci. USA 86:1173-1177(1989) 및 WO 88/10315], 자립형 서열 복제법[Guatelli외 다수, Proc. Nat. Acad. Sci. USA, 87:1874-1878 (1990) 및 W0 90/06995], 표적 폴리뉴클레오티드 서열의 선택적 증폭법[미국 특허 제6,410,276호], 공통 서열로써 프라이밍된 중합 효소 연쇄 반응(CP-PCR)(미국 특허 제4,437,975호), 무작위로 프라이밍된 중합 효소 연쇄 반응(AP-PCR)(미국 특허 제5,413,909호 및 동 제5,861,245호), 핵산계 서열 증폭법(NABSA), 회전 원 증폭법(Rolling Circle Amplification; RCA), 다중 치환 증폭법(MDA)(미국 특허 제6,124,120호 및 동 제6,323,009호) 및 원-대-원 증폭법(circle-to-circle amplification; C2CA)[Dahl외 다수 Proc. Natl. Acad. Sci 101:4548-4553 (2004)]을 포함한다[미국 특허 제5,409,818호, 동 제5,554,517호 및 동 제6,063,603호; 상기 문헌은 각각 본원에 참고용으로 인용됨]. 사용될 수 있는 기타 증폭 방법에 관하여는 문헌[미국 특허 제5,242,794호, 동 제5,494,810호, 동 제5,409,818호, 동 제4,988,617호, 동 제6,063,603호 및 동 제5,554,517호 및 미국 특허 출원 제09/854,317호; 이들 문헌은 각각 본원에 참고용으로 인용됨]에 개시되어 있다.Other suitable amplification methods include ligase chain reaction (LCR) [eg, Wu and Wallace, Genomics 4, 560 (1989), Landegren et al., Science 241, 1077 (1988) and Barringer et al. Gene 89: 117 (1990 )], Transcriptional amplification [Kwoh et al., Proc. Natl. Acad. Sci. USA 86: 1173-1177 (1989) and WO 88/10315, freestanding sequence replication [Guatelli et al., Proc. Nat. Acad. Sci. USA, 87: 1874-1878 (1990) and WO 90/06995, selective amplification of target polynucleotide sequences [US Pat. No. 6,410,276], polymerase chain reaction (CP-PCR) primed with consensus sequences (US Pat. 4,437,975), randomly primed polymerase chain reaction (AP-PCR) (US Pat. Nos. 5,413,909 and 5,861,245), nucleic acid-based sequence amplification (NABSA), rolling circle amplification (RCA) ), Multiple substitution amplification (MDA) (US Pat. Nos. 6,124,120 and 6,323,009) and circle-to-circle amplification (C2CA) [Dahl et al. Proc. Natl. Acad. Sci 101: 4548-4553 (2004); US Pat. Nos. 5,409,818, 5,554,517 and 6,063,603; Each of which is incorporated herein by reference. Other amplification methods that can be used are described in US Pat. Nos. 5,242,794, 5,494,810, 5,409,818, 4,988,617, 6,063,603, and 5,554,517 and US Patent Application Nos. ; Each of which is incorporated herein by reference.

단계 106에서는 몇몇 방법들 중 임의의 방법을 이용하여 게놈 프로필을 생성하게 된다. 유전자 변형을 동정하는 몇몇 방법에 관하여는 당 업계에 공지되어 있는데, 그 예로서는 몇몇 방법들 중 임의의 방법에 의한 DNA 서열 결정법, PCR계 방법, 단편 길이 다형성 검정법(제한 단편 길이 다형성(RFLP), 절단 단편 길이 다형성(CFLP)), 대립 형질 특이적 올리고뉴클레오티드를 주형으로 사용하는 혼성화 방법(예를 들어, 택맨(TaqMan) PCR 방법, 인베이더 방법(invader method), DNA 칩 방법), 프라이머 연장 반응을 통한 방법 및 질량 스펙트럼 분석법(MALDI-TOF/MS 방법) 등을 포함하나, 이에 한정되는 것은 아니다.In step 106 a genomic profile is generated using any of several methods. Several methods of identifying genetic modifications are known in the art, such as DNA sequencing by any of several methods, PCR-based methods, fragment length polymorphism assays (limited fragment length polymorphism (RFLP), cleavage) Fragment length polymorphism (CFLP)), hybridization methods using allele specific oligonucleotides as templates (e.g., TaqMan PCR method, invader method, DNA chip method), primer extension reaction Methods and mass spectral analysis (MALDI-TOF / MS method) and the like.

하나의 구체예에서, 고 밀도 DNA 어레이는 SNP 동정 및 프로필 생성에 사용된다. 이와 같은 어레이는 어피메트릭스(Affymetrix) 및 일루미나(Illumina)[어피메트릭스 진 칩(Affymetrix GeneChip)® 500K 검정 매뉴얼(Affymetrix, Santa Clara, CA; 참고용으로 인용됨); 센트릭스(Sentrix)® 휴먼햅650Y(humanHap650Y) 유전자형 분석 비드칩(Illumina, San Diego, CA) 참조]로부터 시판되고 있다.In one embodiment, high density DNA arrays are used for SNP identification and profile generation. Such arrays include Affymetrix and Illumina (Affymetrix GeneChip® 500K Assay Manual (Affymetrix, Santa Clara, CA; cited for reference); Commercially available from Sentrix® humanHap650Y Genotyping Bead Chips (Illumina, San Diego, Calif.).

예를 들어, SNP 프로필은, 어피메트릭스 게놈 와이드 휴먼 SNP 어레이 6.0[Affymetrix Genome Wide Human SNP Array 6.0]을 사용하여 900,000개 이상의 SNP를 유전자형 분석함으로써 생성될 수 있다. 대안적으로, 전체-게놈 시료 채취 분석법을 통한 500,000개 이상의 SNP는, 어피메트릭스 진 칩 휴먼 맵핑 500K 어레이 세트(Affymetrix GeneChip Human Mapping 500K Array Set)를 사용하여 결정될 수 있다. 이와 같은 검정법에서는, 제한 효소로 분해된 어댑터-결찰 인간 게놈 DNA를 이용하는 단일 프라이머 증폭 반응을 통해 인간 게놈의 하위 세트가 증폭된다. 도 2에 나타낸 바와 같이, 이후 결찰된 DNA의 농도가 측정될 수 있다. 이후, 증폭된 DNA를 단편화하고, 시료의 품질을 측정한 다음, 단계 106을 계속해서 수행한다. 만일 시료가 PCR 및 단편화 표준과 맞을 경우, 이 시료는 변성 및 표지화되고, 이후, 코팅된 수정 표면상의 특정 위치에 작은 DNA 프로브를 포함하는 마이크로어레이에 혼성화된다. 증폭된 DNA 서열의 함수인, 각각의 프로브에 혼성화되는 표지의 양을 모니터링하여, 서열에 관한 정보를 얻게 되고, 그 결과 SNP 유전자형을 분석한다.For example, SNP profiles can be generated by genotyping over 900,000 SNPs using Affymetrix Genome Wide Human SNP Array 6.0. Alternatively, more than 500,000 SNPs through whole-genomic sampling assays can be determined using an Affymetrix GeneChip Human Mapping 500K Array Set. In such assays, a subset of the human genome is amplified via a single primer amplification reaction using adapter-ligated human genomic DNA digested with restriction enzymes. As shown in FIG. 2, the concentration of ligation DNA can then be measured. The amplified DNA is then fragmented, the quality of the sample is measured, and step 106 is continued. If the sample meets the PCR and fragmentation standards, the sample is denatured and labeled and then hybridized to a microarray containing small DNA probes at specific locations on the coated quartz surface. The amount of label hybridized to each probe, which is a function of the amplified DNA sequence, is monitored to obtain information about the sequence, which results in analyzing the SNP genotype.

제조자의 지시에 따라서, 어피메트릭스 진 칩 500K 검정법을 실시한다. 간단히 말해서, 분리된 게놈 DNA를 우선, NspI 또는 StyI 제한 엔도뉴클레아제로 분해한다. 이후, 분해된 DNA를 NspI 또는 StyI 어댑터 올리고뉴클레오티드(즉, NspI 또는 StyI 제한 DNA 중 어느 하나에 각각 어닐링되는 올리고뉴클레오티드)로 결찰한다. 이후, 상기 결찰된 어댑터-함유 DNA를 PCR에 의해 증폭하여, 약 200∼1100 염기쌍인 증폭 DNA 단편(겔 전기 영동으로 확인)을 얻는다. 단편화를 위해 증폭 표준에 맞는 PCR 생성물을 정제 및 정량한다. 최적의 DNA 칩 혼성화를 위해 PCR 생성물을 DNaseI으로 단편화한다. 단편화 이후, DNA 단편의 크기는 250 염기쌍 미만이었으며, 평균적으로는 약 180 염기쌍이었다(겔 전기 영동법으로 확인함). 이후, 말단 데옥시뉴클레오티딜 전이 효소를 이용하여, 단편화 표준에 맞는 시료들을 바이오틴 화합물로 표지화한다. 그 다음, 표지화된 단편들을 변성시킨 후, 이를 진 칩 250K 어레이에 혼성화한다. 혼성화 후, 상기 어레이를 염색하고 나서, 3단계로 이루어진 공정 즉, 스트렙타비딘 피코에리트린(SAPE) 염색 과정 → 바이오틴화된 항-스트렙타비딘 항체(염소)를 사용하는 항체 증폭 과정 → 스트렙타비딘 피코에리트린(SAPE)을 사용하는 최종 염색 과정으로 이루어진 공정으로 스캐닝한다. 표지화 이후, 상기 어레이를 어레이 보관 완충액(array holding buffer)에 담그고 나서, 스캐너 예를 들어, 어피메트릭스 진 칩 스캐너 3000(Affymetrix GeneChip Scanner 3000)으로 스캐닝한다. According to the manufacturer's instructions, the Affymetrix Gene Chip 500K assay is performed. In short, the isolated genomic DNA is first digested with NspI or StyI restriction endonucleases. The digested DNA is then ligated with NspI or StyI adapter oligonucleotides (ie, oligonucleotides annealed to either NspI or StyI restriction DNA, respectively). The ligated adapter-containing DNA is then amplified by PCR to obtain amplified DNA fragments (identified by gel electrophoresis) that are about 200 to 1100 base pairs. Purify and quantify PCR products that meet amplification standards for fragmentation. PCR products are fragmented with DNaseI for optimal DNA chip hybridization. After fragmentation, the DNA fragments were less than 250 base pairs in size, on average about 180 base pairs (identified by gel electrophoresis). Subsequently, using the terminal deoxynucleotidyl transferase, samples meeting the fragmentation standard are labeled with the biotin compound. The labeled fragments are then denatured and then hybridized to the true chip 250K array. After hybridization, the array is stained, followed by a three-step process: streptavidin phycoerythrin (SAPE) staining → antibody amplification using biotinylated anti-streptavidin antibody (goat) → streptavi Scanning is done with a process consisting of a final staining process using Dean Picoerythrin (SAPE). After labeling, the array is immersed in array holding buffer and then scanned with a scanner such as the Affymetrix GeneChip Scanner 3000.

도 3에 나타낸 바와 같이, 제조자의 설명서에 따라, 어피메트릭스 진 칩 휴먼 맵핑 500K 어레이 세트로 스캐닝을 한 이후에 얻어진 데이터를 분석한다. 간단히 말해서, 진 칩 운영 소프트웨어(GeneChip Operating Software; GCOS)를 사용하여 미가공 데이터를 얻는다. 이 데이터는 또한 어피메트릭스 진 칩 명령 콘솔(Affymetrix GeneChip Command Console)™을 이용하여 얻을 수도 있다. 이와 같이 미가공 데이터를 얻어낸 후 이를 진 칩 유전자형 분석 소프트웨어(GeneChip Genotyping Analysis Software; GTYPE)로 분석한다. 본 발명의 목적에 따라서, GTYPE 콜 비율(call rate)이 80% 미만인 시료들은 배제한다. 이후, 시료를 BRLMM 및/또는 SNiPer 알고리즘 분석법으로 분석한다. BRLMM 콜 비율이 95% 미만인 시료 또는 SNiPer 콜 비율이 98% 미만인 시료들은 배제한다. 마지막으로, 연합 분석법을 수행하고, SNiPer 품질 지수(quality index)가 0.45 미만인 시료 및/또는 하디-바인베르크 p-수치가 0.00001 미만인 시료들은 배제한다.As shown in Fig. 3, according to the manufacturer's instructions, the data obtained after scanning with the Affymetrix Gene Chip Human Mapping 500K array set is analyzed. In short, raw data is obtained using GeneChip Operating Software (GCOS). This data can also be obtained using the Affymetrix GeneChip Command Console ™. The raw data is thus obtained and analyzed by GeneChip Genotyping Analysis Software (GTYPE). For the purposes of the present invention, samples with a GTYPE call rate of less than 80% are excluded. The sample is then analyzed by BRLMM and / or SNiPer algorithm analysis. Samples with less than 95% BRLMM call rate or samples with less than 98% SNiPer call rate are excluded. Finally, a combined assay is performed and samples with SNiPer quality index less than 0.45 and / or samples with Hardy-Weinberg p-values less than 0.00001.

DNA 마이크로어레이 분석법에 대한 대안으로서 또는 이 분석법에 더하여, 유전자 변이 예를 들어, SNP 및 돌연 변이를 DNA 서열 결정법으로 검출할 수 있다. DNA 서열 결정법은 또한 상당한 부분, 또는 개체의 전체 게놈 서열을 서열 결정하는데 사용될 수도 있다.As an alternative to or in addition to DNA microarray assays, genetic variations such as SNPs and mutations can be detected by DNA sequencing. DNA sequencing may also be used to sequence substantial portions, or the entire genomic sequence of an individual.

통상적으로, 일반적인 DNA 서열 결정법은 사슬-말단화 단편들의 집단을 분석하는 폴리아크릴아미드 겔 분획화를 기초로 한다[Sanger외 다수, Proc. Natl. Acad. Sci. USA 74:5463-5467 (1977)]. DNA 서열 결정의 속도와 용이성을 증가시키기 위한 대안적인 방법이 개발된 바 있으며, 아직까지도 개발되고 있다. 예를 들어, 고 처리량 및 단일 분자 서열 결정 플랫폼이 시판중에 있거나, 또는 개발중에 있다[454 라이프 사이언시즈(454 Life Sciences; Branford, CT)(Margulies외 다수, Nature(2005) 437:376-380 (2005)); 솔렉사(Solexa; Hayward, CA); 헬리코스 바이오사이언시즈 코포레이션(Helicos BioSciences Corporation; Cambridge, MA)(미국 특허 출원 제11/167046호(2005년 6월 23일)), 및 리-코 바이오사이언시즈(Li-Cor Biosciences; Lincoln, NE)(미국 특허 출원 제11/118031호(2005년 4월 29일)].Typically, general DNA sequencing is based on polyacrylamide gel fractionation, which analyzes a population of chain-terminated fragments [Sanger et al., Proc. Natl. Acad. Sci. USA 74: 5463-5467 (1977). Alternative methods for increasing the speed and ease of DNA sequencing have been developed and are still being developed. For example, high throughput and single molecule sequencing platforms are commercially available or under development. (454 Life Sciences; Branford, CT) (Margulies et al., Nature (2005) 437: 376-380 ( 2005)); Solexa (Hayward, Calif.); Helicos BioSciences Corporation (Cambridge, MA) (US Patent Application No. 11/167046 (23 June 2005)), and Li-Cor Biosciences (Lincoln, NE) (US Patent Application No. 11/118031 (April 29, 2005)).

개체의 게놈 프로필을 단계 106에서 생성한 이후, 단계 108에서는 이 프로필을 디지털 방식으로 저장하는데, 이때, 이 프로필은 보안 유지 방식으로 디지털 저장될 수 있다. 게놈 프로필은 데이터 세트의 일부로서 저장될, 컴퓨터 가독성 포맷으로 암호화되며, 또한 데이터베이스로서 저장될 수 있는데, 이때, 상기 게놈 프로필은 "축적(banking)"될 수 있고, 이후, 다시 이것을 입수할 수 있다. 상기 데이터 세트는 다수의 데이터 포인트를 포함하는데, 여기서, 각각의 데이터 포인트는 개체와 관련되어 있는 것이다. 각각의 데이터 포인트는 다수의 데이터 요소들을 보유할 수 있다. 하나의 데이터 요소는 유일한 식별자로서, 개체의 게놈 프로필을 동정하는데 사용된다. 이는 바 코드(bar code)일 수 있다. 기타 데이터 요소로서는 유전자형에 관한 정보 예를 들어, 개체의 게놈의 SNP 또는 뉴클레오티드 서열이 있다. 유전자형 정보에 상응하는 데이터 요소도 또한 이 데이터 포인트 내에 포함될 수 있다. 예를 들어, 만일 유전자형 정보가 마이크로어레이 분석에 의하여 동정된 SNP를 포함하면, 기타 데이터 요소는 마이크로어레이 SNP 식별 번호, SNP rs 번호 및 다형성 뉴클레오티드를 포함할 수 있다. 기타 데이터 요소들은 유전자형 정보의 염색체상 위치, 이 데이터의 품질 메트릭스(quality metrics), 미가공 데이터 파일, 데이터 이미지 그리고 추론해 낸 강도 스코어(intensity score)일 수 있다.After generating the genomic profile of the individual in step 106, step 108 stores the profile digitally, where the profile can be stored digitally in a secure manner. The genomic profile can be encoded in a computer readable format, which will be stored as part of the data set, and also stored as a database, where the genomic profile can be "banked" and then obtained again. . The data set includes a plurality of data points, where each data point is associated with an entity. Each data point may hold a number of data elements. One data element is a unique identifier that is used to identify an individual's genomic profile. This may be a bar code. Other data elements include genotype information such as SNPs or nucleotide sequences of an individual's genome. Data elements corresponding to genotype information may also be included within this data point. For example, if genotyping information includes SNPs identified by microarray analysis, other data elements may include microarray SNP identification numbers, SNP rs numbers, and polymorphic nucleotides. Other data elements may be the chromosomal location of genotype information, quality metrics of this data, raw data files, data images, and deduced intensity scores.

개체에 관한 구체적인 인자들 예를 들어, 신체적 데이터, 의학적 데이터, 민족성, 가계, 거주 지형, 성별, 연령, 가족력, 공지된 표현형, 인구 통계학적 데이터, 노출 데이터(exposure data), 생활 방식에 관한 데이터, 행동에 관한 데이터, 그리고 기타 공지된 표현형도 데이터 요소로서 통합될 수 있다. 예를 들어, 상기 인자의 예로서는 개체에 관한 것들 예를 들어, 출생지, 부모 및/또는 조부모, 사촌과의 가계, 거주 지역, 조상의 거주 지역, 환경 조건, 공지된 건강 상태, 공지된 약물 상호 작용, 가족의 건강 상태, 생활 방식에 있어서의 조건, 식습관, 운동 습관, 결혼 여부, 그리고 신체 측정 수치 예를 들어, 체중, 신장, 콜레스테롤 수준, 심박수, 혈압, 글루코스 수준 및 기타 당 업계에 공지된 측정치를 포함할 수 있으나, 이에 한정되는 것은 아니다. 전술한 개체의 친척이나 조상 예를 들어, 부모 및 조부모에 대한 인자들은 또한, 데이터 요소로서 통합될 수도 있으며, 개체에 표현형이나 병태가 나타날 위험도를 측정하는데 사용될 수도 있다.Specific factors related to individuals, for example, physical data, medical data, ethnicity, household, habitat, gender, age, family history, known phenotypes, demographic data, exposure data, lifestyle data , Behavioral data, and other known phenotypes may also be incorporated as data elements. For example, examples of such factors include those relating to an individual, such as place of birth, parents and / or grandparents, household with cousin, residence, ancestor's residence, environmental conditions, known health conditions, known drug interactions. , Family health conditions, lifestyle conditions, eating habits, exercise habits, marital status, and physical measurements such as weight, height, cholesterol levels, heart rate, blood pressure, glucose levels, and other measurements known in the art. It may include, but is not limited thereto. The factors for relatives or ancestors of the aforementioned individuals, for example parents and grandparents, may also be incorporated as data elements and used to determine the risk of developing a phenotype or condition in the individual.

특정 인자들은 질문지나 개체의 건강 관리 매니저로부터 알아낼 수 있다. 이후, "축적된" 프로필로부터 얻은 정보를 입수하여 원하는 바대로 활용할 수 있다. 예를 들어, 개체의 유전자형에 관한 상관관계를 처음 평가함에 있어서, 그 개체에 관한 전체적인 정보(통상적으로, 전체 게놈을 통해 존재하거나 그로부터 유래하는 SNP 또는 기타 게놈 서열)는 유전자형의 상관관계에 대해 분석될 것이다. 후속 분석법에 있어서, 원하는 바와 같이 또는 적당하게, 저장 또는 축적된 게놈 프로필로부터 전체적인 정보, 또는 그의 일부 중 어느 하나를 얻어낼 수 있다.Specific factors may be obtained from questionnaires or from the individual's health care manager. The information obtained from the "accumulated" profile can then be obtained and used as desired. For example, in the initial evaluation of an individual's genotype correlations, global information about the individual (typically, SNPs or other genomic sequences that are present or derived from the entire genome) is analyzed for genotype correlations. Will be. In subsequent assays, either whole information, or portions thereof, can be obtained from the stored or accumulated genomic profile, as desired or suitably.

게놈 프로필과 유전자형의 상관관계의 데이터베이스 비교Database comparison of genome profile and genotype correlation

단계 110에서는, 과학 문헌으로부터 유전자형의 상관관계를 얻을 수 있다. 대상으로 하는 한 가지 이상의 표현 형질이 존재하는지 여부와 유전자형 프로필에 대해서 테스트된 개체의 집단을 분석함으로써 유전자 변이에 대한 유전자형의 상관관계가 측정된다. 이후, 프로필 중 각각의 유전자 변이 또는 다형성이 존재하는 대립 형질을 검토하며, 그 결과, 특정 대립 형질이 존재하는지 여부가 대상으로 하는 형질과 연관되어 있는지 여부를 확인할 수 있게 되는 것이다. 상관관계는 통계학상 표준 방법에 의해 분석될 수 있으며, 통계학적으로 유의적인, 유전자 변이 및 표현형 특성 사이의 상관관계가 기록된다. 예를 들어, 대립 형질 A1에 다형성 A가 존재하는 것과 심장 질환 발생 간에는 상관되어 있음을 알 수 있는 것이다. 추가 예로서, 대립 형질 A1에는 다형성 A가, 그리고 대립 형질 B1에는 다형성 B가 함께 존재함은, 암 발병 위험이 증가하는 것과 상관되어 있다. 분석 결과는 상호 검토된 문헌에 공개되어 있으며, 기타 연구 그룹에 의해 입증될 수 있으며/입증될 수 있거나, 전문가 예를 들어, 유전학자, 통계학자, 전염병학자 및 전문의에 의해 분석될 수 있고, 또한 보완될 수도 있다.In step 110, genotype correlations may be obtained from the scientific literature. Genotype correlations for genetic variation are determined by analyzing the presence of one or more expressing traits of interest and the population of individuals tested for the genotype profile. Then, the alleles in which each gene mutation or polymorphism exists in the profile are examined, and as a result, it is possible to confirm whether or not a specific allele is associated with the target trait. Correlations can be analyzed by statistically standard methods, and correlations between statistically significant genetic variations and phenotypic characteristics are recorded. For example, it can be seen that there is a correlation between the presence of polymorph A in allele A1 and the occurrence of heart disease. As a further example, the presence of polymorph A in allele A1 and polymorph B in allele B1 correlates with an increased risk of developing cancer. The results of the analysis are published in the mutually reviewed literature, can be substantiated by other research groups, and / or can be verified, analyzed by experts such as geneticists, statisticians, epidemiologists and specialists, It may be supplemented.

도 4, 5 및 6에는, 게놈 프로필에 적용될 룰을 기초로 할 수 있는 유전자형과 표현형 사이의 상관관계에 관한 예를 나타내었다. 예를 들어, 도 4a 및 4b에 있어서, 각 열은 표현형/위치/민족성에 해당하며, 이때, 도 4c∼4i는 각 열의 상관관계에 관한 추가 정보를 포함한다. 예를 들어, 도 4a에 있어서, "축약 표현형 명칭" BC는, 도 4m에 표시한 바와 같이 축약 표현형 명칭에 대한 인덱스로서, 유방암의 축약어이다. BC_4(위치에 대한 일반 명칭임) 열에서, 유전자 LSP1은 유방암과 상관되어 있다. 공개되었거나 또는 이와 같은 상관관계가 있는 것으로 확인된 기능성 SNP는 rs3817198(도 4c 참조)로서, 여기서, 공개된 위험도 대립 형질은 C이며, 비-위험도 대립 형질은 T이다. 공개된 SNP와 대립 형질들은 공표된 문헌 예를 들어, 세미나 간행물을 통해 확인된다(도 4e∼4g 참조). 도 4e의 LSP1에 관한 예에서, 세미나 간행물로서는 문헌[Easton외 다수, Nature 447:713-720 (2007)]이 있다. 도 22 및 25에는 추가로 상관관계에 대한 정보가 나열되어 있다. 도 22 및 25에 있어서의 상관관계는 개체에 병태 또는 표현형이 나타날 위험도를 계산하는데 사용될 수 있는데, 예를 들어, GCI 스코어 또는 GCI 플러스 스코어를 계산하는데 사용될 수 있다. GCI 스코어 또는 GCI 플러스 스코어는 또한 정보 예를 들어, 병태의 유병율을 통합할 수도 있다(예를 들어, 도 23 참고).4, 5 and 6 show examples of correlations between genotypes and phenotypes that can be based on rules to be applied to genomic profiles. For example, in Figures 4A and 4B, each column corresponds to a phenotype / position / ethnicity, where Figures 4C-4I contain additional information regarding the correlation of each column. For example, in FIG. 4A, the abbreviated phenotype name BC is an index for the abbreviated phenotype name, as shown in FIG. 4M, and is an abbreviation for breast cancer. In the column BC_4 (general name for location), the gene LSP1 is correlated with breast cancer. The functional SNP that has been disclosed or found to be correlated is rs3817198 (see FIG. 4C), wherein the published risk allele is C and the non-risk allele is T. Published SNPs and alleles are identified through published literature such as seminar publications (see FIGS. 4E-4G). In the example of LSP1 in FIG. 4E, the seminar publication is Easton et al., Nature 447: 713-720 (2007). 22 and 25 further list information about correlation. Correlations in FIGS. 22 and 25 can be used to calculate the risk of developing a condition or phenotype in an individual, for example, to calculate a GCI score or a GCI plus score. The GCI score or the GCI plus score may also incorporate information such as the prevalence of the condition (see, eg, FIG. 23).

대안적으로, 상관관계는 저장된 게놈 프로필로부터 생성될 수 있다. 예를 들어, 저장된 게놈 프로필을 나타내는 개체는 또한 저장되어 있던 공지의 표현형 정보를 가질 수도 있다. 저장되어 있는 게놈 프로필과 공지된 표현형을 분석하면 유전자형의 상관관계를 알아낼 수 있다. 예를 들어, 저장되어 있는 게놈 프로필을 나타내는 개체들 250명을 통해서, 그들이 예전에 당뇨병 진단을 받았었다는 정보를 저장할 수 있다. 이들의 게놈 프로필을 분석하여, 그 결과를 당뇨병이 발병하지 않은 개체들로 이루어진 대조군과 비교한다. 그러면, 예전에 당뇨병 진단을 받았던 개체들은 대조군에 비하여 특정한 유전자의 변이율이 더욱 높다는 사실과, 그러한 유전자 변이체와 당뇨병 사이의 유전자형은 상관될 수 있다는 사실이 파악된다. Alternatively, correlations can be generated from stored genomic profiles. For example, an individual representing a stored genomic profile may also have known phenotypic information that has been stored. By analyzing stored genome profiles and known phenotypes, genotype correlations can be determined. For example, 250 individuals representing stored genomic profiles can store information that they had previously been diagnosed with diabetes. Their genomic profile is analyzed and the results compared to a control group of individuals who do not develop diabetes. It is then found that individuals who have previously been diagnosed with diabetes have a higher rate of mutation of certain genes than controls, and that genotypes between such gene variants and diabetes may be correlated.

단계 112에 있어서는, 특정 표현형에 대한 유전자 변이체의 입증된 상관관계를 기초로 하여 룰이 정해진다. 예를 들어, 룰은 표 1에 나열된 상관 유전자형과 표현형을 기초로 하여 정해질 수 있다. 상관관계를 기초로 한 룰은 기타 인자들 예를 들어, 성별(예를 들어, 도 4) 또는 민족성(도 4 및 5)을 통합하여, 효과에 관한 예측(예를 들어, 도 4 및 5)을 하도록 만들 수 있다. 이러한 룰로부터 얻어진 기타 측정치는 상대적 위험도 증가 여부를 예측하게 할 수 있다(도 6). 효과에 관한 예측 결과와 예측된 상대적 위험도 증가 여부는 공표된 문헌으로부터 파악할 수 있거나, 또는 공표된 문헌으로부터 계산할 수 있다. 대안적으로, 룰은 저장되어 있던 게놈 프로필과 예전에 공지된 표현형으로부터 얻어진 상관관계를 기초로 할 수 있다. 몇몇 구체예에서, 상기 룰은 도 22 및 25에 나타낸 상관관계를 기초로 한다.In step 112, rules are determined based on the proven correlation of genetic variants to specific phenotypes. For example, the rules can be determined based on the correlated genotypes and phenotypes listed in Table 1. Correlation-based rules incorporate other factors, such as gender (eg, FIG. 4) or ethnicity (FIGS. 4 and 5), to predict the effect (eg, FIGS. 4 and 5). You can make it work. Other measurements obtained from these rules can be used to predict whether the relative risk will increase (FIG. 6). Predictions of the effects and whether the predicted relative risk increases can be grasped from published literature or calculated from published literature. Alternatively, the rules may be based on correlations between stored genomic profiles and previously known phenotypes. In some embodiments, the rule is based on the correlations shown in FIGS. 22 and 25.

바람직한 구체예에서, 유전자 변이체는 SNP일 것이다. SNP는 하나의 위치에서 생성되며, 이 하나의 위치에 특정 SNP 대립 형질을 가지는 개체는 종종 다른 위치에도 특이적인 SNP 대립 형질을 가진다. 질병과 병태에 대하여 소인을 가지게 하는 개체의 대립 형질과 SNP의 상관관계는 연관 불균형(linkage disequilibrium)을 통해 형성되는 데, 이 경우, 2군데 이상의 위치에 존재하는 대립 형질의 비-무작위적 연관 관계는, 어느 한 집단 내에서, 재조합을 통한 무작위 형성으로부터 예상되는 연관 관계에 비하여 다소 빈번하게 일어난다.In a preferred embodiment, the genetic variant will be SNP. SNPs are generated at one location, and individuals with specific SNP alleles at one location often have specific SNP alleles at other locations. The correlation of alleles and SNPs in individuals that predispose to diseases and conditions is formed through linkage disequilibrium, in which case non-random associations of alleles at two or more locations are present. In either population, occurs somewhat more frequently than expected associations from random formation through recombination.

기타 유전자 마커 또는 변이체 예를 들어, 뉴클레오티드 반복부 또는 삽입부는 또한, 특이적 표현형과 연관된 것으로 파악되는 유전자 마커와 연관 불균형 상태일 수도 있다. 예를 들어, 뉴클레오티드 삽입은 표현형과 상관되어 있으며, SNP는 뉴클레오티드 삽입과 연관 불균형 상태이다. SNP와 표현형 사이의 상관관계를 기초로 하여 룰이 형성된다. 뉴클레오티드 삽입과 표현형 사이의 상관관계를 기초로 한 룰도 형성될 수 있다. 둘 중 어느 하나의 룰 또는 두 개의 룰 전부는 게놈 프로필에 적용될 수 있는데, 즉, SNP와 임의의 위험 인자가 연합하여 위험도를 증가시킬 수 있을 때, 하나의 SNP가 존재함으로 말미암아 임의의 위험도 인자가 형성될 수 있고, 다른 SNP도 다른 위험 인자를 형성할 수 있는 것이다.Other genetic markers or variants, such as nucleotide repeats or inserts, may also be in an imbalanced association with genetic markers that are believed to be associated with specific phenotypes. For example, nucleotide insertions are correlated with phenotypes, and SNPs are in an unbalanced association with nucleotide insertions. Rules are formed based on the correlation between SNPs and phenotypes. Rules based on the correlation between nucleotide insertion and phenotype can also be formed. Either rule or both rules can be applied to the genomic profile, i.e., when an SNP and any risk factor can be combined to increase the risk, the presence of one SNP means that any risk factor Other SNPs may form other risk factors.

연관 불균형을 통하여, 질병 소인성 대립 형질은 SNP의 특정 대립 형질 또는 SNP의 특정 대립 형질을 조합한 것과 동시 분리(cosegregate)된다. 염색체를 따라서 존재하는 SNP 대립 형질들의 특정한 조합을 반수체형이라고 부르며, SNP 대립 형질이 함께 존재하는 DNA 부위를 반수체형 블록이라 부를 수 있다. 반수체형 블록은 하나의 SNP로 이루어질 수 있는 반면에, 통상적으로 반수체형 블록은, 개체 간 반수체형 다양성이 작고 일반적으로 재조합 발생 빈도가 낮은, 2개 이상의 SNP로 이루어진 연속 시리즈를 나타낸다. 반수체형 블록에 존재하는 하나 이상의 SNP를 동정함으로써 반수체형을 동정할 수 있다. 그러므로, SNP 프로필은 통상적으로, 소정의 반수체형 블록에 존재하는 모든 SNP를 반드시 동정할 필요 없이 반수체형 블록을 동정하는데 사용될 수 있다.Through linkage disequilibrium, disease predisposition alleles are cosegregated with a combination of specific alleles of SNPs or specific alleles of SNPs. Particular combinations of SNP alleles present along the chromosome are called haploids, and DNA sites with SNP alleles together may be called haploid blocks. Haploid blocks may consist of one SNP, whereas haploid blocks typically represent a contiguous series of two or more SNPs, with low haploid diversity between individuals and generally low recombination frequency. The haplotype can be identified by identifying one or more SNPs present in the haplotype block. Therefore, SNP profiles can typically be used to identify haploid blocks without necessarily identifying all SNPs present in a given haploid block.

SNP 반수체형 패턴과 질병, 병태 또는 신체적 상태 간 유전자형의 상관관계에 관하여는 점점 많이 알려지고 있다. 소정의 질병에 있어서, 어떤 질병이 발병한 것으로 알려진 사람 군의 반수체형 패턴은 그 질병이 발병하지 않은 사람 군의 반수체형 패턴과 비교된다. 다수의 개체들을 분석함으로써, 집단 내 다형성의 발현 빈도를 측정할 수 있으며, 또한 이와 같은 발생 빈도 또는 유전자형은 특정의 표현형 예를 들어, 질병이나 병태와 연관될 수 있는 것이다. 공지된 SNP-질병 간 상관관계의 예로서는, 연령-관련 황반 변성에 있어서 보체 인자(complement factor) H 내 다형성[Klein외 다수, Science: 308:385-389(2005)]과, 비만과 연관된 INSIG2 유전자에 인접하여 존재하는 변이체[Herbert외 다수, Science: 312:279-283(2006)]을 포함한다. 기타 공지된 SNP의 상관관계로서는, CDKN2A 및 B를 포함하는 9p21 부위 내 다형성 예를 들어, 심근 경색과 상관된 rs10757274, rs2383206, rs13333040, rs2383207, 및 rs1O116277을 포함한다[Helgadottir외 다수, Science 316:1491-1493 (2007); McPherson외 다수, Science 316:1488-1491 (2007)].The genotype correlation between SNP haploid pattern and disease, condition or physical condition is increasingly known. For a given disease, the haploid pattern of the group of people known to have developed the disease is compared to the haploid pattern of the group of people who have not developed the disease. By analyzing a large number of individuals, the frequency of expression of polymorphisms in a population can be measured, and such incidence or genotype can be associated with a particular phenotype, eg, disease or condition. Examples of known SNP-disease correlations include polymorphisms in complement factor H in age-related macular degeneration (Klein et al., Science: 308: 385-389 (2005)) and the INSIG2 gene associated with obesity Variants which exist adjacent to (Herbert et al., Science: 312: 279-283 (2006)). Other known SNP correlations include polymorphisms in 9p21 sites including CDKN2A and B, for example rs10757274, rs2383206, rs13333040, rs2383207, and rs1O116277 correlated with myocardial infarction [Helgadottir et al., Science 316: 1491 -1493 (2007); McPherson et al., Science 316: 1488-1491 (2007)].

상기 SNP는 기능성(functional)이거나 비-기능성(non-functional)일 수 있다. 예를 들어, 기능성 SNP는 세포 기능에 영향을 줌으로써 표현형을 발현시키는 반면에, 비-기능성 SNP는 기능면에서는 침묵 상태에 있지만, 기능성 SNP와 연관 불균형 상태에 있을 수 있다. 상기 SNP는 또한 동일하거나 동일하지 않을 수도 있다. 동일한 SNP는 상이한 형태로 인하여 동일한 폴리펩티드 서열을 생성하는 SNP로서, 비-기능성 SNP이다. 만일 SNP가 상이한 폴리펩티드를 생성하면, 상기 SNP는 동일하지 않으며, 또한 기능성일 수 있거나 또는 그렇지 않을 수 있다. 2개 이상의 반수체형들로 이루어진 이배형에서 반수체형을 동정하는데 사용된 SNP 또는 기타 유전 마커들은 또한, 이배체형과 연관된 표현형을 상관시키는데 사용될 수도 있다. 개체의 반수체형, 이배체형 및 SNP 프로필에 관한 정보는 개체의 게놈 프로필 내에 있을 수 있다.The SNP may be functional or non-functional. For example, functional SNPs express phenotypes by affecting cellular function, while non-functional SNPs may be silent in function but in associative imbalance with functional SNPs. The SNPs may also be the same or not the same. Identical SNPs are SNPs that produce identical polypeptide sequences due to different forms, which are non-functional SNPs. If the SNPs produce different polypeptides, the SNPs may not be identical and may or may not be functional. SNPs or other genetic markers used to identify haplotypes in diplotypes consisting of two or more haplotypes may also be used to correlate phenotypes associated with diplotypes. Information about an individual's haplotype, diplotype, and SNP profile may be within the individual's genomic profile.

바람직한 구체예에서, 표현형과 상관된 다른 유전자 마커와 연관 불균형 상태로 있는 유전자 마커를 기초로 하여 형성된 룰에 있어서, 유전자 마커는 r2 또는 D' 스코어 즉, 당 업계에서 연관 불균형을 측정하는데 일반적으로 사용되는 스코어가 0.5 이상일 수 있다. 바람직한 구체예에서, 상기 스코어는 0.6, 0.7, 0.8, 0.90, 0.95 또는 0.99 이상이다. 결과적으로, 본 발명에 있어서, 표현형을 개체의 게놈 프로필과 상관시키는데 사용된 유전자 마커는, 표현형과 상관된 기능성 SNP 또는 공개된 SNP와 동일할 수 있거나, 또는 상이할 수 있다. 예를 들어, BC_4를 사용할 경우, 테스트 SNP 및 공개된 SNP는 동일하며, 이는 테스트 위험도의 경우에도 마찬가지이고, 또한 비 위험(nonrisk) 대립 형질은 공개된 위험 및 비 위험 대립 형질과도 동일하다(도 4a 및 4c). 그러나, BC_5, CASP8 및 이것과 유방암과의 상관관계에 있어서, 테스트 SNP는 그것의 기능성 SNP 또는 공개된 SNP와는 상이한데, 이는 공개된 위험 및 비 위험 대립 형질에 대한 테스트 위험 대립 형질 및 비 위험 대립 형질의 경우에도 동일하다. 테스트 대립 형질 및 공개된 대립 형질은 게놈의 (+) 사슬과 상대적으로 편향되어 있으며, 이러한 컬럼으로부터 동형 접합성 위험 유전자형 또는 비 위험 유전자형을 추론할 수 있는데, 이로써 개체 예를 들어, 가입자의 게놈 프로필에 적용될 룰을 형성할 수 있다. 몇몇 구체예에서, 테스트 SNP는 동정될 수 없으나, 공개된 SNP 정보를 이용함으로써, 대립 형질 간 차이 또는 SNP는 기타 검정법 예를 들어, 택맨(TaqMan)을 기초로 하여 동정될 수 있다. 예를 들어, 도 25a의 AMD_5 즉, 공개된 SNP는 rs1061170이지만, 테스트 SNP는 동정되지 않았다. 상기 테스트 SNP는 공개된 SNP를 이용하는 LD 분석법에 의해 동정될 수 있다. 대안적으로, 테스트 SNP를 사용할 수 없는 대신에, 테스트 SNP를 가지는 개체의 게놈을 평가하는데 택맨 또는 기타 비교 검정법이 사용될 것이다. In a preferred embodiment, for a rule formed based on a genetic marker that is in associative imbalance with other genetic markers correlated with the phenotype, the genetic marker is generally used to determine an r 2 or D 'score, i.e., associative imbalance in the art. The score used may be at least 0.5. In a preferred embodiment, the score is at least 0.6, 0.7, 0.8, 0.90, 0.95 or 0.99. As a result, in the present invention, the genetic marker used to correlate the phenotype with the genomic profile of the individual may be the same as or different from the functional SNP or the published SNP correlated with the phenotype. For example, when using BC_4, the test SNP and the published SNP are the same, which is the same for the test risk, and also the nonrisk allele is the same with the published risk and non-risk alleles 4a and 4c). However, in the correlation of BC_5, CASP8 and this to breast cancer, the test SNP is different from its functional SNP or published SNP, which is a test risk allele and a non-risk allele for published and non-risk alleles. The same is true for traits. Test alleles and published alleles are relatively biased with the (+) chain of the genome, from which it is possible to infer homozygous risk genotypes or non-risk genotypes, thus allowing for the addition of an individual, e. The rule to be applied can be formed. In some embodiments, test SNPs cannot be identified, but by using published SNP information, allelic differences or SNPs can be identified based on other assays such as TaqMan. For example, AMD_5 of FIG. 25A, the published SNP, is rs1061170, but no test SNP was identified. The test SNPs can be identified by LD assay using published SNPs. Alternatively, instead of being unable to use the test SNP, a Taqman or other comparative assay will be used to evaluate the genome of the individual having the test SNP.

테스트 SNP는 "DIRECT" 또는 "TAG" SNP(도 4e∼4g 및 도 5)일 수 있다. DIRECT SNP는 공개되었거나 기능성인 SNP와 동일한 테스트 SNP 예를 들어, BC_4에 대한 SNP이다. DIRECT SNP는 또한, 유럽인들과 아시아인들의 SNP rs1073640을 이용하여, 유방암과의 FGFR2 상관관계에 대해 사용될 수도 있는데, 이 경우, 부 대립 형질은 A이고, 기타 대립 형질은 G이다[Easton외 다수, Nature 447:1087-1093 (2007)]. 기타 공개되었거나 기능성인, 유방암에 대한 FGFR2 상관관계에 대한 SNP로서는 rs1219648이 있는데, 이는 또한 유럽인들과 아시아인들에게서 살펴볼 수 있는 것이다[Hunter외 다수, Nat. Genet. 39:870-874 (2007)]. 테스트 SNP가 기능성 또는 공개된 SNP와 상이한 경우, Tag SNP는 BC_5의 경우에서와 같다. Tag SNP는 또한 기타 유전자 변이체에 대한 SNP 예를 들어, CAMTA1(rs4908449), 9p21(rs10757274, rs2383206, rs13333040, rs2383207, rs10116277), COL1A1(rs1800012), FVL(rs6025), HLA-DQA1(rs4988889, rs2588331), eNOS(rs1799983), MTHFR(rs1801133) 및 APC(rs28933380)로도 사용될 수 있다. The test SNP may be a "DIRECT" or "TAG" SNP (FIGS. 4E-4G and 5). The DIRECT SNP is the same test SNP as the published or functional SNP, for example SNP for BC_4. DIRECT SNP may also be used for FGFR2 correlation with breast cancer, using SNP rs1073640 from Europeans and Asians, in which case the allele is A and the other allele is G [Easton et al., Nature 447: 1087-1093 (2007). Another SNP for FGFR2 correlations for published and functional breast cancer is rs1219648, which can also be found in Europeans and Asians [Hunter et al., Nat. Genet. 39: 870-874 (2007). If the test SNP is different from the functional or published SNP, the Tag SNP is the same as in the case of BC_5. Tag SNPs also include SNPs for other gene variants such as CAMTA1 (rs4908449), 9p21 (rs10757274, rs2383206, rs13333040, rs2383207, rs10116277), COL1A1 (rs1800012), FVL (rs6025), HLA-DQA1 (rs2588331) rs4988889 , eNOS (rs1799983), MTHFR (rs1801133) and APC (rs28933380) can also be used.

SNP의 데이터베이스는 예를 들어, 국제 햅 맵 프로젝트[www.hapmap.org, The International HapMap Consortium, Nature 426:789-796(2003), 및 The International HapMap Consortium, Nature 437:1299-1320(2005) 참고], 인간 유전자 돌연 변이 데이터베이스(HGMD) 공공 데이터베이스(www.hgmd.org 참고), 그리고 단일 뉴클레오티드 다형성 데이터베이스(dbSNP)(www.ncbi.nlm.nih.gov/SNP/)로부터 공중이 입수할 수 있다. 이와 같은 데이터베이스는 SNP 단배체를 제공하거나, 또는 SNP 단배체 패턴을 결정할 수 있게 해준다. 그러므로, 이러한 SNP 데이터베이스는 광범위한 질병 및 병태 예를 들어, 암, 염증성 질환, 심혈관계 질환, 신경 퇴행성 질환 및 감염성 질환에 내재되어 있는 유전적 위험 인자들을 관찰할 수 있도록 해준다. 질병 또는 병태는 이를 대상으로 소송을 제기할 수 있는 것이며, 여기서, 이 질병 또는 병태와 관련된 치료법과 처치법은 현재 수행되고 있는 것이다. 치료법은 예방용 치료법과, 증상 및 질환을 경감시키는 치료법 예를 들어, 생활 습관의 변화 등을 포함할 수 있다. Databases of SNPs can be found, for example, in the International HapMap Project [www.hapmap.org, The International HapMap Consortium, Nature 426: 789-796 (2003), and The International HapMap Consortium, Nature 437: 1299-1320 (2005). ], Publicly available from the Human Gene Mutation Database (HGMD) Public Database (see www.hgmd.org), and the Single Nucleotide Polymorphism Database (dbSNP) (www.ncbi.nlm.nih.gov/SNP/). . Such a database can provide SNP diploids or allow the determination of SNP diploid patterns. Therefore, this SNP database allows the observation of the genetic risk factors inherent in a wide range of diseases and conditions, such as cancer, inflammatory diseases, cardiovascular diseases, neurodegenerative diseases and infectious diseases. A disease or condition can be brought against it, where the treatments and treatments associated with the disease or condition are currently being performed. Therapies may include prophylactic therapies and therapies to alleviate symptoms and diseases, such as lifestyle changes and the like.

기타 다수의 표현형 예를 들어, 신체적 형질, 생리학적 형질, 정신적 형질, 감정적 형질, 민족성, 가계 및 연령도 관찰될 수 있다. 신체적 형질로서는 키, 머리카락 색깔, 눈 색깔, 신체, 또는 체력, 끈기 및 민첩성과 같은 형질을 포함할 수 있다. 정신적인 형질로서는 지능, 기억력 또는 학습 능력을 포함할 수 있다. 민족성과 가계는 조상이나 민족을 동정하는 것 즉, 어느 한 개체가 기원한 조상들을 분석하는 것을 포함할 수 있다. 연령은 개체의 실제 연령이나, 또는 전체 집단과 개체의 유전적인 특성을 연관 짖는 연령으로 측정할 수 있다. 예를 들어, 어느 한 개체의 실제 연령이 38세라고 하더라도, 이 개체의 유전적 특성으로 말미암아 기억 능력이 결정될 수 있거나, 또는 신체적 건강 연령은 평균 28세일 수도 있는 것이다. 기타 연령에 따른 형질은 어느 한 개체의 장수 여부를 결정지을 수도 있다. Many other phenotypes can also be observed, such as physical traits, physiological traits, mental traits, emotional traits, ethnicity, family and age. Physical traits may include height, hair color, eye color, body, or traits such as physical strength, persistence and agility. Mental traits may include intelligence, memory or learning ability. Ethnicity and ancestry can include identifying ancestors or nations, ie, analyzing ancestors from which an individual originated. Age can be measured by the actual age of the individual or by the age at which the genetic population of the individual is associated with the entire population. For example, even if the actual age of an individual is 38 years old, the genetic characteristics of the individual may determine memory capacity, or the average physical health age may be 28 years old. Other age-dependent traits may determine the longevity of either individual.

기타 표현형으로서는 또한 비-의학적 병태 예를 들어, "흥미로운(fun)" 표현형을 포함할 수도 있다. 이러한 표현형으로서는, 널리 공지된 개체 예를 들어, 외국 저명 인사, 정치인, 유명 인사, 발명가, 운동 선수, 음악가, 예술가, 사업가, 그리고 악명 높은 인물 예를 들어, 범죄자와 비교한 결과들을 포함할 수 있다. 기타 "흥미로운" 표현형으로서는 다른 유기체 예를 들어, 박테리아, 곤충, 식물 또는 인간 이외의 동물과의 비교 결과를 포함할 수 있다. 예를 들어, 어느 한 개체는 그 사람의 게놈 프로필이 그가 키우고 있는 애완용 강아지나, 전직 대통령과 어떻게 비교되는지에 관심이 있을 수 있다. Other phenotypes may also include non-medical conditions, eg, “fun” phenotypes. Such phenotypes may include results compared to well-known entities such as foreign celebrities, politicians, celebrities, inventors, athletes, musicians, artists, businessmen, and infamous figures such as criminals. . Other “interesting” phenotypes may include the results of comparisons with other organisms such as bacteria, insects, plants or animals other than humans. For example, an individual may be interested in how a person's genomic profile compares to the pet dog he is raising or a former president.

단계 114에서는, 저장되어 있던 게놈 프로필에 룰을 적용시켜 단계 116의 표현형 프로필을 형성시킨다. 예를 들어, 도 4∼6의 정보는 개체의 게놈 프로필을 적용시키기 위한 룰이나 테스트의 기초를 형성할 수 있다. 상기 룰은 테스트 SNP 및 대립 형질, 그리고 도 4의 효과 예측치를 포함할 수 있는데, 여기서, 상기 효과 예측치에 대한 유닛(UNIT)은 효과 예측치의 단위 예를 들어, OR이거나 또는 교차비(95% 신뢰도 구간) 또는 평균의 단위이다. 바람직한 구체에에서, 효과 예측치는 유전자형 위험도 예를 들어, 동형 접합체에 대한 위험도(homoz 또는 RR), 위험도 이형 접합체(heteroz 또는 RN), 그리고 비 위험 동형 접합체(homoz 또는 NN)일 수 있다(도 4c∼4g). 다른 구체예에서, 효과 예측치는 매개 위험도(carrier risk) 즉, RR 또는 RN vs NN일 수 있다. 또 다른 구체예에서, 상기 효과 예측치는 대립 형질, 대립 형질 위험도 예를 들어, R vs. N을 기초로 할 수 있다. 뿐만 아니라, 2개의 위치(도 4j) 또는 3개의 위치(도 4k)에 있어서 유전자형 효과 예측치(예를 들어, 2 위치 효과 예측치에 관한 9개의 가능한 유전자형 조합에 있어서 RRRR 및 RRNN 등)가 있을 수도 있다. 공공 햅 맵에서 테스트 SNP의 발현 빈도를 도 4h 및 4i에도 나타내었다.In step 114, rules are applied to the stored genomic profile to form the phenotype profile of step 116. For example, the information in FIGS. 4-6 may form the basis of rules or tests for applying the genomic profile of an individual. The rule may include test SNPs and alleles, and the effect estimates of FIG. 4, wherein the unit for the effect predictions (UNIT) is a unit of the effect prediction, for example, OR, or crossover ratio (95% confidence interval). ) Or units of average. In a preferred embodiment, the predictive effect may be genotype risk, eg, risk for homozygotes (homoz or RR), risk heterozygotes (heteroz or RN), and non-risk homozygotes (homoz or NN) (FIG. 4C). To 4 g). In other embodiments, the effect prediction may be a carrier risk, ie, RR or RN vs NN. In another embodiment, the effect estimate is an allele, an allele risk, eg, R vs. Can be based on N. In addition, there may be genotyping effect estimates (eg, RRRR and RRNN in nine possible genotype combinations for two positional effect predictions) at two positions (FIG. 4J) or three positions (FIG. 4K). . The frequency of expression of test SNPs in the public hap map is also shown in FIGS. 4H and 4I.

다른 구체예에서, 도 21∼23 및/또는 25로부터 얻은 정보는 개체의 게놈 프로필에 적용되는 정보를 생성하는데 사용될 수 있다. 예를 들어, 상기 정보는 개체에 있어서 GCI 스코어 또는 GCI 플러스 스코어를 생성시키는데 사용될 수 있다(예를 들어, 도 19). 상기 스코어는 개체의 표현형 프로필에 있어서 하나 이상의 병태에 대한 유전적 위험도 예를 들어, 예측 평생 위험도(lifetime risk)에 관한 정보를 생성하는데 사용될 수도 있다(예를 들어, 도 15). 이러한 방법으로 말미암아, 도 22 또는 도 25에 나열되어 있는 바와 같은 한 가지 이상의 표현형 또는 병태에 대한 평생 예측 위험도 또는 상대적 위험도를 계산할 수 있는 것이다. 하나의 병태에 대한 위험도는 하나 이상의 SNP을 기초로 하여 알 수 있다. 예를 들어, 표현형이나 병태에 대한 예측 위험도는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 또는 12개 이상의 SNP를 기초로 할 수 있으며, 여기서, 위험도를 예측하기 위한 SNP는 공개된 SNP, 테스트 SNP 또는 이들 둘 다일 수 있다(예를 들어, 도 25 참고).In other embodiments, the information obtained from FIGS. 21-23 and / or 25 can be used to generate information that applies to the genomic profile of an individual. For example, the information can be used to generate a GCI score or a GCI plus score in an individual (eg, FIG. 19). The score may also be used to generate genetic risk for one or more conditions in an individual's phenotype profile, eg, information regarding predicted lifetime risk (eg, FIG. 15). In this way, one can calculate lifetime predicted risk or relative risk for one or more phenotypes or conditions as listed in FIG. 22 or 25. Risk for one condition can be known based on one or more SNPs. For example, the predicted risk for a phenotype or condition can be based on 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, or 12 or more SNPs, where SNPs can be published SNPs, test SNPs, or both (see, eg, FIG. 25).

어느 한 병태에 대한 예측 위험도는 도 22 또는 도 25에 나열된 SNP을 기초로 할 수 있다. 몇몇 구체예에서, 어느 한 병태에 대한 위험도는 하나 이상의 SNP를 기초로 할 수 있다. 예를 들어, 알츠하이머병(AD), 결장직장암(CRC), 골관절염(OA) 또는 박리성 녹내장(XFG)에 대한 개체 위험도 평가는 1 SNP를 기초로 할 수 있다[예를 들어, AD에 있어서는 rs4420638, CRC에 있어서는 rs6983267, OA에 있어서는 rs4911178, 그리고 XFG에 있어서는 rs2165241]. 다른 병태 예를 들어, 비만(BMIOB), 그레이브스병(GD) 또는 혈색소 침착증(HEM)에 있어서, 개체의 예측 위험도는 1 또는 2 이상의 SNP를 기초로 할 수 있다[예를 들어, BMIOB에 있어서는 rs9939609 및/또는 rs9291171; GD에 있어서는 DRB1*0301 DQA1*O5O1 및/또는 rs3087243; HEM에 있어서는 rs1800562 및/또는 rs129128]. 병태 예를 들어, 심근 경색증(MI), 다발성 경화증(MS) 또는 건선(PS)에 있어서, 1, 2 또는 3개의 SNP는 어느 특정 병태에 대한 개체의 위험도를 평가하는데 사용될 수 있다[예를 들어, MI에 있어서는 rs1866389, rs1333049 및/또는 rs6922269; MS에 있어서는 rs6897932, rs12722489 및/또는 DRB1*1501; PS에 있어서는 rs6859018, rs11209026 및/또는 HLAC*0602]. 하지 불안 증후군(RLS) 또는 셀리악병(CelD)의 개체 위험도를 예측하는데 있어서는, 1, 2, 3 또는 4개의 SNP(예를 들어, RLS에 있어서는 rs6904723, rs2300478, rs1O26732 및/또는 rs9296249; CelD에 있어서는 rs6840978, rs11571315, rs2187668 및/또는 DQA1*0301 DQB1*0302)가 사용될 수 있다. 전립선 암(PC) 또는 루프스병(SLE)에 있어서, PC 또는 SLE에 대한 개체의 위험도를 예측하기 위하여 1, 2, 3, 4 또는 5개의 SNP(예를 들어, PC에 있어서는 rs4242384, rs6983267, rs16901979, rs17765344 및/또는 rs4430796; SLE에 있어서는 rs12531711, rs1O954213, rs2004640, DRB1*0301 및/또는 DRB1*1501)가 사용될 수 있다. 어느 한 개체의 황반 변성증(AMD) 또는 류머티즘성 관절염(RA)의 평생 위험도를 예측하는데 있어서, 1, 2, 3, 4, 5 또는 6개의 SNP가 사용될 수 있다[예를 들어, AMD에 있어서는 rs10737680, rs10490924, rs541862, rs2230199, rs1O61170 및/또는 rs9332739; RA에 있어서는 rs6679677, rs11203367, rs6457617, DRB*0101, DRB1*0401 및/또는 DRB1*0404]. 유방암(BC)에 대한 어느 한 개체의 평생 위험도를 예측하는데 있어서, 1, 2, 3, 4, 5, 6 또는 7개의 SNP가 사용될 수 있다[예를 들어, rs3803662, rs2981582, rs4700485, rs3817198, rs17468277, rs6721996 및/또는 rs3803662]. 크론병(CD) 또는 제2형 당뇨병(T2D)에 대한 어느 한 개체의 평생 위험도를 예측하는데 있어서, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 11개의 SNP가 사용될 수 있다[예를 들어, CD에 있어서는 rs2066845, rs5743293, rs10883365, rs17234657, rs10210302, rs9858542, rs11805303, rs1000113, rs17221417, rs2542151 및/또는 rs10761659; T2D에 있어서는 rs13266634, rs4506565, rs10012946, rs7756992, rs1O811661, rs12288738, rs8050136, rs1111875, rs4402960, rs5215, 및/또는 rs1801282]. 몇몇 구체예에 있어서, 위험도를 측정하기 위한 기초로서 사용된 SNP는 전술한 바와 같거나, 또는 도 22 또는 도 25에 나열된 바와 같이 SNP와의 연관 불균형일 수 있다.The predicted risk for either condition can be based on the SNPs listed in FIG. 22 or 25. In some embodiments, the risk for either condition may be based on one or more SNPs. For example, individual risk assessment for Alzheimer's disease (AD), colorectal cancer (CRC), osteoarthritis (OA), or exfoliative glaucoma (XFG) can be based on 1 SNP [eg, rs4420638 for AD. Rs6983267 for CRC, rs4911178 for OA, and rs2165241 for XFG. For other conditions, such as obesity (BMIOB), Graves' disease (GD), or hemochromatosis (HEM), the predicted risk of an individual may be based on one or more SNPs (eg, rs9939609 for BMIOB). And / or rs9291171; For GD DRB1 * 0301 DQA1 * O5O1 and / or rs3087243; Rs1800562 and / or rs129128 for HEM. Conditions For example, in myocardial infarction (MI), multiple sclerosis (MS) or psoriasis (PS), one, two or three SNPs can be used to assess an individual's risk for any particular condition [eg , Rs1866389, rs1333049 and / or rs6922269 for MI; For MS rs6897932, rs12722489 and / or DRB1 * 1501; Rs6859018, rs11209026 and / or HLAC * 0602 for PS. In predicting individual risk of lower extremity anxiety syndrome (RLS) or celiac disease (CelD), one, two, three or four SNPs (e.g., rs6904723, rs2300478, rs1O26732 and / or rs9296249 in CelD; rs6840978, rs11571315, rs2187668 and / or DQA1 * 0301 DQB1 * 0302) may be used. In prostate cancer (PC) or lupus disease (SLE), one, two, three, four, or five SNPs (e.g., rs4242384, rs6983267, rs16901979 for PC) in order to predict an individual's risk for PC or SLE. rs12576511, rs10954213, rs2004640, DRB1 * 0301 and / or DRB1 * 1501 may be used for the SLE. In predicting the lifetime risk of macular degeneration (AMD) or rheumatoid arthritis (RA) in any individual, one, two, three, four, five, or six SNPs may be used (eg, rs10737680 for AMD). , rs10490924, rs541862, rs2230199, rs1061170 and / or rs9332739; Rs6679677, rs11203367, rs6457617, DRB * 0101, DRB1 * 0401 and / or DRB1 * 0404 for RA]. In predicting the lifetime risk of any individual for breast cancer (BC), 1, 2, 3, 4, 5, 6 or 7 SNPs can be used [eg, rs3803662, rs2981582, rs4700485, rs3817198, rs17468277 , rs6721996 and / or rs3803662]. In predicting the lifetime risk of an individual for Crohn's disease (CD) or type 2 diabetes (T2D), 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or 11 SNPs [For example, rs2066845, rs5743293, rs10883365, rs17234657, rs10210302, rs9858542, rs11805303, rs1000113, rs17221417, rs2542151 and / or rs10761659 for CD; Rs13266634, rs4506565, rs10012946, rs7756992, rs1O811661, rs12288738, rs8050136, rs1111875, rs4402960, rs5215, and / or rs1801282 for T2D. In some embodiments, the SNPs used as the basis for measuring risk may be as described above, or an association imbalance with the SNPs as listed in FIGS. 22 or 25.

개체의 표현형 프로필은 다수의 표현형을 포함할 수 있다. 특히, 본 발명의 방법에 의해서 환자의 질병 또는 기타 병태 예를 들어, 약물 반응성 예를 들어, 대사, 효능 및/또는 안전성에 대한 위험도를 평가하면, 증상성, 전증성 또는 무증상성 개체 예를 들어, 한 가지 이상의 질병/병태에 대한 소인을 가지는 대립 형질을 보유하고 있는 개체인지 여부에 따라서, 다발성이며 관련되지 않은 질병 및 병태에 대한 감수성을 예후 분석 또는 진단 분석할 수 있다. 그러므로, 이와 같은 방법들은 특정 질병 또는 병태를 테스트하기 위해서는 어떠한 예상도 하지 않고서 질병이나 질환에 대한 개체의 감수성을 일반적으로 평가한다. 예를 들어, 본 발명의 방법은 개체의 게놈 프로필을 기초로 하여, 표 1, 도 4, 5 또는 6에 나열된 몇몇 병태들 중 임의의 병태에 대한 개체의 감수성을 평가할 수 있게 한다. 뿐만 아니라, 본 발명의 방법은 개체의 예측 평생 위험도 또는 하나 이상의 표현형 또는 병태에 대한 상대적인 위험도(예를 들어, 도 22 또는 25 참고)를 평가할 수 있게 한다.The phenotype profile of an individual may include multiple phenotypes. In particular, when assessing the risk of a disease or other condition of a patient, eg, drug reactivity, e.g., metabolism, efficacy and / or safety, by a method of the invention, a symptomatic, symptomatic or asymptomatic Depending on whether the individual possesses an allele having a predisposition to one or more diseases / conditions, prognostic or diagnostic analysis of multiple and unrelated diseases and conditions may be performed. Therefore, these methods generally assess an individual's susceptibility to a disease or condition without making any predictions to test for that particular disease or condition. For example, the methods of the present invention allow to assess an individual's susceptibility to any of several of the conditions listed in Table 1, FIG. 4, 5 or 6, based on the genomic profile of the individual. In addition, the methods of the present invention allow to assess a subject's predicted lifetime risk or relative risk to one or more phenotypes or conditions (see, eg, FIG. 22 or 25).

평가를 통하여, 바람직하게는 이와 같은 병태들 중 2개 이상, 더욱 바람직하게는 이와 같은 병태들 중 3, 4, 5, 10, 20, 50, 100개 이상에 대한 정보가 제공된다. 바람직한 구체예에서, 표현형 프로필은 개체의 게놈 프로필에 대한 20개 이상의 룰을 적용함으로써 생성된다. 다른 구체예에서, 50개 이상의 룰을 개체의 게놈 프로필에 적용한다. 표현형에 대한 하나의 룰을 단일 유전자에 의한 표현형에 적용시킬 수 있다. 하나 이상의 룰도 하나의 표현형 예를 들어, 다중 유전자에 의한 표현형 또는 단일 유전자에 의한 표현형에 적용시킬 수 있으며, 이 경우, 하나의 유전자 내 다중 유전자 변이체는 표현형을 나타낼 가능성에 영향을 준다.Through the evaluation, information is preferably provided for at least two of these conditions, more preferably at least three, four, five, ten, twenty, fifty, one hundred or more of these conditions. In a preferred embodiment, the phenotype profile is generated by applying at least 20 rules on the genomic profile of the individual. In other embodiments, at least 50 rules are applied to an individual's genomic profile. One rule for a phenotype can be applied to a phenotype with a single gene. One or more rules may also be applied to one phenotype, for example, a phenotype by multiple genes or a phenotype by a single gene, in which case multiple gene variants in one gene affect the likelihood of exhibiting the phenotype.

개별 환자의 게놈 프로필을 처음에 스크리닝한 후, 부가의 뉴클레오티드 변이체가 공지될 때, 이와 같은 부가의 뉴클레오티드 변이체 예를 들어, SNP와의 비교를 통하여, 어느 한 개체의 유전자형의 상관관계가 갱신된다(또는 갱신될 수 있다). 예를 들어, 단계 110은 정기적으로(예를 들어, 매일, 매주 또는 매달), 유전학 분야의 당 업자(즉, 새로운 유전자형의 상관관계에 대한 과학 논문을 통독한 사람) 중 1인 이상의 당업자에 의해 실시될 수 있다. 이후, 새로운 유전자형의 상관관계는 당 업계의 숙련자 중 1인 이상으로 이루어진 위원회에 의해 추가로 입증될 수 있다. 이후, 단계 112는 또한 새로 입증된 상관관계를 기초로 한 새로운 룰로써 주기적으로 갱신될 수도 있다.After initially screening the genomic profile of an individual patient, when additional nucleotide variants are known, the correlation of the genotype of either individual is updated (or compared to such additional nucleotide variants, eg, SNPs). Can be updated). For example, step 110 may be performed on a regular basis (e.g. daily, weekly or monthly) by one or more persons skilled in the arts of genetics (i.e., the person who read the scientific paper on the correlation of new genotypes). Can be implemented. The new genotype correlations can then be further demonstrated by a committee of one or more of those skilled in the art. Thereafter, step 112 may also be updated periodically with new rules based on newly proven correlations.

새로운 룰은 현존하는 룰을 제외한 유전자형 또는 표현형을 포함할 수 있다. 예를 들어, 임의의 표현형과 상관되지 않은 유전자형은 새로운 표현형 또는 현존하는 표현형과 상관되어 있는 것으로 파악된다. 새로운 룰은 또한 원래에는 유전자형과 상관되지 않았던 표현형 사이의 상관관계에 대한 것일 수도 있다. 새로운 룰은 또한 현존하는 룰을 포함하는 유전자형 및 표현형에 대해 결정될 수도 있다. 예를 들어, 유전자형 A와 표현형 A 사이의 상관관계를 기초로 한 룰이 존재한다. 새로 연구를 수행한 결과, 유전자형 B는 표현형 A와 상관되어 있으며, 또한 이와 같은 상관관계를 기초로 하여 새로운 룰이 형성된다는 사실을 알 수 있다. 기타 예로서는, 표현형 B가 있는데, 이 표현형 B는 유전자형 A와 연관되어 있는 것으로 밝혀졌으므로, 이로써 새로운 룰이 형성될 수 있는 것이다.The new rule may include genotypes or phenotypes except for existing rules. For example, genotypes not correlated with any phenotype are understood to be correlated with new or existing phenotypes. The new rule may also be for correlations between phenotypes that were not originally correlated with genotypes. New rules may also be determined for genotypes and phenotypes that include existing rules. For example, there are rules based on the correlation between genotype A and phenotype A. New research shows that genotype B correlates with phenotype A and that new rules are formed based on this correlation. Another example is phenotype B, which has been found to be associated with genotype A, so that new rules can be formed.

룰은 또한 공개된 과학 문헌에서 처음 확인할 수 없는, 공지의 상관관계를 기초로 한 사실들을 통하여 형성될 수 있다. 예를 들어, 유전자형 C는 표현형 C와 상관되어 있다고 볼 수 있다. 기타 문헌에는, 유전자형 D가 표현형 D와 상관되어 있다고 보고되어 있다. 표현형 C와 D는 관련된 증상들인데, 예를 들어, 표현형 C는 호흡 부족을, 그리고 표현형 D는 작은 폐활량을 발현한다. 유전자형 C와 표현형 D, 또는 표현형 C를 동반하는 유전자형 D 사이의 상관관계는, 유전자형 C 및 D, 그리고 표현형 C 및 D를 가지는 개체의 현재 저장되어 있는 게놈 프로필을 이용하는 통계학적 방법이나, 추가의 연구를 통해 규명 및 입증될 수 있다. 이후, 새로운 룰은 새로이 규명되어 입증된 상관관계를 기초로 하여 형성될 수 있다. 다른 구체예에서, 특정 표현형 또는 관련된 표현형을 나타내는 다수의 개체에 관하여 저장된 게놈 프로필을 연구하면, 개체에 공통된 유전자형을 측정할 수 있으며, 상관관계도 확인할 수 있다. 새로운 룰은 이와 같은 상관관계를 기초로 하여 형성될 수 있다.Rules can also be formed through facts based on known correlations that are not first identified in published scientific literature. For example, genotype C can be considered to be correlated with phenotype C. Other documents report that genotype D correlates with phenotype D. Phenotypes C and D are related symptoms, for example, phenotype C expresses shortness of breath and phenotype D expresses small spirometry. The correlation between genotype C and phenotype D, or genotype D with phenotype C, is a statistical method using genotypes C and D and the currently stored genomic profiles of individuals with phenotypes C and D, but for further study. Can be identified and verified. New rules can then be formed based on newly identified and proven correlations. In other embodiments, studying stored genomic profiles with respect to a number of individuals exhibiting a particular phenotype or related phenotype can determine genotypes common to the individual and correlate them. New rules can be formed based on this correlation.

현존하는 룰이 수정되어 다른 룰이 형성될 수도 있다. 예를 들어, 유전자형과 표현형 사이의 상관관계는 개체의 공지된 특성들 예를 들어, 민족성, 가계, 지형, 성별, 연령, 가족력 또는 기타 개체에 관하여 알려진 임의의 표현형에 의해 부분적으로 측정될 수 있다. 이와 같이 공지된 개체의 특성들을 기초로 한 룰이 형성되어 현존하는 룰에 통합되면, 수정된 룰이 형성되는 것이다. 적용될 수정 룰을 선택하는 것은 개체의 구체적인 개별 인자에 따라서 달라질 것이다. 예를 들어, 룰은 개체가 유전자형 E를 가질 때, 표현형 E가 35%인 개체의 확률을 기초로 할 수 있다. 그러나, 만일 개체가 특정의 민족성을 가진다면, 그 확률은 5%이다. 이와 같은 결과를 기초로 하여 새로운 룰이 형성되고, 이 룰은 특정의 민족성을 가지는 개체에 적용될 수 있는 것이다. 대안적으로, 측정치 35%인 현존 룰이 적용될 수 있으며, 이후, 이와 같은 표현형에 대한 민족성을 기초로 하는 다른 룰이 적용된다. 공지된 개체의 특성을 기초로 하는 룰은 과학 문헌으로부터 측정될 수 있거나, 또는 저장된 게놈 프로필을 연구한 결과를 기초로 하여 측정될 수 있다. 새로운 룰이 개발되거나 또는 정기적으로(예를 들어, 1년에 1회 이상) 적용될 수 있음에 따라서, 단계 114에서 새로운 룰이 게놈 프로필에 부가 및 적용될 수 있다. Existing rules may be modified to form other rules. For example, the correlation between genotype and phenotype can be measured in part by known characteristics of the individual, such as ethnicity, pedigree, topography, sex, age, family history, or any phenotype known about the individual. . When a rule based on the characteristics of the known entity is formed and incorporated into an existing rule, a modified rule is formed. Selecting the correction rule to be applied will depend on the specific individual parameters of the entity. For example, the rule may be based on the probability of an individual having a phenotype E of 35% when the individual has genotype E. However, if the individual has a certain ethnicity, the probability is 5%. Based on this result, a new rule is formed, and this rule can be applied to an entity having a specific ethnicity. Alternatively, existing rules of 35% measure may be applied, followed by other rules based on ethnicity for such phenotypes. Rules based on the characteristics of known individuals can be measured from scientific literature or can be determined based on the results of studying stored genomic profiles. As new rules may be developed or applied regularly (eg, more than once a year), new rules may be added and applied to the genomic profile in step 114.

기술의 발달로 인하여 SNP 게놈 프로필을 보다 정밀하게 분석할 수 있게 됨에 따라서, 개체에 질병이 발생할 위험도에 관한 정보 또한 확장될 수도 있다. 전술한 바와 같이, 초기 SNP 게놈 프로필은 500,000개의 SNP를 스캔하는 마이크로어레이 기술을 이용하여 용이하게 형성될 수 있다. 반수체형 블록의 특성이 주어지면, 상기 숫자는 개체의 게놈 내 모든 SNP의 각 프로필에도 해당한다. 그럼에도 불구하고, 인간 게놈 내에는 일반적으로 약 1000만 개의 SNP가 형성되는 것으로 예측된다[국제 햅 맵 프로젝트; www.hapmap.org]. 기술상의 진보, 예를 들어, 1,000,000개, 1,500,000개, 2,000,000개, 3,000,000개 또는 그보다 많은 SNP를 포함하는 마이크로어레이, 또는 전체 게놈 서열 결정법이 발달함에 따라서, 실용적이면서 비용 효율적으로 SNP를 보다 정밀한 수준으로 분석할 수 있게 되었는데, 더욱 상세히 말하자면 SNP 게놈 프로필이 생성될 수 있게 되었다. 이와 유사하게, SNP-질병 상관관계에 관한 마스터 데이터베이스(master database)를, 더욱 정밀한 SNP 게놈 프로필 및 갱신에 관한 비용-효율적인 분석법으로 분석함으로써 컴퓨터 분석법을 더욱 발전시킬 수 있을 것이다.As technology advances, the SNP genomic profile can be analyzed more precisely, so information about the risk of developing disease in an individual can also be expanded. As mentioned above, the initial SNP genomic profile can be readily formed using microarray technology to scan 500,000 SNPs. Given the properties of haploid blocks, the numbers correspond to each profile of every SNP in the individual's genome. Nevertheless, about 10 million SNPs are generally expected to form within the human genome [International Hap Map Project; www.hapmap.org]. As technological advances evolve, for example, microarrays containing 1,000,000, 1,500,000, 2,000,000, 3,000,000 or more SNPs, or whole genome sequencing methods, SNPs can be brought to a more precise and practical level at a more practical and cost-effective level. This allows for analysis, and more specifically, SNP genomic profiles. Similarly, computer analysis can be further developed by analyzing the master database for SNP-disease correlation with cost-effective assays for more precise SNP genome profiles and updates.

단계 116에서 표현형 프로필을 생성한 후, 가입자 또는 그의 건강 관리 매니저는 단계 118에서와 같이 온-라인 포털이나 웹사이트를 통해 게놈 프로필 또는 표현형 프로필을 입수할 수 있다. 표현형 프로필을 포함하는 리포트와 표현형 프로필 및 게놈 프로필과 관련된 기타 정보는 또한, 단계 120 및 122에서와 같이 가입자나 가입자의 건강 관리 매니저에게 제공될 수도 있을 것이다. 상기 리포트는 인쇄될 수 있거나, 가입자의 컴퓨터에 저장될 수 있거나, 또는 온-라인으로 확인할 수 있다.After generating the phenotype profile in step 116, the subscriber or his healthcare manager can obtain the genomic profile or phenotype profile through an on-line portal or website as in step 118. Reports including phenotype profiles and other information related to phenotype profiles and genomic profiles may also be provided to the subscriber or their healthcare manager, as in steps 120 and 122. The report can be printed, stored on the subscriber's computer, or confirmed on-line.

예시적인 온-라인 리포트를 도 7에 나타내었다. 가입자는 하나의 표현형이나, 하나 이상의 표현형을 디스플레이하도록 선택될 수 있다. 상기 가입자는 또한 예를 들어, 도 7에 나타낸 바와 같이 "퀵 뷰(Quick View)" 옵션과 같은 상이한 뷰잉 옵션(viewing option)을 가질 수도 있다. 표현형은 의학적 병태일 수 있으며, 즉석 리포트 내 상이한 치료 방법 그리고 증상은 치료 방법에 관한 추가의 정보를 포함하는 기타 웹 페이지와 링크될 수 있다. 예를 들어, '약품'을 클릭함으로써, 그 약의 투여량, 비용, 부작용 그리고 효능에 관한 정보를 포함하는 웹 사이트로 들어가게 될 것이다. 또한, 그 약품을 사용하는 방법을 다른 치료법과도 비교할 수 있다. 상기 웹사이트는 또한 약품 제조사의 웹사이트로 연결되는 링크를 포함할 수도 있다. 기타 링크는, 가입자의 게놈 프로필을 기초로 하는 약품에 관한 예측 반응과 같은 정보를 포함하는 약제 유전체학 프로필을 형성하도록, 가입자를 위한 옵션을 제공할 수 있다. 약품 투여에 대한 대안 예를 들어, 예방책 예를 들어, 체력 보강 및 체중 감량에 관한 링크와, 다이어트 보조 식품 및 다이어트 계획에 관한 링크, 그리고 근처 헬스 클럽, 건강 클리닉, 건강 및 예방 차원의 건강 관리(wellness) 제공자, 데이 스파(day spa) 등에 관한 링크도 제공될 수 있다. 교육용 비디오와 정보 입수용 비디오, 실시 가능한 치료 방법, 실시 가능한 요법, 그리고 일반적인 권장 사항에 관한 요약 정보도 제공될 수 있다.An exemplary on-line report is shown in FIG. The subscriber may be selected to display one phenotype or one or more phenotypes. The subscriber may also have different viewing options, such as, for example, a "Quick View" option as shown in FIG. The phenotype may be a medical condition and the different treatment methods and symptoms in the instant report may be linked to other web pages that include additional information about the treatment method. For example, by clicking on a drug, you will be taken to a website that contains information about the drug's dosage, cost, side effects, and efficacy. You can also compare how you use the drug with other therapies. The website may also include a link to the drug manufacturer's website. The other link may provide an option for the subscriber to form a pharmaceutical genomic profile that includes information such as predictive response to the drug based on the subscriber's genomic profile. Alternatives to drug administration include, for example, precautions such as links to fitness and weight loss, links to dietary supplements and diet plans, and nearby health clubs, health clinics, health and preventive health care ( Links to wellness providers, day spas, and the like may also be provided. Instructional videos and informational videos, actionable treatments, actionable therapies, and summary information on general recommendations may also be provided.

온-라인 리포트도 또한 개체 담당 전문의 또는 유전 상담 예약에 관한 스케쥴 또는 온-라인 유전 상담자 또는 전문의와 접촉할 수 있는 링크를 제공할 수 있으며, 이와 동시에, 가입자가 자신의 표현형 프로필에 대한 보다 많은 정보를 요청할 기회도 제공된다. 온-라인 유전 상담 및 전문의 문진으로의 링크도 온-라인 리포트 상에서 제공될 수 있다.The on-line report may also provide a schedule for scheduling an individual specialist or genetic counseling, or a link to contact an on-line genetic counselor or specialist, while at the same time providing more information about the subscriber's phenotype profile. There is also an opportunity to request information. Links to on-line genetic counseling and specialist questions may also be provided on the on-line report.

리포트는 또한 다른 형식 예를 들어, 하나의 표현형에 대하여 포괄적으로 검초하는 형식으로 검토될 수도 있으며, 이 경우, 각 카테고리에 대하여 보다 자세한 사항이 제공된다. 예를 들어, 가입자가 표현형을 발현할 가능성에 관한 보다 상세한 통계 자료, 전형적인 증상이나 표현형에 대한 보다 많은 정보 예를 들어, 의학적 병태에 대한 예시적인 증상, 또는 일정 범위의 비-의학적 신체 조건 예를 들어, 키, 또는 유전자와 유전자 변이체에 관한 더욱 많은 정보 예를 들어, 집단 내 발생률(population incidence) 예를 들어, 전 세계, 또는 다른 국가들, 또는 다른 연령대 또는 성별의 집단 내 발생률이 있을 수 있다. 예를 들어, 도 15에는 다수의 병태에 대한 예측 평생 위험도에 관하여 요약되어 있다. 개체는 특정 병태 예를 들어, 전립선암(도 16) 또는 크론병(도 17)에 대하여 보다 많은 정보를 살펴볼 수 있다.Reports may also be reviewed in other formats, such as in a comprehensive way of looking at one phenotype, in which case more details are provided for each category. For example, more detailed statistical data on the likelihood of a subscriber expressing a phenotype, more information about a typical symptom or phenotype, for example illustrative symptoms for a medical condition, or a range of non-medical physical conditions, for example. For example, there may be height, or more information about genes and gene variants, for example, population incidence, for example, in the world, or in other countries, or in a population of different ages or genders. . For example, FIG. 15 summarizes the predicted lifetime risk for multiple conditions. The individual may look for more information about a particular condition, such as prostate cancer (FIG. 16) or Crohn's disease (FIG. 17).

다른 구체예에서, 리포트는 "흥미로운" 표현형 예를 들어, 유명 인사 예를 들어, 알버트 아인슈타인의 게놈 프로필과 어느 한 개체의 게놈 프로필과의 유사성으로 이루어질 수 있다. 상기 리포트는 어느 한 개체의 게놈 프로필과 아인슈타인의 게놈 프로필 사이의 유사성%를 나타낼 수 있으며, 또한 아인슈타인의 예상 IQ와 상기 개체의 예상 IQ를 추가로 나타낼 수도 있다. 추가 정보로서는 전체 집단의 게놈 프로필과 이 구성원들의 IQ를, 어느 한 개체와 아인슈타인의 게놈 프로필과 IQ와 어떻게 비교하는지에 관한 것을 포함할 수 있다. In other embodiments, the report may consist of a similarity of the “interesting” phenotype, eg, the genomic profile of a celebrity, eg, Albert Einstein, with the genomic profile of an individual. The report may indicate the percent similarity between the genomic profile of an individual and the genomic profile of Einstein, and may further indicate the expected IQ of Einstein and the expected IQ of the individual. Additional information may include how the genome profile of the entire population and the IQ of these members are compared with the genome profile and IQ of either individual and Einstein.

다른 구체예에서, 리포트는 가입자의 게놈 프로필과 상관되어 있는 모든 표현형을 나타낼 수 있다. 다른 구체예에서, 상기 리포트는 개체의 게놈 프로필과 양의 상관관계에 있는 표현형만 나타낼 수 있다. 다른 형식에 있어서, 개체는 표현형의 임의의 하위 군 예를 들어, 의학적 표현형, 또는 소송을 제기할 수 있는 의학적 표현형을 나타내도록 선택할 수 있다. 예를 들어, 소송을 제기할 수 있는 표현형과 이의 상관 유전자형으로서는, 크론병(IL23R 및 CARD15와 상관됨), 제1형 당뇨병(HLA-DR/DQ와 상관됨), 루프스병(HLA-DRB1과 상관됨), 건선(HLA-C와 상관됨), 다발성 경화증(HLA-DQA1과 상관됨), 그레이브스병(HLA-DRB1과 상관됨), 류머티즘성 관절염(HLA-DRB1과 상관됨), 제2형 당뇨병(TCF7L2와 상관됨), 유방암(BRCA2와 상관됨), 결장암(APC와 상관됨), 일시적 기억력(KIBRA와 상관됨), 그리고 골다공증(COL1A1과 상관됨)을 포함할 수 있다. 개체는 또한 리포트에서 표현형에 관한 하위 카테고리 예를 들어, 의학적 병태에 대한 염증 질환, 또는 비-의학적 병태에 대한 신체적 형질만을 나타내도록 선택될 수도 있다. 몇몇 구체예에서, 개체는 모든 병태를 나타내도록 선택할 수 있으며, 예측 위험도는 이와 같은 병태들을 부각시키거나(예를 들어, 도 15a 및 15d), 위험도가 증가한 병태만을 부각시키거나(도 15b), 또는 위험도가 감소한 병태만을 부각시킴으로써(도 15c), 어느 한 개체에 대해 계산할 수 있다.In other embodiments, the report may represent all phenotypes correlated with the subscriber's genomic profile. In another embodiment, the report can only show phenotypes that are positively correlated with the genomic profile of the individual. In other forms, the individual may choose to represent any subgroup of phenotypes, for example, medical phenotypes, or medical phenotypes that may be brought to litigation. For example, the phenotypes that can be filed and their correlation genotypes include Crohn's disease (correlated with IL23R and CARD15), type 1 diabetes (correlated with HLA-DR / DQ), Lupus disease (with HLA-DRB1). Correlated), psoriasis (correlated with HLA-C), multiple sclerosis (correlated with HLA-DQA1), Graves' disease (correlated with HLA-DRB1), rheumatoid arthritis (correlated with HLA-DRB1), second Type diabetes mellitus (correlated with TCF7L2), breast cancer (correlated with BRCA2), colon cancer (correlated with APC), transient memory (correlated with KIBRA), and osteoporosis (correlated with COL1A1). The individual may also be selected to show only subcategories of phenotypes in the report, such as inflammatory diseases for medical conditions, or physical traits for non-medical conditions. In some embodiments, the individual may choose to represent all conditions, and the predicted risk may highlight these conditions (eg, FIGS. 15A and 15D), highlight only those with increased risk (FIG. 15B), Or by highlighting only the risk-reduced condition (FIG. 15C), it can be calculated for either individual.

개체에 의해 제출되어 그 개체에 다시 보내어진 정보는 보안 및 기밀 사항으로서, 그러한 정보를 입수하는 것은 개체에 의해 제어될 수 있다. 복합적 게놈 프로필로부터 유래된 정보는 인가된 단속 기관, 이해하기 쉽고, 의학적으로 관련되어 있으며/있거나 강력한 영향력에 관한 데이터로서 개체에 공급될 수도 있다. 정보는 또한 일반적인 흥미를 끌 수도 있으며, 의학적으로 관련이 없을 수도 있다. 정보는 몇몇 수단 예를 들어, 포털 인터페이스 및/또는 메일에 의해서 개체에 안전하게 전달될 수 있다. 더욱 바람직하게, 정보는 포털 인터페이스에 의해 개체에 안전하게(그 개체가 선택한 방식으로) 제공되는데, 이 경우, 상기 개체는 안전하고 기밀의 입수 방식을 택하게 된다. 이와 같은 인터페이스는 온-라인, 인터넷 웹사이트 접속 방식으로 제공되는 것이 바람직하거나, 또는 대안적으로는, 전화나 개인적이고, 안전하며, 용이하게 사용할 수 있는 기타 수단을 통해 제공되는 것이 바람직하다. 게놈 프로필, 표현형 프로필, 그리고 리포트는 네트워크를 통한 데이터 전송에 의해 개체가나 이 개체의 건강 관리 매니저에게 제공된다.Information submitted by an entity and sent back to the entity is security and confidential, and obtaining such information can be controlled by the entity. Information derived from complex genomic profiles may be supplied to an individual as data on authorized regulatory agencies, easy to understand, medically relevant and / or powerful influences. Information may also be of general interest and may not be medically relevant. Information can be securely delivered to the entity by some means, for example, by a portal interface and / or by mail. More preferably, the information is provided securely (in the manner chosen by the entity) to the entity by the portal interface, in which case the entity takes a secure and confidential way of obtaining it. Such an interface is preferably provided on-line, via an Internet website, or alternatively, via a telephone or other means that are personal, secure and readily available. Genomic profiles, phenotype profiles, and reports are provided to individuals or their health care managers by data transfer over the network.

그러므로, 도 18은 표현형 프로필과 리포트가 작성될 수 있는 대표적 논리 장치를 나타내는 블록 도표이다. 도 18은 게놈 프로필을 받아서 저장하고, 유전자형의 상관관계를 분석하며, 유전자형의 상관관계를 분석한 결과를 기초로 하는 룰을 생성하고, 이 룰을 게놈 프로필에 적용시켜, 표현형 프로필과 리포트를 작성하는, 컴퓨터 시스템(또는 디지털 장치)(800)을 나타낸다. 상기 컴퓨터 시스템(800)은 매체(811) 및/또는 네트워크 포트(805)로부터 지시를 읽을 수 있는 논리 장치로서 이해할 수 있는데, 이는 매체(812)가 고정되어 있는 서버(809)에 임의로 접속될 수 있다. 도 8에 나타낸 시스템은 CPU(801), 디스크 드라이브(803), 임의의 입력 장치 예를 들어, 키보드(815) 및/또는 마우스(816) 그리고 임의의 모니터(807)를 포함한다. 데이터 커뮤니케이션은 지정된 커뮤니케이션 매체를 통해, 로컬 기억 장소 또는 원거리 기억 장소에 있는 서버(809)에 도달할 수 있다. 상기 커뮤니케이션 매체는 데이터를 전송하고/전송하거나 수신하는 임의의 수단을 포함할 수 있다. 예를 들어, 상기 커뮤니케이션 매체는 네트워크 접속, 무선 접속 또는 인터넷 접속일 수 있다. 이러한 접속은 월드 와이드 웹(World Wide Web)을 통한 커뮤니케이션을 제공할 수 있다. 본 발명과 관련된 데이터는 파티(party)(822)에 의해 수신 및/또는 검토하기 위한 네트워크나 접속 수단을 통해 전송될 수 있음을 알 수 있다. 수신 파티(822)는 개체, 가입자, 건강 관리 제공자 또는 건강 관리 매니저일 수 있으나, 이에 한정되는 것은 아니다. 하나의 구체예에서, 컴퓨터-가독성 매체는 생물학적 시료나 유전자형의 상관관계의 분석 결과를 전송하는데 적당한 매체를 포함한다. 상기 매체는 대상 개체의 표현형 프로필에 관한 결과를 포함할 수 있는데, 여기서, 이러한 결과는 본원에 개시된 방법을 이용하여 얻어진다.Therefore, FIG. 18 is a block diagram illustrating representative logical devices from which phenotype profiles and reports can be created. Fig. 18 receives and stores genome profiles, analyzes genotype correlations, generates rules based on the results of genotype correlations, and applies these rules to genome profiles to generate phenotype profiles and reports. A computer system (or digital device) 800 is shown. The computer system 800 can be understood as a logical device capable of reading instructions from the medium 811 and / or network port 805, which can be arbitrarily connected to the server 809 to which the medium 812 is fixed. have. The system shown in FIG. 8 includes a CPU 801, a disk drive 803, any input device such as a keyboard 815 and / or mouse 816, and any monitor 807. Data communication may reach a server 809 in a local or remote storage location, via a designated communication medium. The communication medium may comprise any means for transmitting and / or receiving data. For example, the communication medium may be a network connection, a wireless connection or an internet connection. Such a connection may provide communication via the World Wide Web. It will be appreciated that data related to the present invention may be transmitted via a network or access means for receipt and / or review by a party 822. Receiving party 822 may be, but is not limited to, an entity, subscriber, health care provider, or health care manager. In one embodiment, the computer-readable medium includes a medium suitable for transmitting the results of analysis of a biological sample or genotype correlation. The medium may comprise results relating to the phenotype profile of the subject individual, where such results are obtained using the methods disclosed herein.

개인적인 포털은 바람직하게는 게놈 데이터를 수신 및 평가하기 위해서 개체와의 1차적 인터페이스로서 사용되는 것이 바람직할 것이다. 포털은 개체가 테스트와 그 결과를 통해 수집된 자료로부터 표본 처리 과정을 추적하도록 할 수 있을 것이다. 포털에 접근함으로써, 개체는 자신의 게놈 프로필을 기초로 하여, 공통적인 유전 질환에 대한 상대적인 위험도를 도입해 나간다. 가입자는 포털을 통하여 자신의 게놈 프로필에 어느 룰을 적용할 것인가를 선택할 수 있다.The personal portal will preferably be used as the primary interface with the individual for receiving and evaluating genomic data. The portal will allow the entity to track the sample processing from the data collected through the tests and the results. By accessing the portal, an individual introduces a relative risk for common genetic disease, based on its genomic profile. Subscribers can select which rules to apply to their genomic profile via the portal.

하나의 구체예에서, 하나 이상의 웹 페이지는 표현형 리스트를 나열할 것이며, 각각의 표현형 옆에 표시된 박스는 가입자가 자신의 표현형 프로필 중 어느 것을 포함하도록 할 것인가를 선택할 수 있도록 한 박스이다. 표현형은 가입자가 자신의 표현형 프로필에 포함시키고 싶어하는 표현형에 대해 현명한 선택을 하도록 도와주는, 표현형에 대한 정보에 링크될 수 있다. 웹 페이지는 또한 질병 군에 의해 조직된 표현형 예를 들어, 소송을 제기할 수 있는(actionable) 질병인지 아닌지에 대하여도 알려줄 수 있다. 예를 들어, 가입자는 소송을 제기할 수 있는 표현형 예를 들어, HLA-DQA1 및 셀리악병만을 선택할 수 있다. 가입자는 또한 표현형에 대한 전증 또는 병후 치료 방법을 디스플레이하도록 선택할 수도 있다. 예를 들어, 개체는 전증 치료 방법(셀리악병에 있어서는 글루텐을 포함하지 않는 식사에 의한 전증 치료 방법)으로 소송을 제기할 수 있는 표현형을 선택할 수 있다. 다른 예로서는, 알츠하이머병의 경우, 스타틴 처치, 운동, 비타민 섭취 및 정신적 활동 권장과 같은 전증 치료 방법을 들 수 있다. 다른 예로서는 혈전증을 들 수 있는데, 이 경우의 전증 치료 방법은 경구 피임약을 복용해서는 안 되고, 장기간 앉아있는 것을 피하는 것이다. 승인된 병후 치료 방법을 수행하게 될 표현형의 예로서는 CFH와 상관관계에 있는 습성 AMD가 있는데, 이 경우, 개체는 자신의 병태에 대해 레이저 치료 방법을 적용시킬 수 있다.In one embodiment, one or more web pages will list a phenotype list, and the box next to each phenotype is a box that allows the subscriber to select which of his phenotype profiles to include. The phenotype can be linked to information about the phenotype, which helps the subscriber make a wise choice for the phenotype that he wishes to include in his phenotype profile. The web page may also inform whether a phenotype organized by disease group, for example, an actionable disease or not. For example, the subscriber may select only phenotypes for filing a lawsuit, such as HLA-DQA1 and celiac disease. The subscriber may also choose to display a pre or post treatment method for the phenotype. For example, an individual may select a phenotype that may be sued for a symptomatic treatment method (eg, for celiac disease, a symptomatic treatment with a meal that does not contain gluten). As another example, for Alzheimer's disease, prophylactic treatment methods such as statin treatment, exercise, vitamin intake and mental activity recommendation. Another example is thrombosis, in which the method of treating prognosis is to avoid taking oral contraceptives and avoid sitting for a long time. An example of a phenotype that will perform an approved post-treatment method is wet AMD, which correlates with CFH, in which case an individual may apply laser therapy to his or her condition.

표현형은 또한, 예를 들어, 신경성, 심혈관계, 내분비계, 면역성 질병이나 병태 등의 유형 또는 군에 의해 조직화될 수 있다. 표현형은 또한 의학적 표현형 및 비 의학적 표현형으로 분류될 수도 있다. 표현형은 또한 웹페이지 상에서 신체적 형질, 생리학적 형질, 정신적 형질 또는 감정적 형질에 의해 분류될 수 있다. 상기 웹페이지는 또한, 하나의 박스를 선택함으로써 어떠한 표현형 군을 선택하는 선별법을 추가로 제공할 수 있다. 모든 표현형, 오로지 의학적으로만 관련이 있는 표현형, 오로지 비 의학적으로만 관련이 있는 표현형, 오로지 소송을 제기할 수 있는 표현형, 오로지 소송을 제기할 수 없는 표현형, 상이한 질병 군 또는 "흥미로운" 표현형에 대한 선별법을 그 예로 들 수 있다. "흥미로운" 표현형으로서는 유명 인사나 기타 저명한 개체, 또는 다른 동물이나 그 외의 유기체와의 비교 결과를 포함할 수 있다. 비교에 유용한 게놈 프로필 리스트는 또한, 가입자의 게놈 프로필을 비교하기 위해 가입자에 의하여 선별용 웹페이지 상에 제공될 수도 있다.Phenotypes can also be organized by type or group, for example, neurological, cardiovascular, endocrine system, immune disease or condition. Phenotypes may also be classified into medical phenotypes and non-medical phenotypes. Phenotypes can also be classified by physical traits, physiological traits, mental traits or emotional traits on a webpage. The webpage may further provide a screening method for selecting any phenotype group by selecting one box. For all phenotypes, only medically relevant phenotypes, only non-medically related phenotypes, phenotypes that can only be sued, phenotypes that can not be sued, different disease groups or "interesting" phenotypes An example is the screening method. “Interesting” phenotypes can include results of comparisons with celebrities or other prominent individuals, or with other animals or other organisms. A list of genomic profiles useful for comparison may also be provided by the subscriber on a screening webpage to compare the subscriber's genomic profile.

온-라인 포털은 또한, 가입자가 포털을 검색하는 것, 특이적 표현형을 검색하는 것, 또는 표현형 프로필 또는 리포트에 의해 규명된 특이적 용어나 정보를 검색하는 것을 도와주는 검색 엔진을 제공할 수도 있다. 파트너 서비스와 제품 제공을 가능하게 하는 링크도 포털에 의해 제공될 수 있다. 공통되거나 유사한 표현형을 나타내는 개체들의 친목회, 게시판, 그리고 채팅방으로의 부가 링크도 제공될 수 있다. 온-라인 포털은 또한 가입자의 표현형 프로필 내 표현형에 대한 정보를 더욱 많이 보유하는 기타 사이트로의 링크도 제공할 수 있다. 온-라인 포털은 또한, 가입자가 자신의 표현형 프로필 및 리포트를 친구들, 가족들 또는 건강 관리 매니저와 공유할 수 있도록 하는 서비스를 제공할 수도 있다. 가입자는 자신의 친구들, 가족들 또는 건강 관리 매니저와 공유하고 싶어하는 표현형 프로필 중 어느 표현형을 보여줄 지를 선택할 수 있다. The on-line portal may also provide a search engine that helps subscribers search the portal, search for specific phenotypes, or search for specific terms or information identified by phenotype profiles or reports. . Links to enable partner services and product delivery may also be provided by the portal. Additional links may also be provided to social gatherings, bulletin boards, and chat rooms of entities with common or similar phenotypes. The on-line portal can also provide links to other sites that have more information about phenotypes in the subscriber's phenotype profile. The on-line portal may also provide services that allow subscribers to share their phenotype profiles and reports with friends, family, or health care managers. Subscribers can choose which phenotypes to show in their phenotype profile that they wish to share with their friends, family or health care manager.

표현형 프로필과 리포트는 개체에 대해 전유화된 유전자형의 상관관계를 제공한다. 개체에게 제공된 유전자형의 상관관계는 개인의 건강 관리 방식을 결정하는 것과 생활 습관을 선택하는 데 사용될 수 있다. 만일 어떤 치료 방법이 유용한 질병과 유전적 변이체 사이에서 강력한 상관관계가 관찰되면, 유전자 변이체의 검출 방법은 질병의 치료 및/또는 개체의 모니터링을 시작하는 것을 결정하는데 도움이 될 수 있다. 통계학상 유의적인 상관관계가 존재하되, 그것이 강력한 상관관계으로 간주되지 않는 경우, 개체는 개인 전담 전문의와 함께 그 정보에 대해 검토할 수 있으며, 이로써, 적당하고 유용한 조치를 취할 것을 결정할 수 있다. 특정 유전자형의 상관관계의 관점에서 보았을 때, 개체에게 유용할 수 있었던 잠재적인 조치로서는, 치료 방법의 실시, 치료 방법의 잠재적 필요성 또는 치료 방법의 효과에 대한 모니터링, 식습관, 운동 및 기타 개인적인 습관/행동에 있어서의 생활 방식에 변화를 주는 것을 포함한다. 예를 들어, 소송을 제기할 수 있는 표현형 예를 들어, 셀리악 병에는 글루텐을 포함하지 않는 식생활을 통한 전증 치료 방법을 취할 수 있다. 이와 유사하게, 유전자형의 상관관계 정보는 일어날 수 있는 반응 예를 들어, 특정 약물 처치로 인해 발생할 수 있는 효능 또는 이와 관련된 안전성을 예측하도록 하는 약물 유전학적 방법을 통하여 적용될 수 있으며, 개체들은 특정 약물 또는 이 약물의 섭취 방법을 통한 치료를 받게 될 것이다. Phenotypic profiles and reports provide correlated genotypes for individuals. The genotype correlations provided to an individual can be used to determine an individual's health care practices and to make lifestyle choices. If a method of treatment is observed to have a strong correlation between useful disease and genetic variants, the method of detection of genetic variants may help to determine the treatment of the disease and / or to initiate monitoring of the subject. If a statistically significant correlation exists but is not considered to be a strong correlation, the individual may review the information with a dedicated professional physician, thereby deciding to take appropriate and useful measures. Potential measures that could have been useful to an individual from the point of view of specific genotype correlations include the implementation of a treatment method, monitoring the potential need for a treatment method or the effectiveness of the treatment method, eating habits, exercise and other personal habits / behaviors. It includes changing the way of life in Esau. For example, a phenotype that can bring a lawsuit, for example, celiac disease, can take a proliferative treatment through diet that does not contain gluten. Similarly, genotype correlation information can be applied through pharmacogenetic methods to predict the response that may occur, for example, the efficacy or safety associated with a particular drug treatment, and subjects may be subject to specific drug or You will be treated with this medication.

가입자들은 게놈 프로필 및 표현형 프로필을 자신의 건강 관리 매니저 예를 들어, 전문의 또는 유전 상담자에게 제공하도록 선택할 수 있다. 게놈 프로필 및 표현형 프로필은 건강 관리 매니저가 직접 입수할 수 있거나, 가입자가 복사본을 인쇄하여 건강 관리 매니저에게 제공하거나, 또는 온-라인 포털 예를 들어, 온-라인 리포트에 링크를 걸어서 건강 관리 매니저에게 직접 보낼 수 있다. Subscribers can choose to provide their genomic profile and phenotype profile to their healthcare manager, eg, specialist or genetic counselor. Genomic and phenotype profiles can be obtained directly from a health care manager, a member can print out a copy and provide it to the health care manager, or link the health care manager to an on-line portal, e.g., an on-line report. You can send it directly.

이와 같이 관련된 정보가 전달되면, 환자는 자신의 전문의와 함께 조치를 취할 수 있게 될 것이다. 특히, 의학적 정보에 대한 링크 및 개인의 포털, 그리고 환자의 게놈 정보를 환자 자신의 의료 기록에 연관시키는 능력을 통해, 환자와 그의 전담 전문의가 서로 의논을 할 경우, 그것이 유효할 수 있다. 의학적 정보로서는 예방 및 예방 차원의 건강 관리 정보를 포함할 수 있다. 본 발명에 의해 개별 환자에게 제공된 정보는, 환자가 자신의 건강 관리에 대하여 현명한 선택을 할 수 있도록 만들 것이다. 이러한 방식으로, 환자들은 자신의 개인적인 게놈 프로필(유전 DNA)을 보다 유사하게 만드는 질병을 예방하고/예방하거나 지연시키는 것을 도울 수 있는 선택을 할 수 있을 것이다. 뿐만 아니라, 환자들은 자신의 구체적인 의학적 요구 사항을 개체에 적합하게 맞출 치료 방법을 이용할 수 있을 것이다. 개체들은 또한 자신의 유전자형 데이터를 입수할 수 있는 권리를 가질 것이며, 이와 같은 유전자형 데이터는 병을 개선시키고, 자신의 전문의가 치료 전략을 짜는데 도움을 줄 정보를 제공할 것이다. If such relevant information is communicated, the patient will be able to take action with his or her specialist. In particular, through links to medical information and personal portals, and the ability to relate the patient's genomic information to the patient's own medical record, it may be valid if the patient and his dedicated physician discuss with each other. Medical information may include preventive and preventive health care information. The information provided to an individual patient by the present invention will allow the patient to make a smart choice about his or her health care. In this way, patients will be able to make choices that can help prevent and / or delay disease that makes their personal genomic profile (genetic DNA) more similar. In addition, patients will be able to use therapies to tailor their specific medical needs to their individual. Individuals will also have the right to obtain their own genotype data, which will provide information that will help them improve the disease and help their specialists formulate treatment strategies.

유전자형의 상관관계에 관한 정보는 또한 임신을 고려하고 있는 부부에게 조언을 해 주는 유전 상담 결과, 그리고 모, 부 및/또는 자에 대한 잠재적 유전학상 중요성과 함께 사용될 수도 있다. 유전 상담자는 특이적인 병태 또는 질병에 대한 위험도가 증가한 표현형 프로필을 나타내는 가입자에게 정보를 제공하고 지원을 해 줄 수 있다. 이들은 질환에 대한 정보를 설명해주고, 유전 패턴과 재발 위험도를 분석하며, 또한 가입자에게 적용할 수 있는 옵션을 검토해줄 수 있다. 유전 상담자는 또한, 가입자에게 커뮤니티나 시 지원 서비스에 가입하라고 하는 등의 보조적인 상담을 제공할 수도 있다. 유전 상담은 특이적인 가입 계획과 함께 포함될 수 있다. 몇몇 구체예에서, 유전 상담은 요청한 지 24시간 이내에 스케쥴을 잡아, 예를 들어, 저녁, 토요일, 일요일 및/또는 휴일과 같이 특정 시간에 실행될 수 있다.Information on genotype correlations may also be used along with the results of genetic counseling to advise couples considering pregnancy and potential genetic significance for mothers, parents and / or children. Genetic counselors can provide information and support to subscribers with phenotype profiles with increased risk for specific conditions or diseases. They can explain information about the disease, analyze genetic patterns and risks of recurrence, and review options that may apply to you. Genetic counselors may also provide assistive counseling, such as inviting subscribers to join a community or city support service. Genetic counseling can be included with specific subscription plans. In some embodiments, genetic counseling can be scheduled within 24 hours of request and executed at a specific time, such as, for example, evening, Saturday, Sunday, and / or holiday.

개체의 포털은 또한 초기 스크리닝 결과보다 뛰어난 추가 정보의 전달을 촉진할 것이다. 개체는 자신의 유전자 프로필 예를 들어, 자신의 현재 상태 또는 잠재적인 상태에 대한 새로운 치료 방법이나 예방 전략에 관한 정보와 관련된, 새로운 과학적 발견에 대해 통보받을 것이다. 새로운 발견은 또한 개체 자신의 건강 관리 매니저에게도 전달될 수 있다. 바람직한 구체예에서, 가입자 또는 가입자의 건강 관리 제공자는, 이-메일에 의해, 가입자의 표현형 프로필에 있어서의 새로운 유전자형의 상관관계와 표현형에 관해 새로이 규명된 연구 결과를 알게 된다. 다른 구체예에서, "흥미로운" 표현형에 관한 이-메일은 가입자에게 보내어지고, 예를 들어, 이-메일은 가입자에게, 가입자 자신의 게놈 프로필이 에이브라함 링컨의 게놈 프로필과 77% 동일하다는 사실을 알려줄 수 있으며, 온-라인 포털을 통해 얻을 수 있는 추가의 정보를 알려줄 수 있다. The portal of the entity will also facilitate the delivery of additional information that is superior to the initial screening results. The individual will be informed of new scientific findings related to his genetic profile, e.g., information about new treatment methods or prevention strategies for his current or potential condition. New discoveries can also be communicated to the individual's own healthcare manager. In a preferred embodiment, the subscriber or his or her health care provider, by e-mail, is informed of the newly identified study results regarding the correlation and phenotype of the new genotype in the subscriber's phenotype profile. In another embodiment, an e-mail regarding an "interesting" phenotype is sent to the subscriber, e.g., the e-mail is sent to the subscriber, indicating that the subscriber's own genomic profile is 77% identical to that of Abraham Lincoln. It can also inform you of additional information available through the on-line portal.

본 발명은 또한, 새로운 룰을 형성하고, 룰을 수정하며, 둘을 통합하고, 새로운 룰들을 이용하여 룰 세트를 주기적으로 갱신하며, 게놈 프로필 데이터베이스를 안전하게 유지시키고, 룰을 게놈 프로필에 적용하여 표현형 프로필을 측정하게 하며, 리포트를 작성하게 하는 컴퓨터 코드 시스템을 제공하기도 한다. 컴퓨터는 가입자에게 예를 들어, 새로운 예방법 및 예방 차원의 정보, 병을 개선함에 있어서의 새로운 요법에 관한 정보, 또는 실행 가능한 새로운 치료 방법과 함께, 새로운 상관관계 또는 수정된 상관관계, 새로운 룰 또는 수정된 룰, 그리고 새로운 리포트 또는 수정된 리포트를 통보할 것을 암호화한다. The invention also forms new rules, modifies rules, integrates them, updates the ruleset periodically with new rules, keeps the genomic profile database safe, and applies the rules to genomic profiles. It also provides a computer code system that lets you measure profiles and generate reports. The computer may provide the subscriber with new or modified correlations, new rules or modifications, for example, with new preventive and preventive information, information about new therapies in ameliorating the disease, or new treatment options that are feasible. Encrypt rules to be notified and notification of new or revised reports.

비즈니스 방법Business way

본 발명은 환자의 게놈 프로필을, 확립되어 있으며, 의학적으로 관련이 있는 뉴클레오티드 변이체의 임상학적으로 유래된 데이터베이스에 대해 비교한 결과에 바탕을 둔, 개체의 유전자형의 상관관계를 평가하는 비즈니스 방법을 제공한다. 본 발명은 또한 원래부터 알려져 있지 않았던 새로운 상관관계를 평가하기 위해 저장해 둔, 개체의 게놈 프로필을 활용하여, 그 개체가 생물학적 시료를 추가로 제출하지 않고서도 자신에 대한 표현형 프로필을 갱신하는 비즈니스 방법을 추가로 제공한다. 이와 같은 비즈니스 방법을 도시한 흐름도를 도 9에 나타내었다. The present invention provides a business method for evaluating the genotype correlation of an individual based on a comparison of a patient's genomic profile against a clinically derived database of established and medically relevant nucleotide variants. do. The present invention also provides a business method of utilizing an individual's genomic profile, which has been stored to evaluate new correlations that were not originally known, to update the phenotype profile for the individual without further submission of biological samples. Provide additionally. 9 is a flowchart illustrating such a business method.

개체가 처음에, 공통된 인간의 질병, 병태 및 신체적 상태와 같은 다수의 인자에 대한 유전자형의 상관관계에 대해 개인화된 게놈 프로필을 요청 및 구입할 때, 대상 비즈니스 방법에 대한 유입 스트림(revenue stream)은 부분적으로 단계 101에서 형성된다. 이와 같은 요청 및 구입은 임의의 수의 공급원 예를 들어, 온-라인 웹 포털, 온-라인 건강 서비스, 그리고 개체를 전담하는 전문의, 또는 사사로운 의학적 관심에 관한 유사 공급원을 통해 이루어질 수 있다. 대안적인 구체예에서, 게놈 프로필은 무료로 제공될 수 있으며, 유입 스트림은 후반부 단계 예를 들어, 단계 103에서 형성된다.When an individual initially requests and purchases a personalized genomic profile for genotype correlations for a number of factors, such as common human diseases, conditions, and physical conditions, the revenue stream for the target business method is partially As formed in step 101. Such requests and purchases may be made through any number of sources, such as on-line web portals, on-line health services, and specialists dedicated to individuals, or similar sources of personal medical attention. In alternative embodiments, the genomic profile can be provided free of charge, and the inlet stream is formed at a later stage, eg, step 103.

가입자 즉, 고객은 표현형 프로필 구입을 요청한다. 요청 및 구입에 반응하여, 고객에게는 단계 103에서 유전자 시료 분리에 사용된 생물학적 시료용 수집 키트가 제공된다. 상기 요청이 온-라인 상으로, 또는 전화로 이루어지거나, 고객이 수집 키트를 물리적으로 입수할 수 없는 기타 공급원에 의해 요청이 이루어질 때, 수집 키트는 신속한 배송 예를 들어, 동일 또는 익일 배송되는 택배 서비스에 의해 제공된다. 시료를 담는 용기, 그리고 게놈 프로필 형성을 위해 실험실에 시료를 신속하게 전달하기 위한 포장재가 수집 키트에 포함된다. 상기 키트는 또한, 시료를 시료 처리 설비 또는 실험실에 보내라는 설명서와, 개체의 게놈 프로필과 표현형 프로필을 온-라인 포털을 통해 입수하라는 설명서를 포함할 수도 있다.The subscriber, that is, the customer, requests the purchase of a phenotype profile. In response to the request and purchase, the customer is provided with a collection kit for the biological sample used to isolate the genetic sample in step 103. When the request is made on-line or over the phone, or when the request is made by another source for which the customer cannot physically obtain the collection kit, the collection kit will be shipped promptly, for example, in the same or next day delivery. Provided by the service. The collection kit includes a container to hold the sample and packaging to quickly deliver the sample to the laboratory for genomic profile formation. The kit may also include instructions to send the sample to a sample processing facility or laboratory and instructions to obtain the individual's genomic and phenotypic profiles through an on-line portal.

전술한 바와 같이, 게놈 DNA는 많은 유형의 생물학적 시료들 중 임의의 것으로부터 얻을 수 있다. 바람직하게, 게놈 DNA는 시판중인 수집 키트 예를 들어, DNA 제노텍(DNA Genotek)에서 시판중인 수집 키트를 이용하여 타액에서 분리한다. 타액과 이러한 키트를 사용하면, 고객이 수집 키트로 용기 내에 타액 시료를 편리하게 담은 후, 이 용기를 밀봉하므로, 시료를 그것이 새어나오지 않도록 수집할 수 있다. 뿐만 아니라, 타액 시료는 실온에서 보관 및 선적될 수 있다. As mentioned above, genomic DNA can be obtained from any of many types of biological samples. Preferably, genomic DNA is isolated from saliva using a commercially available collection kit, eg, a collection kit commercially available from DNA Genotek. Using saliva and these kits, a customer can conveniently place a saliva sample in a container with a collection kit and then seal the container so that the sample can be collected so that it does not leak out. In addition, saliva samples can be stored and shipped at room temperature.

생물학적 시료를 수집 용기 또는 표본 용기에 담은 후, 고객은 이 시료를 실험실에 보내어 단계 105가 진행되도록 할 것이다. 통상적으로, 고객은 신속한 배송 예를 들어, 동일 또는 익일 배송되는 택배 서비스에 의해 이 시료를 실험실로 배송/발송하기 위해 수집 키트 내에 제공되는 포장재를 사용할 수 있다. After placing the biological sample in a collection container or sample container, the customer will send the sample to the laboratory for step 105 to proceed. Typically, the customer can use the packaging provided in the collection kit to ship / ship this sample to the lab by express delivery, such as a courier service delivered the same or next day.

시료를 처리하고, 게놈 프로필을 형성하는 실험실은 적당한 정부 기관의 가이드라인과 조건을 준수할 수 있다. 예를 들어, 미국의 경우, 처리 실험실은 하나 이상의 연방 정부 기관 예를 들어, 식품의약국(FDA) 또는 노인 의료 보험 센터 및 국민 의료 보조 센터(CMS), 및/또는 하나 이상의 주 정부 기관에 의해 규제될 수 있다. 미국의 경우, 임상 실험실은 임상 실험실 개선을 위한 수정 조항(Clinical Laboratory Improvement Amendments; CLIA)(1988년) 하에서 신임 또는 인정될 수 있다. Laboratories that process samples and form genomic profiles can comply with the guidelines and conditions of appropriate government agencies. For example, in the United States, treatment laboratories may be established by one or more federal agencies, such as the Food and Drug Administration (FDA) or Geriatric Health Insurance and National Medical Assistance Centers (CMS), and / or one or more state agencies. Can be regulated. In the United States, clinical laboratories may be accredited or recognized under the Clinical Laboratory Improvement Amendments (CLIA) (1988).

단계 107에 있어서, 실험실에서는 시료를 전술한 바와 같이 처리하여, DNA 또는 RNA의 유전자 시료를 분리하게 된다. 이후, 단계 109에서는 분리된 유전자 시료의 분석과 게놈 프로필이 형성된다. 바람직하게, 게놈 SNP 프로필이 형성된다. 전술한 바와 같이, SNP 프로필을 형성하는데 몇 가지 방법이 사용될 수 있다. 바람직하게, 고밀도 어레이 예를 들어, 시판중인 플랫폼(어피메트릭스 또는 일루미나 제품)은 SNP 동정 및 프로필 형성에 사용된다. 예를 들어, SNP 프로필은 전술한 바와 같이, 어피메트릭스 진 칩 검정법을 이용하여 형성될 수 있다. 기술이 진보해 감에 따라서, 이외에도 고 밀도 SNP 프로필을 형성할 수 있는 기술자도 있을 수 있다. 다른 구체예에서, 가입자에 대한 게놈 프로필은 가입자의 게놈 서열일 것이다. In step 107, the laboratory treats the sample as described above to isolate a genetic sample of DNA or RNA. Thereafter, in step 109, an analysis and genomic profile of the separated genetic sample are formed. Preferably, genomic SNP profiles are formed. As mentioned above, several methods can be used to form the SNP profile. Preferably, high density arrays, such as commercially available platforms (Affymetrics or Illumina), are used for SNP identification and profile formation. For example, the SNP profile can be formed using the Affymetrix Gene Chip Assay, as described above. As technology advances, there may be other technicians who can form high density SNP profiles. In other embodiments, the genomic profile for the subscriber will be the genomic sequence of the subscriber.

개체의 게놈 프로필을 형성한 이후, 유전자형 데이터는 암호화되어, 단계 111에 유입되고, 이후 단계 113에서 보안 데이터베이스에 축적되거나 저장되는데, 이 경우, 정보는 장래의 참고 자료로서 저장되는 것이다. 게놈 프로필과 관련된 정보는 기밀 사항일 수 있으며, 이 경우, 게놈 프로필과 이와 같은 독점적인 정보는 개체 및/또는 그 개체를 담당하고 있는 전문의에 의해 얻어지는 것이다. 이외에도, 예를 들어, 가입자는 가족 및 개체의 유전 상담자가 입수할 수 있도록 허용할 수 있다. After forming the genomic profile of the individual, the genotype data is encoded and entered into step 111, which is then accumulated or stored in a security database in step 113, in which case the information is stored as a future reference. The information related to the genomic profile may be confidential, in which case the genomic profile and such proprietary information is obtained by the individual and / or the specialist in charge of the individual. In addition, for example, a subscriber may allow access to family and individual genetic counselors.

데이터베이스 또는 저장 장치는 처리 실험실의 사이트상에 존재할 수 있다. 대안적으로, 데이터베이스는 별도의 기억 장소에 존재할 수 있다. 이와 같은 시나리오에 있어서, 처리 실험실에 의해 형성된 게놈 프로필 데이터는 단계 111에서 데이터베이스를 포함하는 별도의 시설에 도입될 수 있다. The database or storage device may reside on the site of the treatment laboratory. Alternatively, the database may be in a separate storage location. In such a scenario, genomic profile data generated by the processing laboratory may be introduced to a separate facility including a database in step 111.

개체의 게놈 프로필이 형성된 후, 개체의 유전자 변이는, 확립되었으며 의학적으로 관련된 유전자 변이체의 임상학적으로 형성된 데이터베이스와 비교된다(단계 115). 대안적으로, 유전자형의 상관관계는 의학적으로 관련이 있을 수 없지만, 유전자형의 상관관계 예를 들어, 신체적 형질 예를 들어, 눈 색깔, 또는 "흥미로운" 표현형 예를 들어, 유명 인사와의 게놈 프로필 유사성에 관한 데이터베이스에 통합될 수 있다.After the genomic profile of the individual is formed, the genetic variation of the individual is compared with a clinically formed database of established and medically relevant genetic variants (step 115). Alternatively, genotype correlations may not be medically relevant, but genotype correlations, eg, physical traits, eg, eye color, or “interesting” phenotypes, eg, genomic profile similarity with celebrities It can be integrated into a database on.

의학적으로 관련된 SNP는 과학 문헌 및 관련 문헌을 통해 확립될 수 있었다. 비-SNP 유전자 변이체는 또한 표현형과 상관되도록 확립될 수도 있다. 일반적으로, 소정의 질병에 대한 SNP의 상관관계는 질병이 발병하지 않은 사람들로 이루어진 군의 반수체형 패턴과, 질병이 발병한 것으로 알려진 사람들로 이루어진 군의 반수체형 패턴을 비교함으로써 확립된다. 다수의 개체를 분석함으로써, 집단 내 다형성의 발현 빈도를 측정할 수 있으며, 이후, 이와 같은 유전자형의 발현 빈도는 특정의 표현형 예를 들어, 질병이나 병태와 연관될 수 있다. 대안적으로, 표현형은 비-의학적 병태일 수 있다.Medically relevant SNPs could be established through scientific and related literature. Non-SNP gene variants may also be established to correlate with the phenotype. In general, the correlation of SNPs for a given disease is established by comparing the haploid pattern of the group of people who have not developed the disease with the haploid pattern of the group of people known to have developed the disease. By analyzing a large number of individuals, the frequency of expression of polymorphisms in a population can be measured, and the frequency of expression of such genotypes can then be associated with certain phenotypes, such as diseases or conditions. Alternatively, the phenotype can be a non-medical condition.

관련된 SNP와 비-SNP 유전자 변이체는 또한, 입수 가능한 공표 문헌에 의해 측정되기 보다는, 저장되어 있던 개체의 게놈 프로필을 분석함으로써 측정될 수도 있다. 게놈 프로필이 저장되어 있던 개체들은 예전에 측정되었던 표현형을 공개할 수 있다. 개체의 유전자형과 공개된 표현형을 분석한 결과를 표현형을 나타내지 않는 개체의 그것과 비교하여, 이후 다른 게놈 프로필에 적용될 수 있는 상관관계를 측정할 수 있다. 게놈 프로필을 측정한 개체들은 이전에 측정하였던 표현형에 대한 질문지를 채워나갈 수 있다. 질문지는 의학적 및 비-의학적 병태 예를 들어, 이전에 진단되었던 질병, 의학적 병태에 대한 가족력, 생활 방식, 신체적 형질, 정신적 형질, 연령, 사회 생활 및 환경 등에 관한 질문들을 포함할 수 있다. Related SNPs and non-SNP gene variants may also be determined by analyzing the genomic profile of the stored individual, rather than by the available published literature. Individuals whose genomic profiles have been stored can reveal phenotypes that were previously measured. Analyzes of the genotypes and published phenotypes of an individual can be compared to those of an individual that does not represent a phenotype, to determine correlations that can then be applied to other genomic profiles. Individuals measuring genomic profiles can fill in the questionnaire about phenotypes previously measured. The questionnaire may include questions about medical and non-medical conditions, for example, diseases previously diagnosed, family history of the medical condition, lifestyle, physical traits, mental traits, age, social life, and the environment.

하나의 구체예에서, 개체는 질문지를 작성하여 제출할 경우 무료로 게놈 프로필을 측정해 볼 수 있다. 몇몇 구체예에서, 이 질문지는 그 개체에 의해 주기적으로 작성되어, 개체 자신의 표현형 프로필과 이에 따른 리포트를 자유로이 입수할 수 있게 될 것이다. 다른 구체예에서, 질문지를 작성한 개체는 가입 등급을 올리는 권한을 부여받을 수 있어서, 이전 가입 수준보다 더욱 많은 정보를 입수할 수 있거나, 또는 저렴한 비용으로 가입하거나 갱신할 수 있다. In one embodiment, an individual can assess the genomic profile free of charge when completing and submitting a questionnaire. In some embodiments, this questionnaire will be filled out periodically by the individual so that the individual's own phenotype profile and corresponding report will be freely available. In another embodiment, the individual filling out the questionnaire may be authorized to raise the subscription level so that they can get more information than the previous level of subscription, or they can subscribe or renew at a lower cost.

단계 121에서, 의학적으로 관련된 유전자 변이체에 관한 데이터베이스에 축적된 모든 정보는 우선, 단계 119에서, 적합한 정부 당국에 의해 보증이 되는지 여부를 검토 및 감독될 뿐만 아니라, 과학적인 정확성과 중요성에 대한 연구/임상 자문 기관에 의해 승인된다. 예를 들어, 미국의 경우, FDA는 유전자 변이체(통상적으로는 SNP, 전사 수준 또는 돌연 변이) 상관 데이터의 입증에 사용되는 알고리즘을 승인해 주는 것으로 감독할 수 있다. 단계 123에서, 과학 문헌 및 기타 관련된 공급원은 부가의 유전자 변이체-질병 또는 병태의 상관관계에 대해 모니터링되고, 이후 정부 당국의 검토 및 승인과 아울러, 정확성과 중요성을 입증하여, 이와 같이 부가적인 표현형의 상관관계를 단계 125의 마스터 데이터베이스에 첨가한다.In step 121, all the information accumulated in the database on the medically relevant genetic variants is first examined and supervised in step 119 as to whether it is endorsed by a suitable government authority, as well as the study of scientific accuracy and importance. Is approved by a clinical advisory body. For example, in the United States, FDA may oversee the approval of algorithms used to validate genetic variants (typically SNPs, transcriptional levels or mutations) correlation data. In step 123, the scientific literature and other related sources are monitored for the correlation of additional genetic variants-diseases or conditions, which are then validated for accuracy and importance, as well as review and approval by government authorities, to ensure that these additional phenotypes The correlation is added to the master database in step 125.

승인 및 입증된, 의학적으로 관련된 유전자 변이체에 관한 데이터베이스는, 게놈에 널리 퍼져있는 개체의 프로필과 함께 다수의 질병 또는 병태에 대해 유전자 위험도-평가를 수행할 수 있도록 하는 것이 유리할 것이다. 개체의 게놈 프로필이 편집된 후, 개체의 유전자형의 상관관계는, 개체의 뉴클레오티드(유전자) 변이체 또는 마커를, 특정 표현형 예를 들어, 질병, 병태 또는 신체적 상태와 상관된 인간의 뉴클레오티드 변이체에 관한 데이터베이스와 비교함으로써 측정될 수 있다. 개체의 게놈 프로필과 유전자형의 상관관계에 대한 마스터 데이터베이스를 비교함으로써, 상기 개체는 자신이 유전자 위험도 인자에 대해 양성인지 아니면 음성인지 여부와, 그 정도는 어느 정도인지 여부를 알 수 있다. 개체는, 과학적으로 입증된 광범위한 병태(예를 들어, 알츠하이머병, 심혈관계 질환, 혈병 형성)에 대한 상대적인 위험도 및/또는 소인 데이터를 입수하게 될 것이다. 예를 들어, 표 1의 유전자형의 상관관계가 포함될 수 있다. 뿐만 아니라, 데이터베이스 내 SNP 질병의 상관관계로서는, 도 4에 나타낸 상관관계를 포함할 수 있으나, 이에 한정되는 것은 아니다. 도 5 및 6에 나타낸 기타 상관관계도 포함될 수 있다. 그러므로, 본 발명의 비즈니스 방법은 다수의 질병과 병태들에 대한 위험도를 분석한 결과를 제공하며, 이 경우, 다수의 질병과 병태가 포함할 수 있는 것이 무엇인지에 대하여 어떠한 예상 견해도 필요하지 않다.It would be advantageous to have a database of approved and validated medically relevant genetic variants that can perform genetic risk-assessment for a number of diseases or conditions, along with profiles of individuals that are prevalent in the genome. After an individual's genomic profile has been edited, the individual's genotype correlations are based on a database of human nucleotide variants that correlate the individual's nucleotide (gene) variants or markers with a particular phenotype, such as a disease, condition or physical condition. It can be measured by comparing with. By comparing the master database of the genome profile and the genotype correlation of the individual, the individual can know whether or not it is positive or negative for the gene risk factor and to what extent. The individual will receive relative risk and / or predisposition data for a wide range of scientifically proven conditions (eg, Alzheimer's disease, cardiovascular disease, blood clot formation). For example, genotype correlations in Table 1 may be included. In addition, the correlation of SNP disease in the database may include, but is not limited to, the correlation shown in FIG. 4. Other correlations shown in FIGS. 5 and 6 may also be included. Therefore, the business method of the present invention provides a result of analyzing the risks for a number of diseases and conditions, in which case no prediction is needed as to what the multiple diseases and conditions may include. .

기타 구체예에서, 게놈에 넓게 퍼져있는 개체의 프로필과 쌍을 이루는 유전자형의 상관관계로서는, 비-의학적으로 관련된 표현형 예를 들어, "흥미로운" 표현형 또는 신체적 형질 예를 들어, 머리카락 색깔이 있다. 바람직한 구체예에서, 룰이나 룰 세트는 전술한 바와 같이, 개체의 게놈 프로필 또는 SNP 프로필에 적용된다. 게놈 프로필에 룰을 적용하면, 개체에 대한 표현형 프로필이 형성된다.In other embodiments, a genotype correlation paired with the profile of an individual that is widely spread in the genome includes a non-medically related phenotype, such as an "interesting" phenotype or physical trait, such as hair color. In a preferred embodiment, the rule or rule set is applied to an individual's genomic profile or SNP profile, as described above. Applying rules to genomic profiles forms phenotype profiles for individuals.

그러므로, 인간 유전자형의 상관관계에 관한 마스터 데이터베이스는, 새로운 상관관계가 발견되어 입증됨에 따라서, 부가의 유전자형의 상관관계로써 확장된다. 원하는 바대로 또는 적당하게 데이터베이스 내에 저장된 개체의 게놈 프로필로부터 적절한 정보를 취하여 갱신할 수 있다. 예를 들어, 공지된 새로운 유전자형의 상관관계는 특정 유전자 변이체를 기초로 할 수 있다. 이후, 개체의 전체 게놈 프로필 중 유전자에 관한 부분만을 검색하여 비교함으로써, 개체가 새로운 유전자형의 상관관계에 대해 감수성을 가질 수 있는지 여부를 파악할 수 있다.Therefore, the master database on human genotype correlations expands with additional genotype correlations as new correlations are discovered and demonstrated. As appropriate or appropriate, the appropriate information may be taken from the genomic profile of the individual stored in the database and updated. For example, known new genotype correlations can be based on specific gene variants. Then, by searching for and comparing only the parts of the gene in the individual's entire genome profile, it can be determined whether the individual can be sensitive to the correlation of the new genotype.

게놈에 대한 질문의 결과는 분석 및 해석되어, 이해할 수 있는 형태로 개체에게 제공되는 것이 바람직하다. 단계 117에서, 초기 스크리닝의 결과들은 이후, 전술한 바와 같이, 메일에 의하거나 또는 온-라인 포털 인터페이스를 통해 안전하고 기밀의 형태로 환자에게 제공된다. The results of the questions about the genome are preferably analyzed and interpreted and provided to the individual in an understandable form. In step 117, the results of the initial screening are then presented to the patient in a secure and confidential form by mail or via an on-line portal interface, as described above.

리포트는 표현형 프로필과 표현형 프로필 중 표현형에 관한 게놈 정보 예를 들어, 상이한 집단에 포함된 유전자 또는 이 집단 내 유전자 변이체에 관한 통계 자료에 관한 기초 유전학 정보를 포함할 수 있다. 리포트에 포함될 수 있는 표현형 프로필을 기초로 한 기타 정보로서는 예방 전략, 예방 차원의 건강 관리 정보, 요법, 증상의 자각, 조기 검출 기술, 개입 계획, 그리고 표현형의 정교한 동정 방법 및 하위 분류 결과가 있다. 개체의 게놈 프로필을 초기에 스크리닝한 이후, 제어 및절제된 방식으로 갱신이 이루어지거나 또는 이루어질 수 있다. The report may include genomic information about the phenotype profile and phenotypes in the phenotype profile, for example, basic genetic information about genes included in different populations or statistical data about genetic variants within the population. Other information based on phenotypic profiles that may be included in the report include preventive strategies, preventive health care information, therapies, awareness of symptoms, early detection techniques, intervention plans, and phenotypic sophisticated identification methods and subclassification results. After initially screening the genomic profile of an individual, the update may or may be made in a controlled and excised manner.

새로운 유전자형의 상관관계가 발현되어 입증 및 승인됨에 따라서, 마스터 데이터베이스를 갱신함과 아울러, 개체의 게놈 프로필은 갱신되거나 갱신될 수 있다. 새로운 유전자형의 상관관계를 기초로 하는 새로운 룰은 초기 게놈 프로필에 적용되어, 갱신된 표현형 프로필을 제공할 수 있다. 갱신된 유전자형의 상관관계 프로필은, 단계 127에서 개체의 게놈 프로필의 관련 부분을 새로운 유전자형의 상관관계과 비교함으로써, 형성될 수 있다. 예를 들어, 만일 새로운 유전자형의 상관관계가 특정 유전자에서 발생한 변이를 기초로 발견되면, 개체의 게놈 프로필의 유전자 부분은 새로운 유전자형의 상관관계에 대하여 분석될 수 있다. 이러한 경우, 이미 적용된 룰을 포함하는 전체 룰 세트보다는 하나 이상의 새로운 룰을, 갱신된 표현형 프로필을 형성하는데 적용할 수 있다. 단계 129에서는 개체의 갱신된 유전자형의 상관관계가 보안 방식으로 제공된다.As new genotype correlations are expressed, validated and approved, the genome profile of an individual can be updated or updated, as well as updating the master database. New rules based on new genotype correlations can be applied to the initial genomic profile to provide an updated phenotype profile. The updated genotype correlation profile can be formed by comparing the relevant portion of the individual's genomic profile with the new genotype correlation in step 127. For example, if a new genotype correlation is found based on mutations occurring in a particular gene, the genetic portion of the individual's genomic profile can be analyzed for the new genotype correlation. In this case, one or more new rules may be applied to form an updated phenotype profile, rather than the entire set of rules including already applied rules. In step 129 the correlation of the updated genotype of the individual is provided in a secure manner.

초기의 갱신된 표현형 프로필은 가입자나 고객에게 제공된 서비스일 수 있다. 게놈 프로필 분석 결과와 그것을 조합함에 따라서 가입 수준이 가변적으로 될 수 있다. 이와 유사하게, 가입 수준은 개체가 일정량의 서비스 즉, 자신의 유전자형의 상관관계에 관한 정보와 함께 제공받기를 원하는 서비스를 선택할 수 있도록, 가변적일 수 있다. 그러므로, 제공된 서비스 수준은 개체에 의해 구입된 서비스 가입 수준에 따라서 달라질 것이다.The initial updated phenotype profile may be a service provided to the subscriber or customer. The combination of genomic profile analysis results and combinations can result in variable levels of subscription. Similarly, the level of subscription can be variable, allowing an individual to select a certain amount of service, i.e., a service that they wish to receive along with information about their genotype correlations. Therefore, the level of service provided will depend on the level of service subscription purchased by the entity.

가입자가 가입할 당시의 가입 수준으로서는 게놈 프로필과 초기 표현형 프로필을 포함할 수 있다. 이는 기본 가입 수준일 수 있다. 기본 가입 수준에 있어서, 그 수준은 서비스 수준에 따라서 달라질 수 있다. 예를 들어, 어떠한 가입 수준의 경우는 특정 질병을 치료 또는 예방함에 있어서 특정한 전문 기술을 가지는 유전 상담자 및 전문의에게 참고 자료 및 기타 서비스 옵션을 제공할 수 있었다. 유전자 상담 결과는 온-라인 또는 전화로 알 수 있다. 다른 구체예에서, 가입 비용은 개체가 자신의 표현형 프로필에 대해 선택하는 표현형의 갯 수에 의존할 수 있다. 기타 옵션은 가입자가 온-라인 유전자 상담을 받을지 받지 않을지 여부에 관한 것일 수 있다.The level of subscription at the time a subscriber subscribes may include a genomic profile and an initial phenotype profile. This may be the default subscription level. For a basic subscription level, that level may vary depending on the service level. For example, some levels of accession could provide reference and other service options to genetic counselors and specialists with specific expertise in treating or preventing certain diseases. Genetic counseling results can be obtained online or by telephone. In other embodiments, the subscription cost may depend on the number of phenotypes that an individual chooses for its phenotype profile. Another option may be whether or not the subscriber will receive on-line gene counseling.

다른 시나리오에 있어서는, 데이터베이스 내 개체의 게놈 프로필을 유지하면서 게놈에 널리 퍼져있는 초기 유전자형의 상관관계를 제공할 수 있었는데; 이러한 데이터베이스는 개체에 의해 선별될 경우 보안이 유지될 수 있다. 이와 같이 초기 분석을 마친 후, 추후 분석 결과 및 추가 결과들은 개체의 요청과 부가 요금을 지불함으로써 받을 수 있다. 이는 가입 수준이 최우수 수준일 때에 받을 수 있다. In another scenario, it was possible to provide early genotype correlations that are prevalent in the genome while maintaining the genomic profile of the individual in the database; Such a database can be secured when selected by an individual. After completing the initial analysis, further analysis results and additional results can be received by requesting an individual and paying an additional fee. This can be received when the subscription level is the highest level.

본 발명의 비즈니스 방법에 관한 하나의 구체예에서, 개체의 위험도는 갱신되며, 상응하는 정보는 가입을 기초로 하여 개체에게 제공될 수 있다. 갱신은 최우수 수준으로 가입한 가입자에게 유용할 수 있다. 유전자형의 상관관계 분석 서비스에 가입함으로써, 개체의 선호도에 따라서 새로운 유전자형의 상관관계의 하위세트 또는 특정 카테고리로 갱신이 이루어질 수 있다. 예를 들어, 개체는 치료 방법이나 예방 방법으로서 알려진 것이 무엇이 있는지 알 수 있는 유전자형의 상관관계만을 알고 싶을 것이다. 어느 한 개체가 부가의 분석을 수행할지 여부를 결정하는 것을 돕기 위해서, 상기 개체에게는 이용 가능하게 된 부가의 유전자형의 상관관계에 관한 정보가 제공될 수 있다. 이러한 정보는 가입자에게 우편 또는 이-메일로 편리하게 보내어질 수 있다. In one embodiment of the business method of the present invention, the risk of the individual is updated and corresponding information may be provided to the individual based on the subscription. Renewal can be useful for subscribers who subscribe at the highest level. By subscribing to a genotype correlation analysis service, updates may be made to a subset or specific category of new genotype correlations, depending on the individual's preferences. For example, an individual may want to know only genotype correlations that can tell what is known as a treatment or prevention method. In order to help determine whether an individual will perform further analysis, the individual may be provided with information regarding the correlation of additional genotypes made available. Such information may be conveniently sent by mail or e-mail to the subscriber.

최우수 가입 시, 예를 들어, 기본 가입시 언급되었던 서비스 이외에, 부가 수준의 서비스가 제공될 수 있다. 기타 가입 모델이 최우수 수준에 제공될 수 있다. 예를 들어, 가장 높은 수준에서는 가입자에게 무제한 갱신 결과와 리포트를 제공할 수 있다. 새로운 상관관계과 룰이 측정됨에 따라서, 가입자의 프로필이 갱신될 수 있다. 이 수준에서, 가입자는 또한 다수의 개체 예를 들어, 가족 구성원과 건강 관리자가 입수하는 것을 허용할 수 있다. 가입자는 또한 온-라인 유전 상담자와 전문의에게 무제한으로 접근을 허용할 수도 있다.At the highest subscription, an additional level of service may be provided, in addition to the services mentioned at the time of the basic subscription, for example. Other subscription models may be provided at the highest level. For example, at the highest level, subscribers can be provided with unlimited renewal results and reports. As new correlations and rules are measured, the subscriber's profile may be updated. At this level, the subscriber may also allow for a large number of individuals to obtain, for example, family members and health managers. Subscribers may also grant unlimited access to on-line genetic counselors and specialists.

최우수 수준으로 가입하였을 때 가입의 다음 수준은 보다 제한된 측면을 제공할 수 있는데, 예를 들어, 제한된 횟수만큼 갱신할 수 있다. 가입자는 가입 기간 이내에 제한된 횟수만큼 예를 들어, 1년에 4회 자신의 게놈 프로필을 갱신할 수 있다. 다른 가입 수준에 있어서, 가입자는 1주일에 1회, 1개월에 1회 또는 1년에 1회만큼 갱신된 게놈 프로필을 저장할 수 있다. 다른 구체예에서, 가입자는 자신이 자신의 게놈 프로필을 갱신하는 것을 선택할 수 있도록, 제한된 수의 표현형만을 보유할 수 있다.When subscribed at the highest level, the next level of subscription may provide a more limited aspect, for example, to renew a limited number of times. Subscribers may update their genomic profile for a limited number of times within the subscription period, for example four times a year. At other subscription levels, the subscriber can store the updated genomic profile once a week, once a month or once a year. In other embodiments, the subscriber may only have a limited number of phenotypes, so that he or she may choose to update his genomic profile.

개인 포털은 또한 편리하게도, 어느 한 개체가 위험도에 관한 가입 상태를 유지할 수 있도록 해 줄 것이거나, 상관관계와 정보를 계속 갱신할 수 있도록 해 줄 것이거나, 또는 위험도 평가 및 정보에 대해 갱신을 요청할 수 있도록 해 줄 것이다. 전술한 바와 같이, 가변적인 가입 수준이 제공될 경우, 개체는 다양한 수준의 유전자형의 상관관계 결과와 갱신 여부를 선택할 수 있으며, 가입 수준들은 가입자 자신의 개인 포털을 통하여 그 자신에 의해 상이하게 선택될 수 있다.Personal portals will also conveniently allow any individual to remain subscribed to a risk, keep the correlation and information up to date, or request an update on risk assessment and information. Will let you. As mentioned above, when variable levels of subscription are provided, an individual can choose between different levels of genotype correlation results and whether or not to renew, and levels of subscription may be selected differently by themselves through the subscriber's own personal portal. Can be.

이와 같은 가입 옵션 중 임의의 것은 본 발명의 비즈니스 방법에 대한 진입스트림에 영향을 미칠 것이다. 본 발명의 비즈니스 방법에 관한 진입 스트림은 또한 새로운 고객과 가입자가 추가됨으로써 더하여지기도 할 것인데, 이 경우, 새로운 게놈 프로필이 데이터베이스에 부가된다. Any of these subscription options will affect the entry stream to the business method of the present invention. The entry stream for the business method of the present invention will also be added by adding new customers and subscribers, in which case the new genomic profile is added to the database.

표 1a~1s: 표현형과 상관되어 유전자 변이가 일어난 대표적인 유전자Table 1a-1s: Representative genes with genetic variation correlated with phenotype

Figure 112009040073333-PCT00001
Figure 112009040073333-PCT00001

Figure 112009040073333-PCT00002
Figure 112009040073333-PCT00002

Figure 112009040073333-PCT00003
Figure 112009040073333-PCT00003

Figure 112009040073333-PCT00004
Figure 112009040073333-PCT00004

Figure 112009040073333-PCT00005
Figure 112009040073333-PCT00005

Figure 112009040073333-PCT00006
Figure 112009040073333-PCT00006

Figure 112009040073333-PCT00007
Figure 112009040073333-PCT00007

Figure 112009040073333-PCT00008
Figure 112009040073333-PCT00008

Figure 112009040073333-PCT00009
Figure 112009040073333-PCT00009

Figure 112009040073333-PCT00010
Figure 112009040073333-PCT00010

Figure 112009040073333-PCT00011
Figure 112009040073333-PCT00011

Figure 112009040073333-PCT00012
Figure 112009040073333-PCT00012

Figure 112009040073333-PCT00013
Figure 112009040073333-PCT00013

Figure 112009040073333-PCT00014
Figure 112009040073333-PCT00014

Figure 112009040073333-PCT00015
Figure 112009040073333-PCT00015

Figure 112009040073333-PCT00016
Figure 112009040073333-PCT00016

Figure 112009040073333-PCT00017
Figure 112009040073333-PCT00017

Figure 112009040073333-PCT00018
Figure 112009040073333-PCT00018

Figure 112009040073333-PCT00019
Figure 112009040073333-PCT00019

유전자 종합 지수(Genetic Composite Genetic Composite Index IndexIndex ; ; GCIGCI ))

다수의 병태 또는 질병의 원인은 유전 인자 및 환경 인자 둘 다에 있다. 최근 들어, 유전자형 분석 기술이 발달함에 따라서 전제 게놈에 걸쳐서 발현되는 질병과 유전 마커 사이의 새로운 연관 관계를 동정할 수 있는 기회가 제공되었다. 실제로, 최근 다수의 연구 결과에 따르면, 이와 같은 연관 관계가 확인되었는데, 즉, 특정 대립 형질이나 유전자형이 질병에 대한 위험도 증가 여부와 상관되어 있음을 알 수 있었다. 이와 같이 행하여지고 있는 연구들 중 일부는 환자군 세트와 대조군 세트를 수집하는 것과, 상기 2개의 집단 들 간 유전자 마커의 대립 형질 분포에 대하여 분석하는 것을 포함한다. 이와 같은 연구 결과들 중 일부에 있어서, 특이 유전자 마커와 질병 사이의 연관 관계는, 백 그라운드로서 취급되되 통계학적 분석 결과를 설명해주는 것은 아닌, 기타 유전자 마커로부터의 분리 결과에 대한 척도가 된다.The cause of many conditions or diseases lies in both genetic and environmental factors. In recent years, the development of genotyping techniques has provided the opportunity to identify new associations between disease markers and genetic markers expressed across the entire genome. Indeed, many recent studies have identified this association, suggesting that certain alleles or genotypes correlate with increased risk for disease. Some of the studies being done include collecting the patient and control sets and analyzing the allele distribution of the genetic markers between the two populations. In some of these findings, the association between specific genetic markers and disease is a measure of the results of separation from other genetic markers, which are treated as background but do not explain the results of statistical analysis.

유전자 마커와 변이체로서는 SNP, 뉴클레오티드 반복부, 뉴클레오티드 삽입부, 뉴클레오티드 결실부, 염색체 전좌부, 염색체 중복부, 또는 복제 수 변이를 포함할 수 있다. 복제 수 변이로서는 초 위성체 반복부, 뉴클레오티드 반복부, 동원체 반복부, 또는 텔로미어 반복부을 포함할 수 있다.Genetic markers and variants may include SNPs, nucleotide repeats, nucleotide insertions, nucleotide deletions, chromosomal translocations, chromosomal duplications, or copy number variations. Copy number variations may include hypersatellite repeats, nucleotide repeats, centriole repeats, or telomere repeats.

본 발명의 하나의 측면에서, 다수의 유전자 마커와 하나 이상의 질병 또는 병태와의 연관 관계에 대한 정보는 통합 및 분석되어, GCI 스코어가 도출된다. 이 GCI 스코어는, 현재의 과학적 연구 결과를 기초로 하여, 각각의 질병 위험도를 관련 집단과 비교하는 것에 대하여 신뢰할만하고(즉, 확고하고), 이해할 수 있으며/있거나, 직관적인 감각을, 유전학 분야에 익숙하지 않은 사람에게 제공하는데 사용될 수 있다. 하나의 구체에에서, 상이한 위치에서의 복합적인 효과에 대하여 확고한 GCI 스코어를 생성하는 방법은, 연구 대상인 각 위치에 대하여 보고된 개체의 위험도를 기초로 한다. 예를 들어, 대상 질병 또는 질환을 동정한 후, 정보 공급원 예를 들어, 데이터베이스, 특허 공보 및 과학 문헌은 하나 이상의 유전자 위치와 이와 같은 병태에 대한 질병이 어떠한 연관 관계가 있는지에 대한 정보에 관하여 질문을 던진다. 이러한 정보 공급원은 품질 기준을 이용하여 보조 및 평가된다. 몇몇 구체예에서, 평가 방법은 다수의 단계들을 포함한다. 다른 구체예에서, 정보 공급원은 다수의 품질 기준에 대해 평가된다. 정보 공급원으로부터 유래하는 정보는 각각의 대상 질병 또는 병태에 관한 하나 이상의 유전자 위치에 대한 상대적 위험도 또는 교차비를 확인하는데 사용된다.In one aspect of the invention, information about the association of multiple genetic markers with one or more diseases or conditions is integrated and analyzed to derive a GCI score. This GCI score, based on current scientific research, provides a reliable (ie robust), understandable, and / or intuitive sensation for comparing each disease risk with the relevant population. It can be used to provide people who are not familiar with it. In one embodiment, the method of generating a robust GCI score for multiple effects at different locations is based on the risk of the individual reported for each location studied. For example, after identifying a subject disease or disorder, sources of information, such as databases, patent publications, and scientific literature, may ask questions about information related to one or more gene positions and how the disease relates to such a condition. Throws. These sources of information are assisted and evaluated using quality standards. In some embodiments, the evaluation method comprises a plurality of steps. In other embodiments, the information source is evaluated against a number of quality criteria. Information from information sources is used to identify relative risks or odds ratios for one or more gene positions for each subject disease or condition.

대안적인 구체예에서, 하나 이상의 유전자 위치에 대한 상대적 위험도(RR) 또는 교차비(OR)는 유용한 정보 공급처로부터 얻을 수 없다. 이후, 상기 RR은 (1) 동일 위치에 존재하는 다수의 대립 형질에 관하여 보고된 OR, (2) 데이터 세트 예를 들어, 햅 맵 데이터 세트로부터 유래하는 대립 형질의 발현 빈도, 및/또는 (3) 대상으로 하는 모든 대립 형질의 RR을 유도하는데 유용한 공급처(예를 들어, CDC, 국립 보건 통계 센터 등)를 활용하여 계산된다. 하나의 구체예에서, 동일한 위치에 있는 다수의 대립 형질들의 OR은 별도로 또는 독립적으로 예측된다. 바람직한 구체예에서, 동일한 위치에 존재하는 다수의 대립 형질들의 OR은 통합되며, 그 결과, 상이한 대립 형질의 OR 사이의 의존도가 계산된다. 몇몇 구체예에서, 확립된 질병 모델(승법, 가법, 하버드-수정 및 지배적 효과와 같은 모델을 포함하나, 이에 한정되는 것은 아님)을 사용하면, 선택된 모델에 따라 개체의 위험도를 나타내는 중간 스코어가 생성된다.In alternative embodiments, the relative risk (RR) or crossover ratio (OR) for one or more gene positions cannot be obtained from a useful source of information. The RR is then (1) OR reported for multiple alleles present at the same location, (2) frequency of expression of alleles derived from a data set, eg, a hap map data set, and / or (3 Calculations are made using sources that are useful for inducing RRs of all alleles of interest (eg, CDC, National Health Statistics Center, etc.). In one embodiment, the ORs of multiple alleles at the same location are predicted separately or independently. In a preferred embodiment, the ORs of multiple alleles present at the same location are integrated, as a result of which the dependencies between the ORs of the different alleles are calculated. In some embodiments, using established disease models (including but not limited to models such as multiplication, addition, Harvard-correction, and dominant effects), a median score representing an individual's risk is generated according to the selected model. do.

다른 구체예에서, 대상 질병 또는 병태에 대한 다수의 모델을 분석하고, 상이한 모델로부터 얻어진 결과들을 상관시키는 방법이 사용되는데; 이로써, 특정의 질병 모델을 선택함으로써 도입될 수 있는 가능 오차(possible error)가 최소화된다. 이 방법은 상대적 위험도를 계산한 결과에 대한 정보 공급원으로부터 얻어진 유병율, 대립 형질 발현 빈도 및 OR에 대한 예측치에 있어서 합리적 오차의 영향력을 최소화한다. RR에 대한 "선형성" 또는 이 RR에 대한 예측 유병 효과의 단조로운 특성으로 인하여, 최종 순위 스코어에 대한 유병율을 설령 틀리게 예측하더라도 이에 따른 영향은 거의 없거나 아예 없는데; 다만, 동일한 모델은 리포트가 작성된 개체들 모두에게 일률적으로 적용된다.In another embodiment, methods are used for analyzing multiple models for a subject disease or condition and correlating results obtained from different models; This minimizes possible errors that can be introduced by selecting a particular disease model. This method minimizes the impact of reasonable errors in the prevalence, allele frequency, and estimates of OR obtained from sources of information on the calculation of relative risk. Due to the "linearity" of the RR or the monotonous nature of the predicted prevalence effect on this RR, even if the prevalence of the final ranking score is incorrectly predicted, there is little or no effect; However, the same model applies uniformly to all the entities for which the report is created.

다른 구체예에서는, 부가 "위치"로서 환경/행동/인구 통계학적 데이터를 고려하는 방법이 이용된다. 관련된 구체예에서, 이러한 데이터는 정보 공급처 예를 들어, 의학적 또는 과학적 문헌이나 데이터베이스(예를 들어, 흡연 w/폐암과의 연관 관계, 또는 보험 산업 위해도 평가 결과)로부터 얻을 수 있다. 하나의 구체예에서, GCI 스코어는 하나 이상의 복합병(complex disease)에 대해 메겨진다. 복합병은 다수의 유전자, 환경 인자 및 이것들의 상호 작용에 의해 영향받을 수 있다. 일어날 수 있는 다수의 상호 작용들은 복합병에 관한 연구가 수행될 때 분석될 필요가 있다. 하나의 구체예에서, 본페로니(Bonferroni) 교정법과 같은 방법이 다수의 비교 결과들을 교정하는데 사용된다. 대안적인 구체예에서, 테스트가 독립적이거나 또는 특정 유형의 의존성을 나타낼 때, 전체적인 유의성 수준("가족 단위 오류율(familywise error rate)"로 알려짐)을 조절하는데에 사임즈 테스트(Simes' test)가 사용된다[Sarkar S.(1998), Some probability inequalities for ordered MTP2 random variables: a proof of Simes conjecture, Ann Stat 26:494-504]. 사임즈 테스트는, p(k)≤αk/K(식 중, 임의의 k는 1,....K임)이면, 모든 K 테스트-특이 귀무 가설이 진실이라는 일반적인 귀무 가설을 부정한다[Simes RJ(1986)An improved Bonferroni procedure for multiple tests of significance, Biometrika 73:751-754]. In another embodiment, a method of considering environmental / behavioral / population statistical data as an additional “location” is used. In related embodiments, such data may be obtained from sources of information such as medical or scientific literature or databases (eg, associations with smoking w / lung cancer, or insurance industry risk assessment results). In one embodiment, the GCI score is scored for one or more complex diseases. Complex diseases can be affected by a number of genes, environmental factors, and their interactions. Many of the interactions that may occur need to be analyzed when research on complications is conducted. In one embodiment, a method such as Bonferroni calibration is used to calibrate a number of comparison results. In alternative embodiments, the Sims' test is used to adjust the overall level of significance (known as the "familywise error rate") when the tests are independent or exhibit certain types of dependencies. Sarkar S. (1998), Some probability inequalities for ordered MTP2 random variables: a proof of Simes conjecture, Ann Stat 26: 494-504. The Signs test negates the general null hypothesis that all K test-specific null hypotheses are true if p (k) ≦ αk / K , where any k is 1, ... K. [Simes RJ (1986) An improved Bonferroni procedure for multiple tests of significance, Biometrika 73: 751-754.

다중 유전자 분석 및 다중 환경 인자 분석에 사용될 수 있는 기타 구체예에서는, 오기각률(false-discovery rate) 즉, 오류에 의해 부정된 귀무 가설의 예상 부정비를 제어한다. 이 연구 방법은 일정 비율의 귀무 가설이 마이크로어레이 연구법에서와 같이 가정된 오류일 수 있을 때에 특히 유용하다. 문헌[Devlin외 다수 2003, Analysis of multilocus models of association. Genet Epidemiol 25:36-47]에서는, 다중 위치 연관 연구법(multilocus association study)에서 일어날 수 있는 다수의 유전자 × 유전자 상호 작용을 테스트할 때 오기각률을 제어하는, 벤자미니 및 호츠버그(Benjamini and Hochberg) 점증법(step-up procedure)의 변법을 제안하였다. 상기 벤자미니 및 호츠버그의 방법은 사임즈 테스트[즉, k * = maxk로 설정하였을 때, p(k)≤αk/K이고, p (1) ,...p (k) 에 해당하는 k * 귀무 가설을 부정함]. 실제로, 벤자미니 및 호츠버그 방법은 모든 귀무 가설이 진실일 때 사임즈 테스트로 회귀한다[Benjamini Y, Yekutieli D (2001) The control of the false discovery rate in multiple testing under dependency. Ann Stat 29:1165-1188].In other embodiments that can be used for multiple genetic analysis and multiple environmental factor analysis, the false-discovery rate, i.e., the predicted maintenance of the negated hypothesis negated by errors, is controlled. This method of research is particularly useful when a certain percentage of the null hypothesis can be assumed error, as in microarray studies. See Devlin et al. 2003, Analysis of multilocus models of association. Genet Epidemiol 25: 36-47] reported that Benjaminini and Hochberg, who control the rate of coming when testing multiple genes x gene interactions that can occur in a multilocus association study, A variation of the step-up procedure is proposed. How the mini Provenza and hocheu bug resigned's test [that is, k * = when set to maxk, p (k) and ≤αk / K, k for the p (1), ... p ( k) * Negate the null hypothesis]. Indeed, the Benjamini and Hotzberg methods revert to the Simims test when all null hypotheses are true [Benjamini Y, Yekutieli D (2001) The control of the false discovery rate in multiple testing under dependency. Ann Stat 29: 1165-1188.

몇몇 구체예에서, 개체는 중간 스코어를 기초로 하는 개체의 집단과 비교하여 순위가 메겨지고, 그 결과, 집단 내 순위로서 표현될 수 있는 최종 순위 스코어가 메겨지는 것이다[예를 들어, 99th 백 분위 수 또는 99th, 98th, 97th, 96th, 95th, 94th, 93rd, 92nd, 91st, 90th, 89th, 88th, 87th, 86th, 85th, 84th, 83rd, 82nd, 81st, 80th, 79th, 78th, 77th, 76th, 75th, 74th, 73rd, 72nd, 71st, 70th, 69th, 65th, 60th, 55th, 50th, 45th, 40th, 40th, 35th, 30th, 25th, 20th, 15th, 10th, 5th 또는 0th 백 분위 수]. 다른 구체예에서, 상기 순위는 일정 범위 예를 들어, 100th∼95th 백 분위 수, 95th∼85th 백 분위 수, 85th∼60th 백 분위 수, 또는 100th∼0th 백 분위 수 내 임의의 범위로서 표시될 수 있는 스코어일 수 있다. 또 다른 구체예에서, 개체는 사 분위 수 예를 들어, 최고 75th 사 분위 수, 또는 최저 25th 사 분위 수로서 순위가 메겨진다. 또 다른 구체예에서, 개체는 집단의 평균 또는 중앙 스코어와 비교하여 순위가 메겨진다. In some embodiments, an individual is ranked relative to a group of individuals based on a median score, resulting in a final ranking score that can be expressed as a ranking within the population (eg, 99 th bag). Quantile or 99 th , 98 th , 97 th , 96 th , 95 th , 94 th , 93 rd , 92 nd , 91 st , 90 th , 89 th , 88 th , 87 th , 86 th , 85 th , 84 th , 83 rd , 82 nd , 81 st , 80 th , 79 th , 78 th , 77 th , 76 th , 75 th , 74 th , 73 rd , 72 nd , 71 st , 70 th , 69 th , 65 th , 60 th , 55 th , 50 th , 45 th , 40 th , 40 th , 35 th , 30 th , 25 th , 20 th , 15 th , 10 th , 5 th or 0 th percentile]. In other embodiments, the ranking is in a range, for example, 100 th to 95 th percentile, 95 th to 85 th percentile, 85 th to 60 th percentile, or 100 th to 0 th percentile It can be a score that can be displayed as any range within. In another embodiment, an individual is ranked as a quartile, for example, up to 75 th quartile, or at least 25 th quartile. In another embodiment, the individual is ranked against the average or median score of the population.

하나의 구체예에서, 개체와 비교되는 집단으로서는, 다양한 지형적 배경 및 민족적 배경을 가진 다수의 사람들 예를 들어, 전 세계 사람들을 포함한다. 다른 구체예에서, 개체와 비교되는 집단은 특정 지형, 가계, 민족성, 성별, 연령(태아, 신생아, 어린이, 청년, 청소년, 성인, 노인)에 따른 병상(예를 들어, 증상성, 무증상성, 보인성, 조기 발병 및 후기 발병)에 제한되어 있다. 몇몇 구체예에서, 개체와 비교되는 집단은 공개된 정보 및/또는 사적인 정보 공급원에 보고된 정보로부터 유래한다.In one embodiment, the population compared to the individual includes a large number of people of various geographical and ethnic backgrounds, for example, people around the world. In other embodiments, the population compared to the subject may be characterized by a condition (eg symptomatic, asymptomatic) according to a particular terrain, family, ethnicity, gender, age (fetal, newborn, child, youth, adolescent, adult, elderly). Visibility, early onset and late onset). In some embodiments, the population to which the individual is compared is derived from published information and / or information reported to private sources of information.

하나의 구체예에서, 개체의 GCI 스코어 또는 GCI 플러스 스코어는 디스플레이를 통해 가시화된다. 몇몇 구체예에서, 스크린(예를 들어, 컴퓨터 모니터 또는 텔레비젼 스크린)은 디스플레이 예를 들어, 관련 정보를 포함하는 개체 포털을 가시화하는데 사용된다. 다른 구체예에서, 상기 디스플레이는 고정된 디스플레이 예를 들어, 인쇄된 페이지이다. 하나의 구체예에서, 상기 디스플레이는 다음과 같은 것들 중 하나 이상을 포함할 수 있으나, 이에 한정되는 것은 아니다: 빈(bin)(예를 들어, 1∼5, 6∼10, 11∼15, 16∼20, 21∼25, 26∼30, 31∼35, 36∼40, 41∼45, 46∼50, 51∼55, 56∼60, 61∼65, 66∼70, 71∼75, 76∼80, 81∼85, 86∼90, 91∼95, 96∼100), 색상 구배(color gradient) 또는 그레이스케일 구배(grayscale gradient), 온도계, 게이지, 파이 도표, 히스토그램 또는 막대 그래프. 예를 들어, 도 18 및 도 19는 MS에 대하여 상이한 디스플레이이며, 도 20은 크론병에 대한 것이다. 다른 구체예에서, 온도계는 GCI 스코어와 질병/병태의 유병율을 나타내는데 사용된다. 다른 구체예에서, 온도계는 보고된 GCI 스코어와 함께 변하는 수준을 표시하는데, 예를 들어, 도 15∼17에 있어서, 색상은 위험도와 상응한다. 온도계는 GCI 스코어가 증가함에 따른 비색 변화(예를 들어, 낮은 GCI 스코어(청색)로부터 높은 GCI 스코어(적색)로 점차 변화됨)를 나타낼 수 있다. 관련 구체예에서, 온도계는 보고된 GCI 스코어에 따라서 변하는 수준과 위험도 순위가 증가함에 따라서 변하는 비색 변화 둘 다를 나타낸다.In one embodiment, the GCI score or GCI plus score of the individual is visualized through the display. In some embodiments, screens (eg, computer monitors or television screens) are used to visualize object portals that contain displays, eg, related information. In another embodiment, the display is a fixed display, such as a printed page. In one embodiment, the display may include, but is not limited to, one or more of the following: bins (eg, 1-5, 6-10, 11-15, 16) -20, 21-25, 26-30, 31-35, 36-40, 41-45, 46-50, 51-55, 56-60, 61-65, 66-70, 71-75, 76-80 , 81-85, 86-90, 91-95, 96-100, color gradient or grayscale gradient, thermometer, gauge, pie chart, histogram or bar graph. For example, FIGS. 18 and 19 are different displays for MS, and FIG. 20 is for Crohn's disease. In another embodiment, the thermometer is used to indicate the GCI score and the prevalence of the disease / condition. In another embodiment, the thermometer displays varying levels with reported GCI scores, for example, in FIGS. 15-17, the color corresponds to the risk. The thermometer may show colorimetric changes as the GCI score increases (eg, gradually changing from a low GCI score (blue) to a high GCI score (red)). In a related embodiment, the thermometer shows both colorimetric changes that change as the level of risk and the rank of risk increase according to the reported GCI score.

대안적인 구체예에서, 개체의 GCI 스코어는 청각 피드백을 사용함으로써 개체에게 전달된다. 하나의 구체예에서, 청각 피드백은 음성으로 위험도 순위가 높거나 낮다고 알려주는 것이다. 다른 구체예에서, 청각 피드백은 특이 GCI 스코어 예를 들어, 수, 백 분위 수, 범위, 사 분위 수 또는 집단에 대한 평균 또는 중앙 GCI 스코어와의 비교 결과에 관하여 상세히 설명한 것이다. 하나의 구체예에서, 청각 피드백은 실제로 사람이 개인적으로 전달해주거나 또는 원격 소통 장치 예를 들어, 전화(지상 통신선, 이동 전화 또는 위성 전화)를 통하거나, 또는 개인 포털을 통하여 전달된다. 다른 구체예에서, 청각 피드백은 자동화된 시스템 예를 들어, 컴퓨터에 의해 전달된다. 하나의 구체예에서, 청각 피드백은 쌍방향 음성 응답(interactive voice response; IVR) 시스템 즉, 통상의 전화 통화를 이용하여 컴퓨터가 목소리를 감지하고 음질을 조절할 수 있는 기술의 일환으로서 전달된다. 다른 구체예에서, 개체는 IVR 시스템을 통해 중앙 서버와 상호 작용할 수 있다. IVR 시스템은 개체들과 상호 작용하고, 이들에게 자신들의 위험도 순위에 관한 청각 피드백을 제공하기 위한, 사전-녹음 오디오 또는 동력으로 생성되는 오디오와 반응할 수 있다. 하나의 예에서, 어느 한 개체는 IVR 시스템에 의해 응답되는 번호로 전화를 걸 수 있다. 임의로 식별 코드나, 보안 코드를 도입하거나 또는 실행중인 음성 인식 프로토콜을 진행한 후, IVR 시스템은 개체로 하여금 메뉴 예를 들어, 누름 단추식 전화기 또는 음성 메뉴로부터 옵션을 선택하도록 요구한다. 이러한 옵션 중 하나는 그 개체에게 자신의 위험도 순위를 제공할 수 있다.In alternative embodiments, the individual's GCI score is communicated to the individual by using auditory feedback. In one embodiment, auditory feedback is spoken to indicate that the risk rank is high or low. In other embodiments, auditory feedback is described in detail with respect to results of comparison with specific GCI scores, eg, mean or median GCI scores for numbers, percentiles, ranges, quartiles, or populations. In one embodiment, the auditory feedback is actually delivered by a person personally or via a remote communication device such as a telephone (terrestrial line, mobile phone or satellite phone), or through a personal portal. In another embodiment, auditory feedback is delivered by an automated system, eg, a computer. In one embodiment, auditory feedback is delivered as part of an interactive voice response (IVR) system, a technology that allows a computer to sense voice and adjust sound quality using a conventional telephone call. In other embodiments, the individual can interact with the central server via the IVR system. The IVR system can react with pre-recorded audio or powered audio to interact with the entities and provide them with auditory feedback regarding their risk ranking. In one example, either entity may dial a number that is answered by the IVR system. After optionally introducing an identification code, security code, or proceeding with a running speech recognition protocol, the IVR system requires the entity to select an option from a menu, such as a touch button or voice menu. One of these options can give the entity its own risk ranking.

다른 구체예에서, 개체의 GCI 스코어는 디스플레이를 이용하여 가시화되고, 청각 피드백 예를 들어, 개인 포털을 사용하여 전달된다. 이러한 조합은 개체의 전반적인 건강에 대한 GCI 스코어의 상관관계에 관하여 토론하며, 적용 가능한 예방 수단을 권고받는, GCI 스코어 및 청각 피드백의 시각적 디스플레이를 포함할 수 있다.In another embodiment, an individual's GCI score is visualized using a display and delivered using auditory feedback, eg, a personal portal. Such combinations may include a visual display of the GCI score and auditory feedback, discussing the correlation of the GCI score to the individual's overall health and recommending applicable preventive measures.

하나의 예에서, GCI 스코어는 다단계 방법을 이용하여 메겨진다. 처음에, 연구될 각각의 병태에 있어서, 유전자 마커 각각에 대한 교차비로부터 상대적 위험도를 계산해낸다. 매 유병율 수치(p = 0.01, 0.02,...., 0.5)에 있어서, 햅 맵 CEU 집단의 GCI 스코어는 유병율과 햅 맵 대립 형질 발현 빈도를 기초로 하여 계산된다. 만일 유병율이 가변적일 때 GCI 스코어가 가변적이지 않을 경우, 고려되는 유일한 가정으로서는 승법 모델이 있다. 그렇지 않을 경우, 상기 모델은 유병율에 감수성이다. 노-콜 수치(no-call value)를 임의로 조합하였을 경우, 햅 맵 집단 내 상대적 위험도와 스코어 분포가 얻어진다. 각각의 새로운 개체에 있어서, 개체의 스코어는 햅 맵 분포와 비교되며, 결과로 생성된 스코어는 이 집단에 있어서 개체의 순위에 해당한다. 이 과정에서는 가정이 행하여지므로, 보고된 스코어의 정확도는 낮을 수 있다. 집단은 사 분위 수(3∼6 빈)로 구분될 것이며, 보고된 빈은 개체의 순위가 떨어지는 경우가 될 것이다. 빈의 수는 여러 가지 고려할 사항들 예를 들어, 각각의 질병에 대한 스코어 정확도를 기초로 하였을 때, 상이한 질병에 따라서 다를 수 있다. 상이한 햅 맵 개체의 스코어 사이에 연관 관계가 있을 경우, 평균 순위가 사용될 것이다.In one example, GCI scores are scored using a multistep method. Initially, for each condition to be studied, the relative risk is calculated from the odds ratios for each of the genetic markers. For each prevalence value (p = 0.01, 0.02,..., 0.5), the GCI score of the hap map CEU population is calculated based on the prevalence and the frequency of hap map allele expression. If the GCI score is not variable when the prevalence is variable, the only assumption considered is the multiplication model. Otherwise, the model is sensitive to prevalence. When randomly combining no-call values, the relative risk and score distribution in the hap map population are obtained. For each new individual, the score of the individual is compared with the hap map distribution, and the resulting score corresponds to the rank of the individual in this population. Since assumptions are made in this process, the accuracy of the reported scores may be low. Cohorts will be divided into quartiles (3-6 bins), and the reported bins will be in the case of low ranking. The number of bins can be different for different diseases, based on several considerations, for example, score accuracy for each disease. If there is an association between the scores of different hap map entities, the average rank will be used.

하나의 구체예에서, GCI 스코어가 높을수록 어느 한 가지 병태나 질병에 걸리거나 또는 이것의 진단을 받을 위험도가 증가함을 알 수 있다. 다른 구체예에서, 상기 GCI 스코어를 추론해내는데 수학 모델이 사용된다. 몇몇 구체예에서, 상기 GCI 스코어는 집단 및/또는 질병이나 병태에 관하여 잠재되어 있던 정보의 불완전한 특성을 설명하는 수학 모델을 기초로 한다. 몇몇 구체예에서, 수학 모델로서는 GCI 스코어를 계산하는 기초의 일부로서 하나 이상의 추론을 포함하는데, 여기서, 상기 가정으로서는 다음과 같은 것들을 포함하나, 이에 한정되는 것은 아니다: 교차비 수치가 주어진다는 가정; 병태의 유병율이 공지된다는 가정; 집단 내 유전자형의 발현 빈도가 공지된다는 가정; 그리고 고객이 연구에 사용된 집단과 햅 맵과 동일한 가계 배경에 속한다는 가정; 통합 위험도가 개별 유전자 마커에 대한 상이한 위험도 인자의 산물이라는 가정. 몇몇 구체예에서, 상기 GCI는 또한, 유전자형의 다중-유전자형 발현 빈도는 SNP 각각의 대립 형질 또는 개별 유전자 마커 의 발현 빈도의 곱이라는 가정을 포함할 수 있다[예를 들어, 상이한 SNP 또는 유전자 마커는 집단을 통틀어서 독립적이다].In one embodiment, the higher the GCI score, the greater the risk of developing or being diagnosed with any one condition or disease. In another embodiment, a mathematical model is used to infer the GCI score. In some embodiments, the GCI score is based on a mathematical model that describes the incomplete nature of the information that was latent with respect to the population and / or disease or condition. In some embodiments, the mathematical model includes one or more inferences as part of the basis for calculating the GCI scores, wherein the assumptions include, but are not limited to: the assumption that a ratio of odds ratio is given; The assumption that the prevalence of the condition is known; The assumption that the frequency of expression of genotypes in a population is known; And the assumption that the client belongs to the same household background as the hap map and the population used in the study; Assume that the integration risk is the product of different risk factors for individual genetic markers. In some embodiments, the GCI may also include the assumption that the genotype's multi-genic expression frequency is the product of the alleles of each SNP or the expression frequency of individual gene markers (eg, different SNPs or gene markers Independent throughout the group].

승법 모델(Multiplicative Model)Multiplicative Model

하나의 구체예에서, GCI 스코어는 유전 마커 세트에 영향을 미치는 위험도가 개별 유전자 마커에 의한 위험도의 곱이라는 가정 하에 계산된다. 이는 곧, 상이한 유전자 마커는 독립적으로, 기타 유전자 마커가 질병의 위험도를 나타내게 한다는 것을 의미한다. 공식적으로, 위험도 대립 형질 r 1 ,....r k , 그리고 비-위험도 대립 형질 n 1 ,...n k 을 포함하는 k 유전자 마커가 존재한다. SNP i에서, 3가지 가능한 유전자형 수치를 r i r i , n i r i n i n i 로 표시한다. 위치 i에 존재하는 위험도 대립 형질의 번호에 따르면, 개체의 유전자형 정보는 벡터 (g 1 ,...,g k )[식 중, g i 는 0, 1 또는 2일 수 있음]로 나타낼 수 있다. 이때, 동일한 위치에 있는 동형 접합 비-위험도 대립 형질과 비교한, 위치 i에 존재하는 이종 접합 유전자형의 상대적인 위험도를 λi 1로 표시한다. 다시 말해서

Figure 112009040073333-PCT00020
와 같이 정의한다. 이와 유사하게, r i r i 유전자형의 상대적 위험도를
Figure 112009040073333-PCT00021
와 같이 정의한다. 승법 모델 하에서, 유전자형 (g1,...gk)인 개체의 위험도는
Figure 112009040073333-PCT00022
라고 가정한다. 승법 모델은 환자군-대조군 연구(Case-Control Study)를 촉진하거나, 또는 가시화할 목적으로, 문헌에서 이미 사용되고 있다.In one embodiment, the GCI score is calculated on the assumption that the risk that affects the set of genetic markers is the product of the risks by the individual genetic markers. This means that different genetic markers independently cause other genetic markers to indicate the risk of disease. Officially, there are k gene markers comprising risk alleles r 1 ,... R k , and non-risk alleles n 1 , ... n k . In SNP i , three possible genotype values are represented by r i r i , n i r i and n i n i . According to the number of risk alleles present at position i , the genotype information of the individual can be represented as a vector ( g 1 , ..., g k ), where g i can be 0, 1 or 2 . Here, the relative risk of the heterozygous genotype present at position i, as compared to the homozygous non-risk allele at the same position, is denoted λ i 1 . In other words
Figure 112009040073333-PCT00020
It is defined as Similarly, the relative risk of the r i r i genotype
Figure 112009040073333-PCT00021
It is defined as Under the multiplication model, the risk for individuals of genotype (g 1 , ... g k ) is
Figure 112009040073333-PCT00022
Assume that Multiplicative models have already been used in the literature for the purpose of facilitating or visualizing Case-Control Studies.

상대적 위험도 예측Relative Risk Prediction

다른 구체예에서, 상이한 유전자 마커에 대한 상대적 위험도는 공지되어 있으며, 또한 그러한 위험도를 평가하는데 승법 모델이 사용될 수 있다. 그러나, 연관 관계에 대한 연구를 포함하는 몇몇 구체예에서, 연구 디자인 시에는 상대적 위험도를 보고하지 않는다. 몇몇 환자군-대조군 연구에 있어서, 상대적 위험도는 추가의 가정이 없이도 데이터로부터 직접 계산될 수 없다. 상대적 위험도를 보고하지 않고, 그 대신에 유전자형의 교차비(OR)를 보고하는 것이 관례인데, 이 경우, 상대적 위험도는, 위험도 유전자형(r i r i 또는 n i r i )에 의한 질병을 보유할 확률 대 위험도 유전자형에 의한 질병을 보유하지 않을 확률이다. 공식으로 정리하면,In other embodiments, the relative risks for the different genetic markers are known, and multiplication models can also be used to assess such risks. However, in some embodiments, including studies of associations, no relative risk is reported in the study design. In some patient-control studies, relative risks cannot be calculated directly from the data without further assumptions. It is customary to report the relative risk of genotypes instead of reporting the relative risk, in which case the relative risk is the probability of having the disease by the risk genotype ( r i r i or n i r i ). Large risk is the probability of not having a disease caused by the genotype. In summary,

Figure 112009040073333-PCT00023
Figure 112009040073333-PCT00023

교차비로부터 상대적 위험도를 찾아내는데에는 부가의 가정이 필요할 수 있다. 전체 집단 내 대립 형질의 발현 빈도 즉, a = f nini , b = f niri 및 c = f riri 가 공지 또는 예측된다는 가정[이는 120개의 염색체를 포함하는 현재의 데이터세트 예를 들어, 햅 맵 데이터세트로부터 예측될 수 있음], 및/또는 질병의 유병율 즉, p = p(D)가 공지되어 있다는 가정이 그것이다. 상기 3개의 등식으로부터 다음의 식을 유도할 수 있다: Additional assumptions may be required to find the relative risk from the odds ratio. Assume that the frequency of expression of alleles in the entire population, i.e., a = f nini , b = f niri and c = f riri, is known or predicted (this is a current dataset containing 120 chromosomes, e.g., a Hapmap dataset Can be predicted from, and / or the prevalence of the disease, ie p = p (D), is known. From the three equations above, the following equation can be derived:

Figure 112009040073333-PCT00024
Figure 112009040073333-PCT00024

인수 pP(D/n i n i )로 나눈 후의 상대적 위험도를 정의함으로써, 첫 번째 등식은 다음과 같이 바꾸어 쓸 수 있다:By defining the relative risk after dividing by the factor pP (D / n i n i ), the first equation can be rewritten as:

Figure 112009040073333-PCT00025
Figure 112009040073333-PCT00025

그러므로, 마지막 2개의 등식은 다음과 같이 바꾸어 쓸 수 있다:Therefore, the last two equations can be rewritten as:

Figure 112009040073333-PCT00026
Figure 112009040073333-PCT00026

a가 1일 때(비-위험도 대립 형질의 발현 빈도가 1일 때), 연립 방정식 1은 문헌의 장(Zhang) 및 유(Yu)의 공식과 동등하다[Zhang J and Yu K., What's the relative risk? A method of correcting the odds ratio in cohort studies of common outcomes. JAMA, 280: 1690-1, 1998; 그 자체로서 참고용으로 인용됨]. 장 및 유의 공식과는 대조적으로, 본 발명의 몇몇 구체예에서는, 상대적 위험도에 영향을 미칠 수 있는 집단 내 대립 형질의 발현 빈도를 고려한다. 몇몇 구체예는 상대적 위험도의 상호 의존성을 고려한다. 상대적 위험도 각각을 독립적으로 계산하였을 때와는 대조적이다.When a is 1 (frequency of non-risk alleles is 1), simultaneous equation 1 is equivalent to the formula of Zhang and Yu in the literature [Zhang J and Yu K., What's the relative risk? A method of correcting the odds ratio in cohort studies of common outcomes. JAMA, 280: 1690-1, 1998; Itself as a reference]. In contrast to intestinal and significant formulas, some embodiments of the invention contemplate the frequency of expression of alleles in a population that may affect relative risk. Some embodiments take into account interdependencies of relative risks. This is in contrast to when each of the relative risks is calculated independently.

연립 방정식 1은, 2개의 2차 등식으로 다시 쓸 수 있는데, 이 경우, 가능한 해법은 4개 정도가 있다. 이러한 등식을 푸는 데에는 내림 순 알고리즘이 사용될 수 있는데, 이 경우, 출발점은 교차비 예를 들어, λi 1 = ORi 1 및 λi 2 = ORi 2으로 맞추어 놓는다.The simultaneous equation 1 can be rewritten as two quadratic equations, in which case there are about four possible solutions. A descending algorithm can be used to solve this equation, in which case the starting point is set to an intersection ratio, for example λ i 1 = OR i 1 and λ i 2 = OR i 2 .

예를 들어:E.g:

Figure 112009040073333-PCT00027
Figure 112009040073333-PCT00027

이 등식의 해법을 찾는 것은 함수 g(λ12)=f112)2 + f212)2의 최소값을 찾는 것과 동등하다.Finding a solution to this equation is equivalent to finding the minimum of the function g (λ 1 , λ 2 ) = f 11 , λ 2 ) 2 + f 21 , λ 2 ) 2 .

그러므로,therefore,

Figure 112009040073333-PCT00028
Figure 112009040073333-PCT00028

이 예에서, x0는 OR1으로, y0는 OR2로 설정해 놓고 풀이를 시작한다. 본 발명자는 수치 [엡실론] = 10-10을 알고리즘을 통한 허용 오차 상수로 설정할 것이다. 반복 기호를, 본 발명자는

Figure 112009040073333-PCT00029
In this example, set x 0 to OR 1 and y 0 to OR 2 to start solving. We will set the numerical value [epsilon] = 10 -10 as the tolerance constant through the algorithm. Repeat symbol, we
Figure 112009040073333-PCT00029

로 정의한다. 이후, 본 발명자는 Defined as Since then, the inventor

Figure 112009040073333-PCT00030
Figure 112009040073333-PCT00030

Figure 112009040073333-PCT00031
Figure 112009040073333-PCT00031

을 설정한다.Set.

"g(xi yi) < 허용 오차"가 될 때까지 상기 과정들을 반복하는데, 이 경우, 허용 오차는 공급 코드 중 10-7로 설정한다. The above steps are repeated until "g (x i y i ) <tolerance", in which case the tolerance is set to 10 -7 of the supply codes.

이와 같은 예에서, 상기 등식들은 a, b, c, p, OR1 및 OR2의 상이한 수치에 대한 올바른 해법을 제시해준다(도 10). In this example, the above equations provide the correct solution for the different values of a, b, c, p, OR 1 and OR 2 (FIG. 10).

상대적 위험도 예측치의 확정성Confirmation of relative risk estimates

몇몇 구체예에서, 상대적 위험도의 예측치에 대한 상이한 매개 변수(유병율, 대립 형질 발현 빈도 및 교차비 오차)의 효과를 측정한다. 대립 형질 발현 빈도와 예측 유병율이 상대적 위험도 수치에 미치는 영향을 측정하기 위해, 상이한 교차비와 상이한 대립 형질 발현 빈도 수치 세트로부터 유래하는 상대적 위험도를 계산하고(HWE 하), 이와 같은 계산 결과를 유병율 수치에 대해 그래프로 작성한다(범위 = 0∼1)(도 10). 뿐만 아니라, 유병율의 고정 수치에 대해서, 결과로 얻어진 상대적 위험도는 위험도-대립 형질 발현 빈도 함수 그래프로 작성될 수 있다(도 11). p = 0, λ1 = OR1 및 λ2 = OR2, 그리고 p = 1, λ1 = λ2 = 0인 경우. 이는 상기 등식으로부터 직접 계산될 수 있다. 뿐만 아니라, 몇몇 구체예에서, 위험도 대립 형질 발현 빈도가 높으면, λ1은 선형 함수에 근접하게 되고, λ2는 제2의 유계 미분계수에 따른 오목 함수(concave function)에 근접하게 된다. 제한적으로, c가 1일 경우, λ2 = OR2 + p(1-OR2)이고,

Figure 112009040073333-PCT00032
이다. 만일
Figure 112009040073333-PCT00033
이면, λi는 역시 선형 함수에 근접하게 된다. 위험도-대립 형질의 발현 반도가 낮으면, λ1 및 λ2는 함수 1/p의 거동에 근접할 것이다. 제한적으로, c가 0일 경우,
Figure 112009040073333-PCT00034
이다. 이는 곧, 위험도-대립 형질 발현 반도가 높아지면, 유병율의 부정확한 예측치는 결과로 얻어진 상대적 위험도에 거의 영향을 미치지 않을 것이라는 것을 나타낸다. 또한, 위험도-대립 형질 발현 빈도가 낮은 경우, 만일 유병율 수치 p'αp이면, 이는 정확한 유병율 p에 대해 치환되고, 이후, 결과로 얻어진 상대적 위험도는 거의 팩터 1/α만큼 떨어질 것이다. 이는 도 11의 섹션 (c)와 섹션 (d)에서 살펴볼 수 있다. 고 위험도-대립 형질 발현 반도에 있어서, 2개의 그래프는 거의 같은 반면, 낮은 대립 형질 발현 빈도에 대한 상대적 위험도 수치의 차이에 있어서 편차는 더욱 심해지며, 이때의 편차는 팩터 2 미만이다.In some embodiments, the effect of different parameters (prevalence, allele frequency and odds ratio error) on the prediction of relative risk is measured. To determine the effect of allele frequency and predicted prevalence on relative risk values, the relative risks derived from different sets of crossover ratios and different allele frequency values are calculated (under HWE), and the results of these calculations are calculated on the prevalence values. Graph is plotted (range = 0 to 1) (Fig. 10). In addition, for fixed values of prevalence, the resulting relative risk can be plotted as a risk-allele frequency function graph (FIG. 11). p = 0, λ 1 = OR 1 and λ 2 = OR 2 , and p = 1, λ 1 = λ 2 = 0. This can be calculated directly from the equation above. In addition, in some embodiments, when the risk allele frequency is high, λ 1 approaches the linear function and λ 2 approaches the concave function according to the second derivative. Restriction, when c is 1, λ 2 = OR 2 + p (1-OR 2 ),
Figure 112009040073333-PCT00032
to be. if
Figure 112009040073333-PCT00033
Λ i is also close to the linear function. If the expression half-risk of the risk-allele is low, λ 1 and λ 2 will approximate the behavior of function 1 / p . If c is zero,
Figure 112009040073333-PCT00034
to be. This, in turn, indicates that as the risk-allele expression peninsula increases, an inaccurate estimate of prevalence will have little impact on the resulting relative risk. Also, if the risk-allele frequency is low, if the prevalence value p ' is αp , it will be substituted for the correct prevalence p, and the resulting relative risk will then drop by approximately factor 1 / α. This can be seen in sections (c) and (d) of FIG. 11. For the high risk-allergic peninsula, the two graphs are nearly identical, while the deviation becomes more severe in the difference in relative risk values for low allele frequency, with the deviation being less than factor 2.

GI 스코어의 계산Calculation of the GI Score

하나의 구체예에서, 유전자 종합 지수는 관련 집단을 나타내는 기준 세트(reference set)를 사용하여 계산된다. 이 기준 세트는 햅 맵 내 집단들 중 하나 또는 기타 유전자형 데이터세트일 수 있다. In one embodiment, the gene synthesis index is calculated using a reference set representing the population of interest. This set of criteria can be one of the populations in the hap map or other genotype dataset.

이 구체예에서, 상기 GCI는 다음과 같이 계산된다. k 위험도 위치 각각에 있어서, 상대적 위험도는 연립 방정식 1을 이용하여 교차비로부터 계산된다. 이후, 기준 세트 내 각각의 개체에 대한 승법 스코어를 계산한다. 승법 스코어 s인 개체의 GCI는 기준 데이터세트 내 모든 개체가 차지하는 비율이다(이 경우, s' ≤ s임). 예를 들어, 만일 기준 세트 내 개체의 50%의 승법 스코어가 s보다 작으면, 개체의 최종 GCI 스코어는 0.5일 것이다.In this embodiment, the GCI is calculated as follows. For each of the k risk locations, the relative risk is calculated from the odds ratio using simultaneous equation 1. The multiplication score is then calculated for each individual in the reference set. The GCI of an individual with a multiplier score s is the proportion of all individuals in the reference dataset (in this case s' ≦ s). For example, if the multiplicative score of 50% of the subjects in the reference set is less than s, the final GCI score of the subject will be 0.5.

기타 모델Other models

하나의 구체예에서, 승법 모델이 사용된다. 대안적인 구체예에서, 기타 모델이 GCI 스코어를 측정하기 위하여 사용될 수 있다. 기타 적당한 모델로서는 다음과 같은 것들을 포함하나, 이에 한정되는 것은 아니다:In one embodiment, a multiplication model is used. In alternative embodiments, other models can be used to measure the GCI score. Other suitable models include, but are not limited to:

가법 모델(Additive Model): 가법 모델 하에서, 유전자형(g1,...gk)인 개체의 위험도는

Figure 112009040073333-PCT00035
인 것으로 가정할 수 있다. Additive Model: Under the additive model, the risk of individuals of genotype (g 1 , ... g k ) is
Figure 112009040073333-PCT00035
Can be assumed to be.

일반화된 가법 모델(Generalized Additive Model): 일반화된 가법 모델 하에서, 함수 f가 존재하며, 이 경우, 유전자형(g1,...gk)인 개체의 위험도는

Figure 112009040073333-PCT00036
인 것으로 가정할 수 있다. Generalized Additive Model: Under the generalized additive model, there exists a function f, in which the risk of an individual with a genotype (g 1 , ..., g k )
Figure 112009040073333-PCT00036
Can be assumed to be.

하버드 수정 스코어(Harvard Modified Score)(Het): 이 스코어는 G.A 콜디츠(Colditz)외 다수로부터 얻어지는데, 이는 유전자 마커에 적용되는 스코어이다[Harvard report on cancer prevention volume 4: Harvard cancer risk index. Cancer Causes and Controls, 11 :477-488, 2000; 본원에 그 자체로서 참고용으로 인용됨]. 비록 함수 f는 상대적 위험도 대신 교차비 수치에 따라서 운용되지만, 상기 Het 스코어는 근본적으로 일반화된 가법 스코어이다. 이는 상대적 위험도를 예측하기 어려울 경우에 유용할 수 있다. 함수 f를 정의하기 위하여, 중간 함수 g는 다음과 같이 정의된다: Harvard Modified Score (Het): This score is obtained from GA Colditz et al., Which is a score applied to genetic markers [Harvard report on cancer prevention volume 4: Harvard cancer risk index. Cancer Causes and Controls, 11: 477-488, 2000; Hereby incorporated by reference in its entirety]. Although the function f is operated according to the odds ratio value instead of the relative risk, the Het score is essentially a generalized additive score. This can be useful when it is difficult to predict relative risk. To define a function f, the intermediate function g is defined as follows:

Figure 112009040073333-PCT00037
Figure 112009040073333-PCT00037

그 다음,

Figure 112009040073333-PCT00038
을 계산하는데, 여기서 pi het는 기준 집단에 널리 퍼져 존재하는 SNPi 중 이형 접합 개체의 발현 빈도이다. 이후, 함수 f를 f(x) = g(x)/het로 정의하고, 하버드 수정 스코어(Het)는 간단하게
Figure 112009040073333-PCT00039
으로 정의한다.next,
Figure 112009040073333-PCT00038
Where p i het is the frequency of expression of heterozygous individuals in SNPi that are prevalent in the reference population. Then, we define the function f as f (x) = g (x) / het, and the Harvard correction score (Het) is simply
Figure 112009040073333-PCT00039
It is defined as

하버드 수정 스코어(Hom): 이 스코어는 Het 스코어와 유사한데, 다만, het 수치 대신 수치

Figure 112009040073333-PCT00040
[식중, pi hom은 동형 접합 위험도-대립 형질을 가지는 개체의 발현 빈도임]를 대입한다. Harvard Correction Score (Hom): This score is similar to the Het score, except that
Figure 112009040073333-PCT00040
Wherein p i hom is the frequency of expression of individuals with homozygous risk-alleles.

최대 교차비(Maximum-Odds Ratio): 이 모델에서, 유전자 마커 중 하나(최대 교차비를 가지는 유전자 마커)는 전체 패널의 통합 위험도와 관련된 최소 값인 것으로 가정한다. 이를 공식으로 나타내면, 유전자형(g1,...gk)인 개체의 스코어는

Figure 112009040073333-PCT00041
이다. Maximum-Odds Ratio: In this model, one of the genetic markers (gene markers with the maximum cross ratio) is assumed to be the minimum value associated with the overall panel integration risk. Expressed as a formula, the scores of individuals with genotypes (g 1 , ... g k ) are
Figure 112009040073333-PCT00041
to be.

스코어 간 비교Comparison between scores

하나의 예에서, GCI 스코어는 햅 맵 CEU 집단에 널리 퍼져있는 다중 모델을 기초로 하여 계산하였는데, 이 경우 10개의 SNP는 T2D와 연관되어 있다. 관련 SNP는 rs7754840, rs4506565, rs7756992, rs1O811661, rs12804210, rs8050136, ra11 11875, rs4402960, rs5215, rs1801282이다. 이와 같은 SNP 각각에 대해서, 있을 수 있는 유전자형에 대한 교차비가 문헌에 보고되어 있다. 상기 CEU 집단은 30가지의 모-부-자(mother-father-child) 트리오로 이루어져 있다. 이 집단에 속하는 부모 중 60명이 함수 종속(dependency)을 피하기 위하여 사용되었다. 10개의 SNP 중 어느 하나가 노-콜(no-call)인 개체 중 한 명은 배제하였으며, 그 결과, 59명의 개체로 이루어진 세트가 얻어졌다. 각각의 개체에 대한 GCI 순위는 몇몇 상이한 모델을 이용하여 계산하였다.In one example, the GCI score was calculated based on multiple models that are prevalent in the Hapmap CEU population, in which 10 SNPs are associated with T2D. Related SNPs are rs7754840, rs4506565, rs7756992, rs10811661, rs12804210, rs8050136, ra11 11875, rs4402960, rs5215, rs1801282. For each of these SNPs, crossover ratios for possible genotypes have been reported in the literature. The CEU population consists of 30 mother-father-child trios. Sixty of the parents in this group were used to avoid function dependencies. One of the 10 SNPs was no-call and one of the individuals was excluded, resulting in a set of 59 individuals. GCI rank for each individual was calculated using several different models.

이와 같은 데이터세트에 있어서, 상이한 모델은 상관관계가 매우 큰 결과를 도출해 낸다(도 12 및 도 13). 스피어맨 상관관계는 모델의 각 쌍들을 대상으로 계산하였으며(표 2), 이로써, 승법 모델 및 가법 모델의 상관관계 계수는 0.97이었음을 알 수 있었으므로, 상기 GCI 스코어는 가법 모델 또는 승법 모델 중 어느 하나를 이용할 경우 확정될 것이었다. 이와 유사하게, 하버드 수정 스코어와 승법 모델 사이의 상관관계는 0.83이었으며, 하버드 스코어와 가법 모델 사이의 상관관계 계수는 0.7이었다. 그러나, 최대 교차비를 유전자 스코어로 사용하면, 하나의 SNP로 한정된 2분 스코어가 얻어졌다. 전제적으로, 이와 같은 결과들을 통하여, 스코어 순위가 모델 의존도를 최소화한 확정 구조를 제공한다는 것을 알 수 있다. For such datasets, different models yield highly correlated results (FIGS. 12 and 13). The spearman correlation was calculated for each pair of models (Table 2), whereby the correlation coefficient of the multiplicative model and additive model was 0.97, so the GCI score was either additive or multiplicative model. The use of one would be confirmed. Similarly, the correlation between the Harvard Correction Score and the Multiplication Model was 0.83, and the correlation coefficient between the Harvard Score and the additive model was 0.7. However, using the maximum crossover ratio as the gene score, a two minute score limited to one SNP was obtained. Presumably, it can be seen from these results that the score ranking provides a deterministic structure with minimal model dependence.

표 2: 모델 쌍 사이의 CEU 데이터 상 스코어 분포도에 대한 스피어맨 상관관계Table 2: Spearman Correlation for Score Distribution on CEU Data Between Model Pairs

승법Multiplication 가법Additive Harv-HetHarv-het Harv-HomHarv-hom MAX ORMAX OR 승법Multiplication 1One 0.970.97 0.830.83 0.830.83 0.420.42 가법Additive 0.970.97 1One 0.70.7 0.70.7 0.60.6 Harv-HetHarv-het 0.830.83 0.70.7 1One 1One 00 Harv-HomHarv-hom 0.830.83 0.70.7 1One 1One 00 MAX ORMAX OR 0.420.42 0.60.6 00 00 1One

T2D의 유병율이 변함에 따라서, 그러한 변화가 분포에 미치는 효과를 측정하였다. 0.001∼0.512 사이의 유병율 수치는 가변적이었다(도 14). T2D의 경우, 유병율 수치가 상이함으로 인하여 개체의 순서는 동일하다는 것을 알 수 있었으며(스피어맨 상관성 > 0.99), 그 결과, 인위적으로 고정한 유병율 수치를 0.01로 가정할 수 있었다.As the prevalence of T2D changed, the effect of that change on the distribution was measured. The prevalence value between 0.001 and 0.512 was variable (FIG. 14). In the case of T2D, it was found that the order of the individuals was the same due to the different prevalence values (Spearman correlation> 0.99). As a result, an artificially fixed prevalence value of 0.01 could be assumed.

임의의 수의 변수로의 모델 확장Extend the model to any number of variables

다른 구체예에서, 모델은 임의의 수의 변수가 적용될 수 있는 상황으로 확대될 수 있다. 앞서 기재한 고려 사항들은 생성될 수 있는 변수 3가지(nn, nr, rr)가 존재할 경우를 다루었다. 일반적으로, 다중 SNP 연관 관계가 공지될 때, 임의의 수의 변수가 집단 내에서 발견될 수 있다. 예를 들어, 2개의 유전자 마커들 사이의 상호 작용이 어떤 병태와 연관되어 있을 때, 9가지의 변수가 존재할 수 있다. 이로써, 8 가지의 상이한 교차비 수치가 얻어진다.In other embodiments, the model can be extended to situations in which any number of variables can be applied. The above considerations deal with the case where there are three variables (nn, nr, rr) that can be created. In general, when multiple SNP associations are known, any number of variables can be found within a population. For example, nine variables may exist when the interaction between two genetic markers is associated with a condition. This results in eight different ratios of cross ratios.

초기 공식을 일반화하기 위하여, k + 1개의 변수가 존재할 수 있으며(a0,...ak), 이 경우, 발현 빈도는 f0, f1,...fk이고, 측정된 교차비는 1, OR1,...,ORk이며, 미지의 상대적 위험도 수치는 1, λ1,...,λk임을 가정할 수 있다. 뿐만 아니라, 모든 상대적 위험도와 교차비는 a0와 관련하여 측정되므로,

Figure 112009040073333-PCT00042
이고,
Figure 112009040073333-PCT00043
이다: To generalize the initial formula, there may be k + 1 variables (a 0 , ... a k ), in which case the expression frequency is f 0 , f 1 , ... f k , and the measured crossover ratio is It can be assumed that 1, OR 1 , ..., OR k , and that the unknown relative risk values are 1, λ 1 , ..., λ k . In addition, all relative risks and crossover ratios are measured in relation to a 0 ,
Figure 112009040073333-PCT00042
ego,
Figure 112009040073333-PCT00043
to be:

이는

Figure 112009040073333-PCT00044
를 기초로 함.this is
Figure 112009040073333-PCT00044
Based on.

ORi는 다음의 식으로 측정된다:OR i is measured by the equation:

Figure 112009040073333-PCT00045
Figure 112009040073333-PCT00045

뿐만 아니라, 만일

Figure 112009040073333-PCT00046
이면, 그 결과는 다음의 등식에 의해 얻어진다:As well as
Figure 112009040073333-PCT00046
If so, the result is obtained by the following equation:

Figure 112009040073333-PCT00047
Figure 112009040073333-PCT00047

그러므로, therefore,

Figure 112009040073333-PCT00048
Figure 112009040073333-PCT00048

또는 or

Figure 112009040073333-PCT00049
Figure 112009040073333-PCT00049

이다.to be.

후자의 등식은 하나의 변수(C)를 포함하는 등식이다. 이 등식은 다수의 상이한 해법을 도출해 낼 수 있다(근본적으로, k + 1 가지 이하의 상이한 해법). 표준 최적화 도구 예를 들어,

Figure 112009040073333-PCT00050
에 가장 근접한 해법을 찾기 위해서는 내림 차순이 적용될 수 있다. The latter equation is an equation involving one variable (C). This equation can lead to a number of different solutions (essentially up to k + 1 different solutions). Standard optimizer, for example
Figure 112009040073333-PCT00050
Descending order can be applied to find the solution closest to.

본 발명은 위험도 인자를 정량하기 위한 확정 스코어링 구조를 이용한다. 상이한 유전자 모델이 상이한 스코어를 나타낼 수 있는 것처럼, 이로부터 얻어진 결과들은 일반적으로 상관되어 있다. 그러므로, 위험도 인자의 정량은 일반적으로 사용 모델에 의존하지 않는다. The present invention utilizes a definite scoring structure to quantify risk factors. As different genetic models can exhibit different scores, the results obtained therefrom are generally correlated. Therefore, the quantification of risk factors generally does not depend on the usage model.

상대적 위험도 환자군-대조군 연구 결과의 예측Prediction of Relative Risk Patient-Control Study

환자군-대조군 연구 중 다수의 대립 형질들에 관한 교차비에서 얻어진 상대적 위험도를 예측하는 방법도 본 발명에 의해 제공된다. 상기 연구 방법들과는 대조적으로, 본 방법은 대립 형질의 발현 빈도, 질병의 유병율, 그리고 상이한 대립 형질의 상대적 위험도 사이의 의존도를 고려하는 것이다. 모의 환자군-대조군 연구 방법을 수행한 결과를 측정한 결과, 매우 정확하다는 사실을 알 수 있었다.Also provided by the present invention are methods for predicting the relative risk obtained from the odds ratios for a number of alleles in a patient-control study. In contrast to the above research methods, the method considers the dependence between the frequency of allele expression, the prevalence of the disease, and the relative risk of different alleles. The results of the simulated patient-control study were found to be very accurate.

방법Way

특이적 SNP가 질병 D와 연관되어 있는지에 대해 테스트하는 경우, R과 N은 이와 같은 특정 SNP의 위험도 대립 형질 및 비-위험도 대립 형질을 나타낸다. P(RR/D), P(RN/D) 및 P(NN/D)는 질병에 의해 영향받게 되는 확률을 나타내는 것으로서, 이 경우, 개체는 위험도 대립 형질에 대해 동형 접합성이고, 비-위험도 대립 형질에 대해서는 각각 이종 접합성 또는 동형 접합성이다. fRR, fRN 및 fNN은 집단 내 3개의 유전자형의 발현 빈도를 나타내는데 사용된다. 이와 같은 정의를 이용하여, 상대적 위험도를 다음과 같이 정의한다:When testing whether a specific SNP is associated with disease D, R and N represent the risk alleles and non-risk alleles of this particular SNP. P (RR / D), P (RN / D) and P (NN / D) represent the likelihood of being affected by a disease. In this case, individuals are homozygous for risk alleles, For traits they are heterozygous or homozygous, respectively. f RR , f RN and f NN are used to indicate the frequency of expression of the three genotypes in the population. Using this definition, the relative risk is defined as:

Figure 112009040073333-PCT00051
Figure 112009040073333-PCT00051

환자군-대조군 연구법에 있어서, 수치 P(RR/D), P(RR/~D) 즉, 환자군과 대조군 사이 RR의 발현 빈도, 그리고 P(RN/D), P(RN/~D), P(NN/D) 그리고 P(NN/~D) 즉, 환자군과 대조군 사이 RN과 NN의 발현 빈도가 예측될 수 있다. 상대적 위험도를 예측하기 위하여, 다음과 같은 베이즈 법칙(Bayes law)이 이용될 수 있다:In the patient-control study, the values P (RR / D), P (RR / ~ D), ie the frequency of expression of RR between the patient group and the control group, and P (RN / D), P (RN / ~ D), P (NN / D) and P (NN / ~ D), ie the frequency of expression of RN and NN between patient and control group can be predicted. To predict relative risk, the following Bayes law can be used:

Figure 112009040073333-PCT00052
Figure 112009040073333-PCT00052

그러므로, 만일 유전자형의 발현 빈도가 공지된다면, 상대적 위험도를 계산하는데 이 발현 빈도를 이용할 수 있다. 집단 내 유전자형의 발현 빈도는 환자군-대조군 연구 자체로부터 계산될 수는 없는데, 그 이유는, 이 발현 빈도가 집단 내 질병 유병율에 의존적이기 때문이다. 특히, 질병의 유병율이 p(D)이면, 다음과 같은 함수가 성립된다:Therefore, if the frequency of expression of genotypes is known, this expression frequency can be used to calculate the relative risk. The frequency of expression of the genotypes in a population cannot be calculated from the patient-control study itself, since this frequency of expression is dependent on disease prevalence in the population. In particular, if the prevalence of the disease is p (D), the following function is established:

Figure 112009040073333-PCT00053
Figure 112009040073333-PCT00053

p(D)가 충분히 작을 때, 유전자형의 발현 빈도는 대조군 내 유전자형의 발현 빈도에 의해 어림잡을 수 있으나, 유병율이 높을 때에는 예측치가 정확하지 않을 것이다. 그러나, 만일 기준 데이터세트(예를 들어, 햅 맵[사이트])가 주어진다면, 기준 데이터세트를 기준으로 유전자형의 발현 빈도를 예측할 수 있다. When p (D) is sufficiently small, the frequency of expression of the genotypes can be approximated by the frequency of expression of the genotypes in the control group, but the predictions will not be accurate when the prevalence is high. However, if a reference dataset (eg, a hap map [site]) is given, one can predict the frequency of genotype expression based on the reference dataset.

가장 최근의 연구에서는 상대적 위험도를 예측하는데 기준 데이터세트를 사용하지 않으며, 교차비만이 주어진다. 교차비는 다음과 같이 정의될 수 있다:Most recent studies do not use reference datasets to predict relative risks, and only crossover ratios are given. The odds ratio can be defined as:

Figure 112009040073333-PCT00054
Figure 112009040073333-PCT00054

일반적으로 집단 내 대립 형질의 발현 빈도를 예측할 필요는 없으므로, 통상적으로는 교차비가 유리하며; 상기 교차비를 계산하는데 필요한 것은 환자군 및 대조군 내 유전자형의 발현 빈도이다.Generally it is not necessary to predict the frequency of expression of alleles in a population, so the odds ratio is usually advantageous; What is needed to calculate this crossover ratio is the frequency of expression of the genotypes in the patient and control groups.

몇몇 경우에 있어서, 유전자형 데이터 자체는 유용하지 않지만, 요약 데이터 예를 들어, 교차비는 유용하다. 메타-분석법이 사전 환자군-대조군 연구로부터 얻어진 결과를 기초로 수행되는 경우가 그러한 경우이다. 이 경우, 교차비로부터 상대적 위험도를 찾아내는 방법이 입증된다. 이때, 다음과 같은 등식이 사용된다:In some cases, genotyping data itself is not useful, but summary data such as odds ratios are useful. Such is the case when the meta-analysis is performed based on results obtained from prior patient-control studies. In this case, the method of finding the relative risk from the odds ratio is demonstrated. The following equation is used:

p(D) = fRRP(D/RR) + fRNP(D/RN) + fNNP(D/NN)p (D) = f RR P (D / RR) + f RN P (D / RN) + f NN P (D / NN)

만일 이와 같은 등식을 P(D/NN)으로 나누면, 다음과 같이 된다:If we divide this equation by P (D / NN), we get:

Figure 112009040073333-PCT00055
Figure 112009040073333-PCT00055

이로써, 교차비를 다음과 같은 방식으로 기재할 수 있다:Thus, the ratio of ratios can be described in the following way:

Figure 112009040073333-PCT00056
Figure 112009040073333-PCT00056

유사한 계산 방법에 따라서, 다음의 연립 방정식을 구할 수 있다. According to a similar calculation method, the following simultaneous equations can be obtained.

Figure 112009040073333-PCT00057
Figure 112009040073333-PCT00057

만일 교차비, 집단 내 유전자형의 발현 빈도, 그리고 질병 유병율이 공지되면, 상대적 위험도는 이와 같은 연립 방정식을 풀이함으로써 구할 수 있다. If the odds ratio, frequency of genotype expression in the population, and disease prevalence are known, the relative risk can be obtained by solving this system of equations.

인수 분해 방식이 2가지 존재하므로, 최대 4가지의 해법이 있을 수 있다. 그 러나, 이하에 나타낸 바와 같이, 이 등식에 대해서는 통상적으로 하나의 가능한 해법이 존재한다. Since there are two factorization methods, there can be up to four solutions. However, as shown below, there is usually one possible solution to this equation.

fNN이 1일 때, 연립 방정식 1은 장(Zhang)과 유(Yu)의 공식과 동등하지만; 집단 내 대립 형질의 발현 빈도가 고려된다. 뿐만 아니라, 본 발명의 방법에서는 2개의 상대적 위험도가 서로 의존적이라는 사실을 고려하고 있으며, 반면에 이전의 방법에서는 각각의 상대적 위험도를 독립적으로 계산할 것을 제안하고 있다.when f NN is 1, simultaneous equation 1 is equivalent to the formula of Zhang and Yu; The frequency of expression of alleles in the population is considered. In addition, the method of the present invention takes into account the fact that the two relative risks are dependent on each other, while the previous method proposes to calculate each of the relative risks independently.

다중-대립 형질 위치에 대한 상대적 위험도:Relative risk for multi-allele location:

만일 다중 마커 또는 기타 다중 대립 형질 변이체를 고려하면, 계산 방법은 약간 복잡해진다. a0, a1,...ak는 존재할 수 있는 k + 1개의 대립 형질로서 표시되는데, 이 경우, a0는 비-위험도 대립 형질이다. 집단 내 존재할 수 있는 k + 1개의 대립 형질에 대한 대립 형질 발현 빈도인 f0, f1, f2,...,fk를 가정한다. 대립 형질 i에 있어서, 상대적 위험도와 교차비는 다음과 같이 정의된다:If multiple markers or other multiple allelic variants are considered, the calculation method is a bit complicated. a 0 , a 1 , ... a k are denoted as k + 1 alleles that may be present, in which case a 0 is a non-risk allele. Assume f 0 , f 1 , f 2 , ..., f k , the allele expression frequencies for k + 1 alleles that may exist in the population. For allele i, the relative risk and crossover ratio are defined as follows:

Figure 112009040073333-PCT00058
Figure 112009040073333-PCT00058

다음의 등식에서는 질병 유병율을 나타낸다:The following equations indicate disease prevalence:

Figure 112009040073333-PCT00059
Figure 112009040073333-PCT00059

그러므로, 상기 등식의 양쪽 변을 p(D/a0)로 나누면 다음과 같은 식이 얻어진다:Therefore, dividing both sides of the equation by p (D / a 0 ) yields the following equation:

Figure 112009040073333-PCT00060
Figure 112009040073333-PCT00060

그 결과

Figure 112009040073333-PCT00061
이 구하여진다.As a result
Figure 112009040073333-PCT00061
Is obtained.

Figure 112009040073333-PCT00062
로 놓았을 때,
Figure 112009040073333-PCT00063
가 구하여진다. 그러므로, C에 관한 정의에 의하면 다음과 같은 식이 구하여진다:
Figure 112009040073333-PCT00062
When set to
Figure 112009040073333-PCT00063
Is obtained. Therefore, the definition of C gives the following equation:

Figure 112009040073333-PCT00064
Figure 112009040073333-PCT00064

상기 식은 하나의 변수 C를 가지는 다항식이다. 일단 C가 결정되면, 상대적 위험도가 결정된다. 상기 다항식은 (k + 1) 차식이므로, 거의 k + 1개의 답이 얻어질 것으로 예상된다. 그러나, 상기 등식의 우변은 C에 관한 함수일 경우 그 차수가 감소하게 되므로, 이 경우의 등식에 대해서는 통상적으로 답이 하나만 존재할 수 있다. 이 경우, 해답은 C = 1과

Figure 112009040073333-PCT00065
에 의해 결정되므로, 답은 이진 탐색법(binary search)을 이용하여 구하는 것이 용이하다. The equation is a polynomial with one variable C. Once C is determined, the relative risk is determined. Since the polynomial is (k + 1), it is expected that almost k + 1 answers will be obtained. However, since the right side of the equation is a function of C, the order of the equation decreases. Therefore, in this case, only one answer may exist. In this case, the answer is C = 1
Figure 112009040073333-PCT00065
As determined by, the answer is easy to find using binary search.

상대적 위험도 예측치의 확정성Confirmation of relative risk estimates

상이한 매개 변수들(유병율, 대립 형질 발현 빈도, 그리고 교차비 오차) 각각이 상대적 위험도에 대한 예측치에 미치는 영향력 측정하였다. 대립 형질의 발현 빈도와 예측 유병율이 상대적 위험도 수치에 비치는 영향력을 측정하기 위하여, 상대적 위험도를, 상이한 교차비 수치, 상이한 대립 형질의 발현 빈도(HWE 하) 세트로부터 계산한 후, 유병율 수치(0∼1)에 대해 계산한 결과로 그래프를 작성하였다. The effect of each of the different parameters (prevalence, allele frequency, and crossover error) on the prediction of relative risk was measured. In order to determine the influence of allele expression frequency and predicted prevalence on relative risk values, the relative risk is calculated from a set of different cross ratio values, different allele expression frequencies (under HWE), and then the prevalence values (0 to 1). The graph was created as a result of the calculation.

뿐만 아니라, 유병율의 확정 수치에 있어서, 결과로 얻어진 상대적 위험도를 이용하여 위험도-대립 형질 발현 빈도의 함수 그래프를 작성하였다. 명확히 말하자면, 모든 경우에 있어서, p(D) = 0이면, λRR = ORRR, 그리고 λRN = ORRN이고, p(D) = 1이면, λRR = λRN = 0이다. 이는 등식 1로부터 직접 계산될 수 있다. 뿐만 아니라, 위험도 대립 형질 발현 빈도가 높으면, λRR은 선형 거동에 근접하게 되며, λRN은 제2의 유계 미분 계수를 가지는 오목 함수에 근접하게 된다. 위험도-대립 형질 발현 빈도가 낮으면, λRR 및 λRN은 함수 1/p(D)의 거동에 근접하게 된다. 이는 곧, 고 위험도-대립 형질 발현 빈도에 있어서, 유병율 예측치가 잘못될 경우에는 결과로 얻어지는 상대적 위험도에 거의 영향을 미치지 않을 것임을 의미한다. In addition, a function graph of the risk-allele expression frequency was prepared using the resulting relative risk in the established value of the prevalence. To be clear, in all cases, if p (D) = 0, then λ RR = OR RR and λ RN = OR RN , and if p (D) = 1, then λ RR = λ RN = 0. This can be calculated directly from equation 1. In addition, if the frequency of risk allele expression is high, λ RR is close to linear behavior, and λ RN is close to a concave function with a second oil derivative. If the risk-allele frequency is low, λ RR and λ RN are close to the behavior of function 1 / p (D). This means that in the high risk-allele frequency, mispredictions of prevalence will have little impact on the resulting relative risk.

이하 실시예에서는 본 발명을 예시 및 설명하고 있다. 본 발명의 범위는 이와 같은 실시예에 의해 제한되지 않는다. The following examples illustrate and illustrate the invention. The scope of the invention is not limited by this embodiment.

실시예 IExample I

SNP 프로필의 형성 및 분석Formation and Analysis of SNP Profiles

분석 대상을 예를 들어, DNA 제노텍(DNA Genotek)에서 시판중인 키트 내의 시료 튜브에 넣었는데, 이때, 상기 대상은 게놈 DNA가 추출될 타액 시료(약 4㎖)를 담고 있다. 상기 타액 시료를 CLIA 인증 실험실에 보내어 처리 및 분석을 수행한다. 통상적으로 이 시료는 수집 키트 내 대상에 편리하게 제공되는 운송 콘테이너 내에 담아져서 우편으로 밤새도록 시설로 운반된다.The analyte was placed, for example, in a sample tube in a kit commercially available from DNA Genotek, which contained a saliva sample (about 4 mL) from which genomic DNA was to be extracted. The saliva sample is sent to a CLIA certified laboratory for processing and analysis. Typically, the samples are transported overnight to the facility by mail in a shipping container conveniently provided to the subject in the collection kit.

바람직한 구체예에서, 게놈 DNA는 타액으로부터 분리된다. 예를 들어, 개체는 DNA 자체 수집 키트 기술(DNA 제노텍)을 이용하여 약 4㎖의 타액 표본을 임상 처리용으로 수집한다. 이 시료를 적당한 실험실에 보내어 처리하고, 통상적으로, 수집 키트 공급 업체에 의해 공급된 시약을 사용하여 50℃에서 1 시간 이상 동안, 열 변성 및 단백질 분해 효소로 분해하여 DNA를 분리한다. 그 다음, 상기 시료를 원심 분리하고, 상청액을 에탄올로 침전시킨다. DNA 펠릿을 후속 분석에 적당한 완충액 중에 현탁한다. In a preferred embodiment, the genomic DNA is isolated from saliva. For example, an individual collects about 4 ml of saliva samples for clinical processing using DNA self-collection kit technology (DNA Genotech). This sample is sent to a suitable laboratory for processing and is typically digested with thermal denaturation and proteolytic enzymes at 50 ° C. for at least 1 hour using reagents supplied by a collection kit supplier to separate DNA. The sample is then centrifuged and the supernatant is precipitated with ethanol. DNA pellets are suspended in a buffer suitable for subsequent analysis.

널리 공지된 방법 및/또는 수집 키트 제조자가 제안하는 방법에 따라서, 개체의 게놈 DNA를 타액 시료로부터 분리한다. 일반적으로, 상기 시료를 우선 열로 변성시키고 단백질 분해 효소로 분해한다. 그 다음, 상기 시료를 원심 분리하고, 상청액을 모아둔다. 이후, 상청액을 에탄올로 침전시켜, 약 5∼16ng의 게놈 DNA를 함유하는 펠릿을 얻는다. 상기 DNA 펠릿을 10mM의 Tris pH 7.6 및 1mM EDTA(TE) 중에 현탁시킨다. 게놈 DNA를, 어레이 제조자에 의해 제공되는 기구 및 설명서에 따 라, 시판중인 고 밀도 SNP 어레이 예를 들어, 어피메트릭스 또는 일루미나에서 시판되는 어레이에 혼성화하여, SNP 프로필을 형성한다. 개체의 SNP 프로필을 보안 데이터베이스 또는 볼트(vault)에 저장한다.According to well known methods and / or methods suggested by the collection kit manufacturer, the genomic DNA of an individual is isolated from saliva samples. Generally, the sample is first denatured by heat and digested with proteolytic enzymes. The sample is then centrifuged and the supernatant collected. The supernatant is then precipitated with ethanol to obtain pellets containing about 5-16 ng of genomic DNA. The DNA pellet is suspended in 10 mM Tris pH 7.6 and 1 mM EDTA (TE). Genomic DNA is hybridized to commercially available high density SNP arrays, eg, arrays available from Affymetrix or Illumina, according to the instruments and instructions provided by the array manufacturer to form SNP profiles. Store the SNP profile of an entity in a security database or vault.

게놈 내에 존재하는 것이 소정의 질병이나 병태와 상관된, 확립되어 있으며 의학적으로 관련된 SNP의 임상 유래 데이터베이스와 비교함으로써, 위험도-분배 SNP에 관해 환자의 데이터 구조를 문의한다. 상기 데이터베이스는 특정 SNP 및 SNP 반수체형과 특정 질병이나 병태의 통계학적 상관관계에 관한 정보를 포함한다. 예를 들어, 실시예 III에 나타낸 바와 같이, 아포지단백질 E 유전자 내 다형성은 단백질의 상이한 아형을 생성하는데, 이는 진행중인 알츠하이머병의 통계학적 가능성과 상관되어 있는 것이다. 다른 예로서, 인자 V 라이덴(Factor V Leiden)으로 알려져 있는 혈병 단백질 인자 V의 변이체를 가지는 개체는 혈병 형성 경향이 증가하게 된다. SNP가 질병이나 질환의 표현형과 연관되어 있는 다수의 유전자를 표 1에 나타내었다. 이와 같은 데이터베이스 내 정보는 과학적 정확성과 중요도에 대한 연구/임상 자문 기관에 의해 승인을 받게 되며, 정부 기관의 감독하에 심사를 받을 수 있다. 상기 데이터베이스는 과학적 커뮤니티로부터 더욱 많은 SNP-질병 간 상관관계가 밝혀지게 됨에 따라서 계속 갱신된다.The patient's data structure is queried for risk-distributing SNPs by comparing them with established and medically relevant SNPs of clinically relevant SNPs that are correlated with a given disease or condition. The database contains information about the statistical correlation of specific SNPs and SNP haplotypes with specific diseases or conditions. For example, as shown in Example III, polymorphisms in the apolipoprotein E gene produce different subtypes of the protein, which correlate with the statistical likelihood of ongoing Alzheimer's disease. As another example, individuals with variants of the blood clot protein factor V, known as Factor V Leiden, have an increased tendency to blood clots. Table 1 shows a number of genes in which SNPs are associated with a disease or phenotype of a disease. Such information in the database is approved by research / clinical advisory bodies for scientific accuracy and importance and may be reviewed under the supervision of government agencies. The database is constantly updated as more SNP-disease correlations are revealed from the scientific community.

온-라인 포털 또는 우편으로 개체의 SNP 프로필에 관한 분석 결과를 환자에게 보안 유지 상태로 제공한다. 환자는 설명 및 보충 정보 예를 들어, 실시예 IV 내 인자 V 라이덴에 대해 알려주는 정보를 제공받는다. 예를 들어, 온-라인 포털을 통해 보안 상태를 유지하면서 개체의 SNP 프로필 정보를 얻음으로써, 환자의 담당 전문의와의 상담이 원활히 진행될 것이며, 또한 환자 개체에게 알맞는 의약품을 환자 자신이 선택할 권한도 부여할 것이다.Analyze the patient's SNP profile in an on-line portal or by mail to provide the patient with security. The patient is provided with descriptive and supplemental information, for example, information informing about Factor V Leiden in Example IV. For example, by obtaining the SNP profile information of an individual while maintaining security through an on-line portal, consultation with the patient's specialist will be facilitated, and the patient will also have the right to select the appropriate medicine for the individual. Will give.

실시예 IIExample II

유전자형의 상관관계의 갱신Update of Genotype Correlation

개체의 유전자형의 상관관계에 관한 초기의 측정 요청에 따라서, 게놈 프로필이 형성되고, 유전자형의 상관관계가 밝혀지게 되며, 그 결과는 실시예 I에 기술된 바와 같이 개체에 통보된다. 개체의 유전자형의 상관관계를 처음 측정한 후, 이후에 다시 갱신된 상관관계는 부가의 유전자형의 상관관계가 공지됨에 따라서 결정되거나 결정될 수 있다. 가입자는 가입 수준과 유전자형 프로필이 최고 수준에 이르게 되며, 그 결과는 보안 데이터베이스에 저장된다. 갱신된 상관관계는 저장된 유전자형 프로필을 기초로 형성된다.Following an initial request for measurement of the subject's genotype correlations, a genomic profile is formed and genotype correlations are revealed and the results are reported to the subject as described in Example I. After the initial measurement of the correlation of a genotype of an individual, the later updated correlation can be determined or determined as additional genotype correlations are known. Subscribers reach the highest level of subscription and genotype profile, and the results are stored in a secure database. The updated correlation is formed based on the stored genotype profile.

예를 들어, 초기의 유전자형의 상관관계 예를 들어, 상기 실시예 I에 기술된 상관관계에 따라서, 특정 개체는 ApoE4를 보유하지 않으므로, 알츠하이머병의 조기 발병의 소인을 가지지 않고, 또한 이 개체는 인자 V 라이덴을 가지지도 않음을 알 수 있었다. 이와 같은 초기 측정 단계를 거친 후, 새로운 상관관계가 공지 및 입증될 수 있었는데, 이 경우, 소정의 유전자(유전자 XYZ라 가정함) 내 다형성은 소정의 병태(병태 321이라 가정)과 상관되어 있다. 이와 같이 새로운 유전자형의 상관관계는 인간의 유전자형의 상관관계에 관한 마스터 데이터베이스에 부가된다. 이후, 보안 데이터베이스 내에 저장된 특정 개체의 게놈 프로필로부터, 관련 유전자 XYZ 데이터를 처음 검색함으로써, 특정 개체에 대한 상관관계가 갱신된다. 특정 개 체의 관련 유전자 XYZ 데이터는 유전자 XYZ에 대한 갱신 마스터 데이터베이스 정보와 비교된다. 이와 같이 비교함으로써, 특정 개체의 병태 321에 대한 감수성 또는 유전적 소인이 측정된다. 이러한 비교 결과를 특정 개체의 유전자형의 상관관계에 부가한다. 특정 개체가 병태 321에 감수성이거나 이 병태 321에 대해 유전적으로 소인이 있는지 여부에 관하여 갱신된 결과를, 그에 관한 설명과 보완 정보와 함께, 특정 개체에 제공한다.For example, early genotype correlations, for example, according to the correlation described in Example I above, a particular subject does not possess ApoE4 and therefore does not have a predisposition to premature onset of Alzheimer's disease, It can be seen that it does not have the factor V Leiden. After this initial measurement step, new correlations could be known and demonstrated, in which case the polymorphism in a given gene (assuming gene XYZ) is correlated with a given condition (assuming condition 321). As such, new genotype correlations are added to the master database on human genotype correlations. The correlation for the particular individual is then updated by first retrieving the relevant gene XYZ data from the genomic profile of the particular individual stored in the security database. The relevant gene XYZ data of a particular object is compared with the update master database information for gene XYZ. By such comparison, the susceptibility or genetic predisposition to condition 321 of a particular individual is measured. This comparison result is added to the genotype correlation of a particular individual. An updated result is provided to the particular individual, with descriptions and complementary information, as to whether the individual is susceptible to, or genetically predisposed to, the condition 321.

실시예 IIIExample III

ApoE4 위치와 알츠하이머병의 상관관계Correlation between ApoE4 Location and Alzheimer's Disease

알츠하이머병(AD)에 관한 위험도는 아포지단백질 E(APOE) 유전자 내 다형성과 상관되어 있는 것으로 보이는데, 이로써 APOE의 3가지 아형들 즉, ApoE2, ApoE3 및 ApoE4가 생성된다. 상기 아형들은 APOE 단백질 내 112번 및 158번 잔기에 존재하는 1개 또는 2개의 아미노산이 서로 상이하다. ApoE2는 112/158 cys/cys를 포함하고; ApoE3은 112/158 cys/arg를 포함하며; ApoE4는 112/158 arg/arg를 포함한다. 표 3에 나타낸 바와 같이, 알츠하이머병의 조기 발병 위험도는 APOE ε4 유전자 복사체 수에 따라서 증가한다. 이와 유사하게, 표 3에 나타낸 바와 같이, AD의 상대적 위험도는 APOE ε4 유전자 복사체 수에 따라서 증가한다.The risk for Alzheimer's disease (AD) appears to be correlated with polymorphisms in the apolipoprotein E (APOE) gene, resulting in three subtypes of APOE: ApoE2, ApoE3 and ApoE4. The subtypes differ from each other by one or two amino acids present at residues 112 and 158 in the APOE protein. ApoE2 comprises 112/158 cys / cys; ApoE3 comprises 112/158 cys / arg; ApoE4 contains 112/158 arg / arg. As shown in Table 3, the risk of early onset of Alzheimer's disease increases with the number of APOE ε4 gene copies. Similarly, as shown in Table 3, the relative risk of AD increases with the number of APOE ε4 gene copies.

AD 위험도 대립 형질의 유병율(Corder외 다수, Science:261:921-3, 1993)Prevalence of AD Risk Alleles (Corder et al., Science: 261: 921-3, 1993) APOE ε4 복사체APOE ε4 copy 유병율(%)Prevalence (%) 알츠하이머 위험도(%)Alzheimer's Risk (%) 발병 연령Onset age 00 7373 2020 8484 1One 2424 4747 7575 22 3 3 9191 6868

ApoE4를 보유하는 AD의 상대적 위험도(Farrer외 다수, JAMA:278:1349-56, 1997)Relative risk of AD with ApoE4 (Farrer et al., JAMA: 278: 1349-56, 1997) APOE 유전자형APOE genotype 교차비Crossover ε2ε2ε2ε2 0.6 0.6 ε2ε3ε2ε3 0.6 0.6 ε3ε3ε3ε3 1.0 1.0 ε2ε4ε2ε4 2.6 2.6 ε3ε4ε3ε4 3.2 3.2 ε4ε4ε4ε4 14.914.9

실시예 IVExample IV

인자 V 라이덴 양성 환자에 대한 정보Information for patients with factor V Leiden positive

이하 정보는 인자 V 라이덴에 대한 유전자가 존재함을 보여주는 게놈 SNP 프로필을 가지는 개체에게 제공될 수 있었던 정보를 예로 들어 나타낸 것이다. 개체는 정보가 초기 리포트에 제공될 수 있는 기본 가입자일 수 있다. The information below exemplifies information that could be provided to an individual having a genomic SNP profile showing the presence of a gene for Factor V Leiden. The entity may be a primary subscriber whose information may be provided in the initial report.

인자 V 라이덴이란 무엇인가?What is the factor V Leiden?

인자 V 라이덴은 질병이 아니고, 어느 한 개체의 부모로부터 물려받은 특정 유전자가 존재함을 의미하는 것이다. 인자 V 라이덴은 혈병 형성에 필요한 단백질 인자 V(5)의 변이체이다. 인자 V가 결핍된 사람은 출혈이 잘 멈추지 않는 경향이 있는 반면에, 인자 V 라이덴을 보유하는 사람은 혈병 형성 경향이 증가하게 된다.The factor V Leiden is not a disease, but it means that there is a specific gene inherited from the parent of one individual. Factor V Leiden is a variant of protein factor V (5) required for blood clot formation. People who lack factor V tend to not stop bleeding well, while those who carry factor V Leiden have an increased tendency to blood clots.

인자 V 라이덴 유전자를 보유하는 사람은 집단 내 다른 개체들보다 혈병 형성(혈전증) 진행 위험도가 5배나 더 높다. 그러나, 이 유전자를 가지는 다수의 사람들은 절대로 혈병이 형성되지 않을 것이다. 영국과 미국에서는, 인구의 5%가 인자 V 라이덴에 대한 유전자를 하나 이상 보유하는데, 이러한 수치는 실제로 혈전증이 발병할 사람의 수보다 훨씬 높다. People carrying the factor V Leiden gene are five times more likely to develop clot (thrombosis) than other individuals in the population. However, many people with this gene will never form blood clots. In the United Kingdom and the United States, 5% of the population carries one or more genes for factor V Leiden, which is actually much higher than the number of people who will develop thrombosis.

어떻게 인자 V 라이덴을 얻을 것인가?How do you get the argument V Leiden?

인자 V에 대한 유전자는 어느 한 개체의 부모로부터 물려받는 것이다. 유전된 모든 특성들과 함께, 하나의 유전자는 모로부터, 그리고 다른 하나의 유전자는 부로부터 유전된다. 그러므로, 즉, 2개의 정상 유전자 또는 1개의 인자 V 라이덴 유전자와, 하나의 정상 유전자 또는 2개의 인자 V 라이덴 유전자가 유전될 수 있는 것이다. 하나의 인자 V 라이덴 유전자를 보유할 경우에는 혈전증으로 진행될 위험도가 약간 높아지지만, 2개의 유전자를 보유할 경우에는 위험도가 상당히 높아진다. The gene for factor V is inherited from the parent of either individual. With all the inherited traits, one gene is inherited from the mother and the other gene from wealth. Thus, that is, two normal genes or one factor V Leiden gene and one normal gene or two factor V Leiden genes can be inherited. The risk of developing thrombosis is slightly higher with one factor V Leiden gene, but significantly higher with two genes.

인자 V 라이덴으로 인한 증상은 무엇인가?What are the symptoms from factor V Leiden?

혈병이 형성되지 않을 경우 징후(혈전증)는 없는 것이다.If no clot is formed, there are no signs (thrombosis).

위험 신호는 무엇인가?What are the danger signs?

가장 일반적인 문제점은 다리에 혈병이 형성되는 것이다. 이러한 문제는, 다리가 붓는다든지, 아프거나 홍조를 띠게 된다든지 하는 것에 의해 나타난다. 매우 드문 경우이긴 하지만, 폐에 혈병이 형성되면(폐 색전), 호흡이 곤란해질 수 있다. 혈병의 크기에 따라서, 증상을 거의 자각하지 못하는 환자로부터 중증 호흡 곤란을 겪는 환자에 이르기까지 여러 유형의 환자가 나타날 수 있다. The most common problem is the formation of blood clots in the legs. This problem is manifested by swelling of the legs, pain or redness. In rare cases, blood clots form in the lungs (pulmonary embolism), which can make breathing difficult. Depending on the size of the blood clot, several types of patients may appear, ranging from patients who are unaware of their symptoms to patients suffering from severe breathing difficulties.

더욱 보기 드문 경우이긴 하지만, 혈병은 팔이나 신체의 다른 부분에서도 일어날 수 있다. 이러한 혈병이, 혈액을 심장으로 보내되 동맥(혈액을 심장으로부터 내보내는 혈관)으로는 보내지 않는 정맥 내에 형성되었으므로, 인자 V 라이덴은 관상 동맥 혈전증의 발병 위험도를 증가시키지 않는다.More rarely, blood clots can also occur in the arm or other part of the body. Since these clots are formed in veins that send blood to the heart but not to arteries (blood vessels that send blood out of the heart), Factor V Leiden does not increase the risk of developing coronary thrombosis.

혈병 형성을 막기 위해서 무엇을 할 수 있을까?What can you do to prevent blood clots?

인자 V 라이덴은 혈병 형성 위험도를 약간 증가시키기만 할 뿐, 이러한 병태를 가지는 사람들 대다수는 혈전증을 경험하지 않을 것이다. 혈병이 형성되는 것을 막기 위해 할 수 있는 일들이 많이 있다. 장시간 동안 같은 자세로 서있거나 앉지 않아야 한다. 장거리 여행시, 규칙적으로 운동을 해주는 것이 중요한데 - 혈액은 "정지"되어서는 안 되기 때문이다. 체중 증가 또는 흡연 역시 혈병 형성 위험도를 상당 수준 증가시킬 것이다. 인자 V 라이덴 유전자를 보유하는 여성은 피임약을 복용하면 안 되는데, 그 이유는 피임약이 혈전증의 발병 위험을 상당 수준 증가시킬 것이기 때문이다. 인자 V 라이덴 유전자를 보유하는 여성은 또한, 임신 전 자신의 담당 의사와 상의해야 하는데, 그 이유는 임신으로 하여금 혈전증의 위험도가 증가할 수 있기 때문이다. Factor V Leiden only slightly increases the risk of clot formation, and the majority of people with this condition will not experience thrombosis. There are many things you can do to prevent blood clots from forming. Do not stand or sit in the same position for a long time. When traveling long distances, it is important to exercise regularly-because the blood must not be "stopped". Weight gain or smoking will also significantly increase the risk of blood clots. Women carrying the factor V Leiden gene should not take birth control pills because they will significantly increase the risk of developing thrombosis. Women who carry the factor V Leiden gene should also consult their doctor before pregnancy because pregnancy may increase the risk of thrombosis.

어떻게 의사가 자신의 환자가 인자 V 라이덴을 보유하는지 여부를 알 수 있을까?How can a doctor know if his patient has factor V Leiden?

인자 V 라이덴 유전자는 혈액 시료 중에서 찾을 수 있다. The factor V Leiden gene can be found in blood samples.

다리나 팔에 생긴 혈병은 일반적으로 초음파 검사로 확인할 수 있다. Blood clots on the legs or arms can usually be confirmed by ultrasound.

혈병은 또한 특정 물질을 혈액 속에 투여하여 혈병이 형성되도록 한 다음에 X-선으로 검출할 수도 있다. 폐 내 혈병은 찾기 힘들지만, 일반적으로 의사는 방사성 물질을 사용하여, 폐 내 혈류 분포도와, 폐에 대한 공기의 분포도를 테스트할 것이다. 2가지 패턴이 매치되어야 하는데, 미스 매치된다는 것은 혈병이 존재한다는 것을 말해준다.Blood clots can also be detected by X-ray after administration of certain substances into the blood to allow blood clots to form. Pulmonary blood clots are hard to find, but doctors will typically use radioactive materials to test the distribution of blood flow in the lungs and the distribution of air to the lungs. The two patterns must match, but a mismatch indicates that a blood clot exists.

인자 V 라이덴의 치료 방법은?How is Factor V Leiden Treated?

인자 V 라이덴을 보유하는 사람은 자신의 혈액이 굳기 시작하지 않으면 굳이 치료를 시작할 필요가 없는데, 이 경우, 의사는 혈액을 묽게 해주는 의약품(항응고제) 예를 들어, 워파린(warfarin)(예를 들어, 마레반(Marevan)) 또는 헤파린을 처방하여 더 이상 응고가 진행되지 않도록 할 것이다. 치료 방법은 일반적으로 3∼6개월 동안 지속될 것이지만, 혈병이 조금이라도 형성되면, 더욱 오랫동안 약을 복용할 수도 있다. 몇몇 경우, 약물 치료 과정은 무한정 지속될 수 있는데; 매우 드문 경우이지만, 혈병을 수술로 제거해야 할 수도 있다.A person with factor V Leiden does not need to start treatment unless his blood starts to harden, in which case doctors use blood thinning medications (anticoagulants), such as warfarin (e.g. , Marevan, or heparin may be prescribed to prevent further clotting. The treatment will generally last 3 to 6 months, but once the blood clots have formed, you can take the medicine for a longer time. In some cases, the medication course can last indefinitely; In very rare cases, blood clots may need to be removed surgically.

임신 중에는 어떻게 인자 V 라이덴 치료가 행하여질까?How is Factor V Leiden Therapy performed during pregnancy?

인자 V 라이덴에 대한 유전자를 2개 보유하는 여성은 임신 중 헤파린 항응고제 치료를 받아야 할 것이다. 이전에 혈병이 형성되었거나 또는 혈병 형성 가족력이 있으며, 인자 V 라이덴 유전자 하나만을 보유하는 여성의 경우에도 동일하다. Women who carry two genes for factor V Leiden will need to receive heparin anticoagulant therapy during pregnancy. The same is true for women who have previously had a blood clot or have a blood clot family history and carry only one factor V Leiden gene.

인자 V 라이덴에 대한 유전자를 보유하는 모든 여성들은 임신의 나머지 절반의 기간 동안 혈병 형성을 막아주는, 특수한 스타킹을 신어야 할 수도 있다. 출산 후에는 항 응고 약인 헤파린이 처방될 수 있다.All women who carry the gene for factor V Leiden may need to wear special tights that prevent blood clots from forming during the remainder of their pregnancy. After birth, anticoagulant heparin may be prescribed.

예후Prognosis

혈병 형성이 진행될 위험도는 연령이 증가함에 따라서 증가하지만, 이 유전자를 보유하는 100세 이상의 노인들을 대상으로 한 조사에 따르면, 소수의 사람들만이 혈전증을 앓고 있다는 것을 알 수 있었다. 국립 유전 상담자 협회(National Society for Genetic Counselors; NSGC)는 본 발명의 방법에 의한 가입자가 알고 싶어하는 분야 내 유전 상담자 리스트와, 가족력이 될지에 대한 정보를 제공할 수 있다. www.nsgc.org/consumer의 온-라인 데이터베이스를 검색하시오.The risk of developing clots increases with age, but a survey of older people 100 years or older carrying this gene showed that only a small number of people suffer from thrombosis. The National Society for Genetic Counselors (NSGC) can provide a list of genetic counselors in the field that subscribers would like to know by the method of the present invention and information about whether to be a family history. Search the online database at www.nsgc.org/consumer.

본 발명의 바람직한 구체예가 본원에 기술 및 개시되어 있지만, 당 업자는 이러한 구체예가 오로지 예시를 위한 목적으로 제공된 것임을 알게 될 것이다. 당 업자는, 본 발명의 범위에서 벗어나지 않고, 본 발명을 다양하게 변형시키고, 바꾸어주며 대체할 것이다. 본원에 개시된 본 발명의 구체예에 대한 다수의 대안들을 본 발명을 수행하는데 사용할 수 있음을 이해해야 할 것이다. 이하 청구의 범위는 본 발명의 범위를 한정하며, 이와 같은 청구 범위에 속하는 방법과 구조, 그리고 이것들의 균등 범위까지 아우를 것이다.While preferred embodiments of the invention have been described and disclosed herein, those skilled in the art will recognize that such embodiments are provided solely for purposes of illustration. Those skilled in the art will make various modifications, changes and substitutions to the present invention without departing from the scope of the invention. It should be understood that many alternatives to the embodiments of the invention disclosed herein can be used to practice the invention. The following claims limit the scope of the invention and will encompass methods and structures falling within such claims and their equivalents.

Claims (131)

개체의 유전자형 상관관계를 평가하는 방법으로서,A method of assessing a genotype correlation of an individual, a) 상기 개체의 유전자 시료를 얻는 단계;a) obtaining a genetic sample of said individual; b) 상기 개체에 대한 게놈 프로필을 형성하는 단계;b) forming a genomic profile for said individual; c) 상기 개체의 게놈 프로필을, 표현형과 인간 유전자형의 상관관계에 관한 현존 데이터베이스와 비교하여, 표현형과 상기 개체 유전자형의 상관관계를 측정하는 단계;c) comparing the individual's genomic profile with an existing database of correlations between the phenotype and the human genotype to determine a correlation between the phenotype and the individual genotype; d) 상기 단계 c)로부터 얻은 결과를, 상기 개체 또는 상기 개체의 건강 관리 매니저에게 보고하는 단계;d) reporting the result obtained from step c) to the individual or the health care manager of the individual; e) 상기 인간 유전자형의 상관관계에 관한 데이터베이스를, 부가적인 인간 유전자형의 상관관계가 규명됨에 따라, 상기 부가적인 인간 유전자형의 상관관계로 갱신하는 단계;e) updating the database of human genotype correlations with additional human genotype correlations as additional human genotype correlations are identified; f) 단계 c)의 상기 개체의 게놈 프로필 또는 그의 일부를 상기 부가적인 인간 유전자형의 상관관계와 비교하고, 상기 개체의 부가적인 유전자형의 상관관계를 측정함으로써, 상기 개체의 유전자형의 상관관계를 갱신하는 단계; 및f) updating the genotype correlation of the individual by comparing the genomic profile of the individual or part thereof in step c) with the correlation of the additional human genotype and measuring the correlation of the additional genotype of the individual step; And g) 상기 단계 f)로부터 얻은 결과를 상기 개체 또는 상기 개체의 건강 관리 매니저에게 보고하는 단계g) reporting the result obtained from step f) to the individual or the health care manager of the individual. 를 포함하는 방법.How to include. 제1항에 있어서, 상기 유전자 시료는 제3자로부터 얻는 것인 방법.The method of claim 1, wherein said genetic sample is obtained from a third party. 제1항에 있어서, 상기 게놈 프로필을 형성하는 단계는 제3자에 의해 수행하는 것인 방법.The method of claim 1, wherein forming the genomic profile is performed by a third party. 제1항에 있어서, 상기 결과는 GCI 스코어 또는 GCI 플러스 스코어를 기초로 하는 것인 방법.The method of claim 1, wherein the result is based on a GCI score or a GCI plus score. 제1항에 있어서, 상기 보고 단계는 상기 결과들을 네트워크상으로 전송하는 것을 포함하는 것인 방법.The method of claim 1, wherein said reporting step comprises transmitting said results over a network. 제1항에 있어서, 상기 결과를 보고하는 단계는 온-라인 포털을 통해 이루어지는 것인 방법.The method of claim 1, wherein reporting the results is through an on-line portal. 제1항에 있어서, 상기 결과를 보고하는 단계는 용지나 이-메일에 의해 이루어지는 것인 방법.The method of claim 1, wherein reporting the results is by paper or e-mail. 제1항에 있어서, 상기 보고 단계는 상기 결과를 보안 방식으로 보고하는 것을 포함하는 것인 방법.The method of claim 1, wherein said reporting step comprises reporting the result in a secure manner. 제1항에 있어서, 상기 보고 단계는 상기 결과를 비-보안 방식으로 보고하는 것을 포함하는 것인 방법.The method of claim 1, wherein said reporting step comprises reporting said result in a non-secure manner. 제1항에 있어서, 상기 개체의 게놈 프로필은 보안 데이터베이스 또는 볼트(vault)에 저장하는 것인 방법.The method of claim 1, wherein the genomic profile of the individual is stored in a security database or vault. 제1항에 있어서, 상기 개체는 가입자인 것인 방법.The method of claim 1, wherein the subject is a subscriber. 제1항에 있어서, 상기 개체는 가입자가 아닌 것인 방법.The method of claim 1, wherein the individual is not a subscriber. 제1항에 있어서, 상기 유전자 시료는 DNA인 것인 방법.The method of claim 1, wherein the genetic sample is DNA. 제1항에 있어서, 상기 유전자 시료는 RNA인 것인 방법.The method of claim 1, wherein the genetic sample is RNA. 제1항에 있어서, 상기 게놈 프로필은 단일 뉴클레오티드 다형성 게놈 프로필이고, 상기 인간 유전자형의 상관관계에 관한 데이터베이스는 인간의 단일 뉴클레오티드 다형성 상관관계이며, 상기 부가적인 인간 유전자형의 상관관계는 단일 뉴클레오티드 다형성 상관관계인 것인 방법.The method of claim 1, wherein the genomic profile is a single nucleotide polymorphism genomic profile, the database of correlations between human genotypes is a single nucleotide polymorphism correlation in human, and wherein the correlation of the additional human genotype is a single nucleotide polymorphism correlation. How. 제1항에 있어서, 상기 게놈 프로필은 절단부, 삽입부, 결실부 또는 반복부를 포함하고, 상기 인간 유전자형의 상관관계에 관한 데이터베이스는 인간의 절단부, 삽입부, 결실부 또는 반복부에 관한 상관관계이며, 상기 부가적인 인간 유전자형의 상관관계는 절단부, 삽입부, 결실부 또는 반복부에 관한 상관관계인 것인 방법.The method of claim 1, wherein the genomic profile comprises a cleavage, insertion, deletion or repeat and the database of correlations between human genotypes is a correlation of a cleavage, insertion, deletion or repeat of a human. Wherein said additional human genotype correlation is with respect to a cleavage, insertion, deletion or repeat. 제1항에 있어서, 상기 게놈 프로필은 상기 개체의 전체 게놈을 갖는 것인 방법.The method of claim 1, wherein the genomic profile has the entire genome of the individual. 제1항에 있어서, 상기 방법은 2개 이상의 유전자형의 상관관계를 평가하는 단계를 포함하는 것인 방법.The method of claim 1, wherein the method comprises assessing a correlation of two or more genotypes. 제1항에 있어서, 상기 방법은 10개 이상의 유전자형의 상관관계를 평가하는 단계를 포함하는 것인 방법.The method of claim 1, wherein the method comprises assessing a correlation of at least 10 genotypes. 제1항에 있어서, 상기 인간 유전자형의 상관관계에 관한 데이터베이스는 표 1에 나열된 하나 이상의 유전자의 유전자 변이체 및 상기 유전자 변이체와 상관된 표현형을 포함하는 것인 방법.The method of claim 1, wherein the database of correlations between human genotypes comprises genetic variants of one or more genes listed in Table 1 and phenotypes correlated with the genetic variants. 제1항에 있어서, 상기 인간 유전자형의 상관관계에 관한 데이터베이스는 도 4, 5, 6, 22 또는 25에 나열된 하나 이상의 유전자의 유전자 변이체 및 상기 유전자 변이체와 상관된 표현형을 포함하는 것인 방법.The method of claim 1, wherein the database of correlations between human genotypes comprises genetic variants of one or more genes listed in FIGS. 4, 5, 6, 22 or 25 and phenotypes correlated with the genetic variants. 제1항에 있어서, 상기 인간 유전자형의 상관관계에 관한 데이터베이스는 상기 개체의 게놈 프로필로부터 측정된 유전자 변이체, 및 상기 개체에 의해 공개된, 이전에 측정된 표현형을 포함하는 것인 방법.The method of claim 1, wherein the database of correlations of human genotypes comprises genetic variants measured from the genomic profile of the individual, and previously measured phenotypes published by the individual. 제1항에 있어서, 상기 인간 유전자형의 상관관계에 관한 데이터베이스는 표 1 또는 도 4, 5, 6, 22 또는 25에 나열된 유전자 내 단일 뉴클레오티드 다형성, 및 상기 단일 뉴클레오티드 다형성과 상관된 표현형을 포함하는 것인 방법.The method of claim 1, wherein the database of correlations between human genotypes comprises single nucleotide polymorphisms in the genes listed in Table 1 or FIGS. 4, 5, 6, 22 or 25, and phenotypes correlated with the single nucleotide polymorphisms. How to be. 제1항에 있어서, 상기 유전자 시료는 혈액, 머리 카락, 피부, 타액, 정액, 소변, 분변, 땀 및 협측 시료로 이루어진 군으로부터 선택된 생물학적 시료로부터 유래하는 것인 방법.The method of claim 1, wherein the genetic sample is derived from a biological sample selected from the group consisting of blood, hair color, skin, saliva, semen, urine, feces, sweat and buccal samples. 제15항에 있어서, 상기 유전자형의 상관관계는 질병 및 병태에 대한 단일 뉴클레오티드 다형성의 상관관계인 것인 방법. The method of claim 15, wherein said genotype correlation is a correlation of single nucleotide polymorphism to disease and condition. 제15항에 있어서, 상기 유전자형의 상관관계는 의학적 병태가 아닌 표현형에 대한 단일 뉴클레오티드 다형성의 상관관계인 것인 방법. The method of claim 15, wherein said genotype correlation is a correlation of single nucleotide polymorphism to a phenotype that is not a medical condition. 제1항에 있어서, 상기 게놈 프로필은 고 밀도 DNA 마이크로어레이를 사용하 여 형성되는 것인 방법.The method of claim 1, wherein the genomic profile is formed using high density DNA microarrays. 제1항에 있어서, 상기 게놈 프로필은 게놈 DNA 서열 결정법을 이용하여 형성되는 것인 방법.The method of claim 1, wherein the genomic profile is formed using genomic DNA sequencing. 제24항에 있어서, 상기 유전자 시료는 게놈 DNA이며, 상기 생물학적 시료는 타액인 것인 방법.The method of claim 24, wherein the genetic sample is genomic DNA and the biological sample is saliva. a) 룰들을 포함하는 룰 세트를 제공하는 단계로서, 각각의 룰은 하나 이상의 유전자형과 하나 이상의 표현형 사이의 상관관계를 나타내는 것인 단계;a) providing a rule set comprising rules, each rule representing a correlation between one or more genotypes and one or more phenotypes; b) 복수의 개체 각각에 대한 게놈 프로필을 포함하는 데이터 세트를 제공하는 단계로서, 각각의 게놈 프로필은 다수의 유전자형을 포함하는 것인 단계;b) providing a data set comprising a genomic profile for each of the plurality of individuals, wherein each genomic profile comprises a plurality of genotypes; c) 상기 룰 세트를 하나 이상의 새로운 룰로 주기적으로 갱신하는 단계로서, 상기 하나 이상의 새로운 룰은 상기 룰 세트 중 이전에는 서로 상관관계가 없는 표현형과 유전자형 사이의 상관관계를 나타내는 것인 단계; 및c) periodically updating the rule set with one or more new rules, wherein the one or more new rules indicate a correlation between phenotypes and genotypes previously uncorrelated with each other in the rule set; And d) 각각의 새로운 룰을 상기 개체들 중 하나 이상의 게놈 프로필에 적용하여, 상기 개체에 대한 하나 이상의 표현형과 하나 이상의 유전자형을 상관시키는 단계d) applying each new rule to at least one genomic profile of said individuals, correlating at least one phenotype with at least one genotype for said individual 를 포함하는 방법.How to include. 제30항에 있어서, e) 상기 개체의 상기 표현형 프로필을 포함하는 리포트를 작성하는 단계를 추가로 포함하는 방법.32. The method of claim 30, further comprising: e) generating a report comprising the phenotype profile of the individual. 제30항에 있어서, 단계 b) 후,The method of claim 30, wherein after step b): i) 상기 룰 세트의 룰들을 상기 개체의 게놈 프로필에 적용하여, 상기 개체에 대한 표현형 프로필 세트를 측정하는 단계; 및i) applying the rules of the rule set to the genomic profile of the individual to determine a set of phenotype profiles for the individual; And ii) 상기 개체의 초기 표현형 프로필을 포함하는 리포트를 작성하는 단계ii) creating a report containing an initial phenotype profile of said individual 를 추가로 포함하는 방법.How to further include. 제31항 또는 제32항에 있어서, 상기 리포트를 제공하는 단계는 상기 리포트를 네트워크를 통하여 전송하는 것을 포함하는 것인 방법.33. The method of claim 31 or 32, wherein providing the report comprises sending the report over a network. 제31항 또는 제32항에 있어서, 상기 리포트는 보안 방식으로 제공하는 것인 방법.33. The method of claim 31 or 32, wherein the report is provided in a secure manner. 제31항 또는 제32항에 있어서, 상기 리포트는 비-보안 방식으로 제공하는 것인 방법.33. The method of claim 31 or 32, wherein the report is provided in a non-secure manner. 제31항 또는 제32항에 있어서, 상기 리포트는 온-라인 포털에 의해 제공하는 것인 방법.33. The method of claim 31 or 32, wherein the report is provided by an on-line portal. 제31항 또는 제32항에 있어서, 상기 리포트는 용지나 이-메일에 의해 제공하는 것인 방법.33. The method of claim 31 or 32, wherein the report is provided by paper or e-mail. 제30항에 있어서, 상기 새로운 룰은 표현형과 비-상관된 유전자형을 상관시키는 것인 방법.31. The method of claim 30, wherein the new rule correlates a phenotype with a non-correlated genotype. 제30항에 있어서, 상기 새로운 룰은, 상기 룰 세트 중 이전에는 상관 없는 표현형과 상관된 유전자형을 상관시키는 것인 방법.31. The method of claim 30, wherein the new rule correlates a genotype correlated with a previously unrelated phenotype in the rule set. 제30항에 있어서, 상기 새로운 룰은 상기 룰 세트 중 임의의 룰을 수정하는 것인 방법.33. The method of claim 30, wherein the new rule modifies any of the rule sets. 제30항에 있어서, 상기 새로운 룰은 상기 개체의 게놈 프로필로부터 유래하는 유전자형과 상기 개체의 이전에 측정된 표현형의 상관관계에 의해 형성하는 것인 방법.31. The method of claim 30, wherein said new rule is formed by correlation of a genotype derived from said individual's genomic profile with a previously measured phenotype of said individual. 제30항에 있어서, 상기 룰은 다수의 유전자형과 표현형을 상관시키는 것인 방법.31. The method of claim 30, wherein said rule correlates a plurality of genotypes and phenotypes. 제30항에 있어서, 상기 새로운 룰을 적용시키는 단계는 민족성, 가계, 지형, 성별, 연령, 가족력 및 이전에 측정된 표현형으로부터 선택된 상기 개체의 특성을 기초로 하여 적어도 부분적으로 상기 표현형 프로필을 측정하는 단계를 추가로 포함하는 것인 방법.31. The method of claim 30, wherein applying the new rule comprises at least partially measuring the phenotype profile based on ethnicity, ancestry, topography, gender, age, family history and characteristics of the subject selected from previously measured phenotypes. Further comprising a step. 제30항에 있어서, 상기 유전자형은 뉴클레오티드 반복부, 뉴클레오티드 삽입부, 뉴클레오티드 결실부, 염색체 전좌부, 염색체 중복부 또는 복제 수 변이를 포함하는 것인 방법.31. The method of claim 30, wherein the genotype comprises nucleotide repeats, nucleotide insertions, nucleotide deletions, chromosomal translocations, chromosomal duplications, or copy number variations. 제44항에 있어서, 상기 복제 수 변이는 초위성체 반복부(microsatelite repeat), 뉴클레오티드 반복부, 동원체 반복부, 또는 텔로미어 반복부인 것인 방법.45. The method of claim 44, wherein said copy number variation is a microsatelite repeat, a nucleotide repeat, a centriole repeat, or a telomere repeat. 제30항에 있어서, 상기 유전자형은 단일 뉴클레오티드 다형성을 포함하는 것인 방법.31. The method of claim 30, wherein said genotype comprises single nucleotide polymorphism. 제30항에 있어서, 상기 유전자형은 반수체형(haplotype) 및 이배체형(diplotype)을 포함하는 것인 방법.31. The method of claim 30, wherein the genotype comprises haplotypes and diplotypes. 제30항에 있어서, 상기 유전자형은 표현형과 상관된 단일 뉴클레오티드 다형 성과 연관 불균형(linkage disequilibrium) 상태로 있는 유전자 마커를 포함하는 것인 방법.The method of claim 30, wherein the genotype comprises a genetic marker that is in linkage disequilibrium with a single nucleotide polymorphism correlated with a phenotype. 제30항에 있어서, 상기 표현형 프로필은 상기 정량적 형질 또는 상기 정량적 형질이 발생할 위험도의 존부를 나타내는 것인 방법.31. The method of claim 30, wherein said phenotype profile indicates the presence of said quantitative trait or risk of developing said quantitative trait. 제30항에 있어서, 상기 표현형 프로필은 임의 유전자형을 가진 개체가 임의 표현형을 가지거나 또는 가질 가능성을 나타내는 것인 방법.The method of claim 30, wherein the phenotype profile indicates that an individual with any genotype has or is likely to have any phenotype. 제50항에 있어서, 상기 가능성은 GCI 스코어 또는 GCI 플러스 스코어를 기초로 하는 것인 방법.51. The method of claim 50, wherein the likelihood is based on a GCI score or a GCI plus score. 제50항에 있어서, 상기 가능성은 예측 평생 위험도인 것인 방법.51. The method of claim 50, wherein the likelihood is a predicted lifetime risk. 제30항에 있어서, 상기 상관관계는 보완되는(curated) 것인 방법.31. The method of claim 30, wherein the correlation is curated. 제30항에 있어서, 상기 룰 세트는 20개 이상의 룰을 포함하는 것인 방법.33. The method of claim 30, wherein the rule set includes 20 or more rules. 제30항에 있어서, 상기 룰 세트는 50개 이상의 룰을 포함하는 것인 방법.33. The method of claim 30, wherein the rule set includes at least 50 rules. 제30항에 있어서, 상기 룰 세트는 표 1내 유전자형의 상관관계를 기초로 한 룰을 포함하는 것인 방법.31. The method of claim 30, wherein said rule set includes rules based on the correlation of genotypes in Table 1. 제30항에 있어서, 상기 룰 세트는 도 4, 5, 6, 22 또는 25 내 상기 유전자형의 상관관계를 기초로 한 룰을 포함하는 것인 방법.31. The method of claim 30, wherein the rule set comprises a rule based on the correlation of the genotypes in FIGS. 4, 5, 6, 22 or 25. 제30항에 있어서, 상기 표현형은 정량적 형질을 포함하는 것인 방법.The method of claim 30, wherein said phenotype comprises a quantitative trait. 제58항에 있어서, 상기 정량적 형질은 의학적 병태를 포함하는 것인 방법.59. The method of claim 58, wherein the quantitative trait comprises a medical condition. 제59항에 있어서, 상기 표현형 프로필은 상기 의학적 병태의 존부, 상기 의학적 병태가 발생할 위험도, 상기 의학적 병태의 예후, 상기 의학적 병태에 대한 치료의 효능, 또는 상기 의학적 병태의 치료에 대한 반응을 나타내는 것인 방법.60. The method of claim 59, wherein the phenotype profile indicates the presence of the medical condition, the risk of developing the medical condition, the prognosis of the medical condition, the efficacy of treatment for the medical condition, or the response to the treatment of the medical condition. How to be. 제58항에 있어서, 상기 정량적 형질은 의학적 병태가 아닌 표현형을 포함하는 것인 방법.59. The method of claim 58, wherein the quantitative trait comprises a phenotype that is not a medical condition. 제58항에 있어서, 상기 정량적 형질은 신체적 형질, 생리학적 형질, 정신적 형질, 감정적 형질, 민족성, 가계 또는 연령으로 이루어진 군으로부터 선택되는 것인 방법.59. The method of claim 58, wherein the quantitative trait is selected from the group consisting of physical traits, physiological traits, mental traits, emotional traits, ethnicity, family or age. 제30항에 있어서, 상기 개체는 인간인 것인 방법.The method of claim 30, wherein the subject is a human. 제30항에 있어서, 상기 개체는 비-인간인 것인 방법.The method of claim 30, wherein the subject is non-human. 제30항에 있어서, 상기 개체는 가입자인 것인 방법.31. The method of claim 30, wherein the subject is a subscriber. 제30항에 있어서, 상기 개체는 가입자가 아닌 것인 방법.31. The method of claim 30, wherein the subject is not a subscriber. 제30항에 있어서, 상기 게놈 프로필은 100,000개 이상의 유전자형을 포함하는 것인 방법.The method of claim 30, wherein said genomic profile comprises at least 100,000 genotypes. 제30항에 있어서, 상기 게놈 프로필은 400,000개 이상의 유전자형을 포함하는 것인 방법.31. The method of claim 30, wherein said genomic profile comprises at least 400,000 genotypes. 제30항에 있어서, 상기 게놈 프로필은 900,000개 이상의 유전자형을 포함하는 것인 방법.The method of claim 30, wherein said genomic profile comprises at least 900,000 genotypes. 제30항에 있어서, 상기 게놈 프로필은 1,000,000개 이상의 유전자형을 포함하는 것인 방법.The method of claim 30, wherein said genomic profile comprises at least 1,000,000 genotypes. 제30항에 있어서, 상기 게놈 프로필은 실질적으로 완전한 전체 게놈 서열을 포함하는 것인 방법.The method of claim 30, wherein said genomic profile comprises a substantially complete whole genome sequence. 제30항에 있어서, 상기 데이터 세트는 다수의 데이터 포인트를 포함하고, 여기서 각각의 데이터 포인트는 개체와 관련되고 다수의 데이터 요소를 포함하며, 상기 데이터 요소는 상기 개체의 유일한 식별자, 유전자형 정보, 마이크로어레이 SNP 식별 번호, SNP rs 번호, 염색체 위치, 다형성 뉴클레오티드, 품질 메트릭스(quality metrics), 미처리(raw) 데이터 파일, 이미지, 추출된 강도 스코어(intensity score), 신체적 데이터, 의학적 데이터, 민족성, 가계, 지형, 성별, 연령, 가족력, 공지의 표현형, 인구 통계학적 데이터, 노출 데이터, 생활 방식 데이터 및 행동 데이터로부터 선택된 하나 이상의 요소를 포함하는 것인 방법.31. The method of claim 30, wherein the data set comprises a plurality of data points, wherein each data point is associated with an entity and includes a plurality of data elements, wherein the data element is a unique identifier of the subject, genotype information, micro Array SNP identification number, SNP rs number, chromosome location, polymorphic nucleotides, quality metrics, raw data file, image, extracted intensity score, physical data, medical data, ethnicity, ancestry, And one or more elements selected from topography, gender, age, family history, known phenotypes, demographic data, exposure data, lifestyle data, and behavioral data. 제30항에 있어서, 주기적으로 갱신 및 적용하는 단계는 1년에 1회 이상 수행하는 것인 방법.31. The method of claim 30, wherein the periodically updating and applying step is performed at least once a year. 제30항에 있어서, 상기 데이터 세트를 제공하는 단계는 33. The method of claim 30, wherein providing the data set 복수의 개체 각각에 대한 게놈 프로필을 얻는 단계로서, (i) 상기 개체로부터 얻은 유전자 시료에 대하여 유전자 분석을 수행하고, (ii) 상기 분석을 컴퓨터 판독가능한 포맷으로 암호화함으로써, 수행하는 것인 단계를 포함하는 것인 방법.Obtaining a genomic profile for each of the plurality of individuals, by (i) performing a genetic analysis on the genetic sample obtained from the individual, and (ii) encoding the analysis in a computer readable format. Which method. 제30항에 있어서, 상기 표현형 프로필은 단일 유전자의 표현형을 포함하는 것인 방법.The method of claim 30, wherein said phenotype profile comprises a phenotype of a single gene. 제30항에 있어서, 상기 표현형 프로필은 다중 유전자의 표현형을 포함하는 것인 방법.The method of claim 30, wherein said phenotype profile comprises phenotypes of multiple genes. 제30항에 있어서, 상기 리포트는 초기의 표현형 프로필을 포함하는 것인 방법.31. The method of claim 30, wherein the report comprises an initial phenotype profile. 제30항에 있어서, 상기 리포트는 갱신된 표현형 프로필을 포함하는 것인 방법.31. The method of claim 30, wherein the report comprises an updated phenotype profile. 제30항에 있어서, 상기 리포트는 예방 전략, 건강 관리(wellness) 정보, 요법, 증상의 자각, 조기 검출 기술, 개입 계획, 및 상기 표현형 프로필 중 표현형의 정교한 동정 방법 및 하위 분류법 중 하나 이상으로부터 선택된 표현형 프로필의 상기 표현형에 대한 정보를 추가로 포함하는 것인 방법.31. The method of claim 30, wherein the report is selected from one or more of prevention strategies, wellness information, therapy, awareness of symptoms, early detection techniques, intervention plans, and sophisticated identification methods and subclassifications of phenotypes in the phenotype profile. Further comprising information about said phenotype of the phenotype profile. 제30항에 있어서,The method of claim 30, e) 새로운 개체의 새로운 게놈 프로필을 상기 개체의 데이터 세트에 부가하 는 단계;e) adding a new genomic profile of the new individual to the data set of the individual; f) 상기 룰 세트를 상기 새로운 개체의 게놈 프로필에 적용하는 단계; 및f) applying the rule set to the genomic profile of the new individual; And g) 상기 새로운 개체에 대한 표현형 프로필의 초기 리포트를 작성하는 단계g) creating an initial report of phenotype profiles for the new entity 를 추가로 포함하는 방법.How to further include. 제30항에 있어서,The method of claim 30, e) 상기 개체의 새로운 게놈 프로필을 부가하는 단계;e) adding a new genomic profile of said individual; f) 상기 룰 세트를 상기 개체의 새로운 게놈 프로필에 적용하는 단계; 및f) applying the rule set to a new genomic profile of the individual; And g) 상기 개체에 대한 표현형 프로필의 새로운 리포트를 작성하는 단계g) creating a new report of phenotype profiles for the individual 를 포함하는방법.How to include. a) 룰들을 포함하는 룰 세트로서, 각각의 룰은 하나 이상의 유전자형과 하나 이상의 표현형 사이의 상관관계를 나타내는 것인 룰 세트;a) a set of rules comprising rules, each rule representing a correlation between one or more genotypes and one or more phenotypes; b) 상기 룰 세트를 하나 이상의 새로운 룰로 주기적으로 갱신하는 코드로서, 상기 하나 이상의 새로운 룰은, 상기 룰 세트 중 이전에는 서로 상관되지 않은 표현형과 유전자형 사이의 상관관계를 나타내는 것인 코드;b) code for periodically updating the rule set with one or more new rules, wherein the one or more new rules indicate a correlation between phenotypes and genotypes previously uncorrelated with each other in the rule set; c) 복수의 개체에 관한 게놈 프로필을 포함하는 데이터베이스;c) a database comprising genomic profiles for the plurality of individuals; d) 상기 룰 세트를 상기 개체의 게놈 프로필에 적용하여, 상기 개체에 대한 표현형 프로필을 측정하는 코드; 및d) code for applying the rule set to the genomic profile of the individual to determine a phenotype profile for the individual; And e) 각각의 개체에 대한 리포트를 작성하는 코드e) code to generate a report for each object 를 포함하는 시스템.System comprising a. 제82항에 있어서, 상기 리포트는 네트워크상에서 전송되는 것인 시스템.83. The system of claim 82, wherein said report is transmitted over a network. 제82항에 있어서, 상기 리포트는 보안 방식으로 제공되는 것인 시스템.83. The system of claim 82, wherein said report is provided in a secure manner. 제82항에 있어서, 상기 리포트는 비-보안 방식으로 제공되는 것인 시스템.83. The system of claim 82, wherein said report is provided in a non-secure manner. 제82항에 있어서, 상기 리포트는 온-라인 포털을 통해 제공되는 것인 시스템.83. The system of claim 82, wherein said report is provided via an on-line portal. 제82항에 있어서, 상기 리포트는 용지 또는 이-메일을 통해 제공되는 것인 시스템.83. The system of claim 82, wherein said report is provided via paper or e-mail. 제82항에 있어서, 새롭거나 수정된 상관관계를 상기 개체에게 통보하는 코드를 추가로 포함하는 시스템.83. The system of claim 82, further comprising code for notifying the subject of a new or modified correlation. 제82항에 있어서, 상기 개체의 게놈 프로필에 적용될 수 있는, 새롭거나 수정된 룰을 상기 개체에게 통보하는 코드를 추가로 포함하는 시스템.83. The system of claim 82, further comprising code for notifying the individual of new or modified rules that can be applied to the individual's genomic profile. 제82항에 있어서, 상기 개체의 표현형 프로필 중 상기 표현형에 대한 새롭거나 수정된 예방 및 건강 관리 정보를 상기 개체에게 통보하는 코드를 추가로 포함하는 시스템.83. The system of claim 82, further comprising code for notifying the individual of new or modified prevention and health care information for the phenotype in the phenotype profile of the individual. a) 하나 이상의 시료 수집 용기;a) one or more sample collection containers; b) 개체로부터 시료를 얻기 위한 설명서;b) instructions for obtaining a sample from the subject; c) 온-라인 포털을 통하여 상기 시료로부터 얻어진 상기 개체의 게놈 프로필을 액세스하기 위한 설명서;c) instructions for accessing a genomic profile of said individual obtained from said sample through an on-line portal; d) 온-라인 포털을 통해 상기 시료로부터 얻어진 상기 개체의 표현형 프로필을 액세스하기 위한 설명서; 및d) instructions for accessing the phenotype profile of the subject obtained from the sample through an on-line portal; And e) 상기 시료 수집 용기를 상기 시료 처리 시설로 배송하기 위한 포장e) packaging for shipping the sample collection container to the sample processing facility. 을 포함하는 키트.Kit comprising a. 개체가 상기 표현형 프로필을 액세스할 수 있는 웹사이트를 포함하는 온-라인 포털로서, 상기 웹사이트는 상기 개체가 An on-line portal that includes a website from which an entity can access the phenotype profile, wherein the website is defined by the entity. a) 상기 개체의 게놈 프로필에 적용하고자 하는 룰을 선택하는 것;a) selecting rules to apply to the genomic profile of the individual; b) 상기 웹사이트 상에서 초기 리포트 및 갱신된 리포트를 검토하는 것;b) reviewing initial and updated reports on the website; c) 상기 웹사이트로부터 초기 리포트 및 갱신된 리포트를 인쇄하는 것;c) printing an initial report and an updated report from the website; d) 상기 웹사이트로부터 얻은 초기 리포트 및 갱신된 리포트를 상기 개체의 컴퓨터에 저장하는 것;d) storing the initial and updated reports obtained from the website on the entity's computer; e) 상기 개체의 표현형 프로필에 대한 예방 및 건강 관리 정보를 얻는 것;e) obtaining preventive and healthcare information about the phenotype profile of said individual; f) 온-라인이나 전화로 연결된 유전 상담자와 상담하는 것;f) counseling with an on-line or telephone genetic counselor; g) 정보를 추출하여 전문의/유전 상담자와 공유하는 것; 및/또는g) extract information and share it with specialists / genetic counselors; And / or h) 파트너 서비스 및 제품 신청을 액세스하는 것h) access to partner services and product applications; 중 하나 이상을 하도록 하는 것인 온 라인 포털.An online portal that allows one or more of the following. 제92항에 있어서, 상기 정보는 네트워크상에서 전송되는 것인 온-라인 포털.93. The on-line portal of claim 92, wherein said information is transmitted over a network. 제92항에 있어서, 상기 웹사이트는 보안되는 것인 온-라인 포털.95. The on-line portal of claim 92, wherein said website is secure. 제92항에 있어서, 상기 웹사이트는 보안되지 않는 것인 온-라인 포털.95. The on-line portal of claim 92, wherein said website is not secure. 제92항에 있어서, 상기 개체는 그러한 개체에 관한 정보 또는 하나 이상의 그 일부의 보안 수준에 관한 하나 이상의 옵션을 제공받는 것인 온-라인 포털.93. The on-line portal of claim 92, wherein the entity is provided with one or more options regarding the security level of the entity or one or more portions thereof. 제92항에 있어서, 상기 표현형 프로필은 소송 제기가능한(actionable) 의학적 병태를 포함하는 것인 온-라인 포털.95. The on-line portal of claim 92, wherein said phenotype profile comprises an actionable medical condition. 제92항에 있어서, 상기 표현형 프로필은 현재 예방적 차원의 처치 또는 요법이 없는 의학적 병태를 포함하는 것인 온-라인 포털.93. The on-line portal of claim 92, wherein said phenotype profile comprises a medical condition currently without prophylactic treatment or therapy. 제92항에 있어서, 상기 표현형 프로필은 비-의학적 병태를 포함하는 것인 온-라인 포털.93. The on-line portal of claim 92, wherein said phenotype profile comprises a non-medical condition. 개체에 병태가 나타날 위험도를 평가하는 방법으로서, As a method of assessing the risk of developing a condition in an individual, a) 개체의 유전자형을 얻는 단계;a) obtaining the genotype of the individual; b) 상기 유전자형으로부터 GCI 스코어 또는 GCI 플러스 스코어를 측정하는 단계;b) measuring a GCI score or a GCI plus score from said genotype; c) 상기 GCI 스코어 또는 GCI 플러스 스코어를 기초로 하여 리포트를 작성하는 단계; 및c) generating a report based on the GCI score or GCI plus score; And d) 상기 리포트를 상기 개체 또는 상기 개체의 건강 관리 매니저에게 제공하는 단계d) providing the report to the subject or the health care manager of the subject 를 포함하는 방법.How to include. 개체에 병태가 나타날 위험도를 평가하는 방법으로서,As a method of assessing the risk of developing a condition in an individual, a) 개체의 유전자형을 얻는 단계;a) obtaining the genotype of the individual; b) 상기 개체에 대한 게놈 프로필을 형성하는 단계;b) forming a genomic profile for said individual; c) 상기 게놈 프로필과 유전자형의 상관관계에 대한 데이터베이스로부터 개체에 병태가 나타날 위험도를 측정하는 단계;c) determining the risk of developing a condition in the individual from a database of correlations between said genomic profile and genotype; d) 상기 단계 c)로부터 리포트를 작성하는 단계;d) generating a report from step c); e) 상기 개체로부터 새로운 정보를 얻는 단계;e) obtaining new information from the entity; f) 상기 새로운 정보를 통합하여, 병태가 나타날 새로운 위험도를 측정하는 단계;f) incorporating said new information to determine a new risk of developing a condition; g) 상기 단계 f)로부터 리포트를 작성하는 단계; 및g) generating a report from step f); And h) 상기 리포트를 상기 개체 또는 상기 개체의 건강 관리 매니저에게 제공하는 단계h) providing the report to the subject or the health care manager of the subject 를 포함하는 방법.How to include. 개체에 병태가 나타날 위험도를 평가하는 방법으로서, As a method of assessing the risk of developing a condition in an individual, a) 개체의 유전자형을 얻는 단계;a) obtaining the genotype of the individual; b) 상기 개체에 대한 게놈 프로필을 형성하는 단계;b) forming a genomic profile for said individual; c) 상기 게놈 프로필 및 유전자형의 상관관계에 관한 데이터베이스로부터 개체에 병태가 나타날 위험도를 측정하는 단계로서, 상기 위험도는 하나 이상의 SNP를 기초로 하는 것인 단계;c) determining a risk of developing a condition in the individual from a database relating to the genomic profile and genotype correlations, wherein the risk is based on one or more SNPs; d) 상기 단계 c)로부터 리포트를 작성하는 단계; 및d) generating a report from step c); And e) 상기 리포트를 상기 개체 또는 상기 개체의 건강 관리 매니저에게 제공하는 단계e) providing the report to the subject or the health care manager of the subject 를 포함하는 방법.How to include. 제100항 내지 제102항 중 어느 하나의 항에 있어서, 상기 개체의 유전자형은 상기 개체로부터 직접 얻는 것인 방법.102. The method of any one of claims 100-102, wherein the genotype of the subject is obtained directly from the subject. 제100항 내지 제102항 중 어느 하나의 항에 있어서, 상기 개체의 유전자형은 제3자로부터 얻는 것인 방법.102. The method of any one of claims 100-102, wherein the genotype of the individual is obtained from a third party. 제100항 내지 제102항 중 어느 하나의 항에 있어서, 상기 제공 단계는 네트워크상에서 전송을 통하여 이루어지는 것인 방법.103. The method of any one of claims 100-102, wherein the providing step is via transmission over a network. 제101항에 있어서, 상기 새로운 정보는 상기 개체의 생물학적 시료로부터 얻는 것인 방법.102. The method of claim 101, wherein said new information is obtained from a biological sample of said individual. 제101항에 있어서, 상기 새로운 정보는 개체의 신체적 측정치로부터 얻는 것인 방법.102. The method of claim 101, wherein said new information is obtained from an individual's physical measurements. 제101항 또는 제102항에 있어서, 상기 위험도는 GCI 스코어 또는 GCI 플러스 스코어로부터 유도되는 것인 방법.103. The method of claim 101 or 102, wherein said risk is derived from a GCI score or a GCI plus score. 제100항 또는 제108항에 있어서, 상기 GCI 스코어 또는 GCI 플러스 스코어는 상기 개체의 가계를 통합하는 것인 방법.109. The method of claim 100 or 108, wherein the GCI score or GCI plus score consolidates the pedigree of the individual. 제100항 또는 제108항에 있어서, 상기 GCI 스코어 또는 GCI 플러스 스코어는 상기 개체의 성별을 통합하는 것인 방법.109. The method of claim 100 or 108, wherein the GCI score or GCI plus score incorporates the sex of the individual. 제100항 또는 제108항에 있어서, 상기 GCI 스코어 또는 GCI 플러스 스코어는 상기 개체에 특이적인 인자를 통합하며, 상기 인자는 상기 유전자형으로부터 유도되지 않는 것인 방법.109. The method of claim 100 or 108, wherein the GCI score or GCI plus score incorporates a factor specific for the subject and the factor is not derived from the genotype. 제111항에 있어서, 상기 인자는112. The method of claim 111, wherein said factor is 개체의, 출생지, 부모 및/또는 조부모, 친적 가계, 거주 지역, 조상 거주 지역, 환경 조건, 공지된 건강 상태, 공지된 약물 상호 작용, 가족 건강 상태, 생활 방식 상태, 식이, 운동 습관, 결혼 여부, 및 신체적 측정치로 이루어진 군 중에서 선택되는 것인 방법.Of the individual, place of birth, parents and / or grandparents, relatives, residence, ancestor residence, environmental conditions, known health conditions, known drug interactions, family health status, lifestyle status, diet, exercise habits, marital status , And physical measurements. 제107항 또는 제112항에 있어서, 상기 개체의 신체적 측정치는 혈압, 심박수, 글루코스 수준, 대사 물질 수준, 이온 수준, 체중, 신장, 콜레스테롤 수준, 비타민 수준, 혈구 수, 체 질량 지수(BMI), 단백질 수준 및 전사물 수준으로 이루어진 군 중에서 선택되는 것인 방법.112. The method of claim 107 or 112, wherein the individual's physical measurements include blood pressure, heart rate, glucose levels, metabolite levels, ionic levels, weight, height, cholesterol levels, vitamin levels, blood cell counts, body mass index (BMI), The protein level and the transcript level. 개체에 병태가 나타날 위험도를 평가하는 방법으로서, As a method of assessing the risk of developing a condition in an individual, a) 개체의 유전자형을 얻는 단계;a) obtaining the genotype of the individual; b) 상기 개체에 대한 게놈 프로필을 형성하는 단계;b) forming a genomic profile for said individual; c) 개체에 알츠하이머병(AD), 결장직장암(CRC), 골관절염(OA) 또는 박리성 녹내장(XFG)이 나타날 위험도를 측정하는 단계로서, 상기 위험도는 AD에 있어서는 rs4420638, CRC에 있어서는 rs6983267, OA에 있어서는 rs4911178, 그리고 XFG에 있어서는 rs2165241을 기초로 하여 측정하는 것인 단계;c) measuring the risk of developing Alzheimer's disease (AD), colorectal cancer (CRC), osteoarthritis (OA), or exfoliative glaucoma (XFG) in an individual, wherein the risk is rs4420638 for AD, rs6983267 for CRC, and OA. Measuring based on rs4911178 for X and rs2165241 for XFG; d) 상기 단계 c)로부터 리포트를 작성하는 단계; 및d) generating a report from step c); And e) 상기 리포트를 개체 또는 상기 개체의 건강 관리 매니저에게 제공하는 단계e) providing the report to an individual or a health care manager of the individual. 를 포함하는방법.How to include. 제102항에 있어서, 상기 위험도는 3, 4, 5, 6, 7, 8, 9, 10 또는 11개 이상의 SNP로부터 측정되는 것인 방법.107. The method of claim 102, wherein the risk is measured from at least 3, 4, 5, 6, 7, 8, 9, 10 or 11 SNPs. 제102항에 있어서, 상기 위험도는 2개 이상의 SNP로부터 측정되는 것인 방법.107. The method of claim 102, wherein the risk is measured from two or more SNPs. 제116항에 있어서, 상기 위험도는 비만(BMIOB)에 대해 측정되며, 상기 2개 이상의 SNP 중 하나 이상은 rs9939609 또는 rs9291171인 것인 방법.116. The method of claim 116, wherein the risk is measured for obesity (BMIOB) and at least one of the two or more SNPs is rs9939609 or rs9291171. 제116항에 있어서, 상기 위험도는 그레이브스병(GD)에 대해 측정되며, 상기 2개 이상의 SNP 중 하나 이상은 rs3087243이거나, DRB1*0301 DQA1*0501이거나, 또는 DRB1*0301 DQA1*0501과 연관 불균형 상태로 있는 것인 방법.117. The method of claim 116, wherein the risk is measured for Graves' disease (GD), and at least one of the two or more SNPs is rs3087243, DRB1 * 0301 DQA1 * 0501, or an imbalance associated with DRB1 * 0301 DQA1 * 0501. How to be. 제116항에 있어서, 상기 위험도는 혈색소 침착증(HEM)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs1800562 또는 rs129128인 것인 방법.116. The method of claim 116, wherein the risk is measured for hemochromatosis (HEM) and at least one of the two or more SNPs is rs1800562 or rs129128. 제116항에 있어서, 상기 위험도는 심근 경색증(MI)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs1866389, rs1333049 또는 rs6922269인 것인 방법.116. The method of claim 116, wherein the risk is measured for myocardial infarction (MI) and at least one of the two or more SNPs is rs1866389, rs1333049 or rs6922269. 제116항에 있어서, 상기 위험도는 다발성 경화증(MS)에 대해서 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs6897932, rs12722489 또는 DRB1*1501인 것인 방법.116. The method of claim 116, wherein the risk is measured for multiple sclerosis (MS) and at least one of the two or more SNPs is rs6897932, rs12722489 or DRB1 * 1501. 제116항에 있어서, 상기 위험도는 건선(PS)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs6859018, rs11209026 또는 HLAC*0602인 것인 방법.117. The method of claim 116, wherein the risk is measured for psoriasis (PS) and at least one of the two or more SNPs is rs6859018, rs11209026 or HLAC * 0602. 제116항에 있어서, 상기 위험도는 하지 불안 증후군(RLS)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs6904723, rs2300478, rs1026732 또는 rs9296249인 것인 방법.117. The method of claim 116, wherein the risk is measured for Lower Anxiety Syndrome (RLS) and at least one of the two or more SNPs is rs6904723, rs2300478, rs1026732 or rs9296249. 제116항에 있어서, 상기 위험도는 셀리악병(CelD)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs6840978, rs11571315, rs2187668 또는 DQA1*0301 또는 DQB1*0302인 것인 방법.116. The method of claim 116, wherein the risk is measured for celiac disease (CelD) and at least one of the two or more SNPs is rs6840978, rs11571315, rs2187668 or DQA1 * 0301 or DQB1 * 0302. 제116항에 있어서, 상기 위험도는 전립선암(PC)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs4242384, rs6983267, rs16901979, rs17765344 또는 rs4430796인 것인 방법.117. The method of claim 116, wherein the risk is measured for prostate cancer (PC) and at least one of the two or more SNPs is rs4242384, rs6983267, rs16901979, rs17765344 or rs4430796. 제116항에 있어서, 상기 위험도는 낭창(SLE)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs12531711, rs10954213, rs2004640, DRB1*0301 또는 DRB1*1501인 것인 방법.117. The method of claim 116, wherein the risk is measured for lupus (SLE) and at least one of the two or more SNPs is rs12531711, rs10954213, rs2004640, DRB1 * 0301, or DRB1 * 1501. 제116항에 있어서, 상기 위험도는 황반 변성증(AMD)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs10737680, rs10490924, rs541862, rs2230199, rs1061170 또는 rs9332739인 것인 방법.117. The method of claim 116, wherein the risk is measured for macular degeneration (AMD) and at least one of the two or more SNPs is rs10737680, rs10490924, rs541862, rs2230199, rs1061170 or rs9332739. 제116항에 있어서, 상기 위험도는 류머티즘성 관절염(RA)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs6679677, rs11203367, rs6457617, DRB*0101, DRB1*0401 또는 DRB1*0404인 것인 방법.117. The method of claim 116, wherein the risk is measured for rheumatoid arthritis (RA) and at least one of the two or more SNPs is rs6679677, rs11203367, rs6457617, DRB * 0101, DRB1 * 0401 or DRB1 * 0404 . 제116항에 있어서, 상기 위험도는 유방암(BC)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs3803662, rs2981582, rs4700485, rs3817198, rs17468277, rs6721996 또는 rs3803662인 것인 방법.116. The method of claim 116, wherein the risk is measured for breast cancer (BC) and at least one of the two or more SNPs is rs3803662, rs2981582, rs4700485, rs3817198, rs17468277, rs6721996 or rs3803662. 제116항에 있어서, 상기 위험도는 크론병(CD)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs2066845, rs5743293, rs1O883365, rs17234657, rs10210302, rs9858542, rs11805303, rs1OOO113, rs17221417, rs2542151 또는 rs1O761659인 것인 방법.116. The method of claim 116, wherein the risk is measured for Crohn's disease (CD), and at least one of the two or more SNPs is rs2066845, rs5743293, rs1O883365, rs17234657, rs10210302, rs9858542, rs11805303, rs1OOOO113, rs17221417, rs2542151659 or rsO How. 제116항에 있어서, 상기 위험도는 제2형 당뇨병(T2D)에 대해 측정되고, 상기 2개 이상의 SNP 중 하나 이상은 rs13266634, rs4506565, rs10012946, rs7756992, rs10811661, rs12288738, rs8050136, rs1111875, rs4402960, rs5215 또는 rs1801282인 것인 방법.117. The method of claim 116, wherein the risk is measured for type 2 diabetes (T2D), and at least one of the two or more SNPs is rs13266634, rs4506565, rs10012946, rs7756992, rs10811661, rs12288738, rs8050136, rs1111875, rs4402960, rs5215 or the method is rs1801282.
KR1020097013756A 2006-11-30 2007-11-30 Genetic analysis systems and methods KR20090105921A (en)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US86806606P 2006-11-30 2006-11-30
US60/868,066 2006-11-30
US95112307P 2007-07-20 2007-07-20
US60/951,123 2007-07-20
US11/781,679 2007-07-23
US11/781,679 US20080131887A1 (en) 2006-11-30 2007-07-23 Genetic Analysis Systems and Methods
US97219807P 2007-09-13 2007-09-13
US60/972,198 2007-09-13
US98562207P 2007-11-05 2007-11-05
US60/985,622 2007-11-05
US98968507P 2007-11-21 2007-11-21
US60/989,685 2007-11-21
PCT/US2007/086138 WO2008067551A2 (en) 2006-11-30 2007-11-30 Genetic analysis systems and methods

Publications (1)

Publication Number Publication Date
KR20090105921A true KR20090105921A (en) 2009-10-07

Family

ID=38962435

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097013756A KR20090105921A (en) 2006-11-30 2007-11-30 Genetic analysis systems and methods

Country Status (10)

Country Link
EP (1) EP2102651A4 (en)
JP (2) JP2010522537A (en)
KR (1) KR20090105921A (en)
CN (1) CN103642902B (en)
AU (1) AU2007325021B2 (en)
CA (1) CA2671267A1 (en)
GB (1) GB2444410B (en)
HK (1) HK1139737A1 (en)
TW (1) TWI363309B (en)
WO (1) WO2008067551A2 (en)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101295785B1 (en) * 2011-10-31 2013-08-12 삼성에스디에스 주식회사 Apparatus and Method for Constructing Gene-Disease Relation Database
KR20140009854A (en) * 2012-07-13 2014-01-23 삼성전자주식회사 Method and apparatus for analyzing gene information for treatment decision
KR20140023607A (en) * 2012-08-16 2014-02-27 삼성전자주식회사 Method and apparatus for analyzing personalized multi-omics data
KR101400946B1 (en) * 2013-12-27 2014-05-29 한국과학기술정보연구원 Biological network analyzing device and method thereof
WO2014119914A1 (en) * 2013-02-01 2014-08-07 에스케이텔레콤 주식회사 Method for providing information about gene sequence-based personal marker and apparatus using same
KR101533395B1 (en) * 2013-01-21 2015-07-08 이상열 Method and system estimating resemblance between subject using single nucleotide polymorphism
KR20150078236A (en) * 2013-12-30 2015-07-08 주식회사 케이티 Method and System for personalized healthcare
WO2017014469A1 (en) * 2015-07-22 2017-01-26 주식회사 케이티 Disease risk prediction method, and device for performing same
WO2017086675A1 (en) * 2015-11-19 2017-05-26 연세대학교 산학협력단 Apparatus for diagnosing metabolic abnormalities and method therefor
KR20170134203A (en) * 2016-05-27 2017-12-06 (주) 메디젠휴먼케어 A system and apparatus for disease-related genomic analysis using SNP
WO2018021636A1 (en) * 2016-07-29 2018-02-01 (주)신테카바이오 Human haplotyping system and method
KR20190019395A (en) * 2017-08-17 2019-02-27 (주)에이엔티홀딩스 Method, system and non-transitory computer-readable recording medium for providing a service based on genetic information
KR20190077997A (en) * 2017-12-26 2019-07-04 주식회사 클리노믹스 Method for disease and phenotype risk score calculation
KR102136207B1 (en) * 2019-12-31 2020-07-21 주식회사 클리노믹스 Sytem for providing personalized social contents imformation based on genetic information and method thereof
KR102179850B1 (en) * 2019-12-06 2020-11-17 주식회사 클리노믹스 System and method for predicting health using analysis device for intraoral microbes (bacteria, virus, viroid, and/or fungi)
KR20210000070A (en) * 2019-06-24 2021-01-04 (주) 아이크로진 Service method and platform for visualizing using a gene information
KR102223362B1 (en) * 2020-08-10 2021-03-05 주식회사 쓰리빌리언 System and method to identify disease associated genetic variants by using symptom associated genetic variants relationship
KR102223361B1 (en) * 2020-09-23 2021-03-05 주식회사 쓰리빌리언 System for diagnosing genetic disease using gene network
WO2021045270A1 (en) * 2019-09-02 2021-03-11 주식회사 클리노믹스 System for providing genetic zodiac sign using genetic information between testee and organism, and method therefor
WO2021112319A1 (en) * 2019-12-06 2021-06-10 주식회사 클리노믹스 System and method for providing genetic surname information by using genomic information
WO2021137563A1 (en) * 2020-01-02 2021-07-08 주식회사 클리노믹스 Method for providing identity analysis service using standard genomic map for each nationality, ethnicity, and race

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8340950B2 (en) 2006-02-10 2012-12-25 Affymetrix, Inc. Direct to consumer genotype-based products and services
US20080131887A1 (en) 2006-11-30 2008-06-05 Stephan Dietrich A Genetic Analysis Systems and Methods
WO2008103299A2 (en) 2007-02-16 2008-08-28 Massachusetts Eye & Ear Infirmary Methods and compositions for prognosing, detecting, and treating age-related macular degeneration
US7844609B2 (en) 2007-03-16 2010-11-30 Expanse Networks, Inc. Attribute combination discovery
FR2934698B1 (en) * 2008-08-01 2011-11-18 Commissariat Energie Atomique PREDICTION METHOD FOR THE PROGNOSIS OR DIAGNOSIS OR THERAPEUTIC RESPONSE OF A DISEASE AND IN PARTICULAR PROSTATE CANCER AND DEVICE FOR PERFORMING THE METHOD.
WO2010017520A1 (en) * 2008-08-08 2010-02-11 Navigenics, Inc. Methods and systems for personalized action plans
BRPI0918889A2 (en) * 2008-09-12 2015-12-01 Navigenics Inc method for generating a score for an environmental genetic composite index (egci) for an individual's disease or condition
NZ572036A (en) 2008-10-15 2010-03-26 Nikola Kirilov Kasabov Data analysis and predictive systems and related methodologies
WO2010067381A1 (en) * 2008-12-12 2010-06-17 Decode Genetics Ehf Genetic variants as markers for use in diagnosis, prognosis and treatment of eosinophilia, asthma, and myocardial infarction
US8108406B2 (en) 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
EP3276526A1 (en) 2008-12-31 2018-01-31 23Andme, Inc. Finding relatives in a database
AU2010242073C1 (en) 2009-04-30 2015-12-24 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
AU2010256343B2 (en) * 2009-06-01 2014-01-30 Genetic Technologies Limited Methods for breast cancer risk assessment
DE102010013114B4 (en) * 2010-03-26 2012-02-16 Rüdiger Lawaczeck Prediagnostic safety system
KR20110136638A (en) * 2010-06-15 2011-12-21 재단법인 게놈연구재단 Online social network construction method and system with personal genome data
WO2012006669A1 (en) * 2010-07-13 2012-01-19 Fitgenes Pty Ltd System and method for determining personal health intervention
WO2012030967A1 (en) * 2010-08-31 2012-03-08 Knome, Inc. Personal genome indexer
US20120309641A1 (en) 2010-10-19 2012-12-06 Medtronic, Inc. Diagnostic kits, genetic markers, and methods for scd or sca therapy selection
EP2636003B1 (en) * 2010-11-01 2019-08-14 Koninklijke Philips N.V. In vitro diagnostic testing including automated brokering of royalty payments for proprietary tests
US9163281B2 (en) 2010-12-23 2015-10-20 Good Start Genetics, Inc. Methods for maintaining the integrity and identification of a nucleic acid template in a multiplex sequencing reaction
US8718950B2 (en) 2011-07-08 2014-05-06 The Medical College Of Wisconsin, Inc. Methods and apparatus for identification of disease associated mutations
CA2812342C (en) * 2011-09-26 2015-04-07 John TRAKADIS Method and system for genetic trait search based on the phenotype and the genome of a human subject
US10378060B2 (en) 2011-10-14 2019-08-13 Dana-Farber Cancer Institute, Inc. ZNF365/ZFP365 biomarker predictive of anti-cancer response
US10437858B2 (en) 2011-11-23 2019-10-08 23Andme, Inc. Database and data processing system for use with a network-based personal genetics services platform
US8209130B1 (en) 2012-04-04 2012-06-26 Good Start Genetics, Inc. Sequence assembly
JP5844715B2 (en) 2012-11-07 2016-01-20 学校法人沖縄科学技術大学院大学学園 Data communication system, data analysis apparatus, data communication method, and program
EP2971159B1 (en) 2013-03-14 2019-05-08 Molecular Loop Biosolutions, LLC Methods for analyzing nucleic acids
US20140274763A1 (en) * 2013-03-15 2014-09-18 Pathway Genomics Corporation Method and system to predict response to pain treatments
US9192647B2 (en) 2013-10-04 2015-11-24 Hans-Michael Dosch Method for reversing recent-onset type 1 diabetes (T1D) by administering substance P (sP)
US10851414B2 (en) 2013-10-18 2020-12-01 Good Start Genetics, Inc. Methods for determining carrier status
TW201516725A (en) * 2013-10-18 2015-05-01 Tci Gene Inc Single nucleotide polymorphism disease incidence prediction system
FI20136079A (en) * 2013-11-04 2015-05-05 Medisapiens Oy Genetic health assessment procedure and system
DE202014010499U1 (en) 2013-12-17 2015-10-20 Kymab Limited Targeting of human PCSK9 for cholesterol treatment
CN106460062A (en) 2014-05-05 2017-02-22 美敦力公司 Methods and compositions for SCD, CRT, CRT-D, or SCA therapy identification and/or selection
US11053548B2 (en) 2014-05-12 2021-07-06 Good Start Genetics, Inc. Methods for detecting aneuploidy
EP3332790A1 (en) 2014-07-15 2018-06-13 Kymab Limited Antibodies for use in treating conditions related to specific pcsk9 variants in specific patients populations
EP4328245A3 (en) 2014-07-15 2024-06-05 Kymab Ltd. Antibodies for use in treating conditions related to specific pcsk9 variants in specific patients populations
DE202015009002U1 (en) 2014-07-15 2016-08-18 Kymab Limited Targeting of human PCSK9 for cholesterol treatment
WO2016023916A1 (en) 2014-08-12 2016-02-18 Kymab Limited Treatment of disease using ligand binding to targets of interest
US20180032673A1 (en) * 2014-09-03 2018-02-01 Otsuka Pharmaceutical Co., Ltd. Pathology determination assistance device, method and storage medium
US11408024B2 (en) 2014-09-10 2022-08-09 Molecular Loop Biosciences, Inc. Methods for selectively suppressing non-target sequences
EP3224595A4 (en) 2014-09-24 2018-06-13 Good Start Genetics, Inc. Process control for increased robustness of genetic assays
WO2016071701A1 (en) 2014-11-07 2016-05-12 Kymab Limited Treatment of disease using ligand binding to targets of interest
WO2016112073A1 (en) 2015-01-06 2016-07-14 Good Start Genetics, Inc. Screening for structural variants
CA2974199A1 (en) 2015-01-20 2016-07-28 Nantomics, Llc Systems and methods for response prediction to chemotherapy in high grade bladder cancer
EP3256606B1 (en) * 2015-02-09 2019-05-22 10X Genomics, Inc. Systems and methods for determining structural variation
CA2978708A1 (en) * 2015-03-03 2016-09-09 Nantomics, Llc Ensemble-based research recommendation systems and methods
WO2017048945A1 (en) * 2015-09-16 2017-03-23 Good Start Genetics, Inc. Systems and methods for medical genetic testing
AU2016324166A1 (en) * 2015-09-18 2018-05-10 Omicia, Inc. Predicting disease burden from genome variants
FR3045874B1 (en) * 2015-12-18 2019-06-14 Axlr, Satt Du Languedoc Roussillon ARCHITECTURE FOR GENOMIC DATA ANALYSIS
JP6776576B2 (en) * 2016-03-28 2020-10-28 富士通株式会社 Database processing program, database processing device and database processing method
EP3479272A1 (en) * 2016-06-29 2019-05-08 Koninklijke Philips N.V. Disease-oriented genomic anonymization
WO2018042185A1 (en) * 2016-09-02 2018-03-08 Imperial Innovations Ltd Methods, systems and apparatus for identifying pathogenic gene variants
CN106778083A (en) * 2016-11-28 2017-05-31 墨宝股份有限公司 A kind of method and device for automatically generating genetic test report
EP3553737A4 (en) * 2016-12-12 2019-11-06 Nec Corporation Information processing device, genetic information creation method, and program
WO2018168986A1 (en) * 2017-03-15 2018-09-20 東洋紡株式会社 Gene testing method and gene testing kit
CN108629153A (en) * 2017-03-23 2018-10-09 广州康昕瑞基因健康科技有限公司 Cma gene analysis method and system
US20200174021A1 (en) * 2017-08-08 2020-06-04 Queensland University Of Technology Methods for diagnosis of early stage heart failure
CN108549795A (en) * 2018-03-13 2018-09-18 刘吟 Genetic counselling information system based on pedigree chart frame
GB201810897D0 (en) * 2018-07-03 2018-08-15 Chronomics Ltd Phenotype prediction
CN109355368A (en) * 2018-10-22 2019-02-19 江苏美因康生物科技有限公司 A kind of kit and method of quick detection hypertension individuation medication gene pleiomorphism
US10896742B2 (en) 2018-10-31 2021-01-19 Ancestry.Com Dna, Llc Estimation of phenotypes using DNA, pedigree, and historical data
GB2578727A (en) * 2018-11-05 2020-05-27 Earlham Inst Genomic analysis
WO2020132456A1 (en) * 2018-12-20 2020-06-25 The Johns Hopkins University Treating type 1 diabetes, other autoimmune diseases
JP7137520B2 (en) * 2019-04-23 2022-09-14 ジェネシスヘルスケア株式会社 How to determine the risk of pancreatitis
JP7137522B2 (en) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 How to determine your scoliosis risk
JP7137521B2 (en) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 How to determine your risk of psoriasis
JP7137525B2 (en) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 How to determine the risk of contact dermatitis
JP7137523B2 (en) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 How to determine your risk of hives
JP7137526B2 (en) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 Methods for determining the risk of atopic dermatitis
JP7137524B2 (en) * 2019-04-24 2022-09-14 ジェネシスヘルスケア株式会社 Methods for determining risk of knee osteoarthritis
CN113921143B (en) * 2021-10-08 2024-04-16 天津金域医学检验实验室有限公司 Personalized estimation method and system for Bayes factors in coseparation analysis
CN114360732B (en) * 2022-01-12 2024-04-09 平安科技(深圳)有限公司 Medical data analysis method, device, electronic equipment and storage medium

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000067139A (en) * 1998-08-25 2000-03-03 Hitachi Ltd Electronic medical sheet system
AU785341B2 (en) * 1999-08-27 2007-01-25 Iris Biotechnologies Inc. Artificial intelligence system for genetic analysis
WO2001026029A2 (en) * 1999-10-01 2001-04-12 Orchid Biosciences, Inc. Method and system for providing genotype clinical information over a computer network
US20020019746A1 (en) * 2000-03-16 2002-02-14 Rienhoff Hugh Y. Aggregating persons with a select profile for further medical characterization
JP2002107366A (en) * 2000-10-02 2002-04-10 Hitachi Ltd Diagnosis-assisting system
AU2001297684A1 (en) * 2000-12-04 2002-08-19 Genaissance Pharmaceuticals, Inc. System and method for the management of genomic data
US20020128860A1 (en) * 2001-01-04 2002-09-12 Leveque Joseph A. Collecting and managing clinical information
US20020187483A1 (en) * 2001-04-20 2002-12-12 Cerner Corporation Computer system for providing information about the risk of an atypical clinical event based upon genetic information
US7461006B2 (en) * 2001-08-29 2008-12-02 Victor Gogolak Method and system for the analysis and association of patient-specific and population-based genomic data with drug safety adverse event data
US20030104453A1 (en) * 2001-11-06 2003-06-05 David Pickar System for pharmacogenetics of adverse drug events
US20040053263A1 (en) * 2002-08-30 2004-03-18 Abreu Maria T. Mutations in NOD2 are associated with fibrostenosing disease in patients with Crohn's disease
WO2004109551A1 (en) * 2003-06-05 2004-12-16 Hitachi High-Technologies Corporation Information providing system and program using base sequence related information
GB0313964D0 (en) * 2003-06-16 2003-07-23 Mars Inc Genotype test
US7084264B2 (en) * 2003-07-16 2006-08-01 Chau-Ting Yeh Viral sequences
US8222005B2 (en) * 2003-09-17 2012-07-17 Agency For Science, Technology And Research Method for gene identification signature (GIS) analysis
CN1867922A (en) * 2003-10-15 2006-11-22 株式会社西格恩波斯特 Method of determining genetic polymorphism for judgment of degree of disease risk, method of judging degree of disease risk, and judgment array
US20050214811A1 (en) * 2003-12-12 2005-09-29 Margulies David M Processing and managing genetic information
US7127355B2 (en) * 2004-03-05 2006-10-24 Perlegen Sciences, Inc. Methods for genetic analysis
US20070265217A1 (en) * 2004-07-16 2007-11-15 Bayer Healthcare Ag Single Nucleotide Polymorphisms as Prognostic Tool to Diagnose Adverse Drug Reactions (Adr) and Drug Efficacy
EP1824996A2 (en) * 2004-11-19 2007-08-29 Oy Jurilab Ltd Method and kit for detecting a risk of essential arterial hypertension

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101295785B1 (en) * 2011-10-31 2013-08-12 삼성에스디에스 주식회사 Apparatus and Method for Constructing Gene-Disease Relation Database
KR20140009854A (en) * 2012-07-13 2014-01-23 삼성전자주식회사 Method and apparatus for analyzing gene information for treatment decision
KR20140023607A (en) * 2012-08-16 2014-02-27 삼성전자주식회사 Method and apparatus for analyzing personalized multi-omics data
KR101533395B1 (en) * 2013-01-21 2015-07-08 이상열 Method and system estimating resemblance between subject using single nucleotide polymorphism
WO2014119914A1 (en) * 2013-02-01 2014-08-07 에스케이텔레콤 주식회사 Method for providing information about gene sequence-based personal marker and apparatus using same
US9984184B2 (en) 2013-12-27 2018-05-29 Korea Institute Of Science And Technology Information Biological network analysis device and method therefor
KR101400946B1 (en) * 2013-12-27 2014-05-29 한국과학기술정보연구원 Biological network analyzing device and method thereof
WO2015099264A1 (en) * 2013-12-27 2015-07-02 한국과학기술정보연구원 Biological network analyzing device and method
KR20150078236A (en) * 2013-12-30 2015-07-08 주식회사 케이티 Method and System for personalized healthcare
WO2017014469A1 (en) * 2015-07-22 2017-01-26 주식회사 케이티 Disease risk prediction method, and device for performing same
KR20170011389A (en) * 2015-07-22 2017-02-02 주식회사 케이티 Method and apparatus for predicting the disease risk
WO2017086675A1 (en) * 2015-11-19 2017-05-26 연세대학교 산학협력단 Apparatus for diagnosing metabolic abnormalities and method therefor
KR20170134203A (en) * 2016-05-27 2017-12-06 (주) 메디젠휴먼케어 A system and apparatus for disease-related genomic analysis using SNP
KR20190080832A (en) * 2016-05-27 2019-07-08 (주) 메디젠휴먼케어 A system and apparatus for disease-related genomic analysis using SNP
WO2018021636A1 (en) * 2016-07-29 2018-02-01 (주)신테카바이오 Human haplotyping system and method
US10540324B2 (en) 2016-07-29 2020-01-21 Syntekabio Co., Ltd. Human haplotyping system and method
KR20190019395A (en) * 2017-08-17 2019-02-27 (주)에이엔티홀딩스 Method, system and non-transitory computer-readable recording medium for providing a service based on genetic information
WO2019035691A3 (en) * 2017-08-17 2019-07-04 (주)에이엔티홀딩스 Method, system, and non-transitory computer readable recording medium for providing service on basis of gene information
KR20190077997A (en) * 2017-12-26 2019-07-04 주식회사 클리노믹스 Method for disease and phenotype risk score calculation
KR20210000070A (en) * 2019-06-24 2021-01-04 (주) 아이크로진 Service method and platform for visualizing using a gene information
WO2021045270A1 (en) * 2019-09-02 2021-03-11 주식회사 클리노믹스 System for providing genetic zodiac sign using genetic information between testee and organism, and method therefor
KR102179850B1 (en) * 2019-12-06 2020-11-17 주식회사 클리노믹스 System and method for predicting health using analysis device for intraoral microbes (bacteria, virus, viroid, and/or fungi)
WO2021112319A1 (en) * 2019-12-06 2021-06-10 주식회사 클리노믹스 System and method for providing genetic surname information by using genomic information
WO2021112317A1 (en) * 2019-12-06 2021-06-10 주식회사 클리노믹스 Health prediction system and method using oral microorganism analysis device
KR102136207B1 (en) * 2019-12-31 2020-07-21 주식회사 클리노믹스 Sytem for providing personalized social contents imformation based on genetic information and method thereof
WO2021137539A1 (en) * 2019-12-31 2021-07-08 주식회사 클리노믹스 System for providing genetic information-based personalized social content information, and method thereof
WO2021137563A1 (en) * 2020-01-02 2021-07-08 주식회사 클리노믹스 Method for providing identity analysis service using standard genomic map for each nationality, ethnicity, and race
KR102223362B1 (en) * 2020-08-10 2021-03-05 주식회사 쓰리빌리언 System and method to identify disease associated genetic variants by using symptom associated genetic variants relationship
KR102223361B1 (en) * 2020-09-23 2021-03-05 주식회사 쓰리빌리언 System for diagnosing genetic disease using gene network

Also Published As

Publication number Publication date
WO2008067551A2 (en) 2008-06-05
TW200847056A (en) 2008-12-01
HK1139737A1 (en) 2010-09-24
AU2007325021A1 (en) 2008-06-05
JP2010522537A (en) 2010-07-08
GB0723512D0 (en) 2008-01-09
WO2008067551A3 (en) 2008-12-11
EP2102651A2 (en) 2009-09-23
JP2014140387A (en) 2014-08-07
CN103642902A (en) 2014-03-19
AU2007325021B2 (en) 2013-05-09
CN103642902B (en) 2016-01-20
CA2671267A1 (en) 2008-06-05
GB2444410A (en) 2008-06-04
TWI363309B (en) 2012-05-01
GB2444410B (en) 2011-08-24
EP2102651A4 (en) 2010-11-17

Similar Documents

Publication Publication Date Title
KR20090105921A (en) Genetic analysis systems and methods
TWI423063B (en) Methods and systems for personalized action plans
JP5491400B2 (en) Method and system for genome analysis using ancestor data
TWI423151B (en) Methods and systems for incorporating multiple environmental and genetic risk factors
US20200027557A1 (en) Multimodal modeling systems and methods for predicting and managing dementia risk for individuals
US9092391B2 (en) Genetic analysis systems and methods
Begg et al. Variation of breast cancer risk among BRCA1/2 carriers
Misganaw et al. Polygenic risk associated with post-traumatic stress disorder onset and severity
Mégarbané et al. Developmental delay, intellectual disability, short stature, subglottic stenosis, hearing impairment, onychodysplasia of the index fingers, and distinctive facial features: A newly reported autosomal recessive syndrome
Leighton Population-based Genotype-phenotype Correlation to Stratify Incident Cases of Motor Neurone Disease in Scotland, from 2015-2017
Umlai Application of Genomics for the Precision Molecular Diagnosis of Rare Short Stature Disorders
Burook et al. Polygenic risk associated with post-traumatic stress disorder onset and severity
Desiderio et al. Wiley series on mass spectrometry
DClinPsy et al. Genome-wide analysis of self-reported risk-taking behaviour and cross-disorder genetic
Munafò et al. CRUK Integrative Cancer Epidemiology Programme

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid