KR101533395B1 - 단일 염기 다형성을 이용한 개체간의 유사도 산출 방법 및 시스템 - Google Patents

단일 염기 다형성을 이용한 개체간의 유사도 산출 방법 및 시스템 Download PDF

Info

Publication number
KR101533395B1
KR101533395B1 KR1020130006489A KR20130006489A KR101533395B1 KR 101533395 B1 KR101533395 B1 KR 101533395B1 KR 1020130006489 A KR1020130006489 A KR 1020130006489A KR 20130006489 A KR20130006489 A KR 20130006489A KR 101533395 B1 KR101533395 B1 KR 101533395B1
Authority
KR
South Korea
Prior art keywords
entity
snp
similarity
degree
phenotype
Prior art date
Application number
KR1020130006489A
Other languages
English (en)
Other versions
KR20140094152A (ko
Inventor
우정훈
금창원
박제환
Original Assignee
이상열
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이상열 filed Critical 이상열
Priority to KR1020130006489A priority Critical patent/KR101533395B1/ko
Publication of KR20140094152A publication Critical patent/KR20140094152A/ko
Application granted granted Critical
Publication of KR101533395B1 publication Critical patent/KR101533395B1/ko

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65BMACHINES, APPARATUS OR DEVICES FOR, OR METHODS OF, PACKAGING ARTICLES OR MATERIALS; UNPACKING
    • B65B25/00Packaging other articles presenting special problems
    • B65B25/20Packaging garments, e.g. socks, stockings, shirts
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65BMACHINES, APPARATUS OR DEVICES FOR, OR METHODS OF, PACKAGING ARTICLES OR MATERIALS; UNPACKING
    • B65B35/00Supplying, feeding, arranging or orientating articles to be packaged
    • B65B35/10Feeding, e.g. conveying, single articles
    • B65B35/22Feeding, e.g. conveying, single articles by roller-ways
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65BMACHINES, APPARATUS OR DEVICES FOR, OR METHODS OF, PACKAGING ARTICLES OR MATERIALS; UNPACKING
    • B65B35/00Supplying, feeding, arranging or orientating articles to be packaged
    • B65B35/56Orientating, i.e. changing the attitude of, articles, e.g. of non-uniform cross-section
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65BMACHINES, APPARATUS OR DEVICES FOR, OR METHODS OF, PACKAGING ARTICLES OR MATERIALS; UNPACKING
    • B65B55/00Preserving, protecting or purifying packages or package contents in association with packaging
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65HHANDLING THIN OR FILAMENTARY MATERIAL, e.g. SHEETS, WEBS, CABLES
    • B65H23/00Registering, tensioning, smoothing or guiding webs
    • B65H23/04Registering, tensioning, smoothing or guiding webs longitudinally
    • B65H23/048Registering, tensioning, smoothing or guiding webs longitudinally by positively actuated movable bars or rollers
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65HHANDLING THIN OR FILAMENTARY MATERIAL, e.g. SHEETS, WEBS, CABLES
    • B65H2801/00Application field
    • B65H2801/81Packaging machines
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65HHANDLING THIN OR FILAMENTARY MATERIAL, e.g. SHEETS, WEBS, CABLES
    • B65H35/00Delivering articles from cutting or line-perforating machines; Article or web delivery apparatus incorporating cutting or line-perforating devices, e.g. adhesive tape dispensers
    • B65H35/04Delivering articles from cutting or line-perforating machines; Article or web delivery apparatus incorporating cutting or line-perforating devices, e.g. adhesive tape dispensers from or with transverse cutters or perforators

Landscapes

  • Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

단일 염기 다형성을 이용한 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 방법 및 시스템을 제공한다. 또한, 상기 방법을 실현시키기 위한 프로그램을 기록한, 컴퓨터로 가독가능한 기록매체를 제공한다.

Description

단일 염기 다형성을 이용한 개체간의 유사도 산출 방법 및 시스템{Method and system estimating resemblance between subject using single nucleotide polymorphism}
단일 염기 다형성을 이용한 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 방법 및 시스템에 관한 것이다. 또한, 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
지난 10년간 기술의 급격한 진보를 바탕으로 한 사람의 전체 유전서열을 읽어내는 비용은 급격히 감소하고 있다. 칩 기술에 기반한 단일 염기 다형성 게놈타이핑(SNP genotyping) 기술은 전체 유전자 서열 중, 사람마다 서로 다른 영역만을 읽어내어 저렴하고, 빠른 속도로 유전자 서열 분석을 할 수 있다. 또한 전체의 유전정보를 탐색하여 정상인 그룹과 환자 그룹 사이에서 유의한 차이가 나는 유전요인을 찾아내는 연구인 GWAS(Genome Wide Association Study)도 있다. GWAS는 전체 유전서열 중, 특정 표현형의 발현에 영향을 주는 서열 변이가 무엇인지 밝혀내는 연구이다. 약 2006년부터 축적되기 시작한 GWAS는 2012년 약 400여개의 표현형에 대한 관련 유전변이를 밝혀냈다.
예를 들면, 약 4000명의 인구집단에 대하여 어떤 유전자 변이가 사람의 음주 성향에 영향을 주는지 발표되었다. 이러한 발표를 통해 ALDH2 (aldehyde dehydrogenase 2), CCDC63(coiled-coil domain containing 63) 등과 같은 유전자의 서열이 사람마다 다른데, 이렇게 다른 유전자 서열은 사람들의 음주 성향과 관련이 있다는 것이 확인되었다.
최근 이러한 연구 기반에 근거하여, 사람들의 유전자 서열과 표현형과의 관련성을 나타내는 연구가 이루어지고 있다. 유전 정보를 이용하여 표현형과의 관련성을 나타내는 연구, 예를 들면 유전 정보를 이용한 표현형 발현의 예측 연구는 환경적 요인을 충분히 고려하지 못한 채, 개체의 유전적 요인만을 이용하여 개체의 표현형과의 관련성을 연구하고 있는 실정이다. 질병을 포함하는 표현형의 발현에 환경적 요인의 영향은 크다고 알려져 있다. 따라서 환경적 요인의 영향을 배제한, 개체의 유전적 요인만을 이용한 개체의 표현형과의 관련성 연구는 그 정확도가 떨어지고 있는 실정이다.
본 발명자는 부모와 자식 간의 표현형의 유사성을 유추하기 위하여 다양한 유전형을 이용하는 기술을 개발하는 과정에서 본 발명을 완성하였다.
일 양상은 단일 염기 다형성을 이용한 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 방법을 제공한다.
다른 양상은 단일 염기 다형성을 이용한 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 시스템을 제공한다.
다른 양상은 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 가독가능한 기록매체를 제공한다.
일 양상은 제3 개체와 제1 개체 및/또는 제2 개체의 게놈 프로파일을 수신받는 단계; 상기 게놈 프로파일로부터 소정의 표현형과 관련된 단일염기 다형성(Single Nucleotide Polymorphism; SNP)에 대한 정보를 추출하는 단계; 추출된 SNP에 대한 정보로부터, 제3 개체의 SNP와 제1 개체 및/또는 제2 개체의 SNP와의 일치 정도를 기반으로 제3 개체의 제1 개체 및/또는 제2 개체와의 유사도를 연산하는 단계;를 포함하는 것인 SNP로부터 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 방법을 제공한다.
상기 SNP로부터 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 방법은 하나 이상의 프로세서가 수행할 수 있다.
상기 방법은 SNP로부터 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 방법은 제3 개체와 제1 개체 및/또는 제2 개체의 게놈 프로파일을 수신받는 단계를 포함할 수 있다. 대안적으로, 제3 개체와 제1 개체 및/또는 제2 개체의 게놈 프로파일은 프로세서의 데이터베이스로부터 검색될 수 있다. 상기 데이터베이스는 복수의 개체의 게놈 프로파일을 저장한다.
개체는 상기 방법을 이용하고자 하는 사용자일 수 있다. 제1 개체 및 제2 개체는 제3 개체와 혈연관계일 수 있다. 제1 개체 및 제2 개체는 제3 개체와 직계 가족, 예를 들면 부모, 형제 자매, 또는 자식일 수 있다. 본 발명의 일 구체예에서, 제1 개체 및 제2 개체는 제3 개체의 부(父) 또는 모(母)일 수 있다.
본 명세서에서 용어 "게놈 프로파일"은 개체의 유전자에 관한 정보, 예를 들면 특정 SNP의 존부 또는 돌연 변이 발생 여부에 관한 정보의 세트를 포함한다. 또한, 게놈 프로파일은 개체의 유전자형을 포함할 수 있다. 또한, 게놈 프로파일은 개체의 실질적으로 완전한 게놈 서열일 수도 있다.
유전자형은 개체의 DNA 또는 RNA에 관한 특이적인 유전자 구성을 의미한다. 유전자형은 개체의 유전자 변이체 및 마커를 포함할 수 있다. 유전자형은 SNP, 반수체형(haplotype), 또는 이배체형(diplotype)일 수 있다. 반수체형은 위치 또는 대립형질을 의미하는 것일 수 있다. 이배체형은 반수체형의 세트이다.
상기 방법은 SNP로부터 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 방법은 상기 게놈 프로파일로부터 소정의 표현형과 관련된 단일염기 다형성(Single Nucleotide Polymorphism; SNP)에 대한 정보를 추출하는 단계를 포함할 수 있다.
본 명세서에서 용어 "단일염기 다형성(Single Nucleotide Polymorphism: SNP)"은 동일한 종의 개체 사이의 단일뉴클레오티드 변이의 형태를 의미한다. 예를 들면, 어느 한 개체가 소정의 유전자의 특정 뉴클레오티드 위치에 아데노신을 가질 수 있을 경우, 다른 개체는 이 위치에 시토신, 구아닌, 또는 티민을 가질 수 있다. 그 결과 이와 같은 특정 위치에 SNP가 존재하게 되는 것이다. SNP는 전체 유전체의 0.1% 또는 1000 bp마다 한 번씩 단일 염기쌍에서 변이가 일어난다. SNP는 유전체 특정부위에 위치하는 두 개의 다른 염기로 인하여 두 개의 대립유전자를 가지게 된다.
SNP의 데이터베이스는 예를 들어, 국제 햅 맵 프로젝트[www.hapmap.org, The International HapMap Consortium, Nature 426:789-796(2003), 및 The International HapMap Consortium, Nature 437:1299-1320(2005) 참고], 인간 유전자 돌연 변이 데이터베이스(HGMD) 공공 데이터베이스(www.hgmd.org 참고), 단일 뉴클레오티드 다형성 데이터베이스(dbSNP)(www.ncbi.nlm.nih.gov/SNP/), 또는 미국 NHGRI의 GWAS 카탈로그(http://www.genome.gov/gwastudies/)로부터 입수할 수 있다. 이와 같은 데이터베이스는 SNP 단배체를 제공하거나, 또는 SNP 단배체 패턴을 제공한다. 이러한 SNP 데이터베이스는 광범위한 질병 또는 병태 예를 들어, 암, 염증성 질환, 심혈관계 질환, 신경 퇴행성 질환 또는 감염성 질환에 내재되어 있는 유전적 위험 인자들을 관찰할 수 있도록 해준다.
rs number는 기준 염기서열(reference sequence)를 의미하며, 이는 인간게놈 프로젝트 후, 미국 국립보건원 산하 생물공학정보연구소(NCBI)의 데이터베이스에서 각 단일염기다형성을 구분하기 위해 붙인 이름이다.
본 명세서에서 용어 "표현형"은 개체의 형질 또는 특성을 나타낸다. 표현형은 다양할 수 있다. 상기 표현형은 알려진 유전형 또는 알려질 유전형의 영향을 받아 발현되는 어떠한 표현형을 모두 포함할 수 있다. 표현형은 의학적 병태와 비의학적 병태를 포함할 수 있다. 의학적 병태는 질병 또는 질환을 포함한다. 비의학적 병태는 신체적 형질, 예를 들어, 머리카락 색; 생리학적 형질, 예를 들어, 폐활량; 정신적 형질, 예를 들어, 기억 보유력; 감정적 형질, 예를 들어, 화를 제어할 수 있는 능력; 인종, 예를 들어, 민족적 배경; 또는 연령, 예를 들어, 기대 연령(age expectancy) 또는 상이한 표현형이 발현되기 시작하는 연령을 포함할 수 있다. 또한, 표현형은 단일 유전 즉, 하나의 유전자가 표현형과 상관될 수 있는 경우이거나, 또는 다인자 유전 즉, 하나 이상의 유전자가 표현형과 상관될 수 있는 경우일 수 있다. 상기 표현형은 음주, 리딩 능력, 음식 선호도, 흡연, 안드로겐성 탈모증, 카페인 섭취, 조울증, 비만, 눈빛, 기억, 신장, 아토피 피부염, 아디포넥틴 농도, 여자의 가슴 형태, 만성 B형 간염, 귀지형, 주근깨, HDL 콜레스테롤 농도, LDL 콜레스테롤 농도, 모색, 곱슬 머리카락, 모발 굵기, 홍채 패턴, 락토오스 불내증, 초경의 시기, 폐경의 시기, 근시 또는 원시, 노로바이러스와 관련된 저항, 후각, 고통에 대한 민감성, 및 광반사 재채기로 이루어진 군으로부터 하나 이상 선택되는 것일 수 있다.
상기 표현형이 음주인 경우, 음주와 관련된 SNP는 rs6943555, rs2301054, rs2269247, rs2269246, rs2269245, rs2269241, rs2269240, rs3790857, rs11576729, rs2269238, rs2269235, rs2269234, rs2269233, rs12027168, rs2749100, rs11208264, rs8294, rs4643, rs855350, rs2749097, rs1506397, rs7548548, rs4854723, rs4854727, rs4017074, rs3860498, rs6785365, rs6763627, rs10935068, rs7617812, rs872134, rs6778062, rs10433415, rs4854733, rs1444600, rs10935070, rs9830001, rs4525863, rs6782523, rs10935073, rs11921527, rs12639304, rs6774822, rs6775042, rs6439431, rs7646118, rs6787177, rs8177178, rs8177313, rs4459901, rs1800277, rs6796795, rs6785596, rs8177191, rs8177197, rs8177213, rs8177220, rs1799852, rs1799899, rs8177240, rs8177252, rs8177272, rs3811647, rs1358024, rs1525892, rs2692695, rs1525889, rs1049296, rs7638018, rs4854760, rs4854761, rs854762, rs9843728, rs1830084, rs9881405, rs6794945, rs9853615, rs12490148, rs1107413, rs3817524, rs7650925, rs6439441, rs1464937, rs1534165, rs1534166, rs6439442, rs17376019, rs6439443, rs6773354, 17310413, rs12637730, rs2293374, rs11921187, rs6793673, rs2692672, rs17310798, rs1880663, rs2074356, rs2072134, rs1106280, rs12229654, rs10849915, rs11065756, rs2238149, rs3782889, rs2078851, rs7299918, rs1016078, rs16941759, rs1016079, rs4766660, rs10850088, rs4767017, rs2384069, rs11066211, rs2078851, rs933296, rs2238153, rs12321677, rs9971746, rs12423041, rs16941724, rs2074356, rs11066280, rs2238151, rs11609628, rs4648328, rs4646777, rs10744777, rs4646778, rs2158029, rs16941669, rs11066029, rs7296651, rs2074356, rs223815, rs4648328, rs10849915, rs11065756, rs3782889, rs2074356, rs11066280, 및 rs12229654로 이루어진 군으로부터 선택되는 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 리딩 능력(reading ability)인 경우, 리딩 능력과 관련된 SNP는 rs11857829, 및 rs1842129로 이루어진 군으로부터 선택되는 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 음식 선호도인 경우, 음식 선호도와 관련된 SNP는 rs1800544, 및 rs5400으로 이루어진 군으로부터 선택되는 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 흡연(smoking)인 경우, 상기 흡연은 니코틴 의존도(nicotine dependence)와 관련된 SNP일 수 있다. 상기 니코틴 의존도와 관련된 SNP는 rs1051730일 수 있다.
상기 표현형이 안드로겐성 탈모증(androgenetic alopecia; male-pattern baldness)인 경우, 상기 안드로겐성 탈모와 관련된 SNP는 rs2003046, rs9287638, rs2073963, rs8085664, rs1385699, rs6152, rs2180439, rs2424407, rs6035945, rs6113363, rs2208309, 및 rs12625990으로 이루어진 군으로부터 선택되는 어느 하나 또는 그의 조합일일 수 있다.
상기 표현형이 카페인 섭취(caffeine consumption)인 경우, 카페인 섭취와 관된 SNP는 rs2472297, 및 rs4410790로 이루어진 군으로부터 선택되는 어느 하나 또는 그의 조합일 수 있다. 상기 카페인 섭취와 관련된 표현형은 커피 소비를 포함할 수 있다.
상기 표현형이 조울증(bipolar disorder)인 경우, 조울증과 관련된 SNP는 rs4948418일 수 있다.
상기 표현형이 비만(obesity)인 경우, 비만과 관련된 SNP는 rs6548238, rs13130484, rs7647305, rs925946, rs4788102, rs6232, 및 rs7566605로 이루어진 군으로부터 선택되는 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 눈빛(eye color)인 경우, 눈빛과 관련된 SNP는 rs12913832일 수 있다.
상기 표현형이 기억(memory)인 경우, 기억과 관련된 SNP는 rs17070145일 수 있다.
상기 표현형이 신장(height)인 경우, 신장과 관련된 SNP는 rs6060371, 및 rs1042725로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 아토피 피부염(Atopic Dermatitis)인 경우, 아토피 피부염과 관련된 SNP는 rs11204971, rs479844, rs848, rs7927894, 및 rs6700998로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 아디포넥틴 농도(Adiponectin Level)인 경우, 아디포넥틴 농도와 관련된 SNP는 rs1851665, rs7193788, 및 rs6444175로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 여자의 가슴 형태(Breast Morphology)인 경우, 상기 가슴 형태는 가슴 크기를 포함할 수 있다. 가슴 크기와 관련된 SNP는 rs7816345일 수 있다.
상기 표현형이 만성 B형 간염(Chronic Hepatitis B)인 경우, 만성 B형 간염과 관련된 SNP는 rs3077, 및 rs2856718로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 귀지형(Earwax Type)인 경우, 귀지형과 관련된 SNP는 rs17822931일 수 있다.
상기 표현형이 주근깨(Freckling)인 경우, 주근깨와 관련된 SNP는 rs2153271, rs4778138, 및 rs1805007로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 HDL 콜레스테롤 농도(HDL-Cholesterol Level)인 경우, HDL 콜레스테롤 농도와 관련된 SNP는 rs964184, rs3764261, rs2271293, 및 rs17145738로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다. 상기 표현형이 LDL 콜레스테롤 농도(LDL-Cholesterol Level)인 경우, LDL 콜레스테롤 농도와 관련된 SNP는 rs4299376, rs6511720, rs646776, 및 rs1367117로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 모색(Hair Color)인 경우, 모색과 관련된 SNP는 rs1805007, 및 rs1667394로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 곱슬 머리카락(Hair Curl)인 경우, 곱슬 머리카락과 관련된 SNP는 rs17646946, 및 rs7349332로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 모발 굵기(Hair Thickness)인 경우, 모발 굵기와 관련된 SNP는 rs3827760일 수 있다.
상기 표현형이 홍채 패턴(Iris Patterns)인 경우, 홍채 패턴과 관련된 SNP는 rs1533995, rs3739070, 및 rs12896399로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 락토오스 불내증(Lactose Intolerance)인 경우, 락토오스 불내증과 관련된 SNP는 rs4988235일 수 있다.
상기 표현형이 장수(Longevity)인 경우, 장수와 관련된 SNP는 rs2542052, 및 rs2764264로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 초경(Menarche)의 시기인 경우, 초경의 시기와 관련된 SNP는 rs10804533, rs9635758, rs6545572, rs7642134, 및 rs4369815로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 폐경(Menopause)의 시기인 경우, 폐경의 시기와 관련된 SNP는 rs16991615일 수 있다.
상기 표현형이 근시(nearsightedness) 또는 원시(farsightedness)인 경우, 근시 또는 원시와 관련된 SNP는 rs10034228, 및 rs560766으로 이루어진 군으로부터 선택된 어느 하나 또는 그의 조합일 수 있다.
상기 표현형이 노로바이러스에 대한 저항(norovirus resistance)인 경우, 노로바이러스에 대한 저항과 관련된 SNP는 rs601338일 수 있다.
상기 표현형이 후각인 경우, 후각과 관련된 SNP는 rs1953558일 수 있다. 상기 후각은 이소발레르산의 냄새에 민감성을 포함할 수 있다.
상기 표현형이 고통에 대한 민감성(Pain Sensitivity)인 경우, 고통에 대한 민감성과 관련된 SNP는 rs6269일 수 있다.
상기 표현형이 광반사 재채기(Photic Sneeze Reflex)인 경우, 광반사 재채기와 관련된 SNP는 rs10427255일 수 있다.
상기 방법은 SNP로부터 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 방법은 추출된 SNP에 대한 정보로부터, 제3 개체의 SNP와 제1 개체 및/또는 제2 개체의 SNP와의 일치 정도를 기반으로 제3 개체의 제1 개체 및/또는 제2 개체와의 유사도를 연산하는 단계를 포함할 수 있다.
상기 방법은 상기 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도 연산은 제3 개체의 SNP와 제1 개체 및/또는 제2 개체의 SNP와의 일치 정도의 합을 상기 추출된 SNP의 종류의 수로 나누는 것일 수 있다.
상기 유사도 연산은 하기 [식1]에 기초한 연산일 수 있다:
[식 1]
유사도 = (ΣSNP 일치 정도k)/n (k=1~n).
상기 [식1]에서 n은 추출된 SNP의 종류의 수를 나타낸다. 표현형이 하나 이상의 SNP와 상관될 수 있는 경우, 상기 SNP는 복수의 SNP일 수 있다. ΣSNP 일치 정도k는 개체 간의 SNP 일치 정도의 합을 나타낸다.
개체의 SNP간의 일치정도는 개체의 SNP간의 일치되는 비율 정보일 수 있다. 또한, 개체의 SNP간의 일치정도는 개체의 SNP 대립유전자의 동일한 좌위(locus)의 서열을 비교함으로써 이루어질 수 있다. 상기 개체의 SNP는 동일한 rs number의 SNP일 수 있다. 상기 제3 개체의 SNP와 제1 개체 및/또는 제2 개체의 SNP와의 일치 정도는 하기 단계로부터 수득될 수 있다.
제3 개체의 SNP가 제1 및 제2 개체의 SNP와 일치하는 경우를 M1(BOTH)로 설정; 제3 개체의 SNP가 제1 개체의 SNP와 일치하고, 제2 개체의 SNP와 일치하지 않는 경우, 제3 개체의 SNP와 제1 개체의 SNP와의 일치정도를 M2(제1 개체 유사(similar))로 설정, 및 제3 개체의 SNP와 제2 개체의 SNP와의 일치정도를 M3(제2 개체 유사)으로 설정; 제3 개체의 SNP가 제2 개체의 SNP와 일치하고, 제1 개체의 SNP와 일치하지 않는 경우, 제3 개체의 SNP와 제1 개체의 SNP와의 일치정도를 M3(제2 개체 유사)으로 설정, 및 제3 개체의 SNP와 제2 개체의 SNP와의 일치정도를 M2(제1 개체 유사)로 설정; 및 제3 개체의 SNP가 제1 및 제2 개체의 SNP와 일치하지 않는 경우는 M4(MIX)로 설정할 수 있다.
또한, 상기의 M1, M2, M3, 및 M4에 임의의 값을 부여할 수 있다. 즉, 상기 일치 정도는 M1에 a의 값을 부여, M2에 b의 값을 부여, M3에 c의 값을 부여, 또는 M4에 d의 값을 부여하는 단계로부터 수득될 수 있다. 일구체예로, 제1 개체와 제3 개체의 유사도를 산출하기 위하여, 상기 a는 1/2 이상의 값, b는 1, c는 0, 및 d는 1/2 이하의 값일 수 있다. 또한, a는 1/2, b는 1, c는 0, 및 d는 1/2일 수 있다. 그러나, 부여되는 값은 변동할 수 있다. 일 구체예로, a는 1, b는 1, c는 0, 및 d는 1/2일 수 있다. 또한, a는 1/2, b는 1, c는 0, 및 d는 1/4일 수 있다. 또한, 제2 개체와 제3 개체의 유사도는 제1 개체와 제3 개체의 유사도와 동일한 방식으로 산출될 수 있다.
상기 [식 1]에 기초한 유사도 산출 결과, 제3 개체와 제1 개체의 유사도와 제3 개체와 제2 개체의 유사도의 합이 100%가 아닌 경우, 다음의 단계를 수행한다.
산출된 제3 개체와 제1 개체의 유사도와 제3 개체와 제2 개체의 유사도의 합으로 각각의 유사도를 나누는 단계를 수행하여, 산출된 유사도가 최종적인 유사도이다. 발명의 일 구체예에서, 제1 개체 및 제2 개체가 제3 개체의 부모인 경우, 제1 개체, 제2 개체, 및 제3 개체는 서로 가족 관계로 환경적 요인, 예를 들면 식습관, 흡연, 음주와 같은 생활 습관을 상당히 공유하여, 유전적 요인, 예를 들면, SNP를 이용하여 산출하는 유사도는, 보다 신뢰성 있는 특정 표현형에 대한 유사도를 산출할 수 있다. 상기 특정 표현형에 대한 유사도는 자녀의 표현형이 부모 중 누구의 표현형과 더 닮았는지, 상기 유전적 요인, 예를 들면 SNP를 이용하여, 자녀와 부모의 유전적 요인을 비교하여 산출할 수 있다.
또한, 상기 방법은 제 3개체가 제1 개체와 제2 개체 중 누구의 표현형과 더 닮았는지를 상기 유사도를 이용하여 산출함으로써, 제3 개체가 제1 개체 또는 제2 개체 중 좀더 유사도가 높게 산출된 개체와 유사한 표현형을 갖거나 가질 수 있음을 알려줄 수 있다.
상기 방법은 산출된 유사도를 포함한 보고서를 개체에게 제공하는 단계를 더 포함할 수 있다. 상기 개체는 제1 개체, 제2 개체, 또는 제3 개체일 수 있다.
상기 보고서는 제3 개체와 제1 개체 또는 제3 개체와 제2 개체와의 산출된 유사도를 포함할 수 있다. 상기 보고서는 제3 개체와 제1 개체 및 제2 개체와의 산출된 유사도를 포함할 수 있어, 동시에 제1 개체 및 제2 개체와의 유사도를 보여줄 수 있다. 제3 개체와 제1 개체 및 제2 개체와의 산출된 유사도를 포함하는 보고서는 특히 제1 개체 및 제2 개체가 제3 개체의 부모인 경우, 제1 개체, 제2 개체, 및 제3 개체는 서로 혈연 관계, 즉, 가족 관계로 환경적 요인, 예를 들면 식습관, 흡연, 음주와 같은 생활 습관을 상당히 공유하여, 유전적 요인, 예를 들면, SNP를 이용하여 산출한 유사도를 포함한 보고서는, 신뢰성 있는 특정 표현형에 대한 유사도를 포함할 수 있다. 상기 특정 표현형에 대한 유사도는 자녀의 표현형이 부모 중 누구의 표현형과 더 닮았는지, 상기 유전적 요인, 예를 들면 SNP를 이용하여, 자녀와 부모의 유전적 요인을 비교하여 산출한 결과일 수 있다.
상기 보고서는 프린트되거나, 컴퓨터상에 저장되거나, 온라인 상에서 보이거나, 또는 앱상에서 보일 수 있다. 상기 보고서는 컴퓨터, 인터넷 웹사이트, 전화, 또는 정보에 유사하게 접속가능하게 하는 다른 수단을 이용해 개체가 용이하게 접근할 수 있는 정보 공급처, 온라인 포탈을 통해 접근 가능할 수 있다. 온라인 포탈의 경우 보안 온라인 포탈 또는 웹사이트일 수 있다.
상기 유사도는 디스플레이를 이용해 시각화되거나 및/또는 청각적 피드백을 이용해 전달될 수 있다.
다른 양상은 제1 개체 및 제2 개체, 및/또는 제3 개체의 게놈 프로파일을 수신받는 게놈 프로파일 수신부; 상기 게놈 프로파일로부터 소정의 표현형과 관련된 단일염기 다형성(Single Nucleotide Polymorphism; SNP)에 대한 정보를 추출하는 SNP에 대한 정보 추출부; 및 추출된 SNP에 대한 정보로부터, 제3 개체의 SNP와 제1 개체 및/또는 제2 개체의 SNP와의 일치 정도를 이용하여 제3 개체의 제1 개체 및/또는 제2 개체와의 유사도를 연산하는 연산부;를 포함하는 것인 SNP로부터 제3 개체와 제1 개체 및/또는 제2 개체간의 유사도를 산출하는 시스템을 제공한다.
프로세서는 게놈 프로파일 수신부, SNP에 대한 정보 추출부, 및/또는 연산부를 포함할 수 있다. 게놈 프로파일 수신부는 제1 개체 및 제2 개체, 및/또는 제3 개체의 게놈 프로파일을 수신받을 수 있다. SNP에 대한 정보 추출부는 상기 게놈 프로파일로부터 소정의 표현형과 관련된 단일염기 다형성에 대한 정보를 추출할 수 있다. 연산부는 추출된 SNP에 대한 정보로부터, 제3 개체의 SNP와 제1 개체 및/또는 제2 개체의 SNP와의 일치 정도를 이용하여 제3 개체의 제1 개체 및/또는 제2 개체와의 유사도를 연산할 수 있다. 상기 유사도 연산, SNP와의 일치 정도, 및 표현형에 대한 내용은 상기 기술한 바와 같다. 상기 시스템은 제3 개체와 제1 개체 및/또는 제2 개체간의 유사도 산출 장치일 수 있다. 상기 장치는 SNP로부터 제3 개체와 제1 개체 및/또는 제2 개체간의 유사도를 산출하는 장치일 수 있다.
다른 양상은 상기한 프로세서가 SNP로부터 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 방법을 달성하기 위해서 본 발명은 상기한 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 가독가능한 기록매체를 제공한다.
컴퓨터가 가독가능한 기록매체는 컴퓨터가 읽을 수 있는 기록매체일 수 있다. 컴퓨터가 가독가능한 기록매테는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 가독가능한 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 가독가능한 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 가독가능한 코드가 저장되고 실행될 수 있다.
일 양상에 따른 단일 염기 다형성을 이용한 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 방법에 의하면, 다양한 표현형에 대하여, 한 개체의 다른 개체에 대한 유사도를 산출할 수 있다. 또한, 상기 방법에 의하면, 다양한 표현형에 대하여, 개체의 유사도를 용이하게 산출하여 사용자에게 보여줄 수 있다. 이는 사용자에게 개체의 유사도를 보여주어 사용자의 기호를 만족시켜줄 수 있다. 특히, 자식과 부모와의 유사도, 예를 들면 유전적 유사도를 신뢰성 있고, 용이하게 보여줄 수 있다.
일 양상에 따른 단일 염기 다형성을 이용한 제3 개체와 제1 개체 및/또는 제2 개체와의 유사도를 산출하는 시스템은 다양한 표현형에 대하여, 한 개체의 다른 개체에 대한 유사도를 산출할 수 있다.
다른 양상은 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 가독가능한 기록매체는 사용자에게 개체의 유사도를 다양한 매체를 통하여 보여줄 수 있다.
이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실시예 1. 알코올 소비와 관련된 자식의 부모와의 유사도 산출
1.1. 알코올 소비와 관련된 SNP 를 이용한, 제3 개체의 SNP 와 제1 개체 및 제2 개체의 SNP 와의 일치 정도
알코올 소비와 관련된 SNP 데이터베이스를 예를 들어, 국제 햅 맵 프로젝트[www.hapmap.org, The International HapMap Consortium, Nature 426:789-796(2003), 및 The International HapMap Consortium, Nature 437:1299-1320(2005) 참고], 인간 유전자 돌연 변이 데이터베이스(HGMD) 공공 데이터베이스(www.hgmd.org 참고), 그리고 단일 뉴클레오티드 다형성 데이터베이스(dbSNP)(www.ncbi.nlm.nih.gov/SNP/)로부터 입수하였다. 제1 개체인 부, 제2 개체인 모, 및 제3 개체인 부모의 자녀로부터 게놈 프로파일을 수신받아, 이로부터 알코올 소비와 관련된 SNP에 대한 정보를 추출하였다. 본 발명의 일 구체예에 따른 산출 방법은 특정 표현형의 발현은 유전적 요인과 환경적 요인이 복합적으로 작용하는데, 가족의 경우 환경적 요인을 상당히 공유하므로, 더 정확하게 부모와 자녀간의 유전자형 유사성을 산출할 수 있다.
추출된 SNP에 대한 정보는 하기 표 1에 나타내었다.
제1 개체
(부)
제2 개체
(모)
제3 개체
(자녀)
제1 개체의 SNP와의 일치 정도 제2 개체의 SNP와의 일치 정도
rs2074356 CT CC CT M2 M3
rs11066280 AA TT AT M4 M4
rs12229654 TG TG TG M1 M1
rs10849915 AA GG GG M3 M2
1.2. M1, M2, M3, M4에 각각 1/2, 1, 0, 1/2를 부여하는 경우, 제3 개체와 제1 개체 및/또는 제2 개체의 유사도 산출
상기 [식1]에 의하여, 제3 개체와 제1 개체의 유사도'는 50% ((1 + 1/2 + 1/2 + 0)/4)이다. 반면에, 제3 개체와 제2 개체의 유사도'는 50% ((0 + 1/2 + 1/2 + 1)/4) 이다. 제3 개체와 제1 개체의 유사도'와 제3 개체와 제2 개체의 유사도'의 합이 100%이므로, 이 경우 제3 개체와 제1 개체의 유사도는 50%, 제3 개체와 제2 개체의 유사도는 50%임이 산출되었다.
1.3. M1, M2, M3, M4에 각각 1, 1, 0, 1/2를 부여하는 경우, 제3 개체와 제1 개체 및/또는 제2 개체의 유사도 산출
상기 [식1]에 의하여, 제3 개체와 제1 개체의 유사도'는 62.5% ((1 + 1/2 + 1 + 0)/4)이다. 반면에, 제3 개체와 제2 개체의 유사도'는 62.5% ((0 + 1/2 + 1 + 1)/4)이다. 제3 개체와 제1 개체의 유사도'와 제3 개체와 제2 개체의 유사도'의 합이 125%이므로, 이 경우 상기 유사도'의 합으로 각각의 유사도'를 나눈 값이 최종적인 유사도이다. 따라서, 제3 개체와 제1 개체의 유사도는 62.5/(62.5+62.5)= 50%이고, 제3 개체와 제2 개체의 유사도는 62.5(62.5+62.5)= 50%임이 산출되었다.
1.4. M1, M2, M3, M4에 각각 1/2, 1, 0, 1/4를 부여하는 경우, 제3 개체와 제1 개체 및/또는 제2 개체의 유사도 산출
상기 [식1]에 의하여, 제3 개체와 제1 개체의 유사도는 43.75% ((1 + 1/4 + 1/2 + 0)/4)이다. 반면에, 제3 개체와 제2 개체의 유사도는 43.75% (0 + 1/4 + 1/2 + 1)/4이다. 제3 개체와 제1 개체의 유사도'와 제3 개체와 제2 개체의 유사도'의 합이 87.5%이므로, 이 경우 상기 유사도'의 합으로 각각의 유사도'를 나눈 값이 최종적인 유사도이다. 따라서, 제3 개체와 제1 개체의 유사도는 43.75/(43.75+43.75)= 50%이고, 제3 개체와 제2 개체의 유사도는 43.75/(43.75+43.75)= 50%임이 산출되었다.
실시예 2. 알코올 소비와 관련된 자식의 부모와의 유사도 산출
2.1. 알코올 소비와 관련된 SNP 를 이용한, 제3 개체의 SNP 와 제1 개체 및 제2 개체의 SNP 와의 일치 정도
알코올 소비와 관련된 SNP 데이터베이스를 실시예 1과 동일하게 입수하였다. 제1 개체인 부, 제2 개체인 모, 및 제3 개체인 부모의 자녀로부터 게놈 프로파일을 수신받아, 이로부터 알코올 소비와 관련된 SNP에 대한 정보를 추출하였다.
추출된 SNP에 대한 정보는 하기 표 2에 나타내었다.
제1 개체
(부)
제2 개체
(모)
제3 개체
(자녀)
제1 개체의 SNP와의 일치 정도 제2 개체의 SNP와의 일치 정도
rs2074356 CC CC CT M4 M4
rs11066280 AA TT AT M4 M4
rs12229654 TG TG TG M1 M1
rs10849915 AA GG GG M3 M2
2.2. M1 , M2 , M3 , M4 에 각각 1/2, 1, 0, 1/2를 부여하는 경우, 제3 개체와 제1 개체 및/또는 제2 개체의 유사도 산출
상기 [식1]에 의하여, 제3 개체와 제1 개체의 유사도'는 37.5% ((1/2 + 1/2 + 1/2 + 0)/4)이다. 반면에, 제3 개체와 제2 개체의 유사도'는 62.5% ((1/2 + 1/2 + 1/2 + 1)/4)이다. 제3 개체와 제1 개체의 유사도'와 제3 개체와 제2 개체의 유사도'의 합이 100%이므로, 이 경우 제3 개체와 제1 개체의 유사도는 37.5%, 제3 개체와 제2 개체의 유사도는 62.5%임이 산출되었다.
2.3. M1 , M2 , M3 , M4 에 각각 1, 1, 0, 1/2를 부여하는 경우, 제3 개체와 제1 개체 및/또는 제2 개체의 유사도 산출
상기 [식1]에 의하여, 제3 개체와 제1 개체의 유사도'는 50% ((1/2 + 1/2 + 1 + 0)/4)이다. 반면에, 제3 개체와 제2 개체의 유사도'는 75% ((1/2 + 1/2 + 1 + 1)/4)이다. 제3 개체와 제1 개체의 유사도'와 제3 개체와 제2 개체의 유사도'의 합이 125%이므로, 이 경우 상기 유사도'의 합으로 각각의 유사도'를 나눈 값이 최종적인 유사도이다. 따라서, 제3 개체와 제1 개체의 유사도는 50/(50+75)= 40%이고, 제3 개체와 제2 개체의 유사도는 75(50+75)= 60%임이 산출되었다.
2.4. M1 , M2 , M3 , M4 에 각각 1/2, 1, 0, 1/4를 부여하는 경우, 제3 개체와 제1 개체 및/또는 제2 개체의 유사도 산출
상기 [식1]에 의하여, 제3 개체와 제1 개체의 유사도는 25% ((1/4 + 1/4 + 1/2 + 0)/4)이다. 반면에, 제3 개체와 제2 개체의 유사도는 50% (1/4 + 1/4 + 1/2 + 1)/4이다. 제3 개체와 제1 개체의 유사도'와 제3 개체와 제2 개체의 유사도'의 합이 75%이므로, 이 경우 상기 유사도'의 합으로 각각의 유사도'를 나눈 값이 최종적인 유사도이다. 따라서, 제3 개체와 제1 개체의 유사도는 25/(25+50)= 약 33.3%이고, 제3 개체와 제2 개체의 유사도는 50/(25+50)= 약 66.6%임이 산출되었다.
실시예 3: 안드로겐성 탈모증과 관련된 자식의 부모와의 유사도 산출
3.1. 안드로겐성 탈모증과 관련된 SNP 를 이용한, 제3 개체의 SNP 와 제1 개체 및 제2 개체의 SNP 와의 일치 정도
안드로겐성 탈모증과 관련된 SNP 데이터베이스를 실시예 1과 동일하게 입수하였다. 제1 개체인 부, 제2 개체인 모, 및 제3 개체인 부모의 자녀로부터 게놈 프로파일을 수신받아, 이로부터 안드로겐성 탈모증과 관련된 SNP에 대한 정보를 추출하였다.
추출된 SNP에 대한 정보는 하기 표 3에 나타내었다.
제1 개체
(부)
제2 개체
(모)
제3 개체
(자녀)
제1 개체의 SNP와의
일치 정도
제2 개체의 SNP와의
일치 정도
rs6047745 AA AC AA M2 M3
rs2424410 AA AC AA M2 M3
rs6035995 AG GG AG M2 M3
rs1080275 AG AG AG M1 M1
rs6047761 AA CC AC M4 M4
rs4815086 AC AC AC M1 M1
3.2. M1 , M2 , M3 , M4 에 각각 1/2, 1, 0, 1/2를 부여하는 경우, 제3 개체와 제1 개체 및/또는 제2 개체의 유사도 산출
상기 [식1]에 의하여, 제3 개체와 제1 개체의 유사도'는 75% ((1 + 1 + 1 + 1/2 + 1/2 + 1/2)/6)이다. 반면에, 제3 개체와 제2 개체의 유사도'는 25% ((0 + 0 + 0 + 1/2 + 1/2 + 1/2)/6) 이다. 제3 개체와 제1 개체의 유사도'와 제3 개체와 제2 개체의 유사도'의 합이 100%이므로, 이 경우 제3 개체와 제1 개체의 유사도는 75%, 제3 개체와 제2 개체의 유사도는 25%임이 산출되었다.
3.3. M1 , M2 , M3 , M4 에 각각 1, 1, 0, 1/2를 부여하는 경우, 제3 개체와 제1 개체 및/또는 제2 개체의 유사도 산출
상기 [식1]에 의하여, 제3 개체와 제1 개체의 유사도'는 약 92% ((1 + 1 + 1 + 1 + 1/2 + 1)/6)이다. 반면에, 제3 개체와 제2 개체의 유사도'는 약 42% ((0 + 0 + 0 + 1 + 1/2 + 1)/6)이다. 제3 개체와 제1 개체의 유사도'와 제3 개체와 제2 개체의 유사도'의 합이 약 134%이므로, 이 경우 상기 유사도'의 합으로 각각의 유사도'를 나눈 값이 최종적인 유사도이다. 따라서, 제3 개체와 제1 개체의 유사도는 92/(92+42)= 약 69%이고, 제3 개체와 제2 개체의 유사도는 42(92+42)= 약 31%임이 산출되었다.
3.4. M1, M2, M3, M4에 각각 1/2, 1, 0, 1/4를 부여하는 경우, 제3 개체와 제1 개체 및/또는 제2 개체의 유사도 산출
상기 [식1]에 의하여, 제3 개체와 제1 개체의 유사도는 약 71% ((1 + 1 + 1 + 1/2 + 1/4 + 1/2)/6)이다. 반면에, 제3 개체와 제2 개체의 유사도는 약 21% ((0 + 0 + 0 + 1/2 + 1/4 + 1/2)/6)이다. 제3 개체와 제1 개체의 유사도'와 제3 개체와 제2 개체의 유사도'의 합이 약 92%이므로, 이 경우 상기 유사도'의 합으로 각각의 유사도'를 나눈 값이 최종적인 유사도이다. 따라서, 제3 개체와 제1 개체의 유사도는 71/(71+21)= 약 77%이고, 제3 개체와 제2 개체의 유사도는 21/(71+21)= 약 23%임이 산출되었다.

Claims (12)

  1. 제3 개체와 제1 개체 및 제2 개체의 게놈 프로파일을 수신받는 단계;
    상기 게놈 프로파일로부터 소정의 표현형과 관련된 단일염기 다형성(Single Nucleotide Polymorphism; SNP)에 대한 정보를 추출하는 단계;
    추출된 SNP에 대한 정보로부터, 제3 개체의 SNP와 제1 개체 및 제2 개체의 SNP와의 일치 정도를 기반으로 제3 개체의 제1 개체 및 제2 개체와의 유사도를 연산하는 단계;를 포함하는 것인 SNP로부터 제3 개체와 제1 개체 및 제2 개체와의 유사도를 산출하는 방법으로서,
    상기 제3 개체의 SNP와 제1 개체 및 제2 개체의 SNP와의 일치 정도는,
    제3 개체의 SNP가 제1 및 제2 개체의 SNP와 일치하는 경우를 M1(BOTH)로 설정;
    제3 개체의 SNP가 제1 개체의 SNP와 일치하고, 제2 개체의 SNP와 일치하지 않는 경우, 제3 개체의 SNP와 제1 개체의 SNP와의 일치정도를 M2(제1 개체 유사(similar))로 설정, 및 제3 개체의 SNP와 제2 개체의 SNP와의 일치정도를 M3(제2 개체 유사)으로 설정;
    제3 개체의 SNP가 제2 개체의 SNP와 일치하고, 제1 개체의 SNP와 일치하지 않는 경우, 제3 개체의 SNP와 제1 개체의 SNP와의 일치정도를 M3(제2 개체 유사)으로 설정, 및 제3 개체의 SNP와 제2 개체의 SNP와의 일치정도를 M2(제1 개체 유사)로 설정; 및
    제3 개체의 SNP가 제1 및 제2 개체의 SNP와 일치하지 않는 경우는 M4(MIX)로 설정하는 단계로부터 수득되는 것인 방법.
  2. 청구항 1에 있어서, 상기 제3 개체와 제1 개체 및 제2 개체와의 유사도 연산은 제3 개체의 SNP와 제1 개체 및 제2 개체의 SNP와의 일치 정도의 합을 상기 추출된 SNP의 종류의 수로 나누는 것인 방법.
  3. 삭제
  4. 청구항 1에 있어서, 제3 개체와 제1 개체의 유사도와 제3 개체와 제2 개체의 유사도의 합이 100%가 아닌 경우, 상기 제3 개체와 제1 개체의 유사도와 제3 개체와 제2 개체의 유사도의 합으로 각각의 유사도를 나누는 단계를 더 포함하는 것인 방법.
  5. 청구항 1에 있어서, 상기 표현형은 음주, 리딩 능력, 음식 선호도, 흡연, 안드로겐성 탈모증, 카페인 섭취, 조울증, 비만, 눈빛, 기억, 신장, 아토피 피부염, 아디포넥틴 농도, 여자의 가슴 형태, 만성 B형 간염, 귀지형, 주근깨, HDL 콜레스테롤 농도, LDL 콜레스테롤 농도, 모색, 곱슬 머리카락, 모발 굵기, 홍채 패턴, 락토오스 불내증, 초경의 시기, 폐경의 시기, 근시 또는 원시, 노로바이러스와 관련된 저항, 후각, 고통에 대한 민감성, 및 광반사 재채기로 이루어진 군으로부터 하나 이상 선택되는 것인 방법.
  6. 제3 개체와 제1 개체 및 제2 개체의 게놈 프로파일을 수신받는 게놈 프로파일 수신부;
    상기 게놈 프로파일로부터 소정의 표현형과 관련된 단일염기 다형성(Single Nucleotide Polymorphism; SNP)에 대한 정보를 추출하는 SNP에 대한 정보 추출부;
    추출된 SNP에 대한 정보로부터, 제3 개체의 SNP와 제1 개체 및 제2 개체의 SNP와의 일치 정도를 기반으로 제3 개체의 제1 개체 및 제2 개체와의 유사도를 연산하는 연산부;를 포함하는 것인 SNP로부터 제3 개체와 제1 개체 및/또는 제2 개체간의 유사도를 산출하는 시스템으로서,
    상기 제3 개체의 SNP와 제1 개체 및 제2 개체의 SNP와의 일치 정도는,
    제3 개체의 SNP가 제1 및 제2 개체의 SNP와 일치하는 경우를 M1(BOTH)로 설정;
    제3 개체의 SNP가 제1 개체의 SNP와 일치하고, 제2 개체의 SNP와 일치하지 않는 경우, 제3 개체의 SNP와 제1 개체의 SNP와의 일치정도를 M2(제1 개체 유사(similar))로 설정, 및 제3 개체의 SNP와 제2 개체의 SNP와의 일치정도를 M3(제2 개체 유사)으로 설정;
    제3 개체의 SNP가 제2 개체의 SNP와 일치하고, 제1 개체의 SNP와 일치하지 않는 경우, 제3 개체의 SNP와 제1 개체의 SNP와의 일치정도를 M3(제2 개체 유사)으로 설정, 및 제3 개체의 SNP와 제2 개체의 SNP와의 일치정도를 M2(제1 개체 유사)로 설정; 및
    제3 개체의 SNP가 제1 및 제2 개체의 SNP와 일치하지 않는 경우는 M4(MIX)로 설정하는 단계로부터 수득되는 것인 시스템.
  7. 청구항 6에 있어서, 상기 제3 개체와 제1 개체 및 제2 개체와의 유사도 연산하는 연산부는 제3 개체의 SNP와 제1 개체 및 제2 개체의 SNP와의 일치 정도의 합을 상기 추출된 SNP의 종류의 수로 나누는 것인 시스템.
  8. 삭제
  9. 청구항 6에 있어서, 상기 일치 정도는 하기의 값을 부여하여 수득되는 것인 시스템: M1에 a의 값을 부여, M2에 b의 값을 부여, M3에 c의 값을 부여, 또는 M4에 d의 값을 부여.
  10. 청구항 6에 있어서, 제3 개체와 제1 개체의 유사도와 제3 개체와 제2 개체의 유사도의 합이 100%가 아닌 경우, 상기 제3 개체와 제1 개체의 유사도와 제3 개체와 제2 개체의 유사도의 합으로 각각의 유사도를 나누는 단계를 더 포함하는 것인 시스템.
  11. 청구항 6에 있어서, 상기 표현형은 음주, 리딩 능력, 음식 선호도, 흡연, 안드로겐성 탈모증, 카페인 섭취, 조울증, 비만, 눈빛, 기억, 신장, 아토피 피부염, 아디포넥틴 농도, 여자의 가슴 형태, 만성 B형 간염, 귀지형, 주근깨, HDL 콜레스테롤 농도, LDL 콜레스테롤 농도, 모색, 곱슬 머리카락, 모발 굵기, 홍채 패턴, 락토오스 불내증, 초경의 시기, 폐경의 시기, 근시 또는 원시, 노로바이러스와 관련된 저항, 후각, 고통에 대한 민감성, 및 광반사 재채기로 이루어진 군으로부터 하나 이상 선택되는 것인 시스템.
  12. 청구항 1, 2, 4 또는 5 중 어느 한 항의 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 가독가능한 기록매체.
KR1020130006489A 2013-01-21 2013-01-21 단일 염기 다형성을 이용한 개체간의 유사도 산출 방법 및 시스템 KR101533395B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130006489A KR101533395B1 (ko) 2013-01-21 2013-01-21 단일 염기 다형성을 이용한 개체간의 유사도 산출 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130006489A KR101533395B1 (ko) 2013-01-21 2013-01-21 단일 염기 다형성을 이용한 개체간의 유사도 산출 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20140094152A KR20140094152A (ko) 2014-07-30
KR101533395B1 true KR101533395B1 (ko) 2015-07-08

Family

ID=51739982

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130006489A KR101533395B1 (ko) 2013-01-21 2013-01-21 단일 염기 다형성을 이용한 개체간의 유사도 산출 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101533395B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101964146B1 (ko) * 2017-09-29 2019-04-01 서울대학교산학협력단 두 개의 소규모 전장유전체 정보로부터 종내 변이 구별을 위해 다형성이 있는 ssr 마커를 선발하는 방법
WO2019190182A1 (ko) * 2018-03-27 2019-10-03 (주)메디젠휴먼케어 단일염기다형성을 이용한 피부 또는 탈모 표현형 예측 방법
KR20200005779A (ko) * 2018-07-09 2020-01-17 (주) 메디젠휴먼케어 단일염기다형성을 이용한 탈모 표현형 예측 방법

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105586394A (zh) * 2014-11-17 2016-05-18 武汉白原科技有限公司 一种评估基因对人体低密度脂蛋白影响的检测试剂盒和方法
KR101933601B1 (ko) * 2017-04-25 2019-04-01 연세대학교 산학협력단 탈모 예측용 snp 프라이머 및 이의 용도
CN109750103B (zh) * 2019-03-11 2022-10-04 深圳乐土生物科技有限公司 基于飞行时间质谱的高度近视基因检测试剂盒、芯片及高度近视检测方法
KR102559726B1 (ko) * 2020-09-11 2023-07-27 서울대학교산학협력단 유전자 다형성 마커 기반 여성형 탈모증 위험도 예측 모델
KR102464776B1 (ko) * 2020-09-11 2022-11-09 서울대학교산학협력단 여성형 탈모증 관련 유전자 다형성 마커 및 이의 용도

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090105921A (ko) * 2006-11-30 2009-10-07 네이비제닉스 인크. 유전자 분석 시스템 및 방법
KR20100067493A (ko) * 2008-12-11 2010-06-21 한국생명공학연구원 가계 내 유전자 정보 및 질병 보인자 흐름 추적 시스템
JP2010539947A (ja) * 2007-09-26 2010-12-24 ナビジェニクス インコーポレイティド 祖先データを用いるゲノム解析の方法及びシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090105921A (ko) * 2006-11-30 2009-10-07 네이비제닉스 인크. 유전자 분석 시스템 및 방법
JP2010539947A (ja) * 2007-09-26 2010-12-24 ナビジェニクス インコーポレイティド 祖先データを用いるゲノム解析の方法及びシステム
KR20100067493A (ko) * 2008-12-11 2010-06-21 한국생명공학연구원 가계 내 유전자 정보 및 질병 보인자 흐름 추적 시스템

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101964146B1 (ko) * 2017-09-29 2019-04-01 서울대학교산학협력단 두 개의 소규모 전장유전체 정보로부터 종내 변이 구별을 위해 다형성이 있는 ssr 마커를 선발하는 방법
WO2019190182A1 (ko) * 2018-03-27 2019-10-03 (주)메디젠휴먼케어 단일염기다형성을 이용한 피부 또는 탈모 표현형 예측 방법
KR20200005779A (ko) * 2018-07-09 2020-01-17 (주) 메디젠휴먼케어 단일염기다형성을 이용한 탈모 표현형 예측 방법
KR102102200B1 (ko) * 2018-07-09 2020-04-21 (주)메디젠휴먼케어 단일염기다형성을 이용한 탈모 표현형 예측 방법

Also Published As

Publication number Publication date
KR20140094152A (ko) 2014-07-30

Similar Documents

Publication Publication Date Title
KR101533395B1 (ko) 단일 염기 다형성을 이용한 개체간의 유사도 산출 방법 및 시스템
Xu et al. The interplay between host genetics and the gut microbiome reveals common and distinct microbiome features for complex human diseases
Heard-Costa et al. NRXN3 is a novel locus for waist circumference: a genome-wide association study from the CHARGE Consortium
Childs et al. Common variation at 2p13. 3, 3q29, 7p13 and 17q25. 1 associated with susceptibility to pancreatic cancer
Smit et al. 17q21 variants modify the association between early respiratory infections and asthma
Lai et al. The APOA5 locus is a strong determinant of plasma triglyceride concentrations across ethnic groups in Singapore
Filges et al. Reduced expression by SETBP1 haploinsufficiency causes developmental and expressive language delay indicating a phenotype distinct from Schinzel–Giedion syndrome
Fan et al. Functional linear models for association analysis of quantitative traits
Turnbull et al. A genome-wide association study identifies susceptibility loci for Wilms tumor
Wang et al. The FGF and FGFR gene family and risk of cleft lip with or without cleft palate
Hancock et al. Assessment of genotype imputation performance using 1000 Genomes in African American studies
Deng et al. The population genomic landscape of human genetic structure, admixture history and local adaptation in Peninsular Malaysia
Kenny et al. Increased power of mixed models facilitates association mapping of 10 loci for metabolic traits in an isolated population
WO2011139797A2 (en) Method and system for analysis and error correction of biological sequences and inference of relationship for multiple samples
Yates et al. De novo mutations in HNRNPU result in a neurodevelopmental syndrome
Zhao et al. More powerful genetic association testing via a new statistical framework for integrative genomics
Gutierrez-Camino et al. The miR-1206 microRNA variant is associated with methotrexate-induced oral mucositis in pediatric acute lymphoblastic leukemia
Zaitlen et al. The effects of migration and assortative mating on admixture linkage disequilibrium
Hong et al. Recapitulation of the association of the Val66Met polymorphism of BDNF gene with BMI in Koreans
Kunkle et al. Genome-wide linkage analyses of non-Hispanic white families identify novel loci for familial late-onset Alzheimer's disease
Yan et al. A genome-wide association study of severe asthma exacerbations in Latino children and adolescents
Ghapanchi et al. The LncRNA H19 rs217727 polymorphism is associated with oral squamous cell carcinoma susceptibility in Iranian population
Wang et al. Interaction analysis between germline susceptibility loci and somatic alterations in lung cancer
Sofer et al. Meta‐analysis of Genome‐Wide Association Studies with correlated individuals: Application to the Hispanic Community Health Study/Study of Latinos (HCHS/SOL)
Knight et al. Linkage analysis of Tourette syndrome in a large Utah pedigree

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
N231 Notification of change of applicant