WO2020017869A1

WO2020017869A1 - 유전체 및 유전체 정보의 보존 및 활용을 위한 방법

Info

Publication number: WO2020017869A1
Application number: PCT/KR2019/008777
Authority: WO
Inventors: 이윤경; 이유진; 이영우
Original assignee: 이윤경
Priority date: 2018-07-17
Filing date: 2019-07-16
Publication date: 2020-01-23
Also published as: JP2021530930A; KR20200008854A; EP3826021A4; JP7037700B2; KR102209178B1; EP3826021A1; US20210271982A1; EP3826021B1; CN112840403A; US11954601B2

Abstract

블록들이 연결되어 구성된 블록 체인을 각각 포함하는 복수의 노드들에 유전체 정보들을 분산하여 저장하고, 저장된 유전체 정보들 중 적어도 하나를 검색하고, 복수의 유전체 물질들-각각은 유전체와 인위적 핵산 서열을 포함함-을 저장하는 유전체 물질 저장부로부터 상기 검색된 유전체 정보에 해당하는 유전체 물질을 취득하기 위한 방법으로서, (1) 상기 복수의 노드들 각각에 의해 수행되는 유전체 정보의 저장 단계; (2) 상기 복수의 노드들 중 적어도 하나에 의해 수행되는 유전체 정보의 검색 단계; 및 (3) 인증 단계를 포함한다.

Description

유전체 및 유전체 정보의 보존 및 활용을 위한 방법

본 발명은 정보의 저장, 분산, 제공, 재가공 등 정보를 위한 암호화 기술을 기반으로 한, 유전체와 유전체 정보의 보존 및 활용을 위한 방법에 관한 것으로서, 더욱 구체적으로는 인위적 핵산 서열을 이용한 암호화 기술을 활용하여 각 객체의 유전제의 보관 및 배포시 항구적 인증을 하고, 블록체인과 같은 암호화 기술을 활용하여 유전제 정보의 저장, 분산, 제공, 재가공 등을 보다 안전하고 신뢰적으로 구축하여 유전체를 활용하는 다양한 산업에 DTC(direct tp customer) 방식을 유도하고 유전체 또는 유전체 정보를 효율적으로 공유하는 것에 관한 것이다.

종래, 생체 또는 사체의 유전체를 연구하기 위해서는 유전체를 갖고 있는 개인에게 의뢰하거나 유전체를 다량으로 가지고 있는 기관으로부터 입수하는 등 개별적으로 입수가 이루어지고 있는 실정이다. 그러나 이러한 경우 입수 가능한 유전체의 종류와 양이 제한되고 자금력이나 인지도가 큰 기관이나 사업체만이 유전체의 입수가 가능하다. 이에 따라, 유전체와 유전체 정보에 대해 일반 연구자들의 접근이 제한되어 자원의 낭비 및 유전체의 심도적 연구에 걸림돌이 되고 있다.

또한, 유전체의 기증자가 인지하지 못하거나 수익을 얻지 못하는 채로 유전체를 분석한 데이터가 영리 단체에 판매되어 유전체로 인한 수익의 적절한 분배와 유전체 분석으로부터 파생된 정보의 보안과 보관이 비효율적으로 이루어지고 있다.

유전체 보존에 관해서는 각 객체들로부터 추출한 건조 보관된 DNA, 조직 또는 혈액 형태로 보관하고 있으며 각 객체의 특정 시퀀스(염기서열정보)로 객체를 분류하는 뱅크가 설립되어 있다. 인간의 유전체 보존의 경우는 각 국가 단위로 모든 인구에 해당하는 유전체 서열 분석 결과 뱅크 형태를 추구하고 있을지라도 기술, 비용, 개인 신상정보의 보안으로 이를 위한 유전자 보존 뱅크가 아직 설립되어 있지 않으며 부분적으로 질환 및 형질을 연구하는 유전체 보존 뱅크 등은 산발적으로 구축되어 있다.

고인을 추모하기 위해 시신 또는 이를 태운 재를 안장한 무덤이 이용되고 있지만, 이는 환경이나 비용적인 면에서 부담이 되고 있다. 이를 해결하기 위해 인류가 남겨야 할 궁극적인 것은 시신이나 태운 재의 형태가 아니라 유전체 자원이라는 점에서 유전체 무덤이라는 개념이 필요하다.

이와 관련하여, 각 객체의 유전체를 보존하고 필요한 연구자원으로 배포하기 위해서는 식별을 위해 외부에 식별를 이용하는 방식이 주로 사용되지만, 이러한 식별 표시는 뒤바뀌거나 잘못 표시될 가능성이 있으며, 유전체를 항구적으로 인증하고 유전체에 대한 효과적인 정보를 기입하는데도 제한적이다.

본 발명은 유전체 또는 유전체 정보가 일부에 독점되지 않고 일반에 공유 가능하고, 유전체의 인증이 가능한 유전체 정보의 보존 및 활용을 위한 방법을 제공하고자 한다.

블록들이 연결되어 구성된 블록 체인을 각각 포함하는 복수의 노드들에 유전체 정보들을 분산하여 저장하고, 저장된 유전체 정보들 중 적어도 하나를 검색하고, 복수의 유전체 물질들-각각은 유전체와 인위적 핵산 서열을 포함함-을 저장하는 유전체 물질 저장부로부터 상기 검색된 유전체 정보에 해당하는 유전체 물질을 취득하기 위한 방법으로서, (1) 상기 복수의 노드들 각각에 의해 수행되는 유전체 정보의 저장 단계; (2) 상기 복수의 노드들 중 적어도 하나에 의해 수행되는 유전체 정보의 검색 단계; 및 (3) 인증 단계를 포함하고, 상기 (1) 유전체 정보의 저장 단계는, (1a) 상기 유전체 정보를 저장하는 단계; (1b) 상기 복수의 노드들에 대한 위치정보를 저장하는 단계; (1c) 상기 유전체 정보가 저장되면, 상기 저장된 유전체 정보 및, 당해 유전체 정보가 저장된 노드의 위치정보인 소유주 정보를 포함하는 트랜잭션을 생성하고, 상기 생성된 트랜잭션을 다른 노드들로 전송하는 단계; 및 (1d) 상기 복수의 노드들 중 다른 노드로부터 트랜잭션을 수신하고, 수신된 트랜잭션에 대해 가장 먼저 블록을 생성하면 블록 해쉬값과 논스값을 다른 노드들에게 송신하며, 다른 노드로부터 블록 해쉬값과 논스값을 수신하면 수신된 값들을 이용하여 블록을 생성하여 블록 체인에 연결하는 단계;를 포함하고, 상기 (2) 유전체 정보의 검색 단계는, (2a) 검색정보가 입력되면, 블록 체인에 저장된 각 블록의 논스 값을 판독하고, 상기 판독된 논스값, 상기 입력된 검색정보 및 상기 복수의 노드들에 대한 위치정보를 이용하여 해쉬값을 생성하는 단계; (2b) 상기 생성된 해쉬값이 상기 논스값이 포함된 블록의 블록 해쉬값과 일치하는지를 판단하는 단계; 및 (2c) 상기 생성된 해쉬값과 일치하는 블록 해쉬값을 갖는 블록이 존재하면, 해당 위치 정보를 갖는 노드가 소유주임을 결정하는 단계;를 포함하고, 상기 (3) 인증 단계는, (3a) 상기 소유주에 해당하는 노드로부터 인증 정보를 수신하는 단계; 및 (3b) 상기 인증 정보와, 상기 유전체 물질 저장부의 유전체 물질에 포함된 인위적 핵산 서열을 비교함으로써 유전체에 대한 인증을 수행하는 단계를 포함한다.

본 발명에 따른 유전체 정보의 보존 및 활용을 위한 방법에 의하면, 블록체인 검색을 통한 유전체 정보 소유주의 위치 파악으로 유전체 정보의 일반적인 접근이 가능하기 때문에, 유전체 또는 유전체 정보가 일부에 독점되지 않고 일반에 공유 가능하여 유전 연구의 발전에 기여할 수 있다.

또한, 본 발명에 따른 유전체 정보의 보존 및 활용을 위한 방법은 유전체 정보의 소유주로부터 인증 정보를 획득한 경우 유전체의 접근을 허용하기 때문에, 유전체가 적법한 권한이 없는 자에 의해 사용되는 것을 차단할 수 있다.

또한, 본 발명에 따른 유전체 정보의 보존 및 활용을 위한 방법은, 블록 체인의 블록 해쉬값이 유전체 정보와 소유주 정보를 포함하도록 함으로써 유전체 정보의 위치를 다른 사용자가 쉽게 확인 가능하다.

또한, 본 발명에 따른 유전체 정보의 보존 및 활용을 위한 방법은, 블록체인 생성과정에서 신뢰성이 보장되므로 보안 측면에서 전자 서명을 통해 인증(Authentication), 부인방지(Non-repudiation)와 블록 hash 생성의 message digest를 통해 무결성(Integrity)을 가진다.

도 1은 본 발명의 실시예에 따른 블록 체인을 기반으로 한 유전체 정보의 관리 시스템을 전체적으로 도시한 구성도이다.

도 2는 본 발명의 실시예에 따른 유전체 물질이 보존된 캡슐을 나타내는 도면이다.

도 3은 본 발명에 따른 유전체 정보 관리 시스템에 있어서, 각 노드의 구조를 도시한 블록도이다.

도 4는 본 발명의 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드들에 의해 수행되는 블록 체인에 유전체 정보 및 소유주 정보를 포함하는 블록을 연결시키는 과정을 순차적으로 도시한 흐름도이다.

도 5는 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드의 트랜잭션 전송 모듈이 트랜잭션을 생성하는 과정을 설명하기 위하여 도시한 구성도이다.

도 6은 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 전자 서명에 대한 암호화 및 복호화 알고리즘을 설명하기 위하여 도시한 개념도이다.

도 7은 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 트랜잭션 수신 노드가 proof of work를 통해 블록 해쉬값을 생성하고 전송하는 과정을 도시한 개념도이다.

도 8은 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드의 유전체 정보 검색 모듈의 동작을 도시한 흐름도이다.

도 9는 각 노드들의 유전체 정보 검색 모듈을 이용하여 블록체인에 저장된 유전체 정보의 검색 후 소유주를 확인하는 과정을 도시한 개념도이다.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 블록 체인을 기반으로 한 유전체 및 유전체 정보의 보존과 활용을 위한 시스템 및 방법에 대하여 구체적으로 설명한다.

본 명세서에서 유전체는 살아있는 개체 또는 사체 어느 쪽의 유전체라도 무방하다. 유전체는 조직, 혈액으로부터 추출된 핵 DNA, 전유전체 DNA, 부분 유전체 DNA, 산모혈에 순환하는 태아의 DNA 등의 게놈 DNA 뿐만 아니라 체세포들, 생식세포들, 종양 세포들, 미생물 또는 다른 유기체들 감염세포들로 등 특정 세포들로부터 추출된 특정 세포군에 한정한 핵 DNA, 전유전체 DNA, 부분 유전체 DNA, 태아의 DNA 등의 게놈 DNA을 포함한다. 뿐만 아니라 cDNA, 특수 처리된 mRNA 등 게놈 DNA를 연구할 수 있도록 개발된 기술로 추출된 염기서열분석이 가능한 물질로서 정의 범주를 현 기술에 한정하지 않는다.

또한, 본 명세서에서 유전체 정보는 형질적 정보, 병리학적 정보, 의료적 정보, 유전체 서열정보, 유전체 실험분석 데이터 정보, 유전체와 형질 또는 질병과의 데이터마이닝 분석 데이터 정보, 기존유전체 데이터베이스와 비교 추출된 데이터 정보, 유전체와 유의미한 표현형을 연구하는데 필요한 임의의 관찰 가능한 표현형 외에도 각종 측정 계측된 자료의 표현형 중 적어도 하나를 포함한다. 유전체 서열 정보는 cDNA 서열, mRNA 서열, 및 또는 발현 프로파일들, 후성 데이터, 단백질 데이터, 전유전체 데이터, 메틸화 데이터, 대사체 데이터, 미생물군유전제 데이터, 사람체 서열데이터, PCR로부터의 유전자형 데이터, DNA 마이크로어레이들로부터의 유전자형 데이터, 총 유전제 시퀑싱으로부터의 유전자형 데이터, 전유전체시쿼싱으로부터의 유전자형 데이터, 유전자 시퀀싱으로부터의 유전자형 데이터, 핵형 데이터, 착상-전 유전자 검사 데이터, 배아 또는 태아의 비-침습성 출생 전 유전자 검사 데이터 등을 포함할 수 있다. 그러한 데이터의 범주는 제한되지 않으며 해당 기술 분야에 잘 알려진 방법들에 의해 획득 될 수 있다.

도 1은 본 발명의 실시예에 따른 블록 체인을 기반으로 한 유전체 정보 관리 시스템을 전체적으로 도시한 구성도이다.

도 1을 참조하면, 본 발명의 실시예에 따른 유전체 정보 관리 시스템(1)은 블록 체인을 활용하여 다수의 노드들에 저장된 유전체 정보를 관리 및 검색할 수 있도록 하는 시스템으로서, 유전체 저장부(1000) 및 복수의 노드(2,3,4, ..., n)를 포함한다.

유전체 저장부(1000)는 복수 개체의 유전체 물질을 보관한다. 각 유전체 물질은 유전체(게놈 DNA)와 인위적 핵산 서열을 포함하며, 예를 들면 캡슐 형태일 수 있다. 유전체 저장부(1000)는 특정 유전체에 대해 접근 요청을 받으면, 특정 유전체에 대응하는 인위적 핵산 서열을 이용하여 인증을 수행하고 인증 수행 결과에 따라 게놈 DNA를 제공할 수 있다. 유전체 저장부(1000)에 저장되는 유전체 물질은 살아있는 개체 또는 사체 어느 쪽의 유전체 물질이라도 무방하다. 사체의 유전체 물질을 저장하는 경우 유전체 물질 저장부(1000)는 유전체 무덤으로서 기능할 수 있다.

이하, 인위적 핵산 서열을 설정하는 방식 및 인증을 수행하는 방식에 대하여 구체적으로 설명한다.

본 발명에 따라 정보를 구성하는 가장 기본단위인 DNA 또는 RNA는 핵산의 기본구조가 포스포디에스테르 결합에 의해 연결된 물질로서, 유전공학 분야에서 일반적으로 정의되는 것과 동일하다. 핵산은 포스포디에스테르 결합방식에 의해 사슬형태로 결합되어 DNA와 RNA를 구성하게 된다. 핵산의 구조에서 염기결합부에는 총 5 종류의 화합물들이 결합될 수 있는데, 어떠한 화합물이 결합되느냐에 따라, DNA는 아데닌(Adenine: A), 티민(Thymine: T), 구아닌(Guanine: G) 및 씨토신(Cytosine: C)의 4 종류의 염기로 구성되어 있고, RNA는 아데닌(A), 우라실(Uracil: U), 구아닌(G) 및 씨토신(C)으로 구성된다. DNA와 RNA는 도 1a에서 환구조의 2 번 탄소에 -H가 결합되는지 또는 -OH가 결합되는지에 따라 구별된다. 생체내에서는 DNA 또는 RNA의 형태에서 4 종류 염기들의 3개의 조합에 의해 특정한 아미노산이 표현되고, 그러한 아미노산의 특정한 조합에 의해 단백질이 형성된다. 참고로, 3 개의 조합에는 1 종류의 염기가 2 이상 존재하는 경우도 있다. 또한, 상기 핵산서열을 자연계에 존재하는 염기들의 결합방식인 포스포디에테르 결합방식에 의해 이루어진다.

상기 서열조합과 정보단위를 매칭시켜 설정하는 복수의 방식은 예를 들면 아래 설명과 같이 3가지를 들 수 있다.

첫 번째 설정방식은 표 1과 같이, 하나 또는 둘 이상의 염기(서열단위)들의 일정한 허용횟수까지 이들의 반복 연결횟수에 따라 순차적으로 일련의 정보단위를 설정하고, 특정한 염기조합을 서열조합의 결합을 표시하는 마커로 설정하는 방식이다.

표 1은 염기들의 인위적 조합방식에 특정한 정보단위를 설정하는 방식 및 상기 설정방식을 이용하여 가치정보를 표현하는 방법의 일 실시예를 나타낸다. 표 1에서 보듯이, 사용된 염기들은 A, C, T, G이고, 일정한 허용횟수는 3으로 설정하였으며, 결합표시 마커로는 ATG가 사용되었다. 마커 ATG는 서열분석시 방향성을 제공하는 것으로서, 염기분석의 방향이 올바른지를 알려줄 수 있는 지표로서도 사용될 수 있는데, 예를 들어, 분석내용이 GTA의 서열조합을 포함하고 있으면 역으로 해석해야 함을 나타낸다. 표 1에서 보듯이, 주민등록번호의 일부인 '1480632'의 가치정보를 표현함에 있어서, 각각의 정보단위 '1', '4', '8' 등을 나타내기 위하여 대응하는 서열조합으로서 'A', 'C', 'TT' 등이 사용되었고, 이들의 적합한 결합형태 등을 확인하기 위하여 각 서열조합들의 사이에 결합마커 'ATG'가 사용되었다. 따라서, 서열단위들의 임의적 조합에 각각 일련의 정보단위를 미리 설정하여 놓고, 특정한 정보 데이터 '1480632'를 표현함에 있어서, 이들의 핵산서열을 구성하여 놓으면, 아래와 같이, 손쉽게 상기 가치정보를 확인할 수 있다.

가치정보 : 1 4 8 0 6 3 2

핵산서열 : A ATG C ATG TT ATG G ATG CCC ATG AAA ATG AA

두 번째 설정방식은 표 2 및 표 3에서와 같이, 특정한 염기(서열단위)를 서열조합의 개시 및/또는 종결 마커로서 사용하고 나머지 염기들의 하나 또는 둘 이상의 반복 연결횟수 또는 임의의 조합에 따라 순차적인 정보단위를 설정하는 방식이다.

표 2는 염기들의 인위적 조합방식에 특정한 정보단위를 설정하는 방식 및 상기 설정방식을 이용하여 가치정보를 표현하는 방법의 다른 일 실시태양을 나타낸다.

표 2에서 보듯이, T가 서열조합의 종결마커로서, A와 C가 서열조합의 반복 서열단위로서, 일정한 허용횟수는 5로서 각각 설정되어있다. 상기 주민등록번호 뒷자리 “1480632”의 정보데이터를 상기 표 2의 방식으로 암호화하면 아래와 같다.

가치 정보 : 1 4 8 0 6 3 2

핵산서열 : AT AAAAT CCCT CCCCCT CT AAAT AAT

또한, 표 3에서 보듯이, A가 서열조합의 개시마커로서, A, T, C, G의 2 개의 조합이 서열조합으로서 각각 설정되어 있다. 상기 “1480632”의 정보데이터를 상기 표 3의 방식으로 암호화하면 아래와 같다.

가치 정보 : 1 4 8 0 6 3 2

핵산서열 : ACC ATC AGT AAA ATG ACG ACT

세 번째 설정방식은 표 4에 도시한 바와 같이, 특정한 염기들의 둘 또는 셋 이상의 서열조합에 각각 특정한 정보단위를 설정하고 이들의 특정한 조합에 의해 가치정보를 설정하는 방식이다.

표 4는 염기들의 인위적 조합방식에 특정한 정보단위를 설정하는 방식 및 상기 설정방식을 이용하여 정보 데이터를 표현하는 방법의 또 다른 일 실시예를 각각 나타낸다. 표 4에서 보듯이, 3 개의 염기들은 제 1 염기, 제 2 염기 및 제 3 염기의 순서로 조합되어 하나의 정보단위(알파벳)를 나타낸다. 정보단위들은 표 4에서 A~Z로 표시되어 있다. 예를 들어, 제 1 염기로서 'A'와 제 2 염기로서 'T'와 제 3 염기로서 'T'의 조합에 의해 서열조합 'ATT'가 만들어지고, 그러한 서열조합에는 정보단위 'K'가 할당되어 있다. 핵산서열이 완벽한 정보를 담고있는지를 확인하기 위하여 종결마커로서 'CCC'의 서열조합이 설정되어있다. 한편, 핵산서열의 완벽성을 나타내기 위하여 'CCC'의 서열조합을 개시마커로 사용할 수도 있고, 경우에 따라서는 'CCC'를 개시 및 종결마커로서 동시에 사용할 수도 있다. 정보 데이터가 “JONG IL LEE”인 경우 이에 대한 암호화는 아래와 같이 수행된다.

가치 정보 : J O N G I L L E E

핵산서열 : ATA TTC TTT CAA CAC ATC ATC TAT TAT CCC

본 발명의 인위적 핵산 서열은 앞에서 예시한 서열조합과 정보단위의 대응 방식 중 어느 하나를 선택하여 이루어진다. 그러나 앞에서 설명한 방식들은 수많은 서열조합과 정보단위를 대응시키는 방식 중의 일부에 지나지 않는다.

이러한 인위적 핵산 서열은 상기 대응 방식의 역으로 적용하여 인증을 수행할 수 있다. 예를 들어, 유전체 물질 저장부(1000)는 인증 정보를 수신하면, 상기 대응 방식을 역으로 적용하여 핵산 서열로부터 가치 정보를 획득하고, 획득된 가치 정보와 인증 정보를 비교함으로써 인증을 수행할 수 있다. 이에 따라, 인증 정보의 제공자가 적법한 권리자임이 확인되면, 당해 인증 정보, 즉 핵산 서열에 대응하는 유전체를 인증 정보의 제공자에게 제공할 수 있다.

도 2는 본 발명의 실시예에 따른 유전체 물질이 보존된 캡슐(1100)을 나타내는 도면이다. 유전체 물질 저장부(1000)는 복수의 개체에 대하여 각각 생성된 캡슐(1100)을 복수 저장할 수 있다.

도 2를 참조하면, 캡슐(1100)은 열 및 기계적 외압에 의해 변형되지 않는 소재의, 상호 분리 및 결합될 수 있는 좌캡슐(1110)과 우캡슐(1120)로 구성된다. 경우에 따라서는, 외부의 열로부터 내용물을 더욱 안전하게 보지할 수 있게 하는 내열성 소재 또는 보관 및 보호를 용이하게 하는 방수 소재의 내피(1130)를 추가로 포함할 수도 있다. 캡슐(1100)의 내부에는 특정한 인간의 게놈 DNA(1200)과 인위적 핵산서열 DNA(1300)가 용액(1400)에 분산된 상태로 다수 포함되어 있으므로, 일부의 게놈 DNA(1200) 또는 인위적 핵산서열 DNA(1300)가 손상되어도 나머지 다수의 DNA들을 분석함으로써 인증을 행할 수 있다.

한편, 도 2에서 보듯이, 인위적 핵산서열은 벡터에 결합한 상태(1310)로 캡슐(1100)의 내부에 구비될 수도 있다. 앞서 설명한 바와 같이, 인위적 핵산서열 DNA(1300)은 게놈 DNA(1200)에 비해 상대적으로 훨씬 적은 수의 염기들로 이루어져 있기 때문에, 짧은 시간내에 간단히 분석할 수 있다.

전술한 캡슐 형태는 예시에 불과하며, 수많은 캡슐의 형태와 구성으로 변형 가능함은 통상의 기술자에게 자명할 것이다.

다시 도 1을 참조하면, 복수의 노드(2,3,4, ..., n)는 유전체 저장부(1000)에 유전체 물질을 제공하고, 제공된 유전체 물질에 대응하는 유전체 정보를 내부에 저장하고, 유전체 정보를 검색하는 기능을 제공한다. 개인이 유전체 물질을 유전체 물질 저장부(1000)에 제공하고, 제공한 유전체 물질에 대응하는 유전체 정보를 직접 자신의 컴퓨터에 저장하는 경우 개인의 컴퓨터가 복수의 노드(2,3,4, ..., n)에 대응할 수 있다. 또는, 개인은 유전체 물질을 유전체 물질 저장부(1000)에 제공하고 유전체 정보를 전문적으로 관리하는 회사에 유전체 정보의 관리를 의뢰할 수 있으며, 이 경우 유전체 정보의 관리 회사가 복수의 노드(2,3,4, ..., n)에 대응할 수 있다. 또한, 복수의 노드(2,3,4, ..., n)는 의료 관련 유전체 분석자 등 유전체를 필요로 하는 개인, 기관 또는 회사 등에 대응할 수 있다.

도 3을 참조하면, 각 노드(2,3,4, ..., n)는 블록 체인(10), 노드 위치정보 저장 모듈(11), 유전체 정보 저장 모듈(12), 트랜잭션 전송 모듈(13), 블록 체인 실행 모듈(14) 및 유전체 정보 검색 모듈(15)을 구비한다.

블록 체인(10)은 다수 개의 블록들이 사슬 형태로 연결되어 이루어진 것이다. 이와 관련하여, 도 3을 참조하면, 블록 체인의 각 블록은 현재 블록의 해쉬(Hash) 값, 논스(Nonce) 값, 이전 블록의 해쉬값, 타임 스탬프(Time Stamp)를 포함한다. 상기 해쉬값과 논스값은 유전체 정보와 소유주의 IP 주소 및 Port 번호에 대하여 사전 설정된 해쉬 함수를 이용하여 구한 값들이다. 블록 체인의 블록들은 자신의 블록 해쉬값 뿐만 아니라 바로 이전의 블록에 대한 블록 해쉬값도 함께 포함하고 있으므로, 블록 체인의 각 블록들은 사슬처럼 서로 연결되어 이어져 나가게 된다.

노드 위치정보 저장 모듈(11)은 복수의 노드(2,3,4, ..., n)의 위치 정보를 저장한 것이다. 이러한 위치 정보는 예를 들면 각 노드의 IP 주소 및 Port 번호일 수 있다. 노드 위치정보 저장 모듈(11)은 모든 노드들에 구비된다.

유전체 정보 저장 모듈(12)은 유전체 정보가 저장되는 메모리 영역으로서, 각 노드들은 다른 노드들과 공유하고자 하는 유전체 정보를 저장하기 위한 폴더를 사전 지정해 둔다. 본 발명에 따른 시스템에 의하여 모든 노드들이 유전체 정보 저장 모듈(12)에 저장된 유전체 정보들을 공유할 수 있는 정보 공유 플랫폼을 제공할 수 있게 된다. 각 노드(2,3,4, ..., n)는 도 1의 유전체 물질 저장부(1000)에 유전체 물질을 제공한 후, 제공한 유전체 물질에 대응하는 유전체 정보를, 각 노드(2,3,4, ..., n) 내의 유전체 정보 저장 모듈(12)에 저장할 수 있다. 또는, 각 노드(2,3,4, ..., n)는, 후술하는 바와 같이 원하는 유전체 정보가 노드(2,3,4, ..., n)에 저장되어 있는지 검색하고, 검색된 노드, 즉 소유주 노드로부터 인증 정보를 수신하고, 수신된 인증 정보를 기초로 유전체 물질 저장부(1000)로부터 유전체 물질을 제공받아 유전체 물질을 분석한 결과에 기초하여 유전체 정보(제2 유전체 정보)를 생성하고, 생성한 유전체 정보(제2 유전체 정보)를 유전체 정보 저장 모듈(12)에 저장할 수도 있다. 유전체 정보 또는 제2 유전체 정보는 개체의 외형이나 병력 등의 표현 형질, 치료 이력 및 유전자 분석 정보 중 적어도 하나가 포함될 수 있다. 이하, 유전체 정보는 제2 유전체 정보를 포함하는 의미로 사용한다.

트랜잭션 전송 모듈(13)은 유전체 정보 저장 모듈(12)의 사전 설정된 폴더에 유전체 정보가 저장되면, 저장된 유전체 정보, 소유주 정보 및 전자 서명을 포함하는 트랜잭션을 생성하고, 생성된 트랜잭션을 블록 체인을 갖는 다른 노드들로 전송한다. 또한, 트랜잭션 전송 모듈(13)은 유전체 정보 저장 모듈(12)의 사전 설정된 폴더에 제2 유전체 정보가 저장되면, 저장된 제2 유전체 정보, 소유주 정보 및 전자 서명을 포함하는 제2 트랜잭션을 생성하고, 생성된 제2 트랜잭션을 블록 체인을 갖는 다른 노드들로 전송한다. 이하, 트랜잭션은 제2 트랜잭션을 포함하는 의미로 사용한다. 본 명세서에서는, 설명의 편의상, 트랜잭션 및 제2 트랜잭션을 전송한 노드를 "트랜잭션 송신 노드"라고 표시한다. 소유주 정보는 유전체 정보가 저장된 노드의 IP 주소 및 Port 번호를 포함할 수 있다.

유전체 정보는 아스키 코드(ASCII Code)의 형태로 변환되어 트랜잭션에 포함되고, 소유주의 IP 주소 및 Port 번호는 십진수의 형태로 변환되어 트랜잭션에 포함될 수 있다.

블록 체인 실행 모듈(14)은 블록 체인을 갖는 다른 노드들로부터 트랜잭션을 수신하면, 수신된 트랜잭션에 대해 블록을 생성하여 블록 체인에 연결시켜 블록 체인을 확장시키게 된다. 본 명세서에서는, 설명의 편의상, 트랜잭션 송신 노드로부터 트랜잭션을 수신한 노드를 "트랜잭션 수신 노드"라고 표시한다. 이하, 블록 체인 실행 모듈(14)의 동작을 보다 구체적으로 설명한다.

블록 체인 실행 모듈(14)은 다른 노드로부터 트랜잭션을 수신하면, 자신이 블록을 생성하기 위하여 필요한 블록 해쉬값을 만들기 위하여 proof-of-work 를 실행한다. proof of work 는 사전 설정된 해쉬 함수를 사용하여 랜덤한 논스값을 상기 수신된 트랜잭션과 연산하여 정해진 '0'의 개수를 충족시키는 16진수의 블록 해쉬값을 만드는 작업이다. 본 발명에 따른 시스템에서는 SHA 256 해쉬 함수를 사용하며, 그 외의 다른 해쉬 함수도 사용가능하다. 이와 같이 proof of work를 하는 이유는, 블록 체인에 참여한 노드들 중 어떠한 노드가 블록을 생성할지 모르게 만들기 위한 것으로서, 악의적 노드가 현재 블록을 생성할 노드를 판단하지 못하게 하여 악의적 노드의 공격(attack)을 방지하게 된다. 예컨대, 비트 코인의 블록 체인의 높이는 417453개이고, 이 블록 해쉬값의 '0'의 개수는 17개인데, 비트 코인은 '0'의 개수를 늘리면서 블록 생성 난이도를 조절하는데, 현재 가장 높은 CPU 또는 GPU 성능을 갖는 시스템을 기준으로 하여 10분에 1개의 블록을 생성하는 '0'의 개수를 취하는 식으로 블록 생성 난이도를 설정하고 있다.

블록 체인 실행 모듈(14)은, 트랜잭션 수신 노드들 중 proof-of-work 를 가장 먼저 성공하면, 블록 해쉬값과 랜덤한 논스(Nonce) 값을 찾아내고, 이를 이용하여 블록을 생성하며, 블록 생성 사실과 상기 찾아낸 블록 해쉬값과 랜덤한 논스값을 전체 노드들에게 전송한다. 본 명세서에서는, 설명의 편의상, 트랜잭션 수신 노드들 중 proof-of-work를 가장 먼저 성공한 노드를 "proof of work 성공 노드"라고 표시한다.

블록 체인 실행 모듈(14)은, proof of work 성공 노드로부터 블록 해쉬값과 논스값을 수신하면, 유효 검정 알고리즘을 이용하여 트랜잭션과 상기 수신한 블록 해쉬값과 논스값에 대하여 유효성을 판단한 후, 유효성 검증이 완료되면 상기 수신한 블록 해쉬값과 논스값을 이용하여 추가의 블록을 생성하고 블록 체인에 생성된 추가의 블록을 연결시킨다.

유전체 정보 검색 모듈(15)은 블록 체인(10)과 노드 위치정보 저장 모듈(11)를 이용하여 각 노드에 저장된 유전체 정보와 소유주를 검색할 수 있도록 한다.

유전체 정보 검색 모듈(15)은, 검색 정보가 입력되면, 블록 체인에 저장된 각 블록의 논스(nonce) 값을 판독하고, 판독된 논스값, 입력된 검색 정보 및 IP 리스트의 각 노드들에 대한 IP 주소와 Port 번호를 이용하여 블록 해쉬값을 생성하고, 생성된 블록 해쉬값이, 논스값이 포함된 블록의 블록 해쉬값과 일치하는지를 판단한다. 만약, 생성된 블록 해쉬와 일치하는 블록 해쉬값을 갖는 블록이 존재하면, 해당 IP 주소와 Port 번호를 갖는 노드가 소유주임을 결정하고, 해당 노드로 유전체 정보 저장부(1000)에 저장된 유전체 물질의 인위적 핵산 서열에 해당하는 인증 정보를 요청한다. 유전체 정보 저장부(1000)는 인증 정보와 인위적 핵산 서열을 비교함으로써, 인증 정보를 제시한 자가 적합한 권한이 있음을 인정하게 되고, 유전체를 인증 정보를 제시한 자에게 제공할 수 있다. 만약, 상기 생성된 블록 해쉬값과 일치하는 블록 해쉬값을 갖는 블록이 존재하지 않으면, 해당 데이터는 없다고 결정하게 된다.

한편, 본 발명에 따른 시스템에 있어서, 블록 체인 실행 모듈(14)은, 블록 체인을 갖는 다른 노드들로부터 하나의 트랜잭션을 수신하면, 수신된 하나의 트랜잭션에 대해 하나의 블록을 생성하여 블록 체인에 연결시키는 것을 특징으로 한다.

이하, 전술한 구성을 갖는 블록 체인을 기반으로 한 유전체 정보 관리 시스템에 있어서, 각 노드에서의 유전체 정보 관리 및 검색 방법을 보다 구체적으로 설명한다.

도 4는 본 발명의 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드들에 의해 수행되는 블록 체인에 유전체 정보 및 소유주 정보를 포함하는 블록을 연결시키는 과정을 순차적으로 도시한 흐름도이다. 도 4를 참조하여, 각 노드들에 의해 수행되는 블록 체인에 유전체 정보 및 소유주 정보를 포함하는 블록을 연결시키는 과정을 구체적으로 설명한다.

각 노드들은 블록 체인 및 IP 리스트를 구비하며, 각 노드들은 유전체 정보 저장 모듈에 다른 노드들과 공유하고자 하는 유전체 정보를 저장하기 위한 영역을 사전 지정해 둔다.

먼저, 각 노드들은, 트랜잭션 전송 모듈에 의해, 상기 사전 설정된 영역에 유전체 정보를 생성하여 저장하면, 상기 유전체 정보, 상기 유전체 정보에 대한 소유주 노드의 IP 주소와 Port 번호, 전자 서명을 포함하는 트랜잭션을 생성하고, 생성된 트랜잭션을 다른 노드들에게 전체적으로 전송한다(S400).

한편, 다른 노드들은 트랜잭션 송신 노드로부터 트랜잭션을 수신하게 된다(S410).

트랜잭션 수신 노드들은, 블록 체인 실행 모듈을 통해, 상기 수신된 트랜잭션에 대하여 자신이 블록을 생성하기 위하여 필요한 블록 해쉬값을 만들기 위하여 proof-of-work 를 실행한다(S420).

트랜잭션 수신 노드들 중 proof-of-work 를 가장 먼저 성공한 노드는, 블록 체인 실행 모듈을 통해, 블록 해쉬값과 랜덤한 논스(Nonce) 값을 찾아내고, 이를 이용하여 블록을 생성하며, 블록 생성 사실과 상기 찾아낸 블록 해쉬값과 랜덤한 논스값을 전체 노드들에게 전송한다(S430).

proof of work 성공 노드로부터 블록 해쉬값과 논스값을 수신한 다른 노드들은 유효 검정 알고리즘을 이용하여 트랜잭션과 상기 수신한 블록 해쉬값과 논스값에 대하여 유효성을 판단한 후(S440), 유효성 검증이 완료되면 상기 수신한 블록 해쉬값과 논스값을 이용하여 추가의 블록을 생성하고 상기 블록 체인에 상기 추가의 블록을 연결시킨다(S450).

도 5를 참조하면, 소유주는 사전 지정된 영역에 유전체 정보를 저장한다. 이때, 유전체 정보는 키, 체중, 시력, 호흡기 치료 이력, 고혈압 치료 이력 등 복수의 필드를 포함하고, 각 필드에 해당하는 숫자 또는문자를 포함할 수 있다. 생성된 유전체 정보는 문자를 숫자로 표현가능한 아스키(ASCII) 코드를 이용하여 단순 나열을 통한 유전체 정보를 표현하고 IP 주소는 이진수로 변환시킨 후 십진수로 변환시키는 것이 바람직하다. 이러한 과정을 통해 추출된 유전체 정보, 소유주의 IP 주소와 Port 번호와 전자 서명(Signature)과 함께 트랜잭션을 생성하게 된다.

도 6을 참조하면, 본 발명에 따른 시스템에 있어서, 데이터 소유주인 트랜잭션 송신 노드는 트랜잭션을 송신할 때 private key를 이용하여 전자서명을 생성하고 전자서명을 트랜잭션에 포함시켜 송신하며, 트랜잭션 수신 노드는 public key를 이용하여 수신된 트랜잭션의 전자서명을 복호화하여 트랜잭션을 송신한 소유주 IP 및 port와 트랜잭션에 포함된 IP address 및 port number가 일치하는지 확인하게 된다.

본 발명에 따른 시스템은, private key와 public key를 이용하여 전자 서명(signature)를 생성하게 되는데, 전자서명 시 사용한 암호 이론은 ECDSA이며, 트랜잭션 송신 노드의 IP address와 TCP socket 통신에 사용할 소유주의 port number를 나열하여 자신의 private key와 암호화함으로써, 전자서명을 생성하게 된다. 해당 전자서명은 트랜잭션에 첨부되고 ECDSA로 생성한 public key를 동봉하여 다른 노드에 전송한다. 트랜잭션 수신 노드는 동봉된 public key를 이용해 복호화시켜 출력된 결과가 True 혹은 False인지를 확인하여 해당 트랜잭션이 유효함을 검증하게 된다. 전자서명의 확인으로 spoofing을 방지하여 임의의 악의적 노드가 잘못된 트랜잭션을 전송하여 블록에 포함시키는 것을 방지한다.

도 7를 참조하면, 실제 비트코인 블록체인 블록 hash의 0의 개수는 17개가 필요한 난이도로 설정되어 있으며 그에 맞게 난이도를 설정한다. 기존의 블록체인과 달리 여러 트랜잭션을 포함한 블록이 아닌 하나의 트랜잭션만 포함하는데, 즉 하나의 블록에 하나의 유전체 정보, 소유주 정보가 입력된다. 이 정보만 이용하여 블록 hash로 만들어 추후에 데이터 검색 시 블록 hash 분석을 통해 검색 정보과 소유주 정보를 확인 가능하게 한다. Hash 알고리즘을 적용하기 위해 트랜잭션으로 수신한 IP, port, 유전체 정보를 나열하고, 랜덤하게 nonce값을 생성해서 SHA256 hash 알고리즘을 사용해 블록 hash를 생성한다(1). 설정한 기준 값인 0이 17개보다 많은 0을 가진 hash값을 찾기까지 nonce를 계속 변화시켜가고, 조건에 타당한 hash를 찾을 시 블록 hash로 받아들인다. 임의의 노드가 생성한 블록 hash값과 nonce값을 블록체인에 참여한 모든 노드들에게 전송하며(2) 수신한 노드는 자신이 받은 블록 hash값과 nonce값을 분석하여 유효성 검증을 진행한다(3). 각 노드들은 블록 생성 위한 트랜잭션 정보를 모두 가지고 있으므로, 트랜잭션 정보인 IP 주소, port 번호, 유전체 정보를 나열하고 수신한 nonce값을 이용해 SHA256 해쉬 알고리즘을 진행하여 출력된 hash 값이 수신한 블록 hash값과 일치했을 때 트랜잭션의 내용이 변하지 않았다는 사실을 노드가 인지하여, 악의적 노드의 블록 생성을 차단할 수 있다. 블록 유효성 검증이 완료된 블록은 해당 내용들이 Json 파일 형태로 저장된 후(4), 블록 체인에 연결된다(5).

도 8은 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드의 유전체 정보 검색 모듈의 동작을 도시한 흐름도이며, 도 9는 각 노드들의 유전체 정보 검색 모듈을 이용하여 블록체인에 저장된 유전체 정보의 검색 후 소유주를 확인하는 과정을 도시한 개념도이다.

도 8 및 도 9를 참조하면, 먼저 사용자가 검색 정보(a)를 입력하면(S800), ASCII code로 변환 후 노드 위치정보 저장 모듈(11)에 있는 각 노드들의 IP 주소와 port 번호의 정보와 함께 나열한다(S810). Json 파일 형태로 저장된 블록체인(10)을 읽어 해당 블록의 nonce 값을 판독하고(S820), 상기 판독된 nonce 값과 앞서 나열한 정보들과 함께 SHA256 hash 알고리즘을 적용시켜 해쉬값을 구하며(S830), 이렇게 구한 해쉬값이 Json 파일의 블록 hash값과 일치하는지를 확인한다(S840). Json 블록 하나를 열어 IP 리스트의 모든 노드들의 IP 주소와 port 번호를 이용해 nonce값과 함께 hash값을 찾아내고 일치하는 hash값이 존재하지 않는다면 다음 블록을 열어 같은 방식으로 반복하여 진행한다. 블록의 hash값과 일치하는 hash 값을 찾아내면, 해당 IP 주소와 port 번호를 가진 노드가 검색한 데이터의 소유주임을 확인 가능하다(S850). 만약 검색한 유전체 정보가 블록체인에 존재하지 않을 경우 "not found"를 return한다(S860).

이와 같이, 본 발명에 따른 유전체 정보 관리 시스템은, 유전체 정보를 블록체인의 hash를 검색하여 소유주의 IP address 및 port 정보를 찾아냄으로서 공유 가능한 유전체 정보의 리스트를 확인 가능한 플랫폼을 구현할 수 있다. 또한, 블록체인 상에서 유전체 정보의 소유주 정보를 확인했을 시, 검색한 노드는 소유주 노드에 해당 유전체 정보에 해당하는 인증 정보를 요청하게 되고, 소유주 노드는 인증 정보를 전송하여 검색 노드로 하여금 유전체 물질 저장부에서 인증을 수행하도록 할 수 있다. 이에 따라, 유전체 물질 저장부는 인증 정보에 해당하는 유전체를 검색 노드(인증을 수행한 자)에게 제공할 수 있다.

여기서, 소유주 노드는 특정 조건을 만족한 경우에만 검색한 노드에 인증 정보를 전송할 수 있다. 예를 들어, 검색한 노드에 해당하는 연구 기관이나 분석자가 소유주 노드가 희망하는 분야의 연구를 수행한다든지, 또는 검색한 노드에서 원하는 비용을 지불한다든지 등의 조건이 있을 수 있다. 이에 따라, 유전체의 소유주가 유전 자원의 분배 과정에서 소외되지 않고 주체가 될 수 있다.

이후, 소유주 노드로부터 인증 정보를 제공받은 검색한 노드는, 유전체 물질 저장부로부터 유전체를 분석하여 유전체 분석 정보(제2 유전체 정보)를 생성할 수 있다.

유전체 분석 정보는 유전체 정보를 다음과 같은 생물의학적 연구를 위해 구축된 각종 데이터베이스 정보와 비교분석하거나 수치적 혹은 텍스트 데이터마이닝을 통해 획득한 통계적으로 유의미한 자료의 정보로서 생물의학적 연구를 위해 구축된 각종 데이터베이스의 예시항목은 다음과 같으며 신규를 구축되는 데이터베이스도 포함된다. 예시항목 데이터베이스는 다음과 같다.

NCBI 데이터베이스들(이에 한정되는 것은 아니지만 젠뱅크(GenBank) 및 엉트헤(Entrez)) 또는 다른 공용 또는 전용 데이터베이스들, 이를테면 일본의 DNA 정보 은행(DNA Data Bank of Japan)(국립 유전학 연구소), 유럽 뉴클레오티드 아카이브(European Nucleotide Archive)(유럽 생물정보학 연구소), 인셈블(Ensembl),유니프롯(UniProt), 스위스-프롯(Swiss-Prot), 단백체 식별 데이터베이스(Proteomics IdentificationsDatabase), 유럽의 단백질 정보 은행, 일본의 단백질 정보 은행, BIND 생체분자 상호작용 네트워크 데이터베이스(Biomolecular Interaction Network Database), 리앰톰(Reactome), 엠젠(mGen), 패서전포탈(PathogenPortal), 소스(SOURCE), 메타베이스(MetaBase), 바이오그래프(BioGraph), 생물정보 하베스터(Bioinformatic Harvester), 엔자임 포탈(Enzyme Portal), 막스 플랑크 연구소(Max Planck Institute), 이에 한정되는 것은 아니지만 일루미나스 래버러토리스 및/또는 베이스스페이스(BASESPACE)를 포함하는 일루미나(Illumina), 라이프 테크놀로지스(Life Technologies), 컴플리트 지노믹스(Complete Genomics), 퍼시픽 바이오사이언시스(Pacific Biosciences), 아피매트릭스(Affymetrix), 애질런트(Agilent), 시쿼놈(Sequenom), 어레잇코포레이션(Arrayit Corporation), 래버러토리 코포레이션 오브 어메리카(Laboratory Corporation ofAmerica), 퀘스트 다이어그노스틱스(Quest Diagnostics), 엠파이어 지노믹스(Empire Genomics), 익스프레션 애널리시스(Expression Analysis), 진디엑스(GeneDx), 진 바이 진(Gene by Gene), 나테라(Natera), 앰브리 제네틱스(Ambry Genetics), 내셔널 지오그래픽(National Geographic), 의료 연구를 위한 코리엘 연구소(CoriellInstitute for Medical Research), 카이저 퍼머넌트(Kaiser Permanente), 정부 데이터베이스들, 연구원의 데이터베이스들, 대학의 데이터베이스들, 연구소의 데이터베이스들, 연구소의 유전자 검사 장비, 이에 한정되는 것은 아니지만 시퀀서들 및/또는 랩-온-칩을 포함하여 유전자 검사를 수행하는 디바이스, 의료 기관의 데이터베이스들, 보건-관련 데이터베이스들, 건강 보험 회사의 데이터베이스, 데이터베이스들, 공기업의 데이터베이스들,바이오피지컬 코포레이션(BioPhysical Corporation), 스펙트라셀 래버러토리스(Spectracell Laboratories), 헬스 다이어그노스틱 래버러토리 인크(Health Diagnostic Laboratory Inc.), 놈(Knome), 카운실(Counsyl), 앤시스트리닷컴(Ancestry.com), 패밀리 트리 DNA(Family Tree DNA), 매치닷컴(Match.com), 이하모니(eHarmony), 오케이큐피드(okCupid), 드럭스닷컴(Drugs.com), HGMD(Human Gene Mutation Database), OMIM(Online MendelianInheritance in Man), 에스엔피디아(SNPedia), 위키피디아(Wikipedia), 페이스북(Facebook), 마이스페이스(Myspace), 링크드인(LinkedIn), 구글(Google)(이에 한정되는 것은 아니지만 인터넷 검색 이력, 클릭 이력, 및구글 플러스(Google Plus) 데이터베이스들을 포함하는), 아마존(Amazon), 애플(Apple), 야후(Yahoo!), 인스타그램(Instagram), 핀터레스트(Pinterest), 트위터(Twitter), 유럽 분자 생물 실험실(European MolecularBiology Laboratory), 아시아 태평양 생명정보학 네트워크(Asia Pacific BioInformatics Network), 베이징 유전학 연구소(Beijing Genomics Institute), 헬스케어닷거브(Healthcare.gov), 미국 인류봉사 보건복지부(United States Department of Health and Human Services), 의료 보장 센터(The Centers for Medicare andMedicaid Services), 미국 재향 군인청(United States Veterans Affairs), 캘리코(Calico), DNA 넥서스(DNANexus), 패스웨이 지노믹스(Pathway Genomics), 아이-진(i-gene), 개인의 개인용 컴퓨터, 개인의 전화, 개인의태블릿 디바이스, 개인의 전자 디바이스, 지노테크(Genotek), 바이오-로지스(bio-logis), 제네렉스(Genelex),루미제닉스(Lumigenix), 스파이럴 제네틱스(Spiral Genetics), 의료인의 데이터베이스, 전자 의료 기록들, 전자건강 기록들(electronic health records), 엑스코드 라이프 사이언시스(Xcode Life Sciences), 리켄 제네시스(Riken Genesis), 페르소나리스(Personalis), 맵마이게놈(MapMyGenome), 및/또는 23앤미(23andMe)에 의해 소유되거나 제어될 수 있는 것들로부터의 유전체 정보분석 데이터베이스에 의해 획득될 수 있다.

상기 검색한 노드는 제2 유전체 정보를 전술한 유전체 정보와 동일한 방법으로 저장하고 블록을 생성하여 블록체인에 연결한다. 이에 따라, 유전체 정보뿐만 아니라 그로부터 파생된 제2 유전체 정보도 공개 및 접근이 가능하여 유전학 및 관련 업계의 획기적인 발전을 꾀할 수 있다.

본 발명에 따른 유전체 정보 관리 시스템 및 이를 이용한 방법은 블록체인을 통한 유전체 정보와 소유주의 정보를 저장하여 블록체인 검색을 통해 필요한 데이터를 공유 요청하는 형식이기 때문에 많은 저장 용량 소모의 문제를 해결할 수 있다.

이에 따라, 각 개인은 유전체 무덤, 즉 유전체 물질 저장부(1000)에 유전체 물질을 저장함으로써 현실적인 무덤을 제작 및 관리하는데 필요한 노력이나 비용을 절감할 수 있고, 유전체 물질을 제3자에 공유되도록 할 수 있다.

또한, 유전체 분석 주체는 필요한 유전체 물질에 관한 유전체 정보를 손쉽게 검색하고, 그에 해당하는 유전체 물질의 소유자에 컨택하여 유전체 물질을 얻을 수 있다. 이에 따라, 종래 유전체 물질이 특정 업체나 기관에 독점되던 것에 반해, 유전체 물질이 공개적으로 접근이 가능해지기 때문에 의료 및 유전 업계의 발전을 꾀할 수 있다.

이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.

Claims

블록들이 연결되어 구성된 블록 체인을 각각 포함하는 복수의 노드들에 유전체 정보들을 분산하여 저장하고, 저장된 유전체 정보들 중 적어도 하나를 검색하고, 복수의 유전체 물질들-각각은 유전체와 인위적 핵산 서열을 포함함-을 저장하는 유전체 물질 저장부로부터 상기 검색된 유전체 정보에 해당하는 유전체 물질을 취득하기 위한 방법으로서,

(1) 상기 복수의 노드들 각각에 의해 수행되는 유전체 정보의 저장 단계;

(2) 상기 복수의 노드들 중 적어도 하나인 검색 노드에 의해 수행되는 유전체 정보의 검색 단계; 및

(3) 인증 단계

를 포함하고,

상기 (1) 유전체 정보의 저장 단계는,

(1a) 상기 유전체 정보를 저장하는 단계;

(1b) 상기 복수의 노드들에 대한 위치정보를 저장하는 단계;

(1c) 상기 유전체 정보가 저장되면, 상기 저장된 유전체 정보 및, 당해 유전체 정보가 저장된 노드의 위치정보인 소유주 정보를 포함하는 트랜잭션을 생성하고, 상기 생성된 트랜잭션을 다른 노드들로 전송하는 단계; 및

(1d) 상기 복수의 노드들 중 다른 노드로부터 트랜잭션을 수신하고, 수신된 트랜잭션에 대해 가장 먼저 블록을 생성하면 블록 해쉬값과 논스값을 다른 노드들에게 송신하며, 다른 노드로부터 블록 해쉬값과 논스값을 수신하면 수신된 값들을 이용하여 블록을 생성하여 블록 체인에 연결하는 단계;

를 포함하고,

상기 (2) 유전체 정보의 검색 단계는,

(2a) 검색정보가 입력되면, 블록 체인에 저장된 각 블록의 논스 값을 판독하고, 상기 판독된 논스값, 상기 입력된 검색정보 및 상기 복수의 노드들에 대한 위치정보를 이용하여 해쉬값을 생성하는 단계;

(2b) 상기 생성된 해쉬값이 상기 논스값이 포함된 블록의 블록 해쉬값과 일치하는지를 판단하는 단계; 및

(2c) 상기 생성된 해쉬값과 일치하는 블록 해쉬값을 갖는 블록이 존재하면, 해당 위치 정보를 갖는 노드가 소유주임을 결정하는 단계;

를 포함하고,

상기 (3) 인증 단계는,

(3a) 상기 소유주에 해당하는 노드로부터 인증 정보를 수신하는 단계; 및

(3b) 상기 인증 정보와, 상기 유전체 물질 저장부의 유전체 물질에 포함된 인위적 핵산 서열을 비교함으로써 유전체에 대한 인증을 수행하는 단계

를 포함하는 방법.
제1항에 있어서,

상기 (3b) 인증을 수행하는 단계는,

(3b-1) 숫자 또는 문자의 정보단위를 DNA 또는 RNA의 염기들의 인위적인 조합에 대응시키는 단계;

(3b-2) 상기 대응 관계에 따라, 상기 정보단위의 순차적 결합에 의해 표현될 수 있는 가치정보를 상기 DNA 또는 RNA 염기들의 순차적 결합 형태인 상기 인위적 핵산 서열로 표현하는 단계; 및

(3b-3) 상기 인증 정보가 입력되면, 상기 인위적 핵산 서열을 상기 대응 관계에 따라 가치정보로 해석하고, 해석된 가치정보과 상기 입력된 인증 정보를 비교하는 단계

를 포함하는 방법.
제2항에 있어서,

상기 가치정보는 이름, 주민등록번호 또는 인증 고유번호인 방법.
제1항에 있어서,

상기 복수의 유전체 물질들 각각은, 상이한 개체의 유전체와, 벡터에 연결된 상기 인위적 핵산 서열을 포함하는 캡슐인 방법.
제1항에 있어서,

상기 블록 체인의 각 블록은 다수의 노드들에 저장된 유전체 정보에 대하여 각각 생성된 것으로서, 각 블록의 블록 해쉬값은 유전체 정보, 유전체 정보의 소유주 정보와 논스값에 대하여 사전 설정된 해쉬 알고리즘을 적용하여 생성한 해쉬값인 방법.
제1항에 있어서,

상기 소유주 정보는, 상기 유전체 정보가 저장된 노드의 IP 주소와 포트 번호를 포함하는 방법.
제1항에 있어서,

상기 트랜잭션은 전자 서명을 추가로 포함하는 방법.
제1항에 있어서,

상기 유전체 정보는 개체의 표현 형질 및 치료 이력 중 적어도 하나인 방법.
제1항에 있어서,

상기 (3a) 단계는,

(3a-1) 상기 소유주에 해당하는 노드는 상기 검색 노드가 소정의 조건을 충족하는 경우 상기 검색 노드에 상기 인증 정보를 전송하는 단계; 및

(3a-2) 상기 검색 노드는 상기 인증 정보를 수신하는 단계

를 포함하는 방법.
제1항에 있어서,

(4a) 상기 (3) 인증 단계 후에, 상기 (3) 인증 단계의 인위적 핵산 서열에 대응하는 유전체를 기초로 제2 유전체 정보를 생성하여 저장하는 단계;

(4b) 상기 제2 유전체 정보가 저장되면, 상기 저장된 제2 유전체 정보 및, 당해 제2 유전체 정보가 저장된 노드의 위치정보인 제2 소유주 정보를 포함하는 제2 트랜잭션을 생성하고, 상기 생성된 제2 트랜잭션을 다른 노드들로 전송하는 단계; 및

(4c) 상기 복수의 노드들 중 다른 노드로부터 제2 트랜잭션을 수신하고, 수신된 제2 트랜잭션에 대해 가장 먼저 블록을 생성하면 블록 해쉬값과 논스값을 다른 노드들에게 송신하며, 다른 노드로부터 블록 해쉬값과 논스값을 수신하면 수신된 값들을 이용하여 블록을 생성하여 블록 체인에 연결하는 단계;

를 포함하는 (4) 유전체 정보의 업데이트 단계

를 더 포함하는 방법.