WO2020017869A1 - 유전체 및 유전체 정보의 보존 및 활용을 위한 방법 - Google Patents

유전체 및 유전체 정보의 보존 및 활용을 위한 방법 Download PDF

Info

Publication number
WO2020017869A1
WO2020017869A1 PCT/KR2019/008777 KR2019008777W WO2020017869A1 WO 2020017869 A1 WO2020017869 A1 WO 2020017869A1 KR 2019008777 W KR2019008777 W KR 2019008777W WO 2020017869 A1 WO2020017869 A1 WO 2020017869A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
genome
block
node
nodes
Prior art date
Application number
PCT/KR2019/008777
Other languages
English (en)
French (fr)
Inventor
이윤경
이유진
이영우
Original Assignee
이윤경
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이윤경 filed Critical 이윤경
Priority to US17/260,513 priority Critical patent/US11954601B2/en
Priority to EP19837847.3A priority patent/EP3826021B1/en
Priority to JP2021503060A priority patent/JP7037700B2/ja
Priority to CN201980060499.6A priority patent/CN112840403A/zh
Publication of WO2020017869A1 publication Critical patent/WO2020017869A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3236Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using cryptographic hash functions
    • H04L9/3239Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using cryptographic hash functions involving non-keyed hash functions, e.g. modification detection codes [MDCs], MD5, SHA or RIPEMD
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/123DNA computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/40Encryption of genetic data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3226Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using a predetermined code, e.g. password, passphrase or PIN
    • H04L9/3231Biological data, e.g. fingerprint, voice or retina
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3236Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials using cryptographic hash functions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/32Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials
    • H04L9/3247Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols including means for verifying the identity or authority of a user of the system or for message authentication, e.g. authorization, entity authentication, data integrity or data verification, non-repudiation, key authentication or verification of credentials involving digital signatures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/50Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols using hash chains, e.g. blockchains or hash trees

Definitions

  • the present invention relates to a method for preservation and utilization of genome and genomic information, based on encryption technology for information such as storage, distribution, provision, reprocessing of information, and more particularly, an encryption technology using an artificial nucleic acid sequence.
  • Permanent authentication for storing and distributing genetic materials of each object by utilizing them, and utilizing genomes to securely and reliably establish storage, distribution, provision, and reprocessing of genetic materials by using encryption technology such as blockchain It is about inducing direct tp customer (DTC) approach to various industries and sharing genome or genome information efficiently.
  • DTC direct tp customer
  • genome data are sold to commercial entities without the knowledge of the genome's donors or revenues, resulting in inadequate distribution of revenue from genomes and security and storage of information derived from genome analysis. .
  • the present invention seeks to provide a method for preservation and utilization of genome information in which genome or genome information is not monopolized and can be shared to the general public, and the genome can be authenticated.
  • a method for acquiring a dielectric material corresponding to the retrieved dielectric information from a dielectric material storage unit storing a box comprising: (1) storing dielectric information performed by each of the plurality of nodes; (2) retrieving genomic information performed by at least one of the plurality of nodes; And (3) an authentication step, wherein (1) storing the genome information comprises: (1a) storing the genome information; (1b) storing location information of the plurality of nodes; (1c) when the genome information is stored, generating a transaction including the stored genome information and owner information which is location information of a node in which the genome information is stored, and transmitting the generated transaction to other nodes; And (1d) receiving a transaction from another node of the plurality of nodes and generating a block hash value and a nonce value to other nodes when generating a block first with respect to the received transaction, and transmitting the block hash value from the other node with the block hash value.
  • the searching of the genome information comprises: (2a) when the search information is inputted, stored in the block chain. Reading a nonce value of each block and generating a hash value using the read nonce value, the input search information, and position information of the plurality of nodes; (2b) determining whether the generated hash value coincides with a block hash value of a block including the nonce value; And (2c) if a block having a block hash value matching the generated hash value exists, determining that the node having the corresponding location information is the owner; and (3) the authenticating step includes (3a) Receiving authentication information from a node corresponding to the owner; And (3b) authenticating the genome by comparing the authentication information with an artificial nucleic acid sequence included in the genomic material of the genomic material storage.
  • the genome information can be accessed in general by locating the owner of the genome information through blockchain search, the genome or the genome information is not monopolized in part but is generally used. It can be shared and contribute to the development of genetic research.
  • the method for preserving and utilizing the genome information according to the present invention allows access to the genome when the authentication information is obtained from the owner of the genome information, thereby preventing the genome from being used by an unauthorized person. .
  • the block hash value of the block chain in the method for preserving and utilizing the genome information according to the present invention, by allowing the block hash value of the block chain to include the genome information and the owner information, other users can easily identify the location of the genome information.
  • the method for preservation and utilization of the genome information according to the present invention since the reliability is ensured in the blockchain generation process, the security (Authentication), non-repudiation and block hash generation through the digital signature in terms of security Integrity through message digest
  • FIG. 1 is a block diagram showing an overall management system of genome information based on a blockchain according to an embodiment of the present invention.
  • FIG. 2 illustrates a capsule in which a dielectric material is preserved according to an embodiment of the present invention.
  • FIG. 3 is a block diagram showing the structure of each node in the genome information management system according to the present invention.
  • FIG. 4 is a flowchart sequentially illustrating a process of connecting a block including genome information and owner information to a block chain performed by each node in the genome information management system according to an exemplary embodiment of the present invention.
  • FIG. 5 is a diagram illustrating a process of generating a transaction by a transaction transmission module of each node in a genome information management system according to an exemplary embodiment of the present invention.
  • FIG. 6 is a conceptual diagram illustrating an encryption and decryption algorithm for an electronic signature in a genomic information management system according to a preferred embodiment of the present invention.
  • FIG. 7 is a conceptual diagram illustrating a process in which a transaction receiving node generates and transmits a block hash value through proof of work in a genome information management system according to a preferred embodiment of the present invention.
  • FIG. 8 is a flowchart illustrating the operation of the genome information retrieval module of each node in the genome information management system according to the preferred embodiment of the present invention.
  • FIG. 9 is a conceptual diagram illustrating a process of identifying an owner after retrieving genome information stored in a blockchain using a genome information retrieval module of each node.
  • the dielectric may be either a living individual or a dead body.
  • the genome is infected with somatic cells, germ cells, tumor cells, microorganisms or other organisms, as well as genomic DNA such as tissue, nuclear DNA extracted from blood, whole genome DNA, partial genomic DNA and fetal DNA circulating in maternal blood.
  • Genomic DNAs such as nuclear DNA, whole genome DNA, partial genomic DNA, fetal DNA, and the like limited to specific cell groups extracted from specific cells such as cells.
  • the technology developed to study genomic DNA, such as cDNA and specially processed mRNA is a material capable of sequencing extracted, and the scope of definition is not limited to the current technology.
  • the genomic information is extracted from the comparison of trait information, pathological information, medical information, genome sequence information, genome experimental data analysis, data mining analysis data information between genomes and traits or diseases, and existing genetic databases.
  • the genomic information includes at least one of the phenotypes of various measured and measured data.
  • Genomic sequence information may include cDNA sequence, mRNA sequence, and / or expression profiles, epigenetic data, protein data, genome data, methylation data, metabolite data, microbial genome data, human sequence data, genotype data from PCR, DNA Genotyping data from microarrays, genotyping data from total genetic agent sequencing, genotyping data from genome sequencing, genotyping data from gene sequencing, karyotyping data, preimplantation genetic testing data, non-embryo or fetal non- Invasive prenatal genetic test data, and the like.
  • the scope of such data is not limited and may be obtained by methods well known in the art.
  • FIG. 1 is a block diagram of a dielectric information management system based on a blockchain according to an embodiment of the present invention.
  • the genome information management system 1 is a system for managing and retrieving genome information stored in a plurality of nodes by using a block chain. ) And a plurality of nodes (2, 3, 4, ..., n).
  • the dielectric storage unit 1000 stores a plurality of dielectric materials. Each genomic material comprises a genome (genomic DNA) and an artificial nucleic acid sequence, for example in the form of a capsule. When the genome storage unit 1000 receives a request for access to a specific genome, the genome storage unit 1000 may perform authentication using an artificial nucleic acid sequence corresponding to the specific genome and provide genomic DNA according to the authentication performance result.
  • the dielectric material stored in the dielectric storage unit 1000 may be a dielectric material of either a living entity or a dead body. When storing the dielectric material of the dead body, the dielectric material storage unit 1000 may function as a dielectric grave.
  • DNA or RNA which is the most basic unit constituting information according to the present invention, is a substance whose nucleic acid structure is linked by phosphodiester bonds, and is the same as that generally defined in the field of genetic engineering. Nucleic acids are linked in a chain form by phosphodiester binding to form DNA and RNA. In the structure of the nucleic acid, a total of five kinds of compounds may be bound to the base-binding portion.
  • DNA may be adenine (A), thymine (T), guanine (G), and It consists of four bases of cytosine (C), and RNA consists of adenine (A), uracil (U), guanine (G), and cytosine (C).
  • DNA and RNA are distinguished according to whether -H or -OH is bonded to carbon number 2 of the ring structure in FIG. 1A.
  • specific amino acids are expressed by three combinations of four bases in the form of DNA or RNA, and proteins are formed by specific combinations of such amino acids.
  • two or more types of bases may exist in three combinations.
  • the nucleic acid sequence is made by a phosphodiether binding method, which is a binding method of bases present in nature.
  • a plurality of methods for matching and setting the sequence combination and the information unit can be given, for example, as described below.
  • a series of information units are sequentially set up according to the number of repetitive linkages up to a certain allowable number of one or more bases (sequence units). This is set as a marker to display.
  • Table 1 shows an embodiment of a method for setting a specific information unit in the artificial combination method of bases and a method of expressing value information using the setting method.
  • the bases used were A, C, T, and G, and a certain allowable frequency was set to 3, and ATG was used as a binding marker.
  • the marker ATG provides directionality in sequencing and can be used as an indicator to indicate if the direction of the nucleotide analysis is correct, for example, indicating that the analysis should be reversed if it contains a sequence of GTA sequences. .
  • Table 1 in expressing the value information of '1480632' which is part of the resident registration number, 'A', 'A' and 'A', '4', '8', etc.
  • the second setup uses a particular base (sequence unit) as the initiation and / or termination marker of the sequence combination, as shown in Tables 2 and 3, and is sequential according to one or two or more repeat linkages or any combination of the remaining bases. This is a method of setting the information unit.
  • Table 2 shows another embodiment of a method of setting a specific information unit in the artificial combination method of bases and a method of expressing value information using the setting method.
  • T is the end marker of the sequence combination
  • a and C are the repeating sequence units of the sequence combination, and a certain allowable number of times is set as 5, respectively. If the information data of the digit "1480632" after the resident registration number is encrypted by the method of Table 2 as follows.
  • the third setting method is to set specific information units to two or three or more sequence combinations of specific bases, and to set value information by specific combinations thereof.
  • Table 4 shows another embodiment of a method of setting an information unit specific to an artificial combination method of bases and a method of expressing information data using the setting method, respectively.
  • the three bases are combined in the order of the first base, the second base and the third base to represent one information unit (alphabet).
  • the units of information are denoted by A through Z in Table 4.
  • a sequence combination 'ATT' is created by a combination of 'A' as the first base, 'T' as the second base, and 'T' as the third base, and the information unit 'K' is included in the sequence combination. Is assigned.
  • the sequence combination of 'CCC' is set as the termination marker.
  • a sequence combination of 'CCC' may be used as the start marker, and in some cases, 'CCC' may be used simultaneously as the start and stop marker. If the information data is “JONG IL LEE”, the encryption is performed as follows.
  • the artificial nucleic acid sequence of the present invention is made by selecting any one of the above-described sequence combinations and corresponding methods of information units. However, the methods described above are only some of the ways in which numerous sequence combinations and information units are mapped.
  • Such artificial nucleic acid sequences can be applied in the reverse of the corresponding manner to perform authentication.
  • the dielectric material storage unit 1000 may perform the authentication by obtaining the value information from the nucleic acid sequence by applying the corresponding method in reverse, and comparing the obtained value information with the authentication information. have. Accordingly, when it is confirmed that the provider of the authentication information is a legitimate owner, the provider of the authentication information can be provided with the authentication information, that is, the genome corresponding to the nucleic acid sequence.
  • the dielectric material storage unit 1000 may store a plurality of capsules 1100 respectively generated for the plurality of objects.
  • the capsule 1100 is composed of a left capsule 1110 and a right capsule 1120, which can be separated and combined with each other, of a material which is not deformed by thermal and mechanical external pressure. In some cases, it may further include an inner skin 1130 of a heat-resistant material or a waterproof material that facilitates storage and protection, so that the contents can be held more safely from external heat. Since the capsule 1100 contains a plurality of human genomic DNA 1200 and an artificial nucleic acid sequence DNA 1300 in a dispersed state in the solution 1400, a part of the genomic DNA 1200 or an artificial nucleic acid sequence DNA Even if 1300 is damaged, authentication can be performed by analyzing the remaining plurality of DNAs.
  • the artificial nucleic acid sequence may be provided inside the capsule 1100 in a state 1310 coupled to the vector.
  • the artificial nucleic acid sequence DNA 1300 is composed of a relatively smaller number of bases than the genomic DNA 1200, it can be analyzed simply in a short time.
  • the plurality of nodes 2, 3, 4,... N provide a dielectric material in the dielectric storage unit 1000, store dielectric information corresponding to the provided dielectric material therein, It provides the ability to retrieve genome information.
  • the individual computer has a plurality of nodes (2, 3, 4,... , n).
  • the individual may provide the dielectric material to the dielectric material storage unit 1000 and request management of the genome information from a company that specializes in managing the genome information. 3, 4, ..., n).
  • the plurality of nodes 2, 3, 4, ..., n may correspond to an individual, an institution or a company that needs a genome such as a medical genome analyzer.
  • FIG. 3 is a block diagram showing the structure of each node in the genome information management system according to the present invention.
  • each node 2, 3, 4,..., N is a block chain 10, a node location information storage module 11, a dielectric information storage module 12, and a transaction transmission module 13. ), A blockchain execution module 14 and a dielectric information retrieval module 15.
  • the block chain 10 is formed by connecting a plurality of blocks in a chain form.
  • each block of the block chain includes a hash value of a current block, a nonce value, a hash value of a previous block, and a time stamp.
  • the hash value and the nonce value are values obtained by using a predetermined hash function for the genome information, the owner's IP address, and the port number. Since the blocks of the blockchain contain not only their own hash value but also the block hash value of the previous block, each block of the block chain is connected to each other like a chain.
  • the node position information storage module 11 stores position information of a plurality of nodes 2, 3, 4,..., N. Such location information may be, for example, an IP address and a port number of each node.
  • the node location information storage module 11 is provided in all nodes.
  • the genome information storage module 12 is a memory area in which genome information is stored, and each node pre-designates a folder for storing genome information to be shared with other nodes.
  • the system according to the present invention makes it possible to provide an information sharing platform in which all nodes can share genome information stored in the genome information storage module 12.
  • Each node 2, 3, 4,... N provides the dielectric material to the dielectric material storage unit 1000 of FIG. 1, and then provides the dielectric information corresponding to the provided dielectric material. 3, 4, ..., n may be stored in the dielectric information storage module 12.
  • each node 2, 3, 4, ..., n searches for whether desired genome information is stored in node 2, 3, 4, ..., n, as described later, and retrieves the retrieved node.
  • the generated dielectric information may be stored in the dielectric information storage module 12.
  • the genomic information or the second genomic information may include at least one of expression traits, treatment history, and genetic analysis information, such as the appearance or history of the individual.
  • the genome information is used as a meaning including the second genome information.
  • the transaction transmission module 13 When the genome information is stored in the preset folder of the genome information storage module 12, the transaction transmission module 13 generates a transaction including the stored genome information, the owner information, and the electronic signature, and generates the transaction with the block chain. Send to other nodes
  • the transaction transmission module 13 when the second genome information is stored in a preset folder of the genome information storage module 12, the transaction transmission module 13 generates a second transaction including the stored second genome information, owner information, and an electronic signature, The created second transaction is sent to other nodes having a blockchain.
  • a transaction is used to mean a second transaction.
  • the node that transmitted the transaction and the second transaction is referred to as a "transaction sending node".
  • the owner information may include the IP address and port number of the node where the genomic information is stored.
  • the genomic information is converted into ASCII code and included in the transaction.
  • the owner's IP address and port number are converted to decimal and may be included in the transaction.
  • the blockchain execution module 14 When the blockchain execution module 14 receives a transaction from other nodes having a blockchain, the blockchain execution module 14 generates a block for the received transaction and connects the blockchain to expand the blockchain.
  • a node that receives a transaction from a transaction sending node is referred to as a "transaction receiving node”. The operation of the blockchain execution module 14 will be described in more detail below.
  • the blockchain execution module 14 executes proof-of-work to generate the block hash value necessary to generate the block.
  • the proof of work is a task of generating a hexadecimal block hash value that satisfies a predetermined number of '0's by calculating a random nonce value with the received transaction using a preset hash function.
  • the SHA 256 hash function is used, and other hash functions may be used. The reason for this proof of work is to make it impossible for any of the nodes in the blockchain to create a block, so that the malicious node can't determine which node to create the current block to attack. Will be prevented.
  • the height of the blockchain of Bitcoin is 417453
  • the number of '0' of the block hash value is 17.Bitcoin adjusts the difficulty of block generation by increasing the number of '0', which is currently the highest CPU or GPU.
  • the difficulty of block generation is set by taking the number of '0's that generate one block in 10 minutes based on a system having performance.
  • the blockchain execution module 14 finds the block hash value and the random nonce value when the proof-of-work is the first successful among the receiving nodes of the transaction, generates a block using the block, and generates the block. It sends the facts, the found block hash value and the random nonce value to all nodes.
  • a node that first succeeds in proof-of-work among the transaction receiving nodes is referred to as a "proof of work success node".
  • the block chain execution module 14 determines the validity of the transaction and the received block hash value and the nonce value by using a validity test algorithm. When the verification is completed, an additional block is generated using the received block hash value and the nonce value, and the additional block generated in the block chain is connected.
  • the genome information retrieval module 15 may retrieve the genome information and the owners stored in each node by using the block chain 10 and the node location information storage module 11.
  • the genome information retrieval module 15 when retrieval information is input, reads the nonce value of each block stored in the blockchain, and reads the nonce value, the input retrieval information, and the IP for each node of the IP list.
  • the block hash value is generated using the address and the port number, and it is determined whether the generated block hash value matches the block hash value of the block including the nonce value. If a block having a block hash value matching the generated block hash exists, it is determined that a node having a corresponding IP address and a port number is owned by the node, and artificially of the dielectric material stored in the dielectric information storage unit 1000 as the node.
  • the genomic information storage unit 1000 recognizes that the person presenting the authentication information has appropriate authority by comparing the authentication information with the artificial nucleic acid sequence, and may provide the genome to the person presenting the authentication information. If a block having a block hash value that matches the generated block hash value does not exist, it is determined that there is no corresponding data.
  • the block chain execution module 14 when the block chain execution module 14 receives one transaction from other nodes having the block chain, the block chain execution module 14 generates one block for the received one transaction to the block chain. It is characterized by connecting.
  • FIG. 4 is a flowchart sequentially illustrating a process of connecting a block including genome information and owner information to a block chain performed by each node in the genome information management system according to an exemplary embodiment of the present invention. Referring to FIG. 4, a process of connecting a block including genome information and owner information to a block chain performed by each node will be described in detail.
  • Each node has a block chain and an IP list, and each node pre-specifies an area for storing genome information to be shared with other nodes in the genome information storage module.
  • each node when each node generates and stores genome information in the predetermined area by a transaction transmission module, each node may execute a transaction including the genome information, an IP address, a port number, and an electronic signature of an owner node for the genome information. Create and transmit the generated transaction to other nodes as a whole (S400).
  • the other nodes will receive a transaction from the transaction transmission node (S410).
  • Transaction receiving nodes execute proof-of-work through the blockchain execution module to generate a block hash value necessary for generating a block for the received transaction (S420).
  • the first node to succeed in proof-of-work among the transaction receiving nodes finds the block hash value and the random nonce value through the blockchain execution module, uses it to generate the block, and generates the block. And the found block hash value and a random nonce value are transmitted to all nodes (S430).
  • the other nodes that receive the block hash value and the nonce value from the proof of work success node determine the validity of the transaction and the received block hash value and the nonce value by using a valid test algorithm (S440).
  • An additional block is generated using the received block hash value and the nonce value, and the additional block is connected to the block chain (S450).
  • FIG. 5 is a diagram illustrating a process of generating a transaction by a transaction transmission module of each node in a genome information management system according to an exemplary embodiment of the present invention.
  • the owner stores genome information in a predetermined area.
  • the genomic information may include a plurality of fields such as height, weight, visual acuity, respiratory treatment history, hypertension treatment history, and may include numbers or letters corresponding to each field.
  • the generated genome information is represented by ASCII code that can represent letters as numbers. It is preferable to convert the genome information into binary number and then convert the IP address into binary number. This process creates a transaction with the extracted genomic information, the owner's IP address and port number, and a digital signature.
  • FIG. 6 is a conceptual diagram illustrating an encryption and decryption algorithm for an electronic signature in a genomic information management system according to a preferred embodiment of the present invention.
  • a transaction sending node which is a data owner, generates a digital signature using a private key and transmits the electronic signature in a transaction when the transaction is transmitted.
  • the digital signature of the received transaction is decrypted using the public key to check whether the owner IP and port that sent the transaction match the IP address and port number included in the transaction.
  • a digital signature is generated by using a private key and a public key.
  • the cryptographic theory used in the digital signature is ECDSA, and the owner's port to be used for IP address and TCP socket communication of a transaction sending node.
  • ECDSA Europay, MasterCard, and Visa
  • the digital signature is attached to the transaction and sent to the other node with the public key generated by ECDSA.
  • the transaction receiving node decrypts using the enclosed public key and verifies that the transaction is valid by checking whether the output result is True or False. Confirmation of the digital signature prevents spoofing, preventing any malicious node from sending a malformed transaction in the block.
  • FIG. 7 is a conceptual diagram illustrating a process in which a transaction receiving node generates and transmits a block hash value through proof of work in a genome information management system according to a preferred embodiment of the present invention.
  • the number of zeros of the actual Bitcoin blockchain block hash is set to 17 required difficulty levels and the difficulty levels are set accordingly.
  • only one transaction is included, not a block including several transactions, that is, one genome information and owner information are input in one block. Only this information is used to make the block hash so that the search information and the owner information can be confirmed through the block hash analysis when the data is retrieved later.
  • To apply the hash algorithm list the IP, port, and genome information received in a transaction, and randomly generate nonce values and generate a block hash using the SHA256 hash algorithm (1).
  • the nonce is continuously changed until it finds a hash value with more than 17 zeros, which is set as the reference value, and it is accepted as a block hash when a valid hash condition is found.
  • the block hash value and the nonce value generated by an arbitrary node are transmitted to all nodes participating in the blockchain (2)
  • the received node analyzes the block hash value and nonce value received by the node and validates it (3). . Since each node has all the transaction information for block generation, it lists the transaction information, IP address, port number, and genome information, and proceeds with the SHA256 hash algorithm using the received nonce value. When the match is found, the node knows that the contents of the transaction have not changed, and can block the block generation of the malicious node. After the block validation is completed, the contents are stored in the form of Json file (4) and then connected to the block chain (5).
  • FIG. 8 is a flowchart illustrating an operation of a genome information retrieval module of each node in a genome information management system according to a preferred embodiment of the present invention
  • FIG. 9 is stored in a blockchain using the genome information retrieval module of each node.
  • a conceptual diagram showing the process of identifying the owner after retrieval of genome information.
  • the genome information management system can implement a platform capable of identifying a list of genome information that can be shared by searching the hash of the blockchain for the genome information and finding the owner's IP address and port information. Also, when the owner information of the genome information is confirmed on the blockchain, the searched node requests the owner node authentication information corresponding to the genome information, and the owner node transmits the authentication information to allow the search node to store the genome material.
  • the department can perform authentication. Accordingly, the dielectric material storage unit may provide the genome corresponding to the authentication information to the search node (the person who performed the authentication).
  • the owner node may transmit authentication information to the retrieved node only when a specific condition is satisfied. For example, a research institute or an analyst corresponding to the searched node may perform the research in the area desired by the owner node, or pay the desired cost from the searched node. Accordingly, the owner of the genome can become a subject without being alienated in the process of distributing the genetic resources.
  • the retrieved node provided with the authentication information from the owner node may analyze the genome from the dielectric material storage to generate genome analysis information (second genome information).
  • Genomic analysis information is a statistical analysis of data obtained by comparing or analyzing genomic information with various database information for biomedical research such as the following, or through various data structures for biomedical research. Examples of the following items are as follows, and a new database is also included.
  • the example item database is as follows.
  • NCBI databases including but not limited to GenBank and Entrez
  • NCBI databases including but not limited to GenBank and Entrez
  • other public or dedicated databases such as the DNA Data Bank of Japan (National Institute of Genetics), European Nucleotides European Nucleotide Archive (European Institute of Bioinformatics), Ensembl, UniProt, Swiss-Prot, Proteomics Identifications Database, European Protein Information Bank, Japan Protein Information Bank, BIND Biomolecular Interaction Network Database, Reactome, mGen, PathogenPortal, SOURCE, MetaBase, BioGraph ), Bioinformatic Harvester, Enzyme Portal, Max Planck Institute, but not limited to Illuminaa, Life Technologies, Complete Genomics, Pacific Biosciences, Affymetrix, including Illuminanas Laboratories and / or BASESPACE Agilent, Sequenom, Arrayit Corporation, Laboratories Corporation of America, Quest Diagnostics, Empire Genomics, Expression Analytics Expression Analysis, GeneDx, Gene by Gene, Natera, Amber Genetics, National Geographic, and
  • the retrieved node stores the second genome information in the same manner as the above-described genome information, generates a block, and connects it to the block chain. Accordingly, not only the genome information but also the second genome information derived therefrom can be disclosed and accessed, which can lead to a breakthrough in genetics and related industries.
  • the genome information management system and the method using the same according to the present invention can solve the problem of consuming a large amount of storage capacity since the genome information and the owner information are stored in the blockchain to request the sharing of necessary data through the blockchain search. .
  • each individual can reduce the effort or cost required to manufacture and manage the realistic grave, and share the dielectric material with a third party. Can be.
  • the dielectric analysis subject can easily retrieve the dielectric information on the required dielectric material and contact the owner of the corresponding dielectric material to obtain the dielectric material.
  • the dielectric material has been monopolized by a specific company or institution, the dielectric material is made publicly accessible, thereby enabling the development of the medical and genetic industries.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Bioethics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

블록들이 연결되어 구성된 블록 체인을 각각 포함하는 복수의 노드들에 유전체 정보들을 분산하여 저장하고, 저장된 유전체 정보들 중 적어도 하나를 검색하고, 복수의 유전체 물질들-각각은 유전체와 인위적 핵산 서열을 포함함-을 저장하는 유전체 물질 저장부로부터 상기 검색된 유전체 정보에 해당하는 유전체 물질을 취득하기 위한 방법으로서, (1) 상기 복수의 노드들 각각에 의해 수행되는 유전체 정보의 저장 단계; (2) 상기 복수의 노드들 중 적어도 하나에 의해 수행되는 유전체 정보의 검색 단계; 및 (3) 인증 단계를 포함한다.

Description

유전체 및 유전체 정보의 보존 및 활용을 위한 방법
본 발명은 정보의 저장, 분산, 제공, 재가공 등 정보를 위한 암호화 기술을 기반으로 한, 유전체와 유전체 정보의 보존 및 활용을 위한 방법에 관한 것으로서, 더욱 구체적으로는 인위적 핵산 서열을 이용한 암호화 기술을 활용하여 각 객체의 유전제의 보관 및 배포시 항구적 인증을 하고, 블록체인과 같은 암호화 기술을 활용하여 유전제 정보의 저장, 분산, 제공, 재가공 등을 보다 안전하고 신뢰적으로 구축하여 유전체를 활용하는 다양한 산업에 DTC(direct tp customer) 방식을 유도하고 유전체 또는 유전체 정보를 효율적으로 공유하는 것에 관한 것이다.
종래, 생체 또는 사체의 유전체를 연구하기 위해서는 유전체를 갖고 있는 개인에게 의뢰하거나 유전체를 다량으로 가지고 있는 기관으로부터 입수하는 등 개별적으로 입수가 이루어지고 있는 실정이다. 그러나 이러한 경우 입수 가능한 유전체의 종류와 양이 제한되고 자금력이나 인지도가 큰 기관이나 사업체만이 유전체의 입수가 가능하다. 이에 따라, 유전체와 유전체 정보에 대해 일반 연구자들의 접근이 제한되어 자원의 낭비 및 유전체의 심도적 연구에 걸림돌이 되고 있다.
또한, 유전체의 기증자가 인지하지 못하거나 수익을 얻지 못하는 채로 유전체를 분석한 데이터가 영리 단체에 판매되어 유전체로 인한 수익의 적절한 분배와 유전체 분석으로부터 파생된 정보의 보안과 보관이 비효율적으로 이루어지고 있다.
유전체 보존에 관해서는 각 객체들로부터 추출한 건조 보관된 DNA, 조직 또는 혈액 형태로 보관하고 있으며 각 객체의 특정 시퀀스(염기서열정보)로 객체를 분류하는 뱅크가 설립되어 있다. 인간의 유전체 보존의 경우는 각 국가 단위로 모든 인구에 해당하는 유전체 서열 분석 결과 뱅크 형태를 추구하고 있을지라도 기술, 비용, 개인 신상정보의 보안으로 이를 위한 유전자 보존 뱅크가 아직 설립되어 있지 않으며 부분적으로 질환 및 형질을 연구하는 유전체 보존 뱅크 등은 산발적으로 구축되어 있다.
고인을 추모하기 위해 시신 또는 이를 태운 재를 안장한 무덤이 이용되고 있지만, 이는 환경이나 비용적인 면에서 부담이 되고 있다. 이를 해결하기 위해 인류가 남겨야 할 궁극적인 것은 시신이나 태운 재의 형태가 아니라 유전체 자원이라는 점에서 유전체 무덤이라는 개념이 필요하다.
이와 관련하여, 각 객체의 유전체를 보존하고 필요한 연구자원으로 배포하기 위해서는 식별을 위해 외부에 식별를 이용하는 방식이 주로 사용되지만, 이러한 식별 표시는 뒤바뀌거나 잘못 표시될 가능성이 있으며, 유전체를 항구적으로 인증하고 유전체에 대한 효과적인 정보를 기입하는데도 제한적이다.
본 발명은 유전체 또는 유전체 정보가 일부에 독점되지 않고 일반에 공유 가능하고, 유전체의 인증이 가능한 유전체 정보의 보존 및 활용을 위한 방법을 제공하고자 한다.
블록들이 연결되어 구성된 블록 체인을 각각 포함하는 복수의 노드들에 유전체 정보들을 분산하여 저장하고, 저장된 유전체 정보들 중 적어도 하나를 검색하고, 복수의 유전체 물질들-각각은 유전체와 인위적 핵산 서열을 포함함-을 저장하는 유전체 물질 저장부로부터 상기 검색된 유전체 정보에 해당하는 유전체 물질을 취득하기 위한 방법으로서, (1) 상기 복수의 노드들 각각에 의해 수행되는 유전체 정보의 저장 단계; (2) 상기 복수의 노드들 중 적어도 하나에 의해 수행되는 유전체 정보의 검색 단계; 및 (3) 인증 단계를 포함하고, 상기 (1) 유전체 정보의 저장 단계는, (1a) 상기 유전체 정보를 저장하는 단계; (1b) 상기 복수의 노드들에 대한 위치정보를 저장하는 단계; (1c) 상기 유전체 정보가 저장되면, 상기 저장된 유전체 정보 및, 당해 유전체 정보가 저장된 노드의 위치정보인 소유주 정보를 포함하는 트랜잭션을 생성하고, 상기 생성된 트랜잭션을 다른 노드들로 전송하는 단계; 및 (1d) 상기 복수의 노드들 중 다른 노드로부터 트랜잭션을 수신하고, 수신된 트랜잭션에 대해 가장 먼저 블록을 생성하면 블록 해쉬값과 논스값을 다른 노드들에게 송신하며, 다른 노드로부터 블록 해쉬값과 논스값을 수신하면 수신된 값들을 이용하여 블록을 생성하여 블록 체인에 연결하는 단계;를 포함하고, 상기 (2) 유전체 정보의 검색 단계는, (2a) 검색정보가 입력되면, 블록 체인에 저장된 각 블록의 논스 값을 판독하고, 상기 판독된 논스값, 상기 입력된 검색정보 및 상기 복수의 노드들에 대한 위치정보를 이용하여 해쉬값을 생성하는 단계; (2b) 상기 생성된 해쉬값이 상기 논스값이 포함된 블록의 블록 해쉬값과 일치하는지를 판단하는 단계; 및 (2c) 상기 생성된 해쉬값과 일치하는 블록 해쉬값을 갖는 블록이 존재하면, 해당 위치 정보를 갖는 노드가 소유주임을 결정하는 단계;를 포함하고, 상기 (3) 인증 단계는, (3a) 상기 소유주에 해당하는 노드로부터 인증 정보를 수신하는 단계; 및 (3b) 상기 인증 정보와, 상기 유전체 물질 저장부의 유전체 물질에 포함된 인위적 핵산 서열을 비교함으로써 유전체에 대한 인증을 수행하는 단계를 포함한다.
본 발명에 따른 유전체 정보의 보존 및 활용을 위한 방법에 의하면, 블록체인 검색을 통한 유전체 정보 소유주의 위치 파악으로 유전체 정보의 일반적인 접근이 가능하기 때문에, 유전체 또는 유전체 정보가 일부에 독점되지 않고 일반에 공유 가능하여 유전 연구의 발전에 기여할 수 있다.
또한, 본 발명에 따른 유전체 정보의 보존 및 활용을 위한 방법은 유전체 정보의 소유주로부터 인증 정보를 획득한 경우 유전체의 접근을 허용하기 때문에, 유전체가 적법한 권한이 없는 자에 의해 사용되는 것을 차단할 수 있다.
또한, 본 발명에 따른 유전체 정보의 보존 및 활용을 위한 방법은, 블록 체인의 블록 해쉬값이 유전체 정보와 소유주 정보를 포함하도록 함으로써 유전체 정보의 위치를 다른 사용자가 쉽게 확인 가능하다.
또한, 본 발명에 따른 유전체 정보의 보존 및 활용을 위한 방법은, 블록체인 생성과정에서 신뢰성이 보장되므로 보안 측면에서 전자 서명을 통해 인증(Authentication), 부인방지(Non-repudiation)와 블록 hash 생성의 message digest를 통해 무결성(Integrity)을 가진다.
도 1은 본 발명의 실시예에 따른 블록 체인을 기반으로 한 유전체 정보의 관리 시스템을 전체적으로 도시한 구성도이다.
도 2는 본 발명의 실시예에 따른 유전체 물질이 보존된 캡슐을 나타내는 도면이다.
도 3은 본 발명에 따른 유전체 정보 관리 시스템에 있어서, 각 노드의 구조를 도시한 블록도이다.
도 4는 본 발명의 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드들에 의해 수행되는 블록 체인에 유전체 정보 및 소유주 정보를 포함하는 블록을 연결시키는 과정을 순차적으로 도시한 흐름도이다.
도 5는 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드의 트랜잭션 전송 모듈이 트랜잭션을 생성하는 과정을 설명하기 위하여 도시한 구성도이다.
도 6은 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 전자 서명에 대한 암호화 및 복호화 알고리즘을 설명하기 위하여 도시한 개념도이다.
도 7은 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 트랜잭션 수신 노드가 proof of work를 통해 블록 해쉬값을 생성하고 전송하는 과정을 도시한 개념도이다.
도 8은 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드의 유전체 정보 검색 모듈의 동작을 도시한 흐름도이다.
도 9는 각 노드들의 유전체 정보 검색 모듈을 이용하여 블록체인에 저장된 유전체 정보의 검색 후 소유주를 확인하는 과정을 도시한 개념도이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 블록 체인을 기반으로 한 유전체 및 유전체 정보의 보존과 활용을 위한 시스템 및 방법에 대하여 구체적으로 설명한다.
본 명세서에서 유전체는 살아있는 개체 또는 사체 어느 쪽의 유전체라도 무방하다. 유전체는 조직, 혈액으로부터 추출된 핵 DNA, 전유전체 DNA, 부분 유전체 DNA, 산모혈에 순환하는 태아의 DNA 등의 게놈 DNA 뿐만 아니라 체세포들, 생식세포들, 종양 세포들, 미생물 또는 다른 유기체들 감염세포들로 등 특정 세포들로부터 추출된 특정 세포군에 한정한 핵 DNA, 전유전체 DNA, 부분 유전체 DNA, 태아의 DNA 등의 게놈 DNA을 포함한다. 뿐만 아니라 cDNA, 특수 처리된 mRNA 등 게놈 DNA를 연구할 수 있도록 개발된 기술로 추출된 염기서열분석이 가능한 물질로서 정의 범주를 현 기술에 한정하지 않는다.
또한, 본 명세서에서 유전체 정보는 형질적 정보, 병리학적 정보, 의료적 정보, 유전체 서열정보, 유전체 실험분석 데이터 정보, 유전체와 형질 또는 질병과의 데이터마이닝 분석 데이터 정보, 기존유전체 데이터베이스와 비교 추출된 데이터 정보, 유전체와 유의미한 표현형을 연구하는데 필요한 임의의 관찰 가능한 표현형 외에도 각종 측정 계측된 자료의 표현형 중 적어도 하나를 포함한다. 유전체 서열 정보는 cDNA 서열, mRNA 서열, 및 또는 발현 프로파일들, 후성 데이터, 단백질 데이터, 전유전체 데이터, 메틸화 데이터, 대사체 데이터, 미생물군유전제 데이터, 사람체 서열데이터, PCR로부터의 유전자형 데이터, DNA 마이크로어레이들로부터의 유전자형 데이터, 총 유전제 시퀑싱으로부터의 유전자형 데이터, 전유전체시쿼싱으로부터의 유전자형 데이터, 유전자 시퀀싱으로부터의 유전자형 데이터, 핵형 데이터, 착상-전 유전자 검사 데이터, 배아 또는 태아의 비-침습성 출생 전 유전자 검사 데이터 등을 포함할 수 있다. 그러한 데이터의 범주는 제한되지 않으며 해당 기술 분야에 잘 알려진 방법들에 의해 획득 될 수 있다.
도 1은 본 발명의 실시예에 따른 블록 체인을 기반으로 한 유전체 정보 관리 시스템을 전체적으로 도시한 구성도이다.
도 1을 참조하면, 본 발명의 실시예에 따른 유전체 정보 관리 시스템(1)은 블록 체인을 활용하여 다수의 노드들에 저장된 유전체 정보를 관리 및 검색할 수 있도록 하는 시스템으로서, 유전체 저장부(1000) 및 복수의 노드(2,3,4, ..., n)를 포함한다.
유전체 저장부(1000)는 복수 개체의 유전체 물질을 보관한다. 각 유전체 물질은 유전체(게놈 DNA)와 인위적 핵산 서열을 포함하며, 예를 들면 캡슐 형태일 수 있다. 유전체 저장부(1000)는 특정 유전체에 대해 접근 요청을 받으면, 특정 유전체에 대응하는 인위적 핵산 서열을 이용하여 인증을 수행하고 인증 수행 결과에 따라 게놈 DNA를 제공할 수 있다. 유전체 저장부(1000)에 저장되는 유전체 물질은 살아있는 개체 또는 사체 어느 쪽의 유전체 물질이라도 무방하다. 사체의 유전체 물질을 저장하는 경우 유전체 물질 저장부(1000)는 유전체 무덤으로서 기능할 수 있다.
이하, 인위적 핵산 서열을 설정하는 방식 및 인증을 수행하는 방식에 대하여 구체적으로 설명한다.
본 발명에 따라 정보를 구성하는 가장 기본단위인 DNA 또는 RNA는 핵산의 기본구조가 포스포디에스테르 결합에 의해 연결된 물질로서, 유전공학 분야에서 일반적으로 정의되는 것과 동일하다. 핵산은 포스포디에스테르 결합방식에 의해 사슬형태로 결합되어 DNA와 RNA를 구성하게 된다. 핵산의 구조에서 염기결합부에는 총 5 종류의 화합물들이 결합될 수 있는데, 어떠한 화합물이 결합되느냐에 따라, DNA는 아데닌(Adenine: A), 티민(Thymine: T), 구아닌(Guanine: G) 및 씨토신(Cytosine: C)의 4 종류의 염기로 구성되어 있고, RNA는 아데닌(A), 우라실(Uracil: U), 구아닌(G) 및 씨토신(C)으로 구성된다. DNA와 RNA는 도 1a에서 환구조의 2 번 탄소에 -H가 결합되는지 또는 -OH가 결합되는지에 따라 구별된다. 생체내에서는 DNA 또는 RNA의 형태에서 4 종류 염기들의 3개의 조합에 의해 특정한 아미노산이 표현되고, 그러한 아미노산의 특정한 조합에 의해 단백질이 형성된다. 참고로, 3 개의 조합에는 1 종류의 염기가 2 이상 존재하는 경우도 있다. 또한, 상기 핵산서열을 자연계에 존재하는 염기들의 결합방식인 포스포디에테르 결합방식에 의해 이루어진다.
상기 서열조합과 정보단위를 매칭시켜 설정하는 복수의 방식은 예를 들면 아래 설명과 같이 3가지를 들 수 있다.
첫 번째 설정방식은 표 1과 같이, 하나 또는 둘 이상의 염기(서열단위)들의 일정한 허용횟수까지 이들의 반복 연결횟수에 따라 순차적으로 일련의 정보단위를 설정하고, 특정한 염기조합을 서열조합의 결합을 표시하는 마커로 설정하는 방식이다.
Figure PCTKR2019008777-appb-I000001
표 1은 염기들의 인위적 조합방식에 특정한 정보단위를 설정하는 방식 및 상기 설정방식을 이용하여 가치정보를 표현하는 방법의 일 실시예를 나타낸다. 표 1에서 보듯이, 사용된 염기들은 A, C, T, G이고, 일정한 허용횟수는 3으로 설정하였으며, 결합표시 마커로는 ATG가 사용되었다. 마커 ATG는 서열분석시 방향성을 제공하는 것으로서, 염기분석의 방향이 올바른지를 알려줄 수 있는 지표로서도 사용될 수 있는데, 예를 들어, 분석내용이 GTA의 서열조합을 포함하고 있으면 역으로 해석해야 함을 나타낸다. 표 1에서 보듯이, 주민등록번호의 일부인 '1480632'의 가치정보를 표현함에 있어서, 각각의 정보단위 '1', '4', '8' 등을 나타내기 위하여 대응하는 서열조합으로서 'A', 'C', 'TT' 등이 사용되었고, 이들의 적합한 결합형태 등을 확인하기 위하여 각 서열조합들의 사이에 결합마커 'ATG'가 사용되었다. 따라서, 서열단위들의 임의적 조합에 각각 일련의 정보단위를 미리 설정하여 놓고, 특정한 정보 데이터 '1480632'를 표현함에 있어서, 이들의 핵산서열을 구성하여 놓으면, 아래와 같이, 손쉽게 상기 가치정보를 확인할 수 있다.
가치정보 : 1 4 8 0 6 3 2
핵산서열 : A ATG C ATG TT ATG G ATG CCC ATG AAA ATG AA
두 번째 설정방식은 표 2 및 표 3에서와 같이, 특정한 염기(서열단위)를 서열조합의 개시 및/또는 종결 마커로서 사용하고 나머지 염기들의 하나 또는 둘 이상의 반복 연결횟수 또는 임의의 조합에 따라 순차적인 정보단위를 설정하는 방식이다.
표 2는 염기들의 인위적 조합방식에 특정한 정보단위를 설정하는 방식 및 상기 설정방식을 이용하여 가치정보를 표현하는 방법의 다른 일 실시태양을 나타낸다.
Figure PCTKR2019008777-appb-I000002
표 2에서 보듯이, T가 서열조합의 종결마커로서, A와 C가 서열조합의 반복 서열단위로서, 일정한 허용횟수는 5로서 각각 설정되어있다. 상기 주민등록번호 뒷자리 “1480632”의 정보데이터를 상기 표 2의 방식으로 암호화하면 아래와 같다.
가치 정보 : 1 4 8 0 6 3 2
핵산서열 : AT AAAAT CCCT CCCCCT CT AAAT AAT
또한, 표 3에서 보듯이, A가 서열조합의 개시마커로서, A, T, C, G의 2 개의 조합이 서열조합으로서 각각 설정되어 있다. 상기 “1480632”의 정보데이터를 상기 표 3의 방식으로 암호화하면 아래와 같다.
Figure PCTKR2019008777-appb-I000003
가치 정보 : 1 4 8 0 6 3 2
핵산서열 : ACC ATC AGT AAA ATG ACG ACT
세 번째 설정방식은 표 4에 도시한 바와 같이, 특정한 염기들의 둘 또는 셋 이상의 서열조합에 각각 특정한 정보단위를 설정하고 이들의 특정한 조합에 의해 가치정보를 설정하는 방식이다.
표 4는 염기들의 인위적 조합방식에 특정한 정보단위를 설정하는 방식 및 상기 설정방식을 이용하여 정보 데이터를 표현하는 방법의 또 다른 일 실시예를 각각 나타낸다. 표 4에서 보듯이, 3 개의 염기들은 제 1 염기, 제 2 염기 및 제 3 염기의 순서로 조합되어 하나의 정보단위(알파벳)를 나타낸다. 정보단위들은 표 4에서 A~Z로 표시되어 있다. 예를 들어, 제 1 염기로서 'A'와 제 2 염기로서 'T'와 제 3 염기로서 'T'의 조합에 의해 서열조합 'ATT'가 만들어지고, 그러한 서열조합에는 정보단위 'K'가 할당되어 있다. 핵산서열이 완벽한 정보를 담고있는지를 확인하기 위하여 종결마커로서 'CCC'의 서열조합이 설정되어있다. 한편, 핵산서열의 완벽성을 나타내기 위하여 'CCC'의 서열조합을 개시마커로 사용할 수도 있고, 경우에 따라서는 'CCC'를 개시 및 종결마커로서 동시에 사용할 수도 있다. 정보 데이터가 “JONG IL LEE”인 경우 이에 대한 암호화는 아래와 같이 수행된다.
Figure PCTKR2019008777-appb-I000004
가치 정보 : J O N G I L L E E
핵산서열 : ATA TTC TTT CAA CAC ATC ATC TAT TAT CCC
본 발명의 인위적 핵산 서열은 앞에서 예시한 서열조합과 정보단위의 대응 방식 중 어느 하나를 선택하여 이루어진다. 그러나 앞에서 설명한 방식들은 수많은 서열조합과 정보단위를 대응시키는 방식 중의 일부에 지나지 않는다.
이러한 인위적 핵산 서열은 상기 대응 방식의 역으로 적용하여 인증을 수행할 수 있다. 예를 들어, 유전체 물질 저장부(1000)는 인증 정보를 수신하면, 상기 대응 방식을 역으로 적용하여 핵산 서열로부터 가치 정보를 획득하고, 획득된 가치 정보와 인증 정보를 비교함으로써 인증을 수행할 수 있다. 이에 따라, 인증 정보의 제공자가 적법한 권리자임이 확인되면, 당해 인증 정보, 즉 핵산 서열에 대응하는 유전체를 인증 정보의 제공자에게 제공할 수 있다.
도 2는 본 발명의 실시예에 따른 유전체 물질이 보존된 캡슐(1100)을 나타내는 도면이다. 유전체 물질 저장부(1000)는 복수의 개체에 대하여 각각 생성된 캡슐(1100)을 복수 저장할 수 있다.
도 2를 참조하면, 캡슐(1100)은 열 및 기계적 외압에 의해 변형되지 않는 소재의, 상호 분리 및 결합될 수 있는 좌캡슐(1110)과 우캡슐(1120)로 구성된다. 경우에 따라서는, 외부의 열로부터 내용물을 더욱 안전하게 보지할 수 있게 하는 내열성 소재 또는 보관 및 보호를 용이하게 하는 방수 소재의 내피(1130)를 추가로 포함할 수도 있다. 캡슐(1100)의 내부에는 특정한 인간의 게놈 DNA(1200)과 인위적 핵산서열 DNA(1300)가 용액(1400)에 분산된 상태로 다수 포함되어 있으므로, 일부의 게놈 DNA(1200) 또는 인위적 핵산서열 DNA(1300)가 손상되어도 나머지 다수의 DNA들을 분석함으로써 인증을 행할 수 있다.
한편, 도 2에서 보듯이, 인위적 핵산서열은 벡터에 결합한 상태(1310)로 캡슐(1100)의 내부에 구비될 수도 있다. 앞서 설명한 바와 같이, 인위적 핵산서열 DNA(1300)은 게놈 DNA(1200)에 비해 상대적으로 훨씬 적은 수의 염기들로 이루어져 있기 때문에, 짧은 시간내에 간단히 분석할 수 있다.
전술한 캡슐 형태는 예시에 불과하며, 수많은 캡슐의 형태와 구성으로 변형 가능함은 통상의 기술자에게 자명할 것이다.
다시 도 1을 참조하면, 복수의 노드(2,3,4, ..., n)는 유전체 저장부(1000)에 유전체 물질을 제공하고, 제공된 유전체 물질에 대응하는 유전체 정보를 내부에 저장하고, 유전체 정보를 검색하는 기능을 제공한다. 개인이 유전체 물질을 유전체 물질 저장부(1000)에 제공하고, 제공한 유전체 물질에 대응하는 유전체 정보를 직접 자신의 컴퓨터에 저장하는 경우 개인의 컴퓨터가 복수의 노드(2,3,4, ..., n)에 대응할 수 있다. 또는, 개인은 유전체 물질을 유전체 물질 저장부(1000)에 제공하고 유전체 정보를 전문적으로 관리하는 회사에 유전체 정보의 관리를 의뢰할 수 있으며, 이 경우 유전체 정보의 관리 회사가 복수의 노드(2,3,4, ..., n)에 대응할 수 있다. 또한, 복수의 노드(2,3,4, ..., n)는 의료 관련 유전체 분석자 등 유전체를 필요로 하는 개인, 기관 또는 회사 등에 대응할 수 있다.
도 3은 본 발명에 따른 유전체 정보 관리 시스템에 있어서, 각 노드의 구조를 도시한 블록도이다.
도 3을 참조하면, 각 노드(2,3,4, ..., n)는 블록 체인(10), 노드 위치정보 저장 모듈(11), 유전체 정보 저장 모듈(12), 트랜잭션 전송 모듈(13), 블록 체인 실행 모듈(14) 및 유전체 정보 검색 모듈(15)을 구비한다.
블록 체인(10)은 다수 개의 블록들이 사슬 형태로 연결되어 이루어진 것이다. 이와 관련하여, 도 3을 참조하면, 블록 체인의 각 블록은 현재 블록의 해쉬(Hash) 값, 논스(Nonce) 값, 이전 블록의 해쉬값, 타임 스탬프(Time Stamp)를 포함한다. 상기 해쉬값과 논스값은 유전체 정보와 소유주의 IP 주소 및 Port 번호에 대하여 사전 설정된 해쉬 함수를 이용하여 구한 값들이다. 블록 체인의 블록들은 자신의 블록 해쉬값 뿐만 아니라 바로 이전의 블록에 대한 블록 해쉬값도 함께 포함하고 있으므로, 블록 체인의 각 블록들은 사슬처럼 서로 연결되어 이어져 나가게 된다.
노드 위치정보 저장 모듈(11)은 복수의 노드(2,3,4, ..., n)의 위치 정보를 저장한 것이다. 이러한 위치 정보는 예를 들면 각 노드의 IP 주소 및 Port 번호일 수 있다. 노드 위치정보 저장 모듈(11)은 모든 노드들에 구비된다.
유전체 정보 저장 모듈(12)은 유전체 정보가 저장되는 메모리 영역으로서, 각 노드들은 다른 노드들과 공유하고자 하는 유전체 정보를 저장하기 위한 폴더를 사전 지정해 둔다. 본 발명에 따른 시스템에 의하여 모든 노드들이 유전체 정보 저장 모듈(12)에 저장된 유전체 정보들을 공유할 수 있는 정보 공유 플랫폼을 제공할 수 있게 된다. 각 노드(2,3,4, ..., n)는 도 1의 유전체 물질 저장부(1000)에 유전체 물질을 제공한 후, 제공한 유전체 물질에 대응하는 유전체 정보를, 각 노드(2,3,4, ..., n) 내의 유전체 정보 저장 모듈(12)에 저장할 수 있다. 또는, 각 노드(2,3,4, ..., n)는, 후술하는 바와 같이 원하는 유전체 정보가 노드(2,3,4, ..., n)에 저장되어 있는지 검색하고, 검색된 노드, 즉 소유주 노드로부터 인증 정보를 수신하고, 수신된 인증 정보를 기초로 유전체 물질 저장부(1000)로부터 유전체 물질을 제공받아 유전체 물질을 분석한 결과에 기초하여 유전체 정보(제2 유전체 정보)를 생성하고, 생성한 유전체 정보(제2 유전체 정보)를 유전체 정보 저장 모듈(12)에 저장할 수도 있다. 유전체 정보 또는 제2 유전체 정보는 개체의 외형이나 병력 등의 표현 형질, 치료 이력 및 유전자 분석 정보 중 적어도 하나가 포함될 수 있다. 이하, 유전체 정보는 제2 유전체 정보를 포함하는 의미로 사용한다.
트랜잭션 전송 모듈(13)은 유전체 정보 저장 모듈(12)의 사전 설정된 폴더에 유전체 정보가 저장되면, 저장된 유전체 정보, 소유주 정보 및 전자 서명을 포함하는 트랜잭션을 생성하고, 생성된 트랜잭션을 블록 체인을 갖는 다른 노드들로 전송한다. 또한, 트랜잭션 전송 모듈(13)은 유전체 정보 저장 모듈(12)의 사전 설정된 폴더에 제2 유전체 정보가 저장되면, 저장된 제2 유전체 정보, 소유주 정보 및 전자 서명을 포함하는 제2 트랜잭션을 생성하고, 생성된 제2 트랜잭션을 블록 체인을 갖는 다른 노드들로 전송한다. 이하, 트랜잭션은 제2 트랜잭션을 포함하는 의미로 사용한다. 본 명세서에서는, 설명의 편의상, 트랜잭션 및 제2 트랜잭션을 전송한 노드를 "트랜잭션 송신 노드"라고 표시한다. 소유주 정보는 유전체 정보가 저장된 노드의 IP 주소 및 Port 번호를 포함할 수 있다.
유전체 정보는 아스키 코드(ASCII Code)의 형태로 변환되어 트랜잭션에 포함되고, 소유주의 IP 주소 및 Port 번호는 십진수의 형태로 변환되어 트랜잭션에 포함될 수 있다.
블록 체인 실행 모듈(14)은 블록 체인을 갖는 다른 노드들로부터 트랜잭션을 수신하면, 수신된 트랜잭션에 대해 블록을 생성하여 블록 체인에 연결시켜 블록 체인을 확장시키게 된다. 본 명세서에서는, 설명의 편의상, 트랜잭션 송신 노드로부터 트랜잭션을 수신한 노드를 "트랜잭션 수신 노드"라고 표시한다. 이하, 블록 체인 실행 모듈(14)의 동작을 보다 구체적으로 설명한다.
블록 체인 실행 모듈(14)은 다른 노드로부터 트랜잭션을 수신하면, 자신이 블록을 생성하기 위하여 필요한 블록 해쉬값을 만들기 위하여 proof-of-work 를 실행한다. proof of work 는 사전 설정된 해쉬 함수를 사용하여 랜덤한 논스값을 상기 수신된 트랜잭션과 연산하여 정해진 '0'의 개수를 충족시키는 16진수의 블록 해쉬값을 만드는 작업이다. 본 발명에 따른 시스템에서는 SHA 256 해쉬 함수를 사용하며, 그 외의 다른 해쉬 함수도 사용가능하다. 이와 같이 proof of work를 하는 이유는, 블록 체인에 참여한 노드들 중 어떠한 노드가 블록을 생성할지 모르게 만들기 위한 것으로서, 악의적 노드가 현재 블록을 생성할 노드를 판단하지 못하게 하여 악의적 노드의 공격(attack)을 방지하게 된다. 예컨대, 비트 코인의 블록 체인의 높이는 417453개이고, 이 블록 해쉬값의 '0'의 개수는 17개인데, 비트 코인은 '0'의 개수를 늘리면서 블록 생성 난이도를 조절하는데, 현재 가장 높은 CPU 또는 GPU 성능을 갖는 시스템을 기준으로 하여 10분에 1개의 블록을 생성하는 '0'의 개수를 취하는 식으로 블록 생성 난이도를 설정하고 있다.
블록 체인 실행 모듈(14)은, 트랜잭션 수신 노드들 중 proof-of-work 를 가장 먼저 성공하면, 블록 해쉬값과 랜덤한 논스(Nonce) 값을 찾아내고, 이를 이용하여 블록을 생성하며, 블록 생성 사실과 상기 찾아낸 블록 해쉬값과 랜덤한 논스값을 전체 노드들에게 전송한다. 본 명세서에서는, 설명의 편의상, 트랜잭션 수신 노드들 중 proof-of-work를 가장 먼저 성공한 노드를 "proof of work 성공 노드"라고 표시한다.
블록 체인 실행 모듈(14)은, proof of work 성공 노드로부터 블록 해쉬값과 논스값을 수신하면, 유효 검정 알고리즘을 이용하여 트랜잭션과 상기 수신한 블록 해쉬값과 논스값에 대하여 유효성을 판단한 후, 유효성 검증이 완료되면 상기 수신한 블록 해쉬값과 논스값을 이용하여 추가의 블록을 생성하고 블록 체인에 생성된 추가의 블록을 연결시킨다.
유전체 정보 검색 모듈(15)은 블록 체인(10)과 노드 위치정보 저장 모듈(11)를 이용하여 각 노드에 저장된 유전체 정보와 소유주를 검색할 수 있도록 한다.
유전체 정보 검색 모듈(15)은, 검색 정보가 입력되면, 블록 체인에 저장된 각 블록의 논스(nonce) 값을 판독하고, 판독된 논스값, 입력된 검색 정보 및 IP 리스트의 각 노드들에 대한 IP 주소와 Port 번호를 이용하여 블록 해쉬값을 생성하고, 생성된 블록 해쉬값이, 논스값이 포함된 블록의 블록 해쉬값과 일치하는지를 판단한다. 만약, 생성된 블록 해쉬와 일치하는 블록 해쉬값을 갖는 블록이 존재하면, 해당 IP 주소와 Port 번호를 갖는 노드가 소유주임을 결정하고, 해당 노드로 유전체 정보 저장부(1000)에 저장된 유전체 물질의 인위적 핵산 서열에 해당하는 인증 정보를 요청한다. 유전체 정보 저장부(1000)는 인증 정보와 인위적 핵산 서열을 비교함으로써, 인증 정보를 제시한 자가 적합한 권한이 있음을 인정하게 되고, 유전체를 인증 정보를 제시한 자에게 제공할 수 있다. 만약, 상기 생성된 블록 해쉬값과 일치하는 블록 해쉬값을 갖는 블록이 존재하지 않으면, 해당 데이터는 없다고 결정하게 된다.
한편, 본 발명에 따른 시스템에 있어서, 블록 체인 실행 모듈(14)은, 블록 체인을 갖는 다른 노드들로부터 하나의 트랜잭션을 수신하면, 수신된 하나의 트랜잭션에 대해 하나의 블록을 생성하여 블록 체인에 연결시키는 것을 특징으로 한다.
이하, 전술한 구성을 갖는 블록 체인을 기반으로 한 유전체 정보 관리 시스템에 있어서, 각 노드에서의 유전체 정보 관리 및 검색 방법을 보다 구체적으로 설명한다.
도 4는 본 발명의 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드들에 의해 수행되는 블록 체인에 유전체 정보 및 소유주 정보를 포함하는 블록을 연결시키는 과정을 순차적으로 도시한 흐름도이다. 도 4를 참조하여, 각 노드들에 의해 수행되는 블록 체인에 유전체 정보 및 소유주 정보를 포함하는 블록을 연결시키는 과정을 구체적으로 설명한다.
각 노드들은 블록 체인 및 IP 리스트를 구비하며, 각 노드들은 유전체 정보 저장 모듈에 다른 노드들과 공유하고자 하는 유전체 정보를 저장하기 위한 영역을 사전 지정해 둔다.
먼저, 각 노드들은, 트랜잭션 전송 모듈에 의해, 상기 사전 설정된 영역에 유전체 정보를 생성하여 저장하면, 상기 유전체 정보, 상기 유전체 정보에 대한 소유주 노드의 IP 주소와 Port 번호, 전자 서명을 포함하는 트랜잭션을 생성하고, 생성된 트랜잭션을 다른 노드들에게 전체적으로 전송한다(S400).
한편, 다른 노드들은 트랜잭션 송신 노드로부터 트랜잭션을 수신하게 된다(S410).
트랜잭션 수신 노드들은, 블록 체인 실행 모듈을 통해, 상기 수신된 트랜잭션에 대하여 자신이 블록을 생성하기 위하여 필요한 블록 해쉬값을 만들기 위하여 proof-of-work 를 실행한다(S420).
트랜잭션 수신 노드들 중 proof-of-work 를 가장 먼저 성공한 노드는, 블록 체인 실행 모듈을 통해, 블록 해쉬값과 랜덤한 논스(Nonce) 값을 찾아내고, 이를 이용하여 블록을 생성하며, 블록 생성 사실과 상기 찾아낸 블록 해쉬값과 랜덤한 논스값을 전체 노드들에게 전송한다(S430).
proof of work 성공 노드로부터 블록 해쉬값과 논스값을 수신한 다른 노드들은 유효 검정 알고리즘을 이용하여 트랜잭션과 상기 수신한 블록 해쉬값과 논스값에 대하여 유효성을 판단한 후(S440), 유효성 검증이 완료되면 상기 수신한 블록 해쉬값과 논스값을 이용하여 추가의 블록을 생성하고 상기 블록 체인에 상기 추가의 블록을 연결시킨다(S450).
도 5는 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드의 트랜잭션 전송 모듈이 트랜잭션을 생성하는 과정을 설명하기 위하여 도시한 구성도이다.
도 5를 참조하면, 소유주는 사전 지정된 영역에 유전체 정보를 저장한다. 이때, 유전체 정보는 키, 체중, 시력, 호흡기 치료 이력, 고혈압 치료 이력 등 복수의 필드를 포함하고, 각 필드에 해당하는 숫자 또는문자를 포함할 수 있다. 생성된 유전체 정보는 문자를 숫자로 표현가능한 아스키(ASCII) 코드를 이용하여 단순 나열을 통한 유전체 정보를 표현하고 IP 주소는 이진수로 변환시킨 후 십진수로 변환시키는 것이 바람직하다. 이러한 과정을 통해 추출된 유전체 정보, 소유주의 IP 주소와 Port 번호와 전자 서명(Signature)과 함께 트랜잭션을 생성하게 된다.
도 6은 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 전자 서명에 대한 암호화 및 복호화 알고리즘을 설명하기 위하여 도시한 개념도이다.
도 6을 참조하면, 본 발명에 따른 시스템에 있어서, 데이터 소유주인 트랜잭션 송신 노드는 트랜잭션을 송신할 때 private key를 이용하여 전자서명을 생성하고 전자서명을 트랜잭션에 포함시켜 송신하며, 트랜잭션 수신 노드는 public key를 이용하여 수신된 트랜잭션의 전자서명을 복호화하여 트랜잭션을 송신한 소유주 IP 및 port와 트랜잭션에 포함된 IP address 및 port number가 일치하는지 확인하게 된다.
본 발명에 따른 시스템은, private key와 public key를 이용하여 전자 서명(signature)를 생성하게 되는데, 전자서명 시 사용한 암호 이론은 ECDSA이며, 트랜잭션 송신 노드의 IP address와 TCP socket 통신에 사용할 소유주의 port number를 나열하여 자신의 private key와 암호화함으로써, 전자서명을 생성하게 된다. 해당 전자서명은 트랜잭션에 첨부되고 ECDSA로 생성한 public key를 동봉하여 다른 노드에 전송한다. 트랜잭션 수신 노드는 동봉된 public key를 이용해 복호화시켜 출력된 결과가 True 혹은 False인지를 확인하여 해당 트랜잭션이 유효함을 검증하게 된다. 전자서명의 확인으로 spoofing을 방지하여 임의의 악의적 노드가 잘못된 트랜잭션을 전송하여 블록에 포함시키는 것을 방지한다.
도 7은 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 트랜잭션 수신 노드가 proof of work를 통해 블록 해쉬값을 생성하고 전송하는 과정을 도시한 개념도이다.
도 7를 참조하면, 실제 비트코인 블록체인 블록 hash의 0의 개수는 17개가 필요한 난이도로 설정되어 있으며 그에 맞게 난이도를 설정한다. 기존의 블록체인과 달리 여러 트랜잭션을 포함한 블록이 아닌 하나의 트랜잭션만 포함하는데, 즉 하나의 블록에 하나의 유전체 정보, 소유주 정보가 입력된다. 이 정보만 이용하여 블록 hash로 만들어 추후에 데이터 검색 시 블록 hash 분석을 통해 검색 정보과 소유주 정보를 확인 가능하게 한다. Hash 알고리즘을 적용하기 위해 트랜잭션으로 수신한 IP, port, 유전체 정보를 나열하고, 랜덤하게 nonce값을 생성해서 SHA256 hash 알고리즘을 사용해 블록 hash를 생성한다(1). 설정한 기준 값인 0이 17개보다 많은 0을 가진 hash값을 찾기까지 nonce를 계속 변화시켜가고, 조건에 타당한 hash를 찾을 시 블록 hash로 받아들인다. 임의의 노드가 생성한 블록 hash값과 nonce값을 블록체인에 참여한 모든 노드들에게 전송하며(2) 수신한 노드는 자신이 받은 블록 hash값과 nonce값을 분석하여 유효성 검증을 진행한다(3). 각 노드들은 블록 생성 위한 트랜잭션 정보를 모두 가지고 있으므로, 트랜잭션 정보인 IP 주소, port 번호, 유전체 정보를 나열하고 수신한 nonce값을 이용해 SHA256 해쉬 알고리즘을 진행하여 출력된 hash 값이 수신한 블록 hash값과 일치했을 때 트랜잭션의 내용이 변하지 않았다는 사실을 노드가 인지하여, 악의적 노드의 블록 생성을 차단할 수 있다. 블록 유효성 검증이 완료된 블록은 해당 내용들이 Json 파일 형태로 저장된 후(4), 블록 체인에 연결된다(5).
도 8은 본 발명의 바람직한 실시예에 따른 유전체 정보 관리 시스템에 있어서, 각 노드의 유전체 정보 검색 모듈의 동작을 도시한 흐름도이며, 도 9는 각 노드들의 유전체 정보 검색 모듈을 이용하여 블록체인에 저장된 유전체 정보의 검색 후 소유주를 확인하는 과정을 도시한 개념도이다.
도 8 및 도 9를 참조하면, 먼저 사용자가 검색 정보(a)를 입력하면(S800), ASCII code로 변환 후 노드 위치정보 저장 모듈(11)에 있는 각 노드들의 IP 주소와 port 번호의 정보와 함께 나열한다(S810). Json 파일 형태로 저장된 블록체인(10)을 읽어 해당 블록의 nonce 값을 판독하고(S820), 상기 판독된 nonce 값과 앞서 나열한 정보들과 함께 SHA256 hash 알고리즘을 적용시켜 해쉬값을 구하며(S830), 이렇게 구한 해쉬값이 Json 파일의 블록 hash값과 일치하는지를 확인한다(S840). Json 블록 하나를 열어 IP 리스트의 모든 노드들의 IP 주소와 port 번호를 이용해 nonce값과 함께 hash값을 찾아내고 일치하는 hash값이 존재하지 않는다면 다음 블록을 열어 같은 방식으로 반복하여 진행한다. 블록의 hash값과 일치하는 hash 값을 찾아내면, 해당 IP 주소와 port 번호를 가진 노드가 검색한 데이터의 소유주임을 확인 가능하다(S850). 만약 검색한 유전체 정보가 블록체인에 존재하지 않을 경우 "not found"를 return한다(S860).
이와 같이, 본 발명에 따른 유전체 정보 관리 시스템은, 유전체 정보를 블록체인의 hash를 검색하여 소유주의 IP address 및 port 정보를 찾아냄으로서 공유 가능한 유전체 정보의 리스트를 확인 가능한 플랫폼을 구현할 수 있다. 또한, 블록체인 상에서 유전체 정보의 소유주 정보를 확인했을 시, 검색한 노드는 소유주 노드에 해당 유전체 정보에 해당하는 인증 정보를 요청하게 되고, 소유주 노드는 인증 정보를 전송하여 검색 노드로 하여금 유전체 물질 저장부에서 인증을 수행하도록 할 수 있다. 이에 따라, 유전체 물질 저장부는 인증 정보에 해당하는 유전체를 검색 노드(인증을 수행한 자)에게 제공할 수 있다.
여기서, 소유주 노드는 특정 조건을 만족한 경우에만 검색한 노드에 인증 정보를 전송할 수 있다. 예를 들어, 검색한 노드에 해당하는 연구 기관이나 분석자가 소유주 노드가 희망하는 분야의 연구를 수행한다든지, 또는 검색한 노드에서 원하는 비용을 지불한다든지 등의 조건이 있을 수 있다. 이에 따라, 유전체의 소유주가 유전 자원의 분배 과정에서 소외되지 않고 주체가 될 수 있다.
이후, 소유주 노드로부터 인증 정보를 제공받은 검색한 노드는, 유전체 물질 저장부로부터 유전체를 분석하여 유전체 분석 정보(제2 유전체 정보)를 생성할 수 있다.
유전체 분석 정보는 유전체 정보를 다음과 같은 생물의학적 연구를 위해 구축된 각종 데이터베이스 정보와 비교분석하거나 수치적 혹은 텍스트 데이터마이닝을 통해 획득한 통계적으로 유의미한 자료의 정보로서 생물의학적 연구를 위해 구축된 각종 데이터베이스의 예시항목은 다음과 같으며 신규를 구축되는 데이터베이스도 포함된다. 예시항목 데이터베이스는 다음과 같다.
NCBI 데이터베이스들(이에 한정되는 것은 아니지만 젠뱅크(GenBank) 및 엉트헤(Entrez)) 또는 다른 공용 또는 전용 데이터베이스들, 이를테면 일본의 DNA 정보 은행(DNA Data Bank of Japan)(국립 유전학 연구소), 유럽 뉴클레오티드 아카이브(European Nucleotide Archive)(유럽 생물정보학 연구소), 인셈블(Ensembl),유니프롯(UniProt), 스위스-프롯(Swiss-Prot), 단백체 식별 데이터베이스(Proteomics IdentificationsDatabase), 유럽의 단백질 정보 은행, 일본의 단백질 정보 은행, BIND 생체분자 상호작용 네트워크 데이터베이스(Biomolecular Interaction Network Database), 리앰톰(Reactome), 엠젠(mGen), 패서전포탈(PathogenPortal), 소스(SOURCE), 메타베이스(MetaBase), 바이오그래프(BioGraph), 생물정보 하베스터(Bioinformatic Harvester), 엔자임 포탈(Enzyme Portal), 막스 플랑크 연구소(Max Planck Institute), 이에 한정되는 것은 아니지만 일루미나스 래버러토리스 및/또는 베이스스페이스(BASESPACE)를 포함하는 일루미나(Illumina), 라이프 테크놀로지스(Life Technologies), 컴플리트 지노믹스(Complete Genomics), 퍼시픽 바이오사이언시스(Pacific Biosciences), 아피매트릭스(Affymetrix), 애질런트(Agilent), 시쿼놈(Sequenom), 어레잇코포레이션(Arrayit Corporation), 래버러토리 코포레이션 오브 어메리카(Laboratory Corporation ofAmerica), 퀘스트 다이어그노스틱스(Quest Diagnostics), 엠파이어 지노믹스(Empire Genomics), 익스프레션 애널리시스(Expression Analysis), 진디엑스(GeneDx), 진 바이 진(Gene by Gene), 나테라(Natera), 앰브리 제네틱스(Ambry Genetics), 내셔널 지오그래픽(National Geographic), 의료 연구를 위한 코리엘 연구소(CoriellInstitute for Medical Research), 카이저 퍼머넌트(Kaiser Permanente), 정부 데이터베이스들, 연구원의 데이터베이스들, 대학의 데이터베이스들, 연구소의 데이터베이스들, 연구소의 유전자 검사 장비, 이에 한정되는 것은 아니지만 시퀀서들 및/또는 랩-온-칩을 포함하여 유전자 검사를 수행하는 디바이스, 의료 기관의 데이터베이스들, 보건-관련 데이터베이스들, 건강 보험 회사의 데이터베이스, 데이터베이스들, 공기업의 데이터베이스들,바이오피지컬 코포레이션(BioPhysical Corporation), 스펙트라셀 래버러토리스(Spectracell Laboratories), 헬스 다이어그노스틱 래버러토리 인크(Health Diagnostic Laboratory Inc.), 놈(Knome), 카운실(Counsyl), 앤시스트리닷컴(Ancestry.com), 패밀리 트리 DNA(Family Tree DNA), 매치닷컴(Match.com), 이하모니(eHarmony), 오케이큐피드(okCupid), 드럭스닷컴(Drugs.com), HGMD(Human Gene Mutation Database), OMIM(Online MendelianInheritance in Man), 에스엔피디아(SNPedia), 위키피디아(Wikipedia), 페이스북(Facebook), 마이스페이스(Myspace), 링크드인(LinkedIn), 구글(Google)(이에 한정되는 것은 아니지만 인터넷 검색 이력, 클릭 이력, 및구글 플러스(Google Plus) 데이터베이스들을 포함하는), 아마존(Amazon), 애플(Apple), 야후(Yahoo!), 인스타그램(Instagram), 핀터레스트(Pinterest), 트위터(Twitter), 유럽 분자 생물 실험실(European MolecularBiology Laboratory), 아시아 태평양 생명정보학 네트워크(Asia Pacific BioInformatics Network), 베이징 유전학 연구소(Beijing Genomics Institute), 헬스케어닷거브(Healthcare.gov), 미국 인류봉사 보건복지부(United States Department of Health and Human Services), 의료 보장 센터(The Centers for Medicare andMedicaid Services), 미국 재향 군인청(United States Veterans Affairs), 캘리코(Calico), DNA 넥서스(DNANexus), 패스웨이 지노믹스(Pathway Genomics), 아이-진(i-gene), 개인의 개인용 컴퓨터, 개인의 전화, 개인의태블릿 디바이스, 개인의 전자 디바이스, 지노테크(Genotek), 바이오-로지스(bio-logis), 제네렉스(Genelex),루미제닉스(Lumigenix), 스파이럴 제네틱스(Spiral Genetics), 의료인의 데이터베이스, 전자 의료 기록들, 전자건강 기록들(electronic health records), 엑스코드 라이프 사이언시스(Xcode Life Sciences), 리켄 제네시스(Riken Genesis), 페르소나리스(Personalis), 맵마이게놈(MapMyGenome), 및/또는 23앤미(23andMe)에 의해 소유되거나 제어될 수 있는 것들로부터의 유전체 정보분석 데이터베이스에 의해 획득될 수 있다.
상기 검색한 노드는 제2 유전체 정보를 전술한 유전체 정보와 동일한 방법으로 저장하고 블록을 생성하여 블록체인에 연결한다. 이에 따라, 유전체 정보뿐만 아니라 그로부터 파생된 제2 유전체 정보도 공개 및 접근이 가능하여 유전학 및 관련 업계의 획기적인 발전을 꾀할 수 있다.
본 발명에 따른 유전체 정보 관리 시스템 및 이를 이용한 방법은 블록체인을 통한 유전체 정보와 소유주의 정보를 저장하여 블록체인 검색을 통해 필요한 데이터를 공유 요청하는 형식이기 때문에 많은 저장 용량 소모의 문제를 해결할 수 있다.
이에 따라, 각 개인은 유전체 무덤, 즉 유전체 물질 저장부(1000)에 유전체 물질을 저장함으로써 현실적인 무덤을 제작 및 관리하는데 필요한 노력이나 비용을 절감할 수 있고, 유전체 물질을 제3자에 공유되도록 할 수 있다.
또한, 유전체 분석 주체는 필요한 유전체 물질에 관한 유전체 정보를 손쉽게 검색하고, 그에 해당하는 유전체 물질의 소유자에 컨택하여 유전체 물질을 얻을 수 있다. 이에 따라, 종래 유전체 물질이 특정 업체나 기관에 독점되던 것에 반해, 유전체 물질이 공개적으로 접근이 가능해지기 때문에 의료 및 유전 업계의 발전을 꾀할 수 있다.
이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (10)

  1. 블록들이 연결되어 구성된 블록 체인을 각각 포함하는 복수의 노드들에 유전체 정보들을 분산하여 저장하고, 저장된 유전체 정보들 중 적어도 하나를 검색하고, 복수의 유전체 물질들-각각은 유전체와 인위적 핵산 서열을 포함함-을 저장하는 유전체 물질 저장부로부터 상기 검색된 유전체 정보에 해당하는 유전체 물질을 취득하기 위한 방법으로서,
    (1) 상기 복수의 노드들 각각에 의해 수행되는 유전체 정보의 저장 단계;
    (2) 상기 복수의 노드들 중 적어도 하나인 검색 노드에 의해 수행되는 유전체 정보의 검색 단계; 및
    (3) 인증 단계
    를 포함하고,
    상기 (1) 유전체 정보의 저장 단계는,
    (1a) 상기 유전체 정보를 저장하는 단계;
    (1b) 상기 복수의 노드들에 대한 위치정보를 저장하는 단계;
    (1c) 상기 유전체 정보가 저장되면, 상기 저장된 유전체 정보 및, 당해 유전체 정보가 저장된 노드의 위치정보인 소유주 정보를 포함하는 트랜잭션을 생성하고, 상기 생성된 트랜잭션을 다른 노드들로 전송하는 단계; 및
    (1d) 상기 복수의 노드들 중 다른 노드로부터 트랜잭션을 수신하고, 수신된 트랜잭션에 대해 가장 먼저 블록을 생성하면 블록 해쉬값과 논스값을 다른 노드들에게 송신하며, 다른 노드로부터 블록 해쉬값과 논스값을 수신하면 수신된 값들을 이용하여 블록을 생성하여 블록 체인에 연결하는 단계;
    를 포함하고,
    상기 (2) 유전체 정보의 검색 단계는,
    (2a) 검색정보가 입력되면, 블록 체인에 저장된 각 블록의 논스 값을 판독하고, 상기 판독된 논스값, 상기 입력된 검색정보 및 상기 복수의 노드들에 대한 위치정보를 이용하여 해쉬값을 생성하는 단계;
    (2b) 상기 생성된 해쉬값이 상기 논스값이 포함된 블록의 블록 해쉬값과 일치하는지를 판단하는 단계; 및
    (2c) 상기 생성된 해쉬값과 일치하는 블록 해쉬값을 갖는 블록이 존재하면, 해당 위치 정보를 갖는 노드가 소유주임을 결정하는 단계;
    를 포함하고,
    상기 (3) 인증 단계는,
    (3a) 상기 소유주에 해당하는 노드로부터 인증 정보를 수신하는 단계; 및
    (3b) 상기 인증 정보와, 상기 유전체 물질 저장부의 유전체 물질에 포함된 인위적 핵산 서열을 비교함으로써 유전체에 대한 인증을 수행하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서,
    상기 (3b) 인증을 수행하는 단계는,
    (3b-1) 숫자 또는 문자의 정보단위를 DNA 또는 RNA의 염기들의 인위적인 조합에 대응시키는 단계;
    (3b-2) 상기 대응 관계에 따라, 상기 정보단위의 순차적 결합에 의해 표현될 수 있는 가치정보를 상기 DNA 또는 RNA 염기들의 순차적 결합 형태인 상기 인위적 핵산 서열로 표현하는 단계; 및
    (3b-3) 상기 인증 정보가 입력되면, 상기 인위적 핵산 서열을 상기 대응 관계에 따라 가치정보로 해석하고, 해석된 가치정보과 상기 입력된 인증 정보를 비교하는 단계
    를 포함하는 방법.
  3. 제2항에 있어서,
    상기 가치정보는 이름, 주민등록번호 또는 인증 고유번호인 방법.
  4. 제1항에 있어서,
    상기 복수의 유전체 물질들 각각은, 상이한 개체의 유전체와, 벡터에 연결된 상기 인위적 핵산 서열을 포함하는 캡슐인 방법.
  5. 제1항에 있어서,
    상기 블록 체인의 각 블록은 다수의 노드들에 저장된 유전체 정보에 대하여 각각 생성된 것으로서, 각 블록의 블록 해쉬값은 유전체 정보, 유전체 정보의 소유주 정보와 논스값에 대하여 사전 설정된 해쉬 알고리즘을 적용하여 생성한 해쉬값인 방법.
  6. 제1항에 있어서,
    상기 소유주 정보는, 상기 유전체 정보가 저장된 노드의 IP 주소와 포트 번호를 포함하는 방법.
  7. 제1항에 있어서,
    상기 트랜잭션은 전자 서명을 추가로 포함하는 방법.
  8. 제1항에 있어서,
    상기 유전체 정보는 개체의 표현 형질 및 치료 이력 중 적어도 하나인 방법.
  9. 제1항에 있어서,
    상기 (3a) 단계는,
    (3a-1) 상기 소유주에 해당하는 노드는 상기 검색 노드가 소정의 조건을 충족하는 경우 상기 검색 노드에 상기 인증 정보를 전송하는 단계; 및
    (3a-2) 상기 검색 노드는 상기 인증 정보를 수신하는 단계
    를 포함하는 방법.
  10. 제1항에 있어서,
    (4a) 상기 (3) 인증 단계 후에, 상기 (3) 인증 단계의 인위적 핵산 서열에 대응하는 유전체를 기초로 제2 유전체 정보를 생성하여 저장하는 단계;
    (4b) 상기 제2 유전체 정보가 저장되면, 상기 저장된 제2 유전체 정보 및, 당해 제2 유전체 정보가 저장된 노드의 위치정보인 제2 소유주 정보를 포함하는 제2 트랜잭션을 생성하고, 상기 생성된 제2 트랜잭션을 다른 노드들로 전송하는 단계; 및
    (4c) 상기 복수의 노드들 중 다른 노드로부터 제2 트랜잭션을 수신하고, 수신된 제2 트랜잭션에 대해 가장 먼저 블록을 생성하면 블록 해쉬값과 논스값을 다른 노드들에게 송신하며, 다른 노드로부터 블록 해쉬값과 논스값을 수신하면 수신된 값들을 이용하여 블록을 생성하여 블록 체인에 연결하는 단계;
    를 포함하는 (4) 유전체 정보의 업데이트 단계
    를 더 포함하는 방법.
PCT/KR2019/008777 2018-07-17 2019-07-16 유전체 및 유전체 정보의 보존 및 활용을 위한 방법 WO2020017869A1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US17/260,513 US11954601B2 (en) 2018-07-17 2019-07-16 Method for storing and utilizing genome and genomic information
EP19837847.3A EP3826021B1 (en) 2018-07-17 2019-07-16 Method for preserving and using genome and genomic data
JP2021503060A JP7037700B2 (ja) 2018-07-17 2019-07-16 ゲノムおよびゲノム情報の保存および活用のための方法
CN201980060499.6A CN112840403A (zh) 2018-07-17 2019-07-16 用于保存和使用基因组及基因组数据的方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2018-0083035 2018-07-17
KR1020180083035A KR102209178B1 (ko) 2018-07-17 2018-07-17 유전체 및 유전체 정보의 보존 및 활용을 위한 방법

Publications (1)

Publication Number Publication Date
WO2020017869A1 true WO2020017869A1 (ko) 2020-01-23

Family

ID=69164544

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/008777 WO2020017869A1 (ko) 2018-07-17 2019-07-16 유전체 및 유전체 정보의 보존 및 활용을 위한 방법

Country Status (6)

Country Link
US (1) US11954601B2 (ko)
EP (1) EP3826021B1 (ko)
JP (1) JP7037700B2 (ko)
KR (1) KR102209178B1 (ko)
CN (1) CN112840403A (ko)
WO (1) WO2020017869A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200073560A1 (en) * 2018-09-04 2020-03-05 Genetic Intelligence, Inc. Methods for decentralized genome storage, distribution, marketing and analysis
GB2585816A (en) * 2018-12-12 2021-01-27 Univ York Proof-of-work for blockchain applications
GB2584154A (en) 2019-05-24 2020-11-25 Nchain Holdings Ltd Knowledge proof
GB201907397D0 (en) * 2019-05-24 2019-07-10 Nchain Holdings Ltd Knowledge proof
WO2021013813A1 (en) * 2019-07-24 2021-01-28 Koninklijke Philips N.V. Summarizing a genomic data entry
KR102293404B1 (ko) * 2020-12-07 2021-08-26 주식회사 마이지놈박스 블록체인 기술을 이용한 dna 데이터의 인증과 무결성 확보를 위한 장치 및 이를 위한 방법
KR20220081256A (ko) * 2020-12-07 2022-06-15 주식회사 마이지놈박스 블록체인 기술을 이용한 dna 데이터의 인증과 무결성 확보를 위한 장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030030690A (ko) * 2001-10-12 2003-04-18 삼성전자주식회사 유전자 정보 관리 및 제공 방법과 그 시스템
KR20040051748A (ko) * 2002-12-11 2004-06-19 바이오인포메틱스 주식회사 유전체 서열 분석 및 데이터 관리 시스템 및 그 방법
KR20130114294A (ko) * 2012-04-09 2013-10-18 삼성에스디에스 주식회사 유전 정보 관리 장치 및 방법
KR101868589B1 (ko) * 2018-03-30 2018-06-18 옥타코 주식회사 접근통제형 장비를 위한 생체인증 로그데이터의 블록체인 공유 기반의 액세스 보안관리 시스템
KR20180067183A (ko) * 2016-12-12 2018-06-20 주식회사 케이티 사용자 생체정보와 관련된 고유번호를 생성하고 폐기하는 시스템 및 방법

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5604097A (en) * 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
KR100764239B1 (ko) * 2003-03-26 2007-10-05 이윤경 인위적 핵산서열을 이용한 개체의 인증방법 및 이에 사용되는 소형캡슐
WO2007137225A2 (en) * 2006-05-19 2007-11-29 The University Of Chicago Method for indexing nucleic acid sequences for computer based searching
US20140089009A1 (en) * 2012-09-27 2014-03-27 Wobblebase, Inc. Method for Personal Genome Data Management
WO2014134615A1 (en) * 2013-03-01 2014-09-04 Actx, Inc. Cloud-like medical-information service
US10114851B2 (en) * 2014-01-24 2018-10-30 Sachet Ashok Shukla Systems and methods for verifiable, private, and secure omic analysis
AU2015311866B2 (en) * 2014-09-03 2018-06-07 Nant Holdings Ip, Llc Synthetic genomic variant-based secure transaction devices, systems and methods
US10785033B2 (en) * 2015-09-04 2020-09-22 Nec Corporation Method for storing an object on a plurality of storage nodes
AU2016355193A1 (en) * 2015-11-18 2018-05-24 Global Specimen Solutions, Inc. Distributed systems for secure storage and retrieval of encrypted biological specimen data
WO2018000077A1 (en) * 2016-06-27 2018-01-04 Novus Paradigm Technologies Corporation System for rapid tracking of genetic and biomedical information using a distributed cryptographic hash ledger
KR101781583B1 (ko) * 2016-08-31 2017-09-27 서강대학교산학협력단 블록체인을 기반으로 한 파일 관리/검색 시스템 및 파일 관리/검색 방법
GB2572088A (en) * 2016-12-14 2019-09-18 Walmart Apollo Llc Controlling access to a locked space using cryptographic keys stored on a blockchain
CN106682530A (zh) * 2017-01-10 2017-05-17 杭州电子科技大学 一种基于区块链技术的医疗信息共享隐私保护方法及装置
JP3230238U (ja) * 2018-04-10 2021-01-14 ブラック ゴールド コイン インコーポレイテッドBlack Gold Coin, Inc. 電子データを安全に格納するシステム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030030690A (ko) * 2001-10-12 2003-04-18 삼성전자주식회사 유전자 정보 관리 및 제공 방법과 그 시스템
KR20040051748A (ko) * 2002-12-11 2004-06-19 바이오인포메틱스 주식회사 유전체 서열 분석 및 데이터 관리 시스템 및 그 방법
KR20130114294A (ko) * 2012-04-09 2013-10-18 삼성에스디에스 주식회사 유전 정보 관리 장치 및 방법
KR20180067183A (ko) * 2016-12-12 2018-06-20 주식회사 케이티 사용자 생체정보와 관련된 고유번호를 생성하고 폐기하는 시스템 및 방법
KR101868589B1 (ko) * 2018-03-30 2018-06-18 옥타코 주식회사 접근통제형 장비를 위한 생체인증 로그데이터의 블록체인 공유 기반의 액세스 보안관리 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3826021A4 *

Also Published As

Publication number Publication date
JP2021530930A (ja) 2021-11-11
EP3826021B1 (en) 2022-08-03
CN112840403A (zh) 2021-05-25
EP3826021A1 (en) 2021-05-26
KR102209178B1 (ko) 2021-01-29
US20210271982A1 (en) 2021-09-02
EP3826021A4 (en) 2021-09-29
JP7037700B2 (ja) 2022-03-16
KR20200008854A (ko) 2020-01-29
US11954601B2 (en) 2024-04-09

Similar Documents

Publication Publication Date Title
WO2020017869A1 (ko) 유전체 및 유전체 정보의 보존 및 활용을 위한 방법
US11702708B2 (en) Systems and methods for analyzing viral nucleic acids
EP3525212B1 (en) Bio-information data providing method based on multiple blockchains
US9449191B2 (en) Device, system and method for securing and comparing genomic data
US9935765B2 (en) Device, system and method for securing and comparing genomic data
US20200303040A1 (en) Method of providing biological data, method of encrypting biological data, and method of processing biological data
Cogo et al. A high-throughput method to detect privacy-sensitive human genomic data
Fernandes et al. DNA-SeAl: sensitivity levels to optimize the performance of privacy-preserving DNA alignment
WO2023085490A1 (ko) 블록체인의 nft를 이용한 바이오 데이터 중개 시스템 및 그 방법
Cassa et al. A novel, privacy-preserving cryptographic approach for sharing sequencing data
WO2022065579A1 (ko) 블록체인을 기반으로 하는 유전자 정보 거래 시스템 및 그 방법
EP4143722A1 (en) Anonymous digital identity derived from individual genome information
Oprisanu et al. How Much Does GenoGuard Really" Guard"? An Empirical Analysis of Long-Term Security for Genomic Data
Zhao et al. A secure alignment algorithm for mapping short reads to human genome
Mathur et al. A review on blockchain for DNA sequence: security issues, application in DNA classification, challenges and future trends
WO2020259847A1 (en) A computer implemented method for privacy preserving storage of raw genome data
Sanghvi et al. Investigating Privacy Preserving Technique for Genome Data
Mozumder et al. Towards privacy-preserving authenticated disease risk queries
US20220293221A1 (en) Data structure for genomic information
WO2014121128A1 (en) Methods, systems, and computer readable media for exchanging genomic and/or patient information
US20230021229A1 (en) Method and data processing device for processing genetic data
Qu Security of human genomic data
Kiefer et al. Mining genotype-phenotype associations from public knowledge sources via semantic web querying
Malin et al. Compromising privacy in distributed population-based databases with trail matching: A dna example
Zhao Privacy-preserving sharing and analysis on human genomic data

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19837847

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2021503060

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2019837847

Country of ref document: EP

Effective date: 20210217