WO2021112319A1 - 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방법 - Google Patents

게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방법 Download PDF

Info

Publication number
WO2021112319A1
WO2021112319A1 PCT/KR2019/017532 KR2019017532W WO2021112319A1 WO 2021112319 A1 WO2021112319 A1 WO 2021112319A1 KR 2019017532 W KR2019017532 W KR 2019017532W WO 2021112319 A1 WO2021112319 A1 WO 2021112319A1
Authority
WO
WIPO (PCT)
Prior art keywords
genetic
chromosome
surname
information
male
Prior art date
Application number
PCT/KR2019/017532
Other languages
English (en)
French (fr)
Inventor
박종화
조윤성
김병철
Original Assignee
주식회사 클리노믹스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 클리노믹스 filed Critical 주식회사 클리노믹스
Publication of WO2021112319A1 publication Critical patent/WO2021112319A1/ko
Priority to US17/746,753 priority Critical patent/US20220277806A1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Definitions

  • An embodiment of the present invention relates to a system and room for providing genetic surname information using genomic information.
  • An embodiment of the present invention defines the Y-chromosome group to which the male himself belongs and the subgroup below it, and precisely calculates the degree of genetic mutation that occurred in the Y-chromosome, sibling, ancestor, cousin, fifth cousin, eighth cousin It infers the closest genetic surname to oneself, etc., and utilizes the mutation information of autosomal, X-chromosome and mitochondrial DNA that exists in both men and women, and the autosomal and X-chromosome possessed by the Y-chromosome-based gene surname group. and mitochondrial DNA information and female autosomal, X-chromosome and mitochondrial DNA information to provide a genetic surname information providing system and method using genomic information to provide a female genetic surname.
  • the genetic surname information providing system using genomic information identifies the genetic variation of the Y-chromosome for men in each region or country in the modern and past, and based on the identified genetic variation, the modern And group Y-chromosomes for each male by past, but if the specific surnames of males grouped according to genetic variation are above a certain ratio, the Y-chromosome group is defined as a Y-chromosome group and stored in the Y-chromosome group database.
  • the genetic distance is calculated by mapping the genetic marker that determines the Y-chromosome of the male sponsor with the genetic marker of the Y-chromosome in each Y-chromosome group stored in the Y-chromosome group database, and the Y-chromosome of the male sponsor a male genetic surname determining unit that determines the surname of the Y-chromosome group having the closest genetic distance to the male client's genetic surname; and male genetics providing genetic surname information including at least one of social information, historical information, emotional information and physical information of modern or past men having a genetic surname determined through the male genetic surname determining unit to a male client. Includes an enemy surname information provider.
  • the Y-chromosome grouping unit analyzes the genetic information of the Y-chromosome for men in each region or country in the modern and past, and compares the sequence of the Y-chromosome in which the genetic information is analyzed, and the Y-chromosome from the comparison result -Y-chromosome genetic mutation detection unit for detecting genetic mutation of the chromosome; a Y-chromosome marker designator for designating a marker determining a Y-chromosome according to a distance on a map of the Y-chromosome by comparing the genetic variation detected through the Y-chromosome genetic variation detection unit; And group the Y-chromosome for each male by modern and past, but if the specific surname of men grouped according to the genetic variation of the Y-chromosome is 1/3 or more of the total surname, the group is defined as a Y-chromosome group It may include a Y-chromosome clustering unit that is stored in the Y-chromosome group database.
  • the male genetic surname determining unit by mapping the genetic marker determining the Y-chromosome of the male client with the genetic marker of the Y-chromosome in each Y-chromosome group stored in the Y-chromosome group database, the genetic distance a genetic surname similarity calculator that calculates and scores the similarity between the male sponsor and the surname belonging to each Y-chromosome group according to the calculation result; and a genetic surname predictor for predicting the surname of the Y-chromosome group having the highest similarity score with the Y-chromosome of the male client as the genetic surname of the male client through the genetic surname similarity calculator.
  • the male genetic surname information providing unit social information about a person known to the public among men belonging to the genetic surname determined through the male genetic surname determination unit, the surname found in the Y-chromosome group of the genetic surname Historical information including information on the past migration and settlement routes of men belonging to the genus, emotional information including the personality of men belonging to the genetic surname, and physical information including physical characteristics, blood types, and diseases of men belonging to the genetic surname information can be provided.
  • the genetic variation of the autosomal, X-chromosome and mitochondrial DNA of men belonging to the Y-chromosome group is identified, and the pattern of the identified genetic variation distribution is the same or most similar between autosomal, X-chromosome and mitochondrial DNAs.
  • an X-chromosome grouping unit for combining and storing the combined autosomal, X-chromosome and mitochondrial DNAs as an X-chromosome group and storing the combined autosomal, X-chromosome and mitochondrial DNAs in the X-chromosome group database;
  • the genetic marker determining the X-chromosome of the female sponsor is mapped to the genetic marker of the X-chromosome in each X-chromosome group stored in the X-chromosome group database to calculate the genetic distance, and the sponsor's X-chromosome and a female genetic surname determining unit for determining the surname of the X-chromosomal group having the closest genetic distance to the client's genetic surname, wherein the male genetic surname information providing unit, through the female genetic surname determining unit Genetic surname information including at least one of social information, historical information, emotional information, and physical information of modern or past men having the determined genetic surname may be provided to the client.
  • the Y-chromosome grouping unit identifies and identifies the genetic variation of the Y-chromosome for men in each region or country in the present and past.
  • the male genetic surname determining unit calculates the genetic distance by mapping the genetic marker that determines the Y-chromosome of the male client with the genetic marker of the Y-chromosome in each Y-chromosome group stored in the Y-chromosome group database, and , Male genetic surname determination step of determining the surname of the Y-chromosome group having the closest genetic distance to the male sponsor's Y-chromos
  • the Y-chromosome grouping step analyzes the genetic information of the Y-chromosome for men in each region or country in the modern and past, and compares the sequence of the Y-chromosome in which the genetic information is analyzed, and from the comparison result Y- chromosome genetic variation detection step of detecting the genetic variation of the Y-chromosome; a Y-chromosome marker designation step of designating a marker determining the Y-chromosome according to the distance on the map of the Y-chromosome by comparing the genetic variation detected through the Y-chromosomal genetic variation detection step; And group the Y-chromosome for each male by modern and past, but if the specific surname of men grouped according to the genetic variation of the Y-chromosome is 1/3 or more of the total surname, the group is defined as a Y-chromosome group Y-chromosome clustering step of storing in the Y-chromosome group database may be included.
  • the male genetic surname determination step is genetic by mapping the genetic marker determining the Y-chromosome of the male client with the genetic marker of the Y-chromosome in each Y-chromosome group stored in the Y-chromosome group database.
  • Genetic surname similarity calculation step of calculating the distance and scoring the similarity between the male sponsor and the surname belonging to each Y-chromosome group according to the calculation result; and a genetic surname prediction step of predicting the surname of the Y-chromosome group having the highest similarity score with the Y-chromosome of the male sponsor as the genetic surname of the male sponsor through the genetic surname similarity calculation step.
  • the male genetic surname information providing step social information about a person known to the public among men belonging to the genetic surname determined through the male genetic surname determination step, the genetic surname is found in the Y-chromosome group Historical information including information on the migration and settlement routes of men belonging to the given surname, emotional information including the personality of men belonging to the genetic surname, and physical characteristics, blood types, and diseases of men belonging to the genetic surname physical information can be provided.
  • the X-chromosome grouping unit identifies the genetic variation of the autosomes, X-chromosomes and mitochondrial DNA of men belonging to the Y-chromosome group, and the autosomal pattern of the identified genetic variation distribution is the same or the most similar
  • X- An X-chromosome grouping step of combining chromosomal and mitochondrial DNAs defining the combined autosomal, X-chromosomal and mitochondrial DNAs as an X-chromosome group and storing the combined autosomal, X-chromosome and mitochondrial DNAs in an X-chromosome group database; and a female genetic surname determination unit, calculating the genetic distance by mapping the genetic marker that determines the X-chromosome of the female client with the genetic marker of the X-chromosome in each X-chromosome group stored in the X-chromosome group database and a female genetic surname determination step of determining the surname of the X-chromosome group having the closest genetic distance to the client'
  • the male himself defines the Y-chromosome group to which he belongs and the subgroups below it, and precisely calculates the degree of genetic mutation that occurred in the Y-chromosome, so that his brother, ancestor, cousin, fifth cousin, eighth cousin, etc.
  • the closest genetic surname to the male and female using the mutation information of autosomal, X-chromosome and mitochondrial DNA that exists in both sexes, the autosomal, X-chromosome and mitochondria possessed by the Y-chromosome-based gene surname group It is possible to provide a system and method for providing genetic surname information using genomic information that compares DNA information with female autosomal, X-chromosome and mitochondrial DNA information to provide a female genetic surname.
  • FIG. 1 is a schematic diagram illustrating an overall operational flow of a system for providing genetic surname information using genomic information according to an embodiment of the present invention.
  • FIG. 2 is a block diagram showing the overall configuration of a system for providing genetic surname information using genomic information according to an embodiment of the present invention.
  • FIG. 3 is a block diagram illustrating a detailed configuration of a Y-chromosome grouping unit according to an embodiment of the present invention.
  • FIG. 4 is a block diagram illustrating a detailed configuration of a male genetic surname determining unit according to an embodiment of the present invention.
  • FIG. 5 is a flowchart illustrating an overall process of a method for providing genetic surname information using genomic information according to an embodiment of the present invention.
  • FIG. 6 is a flowchart illustrating a detailed process of the Y-chromosome grouping step according to an embodiment of the present invention.
  • FIG. 7 is a flowchart illustrating a detailed process of determining a male genetic surname according to an embodiment of the present invention.
  • FIG. 1 is a schematic diagram illustrating the overall operation flow of a system for providing genetic surname information using genomic information according to an embodiment of the present invention
  • FIG. 2 is genetic surname information using genomic information according to an embodiment of the present invention. It is a block diagram showing the overall configuration of the providing system
  • FIG. 3 is a block diagram showing the detailed configuration of the Y-chromosome grouping unit according to an embodiment of the present invention
  • FIG. 4 is a male genetic surname determining unit according to an embodiment of the present invention. It is a block diagram showing the detailed configuration.
  • the genetic surname information providing system 100 using genomic information includes a Y-chromosome grouping unit 110, a male genetic surname determining unit 120, and a male
  • the genetic surname information providing unit 130 may be included, and may further include an X-chromosome grouping unit 140 and a female genetic surname determining unit 150 .
  • the genetic surname information providing system 100 may be implemented in a complex form of a genetic analysis device and a program installed in the device, and is connected to a communication terminal of a client through a communication network to provide various types of genetic surname related information.
  • the information may be connected to the communication terminal of the corresponding client.
  • the Y-chromosome grouping unit 110 identifies the genetic variation of the Y-chromosome for males of each region or country in the modern and past, and based on the identified genetic variation, the present and past for each male. Group the Y-chromosomes in a hierarchical form, but if the specific surnames of men grouped according to genetic variation are above a certain ratio, the group is defined as a Y-chromosome group and stored in the Y-chromosome group database 10 can To this end, the Y-chromosome grouping unit 110 may include a Y-chromosome genetic variation detection unit 111 , a Y-chromosome marker designator 112 and a Y-chromosome clustering unit 113 as shown in FIG. 3 . can
  • the Y-chromosome genetic variation detection unit 111 analyzes the genetic information of the Y-chromosome for men in each region or country in the modern and past, and compares the sequence of the Y-chromosome in which the genetic information is analyzed, and contrasts From the result, it is possible to detect the genetic variation of the Y-chromosome.
  • the Y-chromosome genetic variation detection unit 111 performs genome/DNA decoding, mapping to a standard genome map, and mutation calling. It goes through a general process such as (calling), and at this time, it is not limited in this embodiment with respect to the specific configuration of the algorithm and device for decoding the genome, chromosome, and DNA, or the algorithm and device for extracting genetic variation information thereafter.
  • the Y-chromosome marker designator 112 is, in a state in which the Y-chromosome and the male surname information are continuously accumulated in the Y-chromosome group database 10, through the Y-chromosome genetic variation detection unit 111 By comparing the detected genetic mutations with each other, it is possible to designate a marker that determines the Y-chromosome according to the distance on the map of the Y-chromosome.
  • a Y-chromosome for 2,000 men having various surnames and a database for the surname, that is, the Y-chromosome group database 10 is built, and the corresponding chromosome based on the genetic variation information on the Y-chromosome therein.
  • the Y-chromosome clustering unit 113 groups the Y-chromosome for each male by modern and past, but when the specific surname of men grouped according to the genetic variation of the Y-chromosome is 1/3 or more of the total surname
  • a corresponding group may be defined as a Y-chromosome group and stored in the Y-chromosome group database 10 .
  • the Y-chromosome group means a group that becomes a cluster when a general clustering algorithm and phylogenetic diagram are drawn in the population, and among these groups, there is a group in which male surnames in the cluster have a majority of 33% or more. In some cases, it can be defined as a Y-chromosome group.
  • 33% means that a specific surname is 1/3 in the population, and it may mean an empirically adjusted numerical value that can change according to each surname, such as 40% or 50%. As such, it is important to not limit a specific reference value, and to be able to cluster into this empirical majority Y-chromosome group.
  • the representative marker (one or a few) of each surname located in the middle or in the middle of the group among the distributions of each surname is selected. By specifying it, it is possible to perform the process of clearly processing the location on the clustering of each surname.
  • the male genetic surname determination unit 120 the genetic marker determining the Y-chromosome of the male client is mapped with the genetic marker of the Y-chromosome in each Y-chromosome group stored in the Y-chromosome group database 10 (mapping) to calculate the genetic distance, and determine the surname of the Y-chromosome group having the closest genetic distance to the male sponsor's Y-chromosome as the male sponsor's genetic surname (actually predicted or can be estimated).
  • the male genetic surname determiner 120 may include a genetic surname similarity calculator 121 and a genetic surname predictor 122 as shown in FIG. 4 .
  • the genetic surname similarity calculation unit 121 maps the genetic marker determining the Y-chromosome of the male client to the genetic marker of the Y-chromosome in each Y-chromosome group stored in the Y-chromosome group database 10 .
  • the genetic surname similarity calculator 121 maps the markers determining the Y-chromosome of the male client based on the Y-chromosome group database 10, and within the population (eg, 2,000 people).
  • Algorithms for calculating the closest distance to a group of Y-chromosomes are available. According to the general concept of the algorithm for calculating this genetic distance, each male sponsor will have the genetic distance of the Y-chromosome for each surname. The genetic distance of the Y-chromosome can ultimately be expressed as a score indicating how close an individual is to a group of surnames and Y-chromosomes.
  • each Y-chromosome group is a Y-chromosome group database for ancient males and a Y-chromosome group database for international males according to the general concept of the algorithm for calculating the genetic distance of the Y-chromosome group.
  • the genetic surname prediction unit 122 predicts the surname of the Y-chromosome group having the highest similarity score with the Y-chromosome of the male client as the genetic surname of the male client through the genetic surname similarity calculation unit 121.
  • the male genetic surname information providing unit 130 is at least one of social information, historical information, emotional information, and physical information of modern or past men having a genetic surname determined through the male genetic surname determining unit 120 . It is possible to provide genetic surname information including a male sponsor.
  • the male genetic surname information providing unit 130 social information about a person known to the public among men belonging to the genetic surname determined through the male genetic surname determining unit 120, the genetic surname Historical information including information on the past migration and settlement routes of men belonging to the surname found in the Y-chromosome group of , emotional information including the personality of men belonging to the genetic surname, and physical information of men belonging to the genetic surname Physical information including characteristics, blood types, and diseases may be provided respectively.
  • Male genetic surname information providing unit 130 the current or past (historically) famous person among men belonging to the genetic surname determined through the male genetic surname determination unit 120, historical and social information about the person , various statistical information such as the distribution of surnames found in the corresponding Y-chromosome group can be provided.
  • various statistical information such as the distribution of surnames found in the corresponding Y-chromosome group can be provided.
  • entertainment information based on the anecdotes or characteristics of the surnames of the corresponding Y-chromosome group.
  • various information such as personality, body characteristics, and blood type of individuals based on the corresponding Y-chromosome group may be provided.
  • information such as movement and settlement routes of ancestral fathers of the corresponding Y-chromosome group may be provided. Such information may be provided by producing predetermined image information using media through applications and the web.
  • the X-chromosome grouping unit 140 determines the genetic variation of the autosomal, X-chromosome and mitochondrial DNA of men belonging to the Y-chromosome group, and the autosomal having the same or the most similar pattern of the identified genetic variation distribution, X-chromosome and mitochondrial DNAs are combined, and the combined autosomal, X-chromosome and mitochondrial DNAs are defined as an X-chromosome group and stored in the X-chromosome group database 20 .
  • This X-chromosome grouping unit 140 is a female based on the genetic information on the autosomal, X-chromosome and mitochondrial DNA of people belonging to the Y-chromosome group in a state in which the Y-chromosome group database 10 is built. It is configured to find the surname of , and the configuration for this is made in the same manner as the above-described Y-chromosome grouping unit 110, so a detailed description thereof will be omitted.
  • the female genetic surname determination unit 150 the genetic marker that determines the X-chromosome of the female client is mapped to the genetic marker of the X-chromosome in each X-chromosome group stored in the X-chromosome group database 20 Thus, the genetic distance can be calculated, and the surname of the X-chromosome group having the closest genetic distance to the sponsor's X-chromosome can be determined as the sponsor's genetic surname. Since the female genetic surname determining unit 150 is also made in the same manner as the above-described male genetic surname determining unit 120, a detailed description thereof will be omitted.
  • the male genetic surname information providing unit 130 among the social information, historical information, emotional information and physical information of modern or past men having a genetic surname determined through the female genetic surname determining unit 150 .
  • Genetic surname information including at least one may be provided to the requester, and the configuration for this is the same as the operation method of the male genetic surname information providing unit 130 described above, and thus a detailed description thereof will be omitted.
  • FIG. 5 is a flowchart showing the entire process of a method for providing genetic surname information using genomic information according to an embodiment of the present invention
  • FIG. 6 is a flowchart showing a detailed process of the Y-chromosome grouping step according to an embodiment of the present invention
  • Figure 7 is a flowchart showing a detailed process of the male genetic surname determination step according to an embodiment of the present invention.
  • the method for providing genetic surname information using genomic information (S100) includes a Y-chromosome grouping step (S110), a male genetic surname determination step (S120), and a male genetic surname.
  • a Y-chromosome grouping step (S110) includes a male genetic surname determination step (S120), and a male genetic surname.
  • Including the information providing step (S130), and additionally X- chromosome grouping step (S140) and a female genetic surname determination step (S150) may be further included.
  • the Y-chromosome grouping step (S110) is to determine the genetic variation of the Y-chromosome for males of each region or country in the modern and past, and based on the identified genetic variation, for each male in the present and past Group the Y-chromosomes in a hierarchical form, but if the specific surnames of men grouped according to genetic variation are above a certain ratio, the group is defined as a Y-chromosome group and stored in the Y-chromosome group database 10 can To this end, the Y-chromosome grouping step (S110) includes a Y-chromosome genetic variation detection step (S111), a Y-chromosome marker designation step (S112) and a Y-chromosome clustering step (S113) as shown in FIG. 6 . can do.
  • the Y-chromosome genetic variation detection step (S111), analyzes the genetic information of the Y-chromosome for men in each region or country in the modern and past, and compares the sequence of the Y-chromosome in which the genetic information is analyzed, The genetic variation of the Y-chromosome can be detected from the control result.
  • the Y-chromosome genetic variation detection step (S111) includes genome/DNA decoding, mapping to a standard genome map, and mutation It goes through a general process such as calling, and at this time, it is not limited in this embodiment with respect to the specific configuration of the algorithm and device for decoding the genome, chromosome, and DNA, or the algorithm and device for extracting genetic variation information thereafter. .
  • the Y-chromosome genetic variation detection step (S111) is performed while the Y-chromosome and the male surname information are continuously accumulated in the Y-chromosome group database 10.
  • a Y-chromosome for 2,000 men having various surnames and a database for the surname, that is, the Y-chromosome group database 10 is built, and the corresponding chromosome based on the genetic variation information on the Y-chromosome therein.
  • the Y-chromosome for each male by modern and past is grouped, but when the specific surname of men grouped according to the genetic variation of the Y-chromosome is 1/3 or more of the total surname
  • a corresponding group may be defined as a Y-chromosome group and stored in the Y-chromosome group database 10 .
  • the Y-chromosome group means a group that becomes a cluster when a general clustering algorithm and phylogenetic diagram are drawn in the population, and among these groups, there is a group in which male surnames in the cluster have a majority of 33% or more. In some cases, it can be defined as a Y-chromosome group.
  • 33% means that a specific surname is 1/3 in the population, and it may mean an empirically adjusted numerical value that can change according to each surname, such as 40% or 50%. As such, it is important to not limit a specific reference value, and to be able to cluster into this empirical majority Y-chromosome group.
  • the representative marker (one or a few) of each surname located in the middle or in the middle of the group among the distributions of each surname is selected. By specifying it, it is possible to perform the process of clearly processing the location on the clustering of each surname.
  • the male genetic surname determination step (S120) the genetic marker determining the Y-chromosome of the male client is mapped with the genetic marker of the Y-chromosome in each Y-chromosome group stored in the Y-chromosome group database 10 (mapping) to calculate the genetic distance, and determine the surname of the Y-chromosome group having the closest genetic distance to the male sponsor's Y-chromosome as the male sponsor's genetic surname (actually predicted or can be estimated).
  • the male genetic surname determination step S120 may include a genetic surname similarity calculation step S121 and a genetic surname prediction step S122 as shown in FIG. 7 .
  • the genetic marker determining the Y-chromosome of the male client is mapped with the genetic marker of the Y-chromosome in each Y-chromosome group stored in the Y-chromosome group database 10
  • the genetic surname similarity calculation step (S121) is based on the Y-chromosome group database 10, mapping markers determining the Y-chromosome of the male sponsor, and within the population (eg, 2,000 people).
  • Algorithms for calculating the closest distance to a group of Y-chromosomes are available. According to the general concept of the algorithm for calculating this genetic distance, each male sponsor will have the genetic distance of the Y-chromosome for each surname. The genetic distance of the Y-chromosome can ultimately be expressed as a score indicating how close an individual is to a group of surnames and Y-chromosomes.
  • each Y-chromosome group is a Y-chromosome group database for ancient males and a Y-chromosome group database for international males according to the general concept of the algorithm for calculating the genetic distance of the Y-chromosome group.
  • the genetic surname prediction step (S122) is to predict the surname of the Y-chromosome group having the highest similarity score with the Y-chromosome of the male client as the genetic surname of the male client through the genetic surname similarity calculation step (S121).
  • the male genetic surname information providing step (S130) social information about a person known to the public among men belonging to the genetic surname determined through the male genetic surname determination step (S120), the genetic surname Historical information including information on the past migration and settlement routes of men belonging to the surname found in the Y-chromosome group of , emotional information including the personality of men belonging to the genetic surname, and physical information of men belonging to the genetic surname Physical information including characteristics, blood types, and diseases may be provided respectively.
  • various statistical information such as the distribution of surnames found in the corresponding Y-chromosome group can be provided.
  • entertainment information based on the anecdotes or characteristics of the surnames of the corresponding Y-chromosome group.
  • various information such as personality, body characteristics, and blood type of individuals based on the corresponding Y-chromosome group may be provided.
  • information such as movement and settlement routes of ancestral fathers of the corresponding Y-chromosome group may be provided. Such information may be provided by producing predetermined image information using media through applications and the web.
  • the genetic variation of the autosomes, the X-chromosome and mitochondrial DNA of men belonging to the Y-chromosome group is identified, and the pattern of the identified genetic variation distribution is the same or the most similar autosomes, X-chromosome and mitochondrial DNA are combined, and the combined autosomal, X-chromosome and mitochondrial DNA are defined as an X-chromosome group and stored in the X-chromosome group database 20 .
  • This X-chromosome grouping step (S140) is based on the genetic information on the autosomal, X-chromosome and mitochondrial DNA of people belonging to the Y-chromosome group in the state in which the Y-chromosome group database 10 is built. It is configured to find the surname of , and the configuration for this is made in the same manner as the above-described Y-chromosome grouping step (S110), so a detailed description thereof will be omitted.
  • the female genetic surname determination step (S150) the genetic marker determining the X-chromosome of the female client is mapped with the genetic marker of the X-chromosome in each X-chromosome group stored in the X-chromosome group database 20 Thus, the genetic distance can be calculated, and the surname of the X-chromosome group having the closest genetic distance to the sponsor's X-chromosome can be determined as the sponsor's genetic surname.
  • the female genetic surname determination step (S150) is also made in the same manner as the above-described male genetic surname determination step (S120), so a detailed description thereof will be omitted.
  • the male genetic surname information providing step 130 is, among the social information, historical information, emotional information and physical information of modern or past men having a genetic surname determined through the female genetic surname determination step (S150). Genetic surname information including at least one may be provided to the requester, and the configuration for this is the same as the operation method of the above-described male genetic surname information providing step (S130), so a detailed description thereof will be omitted.
  • the Y-chromosome group to which the male himself belongs and the subgroups below it, and precisely calculating the degree of genetic variation occurring in the Y-chromosome, brothers, ancestors, cousins, fifth cousins, 8 It infers the closest genetic surname to oneself, such as village, and utilizes mutation information of autosomal, X-chromosome, and mitochondrial DNA present in both men and women, and the autosomal, X- By comparing chromosomal and mitochondrial DNA information with female autosomal, X-chromosome and mitochondrial DNA information, it is possible to provide a female genetic surname.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Ecology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Data Mining & Analysis (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방법에 관한 것이다. 일례로, 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전변이를 파악하고, 파악된 유전변이를 기반으로 현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 일정 비율 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스에 저장하는 Y-염색체 그룹화부; 남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 상기 Y-염색체 그룹 데이터베이스에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 남성 의뢰자의 Y-염색체와 가장 가까운 유전적 거리를 갖는 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 결정하는 남성 유전적 성씨 결정부; 및 상기 남성 유전적 성씨 결정부를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 남성 의뢰자에게 제공하는 남성 유전적 성씨 정보 제공부를 포함하는 유전적 성씨 정보 제공 시스템을 개시한다.

Description

게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방법
본 발명의 실시예는 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방에 관한 것이다.
오늘날 우리가 사용하고 있는 성은 신라시대부터 사용된 것으로 추측한다. 박 씨, 석 씨, 김 씨의 3성의 전설이 전해져 오며 유리왕 9년에는 육부의 촌장에게 이 씨, 최 씨, 손 씨, 정 씨, 배 씨, 설 씨의 성을 부여했다고 한다.
고려 중기 문종 9년(1055년)에는 성이 없는 사람은 과거에 급제할 자격을 부여하지 않는다는 법령을 공포하면서 성의 사용이 보편화되었다.
조선 초기에는 양민에게도 보편화되었지만 노비 등의 천민 계급은 조선초기까지도 성을 사용하지 못하였다.
근대에 들어와 1909년 호적법이 시행되면서 누구라도 성과 본을 가질 수 있도록 법제화되면서 우리나라 국민 모두가 성을 사용할 수 있게 되었다.
이때, 성이 없었던 사람에게 성을 지어주기도 하고 본인의 희망에 따라 호적을 담당하던 사람들이 마음대로 성을 지어주기도 했다.
성씨가 혈연과는 전혀 관련이 없이 임의적으로 주어졌음을 알 수 있다.
따라서 성씨의 종류가 많이 늘어나기도 했다. 일제식민통치 하에서는 황국신민화 정책의 일환으로 창씨개명과 1946년 미군정이 공포한 조선성명복구령으로 또 한번 큰 혼란을 겪었다.
또한, 한국인이나 인간의 대부분의 성씨는 남성의 것을 따르는데, 세대가 지나면서, 성씨가 100% 정확하게 유전적으로 정확히 자손에게 전달 되지 못하는 문제를 가지고 있다.
특히, 족보거래나, 성씨를 자의적으로 취한 경우, 양자를 들인 경우, 간음에 의한 경우 등 다양한 이유로, 자신의 성씨가 특정 유전자의 성씨 그룹에 속하는 지는 매우 불분명하다.
본 발명의 실시예는, 남성 자신이 속한 Y-염색체 그룹과 그 밑의 세부 그룹을 정의하고, Y-염색체에서 생긴 유전변이의 정도를 정밀히 계산하여, 형제, 조상, 사촌, 5촌, 8촌 등 자신에게 가장 가까운 유전적 성씨를 유추하며, 남녀 모두에게 존재하는 상염색체, X-염색체 및 미토콘드리아 DNA의 변이 정보를 활용하여, Y-염색체 기반 유전자 성씨 그룹이 보유하고 있는 상염색체, X-염색체 및 미토콘드리아 DNA 정보와 여성의 상염색체, X-염색체 및 미토콘드리아 DNA 정보를 비교하여 여성의 유전적 성씨를 제공하는 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방법을 제공한다.
본 발명의 실시예에 따른 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템은, 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전변이를 파악하고, 파악된 유전변이를 기반으로 현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 일정 비율 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스에 저장하는 Y-염색체 그룹화부; 남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 상기 Y-염색체 그룹 데이터베이스에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 남성 의뢰자의 Y-염색체와 가장 가까운 유전적 거리를 갖는 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 결정하는 남성 유전적 성씨 결정부; 및 상기 남성 유전적 성씨 결정부를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 남성 의뢰자에게 제공하는 남성 유전적 성씨 정보 제공부를 포함한다.
또한, 상기 Y-염색체 그룹화부는, 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전정보를 분석하고, 유전정보가 분석된 Y-염색체의 서열을 대조하며, 대조결과로부터 Y-염색체의 유전변이를 검출하는 Y-염색체 유전변이 검출부; 상기 Y-염색체 유전변이 검출부를 통해 검출된 유전변이를 상호 비교하여 Y-염색체의 지도 상 거리에 따라 Y-염색체를 결정짓는 마커를 지정하는 Y-염색체 마커 지정부; 및 현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, Y-염색체의 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 전체 성씨의 1/3 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스에 저장하는 Y-염색체 클러스터링부를 포함할 수 있다.
또한, 상기 남성 유전적 성씨 결정부는, 남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 상기 Y-염색체 그룹 데이터베이스에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 계산 결과에 따라 남성 의뢰자와 각 Y-염색체 그룹에 속한 성씨와의 유사도를 점수화하는 유전적 성씨 유사도 계산부; 및 상기 유전적 성씨 유사도 계산부를 통해 남성 의뢰자의 Y-염색체와의 유사도 점수가 가장 높은 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 예측하는 유전적 성씨 예측부를 포함할 수 있다.
또한, 상기 남성 유전적 성씨 정보 제공부는, 상기 남성 유전적 성씨 결정부를 통해 결정된 유전적 성씨에 속한 남성들 중 대중에게 알려진 인물에 대한 사회적 정보, 해당 유전적 성씨의 Y-염색체 그룹에서 발견되는 성씨에 속한 남성들의 과거 이동과 정착 경로 정보를 포함하는 역사적 정보, 해당 유전적 성씨에 속한 남성들의 성격을 포함하는 감성적 정보, 및 해당 유전적 성씨에 속한 남성들의 신체적 특징, 혈액형, 질환을 포함하는 신체적 정보를 제공할 수 있다.
또한, 상기 Y-염색체 그룹에 속한 남성들의 상염색체, X-염색체 및 미토콘드리아 DNA의 유전변이를 파악하고, 파악된 유전변이분포의 패턴이 같거나 가장 유사한 상염색체, X-염색체 및 미토콘드리아 DNA들 간을 조합하고, 조합된 상염색체, X-염색체 및 미토콘드리아 DNA들을 X-염색체 그룹으로 규정하여 X-염색체 그룹 데이터베이스에 저장하는 X-염색체 그룹화부; 및 여성 의뢰자의 X-염색체를 결정짓는 유전적 마커를 상기 X-염색체 그룹 데이터베이스에 저장된 각 X-염색체 그룹 내 X-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 의뢰자의 X-염색체와 가장 가까운 유전적 거리를 갖는 X-염색체 그룹의 성씨를 의뢰자의 유전적 성씨로 결정하는 여성 유전적 성씨 결정부를 더 포함하고, 상기 남성 유전적 성씨 정보 제공부는, 상기 여성 유전적 성씨 결정부를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 의뢰자에게 제공할 수 있다.
본 발명의 다른 실시예에 따른 게놈 정보를 이용한 유전적 성씨 정보 제공 방법은, Y-염색체 그룹화부가, 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전변이를 파악하고, 파악된 유전변이를 기반으로 현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 일정 비율 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스에 저장하는 Y-염색체 그룹화 단계; 남성 유전적 성씨 결정부가, 남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 상기 Y-염색체 그룹 데이터베이스에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 남성 의뢰자의 Y-염색체와 가장 가까운 유전적 거리를 갖는 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 결정하는 남성 유전적 성씨 결정 단계; 및 남성 유전적 성씨 정보 제공부가, 상기 남성 유전적 성씨 결정 단계를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 남성 의뢰자에게 제공하는 남성 유전적 성씨 정보 제공 단계를 포함한다.
또한, 상기 Y-염색체 그룹화 단계는, 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전정보를 분석하고, 유전정보가 분석된 Y-염색체의 서열을 대조하며, 대조결과로부터 Y-염색체의 유전변이를 검출하는 Y-염색체 유전변이 검출 단계; 상기 Y-염색체 유전변이 검출 단계를 통해 검출된 유전변이를 상호 비교하여 Y-염색체의 지도 상 거리에 따라 Y-염색체를 결정짓는 마커를 지정하는 Y-염색체 마커 지정 단계; 및 현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, Y-염색체의 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 전체 성씨의 1/3 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스에 저장하는 Y-염색체 클러스터링 단계를 포함할 수 있다.
또한, 상기 남성 유전적 성씨 결정 단계는, 남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 상기 Y-염색체 그룹 데이터베이스에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 계산 결과에 따라 남성 의뢰자와 각 Y-염색체 그룹에 속한 성씨와의 유사도를 점수화하는 유전적 성씨 유사도 계산 단계; 및 상기 유전적 성씨 유사도 계산 단계를 통해 남성 의뢰자의 Y-염색체와의 유사도 점수가 가장 높은 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 예측하는 유전적 성씨 예측 단계를 포함할 수 있다.
또한, 상기 남성 유전적 성씨 정보 제공 단계는, 상기 남성 유전적 성씨 결정 단계를 통해 결정된 유전적 성씨에 속한 남성들 중 대중에게 알려진 인물에 대한 사회적 정보, 해당 유전적 성씨의 Y-염색체 그룹에서 발견되는 성씨에 속한 남성들의 과거 이동과 정착 경로 정보를 포함하는 역사적 정보, 해당 유전적 성씨에 속한 남성들의 성격을 포함하는 감성적 정보, 및 해당 유전적 성씨에 속한 남성들의 신체적 특징, 혈액형, 질환을 포함하는 신체적 정보를 제공할 수 있다.
또한, X-염색체 그룹화부가, 상기 Y-염색체 그룹에 속한 남성들의 상염색체, X-염색체 및 미토콘드리아 DNA의 유전변이를 파악하고, 파악된 유전변이분포의 패턴이 같거나 가장 유사한 상염색체, X-염색체 및 미토콘드리아 DNA들 간을 조합하고, 조합된 상염색체, X-염색체 및 미토콘드리아 DNA들을 X-염색체 그룹으로 규정하여 X-염색체 그룹 데이터베이스에 저장하는 X-염색체 그룹화 단계; 및 여성 유전적 성씨 결정부가, 여성 의뢰자의 X-염색체를 결정짓는 유전적 마커를 상기 X-염색체 그룹 데이터베이스에 저장된 각 X-염색체 그룹 내 X-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 의뢰자의 X-염색체와 가장 가까운 유전적 거리를 갖는 X-염색체 그룹의 성씨를 의뢰자의 유전적 성씨로 결정하는 여성 유전적 성씨 결정 단계를 더 포함하고, 상기 남성 유전적 성씨 정보 제공 단계는, 상기 여성 유전적 성씨 결정 단계를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 의뢰자에게 제공할 수 있다.
본 발명에 따르면, 남성 자신이 속한 Y-염색체 그룹과 그 밑의 세부 그룹을 정의하고, Y-염색체에서 생긴 유전변이의 정도를 정밀히 계산하여, 형제, 조상, 사촌, 5촌, 8촌 등 자신에게 가장 가까운 유전적 성씨를 유추하며, 남녀 모두에게 존재하는 상염색체, X-염색체 및 미토콘드리아 DNA의 변이 정보를 활용하여, Y-염색체 기반 유전자 성씨 그룹이 보유하고 있는 상염색체, X-염색체 및 미토콘드리아 DNA 정보와 여성의 상염색체, X-염색체 및 미토콘드리아 DNA 정보를 비교하여 여성의 유전적 성씨를 제공하는 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방법을 제공할 수 있다.
도 1은 본 발명의 실시예에 따른 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템의 전체 동작 흐름을 설명하기 위해 나타낸 개요도이다.
도 2는 본 발명의 실시예에 따른 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템의 전체 구성을 나타낸 블록도이다.
도 3은 본 발명의 실시예에 따른 Y-염색체 그룹화부의 세부 구성을 나타낸 블록도이다.
도 4는 본 발명의 실시예에 따른 남성 유전적 성씨 결정부의 세부 구성을 나타낸 블록도이다.
도 5는 본 발명의 실시예에 따른 게놈 정보를 이용한 유전적 성씨 정보 제공 방법의 전체 과정을 나타낸 흐름도이다.
도 6은 본 발명의 실시예에 따른 Y-염색체 그룹화 단계의 세부 과정을 나타낸 흐름도이다.
도 7은 본 발명의 실시예에 따른 남성 유전적 성씨 결정 단계의 세부 과정을 나타낸 흐름도이다.
도 1은 본 발명의 실시예에 따른 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템의 전체 동작 흐름을 설명하기 위해 나타낸 개요도이고, 도 2는 본 발명의 실시예에 따른 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템의 전체 구성을 나타낸 블록도이고, 도 3은 본 발명의 실시예에 따른 Y-염색체 그룹화부의 세부 구성을 나타낸 블록도이며, 도 4는 본 발명의 실시예에 따른 남성 유전적 성씨 결정부의 세부 구성을 나타낸 블록도이다.
도 1 및 도 2를 참조하면, 본 발명의 실시예에 따른 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템(100)은 Y-염색체 그룹화부(110), 남성 유전적 성씨 결정부(120) 및 남성 유전적 성씨 정보 제공부(130)를 포함하며, 추가적으로 X-염색체 그룹화부(140) 및 여성 유전적 성씨 결정부(150)를 더 포함하여 구성될 수 있다.
본 실시예에 따른 유전적 성씨 정보 제공 시스템(100)는 유전자 분석 장치 및 해당 장치에 설치된 프로그램의 복합적인 형태로 구현될 수 있으며, 통신망을 통해 의뢰자의 통신단말과 연결되어 유전적 성씨와 관련된 각종 정보를 해당 의뢰자의 통신단말로 연결될 수 있다.
상기 Y-염색체 그룹화부(110)는, 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전변이를 파악하고, 파악된 유전변이를 기반으로 현대 및 과거 별 각 남성들에 대한 Y-염색체를 위계(hierarchy)를 가진 형태로 그룹화하되, 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 일정 비율 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스(10)에 저장할 수 있다. 이를 위해, Y-염색체 그룹화부(110)는 도 3에 도시된 바와 같이 Y-염색체 유전변이 검출부(111), Y-염색체 마커 지정부(112) 및 Y-염색체 클러스터링부(113)를 포함할 수 있다.
상기 Y-염색체 유전변이 검출부(111)는, 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전정보를 분석하고, 유전정보가 분석된 Y-염색체의 서열을 대조하며, 대조결과로부터 Y-염색체의 유전변이를 검출할 수 있다. Y-염색체 그룹화부(110)가 궁극적으로 Y-염색체 그룹 데이터베이스(10)를 구축하기 위하여, Y-염색체 유전변이 검출부(111)는 게놈/DNA 해독, 표준게놈지도에 매핑(mapping), 변이 콜링(calling) 등의 일반적 과정을 거치며, 이때 게놈, 염색체 및 DNA를 해독하는 알고리즘 및 장치, 또는 이후의 유전변이정보를 추출하기 위한 알고리즘 및 장치에 대한 구체적인 구성에 관하여 본 실시예에서는 한정하지 않는다.
상기 Y-염색체 마커 지정부(112)는, Y-염색체 그룹 데이터베이스(10)에 지속적으로 Y-염색체와 해당 남성의 성씨 정보가 누적되고 있는 상태에서, Y-염색체 유전변이 검출부(111)를 통해 검출된 유전변이를 상호 비교하여 Y-염색체의 지도 상 거리에 따라 Y-염색체를 결정짓는 마커를 지정할 수 있다.
예를 들어, 다양한 성씨를 갖는 2,000명의 남성에 대한 Y-염색체와 그 성씨에 대한 데이터베이스 즉 Y-염색체 그룹 데이터베이스(10)를 구축하고, 그 안에 Y-염색체에 대한 유전변이정보에 기초하여 해당 염색체의 특징적인 마커를 지정할 수 있다. 이때, 마커는 모집단 내의 발생 빈도가 0.01% 에서 99% 사이의 모든 빈도를 가지는 것으로, 모든 사람이 같이 가지는 경우는 제외하고, 0.01% 같이 매우 극소수 발생하는 경우의 마커도 배제할 수 있다.
상기 Y-염색체 클러스터링부(113)는, 현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, Y-염색체의 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 전체 성씨의 1/3 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스(10)에 저장할 수 있다.
본 실시예에서 Y-염색체 그룹은, 모집단에서 일반적인 클러스터링 알고리즘과 계통도를 그렸을 때, 클러스터가 되는 그룹을 의미하며, 이러한 그룹들 중에서 그 클러스터에 속한 남성들의 성씨가 33% 이상의 대다수를 가진 그룹이 있을 경우에 이를 Y-염색체 그룹으로 규정할 수 있다. 여기서, 33%는 모집단에 특정 성씨가 1/3이 된다는 의미이며, 이 뿐만 아니라 각 성씨에 따라, 40%, 50% 등 변화할 수 있는 경험적으로 조정되는 수치를 의미할 수 있다. 이와 같이 특정 기준 수치를 한정하지 아니며, 이런 경험적 대다수의 Y-염색체 그룹으로 클러스터 할 수 있다는 것이 중요하다.
한편, Y-염색체 그룹이 성씨 별로 명확히 구분되어지지 않을 경우(즉 성씨 별로 오버랩이 발생할 경우), 각 성씨 별 분포 중 그룹의 가운데 혹은 중간에 위치하는 성씨 별 대표 표지자(1명 또는 소수인)를 지정하여, 각 성씨의 클러스터링 상의 위치를 명확히 처리하는 과정을 수행할 수 있다.
상기 남성 유전적 성씨 결정부(120)는, 남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 Y-염색체 그룹 데이터베이스(10)에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑(mapping)하여 유전적 거리(genetic distance)를 계산하고, 남성 의뢰자의 Y-염색체와 가장 가까운 유전적 거리를 갖는 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 결정(실질적으로는 예측 또는 추정하는 것임)할 수 있다. 이를 위해, 남성 유전적 성씨 결정부(120)는 도 4에 도시된 바와 같이 유전적 성씨 유사도 계산부(121)와 유전적 성씨 예측부(122)를 포함할 수 있다.
상기 유전적 성씨 유사도 계산부(121)는, 남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 Y-염색체 그룹 데이터베이스(10)에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 각각 계산하고, 그 계산 결과에 따라 남성 의뢰자와 각 Y-염색체 그룹에 속한 성씨와의 유사도를 점수화하여 수치적인 결과를 각각 제공할 수 있다. 여기서, 유전적 성씨 유사도 계산부(121)는 Y-염색체 그룹 데이터베이스(10)에 기초하여 남성 의뢰자의 Y-염색체의 결정짓는 마커들 매핑(mapping)하고, 모집단(예를 들어 2,000명) 내에서의 Y-염색체 그룹과 가장 가까운 거리를 계산하는 알고리즘(일반적인 유전적 거리를 계산하는 모든 알고리즘 포함)을 이용할 수 있다. 이러한 유전적 거리를 계산하는 알고리즘의 범용 개념에 따라 각 남성 의뢰자는 각각의 성씨에 대한 Y-염색체의 유전적 거리를 갖게 된다. Y-염색체의 유전적 거리가 결국 개개인이 성씨들 Y-염색체 그룹과 어떻게 가까운지를 나타내는 점수로 표현할 수 있다.
이때, 각각의 Y-염색체 그룹은 Y-염색체 그룹의 유전적 거리를 계산하는 알고리즘의 범용 개념에 따라 과거(ancient)의 남성들에 대한 Y-염색체 그룹 데이터베이스와 국제적(international) 남성들에 대한 Y-염색체 그룹 데이터베이스 간의 비교를 통해 Y-염색체 그룹의 이주(migration)에 대한 데이터베이스를 갖게 된다. 이러한 이주 데이터베이스는 결국, 가령 Y-염색체 그룹의 남성들이 아프리카를 떠나 어떻게 이주해 왔는지를 나타내는 구분 표지자가 될 수 있다.
상기 유전적 성씨 예측부(122)는, 유전적 성씨 유사도 계산부(121)를 통해 남성 의뢰자의 Y-염색체와의 유사도 점수가 가장 높은 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 예측할 수 있다.
상기 남성 유전적 성씨 정보 제공부(130)는, 남성 유전적 성씨 결정부(120)를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 남성 의뢰자에게 제공할 수 있다.
좀 더 구체적으로, 남성 유전적 성씨 정보 제공부(130)는, 남성 유전적 성씨 결정부(120)를 통해 결정된 유전적 성씨에 속한 남성들 중 대중에게 알려진 인물에 대한 사회적 정보, 해당 유전적 성씨의 Y-염색체 그룹에서 발견되는 성씨에 속한 남성들의 과거 이동과 정착 경로 정보를 포함하는 역사적 정보, 해당 유전적 성씨에 속한 남성들의 성격을 포함하는 감성적 정보, 및 해당 유전적 성씨에 속한 남성들의 신체적 특징, 혈액형, 질환을 포함하는 신체적 정보를 각각 제공할 수 있다.
남성 유전적 성씨 정보 제공부(130)는, 남성 유전적 성씨 결정부(120)를 통해 결정된 유전적 성씨에 속한 남성들 중 현재 또는 과거(역사적으로) 유명한 인물, 그 인물에 대한 역사적, 사회적 정보, 해당 Y-염색체 그룹에서 발견되는 성씨의 분포 등 다양한 통계정보를 제공할 수 있다. 또한, 해당 Y-염색체 그룹에 기반한 그 해당 Y-염색체 그룹의 성씨들의 일화나 특징을 주제로 한 오락성 정보를 제공할 수 있다. 또한, 해당 Y-염색체 그룹에 기반한 개개인들의 성격, 신체특징, 혈액형 등 다양한 정보를 제공할 수 있다. 또한, 해당 Y-염색체 그룹에 기반한 해당 Y-염색체 그룹의 조상 아버지들의 이동, 정착 경로 등의 정보를 제공할 수 있다. 이러한 정보들은 어플리케이션과 웹을 통한 미디어를 활용하여 소정의 영상 정보를 제작하여 제공할 수도 있다.
상기 X-염색체 그룹화부(140)는, Y-염색체 그룹에 속한 남성들의 상염색체, X-염색체 및 미토콘드리아 DNA의 유전변이를 파악하고, 파악된 유전변이분포의 패턴이 같거나 가장 유사한 상염색체, X-염색체 및 미토콘드리아 DNA들 간을 조합하고, 조합된 상염색체, X-염색체 및 미토콘드리아 DNA들을 X-염색체 그룹으로 규정하여 X-염색체 그룹 데이터베이스(20)에 저장할 수 있다. 이러한 X-염색체 그룹화부(140)는 Y-염색체 그룹 데이터베이스(10)가 구축된 상태에서 해당 Y-염색체 그룹에 속한 사람들의 상염색체, X-염색체 및 미토콘드리아 DNA에 대한 유전적 정보를 기반으로 여성의 성씨를 찾도록 구성되며, 이에 대한 구성은 상술한 Y-염색체 그룹화부(110)와 대동소이하게 이루어지므로, 이에 대한 상세한 설명은 생략한다.
상기 여성 유전적 성씨 결정부(150)는, 여성 의뢰자의 X-염색체를 결정짓는 유전적 마커를 X-염색체 그룹 데이터베이스(20)에 저장된 각 X-염색체 그룹 내 X-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 의뢰자의 X-염색체와 가장 가까운 유전적 거리를 갖는 X-염색체 그룹의 성씨를 의뢰자의 유전적 성씨로 결정할 수 있다. 여성 유전적 성씨 결정부(150) 또한, 상술한 남성 유전적 성씨 결정부(120)와 대동소이하게 이루어지므로, 이에 대한 상세한 설명은 생략한다.
이에 따라, 남성 유전적 성씨 정보 제공부(130)는, 여성 유전적 성씨 결정부(150)를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 의뢰자에게 제공할 수 있으며, 이를 위한 구성은 상술한 남성 유전적 성씨 정보 제공부(130)의 동작 방식과 동일하게 이루어지므로, 이에 대한 상세한 설명은 생략한다.
도 5는 본 발명의 실시예에 따른 게놈 정보를 이용한 유전적 성씨 정보 제공 방법의 전체 과정을 나타낸 흐름도이고, 도 6은 본 발명의 실시예에 따른 Y-염색체 그룹화 단계의 세부 과정을 나타낸 흐름도이며, 도 7은 본 발명의 실시예에 따른 남성 유전적 성씨 결정 단계의 세부 과정을 나타낸 흐름도이다.
도 5를 참조하면, 본 발명의 실시예에 따른 게놈 정보를 이용한 유전적 성씨 정보 제공 방법(S100)은 Y-염색체 그룹화 단계(S110), 남성 유전적 성씨 결정 단계(S120) 및 남성 유전적 성씨 정보 제공 단계(S130)를 포함하며, 추가적으로 X-염색체 그룹화 단계(S140) 및 여성 유전적 성씨 결정 단계(S150)를 더 포함하여 구성될 수 있다.
상기 Y-염색체 그룹화 단계(S110)는, 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전변이를 파악하고, 파악된 유전변이를 기반으로 현대 및 과거 별 각 남성들에 대한 Y-염색체를 위계(hierarchy)를 가진 형태로 그룹화하되, 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 일정 비율 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스(10)에 저장할 수 있다. 이를 위해, Y-염색체 그룹화 단계(S110)는 도 6에 도시된 바와 같이 Y-염색체 유전변이 검출 단계(S111), Y-염색체 마커 지정 단계(S112) 및 Y-염색체 클러스터링 단계(S113)를 포함할 수 있다.
상기 Y-염색체 유전변이 검출 단계(S111)는, 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전정보를 분석하고, 유전정보가 분석된 Y-염색체의 서열을 대조하며, 대조결과로부터 Y-염색체의 유전변이를 검출할 수 있다. Y-염색체 그룹화 단계(S110)가 궁극적으로 Y-염색체 그룹 데이터베이스(10)를 구축하기 위하여, Y-염색체 유전변이 검출 단계(S111)는 게놈/DNA 해독, 표준게놈지도에 매핑(mapping), 변이 콜링(calling) 등의 일반적 과정을 거치며, 이때 게놈, 염색체 및 DNA를 해독하는 알고리즘 및 장치, 또는 이후의 유전변이정보를 추출하기 위한 알고리즘 및 장치에 대한 구체적인 구성에 관하여 본 실시예에서는 한정하지 않는다.
상기 Y-염색체 마커 지정 단계(S112)는, Y-염색체 그룹 데이터베이스(10)에 지속적으로 Y-염색체와 해당 남성의 성씨 정보가 누적되고 있는 상태에서, Y-염색체 유전변이 검출 단계(S111)를 통해 검출된 유전변이를 상호 비교하여 Y-염색체의 지도 상 거리에 따라 Y-염색체를 결정짓는 마커를 지정할 수 있다.
예를 들어, 다양한 성씨를 갖는 2,000명의 남성에 대한 Y-염색체와 그 성씨에 대한 데이터베이스 즉 Y-염색체 그룹 데이터베이스(10)를 구축하고, 그 안에 Y-염색체에 대한 유전변이정보에 기초하여 해당 염색체의 특징적인 마커를 지정할 수 있다. 이때, 마커는 모집단 내의 발생 빈도가 0.01% 에서 99% 사이의 모든 빈도를 가지는 것으로, 모든 사람이 같이 가지는 경우는 제외하고, 0.01% 같이 매우 극소수 발생하는 경우의 마커도 배제할 수 있다.
상기 Y-염색체 클러스터링 단계(S113)는, 현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, Y-염색체의 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 전체 성씨의 1/3 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스(10)에 저장할 수 있다.
본 실시예에서 Y-염색체 그룹은, 모집단에서 일반적인 클러스터링 알고리즘과 계통도를 그렸을 때, 클러스터가 되는 그룹을 의미하며, 이러한 그룹들 중에서 그 클러스터에 속한 남성들의 성씨가 33% 이상의 대다수를 가진 그룹이 있을 경우에 이를 Y-염색체 그룹으로 규정할 수 있다. 여기서, 33%는 모집단에 특정 성씨가 1/3이 된다는 의미이며, 이 뿐만 아니라 각 성씨에 따라, 40%, 50% 등 변화할 수 있는 경험적으로 조정되는 수치를 의미할 수 있다. 이와 같이 특정 기준 수치를 한정하지 아니며, 이런 경험적 대다수의 Y-염색체 그룹으로 클러스터 할 수 있다는 것이 중요하다.
한편, Y-염색체 그룹이 성씨 별로 명확히 구분되어지지 않을 경우(즉 성씨 별로 오버랩이 발생할 경우), 각 성씨 별 분포 중 그룹의 가운데 혹은 중간에 위치하는 성씨 별 대표 표지자(1명 또는 소수인)를 지정하여, 각 성씨의 클러스터링 상의 위치를 명확히 처리하는 과정을 수행할 수 있다.
상기 남성 유전적 성씨 결정 단계(S120)는, 남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 Y-염색체 그룹 데이터베이스(10)에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑(mapping)하여 유전적 거리(genetic distance)를 계산하고, 남성 의뢰자의 Y-염색체와 가장 가까운 유전적 거리를 갖는 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 결정(실질적으로는 예측 또는 추정하는 것임)할 수 있다. 이를 위해, 남성 유전적 성씨 결정 단계(S120)는 도 7에 도시된 바와 같이 유전적 성씨 유사도 계산 단계(S121)와 유전적 성씨 예측 단계(S122)를 포함할 수 있다.
상기 유전적 성씨 유사도 계산 단계(S121)는, 남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 Y-염색체 그룹 데이터베이스(10)에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 각각 계산하고, 그 계산 결과에 따라 남성 의뢰자와 각 Y-염색체 그룹에 속한 성씨와의 유사도를 점수화하여 수치적인 결과를 각각 제공할 수 있다. 여기서, 유전적 성씨 유사도 계산 단계(S121)는 Y-염색체 그룹 데이터베이스(10)에 기초하여 남성 의뢰자의 Y-염색체의 결정짓는 마커들 매핑(mapping)하고, 모집단(예를 들어 2,000명) 내에서의 Y-염색체 그룹과 가장 가까운 거리를 계산하는 알고리즘(일반적인 유전적 거리를 계산하는 모든 알고리즘 포함)을 이용할 수 있다. 이러한 유전적 거리를 계산하는 알고리즘의 범용 개념에 따라 각 남성 의뢰자는 각각의 성씨에 대한 Y-염색체의 유전적 거리를 갖게 된다. Y-염색체의 유전적 거리가 결국 개개인이 성씨들 Y-염색체 그룹과 어떻게 가까운지를 나타내는 점수로 표현할 수 있다.
이때, 각각의 Y-염색체 그룹은 Y-염색체 그룹의 유전적 거리를 계산하는 알고리즘의 범용 개념에 따라 과거(ancient)의 남성들에 대한 Y-염색체 그룹 데이터베이스와 국제적(international) 남성들에 대한 Y-염색체 그룹 데이터베이스 간의 비교를 통해 Y-염색체 그룹의 이주(migration)에 대한 데이터베이스를 갖게 된다. 이러한 이주 데이터베이스는 결국, 가령 Y-염색체 그룹의 남성들이 아프리카를 떠나 어떻게 이주해 왔는지를 나타내는 구분 표지자가 될 수 있다.
상기 유전적 성씨 예측 단계(S122)는, 유전적 성씨 유사도 계산 단계(S121)를 통해 남성 의뢰자의 Y-염색체와의 유사도 점수가 가장 높은 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 예측할 수 있다.
상기 남성 유전적 성씨 정보 제공 단계(S130)는, 남성 유전적 성씨 결정 단계(S120)를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 남성 의뢰자에게 제공할 수 있다.
좀 더 구체적으로, 남성 유전적 성씨 정보 제공 단계(S130)는, 남성 유전적 성씨 결정 단계(S120)를 통해 결정된 유전적 성씨에 속한 남성들 중 대중에게 알려진 인물에 대한 사회적 정보, 해당 유전적 성씨의 Y-염색체 그룹에서 발견되는 성씨에 속한 남성들의 과거 이동과 정착 경로 정보를 포함하는 역사적 정보, 해당 유전적 성씨에 속한 남성들의 성격을 포함하는 감성적 정보, 및 해당 유전적 성씨에 속한 남성들의 신체적 특징, 혈액형, 질환을 포함하는 신체적 정보를 각각 제공할 수 있다.
남성 유전적 성씨 정보 제공 단계(S130)는, 남성 유전적 성씨 결정 단계(S120)를 통해 결정된 유전적 성씨에 속한 남성들 중 현재 또는 과거(역사적으로) 유명한 인물, 그 인물에 대한 역사적, 사회적 정보, 해당 Y-염색체 그룹에서 발견되는 성씨의 분포 등 다양한 통계정보를 제공할 수 있다. 또한, 해당 Y-염색체 그룹에 기반한 그 해당 Y-염색체 그룹의 성씨들의 일화나 특징을 주제로 한 오락성 정보를 제공할 수 있다. 또한, 해당 Y-염색체 그룹에 기반한 개개인들의 성격, 신체특징, 혈액형 등 다양한 정보를 제공할 수 있다. 또한, 해당 Y-염색체 그룹에 기반한 해당 Y-염색체 그룹의 조상 아버지들의 이동, 정착 경로 등의 정보를 제공할 수 있다. 이러한 정보들은 어플리케이션과 웹을 통한 미디어를 활용하여 소정의 영상 정보를 제작하여 제공할 수도 있다.
상기 X-염색체 그룹화 단계(S140)는, Y-염색체 그룹에 속한 남성들의 상염색체, X-염색체 및 미토콘드리아 DNA의 유전변이를 파악하고, 파악된 유전변이분포의 패턴이 같거나 가장 유사한 상염색체, X-염색체 및 미토콘드리아 DNA 간을 조합하고, 조합된 상염색체, X-염색체 및 미토콘드리아 DNA을 X-염색체 그룹으로 규정하여 X-염색체 그룹 데이터베이스(20)에 저장할 수 있다. 이러한 X-염색체 그룹화 단계(S140)는 Y-염색체 그룹 데이터베이스(10)가 구축된 상태에서 해당 Y-염색체 그룹에 속한 사람들의 상염색체, X-염색체 및 미토콘드리아 DNA에 대한 유전적 정보를 기반으로 여성의 성씨를 찾도록 구성되며, 이에 대한 구성은 상술한 Y-염색체 그룹화 단계(S110)와 대동소이하게 이루어지므로, 이에 대한 상세한 설명은 생략한다.
상기 여성 유전적 성씨 결정 단계(S150)는, 여성 의뢰자의 X-염색체를 결정짓는 유전적 마커를 X-염색체 그룹 데이터베이스(20)에 저장된 각 X-염색체 그룹 내 X-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 의뢰자의 X-염색체와 가장 가까운 유전적 거리를 갖는 X-염색체 그룹의 성씨를 의뢰자의 유전적 성씨로 결정할 수 있다. 여성 유전적 성씨 결정 단계(S150) 또한, 상술한 남성 유전적 성씨 결정 단계(S120)와 대동소이하게 이루어지므로, 이에 대한 상세한 설명은 생략한다.
이에 따라, 남성 유전적 성씨 정보 제공 단계(130)는, 여성 유전적 성씨 결정 단계(S150)를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 의뢰자에게 제공할 수 있으며, 이를 위한 구성은 상술한 남성 유전적 성씨 정보 제공 단계(S130)의 동작 방식과 동일하게 이루어지므로, 이에 대한 상세한 설명은 생략한다.
본 발명의 실시예에 따르면, 남성 자신이 속한 Y-염색체 그룹과 그 밑의 세부 그룹을 정의하고, Y-염색체에서 생긴 유전변이의 정도를 정밀히 계산하여, 형제, 조상, 사촌, 5촌, 8촌 등 자신에게 가장 가까운 유전적 성씨를 유추하며, 남녀 모두에게 존재하는 상염색체, X-염색체 및 미토콘드리아 DNA의 변이 정보를 활용하여, Y-염색체 기반 유전자 성씨 그룹이 보유하고 있는 상염색체, X-염색체 및 미토콘드리아 DNA 정보와 여성의 상염색체, X-염색체 및 미토콘드리아 DNA 정보를 비교하여 여성의 유전적 성씨를 제공할 수 있다.

Claims (10)

  1. 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전변이를 파악하고, 파악된 유전변이를 기반으로 현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 일정 비율 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스에 저장하는 Y-염색체 그룹화부;
    남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 상기 Y-염색체 그룹 데이터베이스에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 남성 의뢰자의 Y-염색체와 가장 가까운 유전적 거리를 갖는 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 결정하는 남성 유전적 성씨 결정부; 및
    상기 남성 유전적 성씨 결정부를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 남성 의뢰자에게 제공하는 남성 유전적 성씨 정보 제공부를 포함하는 것을 특징으로 하는 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템.
  2. 제1 항에 있어서,
    상기 Y-염색체 그룹화부는,
    현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전정보를 분석하고, 유전정보가 분석된 Y-염색체의 서열을 대조하며, 대조결과로부터 Y-염색체의 유전변이를 검출하는 Y-염색체 유전변이 검출부;
    상기 Y-염색체 유전변이 검출부를 통해 검출된 유전변이를 상호 비교하여 Y-염색체의 지도 상 거리에 따라 Y-염색체를 결정짓는 마커를 지정하는 Y-염색체 마커 지정부; 및
    현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, Y-염색체의 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 전체 성씨의 1/3 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스에 저장하는 Y-염색체 클러스터링부를 포함하는 것을 특징으로 하는 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템.
  3. 제1 항에 있어서,
    상기 남성 유전적 성씨 결정부는,
    남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 상기 Y-염색체 그룹 데이터베이스에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 계산 결과에 따라 남성 의뢰자와 각 Y-염색체 그룹에 속한 성씨와의 유사도를 점수화하는 유전적 성씨 유사도 계산부; 및
    상기 유전적 성씨 유사도 계산부를 통해 남성 의뢰자의 Y-염색체와의 유사도 점수가 가장 높은 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 예측하는 유전적 성씨 예측부를 포함하는 것을 특징으로 하는 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템.
  4. 제1 항에 있어서,
    상기 남성 유전적 성씨 정보 제공부는,
    상기 남성 유전적 성씨 결정부를 통해 결정된 유전적 성씨에 속한 남성들 중 대중에게 알려진 인물에 대한 사회적 정보, 해당 유전적 성씨의 Y-염색체 그룹에서 발견되는 성씨에 속한 남성들의 과거 이동과 정착 경로 정보를 포함하는 역사적 정보, 해당 유전적 성씨에 속한 남성들의 성격을 포함하는 감성적 정보, 및 해당 유전적 성씨에 속한 남성들의 신체적 특징, 혈액형, 질환을 포함하는 신체적 정보를 제공하는 것을 특징으로 하는 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템.
  5. 제1 항에 있어서,
    상기 Y-염색체 그룹에 속한 남성들의 상염색체, X-염색체 및 미토콘드리아 DNA의 유전변이를 파악하고, 파악된 유전변이분포의 패턴이 같거나 가장 유사한 상염색체, X-염색체 및 미토콘드리아 DNA 간을 조합하고, 조합된 상염색체, X-염색체 및 미토콘드리아 DNA을 X-염색체 그룹으로 규정하여 X-염색체 그룹 데이터베이스에 저장하는 X-염색체 그룹화부; 및
    여성 의뢰자의 X-염색체를 결정짓는 유전적 마커를 상기 X-염색체 그룹 데이터베이스에 저장된 각 X-염색체 그룹 내 X-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 의뢰자의 X-염색체와 가장 가까운 유전적 거리를 갖는 X-염색체 그룹의 성씨를 의뢰자의 유전적 성씨로 결정하는 여성 유전적 성씨 결정부를 더 포함하고,
    상기 남성 유전적 성씨 정보 제공부는,
    상기 여성 유전적 성씨 결정부를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 의뢰자에게 제공하는 것을 특징으로 하는 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템.
  6. Y-염색체 그룹화부가, 현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전변이를 파악하고, 파악된 유전변이를 기반으로 현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 일정 비율 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스에 저장하는 Y-염색체 그룹화 단계;
    남성 유전적 성씨 결정부가, 남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 상기 Y-염색체 그룹 데이터베이스에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 남성 의뢰자의 Y-염색체와 가장 가까운 유전적 거리를 갖는 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 결정하는 남성 유전적 성씨 결정 단계; 및
    남성 유전적 성씨 정보 제공부가, 상기 남성 유전적 성씨 결정 단계를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 남성 의뢰자에게 제공하는 남성 유전적 성씨 정보 제공 단계를 포함하는 것을 특징으로 하는 게놈 정보를 이용한 유전적 성씨 정보 제공 방법.
  7. 제6 항에 있어서,
    상기 Y-염색체 그룹화 단계는,
    현대 및 과거의 각 지역 또는 국가의 남성들에 대한 Y-염색체의 유전정보를 분석하고, 유전정보가 분석된 Y-염색체의 서열을 대조하며, 대조결과로부터 Y-염색체의 유전변이를 검출하는 Y-염색체 유전변이 검출 단계;
    상기 Y-염색체 유전변이 검출 단계를 통해 검출된 유전변이를 상호 비교하여 Y-염색체의 지도 상 거리에 따라 Y-염색체를 결정짓는 마커를 지정하는 Y-염색체 마커 지정 단계; 및
    현대 및 과거 별 각 남성들에 대한 Y-염색체를 그룹화하되, Y-염색체의 유전변이에 따라 그룹화되는 남성들의 특정 성씨가 전체 성씨의 1/3 이상인 경우 해당 그룹을 Y-염색체 그룹으로 규정하여 Y-염색체 그룹 데이터베이스에 저장하는 Y-염색체 클러스터링 단계를 포함하는 것을 특징으로 하는 게놈 정보를 이용한 유전적 성씨 정보 제공 방법.
  8. 제6 항에 있어서,
    상기 남성 유전적 성씨 결정 단계는,
    남성 의뢰자의 Y-염색체를 결정짓는 유전적 마커를 상기 Y-염색체 그룹 데이터베이스에 저장된 각 Y-염색체 그룹 내 Y-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 계산 결과에 따라 남성 의뢰자와 각 Y-염색체 그룹에 속한 성씨와의 유사도를 점수화하는 유전적 성씨 유사도 계산 단계; 및
    상기 유전적 성씨 유사도 계산 단계를 통해 남성 의뢰자의 Y-염색체와의 유사도 점수가 가장 높은 Y-염색체 그룹의 성씨를 남성 의뢰자의 유전적 성씨로 예측하는 유전적 성씨 예측 단계를 포함하는 것을 특징으로 하는 게놈 정보를 이용한 유전적 성씨 정보 제공 방법.
  9. 제6 항에 있어서,
    상기 남성 유전적 성씨 정보 제공 단계는,
    상기 남성 유전적 성씨 결정 단계를 통해 결정된 유전적 성씨에 속한 남성들 중 대중에게 알려진 인물에 대한 사회적 정보, 해당 유전적 성씨의 Y-염색체 그룹에서 발견되는 성씨에 속한 남성들의 과거 이동과 정착 경로 정보를 포함하는 역사적 정보, 해당 유전적 성씨에 속한 남성들의 성격을 포함하는 감성적 정보, 및 해당 유전적 성씨에 속한 남성들의 신체적 특징, 혈액형, 질환을 포함하는 신체적 정보를 제공하는 것을 특징으로 하는 게놈 정보를 이용한 유전적 성씨 정보 제공 방법.
  10. 제6 항에 있어서,
    X-염색체 그룹화부가, 상기 Y-염색체 그룹에 속한 남성들의 상염색체, X-염색체 및 미토콘드리아 DNA의 유전변이를 파악하고, 파악된 유전변이분포의 패턴이 같거나 가장 유사한 상염색체, X-염색체 및 미토콘드리아 DNA 간을 조합하고, 조합된 상염색체, X-염색체 및 미토콘드리아 DNA을 X-염색체 그룹으로 규정하여 X-염색체 그룹 데이터베이스에 저장하는 X-염색체 그룹화 단계; 및
    여성 유전적 성씨 결정부가, 여성 의뢰자의 X-염색체를 결정짓는 유전적 마커를 상기 X-염색체 그룹 데이터베이스에 저장된 각 X-염색체 그룹 내 X-염색체의 유전적 마커와 매핑하여 유전적 거리를 계산하고, 의뢰자의 X-염색체와 가장 가까운 유전적 거리를 갖는 X-염색체 그룹의 성씨를 의뢰자의 유전적 성씨로 결정하는 여성 유전적 성씨 결정 단계를 더 포함하고,
    상기 남성 유전적 성씨 정보 제공 단계는,
    상기 여성 유전적 성씨 결정 단계를 통해 결정된 유전적 성씨를 갖는 현대 또는 과거의 남성들의 사회적 정보, 역사적 정보, 감성적 정보 및 신체적 정보 중 적어도 하나를 포함하는 유전적 성씨 정보를 의뢰자에게 제공하는 것을 특징으로 하는 게놈 정보를 이용한 유전적 성씨 정보 제공 방법.
PCT/KR2019/017532 2019-12-06 2019-12-12 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방법 WO2021112319A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/746,753 US20220277806A1 (en) 2019-12-06 2022-05-17 System and method for providing genetic surname information by using genomic information

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020190161750A KR102151716B1 (ko) 2019-12-06 2019-12-06 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방법
KR10-2019-0161750 2019-12-06

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/746,753 Continuation-In-Part US20220277806A1 (en) 2019-12-06 2022-05-17 System and method for providing genetic surname information by using genomic information

Publications (1)

Publication Number Publication Date
WO2021112319A1 true WO2021112319A1 (ko) 2021-06-10

Family

ID=72470859

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/017532 WO2021112319A1 (ko) 2019-12-06 2019-12-12 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방법

Country Status (3)

Country Link
US (1) US20220277806A1 (ko)
KR (1) KR102151716B1 (ko)
WO (1) WO2021112319A1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1439723A (zh) * 2003-02-24 2003-09-03 尹国兴 运用y染色体鉴定技术检测姓氏的方法
KR20090105921A (ko) * 2006-11-30 2009-10-07 네이비제닉스 인크. 유전자 분석 시스템 및 방법
KR20170093511A (ko) * 2016-02-05 2017-08-16 사회복지법인 삼성생명공익재단 추정 자손의 유전질환 발병 위험성을 예측하는 방법 및 시스템

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110136638A (ko) * 2010-06-15 2011-12-21 재단법인 게놈연구재단 게놈정보를 이용하여 온라인 상의 사회적 네트워크를 형성하는 시스템 및 그 형성방법
KR102082360B1 (ko) 2013-07-08 2020-02-27 에스케이텔레콤 주식회사 염색체 구조변이 검출 장치 및 이의 제조방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1439723A (zh) * 2003-02-24 2003-09-03 尹国兴 运用y染色体鉴定技术检测姓氏的方法
KR20090105921A (ko) * 2006-11-30 2009-10-07 네이비제닉스 인크. 유전자 분석 시스템 및 방법
KR20170093511A (ko) * 2016-02-05 2017-08-16 사회복지법인 삼성생명공익재단 추정 자손의 유전질환 발병 위험성을 예측하는 방법 및 시스템

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LG SCIENCE LAND: "Can genetic analysis reveal the surname of the perpetrator?", SCIENCE STORY, 25 January 2010 (2010-01-25), XP055832073, Retrieved from the Internet <URL:http://lg-sl.net/product/scilab/sciencestorylist/ALL/readSciencestoryList.mvc?sciencestoryListId=INSC2010010004> *
YOU SUN AH: "Y chromosomal DNA polymorphismsbased on sumames in the Korean population", THESIS, April 1998 (1998-04-01), Chungnam National University, pages 1 - 133 *

Also Published As

Publication number Publication date
KR102151716B1 (ko) 2020-09-04
US20220277806A1 (en) 2022-09-01

Similar Documents

Publication Publication Date Title
Butt et al. Deep learning system to screen coronavirus disease 2019 pneumonia
Bouillon et al. Trauma score systems: Cologne validation study
Debouverie et al. Increasing incidence of multiple sclerosis among women in Lorraine, Eastern France
Chumachenko On intelligent multiagent approach to viral hepatitis B epidemic processes simulation
Shekhar et al. Diversification of multipotential postmitotic mouse retinal ganglion cell precursors into discrete types
Deng et al. Geographic difference shaped human ocular surface metagenome of young Han Chinese from Beijing, Wenzhou, and Guangzhou cities
CN112216402A (zh) 基于人工智能的疫情预测方法、装置、计算机设备及介质
Afzal et al. Clustering of COVID-19 data for knowledge discovery using c-means and fuzzy c-means
Brashear et al. Population genomics identifies a distinct Plasmodium vivax population on the China-Myanmar border of Southeast Asia
WO2021137539A1 (ko) 유전자 정보 개인 맞춤형 소셜 컨텐츠 정보 제공 시스템 및 그 방법
WO2021091348A1 (ko) 신약 재창출 후보 선정 방법 및 장치
CN111081379A (zh) 一种疾病概率决策方法及其系统
WO2021112319A1 (ko) 게놈 정보를 이용한 유전적 성씨 정보 제공 시스템 및 방법
Fagundes et al. Genetic, geographic, and linguistic variation among South American Indians: possible sex influence
Tu et al. Modeling and multi-objective optimal control of reaction-diffusion COVID-19 system due to vaccination and patient isolation
Li et al. Basic fallacies in the formulation of the paternity index.
Cavallaro et al. Suggesting Just Enough (Un) Crowded Routes and Destinations.
Huang et al. SySAP: a system-level predictor of deleterious single amino acid polymorphisms
da Silva Carvalho et al. Outcome of sex determination from ulnar and radial ridge densities of Brazilians’ fingerprints: applying an existing method to a new population
Winther Race and biology
WO2019107840A1 (ko) 인공지능 기반의 보험금 부당청구 탐지 장치 및 방법
CN114937165A (zh) 一种类簇合并方法、装置、终端及计算机可读存储介质
Siregar et al. Analysis of the Naïve Bayes Method for Determining Social Assistance Eligibility Public
Stacey Family and household
Kluzer et al. Milo2. 0 unlocks population genetic analyses of cell state abundance using a count-based mixed model

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19954975

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 19954975

Country of ref document: EP

Kind code of ref document: A1