WO2020251249A1 - 영유아의 장내 미생물 불균형도를 탐지하는 방법 - Google Patents

영유아의 장내 미생물 불균형도를 탐지하는 방법 Download PDF

Info

Publication number
WO2020251249A1
WO2020251249A1 PCT/KR2020/007494 KR2020007494W WO2020251249A1 WO 2020251249 A1 WO2020251249 A1 WO 2020251249A1 KR 2020007494 W KR2020007494 W KR 2020007494W WO 2020251249 A1 WO2020251249 A1 WO 2020251249A1
Authority
WO
WIPO (PCT)
Prior art keywords
group
stage
infant
development
intestinal
Prior art date
Application number
PCT/KR2020/007494
Other languages
English (en)
French (fr)
Inventor
오현석
민의기
김남일
Original Assignee
주식회사 천랩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 천랩 filed Critical 주식회사 천랩
Priority to US17/617,667 priority Critical patent/US20220293275A1/en
Publication of WO2020251249A1 publication Critical patent/WO2020251249A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Definitions

  • the present invention relates to a method of detecting the intestinal microbial imbalance of infants and young children by analyzing samples and/or meta data of infants and young children, and a method of improving the intestinal microbial imbalance of infants and toddlers obtained by the detection method.
  • Intestinal microbes are related to human immunity and nutrient absorption, and by controlling the secretion of cortisol, the stress hormone, affects mood and mental problems. Intestinal microbes change according to dietary habits and host conditions, and are formed differently for each individual.
  • Human gut microbes begin to form from the moment a human is born, and play an important role in immunity, metabolism, and nutrition in the early stages of life.
  • the composition of intestinal microflora of infants and toddlers is clearly distinguished from that of adults, and gradually shows a community structure similar to that of adult intestinal microbes through the feeding period, baby food, and general diet.
  • the main factors that have a great influence on the intestinal microflora of infants and toddlers are the form of delivery such as natural delivery or cesarean section, and whether antibiotics are administered.
  • Intestinal microbial imbalance is a term that refers to a condition in which the intestinal microbial ecosystem is unbalanced, and research showing that intestinal microbial imbalance is directly or indirectly related to modern diseases such as inflammatory bowel disease, obesity, diabetes, and autism is increasing recently. Intestinal microbial imbalance is known to be caused by factors such as indiscriminate intake of processed foods and antibiotics.
  • Investigation of the imbalance of microbial intestinal microbiota in infants and toddlers using a database including data and/or meta data in the intestinal microbes of infants and toddlers can be said to be an essential research topic for interactions with the human body such as physiological functions of intestinal microbes or immune functions.
  • the present invention constructed a database of intestinal microbial communities in infants and young children analyzed by a non-culture analysis method, and conducted a study to search for a meaningful pattern by considering together various meta data that are indicators of intestinal microbial imbalance.
  • machine learning that is effective in analyzing large amounts of data, the stage of infant development, the state of intestinal microbial imbalance in infants and young children, and indicator species of intestinal microbial imbalance in infants and young children were defined from the viewpoint of intestinal microflora.
  • An example of the present invention is to provide a method of detecting or analyzing the degree of microbial imbalance in the intestine of infants and young children by using the analysis of the intestinal microbial community of infants and toddlers.
  • a microbial biomarker that detects the degree of microbial imbalance in the intestine of infants and toddlers may be used to analyze the intestinal microbial community of infants and toddlers.
  • An example of the present invention is to provide a method of detecting or analyzing the degree of microbial imbalance in the intestine of infants and young children by using the analysis of the intestinal microbial community of infants and toddlers.
  • a microbial biomarker that detects the degree of microbial imbalance in the intestine of infants and toddlers may be used to analyze the intestinal microbial community of infants and toddlers.
  • a further example of the present invention is to provide a composition or kit for detecting the degree of microbial imbalance in the intestine of infants and toddlers and/or the stage of intestinal development, comprising a microbial biomarker for detecting the degree of microbial imbalance in the intestine of infants and toddlers or an agent for detecting the biomarker.
  • a further example of the present invention is to provide a composition or kit for detecting the intestinal maturity of infants and toddlers using intestinal microbes, including a microbial biomarker for detecting the degree of microbial imbalance in the intestine of infants and young children, or an agent for detecting the biomarker.
  • a further example of the present invention relates to a method of improving the intestinal microbial imbalance in infants and young children obtained above, or to a method of increasing the maturity of intestinal microorganisms in infants and toddlers. It is to provide a kit for discriminating or predicting the risk of microbial imbalance in the intestine of infants and young children comprising an agent for detecting the biomarker.
  • the present invention is to provide a biomarker for discriminating or predicting risk in the intestinal microbial imbalance of infants and toddlers having an accuracy of the genus or species level by culture-independent methods (CIMs).
  • CCMs culture-independent methods
  • the present invention relates to a method for discriminating or predicting the risk of microbial imbalance in the intestine of infants and young children by utilizing the analysis of microbial community in the intestine of infants and toddlers, and accordingly, including an additional treatment step for resolving the intestinal microbial imbalance, it is possible to improve the growth state of infants and toddlers. It's about how.
  • information capable of diagnosing the intestinal microbial imbalance and growth state of infants and toddlers may be provided by analyzing the intestinal microbial community of infants and toddlers.
  • infant and infant period is the time when the intestinal microbial environment is created, the microbial community constantly changes, and the balance of the environment of the intestinal microbes is adhered to. Therefore, unlike adults, the determination of whether or not the balance or imbalance of the intestinal microbial community of infants and children should be established in consideration of various factors. Therefore, the present invention is to detect the intestinal microbial imbalance or development status of infants and toddlers using the intestinal microbial community in order to detect the balance or development status of the intestinal microorganisms of infants and toddlers, more preferably metadata information of infants and toddlers, For example, age, diet, delivery method. It can be detected by combining information such as antibiotic administration history.
  • an imbalance group of intestinal microorganisms or imbalance of intestinal microorganisms in infants and children refers to a sample group having a population of intestinal microorganisms that has a positive correlation to the imbalance of intestinal microorganisms or is associated with meta data that contributes to or causes the imbalance of intestinal microorganisms.
  • Means, and the term “balance group” means a sample group having an intestinal microbial community that has a positive correlation with the balance of intestinal microbes or is associated with meta data that contributes or causes the balance of intestinal microbes.
  • meta-data related to intestinal microbial imbalance are diarrhea, cesarean section, taking antibiotics, and formula feeding, which are known to cause intestinal microbial imbalance.
  • the sample group that is distinct from the intestinal microbial imbalance-related group can be defined as a group related to the balance of intestinal microflora since it is related to breastfeeding and natural delivery.
  • the infant development stage can be determined by one or more criteria selected from the group consisting of dietary stage, age, and infant development index (based on the information of the intestinal microbial community), and the infant development index uses a development stage-specific biomarker.
  • the development index is calculated by analyzing the species of microbial biomarkers specific to each developmental stage and the ratio (occupancy) of these species to the intestinal flora, and using accuracy, sensitivity and specificity.
  • the cut-off value of is set, the case below the set value is selected as development stage 1, and the case above the set value is selected as development stage 2.
  • an example of a microbial biomarker specific to the development stage of infants and toddlers is described in Tables 10 and 11 below, and the biomarkers specific to the development stage 1 of infants and toddlers are listed in Tables 10 and 11, and biomarkers specific to the development stage 2 are described in Tables 12 and 13 below.
  • the term "imbalance of intestinal microbes" of the infant and toddler refers to whether the intestinal microbial community environment (balance of intestinal microbes) is close to the intestinal microbial community environment (balance of intestinal microbes) suitable for the growth rate of infants and toddlers, or the state of development of the intestinal microbial community. Accordingly, it is intended to detect the imbalance of the intestinal microbial community of infants and toddlers according to the present invention to determine the developmental state of the intestinal microbial community of infants and toddlers, and to achieve a balance of the intestinal microbial community at an appropriate rate according to the growth rate of the child.
  • the distinction between the imbalance group and the balance group in the intestinal microbial community of infants and toddlers according to the present invention can be performed using a biomarker specific for the imbalance group for each development stage and a biomarker for the balance group for each development stage.
  • biomarkers specific to the balance group at development stage 1 are shown in Tables 29 and 30, and the tree diagram of Fig. 10, and the biomarkers specific for the imbalance group at development stage 1 are shown in Tables 33 and Table 34 and the line diagram of Fig. 11 .
  • biomarkers specific to the balance group at development stage 2 are shown in Tables 31, 32, and 12, and the biomarkers specific for the imbalance group at development stage 2 are shown in Tables 35, 36, and 13.
  • the microbiota age indicates the maturity of the intestinal microbial community according to the growth rate of a child, and for example, it can be expressed as the balance or imbalance of the intestinal microbial community by age of infants and toddlers.
  • the microbial diversity represents the diversity of the types of microorganisms in the intestine, and can be expressed as the diversity of the types of microorganisms present in the intestine.
  • Beneficial microorganisms refer to the distribution of microorganisms that positively affect the growth of infants and toddlers. Lack of the development of beneficial microorganisms in the gut microbiota increases the risk of developing disease. Lactobacillus helps digestion in the early intestinal microbial community, contributes to nutrient absorption, and strengthens immunity. When the intestinal microbial community finds stability, it disappears and the ratio decreases.
  • the method for detecting microbial imbalance in the intestine of infants and toddlers may include the following steps:
  • step (C) Based on at least one information selected from the group consisting of the level of the intestinal microbial community in step (A) and the metadata information in step (B), the development stage of the intestinal microbial community is determined according to the criteria for classifying the developmental stage of the standard infant and toddler. Selecting, and
  • (A) of the method for detecting microbial imbalance in the intestinal tract of infants and toddlers in the present invention Species distinguished by the species level related to the intestinal microbial community of infants and toddlers to be tested, and the intestinal microbial community to obtain the occupancy ratio of these species.
  • information on the microbial community of the test subject can be obtained by various methods, for example
  • a sample to be tested such as Obtaining genomic DNA of intestinal microorganisms from a stool sample
  • test subject may be an infant, and in the present invention, the term "infant and infant” means a newborn or infant under 36 months of age.
  • the total feces of infants and toddlers to be tested were collected through the legal representation of each infant and toddler by selecting infants and toddlers over 4 weeks old to 3 years old (36 months). 120 samples were collected.
  • the stool sample of the test subject was collected by being immersed in a buffer solution to prevent the mutation of microorganisms.
  • the buffer was composed of 4% (w/v) Sodium Dodecyl Sulfate (SDS), 50mM Tris-HCl, 50mM EDTA and 500mM NaCl.
  • the step of obtaining DNA from the collected feces sample may be accomplished by culture-independent methods (CIMs).
  • CCMs culture-independent methods
  • the step of obtaining the 16S rRNA genetic information may be a step of analyzing the 16S rRNA gene sequence of the extracted DNA using a next-generation genome sequencing (NGS) platform.
  • NGS next-generation genome sequencing
  • the step of analyzing the 16S rRNA gene sequence of the extracted DNA is a step of performing PCR using a primer set capable of specifically amplifying a variable region of 16S rRNA, preferably V3 of 16S rRNA.
  • a primer set capable of specifically amplifying a variable region of 16S rRNA preferably V3 of 16S rRNA.
  • An exemplary sequence of the universal primer is as follows:
  • Reverse universal primer (SEQ ID NO: 162): 5'-GACTACHVGGGTATCTAATCC -3'
  • the analysis system http://www.ezbiocloud.com may be a step of analyzing microbial community information from a phylum to a species level. If the results of the next-generation genome sequencing technique are the same, the method for analyzing cluster information is not limited to Eztaxon and EasyBioCloud analysis systems.
  • the microbial marker may be selected based on a ratio of the number of times that each microbe is determined as a microbe specific to a specific development stage among the total number of iterations as a result of bootstrap repetition for performing the machine learning.
  • a verification step excluding the corresponding microbial marker may be further included.
  • the microbial marker may be a microorganism containing 16S rRNA consisting of any one of the nucleotide sequences of SEQ ID NOs: 1 to 160.
  • the step of analyzing the microbial community may include analyzing the analyzed 16S rRNA gene sequence using a database of 16S rRNA gene sequences of standard strains and non-cultured microorganisms, and any one of the base sequences of SEQ ID NOs: 1 to 160 Analyzing a population of a microbial biomarker having a sequence may be included.
  • the step of analyzing the microbial community is to identify the entire microbial community by confirming the presence or absence of microorganisms including the 16S rRNA of SEQ ID NOs: 1 to 160 provided in the present invention and analyzing the size of the population only for microorganisms whose existence has been confirmed. Rather, it can save time and labor required for discrimination of intestinal microbial imbalance in infants and young children and predict prognosis.
  • Analyzing the microbial community may include identifying and classifying microbes at the genus or species level using the 16S rRNA database and/or analyzing the size of each microbial community.
  • the database used for the identification and classification of the microorganisms may be appropriately selected and used by a person skilled in the art as necessary, and for example, may be one or more databases selected from the group consisting of EzBioCloud, SILVA, RDP, and Greengene, but is limited thereto. It is not.
  • the size of the microbial community may be expressed as a ratio (%) of a specific microbial community to the total intestinal microbial flora.
  • the percentage (%) occupied by the microbial community may be expressed as a percentage of the frequency of the number of 16S rRNA reads of a specific microorganism among the total number of sequencing reads.
  • the specific microorganism may be a microbial biomarker for discrimination or prediction of microbial imbalance in the intestine of infants and young children provided by the present invention.
  • the method of providing information on discrimination or prediction of intestinal microbial imbalance in infants and toddlers of the present invention includes the step of (B) collecting metadata including items related to intestinal microbial imbalances from test infants.
  • the collecting step of the meta data may be performed at the same time and/or at the same time as collecting the feces sample of the test subject in the (A-1) step.
  • the metadata may be collected without limitation and used for analysis as long as it is a factor for determining the developmental stage, health status, and/or intestinal microbial imbalance of infants and toddlers.
  • the dietary type information is one from the group consisting of information on whether to consume a diet containing lactic acid bacteria, information on intake of fermented food, or information on intake of non-fermented health functional foods or non-fermented foods. It may be the above information, but is not limited thereto.
  • meta data related to intestinal microbial imbalance information was collected using various questionnaire items.
  • the answers of all survey items to the questionnaire items containing factors that may affect the intestinal microbial imbalance are attached to the 16S rRNA sequence data analyzed above, and stored. Or, it may be a step of making a database.
  • the specific questionnaire consists of three types of questionnaire A (nursing), B (reason), and C (general) so that the questionnaire can be filled out with the diet type that corresponds to the sample collection among lactation, baby food, baby food and general food.
  • the questionnaire type was selected based on the judgment of the legal representative of the infants to be studied.
  • the questionnaire items consisted of delivery method, feeding method, baby food, type of baby food and general food, and stool type.
  • the specific questionnaire items are shown in Table 2.
  • step (C) Based on at least one information selected from the group consisting of the level of the intestinal microbial community in step (A) and the metadata information in step (B), the development stage of the intestinal microbial community is determined according to the criteria for classifying the developmental stage of the standard infant and toddler. Steps to select
  • the method of selecting the criteria for classifying the test infants' developmental stages may be determined by one or more criteria selected from the group consisting of dietary stage, age, and infant development index (based on information on intestinal microbial communities).
  • the biomarkers in Tables 10 to 13 are used as biomarkers that are secondarily selected as biomarkers for dividing the stage of development of the intestinal microbial community of infants and toddlers.
  • Table 14 below summarizes the method of determining the development stage according to the criteria for determining each development stage.
  • the method of selecting the development stage of the test infant and the developmental stage-specific biomarker includes applying the 16S rRNA analysis result collected from the feces of the test infant to an infant and infant intestinal microbial development stage prediction model, and calculating the infant development index. do.
  • the criteria for classifying the stage of development of infants and toddlers are:
  • step (C') based on at least one information selected from the group consisting of the degree of intestinal microbial community in step (A') and metadata information in step (B'), determining a criterion for classifying the developmental stage of the reference infant and child. do.
  • the step of determining the criteria for classifying the development stage of the reference infant and child in step (C') may be performed using one or more selected from the group consisting of the dietary stage, age, and development stage-specific microbial biomarkers of the reference infant. .
  • the criteria for classifying the developmental stage of the standard infant and child may be a solid diet, whether the child has passed 15 months of age or whether the infant development index 1.19 is satisfied.
  • the diet that infants and toddlers ingest is classified into liquid feeding food, gel baby food, solid baby food and solid general diet, and liquid based on the infant's metadata information (diet).
  • This is a method of classifying the stage of feeding lactation or gel-like baby food into development stage 1, and the stage of ingesting a solid diet, that is, baby food or general food, into development stage 2. Therefore, the time point of ingesting a solid diet from a liquid or gel lactating or baby food is taken as a criterion.
  • the developmental stage In the case of determining the developmental stage based on the number of months after birth (monthly age), based on the infant's metadata information (the infant's month age), if the age of the infant to be investigated is less than 15 months, it is the developmental stage 1, and the age is 15 months or more. The case is determined as developmental stage 2.
  • a criterion of 15 months was defined through the time when the dietary form was converted from the gel to the solid and the time when the group was classified through the DMM clustering method of Example 4-2. Accordingly, the standard 15 months defined by the above method means that the dietary stage is the most distinct time period, and the time when the type of microorganisms in the intestinal microbial community and the occupancy rate of each microorganism change the most.
  • microbe that contributes to immunity, digestion of breast milk, and stabilization of the intestine immediately after birth is the main type of microbe, and the diversity of microbial species has increased significantly from 15 months, and the type of microbe related to the metabolism of various foods such as dietary fiber. Is the main.
  • the infant development index based on the collected intestinal microbial cluster analysis data, the species of microbial biomarkers specific to each developmental stage and the ratio (occupancy) of these microbial species in the intestinal flora were analyzed and described above. It is a method to determine the developmental stage by applying it to a predictive model of the early childhood development stage.
  • the biomarker specific for development stage 1 is at least one selected from the group consisting of the strains listed in Table 10 and Table 11 above.
  • the biomarker specific for the developmental stage 2 may be at least one selected from the group consisting of the strains described in Tables 12 and 13 above.
  • the development index is calculated by analyzing the species of microbial biomarkers specific to each developmental stage and the ratio (occupancy) of these species in the intestinal flora, and the cut-off value of the development index using accuracy, sensitivity and specificity Is set, and the case below the set value is selected as development stage 1, and the case above the set value is selected as development stage 2.
  • the step of determining the criteria for classifying the developmental stage of the standard infant and child includes the species of specific microbial biomarkers in the developmental stages 1 to 2 of the infant and the infant and the ratio (occupancy) of these species in the intestinal flora. Analysis is performed to calculate the infant development index, and the cut-off value of the infant development index is set using accuracy, sensitivity, and specificity. If it is less than the set value, it is selected as developmental stage 1, and if it is above the set value, developmental stage 2 It is to select as.
  • the infant development index is calculated by analyzing the species of microbial biomarkers specific to the development stage of the test subject and the intestinal flora (occupancy) of these species.
  • the cut-off value which is the criterion for classifying the development stage of the standard infant and toddler, as the development stage 1, and the case above the set value as the development stage 2 It may be to select.
  • the answer to the questionnaire in the form including the items in Table 2 should be preceded.
  • the intestinal microbial analysis using the method of Example 2 should be preceded.
  • the microbial ecosystem in the intestine of infants and toddlers is formed by microbes residing in the parent and the surrounding environment are transferred to and settled in a sterile newborn, and species abundance and diversity in the intestine of infants and toddlers increase according to the growth and diet of infants and toddlers.
  • biomarkers specific to the stage of infant and toddler development specifically indicate the developmental pattern of the intestinal microbial ecosystem according to the growth of infants and toddlers. Biomarkers specific for developmental stage 1 of infants and toddlers are described in Tables 10 and 11, and biomarkers specific for developmental stage 2 are described in Tables 12 and 13 above.
  • the infant development index may be calculated and performed using the following equations 4 to 7:
  • the method of selecting whether or not the test infants have intestinal microbial imbalance is performed using a biomarker specific for the imbalance group at each stage of development and a biomarker specific for the balance group at each stage of development according to the stage of development of the test infant determined above.
  • the distinction between the imbalance group and the balance group in the intestinal microbial community of infants according to the present invention can be performed using a biomarker specific for the imbalance group for each development stage and a biomarker for the balance group for each development stage.
  • the biomarkers specific to the balance group at development stage 1 are shown in Tables 29 and 30, and the tree diagram of Fig. 10, and the biomarkers specific for the imbalance group at development stage 1 are shown in Tables 33 and Table 34 and the line diagram of Fig. 11 .
  • the balance group-specific biomarkers of development stage 2 are shown in Tables 31 and 32 in the system diagram of Fig. 12, and the imbalance group-specific biomarkers of development stage 2 are shown in Tables 35 and Tables 36 and Fig. 13.
  • the infant and toddler intestinal microbial imbalance prediction model may be to provide a parameter for calculating the infant and toddler imbalance index of a test subject by comparing the size of the intestinal microbial community of the microbial biomarker for predicting the intestinal microbial imbalance and/or intestinal balance of the infant and toddler with a database.
  • the infant and toddler intestinal microbial imbalance prediction model is by substituting a list of biomarkers and coefficient values specific to the infant and toddler intestinal microbial imbalance group and/or balance group detected in the test subject to a machine learning function and an indexing equation (Equations 1 to 7 below). It may be to calculate the infant and infant imbalance index for an unknown sample and use it for the determination and/or prediction of microbial imbalance in the infant and infant intestine.
  • the database may be to utilize the intestinal flora database of a sample group of infants and young children collected for microbial biomarker identification, and specifically, recruitment for infants and toddlers over 4 weeks old to 3 years old (36 months) or less specified by the WHO. It could be a microbiome database in the human gut.
  • the infant and toddler gut microbial imbalance prediction model uses machine learning to select microbial biomarkers specific to the gut microbial imbalance group and/or the gut balance group, and calculate the gut microbial imbalance index in the infant and toddler for discrimination of microbial imbalance in the gut. It is characterized in that it is possible to determine the microbial imbalance in the intestine of infants and young children.
  • the step of indexing the microbial community analysis result is to substitute a machine learning function and an indexing equation (Equations 1 to 7 below) and use the microbial marker and the coefficient value of the marker to determine the microbial imbalance in the intestine of infants and toddlers. It may include a process of calculating.
  • the step (D') of the reference infants and toddlers further comprises the step of selecting the criteria for determining the disproportionate group for the developmental stages, wherein the step ( In D'), the criteria for determining the imbalance group by developmental stage are determined by analyzing the species of microbial biomarkers specific to the balance group or the imbalance group in each developmental stage of the reference infant and toddler and the ratio (share) of these species in the intestinal flora. It may be to calculate the index, set the cut-off value of the imbalance judgment index using accuracy, sensitivity, and specificity, select a balance group if it is less than a set value, and select a balance group if it is more than a set value. .
  • Determining whether or not the test subject is an infantile intestinal microbial imbalance may include determining a position of the index on the infant and infant intestinal microbial imbalance index distribution in the entire database.
  • the infant microbial imbalance index can be determined that the prognosis of the intestinal microbial imbalance is improved as it is included in or closer to the balance section in the distribution of the microbial imbalance index in the intestine of the entire database.
  • the entire database may be, for example, a database of intestinal microbial imbalance index in infants and young children of all samples including a training set, a test set, and a test target sample used in constructing the predictive model, but is not limited thereto.
  • the species of microbial biomarkers specific to the balance group or imbalance group at each developmental stage of the test subject infants and toddlers and the ratio of these species in the intestinal flora Analyze (occupancy) to calculate the imbalance determination index In the step of determining whether the intestinal microbial community is imbalanced or balanced, the species of microbial biomarkers specific to the balance group or imbalance group at each developmental stage of the test subject infants and toddlers and the ratio of these species in the intestinal flora Analyze (occupancy) to calculate the imbalance determination index
  • the cut-off value criterion which is the classification criterion for the criteria for determining the imbalance of infants and children to be tested
  • a balance group is selected, and a case above the set value is selected as an imbalance group. It can be.
  • the imbalance determination index may be calculated and performed using the following equations 4 to 7:
  • the intestinal microbial imbalance index in infants and toddlers may be displayed by dividing the distribution section of the intestinal microbial imbalance index in infants and toddlers into at least two or more sections, preferably divided into three sections: appropriate, fast, and slow depending on the developmental stage. I can.
  • the division of the section may be divided based on a value having the highest specificity of the intestinal imbalance index of the infant and toddler.
  • the imbalance and balance stages were classified based on the intestinal imbalance index in infants and toddlers, respectively, and the lower 0 to 70% by development stage were balanced, and 70 to 100% were the imbalance stage. Classified.
  • the lower 0 to 70% is appropriate, 70 to 100% is the'fast' stage, in the developmental stage 2, the lower 0 to 70% is appropriate, and 70 to 100% is the'slow' stage. I did.
  • the'fast' and'slow' stages indicate that the intestinal imbalance-specific biomarkers appearing in development stage 1 are microorganisms mainly appearing in the development stage 2, and the intestinal imbalance-specific biomarkers appearing in development stage 2 are the development stages. It was defined through the fact that they are the microorganisms mainly appearing in 1.
  • the method of providing information on the prediction of intestinal microbial imbalance in infants and toddlers of the present invention may further include monitoring a change in microbial imbalance index in the intestinal microbial imbalance of a test subject over time.
  • the step of monitoring the change in the intestinal microbial imbalance index of infants and toddlers over time may be to determine that the prognosis is good as the distribution interval of the intestinal microbial imbalance index of infants and toddlers is closer to the lower 0% over time.
  • the method for detecting the intestinal microbial imbalance of infants and toddlers of the present invention further includes prebiotics, probiotics, and drugs according to the group determined in the step (E) determining whether or not the intestinal microbial community of the test infant is imbalanced. , Diet, and lifestyle suggestions, etc., by performing at least one treatment selected from the group consisting of, to perform steps for achieving a balance of intestinal microflora, including the step of improving intestinal imbalance of infants and young children or improving intestinal maturity.
  • prebiotics, probiotics, and drugs according to the group determined in the step (E) determining whether or not the intestinal microbial community of the test infant is imbalanced. , Diet, and lifestyle suggestions, etc., by performing at least one treatment selected from the group consisting of, to perform steps for achieving a balance of intestinal microflora, including the step of improving intestinal imbalance of infants and young children or improving intestinal maturity.
  • I can.
  • the probiotics or prebiotics may determine the type and content of microorganisms using the stage of development of the intestinal microorganisms of the test object and the degree of imbalance of the intestinal microorganisms.
  • Examples of the probiotics may include marker microorganisms of the intestinal microbial balance group of the reference infant and toddler population according to the stage of development of the intestinal microflora of infants and toddlers, and specifically, the development shown in Tables 29 and 30 when the test subject is analyzed as developmental stage 1.
  • the test subject is analyzed as developmental stage 2 and contains at least one type of biomarker microorganism specific to the balance group of stage 1, at least one biomarker specific biomarker microbe of the balance group of development stage 2 shown in Table 31 and Table 32 Can include.
  • the prebiotics when the test subject is analyzed as developmental stage 1, increase the relative abundance of at least one of the balance group-specific biomarker microorganisms of the developmental stage 1 shown in Tables 29 and 30 and/or table It may contain a substance that achieves a reduction of at least one of the biomarker microorganisms specific to the imbalance group of developmental stage 1 shown in 33 and Table 34.
  • the prebiotics increase the relative abundance of at least one biomarker microorganism specific to the balance group of developmental stage 2 shown in Tables 31 and 32 and/or Table 35 And a substance that reduces the relative abundance (relative occupancy ratio) of one or more kinds of imbalanced group-specific biomarker microorganisms of development stage 2 shown in Table 36.
  • the procedure for providing an infant and toddler intestinal microbial imbalance index using a biomarker specific for the intestinal microbial imbalance group and/or the intestinal balance group of the present invention and an infant and toddler intestinal microbial imbalance prediction model using the same may be performed through the following steps.
  • NGS next generation genome sequencing
  • the predicted result of microbial imbalance in the intestine of infants and toddlers may be indexed and provided as an analysis report.
  • the analysis report may include the following information.
  • the analysis report may indicate a description and ratio of representative microorganisms among microorganisms corresponding to microbial imbalance biomarkers in the intestine of infants and young children.
  • the intestinal microbial imbalance in infants and young children can be discriminated based on the results of the intestinal microbial analysis through an infant dysbiosis biomarker provided by the present invention.
  • the present invention provides a kit for determining the intestinal microbial imbalance in infants and young children and the intestinal microbial imbalance in infants and young children using the same, or a method for predicting intestinal microbial imbalance, or for determining the intestinal microbial imbalance in infants and young children, or for predicting the intestinal microbial imbalance. It is possible to judge microbial imbalance or quantitatively predict microbial imbalance in the intestine of infants and toddlers.
  • FIG. 1 is a schematic diagram showing a pretreatment and quality test step of a sample for analyzing an intestinal microbial community of an infant according to an example of the present invention.
  • Figure 2 is a graph showing the change in the microbial community ratio of 11 kinds of intestinal microbes according to the age of the infant and infant.
  • FIG. 3a and 3b are graphs showing the distribution of dietary stages according to the age of infants and toddlers, and FIG. 3a shows the distribution of lactation, baby food, and general food, and FIG. 3b shows the distribution of early baby food, mid-term baby food, late baby food, and baby food stages.
  • FIGS. 4A and 4B are graphs showing results of grouping infant and toddler samples according to developmental stages according to the DMM clustering method of Example 3-1.
  • a circle-shaped point denotes a first group
  • a triangular point denotes a second group.
  • Figure 4b is a graph showing the distribution of infants and toddlers in development stage group 1 (cluster 1) and group 2 (cluster 2) according to the age of the infants, where the horizontal axis represents the age of the infant and the vertical axis represents the density of the sample.
  • the base age at which the group is divided is indicated by a vertical line.
  • FIG. 5 is a graph of ROC and AUC showing the results of testing the developmental stage of a test set by a machine learning model for determining the stage of development of infants and toddlers.
  • FIG. 6 is a graph showing the results of calculating sensitivity, specificity, and accuracy according to cut-off values in order to select a determination index of an infant and toddler development stage according to Example 4-7,
  • the horizontal axis represents the cut-off value, and the horizontal axis represents the calculated sensitivity, specificity, and accuracy values.
  • 7A and 7B are graphs of the results of calculating the coordinate center points of factors related to intestinal microbial imbalance using the DMM clustering results in which infant development stage 1 and development stage 2 are subdivided into two subgroups, respectively.
  • 7A is a graph analyzing samples of development stage 1
  • FIG. 7B is a development stage 2.
  • 8A and 8B are ROC curves and AUC graphs for verifying the model for predicting microbial imbalance in the intestine of infants and young children according to each developmental stage of the infant and toddler development stage 1 and development stage 2.
  • 8A is a graph analyzing a sample of development stage 1
  • FIG. 8B is a development stage 2.
  • 9A and 9B are graphs of results of calculating sensitivity, specificity, and accuracy according to cut-off values for determining microbial imbalance according to each developmental stage of infants and toddlers.
  • 9A is a graph for a sample of development stage 1
  • FIG. 9B is a development stage 2.
  • Fig. 10 is a diagram showing a phylogenetic tree representing each subgroup and a specific species level biomarker by genetic distance by classifying the biomarkers of the specific genus level of the intestinal microbial balance group of the infant and infant development stage 1 by genetic distance, and each sub It is a phylogenetic tree representing a group.
  • FIG. 11 shows a phylogenetic tree representing each subgroup and a specific species level biomarker classified by genetic distance by classifying the biomarkers of the genus level specific to the intestinal microbial imbalance group in the infant and infant development stage 1 by genetic distance, and each sub It is a phylogenetic tree representing a group.
  • FIG. 12 is a diagram showing a genera level biomarker specific to the intestinal microbial balance group in the infant and infant development stage 2 by genetic distance, and the phylogenetic tree and species level biomarker representing each subgroup are classified by genetic distance, and each subgroup is classified by genetic distance. It is the indicated tree.
  • 13 is a genera-level biomarker specific to the intestinal microbial imbalance group in the infant and infant development stage 2 by genetic distance, and the phylogenetic tree and species-level biomarkers representing each subgroup are classified by genetic distance, and each subgroup is classified by genetic distance. It is the indicated tree.
  • Example 1 Infant and infant samples and metadata collection
  • the questionnaire was divided into three types: A (nursing), B (reason), and C (general) so that the questionnaire could be filled out with the diet type corresponding to the sample collection among lactation, baby food, baby food, and general food.
  • the questionnaire type was selected by the legal representative of the infants and toddlers to be studied.
  • the questionnaire items consisted of delivery method, feeding method, baby food, type of baby food and general food, and stool type. The specific questionnaire items are shown in Table 2.
  • Type A (nursing) questionnaire 1. Child information (1) Gender (2) Month (3) Height (4) Weight2. Delivery information (1) Natural delivery (2) Cesarean section (3) Cesarean section during natural delivery attempt 3. When mothers take antibiotics (1) During pregnancy (2) At birth (3) Not sure (4) Not applicable 4. Mother's experience of taking antibiotics from birth to present (1) Yes (antibiotic name) (2) No 5.
  • Breastfeeding method (1) Breastfeeding (2) Formula feeding () (3) Mixed feeding () (Formulated or mixed feeding If you do, please write the name of the product you are currently using)* If you select'(1) Breastfeeding' or'(2) Formula Feeding', go to Question 7 6. If you selected ‘(3) mixed feeding’ in question 5, what is the ratio between breast milk and formula?
  • lactobacillus foods (fermented foods such as cheese, yogurt, etc., not in the form of refined drugs)?
  • Severe constipation hard stools appearing in the shape of large beads
  • Weak constipation uneven stools showing the shape of beads
  • Dry stools stools where the surface is cracked
  • Moist stools surface These smooth stools)
  • Thin stools stools that contain a lot of moisture and are separated into several lumps
  • Weak diarrhea stools that come out like mud due to very high moisture
  • Severe diarrhea stools that come out like water
  • lactobacillus foods Fermented foods such as cheese and yogurt, not refined drugs
  • Severe constipation hard stools appearing in the shape of large beads
  • Weak constipation uneven stools showing the shape of beads
  • Dry stools stools where the surface is cracked
  • Moist stools surface These smooth stools)
  • Thin stools stools that contain a lot of moisture and are separated into several lumps
  • Weak diarrhea stools that come out like mud due to very high moisture
  • Severe diarrhea stools that come out like water
  • Genomic DNA of feces was extracted using the feces sample collected by the method of 1-1. Since all samples were collected in a DNA buffer solution, specifically, genomic DNA was extracted by a physical method by homogenizing in FastPrep (MP Biomedicals) for 40 seconds at speed 6.0 immediately after collection.
  • FastPrep MP Biomedicals
  • PCR polymerase chain reaction
  • Reverse universal primer (SEQ ID NO: 162): 5'-GACTACHVGGGTATCTAATCC-3'
  • Component Content (1X) template (genetic DNA) 0.5 ul 2x buffer 10 ul Forward universal primer (10 pmole) 0.5 ul Weak direction universal primer (10 pmole) 0.5 ul Polymerase 0.3 ul 3'D.W 8.2 ul all 20 ul
  • the amplicon quality control was performed using Bioanalyzer (Agilent), qPCR, etc. to obtain 16S rRNA sequence of intestinal microorganisms extracted from genomic DNA of feces. After confirmation, 16s ribosomal RNA gene sequence analysis of the sample was performed using Next Generation Sequencing (NGS) through MiSeq (Illumina) equipment.
  • NGS Next Generation Sequencing
  • FIG. 1 A schematic diagram of the sample pretreatment and QC process is shown in FIG. 1. Specifically, in the DNA amplification process, it was confirmed that a DNA band appeared near 650bp as a result of Gel QC, and as a result of DNA quantitative analysis using Picogreen reagent, the DNA concentration was set to be 5 ng/ul or more. In the sample mixing step, it was confirmed that short peaks other than the main peak were not observed in the DNA peak as a result of Bioanalyzer QC, and quality control was performed based on the DNA concentration of 5 ng/ul or more as a result of picogreen QC.
  • NGS next-generation nucleotide sequencing method
  • EzTaxon 16S ribosomal RNA gene sequence database
  • http:/ /www.ezbiocloud.com easy biocloud analysis system
  • Fig. 2 shows the changes by the number of months of 11 taxa, which account for the largest proportion of the 16S rRNA of microorganisms obtained from the sample.
  • Each of the 11 taxa consisted of the genus Anaerostipes, the genus Bacterioides, the genus Bifidobacterium, the genus Blautia, the genus Clostridium, the genus Lachnospiraceae, the genus Enterococcus, the genus Escherichia, the genus Faecalibacterium, the genus Streptococcus, and the genus veillonella.
  • the genus Bifidobacterium is a representative lactobacillus that helps strengthen immunity and absorb nutrients in newborns, and is known to help settle the intestinal microbes by being delivered to the intestines through breast milk.
  • FIG. 2 when the total intestinal flora size was set to 1, the Bifidobacterium bacteria increased to 0.7 level at 2 months, and then the size of the intestinal flora decreased after 10 months and maintained at 0.2 level.
  • Microorganisms of the genus Bacteroides and Faecalibacterium which have a prominent increase in the colony over time, are associated with the metabolism of plant carbohydrates and the production of short chain fatty acids. It can be estimated that dietary fiber decomposition and short-chain fatty acid producing bacteria increase as the age of infants and toddlers increases and the number of people who eat baby food and baby food increases. Short-chain fatty acids are mainly products that appear in the process of decomposing fiber, and are known to have beneficial effects on the human body, such as promoting energy production, promoting vitamin production, and strengthening intestinal cell binding.
  • the distribution was very low until 3 months, but the cluster size gradually increased after 3 months and reached 0.2 level by 12 months, and then the cluster size was maintained at about 0.25 level.
  • Example 3 Intestinal microbial analysis data grouping and selection of characteristics for each group
  • Dirichlet multinomial mixtures (DMM) clustering is an analysis method that can be grouped by applying all of a variety of factors, and is suitable for reflecting vast intestinal microbial analysis data. The optimal group was found by setting the probability distribution of the intestinal microbial community according to the DMM clustering method as shown in Equation 1 below.
  • Equation 3 the posterior distribution as shown in Equation 3 can be derived.
  • Example 3-1 For machine learning, all infant and toddler samples were divided into a training set and a test set.
  • the training set was used to train machine learning models, and the test set was used to evaluate machine learning models.
  • Samples from each group divided by the method of Example 3-1 were randomly selected at a ratio of about 2:1 to define a test set and a training set.
  • the above sample selection process was repeated with 100 bootstrap replications to derive the expected value of the regression coefficient, and the test set and training set were randomly performed for each bootstrap iteration. Is reset.
  • Machine learning is a step of statistically meaningful recognition of intestinal microbial patterns for each group divided as in Example 3-1, and this prediction model was used as a Least Absolute Shrinkage and Selection Operator (LASSO).
  • LASSO's feature selection algorithm is characterized by imposing a penalty on the sum of the model's regression coefficients so that only the microorganisms that have the strongest correlation with the predictor variables that divide the group can be selected (Friedman, Hastie & Thirani, J Stat Softw, 2010., SJ Kim, K. Koh, M. Lustig, S. Boyd and D. Gorinevsky, in IEEE Journal of Selected Topics in Signal Processing, 2007.).
  • Equation 4 The prediction function of the LASSO model is shown in Equation 4 below.
  • the X is an independent variable of the model, and it corresponds to the ratio of microbial community in the results of fecal analysis of infants and young children.
  • the ⁇ is the coefficient of regression of the model and indicates the degree of relationship between the microorganism and the predictor.
  • M is the number of microbial taxa used for learning, and has a natural number value.
  • the ⁇ value is a hyper parameter of the machine learning model.
  • the first step is required to set a regularization parameter, which is a weight used at this time, according to the microbial community data.
  • a regularization parameter which is a weight used at this time
  • the normalization parameters were evenly cut to 10 on an exponential scale between 0.0001 and 10000, and 10 models were generated to select the model parameters that gave the best prediction result (the highest AUC value). Optimized hyperparameters can be obtained through such a grid search.
  • a feature selection process was performed by using the optimal model parameters found in Example 3-2.
  • the frequency determined by the markers of each group in the 100 iterative learning is Robustness
  • the degree of relevance of each group ( ) Is the average calculated value is defined as Coefficient.
  • the coefficient value is a value indicating the influence of the biomarker, and also includes information on which group each biomarker is specific to in each group.
  • each group shows a larger population
  • the coefficient values are distributed as negative and positive values, and the singularity of each group is determined by applying this to a logistic function such as Equation 4.
  • a logistic function such as Equation 4.
  • the result of applying LASSO in Example 3-3 is corrected according to the criteria for classifying each group, and the final microbial biomarker is selected. For example, since microorganisms identified as biomarkers specific to the first group are microorganisms identified as markers specific to the first group, the population of the microbial taxa in the first group is more than in the second group. It should show a high percentage. Therefore, the final biomarkers of the first group are selected by excluding the microbial taxa in which the population of the microbial taxa is higher in the second group. Through this process, biomarkers obtained by applying LASSO can be corrected according to the predefined criteria for dividing each group.
  • Example 3-2 The test set selected for 100 iterations in Example 3-2 was applied to an optimized machine learning model.
  • a prediction score for group discrimination may be calculated using the specific marker selected in Example 3-5 and the coefficient value of the corresponding marker.
  • X' is the ratio of the population size of the selected microorganisms.
  • the prediction score is a value of 0 to 1 by finding the microbial marker selected through Example 3-5 from the intestinal microbial community data of the test set, and multiplying the cluster size ratio of the microbial marker with the coefficient of the corresponding biomarker. Calculate as.
  • the predicted probability of a machine learning model is a probability calculated based on the discrimination result of the train set, and this is not a probability accurately discriminated from the real population. To give an accurate clinical interpretation, the probability value between 0 and 1 was divided by the ratio of the first group and the second group used for learning and rescaled. Each parameter definition in Equation 7 is as described above.
  • P 0 is the ratio of the second group samples present in the training set used to build the prediction model
  • N case is the number of second group samples in the training set
  • N train is the total number of samples in the training set.
  • Sensitivity refers to the ratio of the second group among all samples of the second group
  • specificity refers to the ratio of the second group among all samples determined as the second group
  • accuracy refers to the ratio of the first group or the second group among all samples.
  • a cut off of the discriminant index is determined by dividing the sensitivity, specificity, and accuracy values distributed in all samples by 20. Sensitivity, specificity, and accuracy are calculated as in Equations 8 to 10 below. Each parameter definition in Equations 8 to 10 is as described above.
  • TP is the discriminant index ( ) Is the number of cases greater than cut-off
  • TN is the discriminant index ( ) Is the number of cases less than cut-off
  • FP is the discriminant index in the samples corresponding to the first group ( ) Is the number of cases greater than cut-off
  • FN is the discriminant index in the samples corresponding to the first group ( ) Is the number of cases less than the cut-off.
  • an accurate discrimination ability for the first group or the second group can be expected with the specificity or sensitivity indicated by the index.
  • the dietary stages of lactation, baby food, and general food are defined according to the type of diet consumed by infants and young children, and each refers to a diet type that consumes liquid (nursing food), gel (baby food), and solid (general food) foods. . According to Figure 3b, the diet stage is distributed differently based on about 6 months and 15 months of age.
  • the general diet refers to the same solid diet as adults.
  • the sample of Example 1 can be divided into two groups through dietary classification, and specifically, a group for feeding (liquid) and baby food (gel), baby food and general food ( Solid) can be classified into groups.
  • developmental stage 1 and developmental stage 2 were defined as developmental stage 1 and developmental stage 2 according to the timing of liquid and gel diets and solid diets.
  • Table 5 shows the distribution of dietary stages by age of all infants and toddlers.
  • Example 3-1 all infant and toddler samples were grouped using intestinal microbial data, and the results are shown in FIGS. 4A and 4B.
  • the entire infant and child sample was divided into two developmental stage groups, and the results are shown in FIG. 4A.
  • Figure 4b shows that the grouping result showed a significant correlation with the age of the infants and toddlers.
  • the first group was designated as developmental stage 1
  • the second group was designated as developmental stage 2.
  • Example 3-2 the intestinal microbial analysis data for each developmental stage specified above was applied to machine learning.
  • the result of optimization prediction (hyper parameter) for determining the developmental stage was determined to be 10.
  • biomarkers that appear primarily in each developmental stage were selected.
  • the biomarkers related to developmental stage 1 were 44 at the Species level and 12 at the Genus level.
  • the biomarkers related to developmental stage 2 were 59 at the Species level and 22 at the Genus level.
  • Tables 6 to 9 show species and genus level biomarkers related to developmental stage 1, and species and genus level biomarkers related to developmental stage 2.
  • a negative value means a microorganism specific to the development stage 1
  • a positive value means a microorganism specific to the development stage 2.
  • the robustness is expressed as a ratio of the number of times each microorganism appeared in each developmental stage among 100 bootstrap repetitions, and the closer to 1 means that it is specific to the group.
  • the ratio of balanced bacteria and the ratio of imbalanced bacteria means the population of each microbial community, and is a value obtained by calculating the ratio through the number of reads occupied by the corresponding microbe compared to the total number of reads of each identified total microbe.
  • biomarkers in Tables 6 to 9 below were first selected as biomarkers that distinguish the developmental stages of the intestinal microbial community of infants and toddlers.
  • the (Genus) level biomarker described in Tables 7 and 9 below is that the species of microbial biomarkers are distinguished, but specifically the identification has not been carried out to the species level. It means that it is a marker.
  • Genus level biomarkers associated with developmental stage 1 primary
  • Genus level biomarkers related to developmental stage 2 primary
  • Species level Bacterial species name
  • coefficients robustness Balanced group ratio %
  • Proportion of unbalanced group %
  • Coprococcus_g2 (Family Lachnospiraceae) 0.000345 0.033333 0.634298 0.518112 Prevotella 0.000503 0.033333 0.728 1.326638 Agathobacter 0.000716 0.066667 0.057737 0.59893
  • PAC000672_g (Family Ruminococcaceae) 0.00116 0.033333 0.002775 0.282116 Pseudoflavonifractor 0.001503 0.05 0.159467 0.221574 Lachnospira 0.001773 0.016667 0.316929 1.607492
  • Eubacterium_g5 (Family Lachnospiraceae) 0.001984 0.05 0.278224 2.044322 Alistipes 0.00218 0.05 0.000
  • the characteristic biomarkers selected primarily by the method of Example 4-4 were corrected by the method described in Example 3-4. Specifically, among the biomarkers specific to the developmental stage 1 in Table 6, a total of 7 microbial species, such as Bacteroides caccae and Terrisporobacter pertrolearius, which appeared at a higher rate of the microbial taxa at development stage 2 were excluded. In addition, a total of 14 microbial species such as Lachnospiraceae family, unpublished species, Clostridium innocuum, and Hungatella hathewayi, which showed a higher percentage of the microbial taxa in development stage 1 among the development stage 2 specific biomarkers in Table 8 were excluded.
  • biomarkers for each stage of development are shown in Tables 10 to 13 below.
  • the biomarkers in Tables 10 to 13 below are biomarkers that are secondarily selected as biomarkers that distinguish the developmental stages of the intestinal microbial community of infants and toddlers.
  • Biomarkers specific to developmental stage 1 consist of 37 taxa with Species level and 12 taxa with Genus level identified microorganisms, and biomarkers specific for developmental stage 2 consist of 47 taxa with Species level and 20 taxa with Genus level.
  • the (Genus) level biomarker described in Tables 11 and 13 refers to the species (speies) of the microbial biomarkers, but specifically the identification was not carried out to the species level, and the microbial biomarkers that are substantially distinguished at the species level. Means
  • Genus level biomarkers associated with developmental stage 2 (secondary) Species level (Bacterial species name) coefficients robustness Balanced group ratio (%) Proportion of unbalanced group (%) Prevotella 0.000503 0.033333 0.728 1.326638 Agathobacter 0.000716 0.066667 0.057737 0.59893 PAC000672_g (Family Ruminococcaceae) 0.00116 0.033333 0.002775 0.282116 Pseudoflavonifractor 0.001503 0.05 0.159467 0.221574 Lachnospira 0.001773 0.016667 0.316929 1.607492 Eubacterium_g5 (Family Lachnospiraceae) 0.001984 0.05 0.278224 2.044322 Alistipes 0.00218 0.05 0.000794 0.539207 Clostridium_g24 (Family Lachnospiraceae) 0.003903 0.1 0.479107 1.181915 Akkerman
  • Fig. 6 shows a ROC curve (receiver operating characteristic curve) and an area under curve (AUC) graph of the result of determining the development stage for the test set by the optimized machine learning model. Since the ROC curve is largely curved in a bow shape and the AUC is 0.98, which is close to 1, it was confirmed that the result of predicting the stage of infant development in Example 4-3 was significant.
  • Example 4-6 In order to give an accurate clinical interpretation to the prediction results of Example 4-6, in substantially the same manner as in Example 3-6, 0 calculated by the dot product of the ratio of the community size of each biomarker microorganism and the coefficient and The probability value between 1 was divided by the ratio of developmental stage 1 and developmental stage 2 used for learning and rescaled.
  • Equation 7 Is the predicted score of the test subject for discrimination of developmental stage 2, P 0 is the proportion of samples corresponding to developmental stage 2 in the training set used to build the prediction model, and N case is the developmental stage 2 in the training set. This is the number of samples, and N train is the total number of samples in the training set.
  • the index calculated in this way was named'Infant Development Index'.
  • FP is the infant development index in the sample corresponding to the developmental stage 1 ( ) Is the number of cases greater than the cut-off
  • FN is the infant development index ( ) Is the number of cases less than the cut-off
  • TP is the infant development index ( ) Is the number of cases greater than the cut-off
  • TN is the infant development index ( ) Is the number of cases less than the cut-off
  • the specificity to accurately match the development stage 2 is about 98%, and the sensitivity to accurately judge the infant development stage 1 is about 97%.
  • the accuracy graph is shown in FIG. 6.
  • the specificity is about 98%, and since it can accurately distinguish the stage of development, it can be seen that it shows a high clinically distinguishable ability. Therefore, if the infant development index is 1.19 or higher, it can be determined as developmental stage 2, and if it is calculated as less than 1.19, it can be determined as developmental stage 1.
  • Infant and infant development stages can be determined by one or more criteria selected from the group consisting of dietary stage, age, and infant development index (based on information of intestinal microbial communities).
  • the biomarkers in Tables 10 to 13 are used as biomarkers that are secondarily selected as biomarkers for dividing the stage of development of the intestinal microbial community of infants and toddlers.
  • Table 14 below summarizes the method of determining the development stage according to the criteria for determining each development stage.
  • the diet that infants and toddlers ingest is classified into liquid feeding food, gel baby food, solid baby food and solid general diet, and liquid based on the infant's metadata information (diet).
  • This is a method of classifying the stage of feeding lactation or gel-like baby food into development stage 1, and the stage of ingesting a solid diet, that is, baby food or general food, into development stage 2. Therefore, the time point of ingesting a solid diet from a liquid or gel lactating or baby food is taken as a criterion.
  • the developmental stage based on the number of months after birth (monthly age), based on the infant's metadata information (the infant's month age), if the age of the infant to be investigated is less than 15 months, it is the developmental stage 1, and the age is 15 months or more. The case is determined as developmental stage 2.
  • the reference period of 15 months is when the dietary form is converted from gel to solid, and is when groups are classified through the DMM clustering method of Example 4-2.
  • the type of microbe, the amount of microbial species, and the diversity of microbial species change the most from a specific time point, for example, 15 months. From birth to 15 months, it is composed of microbial species that contribute to immunity, digestion of breast milk, and stabilization in the intestines. After 15 months, microbial species related to the metabolism of various foods such as dietary fiber increases, and species diversity increases significantly.
  • the species of microbial biomarkers specific to each developmental stage and the ratio (occupancy) of these microbial species in the intestinal flora were analyzed and described above. It is a method to determine the developmental stage by applying it to a predictive model of the early childhood development stage.
  • the development index is calculated by analyzing the species of microbial biomarkers specific to each developmental stage and the ratio (occupancy) of these species in the intestinal flora, and the cut-off value of the development index using accuracy, sensitivity and specificity Is set, and the case below the set value is selected as development stage 1, and the case above the set value is selected as development stage 2.
  • the answer to the questionnaire in the form including the items in Table 2 should be preceded.
  • the intestinal microbial analysis using the method of Example 2 should be preceded.
  • the microbial ecosystem in the intestine of infants and toddlers is formed by microbes residing in the parent and the surrounding environment are transferred to and settled in a sterile newborn, and species abundance and diversity in the intestine of infants and toddlers increase according to the growth and diet of infants and toddlers.
  • biomarkers specific to the stage of infant and toddler development specifically indicate the developmental pattern of the intestinal microbial ecosystem according to the growth of infants and toddlers. Biomarkers specific for developmental stage 1 of infants and toddlers are described in Tables 10 and 11, and biomarkers specific for developmental stage 2 are described in Tables 12 and 13 above.
  • Enterococcus, Streptococcus, and Lactobacillus are included in the Firmicutes phylum, and Bifidobacterium is a microorganism included in the Actinobacteria phylum.
  • the Enterococcus, Bifidobacterium, Streptococcus, and Lactobacillus are all lactic acid bacteria, and lactic acid bacteria are microorganisms that are transmitted from the mother's body to the child and first settle in the intestine of a sterile newborn baby, and after easily settle in the intestinal environment than other microorganisms, It secretes antibacterial substances to prevent the settlement of various foreign antigens.
  • lactobacilli are microorganisms that break down lactose and play the greatest role in helping infants and toddlers digest breast milk.
  • Escherichia which is included in phylum Proteobacteria, it is a microorganism most often found in the meconium before lactic acid bacteria are transmitted, and it is the first to settle in the intestinal environment of newborns and absorb oxygen in the intestine, thereby creating the intestine into an anaerobic environment. , Helps in stabilization.
  • Biomarkers specific to developmental stage 2 can be largely divided into the phylum firmicutes family including Blautia, Faecalibacterium, and Anaerostipes, and the phylum Bacteroidetes family of Prevotella and Bacteroides.
  • the intestinal microbial community was converted from phylum Firmicutes and Actinobacteria (development stage 1), mainly lactic acid bacteria, to phylum Firmicutes and Bacteroidetes.
  • Phylum Firmicutes and Bacteroidetes are the most common characteristics of adults in the prominent gut microbiota. This pattern means that the intestinal microbial ecosystem of infants and toddlers is developing in a similar way to that of an adult. As infants and toddlers grow physically and the nutrients they need are diversified, the foods they consume also diversify, increasing the microbial species of the intestinal microbial community and the metabolic diversity of each microbial species.
  • the biomarker specific for developmental stage 2 is mainly composed of short-chain fatty acid-producing bacteria related to fiber metabolism.
  • microbial species Balautia, Faecalibacterium, Anaerostipes
  • Clostridiales which contain the most representative short-chain fatty acid producing bacteria, show the highest coefficient value.
  • Prevotella and Bacteroides are representative microorganisms that degrade dietary fiber and protein. These microorganisms were mentioned in the 2011 journal Nature as a criterion for dividing adult enterotypes across races, regions, and individuals. In a follow-up study on the intestinal type, prevotella appeared mainly in a high dietary fiber-low protein diet, and many Bacteroides appeared in a low dietary fiber (simple sugar)-high protein diet were reported. When looking at the coefficient and robustness values of Prevotella and Bacteroides in developmental stage 2, Bacteroides showed higher values than Prevotella.
  • Example 5 Classification of imbalance and balance of intestinal microflora by development stage of infants and toddlers
  • samples of infants and young children for each developmental stage were grouped using the intestinal microbial analysis data. At each developmental stage, two groups were divided, and a total of four groups were clustered. Infant and infant samples for each developmental stage are distributed as follows.
  • Intestinal microbial imbalance is generally defined as an imbalance caused by the consumption of processed foods and antibiotics, which are factors that lower the species diversity of the ecosystem.
  • the intestinal microbial ecosystem of a healthy infant and toddler sample that does not contain an imbalance factor is defined as a balanced state. Therefore, the imbalance group of intestinal microbes is defined as a sample group that has the intestinal microbial community associated with the meta data that causes the intestinal imbalance, and the balance group is the intestinal microbial community that is related to the meta data that mitigates the intestinal imbalance.
  • Is defined as a sample group with Factors related to intestinal microbial imbalance and balance were selected by referring to the meta data collected by the questionnaire in Table 2 and the items mentioned in Chong's 2018 study. Factors affecting the intestinal microflora of newborns are the infant's age, whether or not to take antibiotics, the form of birth, feeding method, and the presence of diarrhea. Classification according to the items and answers selected in Table 15 are shown.
  • P-value and R 2 were calculated by performing cluster coordinates and (permutational) MANOVA for each factor related to intestinal microbial imbalance. The lower the P-value and higher R 2 , the higher the correlation between the factor and cluster coordinates. In addition, by calculating the coordinate center points of factors related to intestinal microbial imbalance, the locations of samples having a positive correlation with the factor were predicted. The above analyzes were calculated using the vegan package of statistical analysis program R. Table 16 shows the P-value and R 2 values for development stage 1, and Table 17 shows the calculation results for the direction of meta data for development stage 1, and the P-value and R 2 values for development stage 2 are In Table 18, the calculation results for the direction of meta data for development stage 2 are shown in Table 19.
  • coord1 and coord2 are the positions of the correlation arrows on the coordinates of the intestinal imbalance-related factors significantly related to each group.
  • coord1 is the coordinate value of the horizontal axis and coord2 is the coordinate value of the vertical axis. Arrows on the coordinates appear in the corresponding direction and length according to the degree associated with each group.
  • FIG. 7A and 7B are graphs showing arrows on coordinates of factors related to intestinal microbial imbalance according to each developmental stage grouped as a result of DMM clustering.
  • the age_month showed the highest correlation compared to other imbalance-related factors, with R 2 values of 0.070071 and 0.118405 in Tables 16 and 18, respectively.
  • FIG. 7 through the coordinate values of Tables 17 and 19, it can be seen that the number of months of birth is most distinguished compared to other factors. This means that the number of months of life is the factor that has the greatest influence on the developmental stage, but is not the criterion for dividing the two groups within the developmental stage. In other words, the age of the month did not have a significant effect on the intestinal microbial imbalance.
  • development stage 1 (FIG. 7A) and development stage 2 (two groups of FIG. 7B) classified according to Example 3-2 are, respectively, whether there is diarrhea, whether or not to take antibiotics, how to give birth, whether to breastfeed. It can be seen that it is related to the coordinate value of.
  • the coordinate values of breastfeeding (lactation_bfTRUE) and natural delivery (birth_mode_naturalTRUE) in the developmental stage 1 divided according to Example 3-2 are antibiotics (antibioticsTRUE), Compared to the coordinate value of diarrheaTRUE, the center point of group 1 is toward the center point, and the center point of group 2 shows a strong correlation with the coordinate value of diarrheaTRUE.
  • the coordinate value of birth_mode_naturalTRUE is antibiotics.
  • the center point of group 1 is toward the center point, and the center point of the group 2 shows a strong correlation with the antibiotics TRUE and diarrheaTRUE coordinates.
  • the two groups grouped by DMM clustering in developmental stage 1 and developmental stage 2 are groups that are strongly related to intestinal microbial imbalance metadata as well as intestinal microbial analysis data.
  • the group related to diarrhea, cesarean section, taking antibiotics, and milk formula, which are known to cause intestinal microbial imbalance can be defined as the group related to intestinal microbial imbalance.
  • the sample group distinguished from the intestinal microbial imbalance-related group is related to breastfeeding and natural childbirth, and thus can be defined as a group related to intestinal balance. Metadata factors showing a strong association with intestinal microbial imbalance and intestinal balance are shown in Table 20.
  • Example 3-2 the intestinal microbial analysis data of the intestinal microbial imbalance and balance group for each stage of development was applied to machine learning.
  • the normalization parameter corresponding to the hyperparameter of the model, that is, the optimized infant and toddler gut microbial imbalance prediction model according to the present invention is expressed in Equation 1 above. Among the values, the best prediction result is selected through the value. In developmental stage 1, the optimization prediction result value for discriminating imbalance was set to 0.05, and the optimization prediction result value in developmental stage 2 was set to 100.
  • the biomarkers related to the intestinal balance group represented as the primary characteristic selection were 31 taxa at the Species level and 26 taxa at the Genus level.
  • the biomarkers related to the imbalanced group were 26 taxa at the Species level and 24 at the Genus level.
  • Tables 21 to 28 show the types of species-level biomarkers related to the balanced group, genera level biomarkers related to the balance group, species level biomarkers related to the imbalance group, and the genera level biomarkers related to the imbalance group, respectively, by developmental stage. .
  • the coefficient is obtained by calculating ⁇ in Equation 4, and when it is a negative value, it means that it is a microorganism specific to the balance group, and when it is a positive value, it is a microorganism specific to the imbalance group.
  • Means The robustness is obtained by calculating the case where the corresponding microorganism appears as the corresponding result through the bootstrap result performed 100 times, and the closer to 1 means that the result is repeatedly specific to the group.
  • the proportion of the balance group and the ratio of imbalance are obtained by calculating the ratio through the number of reads occupied by the corresponding microorganism relative to the total number of reads of the total microorganisms identified, respectively, and mean a population.
  • Genus level biomarkers related to the balance group (development stage 1) Sample number (genus level) coefficients robustness Balanced group ratio (%) Proportion of unbalanced group (%) Bifidobacterium -0.168201 One 62.580789 33.045218 Enterococcus -0.001554 0.083333 10.041681 6.371829
  • Genus level biomarkers associated with imbalances (development stage 1) Sample number (genus level) (Bacterial species name) coefficients robustness Balanced group ratio (%) Proportion of unbalanced group (%) Pseudoflavonifractor 0.00372 0.116667 0.009344 0.250999 Clostridioides 0.007392 0.183333 0.116913 0.580252 Escherichia 0.016107 0.35 4.706873 9.535802 Clostridium_g24 (Family Lachnospiraceae) 0.016223 0.333333 0.052884 0.366841 Clostridium 0.027992 0.566667 0.441519 3.809211 Bacteroides 0.039796 0.65 2.059269 8.545303 Veillonella 0.365429 One 1.498936 9.7073
  • Species-level biomarkers associated with the balance group development stage 2
  • Species level (Bacterial species name) coefficients robustness Balanced group ratio %)
  • Proportion of unbalanced group (%) Fusicatenibacter saccharivorans -0.113431 0.716667 2.451463 0.770204 Faecalibacterium prausnitzii -0.067313 0.7 11.303225 4.18633
  • Bifidobacterium catenulatum -0.045657 0.483333 5.608016 2.749555 Anaerostipes hadrus -0.031165 0.3 4.493286 1.038971
  • Genus level biomarkers related to the balance group (development stage 2) Species level (Bacterial species name) coefficients robustness Balanced group ratio (%) Proportion of unbalanced group (%) Ruminococcus_g2 (Family Ruminococcaceae) -0.466909 0.916667 1.860715 0.070953 Lachnospira -0.384064 0.833333 1.875378 0.12984 Bacteroides -0.22437 0.766667 17.524886 14.548922 Faecalibacterium -0.165892 0.466667 11.503136 4.195657 Eubacterium_g5 (Family Lachnospiraceae) -0.116977 0.366667 2.608563 0.480289 Fusicatenibacter -0.070078 0.483333 2.514382 0.791564 Roseburia -0.038164 0.283333 2.255163 0.32842 Subdoligranulum -0.02894 0.183333 2.476985 0.559366 Blautia
  • Example 3-4 the result of applying machine learning was corrected according to the selection criteria for the intestinal microbial balance group or imbalance group, and the final microbial biomarker was selected.
  • a total of five taxa such as Akkermansia and Bacteroides fragilis, which showed a higher percentage of microbial taxa in the imbalanced group by developmental stage, were excluded from the balance group-specific biomarkers.
  • a total of three taxa such as Clostridium and Sutterella, which appeared at a higher ratio in the balanced group, were excluded.
  • the biomarkers specific to the balanced group are shown in Tables 29 to 32 below for each stage of development.
  • the balanced group-specific biomarkers consist of 12 Species level taxa and 6 Genus level taxa at development stage 1, and 18 Species level taxa at development stage 2 and 16 Genus level taxa.
  • the imbalance group-specific biomarkers corrected by secondary feature selection are shown in Tables 33 to 36.
  • the imbalanced group-specific biomarkers consisted of 11 taxa at the Species level and 7 taxa at the Genus level at the development stage 1, and 15 taxa at the Species level at the 2nd stage and 14 at the Genus level.
  • the biomarkers specific to the balance group for each developmental stage are shown in Tables 29 and 30 and the schematic diagram of Fig. 10, and the biomarkers for the imbalance group at development stage 1 are shown in Table 33 and Tables. It is shown in the system diagram of 34 and FIG.
  • the balance group-specific biomarkers of development stage 2 are shown in Tables 31 and 32 in the schematic diagram of Fig. 12, and the imbalance group-specific biomarkers of development stage 1 are shown in Tables 35 and Tables 36 and the line diagrams of Fig. 13.
  • the genus-level biomarkers described in Tables 30, 32, 34, and 36 below are classified as spies of microbial biomarkers, but specifically the identification was not carried out to the species level, so the identification results were As a species described up to the level, it means that it is a microbial biomarker that is substantially distinguished at the species level.
  • Species-level biomarkers associated with the balance group development stage 1
  • 83 0.814519 0.221563
  • 3.588835 1.564981 Streptococcus pneumoniae 6 86 0.203145 0.075435
  • Bifidobacterium breve 7 8.686701 7.201174 Rothia mucilaginosa 8 88 0.397782 0.075418 Streptococcus salivarius 9 89 4.78868 2.924272
  • Genus level biomarkers related to the balance group development stage 1
  • Sample number (genus level) Bacterial species name) 16S rRNA Sequence number 16S rRNA fragment Sequence number Balanced group ratio (%) Proportion of unbalanced group (%) Bifidobacterium 13 93 62.580789 33.045218 Enterococcus 14 94 10.041681 6.371829 Rothia 15 95 0.407708 0.084993 Eggerthella 16 96 0.202414 0.076959 Lactobacillus 17 97 2.804877 2.013835 Anaerostipes 18 98 0.30337 0.157415
  • Species-level biomarkers associated with the balance group development stage 2
  • Genus level biomarkers related to the balance group development stage 2 Species level (Bacterial species name) 16S rRNA Sequence number 16S rRNA fragment Sequence number Balanced group ratio (%) Proportion of unbalanced group (%) Ruminococcus_g2 (Family Ruminococcaceae) 35 115 1.860715 0.070953 Lachnospira 36 116 1.875378 0.12984 Bacteroides 37 117 17.524886 14.548922 Faecalibacterium 38 118 11.503136 4.195657 Eubacterium_g5 (Family Lachnospiraceae) 39 119 2.608563 0.480289 Fusicatenibacter 40 120 2.514382 0.791564 Roseburia 41 121 2.255163 0.32842 Subdoligranulum 42 122 2.476985 0.559366 Blautia 43 123 8.472013 3.055045 CCMM_g (Family Erysipelotrichaceae) 44 124 0.811336 0.13
  • Species-level biomarkers associated with imbalances development stage 1
  • FWNZ_s Genetic Klebsiella 50 130 0.149975 1.899234
  • Flavonifractor plautii 51 131 0.005163 0.229055 Streptococcus gallolyticus 52 132 0.243751 1.754617 Clostridium neonatale 53 133 0.010955 1.006057
  • Clostridioides difficile 54 134 0.091256 0.578815 Veillonella ratti 55 135 0.561349 2.445463 Escherichia coli 56 136 4.687128 9.505538 Clostridium paraputrificum 57 137 0.042032 0.510855 Bacteroides vulgatus 58 138 0.140871 5.123635 Veillonella atypica 59 139
  • Genus level biomarkers associated with imbalances (development stage 1) Sample number (genus level) (Bacterial species name) 16S rRNA Sequence number 16S rRNA fragment Sequence number Balanced group ratio (%) Proportion of unbalanced group (%) Pseudoflavonifractor 61 141 0.009344 0.250999 Clostridioides 62 142 0.116913 0.580252 Escherichia 63 143 4.706873 9.535802 Clostridium_g24 (Family Lachnospiraceae) 64 144 0.052884 0.366841 Clostridium 65 145 0.441519 3.809211 Bacteroides 37 117 2.059269 8.545303 Veillonella 66 146 1.498936 9.707073
  • Genus level biomarkers associated with imbalances development stage 2
  • Species level Bacterial species name
  • 16S rRNA Sequence number 16S rRNA fragment Sequence number Balanced group ratio (%)
  • Proportion of unbalanced group (%)
  • Clostridium_g35 (Family Lachnospiraceae) 73 153 0.110759 0.221132 Intestinibacter 74 154 0.841446 1.174962 Bifidobacterium 13 93 12.867602 20.307788 Hungatella 75 155 0.076689 0.191014
  • Citrobacter 78 158 0.130479 0.376519 Klebsiella 79 159 0.032624 2.397416
  • Example 6 Prediction of microbial imbalance in the intestine of infants and toddlers
  • Example 3-5 Using the method of Example 3-5, it was examined whether the machine learning model that learned whether or not the intestinal microbial imbalance in infants and toddlers was actually accurately distinguished whether or not the intestinal microbial imbalance in infants and toddlers was.
  • the ROC curve (receiver operating characteristic curve) and AUC (area under curve) graph of the result of determining whether or not the intestinal microbial imbalance for the test set is determined using the predictive model are shown in FIGS. 8A and 8B.
  • the ROC curve is largely curved in a bow shape, and the AUC is 0.88 in the developmental stage 1 and 0.92 in the developmental stage 2, showing a value close to 1, so that the result of predicting the microbial imbalance in the intestine of infants and young children applied in Example 5-3 is significant. Able to know.
  • I the predicted score of the test subject for discrimination of intestinal microbial imbalance in infants and toddlers
  • P 0 is the ratio of intestinal microbial imbalance samples present in the training set used to build the prediction model
  • N case is the number of intestinal microbial imbalance samples in the training set.
  • N train is the total number of samples in the training set.
  • the index calculated in this way was named as the index of microbial imbalance in the intestine of infants and young children.
  • the intestinal microbial imbalance index can be used as an index for classifying the intestinal microbial imbalance with respect to unknown samples.
  • the sensitivity, specificity, and accuracy of the intestinal microbial imbalance index in the infant and toddler can be used. ) I checked the value.
  • the sensitivity, specificity, and accuracy values distributed from 0.3 to 1.67 in development stage 1 and 0 to 2.68 in development stage 2 were divided into 20 equal parts to determine the cut off of the intestinal microbial imbalance index in infants and young children. Sensitivity, specificity, and accuracy are calculated as in Equations 8 to 10 below.
  • TP is the intestinal microbial imbalance index of infants and young children in the intestinal microbial imbalance sample ( ) Is the number of cases greater than the cut-off
  • TN is the intestinal microbial imbalance index ( ) Is the number of cases less than the cut-off
  • FP is the intestinal microbial imbalance index ( ) Is the number of cases greater than the cut-off
  • FN is the intestinal microbial imbalance index ( ) Is the number of cases less than the cut-off.
  • the specificity to accurately balance the intestine of infants and toddlers is 83%, and the sensitivity to accurately determine the intestinal microbial imbalance in infants and toddlers is 76. %to be.
  • the accuracy graph is shown in Fig. 9A.
  • test target sample corresponding to the developmental stage 1 has a microbial imbalance index in the intestine of 1.17 or more, it can be determined by the microbial imbalance in the intestine of infants and young children, and when it is calculated as less than 1.17, it can be determined by the intestinal balance of the infant and toddler.
  • test target sample corresponding to the developmental stage 2 has an intestinal microbial imbalance index of 1.7 or more, it can be determined as the intestinal microbial imbalance in infants and young children, and if it is calculated as less than 1.7, it can be determined as the intestinal microbial balance in the infant and toddler.
  • the intestinal microbial imbalance of infants and young children can be determined by analyzing biomarkers specific to the intestinal microbial imbalance of infants and toddlers. Since the biomarkers of microbial imbalance in the intestine of infants and young children change according to the stage of development of infants and young children, it is necessary to first determine the stage of development of the infant and toddler when determining the intestinal microbial imbalance in infants and toddlers.
  • intestinal microflora was analyzed using the method of Example 2, and the stage of infant and infant development was defined by the method of Example 4, and then applied to a model for predicting microbial imbalance in the intestine of infants and young children, thereby obtaining an index of discrimination of microbial imbalance in the intestine of infants and toddlers. According to the criteria of the intestinal microbial imbalance discrimination index for each stage of development, it is possible to finally determine the degree of imbalance of the intestinal microbiota of infants and young children.
  • the imbalance judgment index is calculated, and accuracy, sensitivity, and specificity
  • the cut-off value of the imbalance judgment index is set using, and the case below the set value is selected as the balanced group, and the case above the set value is selected as the imbalance group.
  • Exemplary criteria for determining the microbial imbalance in the intestine of infants and children are shown in Table 37 below.
  • Criteria for determining microbial imbalance in the intestine of infants and young children Classification of development stages Model for predicting microbial imbalance in the intestine of infants and toddlers Intestinal microbial imbalance Development stage 1 Intestinal microbial imbalance discrimination index less than 1.17 Intestinal microbial balance Intestinal microbial imbalance discrimination index 1.17 or higher Gut microbial imbalance Development stage 2 Intestinal microbial imbalance discrimination index less than 1.7 Intestinal microbial balance Intestinal microbial imbalance discrimination index 1.7 or higher Gut microbial imbalance
  • intestinal microbial imbalance refers to a condition in which the diversity of the microbial community in the intestine is reduced and the balance is broken due to factors such as antibiotics and processed foods.
  • intestinal microbial imbalance has been pointed out as a factor of modern diseases such as irritable bowel syndrome (IBS), obesity, and diabetes.
  • the present inventors selected items such as the form of delivery, the form of lactation, the use of antibiotics, and diarrhea, which are meta data related to the intestinal microbial imbalance of infants and young children, through literature research, and which items are included in the intestinal microbial data grouped by developmental stage. We investigated whether it had the greatest impact. Subsequently, biomarkers were selected by searching for strongly related microbial species in each group to which meaning was given through metadata.
  • the phylogenetic tree was created using a neighbor joining algorithm based on the 16S rRNA sequence of biomarkers specific to the intestinal microbial imbalance group of infants and toddlers and the intestinal balance group of infants and toddlers, and from a taxonomic point of view (order level). Was identified.
  • the biomarkers that appear in the infant and infant gut microbial imbalance group and the infant and infant gut balance group can be divided into 38 subgroups.
  • FIGS. 10 to 13 the phylogenic tree of the species and genus level biomarkers of the infant and infant intestinal microbial imbalance group and the infant and infant intestinal balance group according to development stages are shown. Specifically, the development stage, balance, and species/genus markers are classified and shown in the following table.
  • FIG. 10 which shows the biomarkers of the intestinal balance group of infants and toddlers in development stage 1
  • the biomarker that shows the greatest correlation with the intestinal balance group of infants and children in developmental stage 1 is Bifidobacterium, and lactic acid bacteria belonging to Actinobacteria along with Rothia in the same subgroup.
  • Lactobacillus and Enterococcus of subgroup 1 are also lactic acid bacteria, and it can be seen that the positive effects of immunity strengthening and nutrient absorption performed by lactic acid bacteria in developmental stage 1 are more pronounced in the balanced group.
  • Lactobacillus gasseri (Subgroup 5), which is most specific to the balance group based on the coefficient value among Lactobacillus, can survive bile acids like most Lactobacillus, and has a gene that easily attaches to intestinal epithelial cells. Can settle for a long time.
  • the effects of strengthening immunity, relieving bowel discomfort, and relieving diarrhea and constipation have all been verified through clinical studies in adult studies.
  • Bifidobacterium longum which is most specific to the balanced group based on the coefficient value, it is a lactobacillus detected in the maternal vagina, is associated with natural delivery, and helps the immunity of newborns.
  • IBD inflammatory bowel disease
  • CD Crohn's disease
  • UC ulcerative colitis
  • FIG 11 which shows the biomarkers of the intestinal imbalance group of infants and toddlers in development stage 1
  • the most specific biomarkers for the intestinal microbial imbalance group of infants and toddlers in the developmental stage 1 are Veillonella and Clostridium belonging to Phylum Firmicutes and Bacteroides belonging to Phylum Bacteroidetes. Cheat.
  • microorganisms are related to the metabolism of solid (baby and general) diets consisting of vegetable carbohydrates (simple sugar and fiber) and proteins, not in liquid (nursing food) or gel (baby food) diet forms, and produce short-chain fatty acids. There is a characteristic. In adults, microorganisms that have the ability to metabolize fiber and produce short-chain fatty acids play a beneficial role in increasing the species diversity of the intestinal microbial ecosystem. However, in the case of infants and toddlers, it was analyzed that the pattern of detection of these microorganisms in developmental stage 1 is associated with intestinal microbial imbalance factors such as diarrhea and cesarean section.
  • the detection of microorganisms during the transition from infant development stage 1 to solid (infant diet and general diet) in the form of liquid (feeding) to gel (feeding) diet can be interpreted as the intestinal microbial ecosystem developed earlier than expected. It can be seen that the intestinal microbial ecosystem is not ideally developed as it is related to the intestinal microbial imbalance factor.
  • FIG. 12 which shows the biomarkers of the intestinal balance group of infants and toddlers in developmental stage 2, the biomarkers showing the greatest correlation are the cases where the majority of the biomarkers are short-chain fatty acid producing bacteria.
  • 13 biomarkers corresponding to subgroup 18 (Subdoligranulum, Faecalibacterium, Eubacterium_g23, Ruminococcus_g2, Romboutsia, Fusicatenibacter, Anaerostipes, Agathobacter, Lachnospira, Roseburirmi, Eubacterium_g5, Blautia, PAC001046) belong to the genus F. It is a submicrobial species of order Clostridiales that contains short-chain fatty acid producing bacteria, which are representative of Firmicutes.
  • Short-chain fatty acids are metabolites produced in the process of decomposing dietary fiber, and are known to have beneficial effects on the human body, such as promoting energy production, promoting vitamin production, and strengthening intestinal cell binding. It can be judged that the intestinal microbial ecosystem is appropriately developing as the dietary form of liquid (feeding) to gel (baby feed) is converted to a solid (baby diet and general diet) diet.
  • Faecalibacterium prausnitzii which exhibits relatively high coefficient and robustness values, is a representative short-chain fatty acid-producing bacteria, and has been reported to have anti-inflammatory effects in adults.
  • Eubacterium eligens, Anaerostipes hadrus, and Blautia wexlerae are also short-chain fatty fish fungi, which typically produce butyric acid, which regulates immunity and relieves inflammation. Eubacterium eligens helps digestion by decomposing pectin, a water-soluble dietary fiber that is present in many fruits and vegetables. Anaerostipes hadrus is known to be associated with the alleviation of irritable bowel syndrome, and Blautia wexlerae is known to be present in the gut of obese people in a lower proportion than healthy people.
  • FIG. 13 which shows the biomarkers of the intestinal imbalance group of infants and toddlers in developmental stage 2, the most specific biomarkers are lactic acid bacteria such as Enterococcus, Lactobacillus, Streptococcus (subgroup 25), and Bifidobacterium (subgroup 30).
  • the E. coli family Haemophilus (Subgroup 28), Escherichia, Klebsiella, and Citrobacter (Subgroup 29) of Phylum Proteobacteria were also selected as biomarkers associated with developmental stage 2.
  • Microorganisms of E. coli are microorganisms that help stabilize the intestinal environment in the early stages, but they have a harmful effect in the intestinal environment where the balance is broken. Haemophilus can cause inflammation in the intestine, and in particular, Clostridioides difficile is the causative agent of difficile infection.
  • Clostridiales which produce short-chain fatty acids.
  • Clostridiales which produce short-chain fatty acids.
  • the robustness value of the biomarker is lower than that of the microbial species of order Clostridiales of the intestinal balance group-specific biomarker, it can be seen that there are relatively few cases where the biomarker is significantly calculated.
  • Bacteroides When looking at Prevotella and Bacteroides of the phylum Bacteroidetes in developmental stage 2, Bacteroides is included in the balance group-specific biomarker, and Prevotella is included in the imbalance-specific biomarker. Therefore, the more ideal intestinal microbial ecosystem type in the early childhood period is judged as Bacteroides type. do.

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Biophysics (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)

Abstract

본 발명은 영유아의 장내 미생물 분석을 이용하여 시험 대상 영유아의 장내 미생물 불균형 정보를 제공하는 방법에 관한 것으로서, 영유아 장내 미생물 불균형의 판단 또는 영유아의 장내 미생물 불균형에 대한 정량적인 예측이 가능하다. 보다 구체적으로, 본 발명은 장내 미생물 분석을 이용하여 영유아의 장내 미생물 발달 단계를 규정하고, 상기 발달 단계에 기초하여 영유아의 장내 미생물 불균형 정보를 제공하는 방법을 제공한다.

Description

영유아의 장내 미생물 불균형도를 탐지하는 방법
본 발명은 영유아의 시료 및/또는 메타 데이터를 분석하여 영유아의 장내 미생물 불균형도의 탐지 방법 및 상기 탐지방법으로 얻어진 영유아의 장내 미생물 불균형도를 개선하는 방법에 관한 것이다.
인간의 몸에는 인체의 세포 수보다 많은 미생물들이 피부, 소화기, 호흡기 등 다양한 부위에서 인체와 상호 작용하며 살아가고 있다. 인체에 존재하는 미생물의 대부분 장 내에 서식하고 있는데, 거듭된 연구와 실험 기술의 발달로 인하여 장내 미생물의 기능과 효과가 점차 알려지고 있다. 장내의 미생물은 인간의 면역, 영양 흡수와 관련이 있으며, 스트레스 호르몬인 코티졸 분비를 조절하여 기분이나 정신적인 문제에도 영향을 미친다. 장내 미생물은 식이 습관 및 숙주의 상태에 따라 변화하고, 개인별로 다르게 형성되어 있다.
인체 장내 미생물은 인간이 태어나는 순간부터 형성되기 시작하며, 생애 초기 단계의 면역, 대사, 영양적인 측면에서 중요한 역할을 수행한다. 영유아의 장내 미생물 조성은 성인과 분명히 구별되며, 수유 시기, 이유식, 일반식을 거치면서 점차적으로 성인의 장내 미생물과 유사한 군집 구조를 보인다. 영양 섭취 방법과 더불어 영유아의 장내 미생물에 큰 영향을 주는 주요 요소는 자연분만이나 제왕절개 등과 같은 분만 형태, 항생제 투약 여부 등이다.
장내 미생물 불균형 (Dysbiosis)은 장내 미생물 생태계가 불균형을 이룬 상태를 일컫는 용어로, 장내 미생물 불균형이 염증성 장 질환, 비만, 당뇨, 자폐증 등의 현대 질환과 직간접적으로 연관되어 있다는 연구가 최근 늘어나고 있다. 장내 미생물 불균형은 무분별한 가공식품 섭취, 항생제 복용 등의 요인에 의해 발생하는 것으로 알려져 있다.
영유아 장내 미생물 군집 연구는 천이 (Succession) 과정 및 영유아 장내 미생물의 성숙도에 대한 관점으로 진행된 바 있으나, 장내 미생물 불균형 관점에서 영유아 장내 미생물을 해석한 연구는 아직 미흡하다. 영유아의 장내 미생물 생태계는 아이가 정상적으로 성장하고 있는 경우에도 안정적이지 않다. 따라서, 영유아 장내 미생물 불균형 정도를 성숙 단계에 따라 적절하게 규정하는 시도가 필요하다. 영유아 장내 미생물 데이터 및/또는 메타 데이터를 포함하는 데이터베이스를 이용한 영유아 장내 미생물 불균형 상태의 규명은, 장내 미생물의 생리적 기능이나 면역작용과 같은 인체와의 상호작용에 있어 필수적인 연구주제라고 할 수 있다.
이에, 본 발명은 비배양 분석 방법으로 분석한 영유아 장내 미생물 군집 데이터베이스를 구축하였으며, 장내 미생물 불균형의 지표가 되는 여러 가지 메타 데이터를 함께 고려하여 유의미한 패턴을 탐색하는 연구를 진행하였다. 또한, 대량 데이터 분석에 효과적인 기계학습을 통해 장내 미생물 관점에서 영유아 발달 단계, 영유아 장내 미생물 불균형 상태, 및 영유아 장내 미생물 불균형 지표종을 규정하였다.
본 발명의 일 예는, 영유아의 장내 미생물 군집 분석을 이용하여 영유아 장내 미생물 불균형 정도를 탐지 또는 분석하는 방법을 제공하는 것이다. 상기 영유아의 장내 미생물 군집 분석에 영유아 장내 미생물 불균형 정도를 탐지하는 미생물 바이오마커를 이용할 수 있다.
본 발명의 일 예는, 영유아의 장내 미생물 군집 분석을 이용하여 영유아 장내 미생물 불균형 정도를 탐지 또는 분석하는 방법을 제공하는 것이다. 상기 영유아의 장내 미생물 군집 분석에 영유아 장내 미생물 불균형 정도를 탐지하는 미생물 바이오마커를 이용할 수 있다.
본 발명의 추가 예는 상기 영유아 장내 미생물 불균형 정도를 탐지하는 미생물 바이오마커 또는 상기 바이오마커를 검출하는 제제를 포함하는, 영유아 장내 미생물 불균형 정도 및/또는 장 발달단계의 탐지용 조성물 또는 키트를 제공하는 것이다.
본 발명의 추가 예는 상기 영유아 장내 미생물 불균형 정도를 탐지하는 미생물 바이오마커 또는 상기 바이오마커를 검출하는 제제를 포함하는, 장내 미생물을 이용한 영유아의 장 성숙도의 탐지용 조성물 또는 키트를 제공하는 것이다.
본 발명의 추가 일 예는 상기 얻어진 영유아의 장내 미생물 불균형도를 개선하는 방법 또는 영유아의 장내 미생물 성숙도를 높이는 방법에 관한 것이다. 상기 바이오마커를 검출하는 제제를 포함하는 영유아 장내 미생물 불균형의 판별용 또는 위험도 예측용 키트를 제공하는 것이다.
본 발명은 배양 비의존적 방법(CIMs)으로 속(Genus) 또는 종(Species) 수준의 정확도를 가지는, 영유아의 장내 미생물 불균형 판별용 또는 위험도 예측용 바이오마커를 제공하는 것이다. 또한, 본 발명은 영유아 장내 미생물 군집 분석을 활용하여 영유아 장내 미생물 불균형의 판별 또는 위험도 예측하는 방법에 관한 것이며, 이에 따라 장내 미생물 불균형 해소를 위한 추가 처치단계를 포함하여 영유아 성장 상태를 개선할 수 있는 방법에 관한 것이다. 구체적으로, 영유아의 장내 미생물 군집을 분석하여 영유아의 장내 미생물 불균형 및 성장 상태를 진단할 수 있는 정보를 제공할 수 있다.
영유아 시기는 장내 미생물 환경이 만들어지는 시기이며, 미생물 군집이 지속적으로 변화하며, 장내 미생물의 환경의 균형을 점착 찾아가게 된다. 따라서, 성인과 달리 영유아의 장내 미생물 군집의 균형 또는 불균형 여부의 결정은 다양한 인자를 고려하여 설정해야 한다. 따라서, 본 발명은 영유아의 장내 미생물의 균형여부 또는 발달 상태를 탐지하기 위해, 장내 미생물 군집을 활용한 영유아의 장내 미생물 불균형도 또는 발달 상태를 탐지하고자 하며, 더욱 바람직하게는 영유아의 메타데이타 정보, 예를 들면, 월령, 식이, 분만방법. 항생제 투여 이력 등의 정보를 조합하여 탐지할 수 있다.
본 명세서에서 영유아 장내 미생물의 불균형군 또는 장내 미생물의 불균형 이라 함은 장내 미생물의 불균형에 양의 상관성을 갖는 또는 장내 미생물의 불균형에 기여하거나 초래하는 메타 데이터와 연관되어 있는 장내 미생물 군집을 보유한 샘플군을 의미하고, 균형군이라 함은, 장내 미생물의 균형에 양의 상관성을 갖는 또는 장내 미생물의 균형에 기여하거나 초래하는 메타 데이터와 연관되어 있는 장내 미생물 군집을 보유한 샘플군을 의미한다.
예를 들면, 장내 미생물 불균형과 관련된 메타 데이터는 장내 미생물 불균형을 일으키는 것으로 알려진 설사, 제왕절개, 항생제 복용, 분유 수유이다. 동일한 발달 단계 내에서, 장내 미생물 불균형 관련 그룹과 구별되는 샘플군은 모유 수유, 자연 분만과 관련되어 있으므로 장내 미생물의 균형과 관련된 그룹으로 규정할 수 있다. 장내 미생물의 불균형 및 장내 미생물의 균형과 강한 연관을 보이는 메타 데이터 인자를 정리하면, 영유아의 발달단계를 1 및 2그룹으로 구분하는 경우, 발달단계 1의 균형 그룹은 자연분만 및 모유수유이며, 불균형 그룹은 설사 및 항생제 투여 경험이고, 발달단계 2의 균형 그룹은 자연분만이며, 불균형 그룹은 설사 및 항생제 투여 경험이다.
상기 영유아 발달 단계는 식이단계, 월령 및 영유아 발달 지수 (장내 미생물 군집의 정보에 기초)로 이루어지는 군에서 선택된 1종 이상의 기준으로 판별할 수 있으며, 상기 영유아 발달 지수는 발달단계 특이적 바이오마커를 이용하여 구분할 수 있으며, 각 발달 단계에 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 발달지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 발달지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 발달단계 1로 선정하고, 설정값 이상인 경우를 발달단계 2로 선정한다. 본 발명의 일 예에 따라 영유아의 발달 단계에 특이적인 미생물 바이오마커의 일예는 영유아의 발달단계 1에 특이적인 바이오마커는 하기 표 10 및 표 11에 기재되어 있고, 발달단계 2에 특이적인 바이오마커는 하기 표 12 및 표 13에 기재되어 있다.
상기 영유아의 "장내 미생물의 불균형도"라 함은 영유아의 성장 속도에 맞는 장내 미생물 군집 환경 (장내 미생물의 균형)에 근접 여부 또는 장내 미생물 군집의 발달 상태를 의미한다. 이에, 본 발명에 따른 영유아의 장내 미생물 군집의 불균형도를 검출하여 영유아의 장내 미생물 군집의 발달 상태를 파악하고, 아이의 성장속도에 맞추어 적정 속도로 장내 미생물 군집의 균형도를 달성하고자 한다.
본 발명의 구체적 일 예에서, 본 발명에 따른 영유아의 장내 미생물 군집 불균형군과 균형군의 구별은 발달단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 수행할 수 있다.
구체적으로, 발달단계 1의 균형군 특이적 바이오마커는 표 29 및 표 30과 도 10의 계통도에 나타내고, 발달단계 1의 불균형군 특이적 바이오마커는 표 33 및 표 34과 도 11의 계통도에 나타낸다. 또한 발달단계 2의 균형군 특이적 바이오마커는 표 31, 표 32 및 도 12의 계통도에 나타내고, 발달단계 2의 불균형군 특이적 바이오마커는 표 35 및 표 36과 도 13의 계통도에 나타낸다.
본 발명에 따른 탐지 방법에 의해 분석한 영유아의 장내 미생물 불균형도 탐지결과로서, 미생물 생태나이, 미생물의 다양성, 유익한 미생물, 또래 영유아의 장내 미생물 우점종에 대한 정보를 제공할 수 있다. 미생물 생태나이(microbiota age)는 아이의 성장 속도에 따른 장내 미생물 군집이 성숙 정도를 나타내며, 예를 들면 영유아의 월령 별 장내 미생물 군집의 균형도 또는 불균형도로 표시할 수 있다. 미생물 다양성(commensal diversity)은 장내 미생물 종류의 다양성을 나타내며, 장내 존재하는 미생물의 종류의 다양성으로 표시될 수 있다. 유익한 미생물은 영유아의 성장에 긍정적 영향을 미치는 미생물의 분포를 의미한다. 장내 미생물 군집에서 유익한 미생물의 발달이 부족하면 질환 발생 위험이 높아진다. 유산균은 초기 장내 미생물 군집에서 소화를 도와 영양분 흡수에 기여하고 면역력을 강화하는 역할을 하고 있으며, 장내 미생물 군집이 안정을 찾으면 사라져 그 비율이 감소한다.
이하, 본 발명에 따른 영유아 장 발달단계 및/또는 장내 미생물 불균형도 탐지방법에 대해 구성 단계 별로 상세히 설명하고자 하다.
본 발명의 일 예에서, 영유아 장내 미생물 불균형도 탐지방법은 하기 단계를 포함할 수 있다:
(A) 시험대상 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 얻는 단계,
(B) 시험대상 영유아의 메타데이타 정보를 얻는 단계,
(C) 상기 단계(A)의 장내 미생물 군집 정도 및 단계(B)의 메타데이타 정보로 이루어지는 군에서 선택된 1이상의 정보에 근거하여, 기준 영유아의 발달 단계 구분기준에 따라 장내 미생물 군집의 발달 단계를 선정하는 단계, 및
(D) 상기 선정된 발달 단계에 따라, 발달 단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 장내 미생물 군집의 불균형군 또는 균형군 여부를 결정하는 단계.
더욱 자세하게는, 본 발명의 일 예에서 영유아 장내 미생물 불균형도 탐지방법의 (A) 시험대상 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 얻는 단계는, 다양한 방법으로 시험 대상의 미생물 군집 정보를 얻을 수 있으며, 예를 들면
(A-1) 시험 대상의 시료, 예컨대 대변 시료로부터 장내 미생물의 유전체 DNA를 얻는 단계;
(A-2) 상기 장내 미생물 유전체 DNA로부터 16S rRNA 유전 정보를 얻는 단계; 및
(A-3) 상기 장내 미생물의 16S rRNA 정보를 분석하여 시험대상 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 분석하는 단계를 포함할 수 있다.
(A-1) 실험 대상 영유아의 대변 시료로부터 장내 미생물의 유전체 DNA를 얻는 단계
상기 시험 대상은 영유아일 수 있으며, 본 발명에서 "영유아"란, 생후 36개월 이하의 신생아 또는 유아를 의미한다.
본 발명의 일 실시예에서, 국제건강기구(WHO)에서 규정한 대로 생후 4주 초과 내지 만 3세(36개월)의 영유아를 선별하여, 각 영유아의 법정대리을 통해 채집된 시험 대상 영유아의 분변 총 120개 샘플을 수집하였다. 상기 시험 대상의 대변 샘플은 미생물의 변이를 막는 완충액에 담겨 수집되었다. 상기 완충액은 4%(w/v) SDS(Sodium Dodecyl Sulfate), 50mM Tris-HCl, 50mM EDTA 및 500mM NaCl로 구성되었다.
상기 수집된 대변 시료로부터 DNA를 얻는 단계는 배양 비의존적 방법(CIMs)으로 이루어질 수 있다. 상기 배양 비의존적 방법을 이용함으로써, 미생물 배양 과정에서 발생하는 데이터 왜곡을 방지할 수 있으며, 실제 장내 미생물 생태계와 유사한 미생물 군집 규모 정보를 얻을 수 있는 장점이 있다.
(A-2) 상기 장내 미생물 DNA로부터 장내 미생물의 16S rRNA 유전 정보를 얻는 단계
상기 16S rRNA 유전 정보를 얻는 단계는, 차세대 유전체 염기서열분석(NGS) 플랫폼을 이용하여, 상기 추출된 DNA의 16S rRNA 유전자 서열을 분석하는 단계일 수 있다.
상기 추출된 DNA의 16S rRNA 유전자 서열을 분석하는 단계는, 16S rRNA의 가변 영역(variable region)을 특이적으로 증폭할 수 있는 프라이머 세트를 이용하여 PCR을 수행하는 단계, 바람직하게는 16S rRNA의 V3 내지 V4 영역을 특이적으로 증폭할 수 있는 프라이머 세트를 이용하여 PCR을 수행하는 단계, 더욱 바람직하게는 하기 서열을 갖는 universal primer를 이용하여 PCR을 수행하여 앰플리콘을 생성하는 단계를 포함할 수 있으며, universal primer의 예시적인 서열은 하기와 같다:
정방향 universal primer (서열번호 161): 5'-CCTACGGGNGGCWGCAG -3'
역방향 universal primer (서열번호 162): 5'-GACTACHVGGGTATCTAATCC -3'
(A-3) 상기 장내 미생물의 16S rRNA 정보를 분석하여 시험대상 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 분석하는 단계
군집 정보를 분석하는 단계는, 상기 차세대 유전체 염기서열분석 (NGS)기법으로 하나의 샘플에서 생성된 수천 개의 유전자 서열을 표준 균주 및 비배양 미생물의 16S 리보솜 RNA 유전자 서열 데이터베이스 (EzTaxon) 및 이지바이오클라우드 분석시스템 (http://www.ezbiocloud.com)으로 미생물 커뮤니티(bacterial community) 정보를 문(phylum)에서 종(species) 수준까지 분석하는 단계일 수 있다. 차세대 유전체 염기서열분석기법의 결과물이 같다면, 군집 정보 분석을 위한 방법은 Eztaxon 및 이지바이오클라우드 분석 시스템에 국한되지 않는다.
상기 미생물 마커는, 상기 기계 학습을 수행하기 위한 부트스트랩 반복 결과, 전체 반복 수 중 각 미생물이 특정 발달 단계 특이적인 미생물로 판정된 횟수의 비율을 근거로 선별되는 것일 수 있다. 바람직하게는, 상기 미생물 마커의 선별 단계 이후, 선별된 미생물 마커의 해당 발달 단계에서의 군집 규모가 다른 발달 단계에서의 군집 규모에 비해 낮은 경우, 해당 미생물 마커를 제외하는 검증 단계를 추가로 포함할 수 있다. 바람직하게는, 상기 미생물 마커는 서열번호 1 내지 160의 염기서열 중 어느 하나의 염기서열로 이루어지는 16S rRNA를 포함하는 미생물일 수 있다.
상기 미생물 군집을 분석하는 단계는, 표준 균주 및 비배양 미생물의 16S rRNA 유전자 서열의 데이터베이스를 이용하여, 상기 분석된 16S rRNA 유전자 서열을 분석하여, 서열번호 1 내지 160의 염기서열 중 어느 하나의 염기 서열을 가지는 미생물 바이오마커 군집 규모(population)를 분석하는 단계를 포함할 수 있다.
상기 미생물 군집을 분석하는 단계는, 본 발명에서 제공하는 서열번호 1 내지 160의 16S rRNA를 포함하는 미생물의 존부를 확인하고 존재가 확인된 미생물에 대해서만 군집 규모를 분석함으로써, 전체 미생물 군집을 동정하는 것보다 영유아 장내 미생물 불균형의 판별 및 예후 예측에 필요한 시간과 노동력을 절감할 수 있다.
상기 미생물 군집을 분석하는 단계는, 16S rRNA 데이터베이스를 이용하여 미생물을 속 또는 종 수준으로 동정 및 분류하는 단계 및/또는 각 미생물 군집 규모(population)를 분석하는 단계를 포함하는 것일 수 있다.
상기 미생물의 동정 및 분류에 사용되는 데이터베이스는 필요에 따라 당업자가 적절히 선택하여 사용할 수 있으며, 예를 들어, EzBioCloud, SILVA, RDP 및 Greengene으로 이루어지는 군에서 선택되는 하나 이상의 데이터베이스일 수 있으나, 이에 제한되는 것은 아니다.
상기 미생물 군집 규모는 전체 장내 미생물 균총에서 특정 미생물 군집이 차지하는 비율(%)로 나타내어질 수 있다. 상기 미생물 군집이 차지하는 비율(%)은 전체 시퀀싱 리드 수 중 특정 미생물의 16S rRNA 리드 수 빈도(frequency)의 백분율로 나타내어 질 수 있다. 상기 특정 미생물은 본 발명이 제공하는 영유아 장내 미생물 불균형의 판별 또는 예측용 미생물 바이오마커일 수 있다.
(B) 시험대상 영유아의 메타데이타 정보를 얻는 단계
본 발명의 영유아 장내 미생물 불균형의 판별 또는 예측에 관한 정보를 제공하는 방법은, (B) 시험 영유아로부터 장내 미생물 불균형 관련 항목이 포함된 메타 데이터를 수집하는 단계를 포함한다.
상기 메타 데이터의 수집 단계는 상기 제(A-1)단계의 시험 대상의 대변 시료 수집과 동시에 및/또는 이시에 이루어질 수 있다.
상기 메타 데이터는 영유아의 발달 단계, 건강 상태, 및/또는 장내 미생물 불균형 상태를 판단하기 위한 인자라면 제한없이 수집되어 분석에 이용될 수 있으며, 예를 들어 영유아의 성별, 월령, 키, 체중, 영유아의 식이 형태, 수유 방법, 유산균 포함 식이 진행 여부, 대변의 형태, 대변의 색, 항생제 복용 정보, 질병 진단 정보, 모체의 해당 영유아 임신기간 중 식이 형태, 영유아의 출산 후 모체의 식이 형태 및 모체의 항생제 복용 정보로 이루어지는 군에서 선택되는 하나 이상의 인자를 포함하는 데이터를 수집할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 메타 데이터 수집 과정에서 수집되는 정보 중 상기 식이 형태 정보는, 유산균을 포함하는 식이 섭취 여부, 발효 식품의 섭취 정보, 또는 비발효 건강기능식품 또는 비발효식품의 섭취 정보로 이루어지는 군에서 하나 이상의 정보일 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 일 실시예에서, 다양한 설문 항목을 이용하여 장내 미생물 불균형 정보 관련 메타 데이터가 수집되었다. 상기 메타 데이터를 얻는 단계는, 설문 항목을 이용하여, 장내 미생물 불균형에 영향을 미칠 수 있는 인자가 포함된 설문 항목에 대한 전체 설문 항목의 답변을 상기에서 분석한 16S rRNA 시퀀스 데이터에 첨부 수집하여 저장 혹은 데이터베이스화 하는 단계일 수 있다.
구체적 설문은 설문은 수유식, 이유식, 유아식 및 일반식 중에서 샘플 수집 시에 해당하는 식이 유형으로 설문지를 작성할 수 있도록 설문지를 A(수유), B(이유), C(일반)의 세 가지 유형으로 나누었으며, 설문지 유형은 연구대상 영유아의 법정대리인의 판단으로 선택하도록 하였다. 설문 항목은 분만 방법, 수유 방법, 이유식, 유아식 및 일반식의 종류, 대변 형태 등으로 이루어져 있다. 구체적인 설문 문항을 표 2에 나타내었다.
(C) 상기 단계(A)의 장내 미생물 군집 정도 및 단계(B)의 메타데이타 정보로 이루어지는 군에서 선택된 1이상의 정보에 근거하여, 기준 영유아의 발달 단계 구분기준에 따라 장내 미생물 군집의 발달 단계를 선정하는 단계
상기 시험 영유아의 발달 단계 구분기준를 선정하는 방법은, 식이단계, 월령 및 영유아 발달 지수 (장내 미생물 군집의 정보에 기초)로 이루어지는 군에서 선택된 1종 이상의 기준으로 판별할 수 있다. 상기 영유아 발달 지수는 하기 표 10 내지 표 13의 바이오마커는 영유아의 장내 미생물 군집의 발달 단계를 구분하는 바이오마커로서 2차로 선정된 최종 바이오마커를 활용한 것이다. 하기 표 14에 각 발달 단계 판별 기준에 따른 발달 단계 판별 방법을 요약하였다.
구체적으로, 식이단계를 이용한 영유아 발달 단계의 구분, 월령을 이용한 영유아 발달 단계의 구분 또는 발달단계 특이적 바이오마커를 이용한 영유아 발달 단계의 구분할 수 있다.
상기 발달단계 특이적 바이오마커를 시험 영유아의 발달 단계를 선정하는 방법은, 시험 영유아의 대변으로부터 수집한 16S rRNA 분석 결과를 영유아 장내 미생물 발달 단계 예측 모델에 적용하고 영유아 발달 지수를 계산하는 단계를 포함한다.
상기 기준 영유아의 발달 단계 구분기준은,
(A')기준 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 얻는 단계,
(B')기준 영유아의 메타데이타 정보를 얻는 단계, 및
(C')상기 단계(A')의 장내 미생물 군집 정도 및 단계(B')의 메타데이타 정보로 이루어지는 군에서 선택된 1이상의 정보에 근거하여, 기준 영유아의 발달 단계 구분기준을 결정하는 단계를 포함한다.
상기 단계(C')에서 기준 영유아의 발달 단계 구분기준을 결정하는 단계는, 기준 영유아의 식이단계, 월령 및 발달단계 특이적 미생물 바이오마커로 이루어지는 군에서 선택된 1종 이상을 이용하여 수행될 수 있다.
상기 단계(C)에서 발달 단계를 선정하는 단계에서, 기준 영유아의 발달 단계 구분기준은 고형 식이, 생후 15개월 도과 여부 또는 영유아 발달지수 1.19 충족 여부인 것일 수있다.
식이단계를 이용한 영유아 발달 단계의 구분
식이단계를 통한 영유아 발달 단계 판별은, 영유아가 섭취하는 식이를 액상의 수유식, 겔상의 이유식, 고형의 유아식 및 고형의 일반식으로 분류하고, 영유아의 메타데이타 정보 (식이)에 근거하여 액상의 수유식 또는 겔상의 이유식 식이 단계를 발달단계 1로, 고형 식이 즉 유아식 또는 일반식을 섭취하는 단계를 발달단계 2로 분류하는 방법이다. 따라서 액상 또는 겔상의 수유식 또는 이유식에서 고형의 식이를 섭취하는 시점을 판단 기준으로 삼는다.
월령을 이용한 영유아 발달 단계의 구분
생후 개월수(월령)를 기준으로 한 발달 단계 판별의 경우, 영유아의 메타데이타 정보 (영유아의 월령)에 근거하여, 조사 대상 영유아의 월령이 15개월 미만인 경우 발달단계 1로, 월령이 15개월 이상인 경우 발달단계 2로 판별한다. 식이 형태가 겔상에서 고형으로 전환되는 시기와, 실시예 4-2의 DMM clustering 방법을 통해 그룹이 분류된 시기를 통해 15개월이라는 기준을 규정하였다. 따라서, 상기 방법으로 규정한 15개월이라는 기준은 식이 단계가 가장 뚜렷하게 나누어지는 시기인 것과, 장내 미생물 군집의 미생물 종류와 각각의 미생물 점유율이 가장 크게 변화하는 시기인 것을 의미한다. 출생 직후의 영유아 장내 미생물은 면역, 모유의 소화 및 장내 안정화 등에 기여하는 미생물 종류가 주를 이루며, 15개월을 기점으로 미생물 종 다양성이 큰 폭으로 증가하고 식이섬유 등 다양한 음식물의 대사와 관련된 미생물 종류가 주를 이룬다.
발달단계 특이적 바이오마커를 이용한 영유아 발달 단계의 구분
영유아 발달 지수를 기준으로 하는 경우, 수집된 장내 미생물의 군집 분석 데이터에 근거하여 각 발달 단계에 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 상술한 영유아 발달 단계 예측 모델에 적용함으로써 발달 단계를 판별하는 방법이다.
상기 발달단계 특이적 미생물 바이오마커를 이용하여 발달단계 1 및 발달단계 2로 구분하는 경우, 상기 발달단계 1에 특이적인 바이오마커는 상기 표 10 및 표 11에 기재된 균종으로 이루어지는 군에서 선택된 1종 이상이고, 상기 발달단계 2에 특이적인 바이오마커는 상기 표 12 및 표 13에 기재된 균종으로 이루어지는 군에서 선택된 1종 이상일 수 있다.
각 발달 단계에 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 발달지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 발달지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 발달단계 1로 선정하고, 설정값 이상인 경우를 발달단계 2로 선정한다.
상기 단계(C')에서 기준 영유아의 발달 단계 구분기준을 결정하는 단계는, 영유아의 발달 단계 1 내지 2의 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 영유아 발달 지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 영유아 발달 지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 발달 단계 1로 선정하고, 설정값 이상인 경우를 발달 단계 2로 선정하는 것이다.
상기 단계(C)에서 발달 단계를 선정하는 단계에서, 시험대상 영유아의 발달 단계에 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 영유아 발달 지수를 산정하고,
상기 시험대상 영유아의 산정된 영유아 발달 지수가, 상기 기준 영유아의 발달 단계 구분기준인 cut-off 값을 기준에 따라 설정값 미만인 경우를 발달 단계 1로 선정하고, 설정값 이상인 경우를 발달 단계 2로 선정하는 것일 수 있다.
본 실험에서는, 상기 실시예 4-7에 의해, 발달지수 1.19를 기준으로 1.19 미만인 경우 발달단계 1로, 발달지수 1.19 이상인 경우 발달단계 2로 판별한다.
설문의 응답에 의존하는 식이 단계 및 생후 개월 수를 기준으로 발달 단계를 판별하는 경우, 상기 표 2의 문항을 포함하는 형태의 설문에 대한 응답이 선행되어야 한다. 영유아 발달 지수를 기준으로 한 판별의 경우, 실시예 2의 방법을 이용한 장내 미생물 분석이 선행되어야 한다.
영유아 장내 미생물 생태계는 부모 및 주변 환경에 상주하는 미생물들이 무균 상태의 신생아에 전달되어 정착해 나감으로써 형성되고, 영유아의 성장과 식이에 따라 영유아 장내의 종 풍부도 및 다양성이 증가한다. 이러한 증가 추세에서, 영유아 발달 단계 특이적 바이오마커는 영유아의 성장에 따른 장내 미생물 생태계의 발달 양상을 구체적으로 나타낸다. 영유아의 발달단계 1에 특이적인 바이오마커는 상기 표 10 및 표 11에 기재되어 있고, 발달단계 2에 특이적인 바이오마커는 상기 표 12 및 표 13에 기재되어 있다.
상기 영유아 발달 지수는, 하기 수학식 4 내지 7의 수학식를 이용하여 산출하여 수행되는 것일 수 있다:
[수학식 4]
Figure PCTKR2020007494-appb-I000001
[수학식 5]
Figure PCTKR2020007494-appb-I000002
[수학식 6]
Figure PCTKR2020007494-appb-I000003
[수학식 7]
Figure PCTKR2020007494-appb-I000004
(D) 상기 선정된 발달 단계에 따라, 발달 단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 장내 미생물 군집의 불균형군 또는 균형군 여부를 결정하는 단계
시험 영유아의 장내 미생물 불균형 여부를 선정하는 방법은, 상기에서 판별한 시험 영유아의 발달 단계에 따라, 발달 단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 수행한다.
본 발명에 따른 영유아의 장내 미생물 군집 불균형군과 균형군의 구별은 발달단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 수행할 수 있다.
구체적으로, 발달단계 1의 균형군 특이적 바이오마커는 표 29 및 표 30과 도 10의 계통도에 나타내고, 발달단계 1의 불균형군 특이적 바이오마커는 표 33 및 표 34과 도 11의 계통도에 나타낸다. 또한 발달단계 2의 균형군 특이적 바이오마커는 표 31 및 표 32 도 12의 계통도에 나타내고, 발달단계 2의 불균형군 특이적 바이오마커는 표 35 및 표 36과 도 13의 계통도에 나타낸다.
구체적인 일예에서, 표 37의 영유아 장내 미생물 불균형 판별 기준을 이용하여, 상기 시험 영유아의 대변으로부터 수집한 16S rRNA 분석 결과를 영유아 장내 미생물 불균형 예측 모델에 적용하고 영유아 장내 미생물 불균형 지수를 계산하는 단계를 포함한다.
상기 영유아 장내 미생물 불균형 예측 모델은 영유아 장내 미생물 불균형 및/또는 장내 균형 예측용 미생물 바이오마커의 장내 미생물 군집 규모를 데이터베이스와 대조하여 시험 대상의 영유아 불균형 지수를 계산하기 위한 파라미터를 제공하는 것일 수 있다.
상기 영유아 장내 미생물 불균형 예측 모델은 시험 대상에서 검출된 영유아 장내 미생물 불균형군 및/또는 균형군 특이적 바이오마커 목록 및 coefficient값을 기계 학습 함수 및 지수화 수학식(하기 수학식 1 내지 7)에 대입하여 미지 시료에 대한 영유아 불균형 지수를 계산하고 영유아 장내 미생물 불균형의 판별 및/또는 예측에 활용하는 것일 수 있다.
상기 데이터베이스는 미생물 바이오마커 특정을 위해 수집된 영유아 샘플군의 장내 균총 데이터베이스를 활용하는 것일 수 있으며, 구체적으로, WHO에서 명시한 생후 4주 초과 내지 만 3세(36개월)이하의 영유아를 대상으로 모집한 인체 장내 마이크로바이옴 데이터베이스일 수 있다.
상기 영유아 장내 미생물 불균형 예측 모델은 기계 학습(machine learning)을 이용하여 영유아 장내 미생물 불균형이군 및/또는 장내 균형군 특이적 미생물 바이오마커를 선별 및 영유아 장내 미생물 불균형 판별을 위한 영유아 장내 미생물 불균형 지수를 계산하여 영유아 장내 미생물 불균형을 판별할 수 있는 것을 특징으로 한다.
미생물 군집 분석 결과를 지수화하는 단계는 기계 학습 함수 및 지수화 수학식(하기 수학식 1 내지 7)에 대입하여 미생물 마커와 해당 마커의 Coefficient 값을 이용하여 영유아 장내 미생물 불균형 판별을 위한 영유아 장내 미생물 불균형 지수를 계산하는 과정을 포함할 수 있다.
상기 단계(c') 기준 영유아의 발달 단계 구분기준을 결정하는 단계이후에, 기준 영유아의 상기 단계 (D')에서 발달 단계별 불균형군의 결정 기준을 선정하는 단계를 추가로 포함하며,상기 단계 (D')에서 발달 단계별 불균형군의 결정 기준은, 기준 영유아의 각 발달 단계별 균형군 또는 불균형군 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 불균형 결정 지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 불균형 판결 지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 균형군로 선정하고, 설정값 이상인 경우를 불균형군으로 선정하는 것일 수 있다.
상기 시험 대상이 영유아 장내 미생물 불균형인지 여부를 결정하는 단계는 상기 지수가 전체 데이터베이스의 영유아 장내 미생물 불균형 지수 분포상의 위치를 결정하는 단계를 포함할 수 있다. 상기 영유아 미생물 불균형 지수는 전체 데이터베이스의 영유아 장내 미생물 불균형 지수 분포에서, 균형 구간에 포함되거나 가까워 질수록 장내 미생물 불균형의 예후가 좋아지는 것으로 판단할 수 있다. 상기 전체 데이터베이스는 예를 들어, 상기 예측 모델의 구축에 사용된 트레이닝 세트, 테스트 세트 및 시험 대상 시료를 포함하는 전체 샘플의 영유아 장내 미생물 불균형 지수 데이터베이스일 수 있으나, 이에 제한되는 것은 아니다.
상기 (D) 장내 미생물 군집의 불균형군 또는 균형군 여부를 결정하는 단계에서, 시험대상 영유아의 각 발달 단계별 균형군 또는 불균형군 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 불균형 결정 지수를 산정하고,
상기 시험대상 영유아의 산정된 불균형 결정 지수가, 상기 기준 영유아의 불균형 결정 지수의 구분기준인 cut-off 값 기준에 따라 설정값 미만인 경우를 균형군으로 선정하고, 설정값 이상인 경우를 불균형군로 선정하는 것일 수 있다.
상기 불균형 결정 지수는, 하기 수학식 4 내지 7의 수학식를 이용하여 산출하여 수행되는 것일 수 있다:
[수학식 4]
Figure PCTKR2020007494-appb-I000005
[수학식 5]
Figure PCTKR2020007494-appb-I000006
[수학식 6]
Figure PCTKR2020007494-appb-I000007
[수학식 7]
Figure PCTKR2020007494-appb-I000008
상기 영유아 장내 미생물 불균형 지수는 영유아 장내 미생물 불균형 지수의 분포 구간을 적어도 2 이상의 구간으로 구분하여 표시하는 것일 수 있으며, 바람직하게는 발달 단계에 따라 적정, 빠름, 느림의 3개의 구간으로 구분하여 표시할 수 있다.
상기 구간의 구분은 상기 영유아 장내 불균형 지수의 특이도가 가장 높은 값을 기준으로 하여 구분되는 것일 수 있다.
본 발명의 일 예에서, 발달 단계 1과 발달 단계 2에서 각각 영유아 장내 불균형 지수를 기준으로 불균형 및 균형 단계를 분류하였으며, 발달 단계 별로 하위 0 내지 70%는 균형, 70 내지 100%는 불균형 단계로 분류하였다.
보다 구체적으로, 발달 단계 1에서 하위 0 내지 70%는 적정, 70 내지 100%는 '빠름' 단계이며, 발달 단계 2에서 하위 0 내지 70%는 적정, 70 내지 100%는 '느림' 단계로 규정하였다.
상기 구분에서, '빠름' 및 '느림' 단계는 발달 단계 1에서 나타나는 장내 불균형 특이적 바이오마커가 발달 단계 2에서 주로 나타나는 미생물들인 점과, 발달 단계 2에서 나타나는 장내 불균형 특이적 바이오마커는 발달 단계 1에서 주로 나타나는 미생물들인 점을 통해 규정하였다.
본 발명의 영유아 장내 미생물 불균형의 예측에 관한 정보를 제공하는 방법은, 시간에 따른 시험 대상의 영유아 장내 미생물 불균형 지수 변화를 모니터링하는 단계를 더 포함할 수 있다.
상기 시간에 따른 영유아의 장내 미생물 불균형 지수 변화를 모니터링하는 단계는, 시간의 경과에 따라 영유아 장내 미생물 불균형 지수 분포 구간이 하위 0%에 가까워 질수록 예후가 좋은 것으로 결정하는 것일 수 있다.
본 발명의 영유아 장내 미생물 불균형도의 탐지방법은, 추가로 (E)시험 영유아의 장내 미생물 군집의 불균형 여부를 결정하는 단계에서 결정된 그룹에 따라, 프리바이오틱스(prebiotic), 프로바이오틱스(probiotics), 약물, 식이, 및 생활습관 제안 등으로 이루어지는 군에서 선택된 1종 이상의 처리를 수행하여, 영유아의 장 불균형도를 개선하거나 장 성숙도를 개선하는 단계를 포함하는 장내 미생물의 균형을 달성하기 위한 단계를 수행할 수 있다.
상기 프로바이오틱스 또는 프리바이오틱스는 시험 대상의 장내 미생물 발달단계 및 장내 미생물의 불균형 정도를 이용하여, 미생물 종류 및 함량을 결정할 수 있다.
상기 프로바이오틱스의 예는, 영유아 장내 미생물이 발달 단계에 따라 기준 영유아 집단의 장내 미생물 균형군의 마커 미생물을 포함할 수 있으며 구체적으로 시험 대상이 발달단계 1로 분석된 경우 표 29 및 표 30에 나타낸 발달단계 1의 균형군 특이적 바이오마커 미생물 중 1종 이상을 포함하며, 시험 대상이 발달단계 2로 분석된 경우 표 31 및 표 32에 나타낸 발달단계 2의 균형군 특이적 바이오마커 미생물을 1종 이상 포함할 수 있다.
또한, 상기 프리바이오틱스는, 시험 대상이 발달단계 1로 분석된 경우, 표 29 및 표 30에 나타낸 발달단계 1의 균형군 특이적 바이오마커 미생물 중 1종 이상의 상대적 풍부도를 증가 및/또는 표 33 및 표 34에 나타낸 발달단계 1의 불균형군 특이적 바이오마커 미생물 중 1종 이상의 감소를 달성하는 물질을 포함할 수 있다. 또는, 시험 대상이 발달단계 2로 분석된 경우, 상기 프리바이오틱스는 표 31 및 표 32에 나타낸 발달단계 2의 균형군 특이적 바이오마커 미생물을 1종 이상의 상대적 풍부도를 증가 및/또는 표 35 및 표 36에 나타낸 발달단계 2의 불균형군 특이적 바이오마커 미생물을 1종 이상의 상대적 풍부도(상대적 점유 비율)를 감소하는 물질을 포함할 수 있다.
본 발명의 영유아 장내 미생물 불균형군 및/또는 장내 균형군 특이적 바이오마커 및 이를 이용한 영유아 장내 미생물 불균형 예측 모델을 이용한 영유아 장내 미생물 불균형 지수 제공 절차는 하기의 단계를 거쳐 수행될 수 있다.
(1) 시험 대상 영유아의 채변 샘플 수집 단계,
(2) 상기 채변 샘플로부터 시험대상의 DNA를 추출하고, 추출된 DNA를 주형으로 16S rRNA의 universal primer로 PCR을 수행하여 앰플리콘(amplicon)을 생성하는 단계,
(3) 차세대 유전체 서열분석 (NGS) 플랫폼을 이용하여, 상기 앰플리콘의 16S rRNA 유전자 서열을 분석하는 단계,
(4) 표준(standard) 균주 및 비배양 미생물의 16S rRNA 유전자 서열의 데이터베이스를 이용하여 상기 분석된 16S rRNA 유전자 서열을 분석하여, 시험 대상의 미생물 군집 분석을 수행하는 단계,
(5) 시험 대상 영유아로부터 장내 미생물 불균형 관련 항목이 포함된 메타 데이터를 수집하는 단계,
(6) 상기 (4) 혹은 (5)의 결과에 근거하여, 기준(refernece) 영유아의 발달 단계 구분에 따라, 시험 영유아의 발달 단계를 선정하는 단계,
(7) 시험 영유아의 해당 발달 단계에 따른 기준 영유아 집단의 장내 미생물 불균형이군 및 장내 미생물 균형군의 미생물 군집과 구성 미생물의 점유율 분포를 비교하는 단계, 및
(8) 상기 비교 결과, 영유아 장내 미생물 불균형 지수 기준을 충족하는 경우, 시험 영유아의 장내 미생물 군집의 불균형 여부를 결정하는 단계.
상기 영유아 장내 미생물 불균형 예측 결과를 지수화하여 분석 리포트로 제공할 수 있다. 상기 분석 리포트는 하기의 정보를 포함할 수 있다.
(1) 검사 대상의 발달 단계 및 장내 미생물 불균형 지수
검사 대상에 대하여 영유아 장내 미생물 불균형 예측 모델을 적용하여 영유아 장내 미생물 불균형 지수를 계산한 결과를 포함한다.
(2) 검출된 영유아 장내 미생물 불균형 바이오마커 미생물의 정보
또한, 상기 분석 리포트에는 영유아 장내 미생물 불균형 바이오마커에 해당하는 미생물 중에서 대표적인 미생물에 대한 설명과 비율을 나타낼 수 있다.
본 발명이 제공하는 영유아 장내 미생물 불균형 바이오마커(infant dysbiosis biomarker)를 통해 장내 미생물 분석 결과에 대하여 영유아 장내 미생물 불균형의 판별이 가능하다. 구체적으로, 본 발명은 영유아 장내 미생물 불균형 바이오마커 및 이를 이용한 영유아 장내 미생물 불균형의 판단 또는 장내 미생물 불균형 예측 방법, 또는 영유아 장내 미생물 불균형의 판단 또는 장내 미생물 불균형 예측용 키트를 제공하며, 이를 통해 영유아 장내 미생물 불균형의 판단 또는 영유아 장내 미생물 불균형에 대한 정량적인 예측이 가능하다.
도 1은 본 발명의 일 예에 따른 영유아의 장내 미생물 군집을 분석하기 위한 시료의 전처리 및 품질 검사 단계를 나타낸 모식도이다.
도 2는 영유아 월령에 따른 장내 미생물 11종의 미생물 군집 비율 변화를 나타낸 그래프이다.
도 3a 및 3b는 영유아 월령에 따른 식이 단계 분포를 나타낸 그래프로서, 도 3a은 수유식, 이유식, 일반식의 분포, 도 3b은 초기 이유식, 중기 이유식, 후기 이유식, 유아식 단계의 분포를 나타낸다.
도 4a 및 4b는 실시예 3-1의 DMM 클러스터링 방법에 따라 영유아 시료를 발달 단계에 따라 그룹화한 결과를 나타내는 그래프이다. 도 4a의 원 모양 점은 제1그룹을, 세모 모양 점은 제2그룹을 의미한다. 도 4b는 영유아 발달단계 그룹 1(cluster1) 및 그룹 2(cluster 2)의 분포를 영유아의 월령에 따라 나타낸 그래프로서, 가로축은 영유아의 월령, 세로축은 시료의 분포 밀도(Density)를 의미하며, 두 그룹이 나누어지는 기준 월령을 세로줄로 표시하였다.
도 5는 영유아 발달 단계의 결정을 위한 기계 학습 모델이 Test set에 대한 발달 단계를 검정한 결과를 나타낸 ROC 및 AUC 그래프이다.
도 6은 실시예 4-7에 따라 영유아 발달 단계의 결정 지수를 선정하기 위해 cut-off 수치에 따른 민감도(Sensitivity), 특이도(Specificity) 및 정확도(Accuarcy)를 계산한 결과를 나타내는 그래프로서, 가로축은 cut-off 수치를 나타내고, 가로축은 계산된 민감도(Sensitivity), 특이도(Specificity) 및 정확도 수치를 나타낸다.
도 7a 및 도 7b는 영유아 발달단계 1 및 발달단계 2를 각각 두 가지 하위 그룹으로 세분화한 DMM 클러스터링 결과를 이용하여 장내 미생물 불균형 관련 인자의 좌표 중심점을 계산한 결과 그래프이다. 도 7a는 발달단계 1, 도 7b는 발달단계 2의 시료를 분석한 그래프이다.
도 8a 및 도 8b은 영유아 발달단계 1 및 발달단계 2의 각 발달단계에 따른 영유아 장내 미생물 불균형 예측 모델을 검증하기 위한 ROC 곡선 및 AUC 그래프이다. 도 8a 은 발달단계 1, 도 8b는 발달단계 2의 시료를 분석한 그래프이다.
도 9a 및 도 9b는 영유아의 각 발달단계에 따른 미생물 불균형 여부를 결정하기 위한 cut-off 수치에 따른 민감도(Sensitivity), 특이도(Specificity) 및 정확도(Accuarcy)를 계산한 결과 그래프이다. 도 9a은 발달단계 1, 도 9b은 발달단계 2의 샘플을 대상으로 한 그래프이다.
도 10은 영유아 발달단계 1의 장내 미생물 균형 그룹 특이적 속 수준 바이오마커를 유전적 거리에 의해 분류하여 각 서브그룹을 표시한 계통수와 특이적 종 수준 바이오마커를 유전적 거리에 의해 분류하여 각 서브그룹을 표시한 계통수이다.
도 11은 영유아 발달단계 1의 장내 미생물 불균형 그룹 특이적 속 수준 바이오마커를 유전적 거리에 의해 분류하여 각 서브그룹을 표시한 계통수와 특이적 종 수준 바이오마커를 유전적 거리에 의해 분류하여 각 서브그룹을 표시한 계통수이다.
도 12는 영유아 발달단계 2의 장내 미생물 균형 그룹 특이적 속 수준 바이오마커를 유전적 거리에 의해 분류하여 각 서브그룹을 표시한 계통수와 종 수준 바이오마커를 유전적 거리에 의해 분류하여 각 서브그룹을 표시한 계통수이다.
도 13은 영유아 발달단계 2의 장내 미생물 불균형 그룹 특이적 속 수준 바이오마커를 유전적 거리에 의해 분류하여 각 서브그룹을 표시한 계통수와 종 수준 바이오마커를 유전적 거리에 의해 분류하여 각 서브그룹을 표시한 계통수이다.
이하 본 발명을 실시예에 의해 더욱 자세히 설명한다. 그러나 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 권리범위를 제한하지 않는다.
실시예 1. 영유아 시료 및 메타 데이터 수집
1-1. 영유아의 선별 기준 및 시료 수집
본 실험을 위해 국제건강기구(WHO)에서 규정한 대로, 생후 4주 초과 내지 만 3세(36개월)이하의 영유아를 선별하였으며, 연구대상 영유아의 법정대리인으로부터 채집된 영유아의 분변을 전달받아 총 120개 샘플을 수집했다. 상기 분변은 미생물의 변성을 막는 완충액에 담겨 전달 되었다. 완충액의 조성은 표 1에 나타내었다.
Figure PCTKR2020007494-appb-T000001
1-2. 영유아의 메타 데이터 수집
각 샘플 수집 시에는, 해당 시기에서의 영유아 식생 습관에 대해 알기 위한 항목으로 구성된 설문지를 함께 작성하여 제출받았다.
설문은 수유식, 이유식, 유아식 및 일반식 중에서 샘플 수집 시에 해당하는 식이 유형으로 설문지를 작성할 수 있도록 설문지를 A(수유), B(이유), C(일반)의 세 가지 유형으로 나누었으며, 설문지 유형은 연구대상 영유아의 법정대리인의 판단으로 선택하도록 하였다. 설문 항목은 분만 방법, 수유 방법, 이유식, 유아식 및 일반식의 종류, 대변 형태 등으로 이루어져 있다. 구체적인 설문 문항을 표 2에 나타내었다.
Type A(수유) 설문지
1. 아이 정보(1) 성별 (2) 개월 (3) 키 (4) 몸무게2. 분만 정보(1)자연 분만 (2) 제왕 절개 (3)자연분만 시도 중 제왕절개3. 엄마의 항생제 복용 시기(1) 임신기간 중 (2) 출산 시 (3)잘 모름 (4) 해당사항 없음4. 출산 후부터 현재까지 엄마의 항생제 복용 경험(1) 예 (항생제명) (2) 아니오 5. 수유 방법(1) 모유 수유 (2) 분유 수유 ( ) (3)혼합 수유 ( ) (분유 수유나 혼합 수유를 하시는 경우에는 현재 사용하시는 제품명 기재)* ‘(1) 모유 수유’ 또는 ‘(2) 분유 수유’를 선택하신 경우 7번 문항으로 이동6. 5번 문항에서 ‘(3)혼합 수유’를 선택한 경우, 모유와 분유의 비율은 다음 중 어느 정도입니까? (1) 주로 모유 (2) 주로 분유 (3)모유, 분유 비슷한 비율 (4) 잘 모름7. 임신 기간 중, 유산균 식품 (정제된 약품 형태가 아닌 치즈, 요거트 등의 발효식품)을 일주일에 몇 일 정도 섭취하였습니까? (1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음8. 임신 기간 중, 프로바이오틱스 또는 프리바이오틱스 제품 (치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 섭취하였습니까? (1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음9. 현재, 귀하는 유산균 식품 (정제된 약품 형태가 아닌 치즈, 요거트 등의 발효식품)을 일주일에 몇 일 정도 섭취하고 있습니까? (1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음10. 현재, 귀하는 프로바이오틱스 또는 프리바이오틱스 제품 (치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 복용하고 있습니까? (1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음11. 현재, 아이는 프로바이오틱스 또는 프리바이오틱스 제품 (치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 복용하고 있습니까? (분유에 섞어서 먹이는 것 포함) (1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음12. 지난 한 달 사이에 아이가 항생제를 복용한 적이 있습니까? (1) 예 (2) 아니오 (3)잘 모름 * ‘(2) 아니오’ 또는 ‘(3)잘 모름’을 선택하신 경우 14번 문항으로 이동13. 아이가 항생제를 복용했을 때의 복용 기간은 다음 중 무엇입니까? (1) 1-2일 (2) 3-6일 (3)7일 이상14. 지난 한 달 동안 일반적인 대변의 형태는 다음 중 무엇입니까? (1) 설사가 많음 (2) 일반적인 묽은변 (3)기타 (_________________________________)15. 지난 한 달 동안 일반적인 대변의 색깔은 다음 중 무엇입니까? (한 가지만 선택해주세요.) (1) 황금색 (2) 갈색 (3)검은색 (4) 쑥색 (녹색) (5) 이 외의 다른 색 (_________________)16. 아이가 다음과 같은 질병을 병원에서 진단 받은 적이 있습니까? (중복 선택 가능) (1) 해당사항 없음 (2) 아토피 (3)자폐증 (4) ADHD (5) 유아비만 (6) 기타 질병 (__________________)
[Type B(이유) 설문지]
1. 아이 정보
(1) 성별 (2) 개월 (3) 키 (4) 몸무게
2. 분만 정보
(1) 자연 분만 (2) 제왕 절개 (3)자연분만 시도 중 제왕절개
3. 엄마의 항생제 복용 시기
(1) 임신기간 중 (2) 출산 시 (3)잘 모름 (4) 해당사항 없음
4. 출산 후부터 현재까지 엄마의 항생제 복용 경험
(1) 예 (항생제명) (2) 아니오
5. 이유식 혹은 유아식을 수유와 함께 진행하고 계십니까?
(1) 예 (2) 아니오
* ‘(2) 아니오’를 선택하신 경우 8번 문항으로 이동
6. 5번 문항에서 ‘(1) 예’를 선택하신 경우, 수유 방법은 다음 중 무엇입니까? (분유 수유 혹은 혼합 수유라면, 사용하시는 제품의 이름을 함께 적어 주십시오)
(1) 모유 수유 (2) 분유 수유 ( ) (3)혼합 수유 ( )
*(1) 또는 (2) 번을 선택하신 경우 8번 문항으로 이동
7. 6번 문항에서 ‘(4) 혼합 수유’를 선택한 경우, 모유 수유와 분유 수유의 비율은 어떠합니까?
(1) 주로 모유 수유 (2) 주로 분유 수유 (3)모유, 분유 수유 동등한 비율
8. 현재, 엄마는 유산균 식품 (정제된 약품 형태가 아닌 치즈, 요거트 등의 발효식품)을 일주일에 몇 일 정도 섭취하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
9. 현재, 엄마는 프로바이오틱스 또는 프리바이오틱스 제품 (치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 섭취하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
10. 아이가 일반적으로 섭취하는 이유식은 무엇입니까?
(1) 초기 이유식 (물 같은 미음) (2) 중기 이유식 (묽은 죽, 으깬 것) (3)후기 이유식 (된죽) (4) 유아식 (죽 이외의 음식)
11. 현재, 아이는 유산균 식품(정제된 약품 형태가 아닌 치즈, 요거트 등의 발효식품) 을 일주일에 몇 일 정도 섭취하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
12. 현재, 아이는 프로바이오틱스 또는 프리바이오틱스 제품 (치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 복용 하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
13. 지난 한 달 사이에 아이가 항생제를 복용한 적이 있습니까? * 모르시면 공백
(1) 예 (항생제명: _________________) (2) 아니오
*(2) 아니오 경우 15번 문항으로 이동
14. 아이의 항생제 복용 기간은 어떻게 됩니까?
(1) 1-2일 (2) 3-6일 (3)7일 이상
15. 현재 이유식을 진행하는 경우, 지난 한 달 동안 아이의 일반적인 대변 형태는 다음 중 무엇입니까?
(1) 설사가 많음 (2) 일반적인 묽은변 (3)기타 (__________________)
* 17번 문항으로 이동해주세요.
16. 유아식을 진행하는 경우, 지난 한 달 동안 아이의 일반적인 대변 형태는 다음 중 무엇입니까? (한 가지만 선택해주세요.)
(1) 심한 변비 (큰 구슬 모양으로 나오는 단단한 변) (2) 약한 변비 (구슬 모양이 보이는 울퉁불퉁한 변) (3)건조한 변 (표면이 갈리진 모양이 보이는 변) (4) 촉촉한 변 (표면이 매끈한 변) (5) 묽은 변 (수분을 많이 함유하여 여러 덩어리로 분리 된 변) (6) 약한 설사 (수분이 매우 많아 진흙처럼 나오는 변) (7) 심한 설사 (물처럼 나오는 변)
17. 지난 한 달 동안 일반적인 대변의 색깔은 다음 중 무엇입니까? (한 가지만 선택해주세요.)
(1) 황금색 (2) 갈색 (3)검은색 (4) 쑥색 (녹색) (5) 이 외의 다른 색 (_________________)
18. 아이가 다음과 같은 질병을 진단 받은 적이 있습니까? (중복 선택 가능)
(1) 해당사항 없음 (2) 아토피 (3)자폐증 (4) ADHD (5) 유아비만 (6) 기타 질병 (__________________)
19. 질병 진단을 받았다면 증상이 이유식 혹은 유아식을 시작 후 나타났습니까?
(1) 예 (2) 아니오
[Type C(일반) 설문지]
. 아이 정보
(1) 성별 (2) 개월 (3) 키 (4) 몸무게
2. 분만 정보
(1) 자연 분만 (2) 제왕 절개 (3)자연분만 시도 중 제왕절개
3. 엄마의 항생제 복용 시기
(1) 임신기간 중 (2) 출산 시 (3)잘 모름 (4) 해당사항 없음
4. 출산 후부터 현재까지 엄마의 항생제 복용 경험
(1) 예 (항생제명) (2) 아니오
5. 현재 수유 중입니까?
(1) 예 (2) 아니오
* ‘(2) 아니오’를 선택하신 경우 8번 문항으로 이동
6. 현재 수유를 진행하는 경우, 수유 방법은 다음 중 무엇입니까? 분유 수유나 혼합 수유를 하시는 경우에는 현재 사용하시는 제품의 이름을 함께 적어 주십시오.
(1) 모유 수유 (2) 분유 수유 ( ) (3)혼합 수유 ( )
* ‘(1) 모유 수유’ 또는 ‘(2) 분유 수유’를 선택하신 경우 8번 문항으로 이동
7. 6번 문항에서 ‘(3)혼합 수유’를 선택한 경우, 모유와 분유의 비율은 다음 중 어느 정도입니까?
(1) 주로 모유 (2) 주로 분유 (3)모유, 분유 비슷한 비율 (4) 잘 모름
8. 아이가 주로 섭취하는 일반식 재료 3가지를 적어주세요.
(1) ______________________ (2) ______________________ (3)______________________
9. 현재, 아이는 유산균 식품 (정제된 약품 형태가 아닌 치즈, 요거트 등의 발효식품)을 일주일에 몇 일 정도 섭취하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
10. 현재, 아이는 프로바이오틱스 또는 프리바이오틱스 제품(치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 복용 하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
11. 현재, 아이의 설탕이 포함된 음료 (탄산, 과일주스 등)의 주간 섭취 빈도는 다음 중 무엇입니까?
(1) 매일 (2) 3-5일 (3)1-2일 (4) 주 1일 이하 (5) 섭취하지 않음 (6) 잘 모름
12. 현재, 아이의 설탕이 포함된 과자(예: 초콜릿, 사탕, 젤리 등)의 주간 섭취 빈도는 다음 중 무엇입니까?
(1) 매일 (2) 3-5일 (3)1-2일 (4) 주 1일 이하 (5) 섭취하지 않음 (6) 잘 모름
13. 지난 한 달 사이에 아이가 항생제를 복용한 적이 있습니까?
(1) 예 (2) 아니오 (3)잘 모름
* ‘(2) 아니오’ 또는 ‘(3)잘 모름’을 선택하신 경우 14번 문항으로 이동
14. 아이가 항생제를 복용했을 때의 복용 기간은 다음 중 무엇입니까?
(1) 1-2일 (2) 3-6일 (3)7일 이상
15. 지난 한 달 동안 일반적인 대변의 형태는 다음 중 무엇입니까? (한 가지만 선택해주세요.)
(1) 심한 변비 (큰 구슬 모양으로 나오는 단단한 변) (2) 약한 변비 (구슬 모양이 보이는 울퉁불퉁한 변) (3)건조한 변 (표면이 갈리진 모양이 보이는 변) (4) 촉촉한 변 (표면이 매끈한 변) (5) 묽은 변 (수분을 많이 함유하여 여러 덩어리로 분리 된 변) (6) 약한 설사 (수분이 매우 많아 진흙처럼 나오는 변) (7) 심한 설사 (물처럼 나오는 변)
16. 지난 한 달 동안 일반적인 대변의 색깔은 다음 중 무엇입니까? (한 가지만 선택해주세요.)
(1) 황금색 (2) 갈색 (3)검은색 (4) 쑥색 (녹색) (5) 붉은색 (6) 이 외의 다른 색 (_________________)
17. 아이가 다음과 같은 질병을 진단 받은 적이 있습니까? (중복 선택 가능)
(1) 해당사항 없음 (2) 아토피 (3)자폐증 (4) ADHD (5) 유아비만 (6) 기타 질병 (__________________)
18. 질병 진단을 받았다면 증상이 일반식을 시작한 후 나타났습니까?
(1) 예 (2) 아니오
실시예 2. 차세대염기서열분석(Next Generation Sequencing; NGS)을 이용한 장내 미생물 군집 분석
2-1. 16S 리보솜 RNA 유전자 서열 획득 및 분석
상기 1-1의 방법으로 수집된 대변 샘플을 이용하여 대변의 genomic DNA를 추출하였다. 모든 샘플은 DNA 완충액에 담겨 수집된 상태이므로, 구체적으로, 수집 직후 FastPrep (MP Biomedicals)에서 speed 6.0으로 40 초간 homogenization하여 물리적인 방법으로 유전체 DNA(genomic DNA)를 추출하였다.
구체적으로, 상기 유전체 DNA 추출 방법으로 추출된 DNA를 이용, universal primer를 사용하여 중합효소 연쇄 반응(PCR reaction)을 통해 광범위한 Taxonomic group을 대상으로 한 다양한 유형의 앰플리콘(amplicon)을 생성하였다. 상기 universal primer의 서열은 하기와 같으며, 앰플리콘 형성을 위한 PCR pre-mix의 조성 및 PCR 수행 조건을 표 3 및 표 4에 각각 나타내었다.
정방향 universal primer (서열번호 161): 5'-CCTACGGGNGGCWGCAG-3'
역방향 universal primer (서열번호 162): 5'-GACTACHVGGGTATCTAATCC-3'
조성(component) 함량(1X)
template (유전체 DNA) 0.5 ul
2x buffer 10 ul
정방향 universal primer (10 pmole) 0.5 ul
약방향 universal primer (10 pmole) 0.5 ul
Polymerase 0.3 ul
3' D.W 8.2 ul
전체 20 ul
단계(cycle step) 온도(temperature) 시간(time)
Initial denaturation 95 ℃ 3 min
Denaturation annealing& Extension(25 cycles) 95 ℃55 ℃72 ℃ 30 sec30 sec30 sec
Final extension 72 ℃4 ℃ 5 min∞
이렇게 생성된 앰플리콘들은 정제한 후 Bioanalyzer (Agilent), qPCR 등을 이용하여 앰플리콘 품질 검사 단계(Quality Control; QC)를 수행하여, 대변의 genomic DNA에서 추출된 장내 미생물의 16S rRNA 서열을 얻은 것을 확인한 후, MiSeq(Illumina) 장비를 통해 차세대 염기서열 분석기술(Next Generation Sequencing; NGS)을 이용하여, 상기 시료의 16s 리보솜 RNA 유전자 서열 분석을 시행하였다.
시료 전처리 및 QC 과정의 모식도를 도 1에 나타내었다. 구체적으로, DNA 증폭 과정에서 Gel QC 결과 650bp 부근에서 DNA band가 나타나는 것을 확인하고, Picogreen 시약을 이용한 DNA 정량 분석 결과 DNA 농도가 5 ng/ul 이상이 되도록 하였다. 샘플 혼합 단계에서는 Bioanalyzer QC 결과 DNA peak에 main peak 이외의 short peak이 관찰되지 않는 지 확인하고, picogreen QC 결과 DNA 농도가 5 ng/ul 이상을 기준으로 quality control을 수행하였다.
2-2. 미생물 군집 분석
상기 차세대염기서열분석기법 (NGS)으로 하나의 샘플에서 수천 개의 유전자 서열을 생성한 후에는, 표준 균주 및 비배양 미생물의 16S 리보솜 RNA 유전자 서열 데이터베이스 (EzTaxon) 및 이지바이오클라우드 분석시스템 (http://www.ezbiocloud.com)으로 미생물 커뮤니티(bacterial community) 정보를 문(phylum)에서 종(species) 단계까지 분석하였다. 분석 정보는 천랩의 인체 마이크로바이옴 데이터베이스에 상기 실시예 1-2의 메타 데이터와 함께 축적하였다.
시료에서 얻어진 미생물의 16S rRNA 중에서 가장 큰 비율을 차지하는 11개 분류군의 개월수 별 변화를 도 2에 나타내었다. 상기 11개 분류군은 각각 Anaerostipes 속, Bacterioides 속, Bifidobacterium 속, Blautia 속, Clostridium 속, Lachnospiraceae 과 미발표 속, Enterococcus 속, Escherichia 속, Faecalibacterium 속, Streptococcus 속 및 veillonella 속으로 구성되었다.
영유아의 월령에 따른 11개 분류군의 변화를 보다 구체적으로 살펴보면, 영유아의 성장에 따라 Bifidobacterium 속의 감소 및 Bacteroides 속 및 Faecalibacterium 속의 증가가 두드러지게 나타났다. Bifidobacterium 속은 신생아의 면역력 강화 및 영양분 흡수에 도움을 주는 대표적인 유산균으로, 모유를 통해 장내에 전달되어 초기 장내 미생물들의 정착을 돕는 것으로 알려져 있다. 도 2에서 확인할 수 있는 바와 같이, 전체 장내 균총 규모를 1로 두었을 때 Bifidobacterium 균은 2개월 째에 0.7수준으로 증가하였다가 10개월 이후 장내 균총 내 규모가 감소하여 0.2 수준으로 유지되었다.
시간에 따른 균총 내 증가세가 두드러진 Bacteroides 속 및 Faecalibacterium 속 미생물들은 식물성 탄수화물의 대사 및 짧은 사슬 지방산의 생성과 연관되어 있다. 영유아의 월령이 늘어나고 이유식 및 유아식을 하는 인원이 증가함에 따라 식이섬유 분해 및 짧은 사슬 지방산 생성균이 증가하는 것으로 추정할 수 있다. 짧은 사슬 지방산은 주로 섬유질이 분해되는 과정에서 나타나는 산물로, 에너지 생산 촉진, 비타민 생성 촉진, 장내 세포 결속 강화 등 인체에 유익한 영향을 주는 물질로 알려져 있다.
Bacteriodes 균은 8개월 이전의 영아에서는 전체 균총 내 차지하는 비율이 약 0.05 수준으로 매우 낮았으나, 9개월 이후 점차 그 비율이 증가하여 두 돌에 이르면 0.48 수준으로 규모가 증가하였다.
Faecalibacteium 속 미생물의 경우, 3개월까지는 분포가 매우 낮게 나타났으나, 3개월 이후 군집 규모가 점차 증가하여 12개월에 이르면 0.2 수준이 되었고, 이후 약 0.25 수준에서 군집 규모가 유지되는 양상을 보였다.
실시예 3. 장내 미생물 분석 데이터 그룹화 및 그룹 별 특징 선택
3-1. DMM clustering을 이용한 장내 미생물 분석 데이터 그룹화
디리클레 다항분포 혼합모델 (Dirichlet multinomial mixtures, DMM) 클러스터링은 다양한 요인을 모두 적용하여 그룹화(grouping)할 수 있는 분석 방법으로, 방대한 장내 미생물 분석 데이터를 반영하기에 적합하다. DMM 클러스터링 방법에 따라 장내 미생물 군집의 확률분포를 하기 수학식 1과 같이 설정하여 최적의 그룹을 찾았다.
[수학식 1]
Figure PCTKR2020007494-appb-I000009
Figure PCTKR2020007494-appb-I000010
우선 각 샘플의 군집을 계통군의 확률 벡터
Figure PCTKR2020007494-appb-I000011
(i=1,..., N)로 나타낸다. 이때 N은 총 샘플의 개수에 해당한다. 그리고 위 확률 벡터는 각 군집 그룹별로 다른 하이퍼파라미터
Figure PCTKR2020007494-appb-I000012
(k=1,..., K)를 가지는 디리클레 분포의 혼합 사전분포로부터 생성된다. K는 총 군집 그룹의 개수이며,
Figure PCTKR2020007494-appb-I000013
는 혼합모델의 가중치에 해당한다.
샘플들의 관측값
Figure PCTKR2020007494-appb-I000014
은 위 군집별 확률벡터로부터 다항분포 샘플링으로 생성된다. 최종적으로 관측값의 likelihood는 수학식 2와 같이 정의된다.
[수학식 2]
Figure PCTKR2020007494-appb-I000015
Figure PCTKR2020007494-appb-I000016
Figure PCTKR2020007494-appb-I000017
위 likelihood와 사전분포를 조합하면 수학식 3과 같은 사후분포를 도출할 수 있다.
[수학식 3]
Figure PCTKR2020007494-appb-I000018
베이지안 방법론에서는 이를 최대로 하는 모델의 하이퍼파라미터를 찾는다. 이때, Expectation-maximization 방법을 이용하였으며, Laplace approximation 값을 이용하여 모델의 적합도를 판별하였다. 이는 통계분석 프로그램 R의 DirichletMultinomial 패키지를 이용하여 계산하였다.
3-2. 기계 학습(Machine learning) 모델 구축
기계 학습을 위해서, 모든 영유아 샘플은 training set과 test set으로 나누어졌다. Training set은 기계학습 모델의 학습에, test set은 기계학습 모델에 대한 평가에 사용하였다. 상기 실시예 3-1의 방법으로 나눈 각각의 그룹에서 샘플을 약 2:1의 비율로 무작위로 선정하여 test set과 training set을 규정하였다. 기계 학습 모델 구축 시, 회귀계수의 기대값을 도출하기 위해 100번의 부트스트랩 반복 (bootstrap replication)으로 상기의 샘플 선정 과정을 반복하였으며, test set과 training set은 부트스트랩(bootstrap) 반복 수행마다 무작위로 재설정된다.
기계 학습은 실시예 3-1과 같이 나눈 그룹 별 장내 미생물 패턴을 통계적으로 유의미하게 인식하는 단계로서, 이러한 예측 모델은 라소(Least absolute shrinkage and selection operator, LASSO)를 이용하였다. LASSO의 특징 선택 알고리즘은 모델의 회귀계수(regression coefficient)의 합계에 벌점(penalty)을 부과하여 그룹을 나누는 예측 변수와 가장 강한 연관관계를 보이는 미생물만을 선택할 수 있도록 하는 특징이 있다(Friedman, Hastie & Thirani, J Stat Softw, 2010., S. J. Kim, K. Koh, M. Lustig, S. Boyd and D. Gorinevsky, in IEEE Journal of Selected Topics in Signal Processing, 2007.).
LASSO 모델의 예측 함수는 하기 수학식 4와 같다.
[수학식 4]
Figure PCTKR2020007494-appb-I000019
[수학식 5]
Figure PCTKR2020007494-appb-I000020
각 변수는 하기와 같다.
상기 X 는 모델의 독립변수이며 이는 영유아 대변 분석 결과 상의 미생물 군집 비율에 해당한다.
상기 β는 모델의 회귀계수(Coefficient)이고 미생물과 예측 변수의 관련도를 나타낸다.
상기
Figure PCTKR2020007494-appb-I000021
는 모델의 예측 점수이고 0에서 1사이의 확률값을 가진다.
상기
Figure PCTKR2020007494-appb-I000022
는 학습에 사용한 n개의 시료의 미생물 군집 비율에 해당하며, 상기
Figure PCTKR2020007494-appb-I000023
는 사용한 시료의 실제 데이터(그룹화에 사용된 실제 변수에 따라 각각 0과 1의 값)에 해당한다.
상기 m은 학습에 사용된 미생물 분류군 수로서, 자연수 값을 가진다.
상기 λ 값 은 기계 학습 모델의 하이퍼파라미터(hyper parameter)이다.
이때 사용하는 가중치인 정규화 파라미터(regularization parameter)를 미생물 군집데이터에 맞게 설정하는 단계가 가장 먼저 필요하다. 이를 위해 정규화 파라미터를 0.0001 에서 10000 사이에서 지수 스케일로 균등하게 10개로 잘라 10개의 모델을 생성하여 가장 좋은 예측 결과(가장 높은 AUC 수치)를 주는 모델 파라미터를 선별하는 과정을 거쳤다. 이러한 그리드서치(grid search)를 통해 최적화(optimization)된 하이퍼파라미터(hyperparameter)를 얻을 수 있다.
3-3. 그룹별 바이오마커의 탐색
실시예 3-2에서 찾은 최적의 모델 파라미터를 이용하여 특징적 선택 (feature selection) 과정을 진행하였다. 상기 100번의 반복 학습에서 각 그룹의 마커로 판별된 빈도는 Robustness, 각 그룹의 관련도(
Figure PCTKR2020007494-appb-I000024
)를 평균 계산한 값은 Coefficient라고 정의된다. Coefficient 값은 바이오마커의 영향력을 나타낸 값으로서, 각 바이오마커가 각 그룹에서 어느 그룹에 특정하는지에 대한 정보 역시 포함하고 있다.
각각의 그룹에서 더 많은 군집 규모(population)를 보이는 경우에 따라, Coefficient 값은 음수값과 양수값으로 분포하며, 이를 수학식 4와 같은 logistic function에 적용하여 각 그룹에 대한 특이점을 판별한다. 제1그룹에 더 많이 분포할 경우 음수값, 제2그룹에 더 많이 분포할 경우 양수값으로 표현되도록 설정하였다.
3-4. 그룹 별 바이오마커의 특징 선택
상기 실시예 3-3의 LASSO 적용 결과를 각 그룹을 구분하는 기준에 따라 보정하여, 최종 미생물 바이오마커를 선정한다. 예를 들어, 제1그룹에 특이적인 바이오마커로 판별된 미생물은 제1그룹에 특이적인 마커로서 판별한 미생물이기 때문에, 제2그룹에 비해 제1그룹에서 미생물 분류군의 군집 규모(population)가 더 높은 비율을 보여야 한다. 따라서, 제1그룹의 최종적인 바이오마커는 제2그룹에서 미생물 분류군의 군집 규모(population)가 더 높은 비율로 나타난 미생물 분류군을 제외하여 선별한다. 이러한 과정을 통해 LASSO를 적용하여 얻어낸 바이오마커를 각 그룹을 나누는 미리 규정된 기준에 따라 보정할 수 있다.
3-5. Test set을 이용한 모델 검증
상기 실시예 3-2에서 100번 반복으로 선정된 Test set을 최적화 기계 학습 모델에 적용하였다. 실시예 3-5에서 선택한 특이적 마커와 해당 마커의 Coefficient 값을 이용하여 그룹 판별을 위한 예측점수(prediction score)를 계산할 수 있다.
실시예 3-5에서 선별한 미생물들의 계수(coefficient)를
Figure PCTKR2020007494-appb-I000025
, 선별한 미생물들의 군집 규모가 장내 균총에서 차지하는 비율을 X' 라고 할 때, 예측 점수
Figure PCTKR2020007494-appb-I000026
는 하기 수학식 6와 같이 계산한다. 수학식 6에서 각 파라미터 정의는 상기한 바와 같다.
[수학식 6]
Figure PCTKR2020007494-appb-I000027
상기 수학식 6에서,
Figure PCTKR2020007494-appb-I000028
는 선별한 미생물들의 coefficient이고,
X' 는 선별한 미생물들의 군집 규모 비율이다.
상기 예측점수(prediction score)는 Test set의 장내 미생물 군집 데이터에서 실시예 3-5를 통해 선택한 미생물 마커를 찾고 상기 미생물 마커의 군집 규모 비율을 해당 바이오마커의 Coefficient와 내적곱을 하여 0 내지 1의 값으로 계산한다.
Test set에 대한 예측 모델 적용 결과의 ROC 곡선 (receiver operating characteristic curve) 및 AUC (area under curve) 그래프를 통해 이를 검증할 수 있다. ROC 곡선의 경우 활 모양으로 크게 굽어져 있는지, AUC값의 경우 1에 가까운 값을 보이는지를 통해 test set에 적용한 예측 모델이 유의미함을 알 수 있다.
3-6. 예측 모델 판별 결과의 지수화
기계 학습 모델의 예측 확률은 Train set의 판별 결과에 근거하여 계산된 확률이며 이는 실제 인구에서 정확히 판별한 확률이 아니다. 이에 정확한 임상적 해석을 부여하기 위해, 0과 1사이의 확률값을 학습에 사용한 제1그룹와 제2그룹의 비율로 나눠 리스케일하였다. 수학식 7에서 각 파라미터 정의는 상기한 바와 같다.
[수학식 7]
Figure PCTKR2020007494-appb-I000029
상기 수학식 7에서,
Figure PCTKR2020007494-appb-I000030
는 특정 그룹의 판별을 위한 시험 대상의 예측 점수이고,
P0 는 예측 모델 구축에 사용된 training set에 존재하는 제2그룹 샘플의 비율이며,
Ncase 는 training set 내 제2그룹 샘플의 수이고,
Ntrain 는 training set의 전체 샘플 수이다.
위에서 구한 판별 지수를 통해 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy) 값을 확인한다. 민감도는 제2그룹 전체 시료 중 실제로 제2그룹인 비율, 특이도는 제2그룹으로 판정된 전체 시료 중 실제 제2그룹인 비율을 의미하며, 정확도는 전체 시료 중 제1그룹 또는 제2그룹이 각각 정확하게 판정된 비율을 나타낸다.
구체적으로, 전체 샘플에서 분포하는 민감도, 특이도, 정확도 값을 20등분하여 판별 지수의 기준(cut off)을 정한다. 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy)는 하기 수학식 8 내지 10과 같이 계산한다. 수학식 8 내지 10에서 각 파라미터 정의는 상기한 바와 같다.
[수학식 8]
Figure PCTKR2020007494-appb-I000031
[수학식 9]
Figure PCTKR2020007494-appb-I000032
[수학식 10]
Figure PCTKR2020007494-appb-I000033
상기 수학식 8 내지 10에서,
TP는 제2그룹에 해당하는 시료에서 판별 지수(
Figure PCTKR2020007494-appb-I000034
)가 cut-off보다 큰 경우의 수이고,
TN은 제2그룹에 해당하는 시료에서 판별 지수(
Figure PCTKR2020007494-appb-I000035
)가 cut-off보다 작은 경우의 수이고,
FP는 제1그룹에 해당하는 시료에서 판별 지수(
Figure PCTKR2020007494-appb-I000036
)가 cut-off보다 큰 경우의 수이고,
FN은 제1그룹에 해당하는 시료에서 판별 지수(
Figure PCTKR2020007494-appb-I000037
)가 cut-off보다 작은 경우의 수이다.
정확도가 가장 높게 계산된 지수를 기준으로 판별할 경우, 해당 지수에서 나타나는 특이도 혹은 민감도로 제1그룹 혹은 제2그룹에 대한 정확한 판별능을 기대할 수 있다.
실시예 4. 영유아 발달 단계의 규정
4-1. 식이 단계를 통한 영유아 샘플 분류
실시예 1의 샘플 수집 시에는 해당 시기에서의 영유아 식생 습관에 대해 알기 위한 설문지에 근거하여, 전체 120개 영유아 샘플에 대한 수유식, 이유식, 일반식의 분포를 도 3a에 나타내고 식이 단계 별 개월수(age) 분포를 살펴보았다. 수유식, 이유식, 일반식의 식이 단계는 영유아가 섭취하는 식이의 형태에 따라 정의하며, 각각 액상 (수유식), 겔상(이유식), 고형(일반식)의 식품을 섭취하는 식이 형태를 의미한다. 도 3b에 따르면 식이 단계는 생후 약 6개월, 15개월을 기준으로 다르게 분포한다. 상기 일반식 식이는 성인과 동일한 고형 식이를 의미한다.
다만, 생후 6 내지 24개월에 해당하는 영유아의 식이 단계는 넓게 혼재되어 있다. 이 시기의 식이 단계를 세분화하여 살펴보기 위해, 초기 이유식(갈색), 중기 이유식(분홍색), 후기 이유식(회색), 유아식(노란색)으로 나누어 개월수(age)를 살펴보았다. 이유식 단계는 상기 표 2의 B유형 설문 10번 문항을 이용하였으며, 그 결과를 도 3b에 나타내었다. 도 3b에 따르면, 초기, 중기, 후기 이유식과 유아식이 생후 약 15개월을 기점으로 구분된다. 초기 이유식은 물 같은 미음 위주(겔상), 중기 이유식은 묽은 죽, 으깬 것 위주(겔상), 후기 이유식은 된죽 위주(겔상), 유아식은 죽 이외의 음식 위주(고형)의 식이를 한다고 답변한 경우이다.
도 3a 및 3b로 미루어볼 때, 실시예 1의 샘플은 식이 구분을 통해 2개 그룹으로 나눌 수 있으며, 구체적으로, 수유식(액상)과 이유식(겔상)을 하는 그룹과, 유아식 및 일반식(고형)을 하는 그룹으로 구분할 수 있다.
따라서, 식이의 형태에 따라 영유아를 액상 및 겔상 식이와 고형 식이를 하는 시기에 따라 발달단계 1 및 발달단계 2로 규정하였다. 전체 영유아의 개월수(age) 별 식이 단계 분포를 표 5에 나타내었다.
영유아 식이 단계에 따른 샘플 수 분포
구분 0-10개월 11-14개월 15-36개월
수유식 28 0 0 28
초기 이유식 4 0 0 4
중기 이유식 18 1 0 19
후기 이유식 2 9 1 12
유아식 1 3 7 11
일반식 0 1 45 46
53 14 53 120
4-2. 장내 미생물 분석 데이터를 통한 발달 단계의 그룹화
상기 실시예 3-1의 DMM 클러스터링 방법에 따라, 장내 미생물 데이터를 이용하여 전체 영유아 샘플을 그룹화하였으며 도 4a 및 도 4b에 그 결과를 나타내었다. DMM 클러스터링 방법에 따르면, 전체 영유아 샘플은 총 2개 발달단계 그룹으로 나누어졌으며, 도 4a에 그 결과를 나타내었다. 제1그룹에서 69개 샘플, 제2그룹에서 51개 샘플로 나타났으며, 제1그룹과 제2그룹에 생후 개월수(월령)를 적용한 결과, 약 15개월을 기준으로 샘플들이 두 가지 그룹으로 분리되어 분포하였다. 이러한 결과는 도 4b에 나타내었다. 따라서 상기 그룹화 결과가 영유아의 월령과 유의미한 상관 관계를 나타냄을 확인하였다. 실시예 4-1을 참고하여, 제1그룹은 발달단계 1, 제2그룹은 발달단계 2로 명명하였다.
총 샘플 수: 120
제1그룹: 발달단계 1
제1그룹 샘플 수: 69
제2그룹: 발달단계 2
제2그룹 샘플 수: 51
4-3. 발달 단계별 기계 학습 모델의 적용
상기 실시예 3-2에 따라, 상기 규정한 발달단계별 장내 미생물 분석 데이터를 기계 학습에 적용하였다. 모델의 하이퍼파라미터에 해당하는 정규화 파라미터 즉, 본 발명에 따른 최적화된 영유아 발달 단계 예측 모델은 상기 수학식 1의
Figure PCTKR2020007494-appb-I000038
값 중 가장 좋은 예측 결과를 보이는 값을 통해 선택되었다. 발달 단계를 판별하는 최적화 예측 결과값(하이퍼파라미터)은 10으로 확정하였다.
4-4. 발달 단계 예측 모델을 이용한 바이오마커의 특징적 선택(1차)
실시예 4-3의 결과에 따라, 각 발달 단계에서 1차적으로 나타나는 특징적인 바이오마커를 선별하였다. 발달단계 1과 관련된 바이오마커는 종 수준(Species level)에서 44개, 속 수준(Genus level)에서 12개 분류군으로 나타났다. 반면, 발달단계 2와 관련된 바이오마커는 종 수준(Species level)에서 59개, 속 수준(Genus level)에서 22개 분류군으로 나타났다. 표 6 내지 표 9에는 발달단계 1과 관련된 종 및 속 수준 바이오마커, 발달단계 2와 관련된 종 및 속 수준 바이오마커의 종류를 나타내었다.
하기 표 6 내지 9에서, coefficient 는 상기 수학식 4의 β에 해당하며, 음수 값은 발달단계 1에 특이적인 미생물, 양수 값은 발달단계 2에 특이적인 미생물임을 의미한다. robustness 는 부트스트랩 반복 100회 중 각 미생물이 각 발달단계로 나타난 횟수를 비율로 나타낸 것이며, 1에 가까울수록 해당 그룹에 특이적임을 의미한다. 또한, 균형균 비율 및 불균형균 비율은 각 미생물 군집의 규모 (population)를 의미하며, 각각 동정된 전체 미생물의 총 reads 수에 대비하여 해당 미생물이 차지하는 reads 수를 통해 비율을 계산하여 얻은 수치이다.
하기 표 6 내지 표 9의 바이오마커는 영유아의 장내 미생물 군집의 발달 단계를 구분하는 바이오마커로서 1차로 선정된 것이다. 하기 표 7 및 표 9에서 기재된 (Genus) 수준 바이오마커라 함은 미생물 바이오마커의 종(speies)가 구분되나, 구체적으로 동정이 종 수준까지 수행되지 않은 것으로서, 실질적으로 species 수준에서 구별되는 미생물 바이오마커임을 의미한다.
발달단계 1과 관련된 종(Species) 수준 바이오마커(1차)
시료번호(species level)(균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Enterococcus faecalis -0.618223 1 1.885624 0.01247
Streptococcus peroris -0.497649 0.95 0.414597 0.014475
Bifidobacterium longum -0.314397 1 28.477828 4.755615
Bifidobacterium scardovii -0.244088 0.916667 1.498041 0.681195
Enterococcus faecium -0.201899 0.95 7.106151 1.48029
Rothia mucilaginosa -0.152262 0.533333 0.177708 0.001652
Veillonella parvula -0.129975 0.716667 0.876127 0.032537
Clostridioides difficile -0.061403 0.35 0.331878 0.100077
Veillonella dispar -0.056745 0.5 2.840242 0.776448
Bifidobacterium pseudolongum -0.055155 0.333333 0.102172 0.032258
Lactobacillus paracasei -0.052383 0.3 0.662389 0.099017
Lactobacillus fermentum -0.047133 0.3 0.182245 0.111444
Staphylococcus aureus -0.046645 0.266667 0.190544 0.003756
Streptococcus sinensis -0.03878 0.2 0.124871 0.123921
Lactobacillus delbrueckii -0.036624 0.316667 0.034776 0.000525
Streptococcus salivarius -0.029187 0.25 4.33701 2.858201
Clostridium paraputrificum -0.024316 0.15 0.225459 0.042078
Bacteroides caccae -0.024235 0.15 0.209986 0.211941
Clostridium tertium -0.023736 0.183333 0.243511 0.010923
Bifidobacterium animalis -0.012494 0.15 0.226015 0.217978
Clostridium butyricum -0.012275 0.116667 0.172851 0.003612
Granulicatella adiacens -0.011808 0.133333 0.032141 0.016157
FWNZ_s (Genus Klebsiella) -0.011279 0.116667 1.046689 0.030994
Streptococcus gallolyticus -0.010265 0.183333 1.033063 0.269234
Enterobacteriaceae -0.009719 0.166667 1.469605 0.367475
Bifidobacterium breve -0.009272 0.183333 7.049017 1.053326
Clostridium perfringens -0.009186 0.1 0.152768 0.005388
Escherichia coli -0.007864 0.166667 6.548644 1.762086
Terrisporobacter petrolearius -0.006267 0.083333 0.025722 0.080401
Bacteroides vulgatus -0.005773 0.1 1.839026 1.638793
PAC001163_s (Genus Blautia) -0.004732 0.066667 0.336045 0.060607
KQ235774_s (Genus Klebsiella) -0.004721 0.05 0.113268 0.106438
Sutterella wadsworthensis -0.004474 0.05 0.027164 0.112334
Clostridium ramosum -0.002546 0.05 0.713797 0.236914
Bacteroides dorei -0.001847 0.033333 0.2586 1.951592
Prevotella copri -0.001655 0.016667 0.087912 0.017899
Veillonella atypica -0.001547 0.033333 0.447658 0.065735
Citrobacter koseri -0.001237 0.016667 0.041994 0.023602
CP011914_s (Genus Eubacterium) -0.00086 0.016667 0.013024 0.033725
Clostridium celatum -0.000719 0.016667 0.598248 1.369989
PAC001178_s (Genus Epulopiscium) -0.000559 0.016667 0.284282 0.030382
Collinsella aerofaciens -0.000549 0.016667 0.210585 0.184206
Leuconostoc lactis -0.000532 0.016667 0.033191 0.012436
Bacteroides uniformis -0.000289 0.033333 0.091656 1.41397
발달단계 1과 관련된 속(Genus) 수준 바이오마커(1차)
시료번호(species level)(균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Enterococcus -0.205616 0.983333 9.101523 1.514777
Bifidobacterium -0.13326 0.983333 40.409598 14.897967
Streptococcus -0.078202 0.733333 6.331705 3.528536
Lactobacillus -0.04119 0.633333 2.375967 0.931366
Rothia -0.013894 0.283333 0.191178 0.00428
Veillonella -0.005144 0.15 5.807609 2.012367
Clostridioides -0.004674 0.066667 0.342586 0.10047
Enterobacteriaceae_g (Genus Enterobacteriaceae) -0.0043 0.1 1.469605 0.367475
Klebsiella -0.002829 0.066667 1.051937 0.031341
Actinomyces -0.001029 0.05 0.306497 0.029024
Clostridium -0.000232 0.016667 2.230602 1.767117
Staphylococcus -0.000149 0.033333 0.191791 0.003814
발달단계 2와 관련된 종(speceis) 수준 바이오마커(1차)
시료번호(species level) (균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Hungatella hathewayi 0.000251 0.016667 0.094561 0.073049
Clostridium innocuum 0.000519 0.016667 0.536483 0.496771
Blautia obeum 0.000728 0.016667 0.025596 0.283337
Roseburia intestinalis 0.000808 0.016667 0.033406 0.376978
Clostridium neonatale 0.000935 0.066667 0.561752 0.061132
Bacteroides ovatus 0.001029 0.016667 0.170532 1.268938
DQ799557_s (Genus Bacteroides) 0.001128 0.016667 0.079239 0.269888
PAC001177_s (Family Lachnospiraceae) 0.001172 0.1 0.095936 0.16772
Coprobacillus cateniformis 0.001199 0.016667 0.032492 0.015334
LT907848_s (Genus Anaerobutyricum) 0.001287 0.016667 0.180159 0.692164
PAC001143_s (Genus Eisenbergiella) 0.001374 0.016667 0.012706 0.27321
PAC001046_s (Family Lachnospiraceae) 0.001967 0.016667 0.000392 0.434514
PAC001305_s (Family Lachnospiraceae) 0.001981 0.033333 0.000453 0.177736
Intestinibacter bartlettii 0.001984 0.033333 0.534782 0.886648
Bacteroides xylanisolvens 0.003104 0.05 0.043177 0.756637
CCMM_s (Family Erysipelotrichaceae) 0.003396 0.1 0.126861 0.53309
KQ968618_s (Genus Akkermansia) 0.003604 0.066667 0.000306 0.666025
Megasphaera micronuciformis 0.003705 0.016667 0.033965 0.040222
Clostridium nexile 0.003745 0.116667 0.591177 0.435947
Roseburia inulinivorans 0.003771 0.05 0.035658 0.738106
Ruminococcus gnavus 0.004187 0.183333 3.57294 2.883981
Eggerthella lenta 0.005097 0.066667 0.143669 0.123881
Bifidobacterium adolescentis 0.005224 0.05 0.006449 1.546615
Romboutsia timonensis 0.005618 0.083333 0.666966 0.798258
Lactobacillus rogosae 0.005688 0.083333 0.052894 0.563106
DQ799511_s (Genus Blautia) 0.006537 0.066667 0.002242 0.054269
Clostridium clostridioforme 0.008845 0.083333 0.124666 0.190663
Akkermansia muciniphila 0.011069 0.183333 0.605722 1.20175
Cellulosilyticum lentocellum 0.011502 0.066667 0.022776 0.037526
Parasutterella excrementihominis 0.014228 0.1 0.001163 0.321641
Agathobaculum butyriciproducens 0.015198 0.116667 0.000282 0.165948
Eubacterium hallii 0.015404 0.2 0.094473 1.256658
Faecalimonas umbilicata 0.016121 0.166667 0.049223 0.204978
LN913006_s (Genus Blautia) 0.016775 0.133333 0.036213 0.425286
Ruminococcus bromii 0.019532 0.183333 0.015017 0.603128
PAC001136_s (Genus Clostridium) 0.021142 0.233333 0.004555 0.188245
Fusicatenibacter saccharivorans 0.024694 0.216667 0.314287 1.907538
Ruminococcus faecis 0.027194 0.15 0.124086 0.669968
Bifidobacterium catenulatum 0.027944 0.316667 1.915472 5.482113
Faecalibacterium prausnitzii 0.03736 0.383333 0.98172 9.068555
Bacteroides fragilis 0.049211 0.5 1.637415 5.670545
Prevotella buccae 0.049889 0.25 0.000156 0.560138
Blautia faecis 0.05423 0.35 0.000464 0.520471
Sellimonas intestinalis 0.054853 0.366667 0.032135 0.243094
Lactobacillus plantarum 0.057454 0.4 0.600968 0.335825
PAC001048_s (Genus Ruminococcaceae) 0.063003 0.35 0.002535 0.281593
Roseburia cecicola 0.072292 0.383333 0.108276 0.459604
Clostridium spiroforme 0.096748 0.383333 0.07068 0.044219
Veillonella ratti 0.120458 0.7 1.346032 1.103508
Agathobacter rectalis 0.133908 0.666667 0.057285 0.579458
Clostridium symbiosum 0.13445 0.65 0.145693 0.118909
Anaerostipes hadrus 0.171178 0.816667 0.304226 3.597979
Gemmiger formicilis 0.175736 0.75 0.080487 1.546753
Alistipes onderdonkii 0.202069 0.616667 0.000477 0.411531
Blautia hansenii 0.271272 0.883333 0.151363 0.166795
PAC001148_s (Family Lachnospiraceae) 0.28366 0.933333 0.271439 0.640186
Bifidobacterium bifidum 0.309518 0.916667 0.87911 0.874891
Ruminococcus torques 0.379602 0.866667 0.002731 0.228165
Blautia wexlerae 0.660876 1 0.634202 6.432939
발달단계 2와 관련된 속(Genus) 수준 바이오마커(1차)
시료번호(species level) (균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Coprococcus_g2 (Family Lachnospiraceae) 0.000345 0.033333 0.634298 0.518112
Prevotella 0.000503 0.033333 0.728 1.326638
Agathobacter 0.000716 0.066667 0.057737 0.59893
PAC000672_g (Family Ruminococcaceae) 0.00116 0.033333 0.002775 0.282116
Pseudoflavonifractor 0.001503 0.05 0.159467 0.221574
Lachnospira 0.001773 0.016667 0.316929 1.607492
Eubacterium_g5 (Family Lachnospiraceae) 0.001984 0.05 0.278224 2.044322
Alistipes 0.00218 0.05 0.000794 0.539207
Clostridium_g24 (Family Lachnospiraceae) 0.003903 0.1 0.479107 1.181915
Akkermansia 0.004259 0.1 0.607531 1.890071
Ruminococcus_g5 (Family Lachnospiraceae) 0.005001 0.133333 3.606215 2.937409
Roseburia 0.021967 0.416667 0.179598 1.660123
Fusicatenibacter 0.022191 0.366667 0.317638 1.958465
Sellimonas 0.0305 0.5 0.033008 0.279463
Ruminococcus_g2 (Family Ruminococcaceae) 0.033029 0.483333 0.020473 1.177464
Bacteroides 0.03449 0.7 4.901392 16.590086
Eisenbergiella 0.036326 0.4 0.042349 0.415958
Subdoligranulum 0.043866 0.65 0.145427 1.898761
Ruminococcus_g4 (Family Lachnospiraceae) 0.054933 0.683333 0.178463 1.097635
Anaerostipes 0.146638 0.883333 0.552492 3.926105
Faecalibacterium 0.153494 0.95 0.98321 9.194765
Blautia 0.326798 1 1.464729 8.879734
4-5. 발달 단계 예측 모델을 이용한 미생물의 특징적 선택(2차)
상기 실시예 4-4의 방법으로 1차적으로 선택한 특징적 바이오마커를, 상기 실시예 3-4에 기재된 방법으로 보정을 수행하였다. 구체적으로, 상기 표 6의 발달단계 1 특이적 종 수준 바이오마커 중, 발달단계 2에서 미생물 분류군의 군집 규모가 더 높은 비율로 나타난 Bacteroides caccae, Terrisporobacter pertrolearius 등 총 7개 미생물 종을 제외하였다. 또한 상기 표 8의 발달단계 2 특이적 바이오마커 중 발달단계 1에서 미생물 분류군의 군집 규모가 더 높은 비율로 나타난 Lachnospiraceae 과 미발표종, Clostridium innocuum, Hungatella hathewayi 등의 총 14개 미생물 종을 제외하였다.
상기 제외된 미생물 분류군를 고려하여, 발달 단계별 특징적 바이오마커를 하기 표 10 내지 표 13에 나타내었다. 하기 표 10 내지 표 13의 바이오마커는 영유아의 장내 미생물 군집의 발달 단계를 구분하는 바이오마커로서 2차로 선정된 최종 바이오마커이다. 발달단계 1에 특이적 바이오마커는 Species level 37개 분류군, Genus level 동정 미생물이 12개 분류군으로 이루어져 있고, 발달단계 2 특이적 바이오마커는 Species level 47개 분류군, Genus level 20개 분류군으로 이루어져 있다. 표 11 및 표 13에서 기재된 (Genus) 수준 바이오마커라 함은 미생물 바이오마커의 종(speies)가 구분되나, 구체적으로 동정이 종 수준까지 수행되지 않은 것으로서, 실질적으로 species 수준에서 구별되는 미생물 바이오마커임을 의미한다.
발달단계 1과 관련된 바이오마커(2차)
시료번호(species level)(균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Enterococcus faecalis -0.618223 1 1.885624 0.01247
Streptococcus peroris -0.497649 0.95 0.414597 0.014475
Bifidobacterium longum -0.314397 1 28.477828 4.755615
Bifidobacterium scardovii -0.244088 0.916667 1.498041 0.681195
Enterococcus faecium -0.201899 0.95 7.106151 1.48029
Rothia mucilaginosa -0.152262 0.533333 0.177708 0.001652
Veillonella parvula -0.129975 0.716667 0.876127 0.032537
Clostridioides difficile -0.061403 0.35 0.331878 0.100077
Veillonella dispar -0.056745 0.5 2.840242 0.776448
Bifidobacterium pseudolongum -0.055155 0.333333 0.102172 0.032258
Lactobacillus paracasei -0.052383 0.3 0.662389 0.099017
Lactobacillus fermentum -0.047133 0.3 0.182245 0.111444
Staphylococcus aureus -0.046645 0.266667 0.190544 0.003756
Streptococcus sinensis -0.03878 0.2 0.124871 0.123921
Lactobacillus delbrueckii -0.036624 0.316667 0.034776 0.000525
Streptococcus salivarius -0.029187 0.25 4.33701 2.858201
Clostridium paraputrificum -0.024316 0.15 0.225459 0.042078
Clostridium tertium -0.023736 0.183333 0.243511 0.010923
Bifidobacterium animalis -0.012494 0.15 0.226015 0.217978
Clostridium butyricum -0.012275 0.116667 0.172851 0.003612
Granulicatella adiacens -0.011808 0.133333 0.032141 0.016157
FWNZ_s (Genus Klebsiella) -0.011279 0.116667 1.046689 0.030994
Streptococcus gallolyticus -0.010265 0.183333 1.033063 0.269234
Enterobacteriaceae -0.009719 0.166667 1.469605 0.367475
Bifidobacterium breve -0.009272 0.183333 7.049017 1.053326
Clostridium perfringens -0.009186 0.1 0.152768 0.005388
Escherichia coli -0.007864 0.166667 6.548644 1.762086
Bacteroides vulgatus -0.005773 0.1 1.839026 1.638793
PAC001163_s (Genus Blautia) -0.004732 0.066667 0.336045 0.060607
KQ235774_s (Genus Klebsiella) -0.004721 0.05 0.113268 0.106438
Clostridium ramosum -0.002546 0.05 0.713797 0.236914
Prevotella copri -0.001655 0.016667 0.087912 0.017899
Veillonella atypica -0.001547 0.033333 0.447658 0.065735
Citrobacter koseri -0.001237 0.016667 0.041994 0.023602
PAC001178_s (Genus Epulopiscium) -0.000559 0.016667 0.284282 0.030382
Collinsella aerofaciens -0.000549 0.016667 0.210585 0.184206
Leuconostoc lactis -0.000532 0.016667 0.033191 0.012436
발달단계 1과 관련된 속(Genus) 수준 바이오마커(2차)
시료번호(species level)(균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Enterococcus -0.205616 0.983333 9.101523 1.514777
Bifidobacterium -0.13326 0.983333 40.409598 14.897967
Streptococcus -0.078202 0.733333 6.331705 3.528536
Lactobacillus -0.04119 0.633333 2.375967 0.931366
Rothia -0.013894 0.283333 0.191178 0.00428
Veillonella -0.005144 0.15 5.807609 2.012367
Clostridioides -0.004674 0.066667 0.342586 0.10047
Enterobacteriaceae_g (Genus Enterobacteriaceae) -0.0043 0.1 1.469605 0.367475
Klebsiella -0.002829 0.066667 1.051937 0.031341
Actinomyces -0.001029 0.05 0.306497 0.029024
Clostridium -0.000232 0.016667 2.230602 1.767117
Staphylococcus -0.000149 0.033333 0.191791 0.003814
발달단계 2와 관련된 종(speceis) 수준 바이오마커(2차)
시료번호(species level) (균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Blautia obeum 0.000728 0.016667 0.025596 0.283337
Roseburia intestinalis 0.000808 0.016667 0.033406 0.376978
Bacteroides ovatus 0.001029 0.016667 0.170532 1.268938
DQ799557_s (Genus Bacteroides) 0.001128 0.016667 0.079239 0.269888
PAC001177_s (Family Lachnospiraceae) 0.001172 0.1 0.095936 0.16772
LT907848_s (Genus Anaerobutyricum) 0.001287 0.016667 0.180159 0.692164
PAC001143_s (Genus Eisenbergiella) 0.001374 0.016667 0.012706 0.27321
PAC001046_s (Family Lachnospiraceae) 0.001967 0.016667 0.000392 0.434514
PAC001305_s (Family Lachnospiraceae) 0.001981 0.033333 0.000453 0.177736
Intestinibacter bartlettii 0.001984 0.033333 0.534782 0.886648
Bacteroides xylanisolvens 0.003104 0.05 0.043177 0.756637
CCMM_s (Family Erysipelotrichaceae) 0.003396 0.1 0.126861 0.53309
KQ968618_s (Genus Akkermansia) 0.003604 0.066667 0.000306 0.666025
Megasphaera micronuciformis 0.003705 0.016667 0.033965 0.040222
Roseburia inulinivorans 0.003771 0.05 0.035658 0.738106
Bifidobacterium adolescentis 0.005224 0.05 0.006449 1.546615
Romboutsia timonensis 0.005618 0.083333 0.666966 0.798258
Lactobacillus rogosae 0.005688 0.083333 0.052894 0.563106
DQ799511_s (Genus Blautia) 0.006537 0.066667 0.002242 0.054269
Clostridium clostridioforme 0.008845 0.083333 0.124666 0.190663
Akkermansia muciniphila 0.011069 0.183333 0.605722 1.20175
Cellulosilyticum lentocellum 0.011502 0.066667 0.022776 0.037526
Parasutterella excrementihominis 0.014228 0.1 0.001163 0.321641
Agathobaculum butyriciproducens 0.015198 0.116667 0.000282 0.165948
Eubacterium hallii 0.015404 0.2 0.094473 1.256658
Faecalimonas umbilicata 0.016121 0.166667 0.049223 0.204978
LN913006_s (Genus Blautia) 0.016775 0.133333 0.036213 0.425286
Ruminococcus bromii 0.019532 0.183333 0.015017 0.603128
PAC001136_s (Genus Clostridium) 0.021142 0.233333 0.004555 0.188245
Fusicatenibacter saccharivorans 0.024694 0.216667 0.314287 1.907538
Ruminococcus faecis 0.027194 0.15 0.124086 0.669968
Bifidobacterium catenulatum 0.027944 0.316667 1.915472 5.482113
Faecalibacterium prausnitzii 0.03736 0.383333 0.98172 9.068555
Bacteroides fragilis 0.049211 0.5 1.637415 5.670545
Prevotella buccae 0.049889 0.25 0.000156 0.560138
Blautia faecis 0.05423 0.35 0.000464 0.520471
Sellimonas intestinalis 0.054853 0.366667 0.032135 0.243094
PAC001048_s (Genus Lachnospiraceae) 0.063003 0.35 0.002535 0.281593
Roseburia cecicola 0.072292 0.383333 0.108276 0.459604
Agathobacter rectalis 0.133908 0.666667 0.057285 0.579458
Anaerostipes hadrus 0.171178 0.816667 0.304226 3.597979
Gemmiger formicilis 0.175736 0.75 0.080487 1.546753
Alistipes onderdonkii 0.202069 0.616667 0.000477 0.411531
Blautia hansenii 0.271272 0.883333 0.151363 0.166795
PAC001148_s (Family Lachnospiraceae) 0.28366 0.933333 0.271439 0.640186
Ruminococcus torques 0.379602 0.866667 0.002731 0.228165
Blautia wexlerae 0.660876 1 0.634202 6.432939
발달단계 2와 관련된 속(Genus) 수준 바이오마커(2차)
시료번호(species level) (균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Prevotella 0.000503 0.033333 0.728 1.326638
Agathobacter 0.000716 0.066667 0.057737 0.59893
PAC000672_g (Family Ruminococcaceae) 0.00116 0.033333 0.002775 0.282116
Pseudoflavonifractor 0.001503 0.05 0.159467 0.221574
Lachnospira 0.001773 0.016667 0.316929 1.607492
Eubacterium_g5 (Family Lachnospiraceae) 0.001984 0.05 0.278224 2.044322
Alistipes 0.00218 0.05 0.000794 0.539207
Clostridium_g24 (Family Lachnospiraceae) 0.003903 0.1 0.479107 1.181915
Akkermansia 0.004259 0.1 0.607531 1.890071
Roseburia 0.021967 0.416667 0.179598 1.660123
Fusicatenibacter 0.022191 0.366667 0.317638 1.958465
Sellimonas 0.0305 0.5 0.033008 0.279463
Ruminococcus_g2 (Family Ruminococcaceae) 0.033029 0.483333 0.020473 1.177464
Bacteroides 0.03449 0.7 4.901392 16.590086
Eisenbergiella 0.036326 0.4 0.042349 0.415958
Subdoligranulum 0.043866 0.65 0.145427 1.898761
Ruminococcus_g4 (Family Lachnospiraceae) 0.054933 0.683333 0.178463 1.097635
Anaerostipes 0.146638 0.883333 0.552492 3.926105
Faecalibacterium 0.153494 0.95 0.98321 9.194765
Blautia 0.326798 1 1.464729 8.879734
4-6. 영유아 발달 단계 예측 모델의 검증
상기 실시예 3-5의 방법을 이용하여, 영유아 발달 단계를 학습한 최적화 기계 학습 모델이 실제로 영유아 발달 단계를 정확하게 구별하는지 살펴보았다.
최적화 기계 학습 모델이 Test set에 대한 발달 단계를 판정한 결과의 ROC 곡선 (receiver operating characteristic curve) 및 AUC (area under curve) 그래프를 도 6에 나타내었다. ROC 곡선이 활 모양으로 크게 굽어져 있고, AUC는 0.98로 1에 가까운 값을 보이므로 상기 실시예 4-3에서 영유아 발달 단계를 예측한 결과가 유의미함을 확인하였다.
4-7. 영유아 발달 단계의 판별 지수
상기 실시예 4-6의 예측 결과에 정확한 임상적 해석을 부여하기 위해, 상기 실시예 3-6과 실질적으로 동일한 방법으로, 각 바이오마커 미생물의 군집 규모 비율과 Coefficient의 내적곱으로 계산한 0과 1사이의 확률값을, 학습에 사용한 발달단계 1과 발달단계 2의 비율로 나눠 리스케일하였다.
상기 수학식 7에서,
Figure PCTKR2020007494-appb-I000039
는 발달단계 2의 판별을 위한 시험 대상의 예측 점수이고, P0 는 예측 모델 구축에 사용된 training set에 존재하는 발달단계 2에 해당하는 샘플의 비율이며, Ncase 는 training set 내 발달단계 2에 해당하는 샘플의 수이고, Ntrain 은 training set의 전체 샘플 수이다. 이렇게 계산된 지수는 '영유아 발달 지수'로 명명하였다.
상기 영유아 발달 지수를 통해 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy) 값을 확인하였다. 상기 수학식 8 내지 10에서, FP는 발달단계 1에 해당하는 시료에서 영유아 발달 지수(
Figure PCTKR2020007494-appb-I000040
)가 cut-off보다 큰 경우의 수이고, FN은 발달단계 1에 해당하는 시료에서 영유아 발달 지수(
Figure PCTKR2020007494-appb-I000041
)가 cut-off보다 작은 경우의 수이고, TP는 발달단계 2에 해당하는 시료에서 영유아 발달 지수(
Figure PCTKR2020007494-appb-I000042
)가 cut-off보다 큰 경우의 수이고, TN은 발달단계 2에 해당하는 시료에서 영유아 발달 지수(
Figure PCTKR2020007494-appb-I000043
)가 cut-off보다 작은 경우의 수이고, 이러한 결과를 도 6에 나타내었다.
정확도가 약 98%로 계산된 가장 높은 지수 1.19를 기준으로 영유아 발달 단계를 판별할 경우, 발달단계 2를 정확하게 맞추는 특이도는 약 98%, 영유아 발달단계 1을 정확하게 판단하는 민감도는 약 97%이다. 해당 정확도 그래프를 도 6에 나타내었다.
영유아 발달 지수 1.19를 기준으로 장내 미생물 불균형 여부를 판별할 때, 특이도는 약 98%로 발달 단계를 정확하게 구별할 수 있으므로 임상학적으로 높은 판별능을 보이는 것을 알 수 있다. 따라서, 영유아 발달 지수가 1.19 이상인 경우, 발달단계 2로 판별할 수 있으며, 1.19 미만으로 계산되는 경우, 발달단계 1로 판별할 수 있다.
4-8. 영유아 장내 미생물 발달 단계의 구분
(A) 영유아 발달 단계의 구분 개요
영유아 발달 단계는 식이단계, 월령 및 영유아 발달 지수 (장내 미생물 군집의 정보에 기초)로 이루어지는 군에서 선택된 1종 이상의 기준으로 판별할 수 있다. 상기 영유아 발달 지수는 하기 표 10 내지 표 13의 바이오마커는 영유아의 장내 미생물 군집의 발달 단계를 구분하는 바이오마커로서 2차로 선정된 최종 바이오마커를 활용한 것이다. 하기 표 14에 각 발달 단계 판별 기준에 따른 발달 단계 판별 방법을 요약하였다.
영유아 발달 단계 판별 기준
구분 발달단계 1 발달단계 2
식이 단계 수유식(액상 식이)이유식(겔상 식이) 고형 식이
생후 개월수(월령) 15개월 미만 15개월 이상
영유아 발달 지수 발달 지수 1.19 미만 발달 지수 1.19 이상
(B) 식이단계를 이용한 영유아 발달 단계의 구분
식이단계를 통한 영유아 발달 단계 판별은, 영유아가 섭취하는 식이를 액상의 수유식, 겔상의 이유식, 고형의 유아식 및 고형의 일반식으로 분류하고, 영유아의 메타데이타 정보 (식이)에 근거하여 액상의 수유식 또는 겔상의 이유식 식이 단계를 발달단계 1로, 고형 식이 즉 유아식 또는 일반식을 섭취하는 단계를 발달단계 2로 분류하는 방법이다. 따라서 액상 또는 겔상의 수유식 또는 이유식에서 고형의 식이를 섭취하는 시점을 판단 기준으로 삼는다.
(C) 월령을 이용한 영유아 발달 단계의 구분
생후 개월수(월령)를 기준으로 한 발달 단계 판별의 경우, 영유아의 메타데이타 정보 (영유아의 월령)에 근거하여, 조사 대상 영유아의 월령이 15개월 미만인 경우 발달단계 1로, 월령이 15개월 이상인 경우 발달단계 2로 판별한다.
15개월이라는 기준 시기는 식이 형태가 겔상에서 고형으로 전환되는 시기이며, 실시예 4-2의 DMM clustering 방법을 통해 그룹이 분류되는 시기이다. 영유아의 장내 미생물 생태계는 특정 시점, 예를 들면 15개월을 기점으로 미생물 종류, 미생물 종의 양, 미생물 종의 다양성이 가장 크게 변한다. 출생 직후부터 15개월까지는 면역, 모유의 소화 및 장내 안정화 등에 기여하는 미생물 종으로 이루어져 있으며, 15개월 이후로 식이섬유 등 다양한 음식물의 대사와 관련된 미생물 종이 늘어나고 종 다양성이 큰 폭으로 증가한다.
(D) 발달단계 특이적 바이오마커를 이용한 영유아 발달 단계의 구분
영유아 발달 지수를 기준으로 하는 경우, 수집된 장내 미생물의 군집 분석 데이터에 근거하여 각 발달 단계에 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 상술한 영유아 발달 단계 예측 모델에 적용함으로써 발달 단계를 판별하는 방법이다. 각 발달 단계에 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 발달지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 발달지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 발달단계 1로 선정하고, 설정값 이상인 경우를 발달단계 2로 선정한다.
본 실험에서는, 상기 실시예 4-7에 의해, 발달지수 1.19를 기준으로 1.19 미만인 경우 발달단계 1로, 발달지수 1.19 이상인 경우 발달단계 2로 판별한다.
설문의 응답에 의존하는 식이 단계 및 생후 개월 수를 기준으로 발달 단계를 판별하는 경우, 상기 표 2의 문항을 포함하는 형태의 설문에 대한 응답이 선행되어야 한다. 영유아 발달 지수를 기준으로 한 판별의 경우, 실시예 2의 방법을 이용한 장내 미생물 분석이 선행되어야 한다.
영유아 장내 미생물 생태계는 부모 및 주변 환경에 상주하는 미생물들이 무균 상태의 신생아에 전달되어 정착해 나감으로써 형성되고, 영유아의 성장과 식이에 따라 영유아 장내의 종 풍부도 및 다양성이 증가한다. 이러한 증가 추세에서, 영유아 발달 단계 특이적 바이오마커는 영유아의 성장에 따른 장내 미생물 생태계의 발달 양상을 구체적으로 나타낸다. 영유아의 발달단계 1에 특이적인 바이오마커는 상기 표 10 및 표 11에 기재되어 있고, 발달단계 2에 특이적인 바이오마커는 상기 표 12 및 표 13에 기재되어 있다.
발달단계 1에 특이적인 바이오마커 중 Enterococcus, Streptococcus, 및 Lactobacillus는 Firmicutes 문(phylum)에 포함되고, Bifidobacterium은 Actinobacteria 문(phylum)에 포함되는 미생물이다. 상기 Enterococcus, Bifidobacterium, Streptococcus, 및 Lactobacillus는 모두 유산균으로, 유산균은 산모의 신체로부터 자녀로 전달되어 가장 먼저 무균 상태의 신생아의 장에 정착하는 미생물로, 다른 미생물보다 장내 환경에 용이하게 정착한 뒤, 항균 물질을 분비하여 다양한 외부 항원의 정착을 막는 역할을 한다. 또한 발달단계 1에 특이적인 종 수준 바이오마커 중 하나인 Bifidobacterium longum의 경우에는, 외부 항원에서 나타나는 단백질 가수분해 효소를 세르핀이라는 물질로 저해하는 기작으로 면역력에 기여한다. 무엇보다, 유산균은 유당을 분해하는 미생물로, 영유아가 모유를 잘 소화할 수 있도록 돕는 역할이 가장 크다. phylum Proteobacteria에 포함되는 대장균 계열(Escherichia)의 경우, 유산균이 전해지기 전, 태변에서 가장 많이 발견되는 미생물로, 신생아의 장내 환경에 가장 먼저 정착하여 장내의 산소를 흡수함으로써 장내를 혐기성 환경으로 조성하여, 안정화에 도움을 준다.
발달단계 2에 특이적인 바이오마커는 크게 Blautia, Faecalibacterium, Anaerostipes을 비롯한 phylum firmicutes 계열과 Prevotella, Bacteroides의 phylum Bacteroidetes 계열로 나눌 수 있다.
장내 미생물 군집이 유산균 위주의 phylum Firmicutes, Actinobacteria(발달단계 1)에서 phylum Firmicutes, Bacteroidetes로 전환된 것을 알 수 있다. Phylum Firmicutes 및 Bacteroidetes가 장내 미생물 군집에서 두드러지는 양상은 성인에게서 가장 보편적으로 나타나는 특징이다. 이러한 양상은 영유아의 장내 미생물 생태계가 성인의 장내 환경과 비슷한 모습으로 발달하고 있는 것을 의미한다. 영유아가 신체적으로 성장하고, 필요로 하는 영양소가 다양해짐에 따라, 섭취하는 식품 또한 다양해지면서 장내 미생물 군집의 미생물 종과, 각각의 미생물 종들이 가진 대사적 다양성이 증가하게 된다.
발달단계 2에 특이적인 바이오마커의 구성은 상기 실시예 2-2에서 언급한 바와 같이 섬유질 대사와 관련된 짧은 사슬 지방산 생성균이 주를 이루고 있다. 특히, 발달단계 2의 Firmicutes 문의 경우, 대표적인 짧은 사슬 지방산의 생성균이 가장 많이 포함된 Clostridiales 목(order)의 미생물 종들(Blautia, Faecalibacterium, Anaerostipes)이 가장 높은 coefficient 값을 보인다.
Phylum Bacteroidetes의 genus Prevotella 및 Bacteroides는 식이섬유와 단백질을 분해하는 대표적인 미생물이다. 이 미생물들은 인종, 지역, 개인을 아우르는, 성인의 장 유형(enterotype)을 나누는 기준으로 2011년 학술지 nature를 통해 언급된 바 있다. 장 유형에 대한 후속 연구에서 주로 고식이섬유-저단백질 식습관에서 Prevotella가 나타나고, 저식이섬유(단순당)-고단백질 식습관에서 Bacteroides가 많이 나타나는 특징이 보고된 바 있다. 발달단계 2에서 Prevotella 및 Bacteroides가 가지는 coefficient 및 robustness 값을 보면, Bacteroides가 Prevotella에 비해 모두 높은 값을 보이고 있다. 이를 통해, 영유아의 장내 미생물 유형은 주로 Bacteroides 형으로 발달하는 것을 알 수 있다. 단, 아직 Prevotella 및 Bacteroides 유형을 정확히 규명하기에는 연구가 미흡한 실정이며, 영유아 장내 미생물에서 주로 나타나는 장 유형에 대한 해석의 여지 또한 아직 많다.
실시예 5. 영유아의 발달 단계 별 장내 미생물의 불균형 및 균형 구분
5-1. 발달 단계 별 장내 미생물 분석 데이터의 그룹화
상기 실시예 3-1의 DMM 클러스터링 방법에 따라, 장내 미생물 분석 데이터를 이용하여 발달 단계 별 영유아 샘플을 그룹화하였다. 각 발달 단계에서 2개 그룹이 나뉘었으며, 총 4개 그룹이 클러스터링되었다. 각 발달 단계 별 영유아 샘플은 다음과 같이 분포한다.
총 샘플 수: 120
발달 단계1 제1 그룹 샘플 수: 36
발달 단계1 제2 그룹 샘플 수: 33
발달 단계2 제 3 그룹 샘플 수: 32
발달 단계2 제 4 그룹 샘플 수: 19
5-2. 영유아 메타 데이터를 이용한 영유아 장내 미생물 불균형의 규정
장내 미생물 불균형 및 균형 관련 인자들과의 연관성을 계산하기 위해, Chong의 2018년 연구(Factors Affecting Gastrointestinal Microbiome Development in Neonates. Nutrients. 2018 Feb 28;10(3).)를 참고하였다.
장내 미생물 불균형은 일반적으로 생태계의 종 다양성을 낮아지게 하는 요인인 가공식품 섭취, 항생제 복용 등에 의해 일어나는 불균형 상태로 정의된다. 장내 미생물 균형 상태를 정의하는 뚜렷한 기준은 아직 없으나, 본 발명에서는 불균형 인자를 포함하지 않는 건강한 영유아 샘플의 장내 미생물 생태계를 균형 상태로 정의하였다. 따라서, 장내 미생물의 불균형군이라 함은 장내 불균형을 일으키는 메타 데이터와 연관되어 있는 장내 미생물 군집을 보유한 샘플군으로 정의하고, 균형군이라 함은 장내 불균형의 완화하는 메타 데이터와 연관되어 있는 장내 미생물 군집을 보유한 샘플군으로 정의한다. 장내 미생물 불균형 및 균형과 관련된 인자는 표 2의 설문지로 수집한 메타 데이터와 상기 Chong의 2018년 연구에서 언급한 항목을 참고하여 선정하였다. 신생아의 장내 미생물에 영향을 미치는 요인은 영유아의 나이, 항생제 복용 여부, 출산 형태, 수유 방법, 설사 유무 등이다. 표 15에 선정한 항목 및 답변에 따른 분류를 나타내었다.
Figure PCTKR2020007494-appb-T000002
장내 미생물 불균형 관련 인자 각각을 군집 좌표와 (permutational) MANOVA를 수행하여 P-value와 R2를 계산하였다. P-value가 낮고 R2가 높을수록 해당 인자와 군집 좌표의 상관관계가 높다고 볼 수 있다. 또한 각 장내 미생물 불균형 관련 인자들의 좌표 중심점을 계산하여 해당 인자와 양의 상관관계를 갖는 샘플들의 위치를 예측하였다. 위 분석들은 통계분석 프로그램 R의 vegan 패키지를 이용하여 계산하였다. 발달단계 1에 대한 P-value 및 R2값을 표 16에, 발달단계 1에 대한 메타 데이터의 방향성에 대한 계산 결과를 표 17에 나타내었으며, 발달단계 2에 대한 P-value 및 R2값은 표 18에, 발달단계 2에 대한 메타 데이터의 방향성에 대한 계산 결과는 표 19에 나타내었다.
하기 표 17 및 표 19에서, coord1 및 coord2는 각각의 그룹에 유의적으로 관련이 있는 장내 불균형 관련 인자의 좌표 상 화살표(correlation arrows)의 위치이다. coord1은 가로축의 좌표값을, coord2는 세로축의 좌표값을 의미한다. 좌표 상 화살표는 각 그룹과 연관된 정도에 따라 해당 방향과 길이로 나타난다.
발달단계 1에 대한 장내 미생물 불균형 관련 인자의 연관성
메타 데이터 종류 R2 P-value
lactation_bf 0.040322 0.0599
age_month 0.070071 0.0918
birth_mode_natural 0.018764 0.2866
Antibiotics 0.007639 0.6059
Diarrhea 0.0049 0.7248
발달단계 1에 대한 장내 미생물 불균형 관련 인자의 방향성
메타 데이터 종류 coord1 coord2
age_month 0.017031 -0.26416
antibioticsFALSE 0.001282 0.009315
antibioticsTRUE -0.004248 -0.030855
diarrheaFALSE -0.002856 -0.000619
diarrheaTRUE 0.062828 0.013628
birth_mode_naturalFALSE 0.020454 0.030504
birth_mode_naturalTRUE -0.010909 -0.016269
lactation_bfFALSE 0.031211 -0.016939
lactation_bfTRUE -0.038259 0.020764
발달단계 2에 대한 장내 미생물 불균형 관련 인자의 연관성
메타 데이터 종류 R2 P-value
antibiotics 0.075639 0.0211
age_month 0.118405 0.0482
birth_mode_natural 0.058039 0.0489
diarrhea 0.017417 0.4513
발달단계 2에 대한 장내 미생물 불균형 관련 인자의 방향성
메타 데이터 종류 coord1 coord2
age_month -0.097983 0.329856
antibioticsFALSE -0.03849 -0.022217
antibioticsTRUE 0.070565 0.040732
diarrheaFALSE -0.005357 0.00231
diarrheaTRUE 0.131238 -0.056605
birth_mode_naturalFALSE 0.056386 0.028105
birth_mode_naturalTRUE -0.03947 -0.019673
도 7a 및 도 7b은 DMM 클러스터링 결과로 그룹화된 각 발달단계에 따라 장내 미생물 불균형 관련 인자의 좌표 상 화살표를 나타낸 그래프이다. 선정된 메타 데이터의 장내 미생물 불균형 관련 인자 중에서, 생후 개월수(age_month)는 표 16 및 표 18에서 R2값이 각각 0.070071과 0.118405로 다른 불균형 관련 인자에 비해 가장 높은 상관 관계를 보였다. 표 17과 표 19의 좌표값을 통해 도 7에서 나타난 바를 보더라도, 생후 개월수가 다른 인자들에 비해 가장 구별되어 있음을 알 수 있다. 이는 생후 개월수가 발달 단계에 가장 큰 영향을 미치는 요인이되, 발달 단계 내의 두 그룹을 나누는 기준이 아니라는 것을 의미한다. 즉, 월령은 장내 미생물 불균형에는 유의미한 영향을 미치지 않았다
도 7a 및 도 7b를 보면, 상기 실시예 3-2에 따라 구분된 발달단계 1(도 7a )과 발달단계 2(도 7b의 두 그룹은 각각 설사 유무, 항생제 복용 여부, 출산 방식, 모유 수유 여부의 좌표값과 연관되어 있는 것을 알 수 있다. 도 7a에 따르면, 실시예 3-2에 따라 나뉜 발달단계 1에서 모유 수유(lactation_bfTRUE), 자연 분만(birth_mode_naturalTRUE)의 좌표값이 항생제 복용(antibioticsTRUE), 설사(diarrheaTRUE) 좌표값에 비해 1그룹의 중심점을 향하고 있고, 2그룹의 중심점은 설사(diarrheaTRUE) 좌표값과 강한 연관을 보인다. 도 7의 B패널에 따르면 자연 분만(birth_mode_naturalTRUE)의 좌표값이 항생제 복용(antibioticsTRUE), 설사(diarrheaTRUE) 좌표값에 비해 1그룹의 중심점을 향하고 있고, 2그룹의 중심점은 항생제 복용(antibioticsTRUE) 및 설사(diarrheaTRUE) 좌표값과 강한 연관성을 보인다.
따라서, 발달단계 1과 발달단계 2에서 DMM 클러스터링에 의해 각각 그룹화된 두 그룹은 장내 미생물 분석 데이터뿐만 아니라, 장내 미생물 불균형 메타 데이터와 관련성이 강한 그룹이다. 특히, 장내 미생물 불균형을 일으키는 것으로 알려진 설사, 제왕절개, 항생제 복용, 분유 수유와 관련된 그룹은 장내 미생물 불균형과 관련된 그룹으로 규정할 수 있다. 또한, 동일한 발달 단계 내에서, 장내 미생물 불균형 관련 그룹과 구별되는 샘플군은 모유 수유, 자연 분만과 관련되어 있으므로 장내 균형과 관련된 그룹으로 규정할 수 있다. 장내 미생물 불균형 및 장내 균형과 강한 연관을 보이는 메타 데이터 인자를 표 20에 나타내었다.
발달 단계 균형여부 관련 메타 데이터 인자 coord1 coord2
발달단계 1 균형 그룹 birth_mode_naturalTRUE -0.010909 -0.016269
lactation_bfTRUE -0.038259 0.020764
불균형 그룹 diarrheaTRUE 0.062828 0.013628
antibioticsTRUE -0.004248 -0.030855
발달단계 2 균형 그룹 birth_mode_naturalTRUE -0.03947 -0.019673
불균형 그룹 diarrheaTRUE 0.131238 -0.056605
antibioticsTRUE 0.070565 0.040732
5-3. 발달 단계 별 기계 학습 모델의 적용
상기 실시예 3-2에 따라, 상기 규정한 발달 단계 별 장내 미생물 불균형 및 균형 그룹의 장내 미생물 분석 데이터를 기계 학습에 적용하였다. 모델의 하이퍼파라미터에 해당하는 정규화 파라미터 즉, 본 발명에 따른 최적화된 영유아 장내 미생물 불균형 예측 모델은 상기 수학식 1의
Figure PCTKR2020007494-appb-I000044
값 중 가장 좋은 예측 결과를 보이는 값을 통해 선택한다. 발달단계 1에서 불균형 여부를 판별하는 최적화 예측 결과값은 0.05, 발달단계 2의 최적화 예측 결과값은 100으로 확정하였다.
5-4. 장내 미생물 불균형 예측 모델을 이용한 바이오마커의 특징적 선택(1차)
1차 특징적 선택으로 나타난 장내 균형군과 관련된 바이오마커는 종 수준(Species level)에서 31개, 속 수준(Genus level)에서 26개 분류군으로 나타났다. 반면, 불균형군과 관련된 바이오마커는 종 수준(Species level)에서 26개, 속 수준(Genus level)에서 24개 분류군이다. 표 21 내지 표 28에는 균형군과 관련된 종 수준 바이오마커 및 균형군과 관련된 속 수준 바이오마커, 불균형군과 관련된 종 수준 바이오마커, 불균형군과 관련된 속 수준 바이오마커의 종류를 발달 단계 별로 각각 표시하였다.
하기 표 21 내지 28에서, 상기 실시예 3-4와 마찬가지로, coefficient 는 수학식 4의 β를 계산하여 얻고, 음수값일 경우 균형군에 특이적인 미생물임을 의미하며, 양수값일 경우 불균형군에 특이적인 미생물임을 의미한다. robustness 는 100번 반복 수행한 부트스트랩 결과를 통해 해당 미생물이 해당 결과로 나타난 경우를 계산하여 얻고, 1에 가까울수록 반복적으로 해당 그룹에 특이적인 결과임을 의미한다. 또한, 균형군 비율과 불균형 비율은 각각 동정된 전체 미생물의 총 reads 수에 대비하여 해당 미생물이 차지하는 reads 수를 통해 비율을 계산하여 얻고, 군집 규모(population)를 의미한다.
균형군과 관련된 종 수준 바이오마커(발달단계 1)
시료번호(species level)(균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Bifidobacterium longum -0.070612 0.933333 51.243026 21.23793
Lactobacillus gasseri -0.031707 0.616667 1.055237 0.22722
Streptococcus peroris -0.023587 0.4 0.814519 0.221563
Bifidobacterium bifidum -0.011173 0.3 1.745036 0.563617
Enterococcus faecalis -0.011012 0.3 3.588835 1.564981
Streptococcus pneumonia -0.007745 0.166667 0.203145 0.075435
Bifidobacterium breve -0.005682 0.216667 8.686701 7.201174
Rothia mucilaginosa -0.001013 0.033333 0.397782 0.075418
Streptococcus salivarius -0.000717 0.016667 4.78868 2.924272
Anaerostipes hadrus -0.00063 0.033333 0.266833 0.03419
Enterococcus faecium -0.000245 0.033333 6.333801 4.757783
Eggerthella lenta -0.000058 0.016667 0.189416 0.074407
균형군과 관련된 속 수준 바이오마커(발달단계 1)
시료번호(genus level)(균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Bifidobacterium -0.168201 1 62.580789 33.045218
Enterococcus -0.001554 0.083333 10.041681 6.371829
Akkermansia -0.000945 0.016667 0.212773 1.174082
Rothia -0.000901 0.05 0.407708 0.084993
Eggerthella -0.000268 0.016667 0.202414 0.076959
Lactobacillus -0.000171 0.016667 2.804877 2.013835
Ruminococcus_g5 (Family Ruminococcaceae) -0.000124 0.016667 0.727894 3.103867
Anaerostipes -0.000071 0.016667 0.30337 0.157415
불균형군과 관련된 종(speceis)수준 바이오마커(발달단계 1)
시료번호(species level) (균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
FWNZ_s (Genus Klebsiella) 0.000031 0.016667 0.149975 1.899234
Flavonifractor plautii 0.000576 0.033333 0.005163 0.229055
Streptococcus gallolyticus 0.001891 0.1 0.243751 1.754617
Clostridium neonatale 0.002055 0.116667 0.010955 1.006057
Clostridioides difficile 0.010121 0.25 0.091256 0.578815
Veillonella ratti 0.017467 0.333333 0.561349 2.445463
Escherichia coli 0.018013 0.316667 4.687128 9.505538
Clostridium paraputrificum 0.021838 0.333333 0.042032 0.510855
Bacteroides vulgatus 0.036621 0.6 0.140871 5.123635
Veillonella atypica 0.063393 0.716667 0.043712 1.088948
Veillonella dispar 0.171471 1 0.529256 4.334027
불균형군과 관련된 속(Genus) 수준 바이오마커(발달단계 1)
시료번호(genus level) (균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Pseudoflavonifractor 0.00372 0.116667 0.009344 0.250999
Clostridioides 0.007392 0.183333 0.116913 0.580252
Escherichia 0.016107 0.35 4.706873 9.535802
Clostridium_g24 (Family Lachnospiraceae) 0.016223 0.333333 0.052884 0.366841
Clostridium 0.027992 0.566667 0.441519 3.809211
Bacteroides 0.039796 0.65 2.059269 8.545303
Veillonella 0.365429 1 1.498936 9.707073
균형군과 관련된 종 수준 바이오마커(발달단계 2)
시료번호(species level) (균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Fusicatenibacter saccharivorans -0.113431 0.716667 2.451463 0.770204
Faecalibacterium prausnitzii -0.067313 0.7 11.303225 4.18633
Blautia faecis -0.052685 0.433333 0.815303 0.01675
Bifidobacterium catenulatum -0.045657 0.483333 5.608016 2.749555
Anaerostipes hadrus -0.031165 0.3 4.493286 1.038971
Gemmiger formicilis -0.029734 0.45 1.934029 0.552129
Eubacterium eligens -0.016785 0.166667 0.841646 0.085065
Blautia wexlerae -0.010245 0.083333 5.646432 2.316964
Ruminococcus bromii -0.006754 0.083333 0.950139 0.068682
Eubacterium hallii -0.006486 0.1 1.470321 0.388819
Roseburia inulinivorans -0.004387 0.15 1.023162 0.008023
Bifidobacterium bifidum -0.002405 0.033333 0.722383 0.172211
LT907848_s (Genus Anaerobutyricum) -0.00205 0.033333 1.010872 0.061536
Bacteroides fragilis -0.001945 0.116667 4.954876 5.440352
Roseburia cecicola -0.000708 0.016667 0.637494 0.072541
Clostridium celatum -0.000548 0.016667 1.47384 0.790128
PAC001046_s (Family Lachnospiraceae) -0.00027 0.033333 0.681424 0.000712
Lactobacillus rogosae -0.000069 0.016667 0.634118 0.040713
Bacteroides uniformis -0.00002 0.016667 2.133196 0.316344
균형군과 관련된 속 수준 바이오마커(발달단계 2)
시료번호(species level) (균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Ruminococcus_g2 (Family Ruminococcaceae) -0.466909 0.916667 1.860715 0.070953
Lachnospira -0.384064 0.833333 1.875378 0.12984
Bacteroides -0.22437 0.766667 17.524886 14.548922
Faecalibacterium -0.165892 0.466667 11.503136 4.195657
Eubacterium_g5 (Family Lachnospiraceae) -0.116977 0.366667 2.608563 0.480289
Fusicatenibacter -0.070078 0.483333 2.514382 0.791564
Roseburia -0.038164 0.283333 2.255163 0.32842
Subdoligranulum -0.02894 0.183333 2.476985 0.559366
Blautia -0.016366 0.233333 8.472013 3.055045
CCMM_g (Family Erysipelotrichaceae) -0.013717 0.166667 0.811336 0.139387
Agathobacter -0.013303 0.116667 0.649122 0.123431
Akkermansia -0.009818 0.116667 1.838978 2.882973
Anaerostipes -0.008317 0.083333 4.771253 1.473928
Parasutterella -0.008229 0.066667 0.270422 0.176537
Romboutsia -0.005091 0.066667 0.927612 0.867899
PAC001046_g (Family Lachnospiraceae) -0.004184 0.033333 0.694255 0.000712
Eubacterium_g23 (Family Ruminococcaceae) -0.001176 0.016667 0.422063 0.00009
Alistipes -0.001155 0.016667 0.398863 1.24756
불균형군과 관련된 종(speceis) 수준 바이오마커(발달단계 2)
시료번호(species level) (균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Streptococcus salivarius 0.000255 0.016667 2.374956 4.833057
Bacteroides dorei 0.000329 0.016667 1.610086 2.637872
PAC001148_s (Family Lachnospiraceae) 0.000436 0.016667 0.278625 0.597653
FWNZ_s (Genus Klebsiella) 0.000743 0.05 0.032624 2.392581
Haemophilus parainfluenzae 0.001315 0.033333 0.128404 0.246825
Lactobacillus paracasei 0.001989 0.016667 0.108647 0.150154
Bifidobacterium longum 0.002892 0.066667 3.680349 10.12144
Bacteroides ovatus 0.002929 0.066667 1.300072 2.472146
Lactobacillus fermentum 0.003348 0.1 0.187065 0.884733
Clostridioides difficile 0.004256 0.066667 0.019651 0.344302
Veillonella ratti 0.007767 0.15 0.663291 3.604658
Enterococcus faecium 0.056388 0.633333 1.198365 2.516732
Veillonella dispar 0.060976 0.65 0.153714 2.407966
Escherichia coli 0.080391 0.8 0.409679 6.41716
Bifidobacterium breve 0.090213 0.666667 0.358843 6.825921
불균형군과 관련된 속(Genus) 수준 바이오마커(발달단계 2)
시료번호(species level) (균종명) coefficients robustness 균형군 비율(%) 불균형군 비율(%)
Clostridium_g35 (Family Lachnospiraceae) 0.000291 0.016667 0.110759 0.221132
Clostridium 0.000469 0.083333 1.860338 1.850075
Intestinibacter 0.000528 0.016667 0.841446 1.174962
Bifidobacterium 0.000938 0.016667 12.867602 20.307788
Sutterella 0.001188 0.016667 0.211909 0.104892
Hungatella 0.001625 0.016667 0.076689 0.191014
Prevotella 0.005983 0.083333 1.247341 1.583361
Streptococcus 0.007556 0.116667 2.765987 5.420648
Citrobacter 0.014446 0.116667 0.130479 0.376519
Klebsiella 0.024247 0.166667 0.032624 2.397416
Clostridioides 0.034329 0.2 0.01975 0.344425
Enterococcus 0.079289 0.5 1.223035 2.543823
PAC001138_g (Family Lachnospiraceae) 0.105919 0.416667 0.352784 0.194167
Haemophilus 0.157628 0.566667 0.137701 0.249095
Lactobacillus 0.193791 0.616667 0.864182 1.122363
Veillonella 0.297158 0.933333 0.895922 7.832423
Escherichia 0.616597 0.933333 0.41046 6.437183
5-5. 장내 미생물 불균형 예측 모델을 이용한 미생물의 특징적 선택(최종)
실시예 3-4에 상기한 바와 같이, 기계 학습 적용 결과를 장내 미생물 균형군 혹은 불균형군 선별 기준에 따라 보정하여, 최종 미생물 바이오마커를 선정하였다. 발달 단계 별로 불균형군에서 미생물 분류군의 군집 규모가 더 높은 비율로 나타난 Akkermansia, Bacteroides fragilis 등의 총 5개 분류군을 균형군 특이적 바이오마커에서 제외하였다. 불균형 특이적 바이오마커에서는 균형군에서 더 높은 비율로 나타난 Clostridium, Sutterella 등의 총 3개 분류군을 제외하였다.
상기 제외된 미생물 분류군를 고려하여, 균형군 특이적 바이오마커를 발달 단계 별로 하기 표 29 내지 32에 나타내었다. 균형군 특이적 바이오마커는 발달단계 1에서 Species level 12개 분류군, Genus level 6개 분류군으로 이루어져 있고, 발달단계 2에서 Species level 18개 분류군, Genus level 16개 분류군으로 이루어져 있다.
2차 특징 선택으로 보정을 마친 불균형군 특이적 바이오마커는 표 33 내지 표 36에 나타내었다. 불균형군 특이적 바이오마커는 발달단계 1에서 Species level 11개 분류군, Genus level 7개 분류군으로 이루어져 있고, 발달단계 2에서 Species level 15개 분류군, Genus level 14개 분류군으로 이루어져 있다.
상기 발달단계별 균형군 특이적 바이오마커로서, 발달단계 1의 균형군 특이적 바이오마커는 표 29 및 표 30과 도 10의 계통도에 나타내고, 발달단계 1의 불균형군 특이적 바이오마커는 표 33 및 표 34과 도 11의 계통도에 나타낸다. 또한 발달단계 2의 균형군 특이적 바이오마커는 표 31 및 표 32 도 12의 계통도에 나타내고, 발달단계 1의 불균형군 특이적 바이오마커는 표 35 및 표 36과 도 13의 계통도에 나타낸다. 하기 표 30, 표 32, 표 34 및 표 36에서 기재된 속 (Genus) 수준 바이오마커라 함은 미생물 바이오마커의 종(speies)가 구분되나, 구체적으로 동정이 종 수준까지 수행되지 않아 동정 결과를 속 수준까지 기재한 species로서, 실질적으로 species 수준에서 구별되는 미생물 바이오마커임을 의미한다.
균형군과 관련된 종 수준 바이오마커(발달단계 1)
시료번호(species level) (균종명) 16S rRNA 서열번호 16S rRNA 단편의 서열번호 균형군 비율(%) 불균형군 비율(%)
Bifidobacterium longum 1 81 51.243026 21.23793
Lactobacillus gasseri 2 82 1.055237 0.22722
Streptococcus peroris 3 83 0.814519 0.221563
Bifidobacterium bifidum 4 84 1.745036 0.563617
Enterococcus faecalis 5 85 3.588835 1.564981
Streptococcus pneumoniae 6 86 0.203145 0.075435
Bifidobacterium breve 7 87 8.686701 7.201174
Rothia mucilaginosa 8 88 0.397782 0.075418
Streptococcus salivarius 9 89 4.78868 2.924272
Anaerostipes hadrus 10 90 0.266833 0.03419
Enterococcus faecium 11 91 6.333801 4.757783
Eggerthella lenta 12 92 0.189416 0.074407
균형군과 관련된 속 수준 바이오마커(발달단계 1)
시료번호(genus level) (균종명) 16S rRNA 서열번호 16S rRNA 단편의 서열번호 균형군 비율(%) 불균형군 비율(%)
Bifidobacterium 13 93 62.580789 33.045218
Enterococcus 14 94 10.041681 6.371829
Rothia 15 95 0.407708 0.084993
Eggerthella 16 96 0.202414 0.076959
Lactobacillus 17 97 2.804877 2.013835
Anaerostipes 18 98 0.30337 0.157415
균형군과 관련된 종 수준 바이오마커(발달단계 2)
시료번호(species level) (균종명) 16S rRNA 서열번호 16S rRNA 단편의 서열번호 균형군 비율(%) 불균형군 비율(%)
Fusicatenibacter saccharivorans 19 99 2.451463 0.770204
Faecalibacterium prausnitzii 20 100 11.303225 4.18633
Blautia faecis 21 101 0.815303 0.01675
Bifidobacterium catenulatum 22 102 5.608016 2.749555
Anaerostipes hadrus 10 90 4.493286 1.038971
Gemmiger formicilis 23 103 1.934029 0.552129
Eubacterium eligens 24 104 0.841646 0.085065
Blautia wexlerae 25 105 5.646432 2.316964
Ruminococcus bromii 26 106 0.950139 0.068682
Eubacterium hallii 27 107 1.470321 0.388819
Roseburia inulinivorans 28 108 1.023162 0.008023
Bifidobacterium bifidum 4 84 0.722383 0.172211
LT907848_s (Genus Anaerobutyricum) 29 109 1.010872 0.061536
Roseburia cecicola 30 110 0.637494 0.072541
Clostridium celatum 31 111 1.47384 0.790128
PAC001046_s (Family Lachnospiraceae) 32 112 0.681424 0.000712
Lactobacillus rogosae 33 113 0.634118 0.040713
Bacteroides uniformis 34 114 2.133196 0.316344
균형군과 관련된 속 수준 바이오마커(발달단계 2)
시료번호(species level) (균종명) 16S rRNA 서열번호 16S rRNA 단편의 서열번호 균형군 비율(%) 불균형군 비율(%)
Ruminococcus_g2 (Family Ruminococcaceae) 35 115 1.860715 0.070953
Lachnospira 36 116 1.875378 0.12984
Bacteroides 37 117 17.524886 14.548922
Faecalibacterium 38 118 11.503136 4.195657
Eubacterium_g5 (Family Lachnospiraceae) 39 119 2.608563 0.480289
Fusicatenibacter 40 120 2.514382 0.791564
Roseburia 41 121 2.255163 0.32842
Subdoligranulum 42 122 2.476985 0.559366
Blautia 43 123 8.472013 3.055045
CCMM_g (Family Erysipelotrichaceae) 44 124 0.811336 0.139387
Agathobacter 45 125 0.649122 0.123431
Anaerostipes 18 98 4.771253 1.473928
Parasutterella 46 126 0.270422 0.176537
Romboutsia 47 127 0.927612 0.867899
PAC001046_g (Family Lachnospiraceae) 48 128 0.694255 0.000712
Eubacterium_g23 (Family Ruminococcaceae) 49 129 0.422063 0.00009
불균형군과 관련된 종(speceis) 수준 바이오마커(발달단계 1)
시료번호(species level) (균종명) 16S rRNA 서열번호 16S rRNA 단편의 서열번호 균형군 비율(%) 불균형군 비율(%)
FWNZ_s (Genus Klebsiella) 50 130 0.149975 1.899234
Flavonifractor plautii 51 131 0.005163 0.229055
Streptococcus gallolyticus 52 132 0.243751 1.754617
Clostridium neonatale 53 133 0.010955 1.006057
Clostridioides difficile 54 134 0.091256 0.578815
Veillonella ratti 55 135 0.561349 2.445463
Escherichia coli 56 136 4.687128 9.505538
Clostridium paraputrificum 57 137 0.042032 0.510855
Bacteroides vulgatus 58 138 0.140871 5.123635
Veillonella atypica 59 139 0.043712 1.088948
Veillonella dispar 60 140 0.529256 4.334027
불균형군과 관련된 속(Genus) 수준 바이오마커(발달단계 1)
시료번호(genus level) (균종명) 16S rRNA 서열번호 16S rRNA 단편의 서열번호 균형군 비율(%) 불균형군 비율(%)
Pseudoflavonifractor 61 141 0.009344 0.250999
Clostridioides 62 142 0.116913 0.580252
Escherichia 63 143 4.706873 9.535802
Clostridium_g24 (Family Lachnospiraceae) 64 144 0.052884 0.366841
Clostridium 65 145 0.441519 3.809211
Bacteroides 37 117 2.059269 8.545303
Veillonella 66 146 1.498936 9.707073
불균형군과 관련된 종(speceis) 수준 바이오마커(발달단계 2)
시료번호(species level) (균종명) 16S rRNA 서열번호 16S rRNA 단편의 서열번호 균형군 비율(%) 불균형군 비율(%)
Streptococcus salivarius 9 89 2.374956 4.833057
Bacteroides dorei 67 147 1.610086 2.637872
PAC001148_s (Family Lachnospiraceae) 68 148 0.278625 0.597653
FWNZ_s (Genus Klebsiella) 50 130 0.032624 2.392581
Haemophilus parainfluenzae 69 149 0.128404 0.246825
Lactobacillus paracasei 70 150 0.108647 0.150154
Bifidobacterium longum 1 81 3.680349 10.12144
Bacteroides ovatus 71 151 1.300072 2.472146
Lactobacillus fermentum 72 152 0.187065 0.884733
Clostridioides difficile 54 134 0.019651 0.344302
Veillonella ratti 55 135 0.663291 3.604658
Enterococcus faecium 11 91 1.198365 2.516732
Veillonella dispar 60 140 0.153714 2.407966
Escherichia coli 56 136 0.409679 6.41716
Bifidobacterium breve 7 87 0.358843 6.825921
불균형군과 관련된 속(Genus) 수준 바이오마커(발달단계 2)
시료번호(species level) (균종명) 16S rRNA 서열번호 16S rRNA 단편의 서열번호 균형군 비율(%) 불균형군 비율(%)
Clostridium_g35 (Family Lachnospiraceae) 73 153 0.110759 0.221132
Intestinibacter 74 154 0.841446 1.174962
Bifidobacterium 13 93 12.867602 20.307788
Hungatella 75 155 0.076689 0.191014
Prevotella 76 156 1.247341 1.583361
Streptococcus 77 157 2.765987 5.420648
Citrobacter 78 158 0.130479 0.376519
Klebsiella 79 159 0.032624 2.397416
Clostridioides 62 142 0.01975 0.344425
Enterococcus 14 94 1.223035 2.543823
Haemophilus 80 160 0.137701 0.249095
Lactobacillus 17 97 0.864182 1.122363
Veillonella 66 146 0.895922 7.832423
Escherichia 63 143 0.41046 6.437183
실시예 6: 영유아 장내 미생물 불균형 예측
6-1. 영유아 장내 미생물 불균형 예측 모델의 검증
실시예 3-5의 방법을 이용하여, 영유아 장내 미생물 불균형 여부를 학습한 기계 학습 모델이 실제로 영유아 장내 미생물 불균형 여부를 정확하게 구별하는지 살펴보았다. 예측 모델을 이용하여 Test set에 대한 장내 미생물 불균형 여부를 판정한 결과의 ROC 곡선 (receiver operating characteristic curve) 및 AUC (area under curve) 그래프를 도 8a 및 도 8b에 나타내었다. ROC 곡선이 활 모양으로 크게 굽어져 있고, AUC는 발달단계 1에서 0.88, 발달단계 2에서 0.92로 1에 가까운 값을 보이므로 상기 실시예 5-3에서 적용한 영유아 장내 미생물 불균형 예측 결과가 유의미함을 알 수 있다.
6-2: 영유아 장내 미생물 불균형의 판별 지수
실시예 3-6에서 상기한 바와 같이 정확한 임상적 해석을 부여하기 위해, 해당 바이오마커의 Coefficient와 내적곱을 하여 계산한 0과 1사이의 확률값을 학습에 사용한 장내 미생물 불균형군과 장내 균형군의 비율로 나눠 리스케일하였다. 상기 수학식 7에서,
Figure PCTKR2020007494-appb-I000045
는 영유아 장내 미생물 불균형 판별을 위한 시험 대상의 예측 점수이고, P0 는 예측 모델 구축에 사용된 training set에 존재하는 장내 미생물 불균형 샘플의 비율이며, Ncase 는 training set 내 장내 미생물 불균형 샘플의 수이고, Ntrain 는 training set의 전체 샘플 수이다. 이렇게 계산된 지수는 영유아 장내 미생물 불균형 지수로 명명하였다.
미지 시료에 대하여 장내 미생물 불균형 상태를 구분하는 지표로 상기 영유아 장내 미생물 불균형 지수를 사용할 수 있는지 검증하기 위해, 상기의 영유아 장내 미생물 불균형 지수를 통해 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy) 값을 확인해보았다.
구체적으로, 발달단계 1에서 0.3 ~ 1.67, 발달단계 2에서 0 ~ 2.68에 분포하는 민감도, 특이도, 정확도 값을 20등분하여 영유아 장내 미생물 불균형 지수의 기준(cut off)을 정하였다. 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy)는 하기 수학식 8 내지 10과 같이 계산한다. 상기 수학식 8 내지 10에서, TP는 장내 미생물 불균형 시료에서 영유아 장내 미생물 불균형 지수(
Figure PCTKR2020007494-appb-I000046
)가 cut-off보다 큰 경우의 수이고, TN은 장내 미생물 불균형 시료에서 영유아 장내 미생물 불균형 지수(
Figure PCTKR2020007494-appb-I000047
)가 cut-off보다 작은 경우의 수이고, FP는 장내 균형 시료에서 영유아 장내 미생물 불균형 지수(
Figure PCTKR2020007494-appb-I000048
)가 cut-off보다 큰 경우의 수이고, FN은 장내 균형 시료에서 영유아 장내 미생물 불균형 지수(
Figure PCTKR2020007494-appb-I000049
)가 cut-off보다 작은 경우의 수이다. 이러한 계산 결과를 도 9a 및 도 9b에 나타내었다.
발달단계 1에서 정확도가 80%로 계산된 가장 높은 지수 1.17를 기준으로 장내 미생물 불균형 상태를 판별할 경우, 영유아 장내 균형을 정확하게 맞추는 특이도는 83%, 영유아 장내 미생물 불균형을 정확하게 판단하는 민감도는 76%이다. 해당 정확도 그래프를 도 9a에 나타내었다.
발달단계 2에서 정확도가 82%로 계산된 가장 높은 지수 1.7을 기준으로 장내 미생물 불균형 상태를 구분할 경우, 영유아 장내 균형을 정확하게 맞추는 특이도는 88%, 영유아 장내 미생물 불균형을 정확하게 판단하는 민감도는 74%이다. 해당 정확도 그래프를 도 9b에 나타내었다.
발달단계 1에서 1.17, 발달단계 2에서 1.7을 기준으로 장내 미생물 불균형 여부를 판별할 때, 각 지수에서 나타나는 특이도는 각각 83% 및 88%로 장내 미생물 균형 여부를 정확하게 구별할 수 있으므로 임상학적으로 더 높은 판별능을 보이는 것을 알 수 있다.
따라서, 발달단계 1에 해당하는 검사 대상 샘플의 영유아 장내 미생물 불균형 지수가 1.17 이상인 경우, 영유아 장내 미생물 불균형으로 판별할 수 있으며, 1.17 미만으로 계산되는 경우, 영유아 장내 균형으로 판별할 수 있다. 발달단계 2에 해당하는 검사 대상 샘플의 영유아 장내 미생물 불균형 지수가 1.7 이상인 경우, 영유아 장내 미생물 불균형으로 판별할 수 있으며, 1.7 미만으로 계산되는 경우, 영유아 장내 미생물 균형으로 판별할 수 있다.
6-3. 영유아 장내 미생물 불균형의 판정
영유아의 발달단계별 장내 미생물 불균형 여부는 영유아 장내 미생물 불균형에 특이적인 바이오마커를 분석함으로써 판별할 수 있다. 영유아 장내 미생물 불균형 바이오마커는 영유아 발달 단계에 따라 변화하므로, 영유아 장내 미생물 불균형에 대한 판별시 먼저 영유아 발달 단계의 확정이 필요하다.
구체적으로, 실시예 2의 방법을 이용하여 장내 미생물을 분석하며, 실시예 4의 방법으로 영유아 발달 단계를 규정한 후, 영유아 장내 미생물 불균형 예측 모델에 적용함으로써 영유아 장내 미생물 불균형 판별 지수를 얻는다. 발달 단계 별 장내 미생물 불균형 판별 지수 기준에 따라, 최종적으로 영유아 장내 미생물의 불균형도를 판별할 수 있다.
자세하게는, 영유아의 각 발달 단계별 균형군 또는 불균형군 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 불균형 판결 지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 불균형 판결 지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 균형군로 선정하고, 설정값 이상인 경우를 불균형군으로 선정한다. 영유아 장내 미생물 불균형도을 판별하는 예시적인 기준을 하기 표 37에 나타내었다.
영유아 장내 미생물 불균형 판별 기준
발달 단계 구분 영유아 장내 미생물 불균형 예측 모델 장내 미생물 불균형 여부
발달단계 1 장내 미생물 불균형 판별 지수 1.17 미만 장내 미생물 균형
장내 미생물 불균형 판별 지수 1.17 이상 장내 미생물 불균형
발달단계 2 장내 미생물 불균형 판별 지수 1.7 미만 장내 미생물 균형
장내 미생물 불균형 판별 지수 1.7 이상 장내 미생물 불균형
상대적으로 안정된 장내 미생물 생태계가 이루어져 있는 성인의 경우, 건강군과 질병군에 대한 장내 미생물 군집 분포의 차이가 뚜렷하게 나타난다. 성인 기준으로, 장내 미생물 불균형(dysbiosis)은 항생제, 가공 식품 등의 요인으로 인해 장내 미생물 군집의 다양성이 낮아지고 균형이 망가진 상태를 의미한다. 최근, 과민성 대장 증후군(IBS), 비만, 당뇨 등 현대 질병의 요인으로 장내 미생물 불균형이 지목되고 있다.
영유아 장내 미생물 생태계의 경우, 무균 상태인 신생아의 장에 미생물이 정착을 하게 되며, 이러한 과정으로 인해 성인에 비해 종 다양성이 낮은 수치로 분석되는 등 다소 불안정해보일 수 있는 상태가 나타난다. 따라서, 영유아의 장내 미생물 불균형을 규정하기 위해서는 보편적으로 장내 미생물 불균형의 판단 기준이 되는 종 다양성을 배제하고, 동일한 발달 시기에 해당하는 모집군의 메타 데이터에 대한 특징 조사가 필요하다.
상기 언급한 바와 같이, 영유아 장내 미생물 불균형의 규정에는 장내 미생물 분석 데이터에 어떤 종류의 메타 데이터가 가장 큰 영향을 미치는지를 알아보는 것이 중요하다. 따라서 본 발명자들은 영유아 장내 미생물 불균형과 연관되어 있는 메타 데이터인 분만 형태, 수유 형태, 항생제 복용 여부 및 설사 여부 등의 항목을 문헌 조사를 통해 선정하여, 발달 단계 별로 그룹화된 장내 미생물 데이터에 어떤 항목이 가장 큰 영향을 미치는지 알아보았다. 이어서, 메타 데이터를 통해 의미가 부여된 각각의 그룹에서 강하게 연관되어 있는 미생물 종을 탐색함으로써 바이오마커를 선별하였다.
6-4. 영유아 장내 미생물 바이오마커와 관계
영유아 장내 미생물 불균형 바이오마커는 영유아 장내 미생물 불균형군과 영유아 장내 균형군에 특이적인 바이오마커의 16S rRNA sequence를 기반으로 neighbor joining 알고리즘을 이용하여 phylogenetic tree를 생성하였으며, 분류학적인 관점(order 수준)에서 subgroup을 구분하였다. 각각의 발달 단계에서 영유아 장내 미생물 불균형군과 영유아 장내 균형군에서 나타나는 바이오마커는 38개 subgroup으로 나눌 수 있다.
도 10 내지 도 13에 발달 단계 별 영유아 장내 미생물 불균형이군 및 영유아 장내 균형군의 종 및 속 수준 바이오마커의 계통수(phylogenic tree)를 표시하였다. 구체적으로, 발달단계, 균형여부 및 종/속 마커를 구분하여 하기 표에 나타낸다.
발달단계 균형여부 종/속 구분(마커) 하위그룹
발달단계 1 균형군 특이적 속수준 마커 제1그룹 내지 제4그룹
특이적 종수준 마커 제5그룹 내지 제9그룹
불균형군 특이적 속수준 마커 제10그룹 내지 제12그룹
특이적 종수준 마커 제13그룹 내지 제17그룹
발달단계 2 균형군 특이적 속수준 마커 제18그룹 내지 제21그룹
특이적 종수준 마커 제22그룹 내지 제24그룹
불균형군 특이적 속수준 마커 제25그룹 내지 제31그룹
특이적 종수준 마커 제32그룹 내지 제38그룹
(A) 발달단계 1의 장내 균형군 바이오마커
발달단계 1에서 영유아 장내 균형군의 바이오마커를 나타낸 도 10를 참고하면, 발달단계 1에서 영유아 장내 균형군과 가장 큰 연관성을 보이는 바이오마커는 Bifidobacterium이며, 같은 subgroup 내의 Rothia와 함께 Actinobacteria에 속하는 유산균이다. Subgroup 1의 Lactobacillus, Enterococcus 역시 유산균으로서, 발달단계 1에서 유산균이 수행하는 면역력 강화, 영양소 흡수 등의 긍정적인 영향이 균형 그룹에서 더 잘 나타나는 것을 알 수 있다.
더욱 자세하게는 Lactobacillus 중에서 coefficient 값을 기준으로 가장 균형군에 특이적인 Lactobacillus gasseri(Subgroup 5)는, 대부분의 Lactobacillus와 마찬가지로 담즙산에 살아남을 수 있고, 장내 상피세포에 쉽게 부착하는 유전자를 가지고 있어, 대장에 오래 정착할 수 있다. 또한 성인 대상 연구에서 면역력 강화, 장 불편 완화, 설사 및 변비 완화 등의 효과가 모두 임상연구를 통해 검증된 바 있다. coefficient 값을 기준으로 가장 균형군에 특이적인 Bifidobacterium longum(Subgroup 9)의 경우에는, 산모의 질에서 검출되는 유산균으로, 자연 분만과 연관되어 있으며, 신생아의 면역력에 도움을 준다. 또한 성인 대상 연구에서 크론병(crohn's disease, CD)이나 궤양성 대장염(ulcerative colitis, UC)과 같은 염증성 장 질환(inflammatory bowel disease, IBD)을 완화하는 사례가 많이 보고되고 있다. 이처럼, 발달단계 1에서 장내 균형 그룹에 특이적인 바이오마커는 영유아 장내 미생물 발달에 긍정적인 역할이 두드러진다.
(B) 발달단계 1의 장내 불균형군 바이오마커
발달단계 1에서 영유아 장내 불균형군의 바이오마커를 나타낸 도 11를 참고하면, 발달단계 1에서 영유아 장내 미생물 불균형군에 가장 특이적인 바이오마커는 Phylum Firmicutes에 속하는 Veillonella 속 및 Clostridium 속과 Phylum Bacteroidetes에 속하는 Bacteroides속 이다.
이러한 미생물들은 액상(수유식) 내지 겔상(이유식)의 식이 형태가 아닌 식물성 탄수화물(단순당 및 섬유질) 및 단백질로 이루어지는 고형(유아식 및 일반식) 식이의 대사와 관련이 있으며, 짧은 사슬 지방산을 생성하는 특징이 있다. 성인의 경우, 섬유질에 대한 대사 능력과 짧은 사슬 지방산을 생성하는 기능을 가지는 미생물은 장내 미생물 생태계의 종 다양성을 높이는 유익한 역할을 한다. 하지만, 영유아의 경우, 발달단계 1에서 이러한 미생물이 검출되는 양상이 설사, 제왕 절개 등의 장내 미생물 불균형 인자와 연관되어 있는 것으로 분석되었다. 액상(수유식) 내지 겔상(이유식)의 식이 형태가 주로 이루어지는 영유아 발달단계 1에서 고형(유아식 및 일반식)으로 바뀌는 시기에 나타나는 미생물이 검출되는 것은 장내 미생물 생태계가 예상보다 일찍 발달한 것으로 해석할 수 있으며, 장내 미생물 불균형 인자와 관련된 것으로 미루어 장내 미생물 생태계가 이상적으로 발달하지 않고 있는 상태임을 알 수 있다.
(C) 발달단계 2의 장내 균형군 바이오마커
발달단계 2에서 영유아 장내 균형군의 바이오마커를 나타낸 도 12를 참고하면, 가장 큰 연관성을 보이는 바이오마커는 대다수가 짧은 사슬 지방산 생성균인 경우이다. 속 수준의 16개 바이오마커 중에서 subgroup 18에 해당하는 13개 바이오마커(Subdoligranulum, Faecalibacterium, Eubacterium_g23, Ruminococcus_g2, Romboutsia, Fusicatenibacter, Anaerostipes, Agathobacter, Lachnospira, Roseburia, Eubacterium_g5, Blautia, PAC001046_g)가 phylum Firmicutes에 속하며, Firmicutes에서 대표적인 짧은 사슬 지방산 생성균이 포함되는 order Clostridiales의 하위 미생물 종이다.
짧은 사슬 지방산은 식이섬유를 분해하는 과정에서 생성되는 대사 산물로, 에너지 생산 촉진, 비타민 생성 촉진, 장내 세포 결속 강화 등 인체에 유익한 영향을 주는 물질로 알려져 있다. 액상(수유식) 내지 겔상(이유식)의 식이 형태가 고형(유아식 및 일반식) 식이 형태로 전환됨에 따라, 장내 미생물 생태계가 적합하게 발달하고 있는 모습으로 판단할 수 있다. 특히, 상대적으로 높은 coefficient 및 robustness 값이 나타나는 Faecalibacterium prausnitzii는 대표적인 짧은 사슬 지방산 생성균으로, 성인에게서 항염증 효과가 나타난 사례가 보고된 바 있다. Eubacterium eligens, Anaerostipes hadrus, Blautia wexlerae 역시 짧은 사슬 지방산 생선균이며, 면역을 조절하고 염증을 완화하는 butyric acid를 대표적으로 생성한다. Eubacterium eligens는 과일, 채소 등에 많이 존재하는 수용성 식이섬유 팩틴(pectin)을 분해하여 소화를 돕는다. Anaerostipes hadrus는 과민성 대장 증후군의 완화와 관련되어 있는 것으로 알려졌으며, Blautia wexlerae는 비만인 사람의 장에는 건강한 사람에 비해 낮은 비율로 존재하는 것으로 알려졌다.
(D) 발달단계 2의 장내 불균형군 바이오마커
발달단계 2에서 영유아 장내 불균형군의 바이오마커를 나타낸 도 13를 참고하면, 가장 특이적인 바이오마커는 Enterococcus, Lactobacillus, Streptococcus (subgroup 25), Bifidobacterium (subgroup 30) 등의 유산균이다. 또한, Phylum Proteobacteria의 대장균 계열 Haemophilus (Subgroup 28), Escherichia, Klebsiella, Citrobacter (Subgroup 29) 역시 발달단계 2와 연관된 바이오마커로 선별되었다. 대장균류의 미생물들은 초기 장내 환경의 안정화를 돕는 미생물이지만, 균형이 망가진 장내 환경에서는 유해한 영향을 미친다. Haemophilus는 장내에서 염증을 유발할 수 있으며, 특히, Clostridioides difficile는 디피실레 감염증의 원인균이다.
짧은 사슬 지방산을 생성하는 order Clostridiales(Subgroup 27)의 4개 genus(Clostridium_g35, Hungatella, Clostridioides, Intestinibacter)가 영유아 장내 미생물 불균형에 특이적인 바이오마커로 포함되어 있다. 그러나, 해당 바이오마커의 robustness 값이 장내 균형군 특이적 바이오마커의 order Clostridiales의 미생물 종들에 비해 낮은 수치를 보이므로, 해당 바이오마커가 유의미하게 계산된 경우가 상대적으로 적다는 것을 알 수 있다.
발달단계 2에서 phylum Bacteroidetes의 Prevotella 및 Bacteroides를 살펴볼 때, Bacteroides는 균형군 특이적 바이오마커에, Prevotella는 불균형 특이적 바이오마커에 포함되어 있으므로, 영유아 시기에 더 이상적인 장내 미생물 생태계 유형은 Bacteroides 형으로 판단된다.
따라서, 발달단계 2에서 영유아 장내 미생물 불균형군에 특이적인 바이오마커가 검출되는 것은 초기의 장내 미생물 생태계가 아직 유지되고 있어 예상보다 늦게 발달하고 있는 상태로 해석할 수 있다. 해당 결과가 장내 미생물 불균형 인자와 관련되어 있으므로, 장내 미생물 생태계가 이상적으로 발달하지 않는 상태이다.

Claims (21)

  1. 하기 단계를 포함하는 영유이 장내 미생물 발달단계 및 장내 미생물의 불균형 정도를 탐지하는 방법:
    (A) 시험대상 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 얻는 단계,
    (B) 시험대상 영유아의 메타데이타 정보를 얻는 단계,
    (C) 상기 단계(A)의 장내 미생물 군집 정도 및 단계(B)의 메타데이타 정보로 이루어지는 군에서 선택된 1이상의 정보에 근거하여, 기준 영유아의 발달 단계 구분기준에 따라 장내 미생물 군집의 발달 단계를 결정하는 단계, 및
    (D) 상기 결정된 발달 단계에 따라, 발달 단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 장내 미생물 군집의 불균형 정도를 결정하는 단계.
  2. 제1항에 있어서, 상기 (A)의 장내 미생물 군집 정보를 얻는 단계는,
    (A-1) 시험 대상의 대변 시료로부터 장내 미생물의 유전체 DNA를 얻는 단계;
    (A-2) 상기 장내 미생물 유전체 DNA로부터 16S rRNA 유전 정보를 얻는 단계; 및
    (A-3) 상기 장내 미생물의 16S rRNA 정보를 분석하여 시험대상 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 분석하는 단계를 포함하는 것인 방법.
  3. 제1항에 있어서, 상기 기준 영유아의 발달 단계 구분기준은,
    (A')기준 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 얻는 단계,
    (B')기준 영유아의 메타데이타 정보를 얻는 단계, 및
    (C')상기 단계(A')의 장내 미생물 군집 정도 및 단계(B')의 메타데이타 정보로 이루어지는 군에서 선택된 1이상의 정보에 근거하여, 기준 영유아의 발달 단계 구분기준을 결정하는 단계를 포함하는, 방법.
  4. 제1항에 있어서, 상기 영유아의 메타데이타 정보는 성별, 월령, 키, 체중, 영유아의 식이 형태, 수유 방법, 유산균 포함 식이 진행 여부, 대변의 형태, 대변의 색, 항생제 복용 정보, 질병 진단 정보, 모체의 해당 영유아 임신기간 중 식이 형태, 영유아의 출산 후 모체의 식이 형태 및 모체의 항생제 복용 정보로 이루어지는 군에서 선택되는 하나 이상의 정보인 방법.
  5. 제1항에 있어서, 상기 단계(C)에서 발달 단계를 결정하는 단계는, 시험대상 영유아의 식이단계, 월령 및 발달단계 특이적 미생물 바이오마커로 이루어지는 군에서 선택된 1종 이상을 이용하여 수행되는 것인 방법.
  6. 제3항에 있어서, 상기 단계(C')에서 기준 영유아의 발달 단계 구분기준을 결정하는 단계는, 기준 영유아의 식이단계, 월령 및 발달단계 특이적 미생물 바이오마커로 이루어지는 군에서 선택된 1종 이상을 이용하여 수행되는 것인 방법.
  7. 제5항 또는 제6항에 있어서, 상기 발달단계 특이적 미생물 바이오마커를 이용하여 발달단계 1 및 발달단계 2로 구분하는 경우, 상기 발달단계 1에 특이적인 바이오마커는 상기 표 10 및 표 11에 기재된 균종으로 이루어지는 군에서 선택된 1종 이상이고, 상기 발달단계 2에 특이적인 바이오마커는 상기 표 12 및 표 13에 기재된 균종으로 이루어지는 군에서 선택된 1종 이상인 방법.
  8. 제3항에 있어서, 상기 단계(C')에서 기준 영유아의 발달 단계 구분기준을 결정하는 단계는, 영유아의 발달 단계 1 내지 2의 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 영유아 발달 지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 영유아 발달 지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 발달 단계 1로 선정하고, 설정값 이상인 경우를 발달 단계 2로 선정하는 것인 방법.
  9. 제8항에 있어서, 상기 단계(C)에서 발달 단계를 결정하는 단계에서, 시험대상 영유아의 발달 단계에 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 점유율을 분석하여 영유아 발달 지수를 산정하고,
    상기 시험대상 영유아의 산정된 영유아 발달 지수가, 상기 기준 영유아의 발달 단계 구분기준인 cut-off 값을 기준에 따라 설정값 미만인 경우를 발달 단계 1로 선정하고, 설정값 이상인 경우를 발달 단계 2로 선정하는 것인 방법.
  10. 제8항 또는 제9항에 있어서, 상기 영유아 발달 지수는, 하기 수학식 4 내지 7의 수학식를 이용하여 산출하여 수행되는 것인 방법:
    [수학식 4]
    Figure PCTKR2020007494-appb-I000050
    [수학식 5]
    Figure PCTKR2020007494-appb-I000051
    [수학식 6]
    Figure PCTKR2020007494-appb-I000052
    [수학식 7]
    Figure PCTKR2020007494-appb-I000053
  11. 제5항 또는 제6항에 있어서, 상기 발달단계는 식이단계가 액상 식이, 겔상 식이 및 고형 식이로 구분하는 것인 방법.
  12. 제5항에 있어서, 상기 단계(C)에서 발달 단계를 선정하는 단계에서, 기준 영유아의 발달 단계 구분기준은 고형 식이, 생후 15개월 도과 여부 또는 영유아 발달지수 1.19 충족 여부인 것인 방법.
  13. 제1항에 있어서, 상기 단계 (D)에서 발달 단계별 균형군 특이적 바이오마커는 상기 표 29 내지 표 32에 기재된 균종으로 이루어지는 군에서 선택된 1종 이상이고, 발달단계별 불균형군 특이적 바이오마커는 상기 표 33 내지 표 36에 기재된 균종으로 이루어지는 군에서 선택된 1종 이상인 방법.
  14. 제3항에 있어서, 상기 단계(c') 기준 영유아의 발달 단계 구분기준을 결정하는 단계이후에, 기준 영유아의 상기 단계 (D')에서 발달 단계별 불균형군의 결정 기준을 선정하는 단계를 추가로 포함하며,
    상기 단계 (D')에서 발달 단계별 불균형군의 결정 기준은, 기준 영유아의 각 발달 단계별 균형군 또는 불균형군 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 불균형 결정 지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 불균형 판결 지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 균형군로 선정하고, 설정값 이상인 경우를 불균형군으로 선정하는 것인 방법.
  15. 제14항에 있어서, 상기 (D) 장내 미생물 군집의 불균형군 또는 균형군 여부를 결정하는 단계에서, 시험대상 영유아의 각 발달 단계별 균형군 또는 불균형군 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 불균형 결정 지수를 산정하고,
    상기 시험대상 영유아의 산정된 불균형 결정 지수가, 상기 기준 영유아의 불균형 결정 지수의 구분기준인 cut-off 값 기준에 따라 설정값 미만인 경우를 균형군으로 선정하고, 설정값 이상인 경우를 불균형군로 선정하는 것인 방법.
  16. 제14항 또는 제15항에 있어서, 상기 불균형 결정 지수는, 하기 수학식 4 내지 7의 수학식를 이용하여 산출하여 수행되는 것인 방법:
    [수학식 4]
    Figure PCTKR2020007494-appb-I000054
    [수학식 5]
    Figure PCTKR2020007494-appb-I000055
    [수학식 6]
    Figure PCTKR2020007494-appb-I000056
    [수학식 7]
    Figure PCTKR2020007494-appb-I000057
  17. 제1항에 있어서, 상기 단계(D)이후에, 시간에 따른 시험 대상의 영유아 장내 미생물 불균형 지수 변화를 모니터링하는 단계를 더 포함하는, 방법.
  18. 제1항에 있어서, 상기 얻어진 시험 대상의 장내 미생물 발달단계 및 장내 미생물의 불균형 정도를 이용하여, 프리바이오틱스(prebiotics), 프로바이오틱스(probiotics), 약물, 식이 및 생활습관으로 이루어지는 군에서 선택된 1종 이상의 처치를 수행하여 장내 미생물의 균형을 달성하기 위한 단계를 추가로 포함하는 방법.
  19. 제18항에 있어서, 상기 프로바이오틱스(probiotics)는 시험 대상의 발달단계를 발달단계 1 및 발달단계 2로 구분하는 경우, 시험 대상이 발달단계 1로 분석된 경우 표 29 및 표 30에 나타낸 발달단계 1의 균형군 특이적 바이오마커 미생물 중 1종 이상을 포함하며, 또는 시험 대상이 발달단계 2로 분석된 경우 표 31 및 표 32에 나타낸 발달단계 2의 균형군 특이적 바이오마커 미생물을 1종 이상 포함하는 것인 방법.
  20. 제18항에 있어서, 상기 프리바이오틱스(prebiotics)는 시험 대상의 발달단계를 발달단계 1 및 발달단계 2로 구분하는 경우, 시험 대상이 발달단계 1로 분석된 경우, 표 29 및 표 30에 나타낸 발달단계 1의 균형군 특이적 바이오마커 미생물 중 1종 이상의 상대적 풍부도를 증가 또는 표 33 및 표 34에 나타낸 발달단계 1의 불균형군 특이적 바이오마커 미생물 중 1종 이상의 감소를 달성하는 물질을 포함하거나, 또는
    시험 대상이 발달단계 2로 분석된 경우, 상기 프리바이오틱스는 표 31 및 표 32에 나타낸 발달단계 2의 균형군 특이적 바이오마커 미생물을 1종 이상의 상대적 풍부도를 증가 및/또는 표 35 및 표 36에 나타낸 발달단계 2의 불균형군 특이적 바이오마커 미생물을 1종 이상의 상대적 풍부도(상대적 점유 비율)를 감소하는 물질을 포함하는 방법.
  21. 제1항에 있어서, 상기 단계(D)에서 발달단계 1의 균형 그룹은 자연분만 및 모유수유에 영향을 받은 균형군 바이오마커가 검출된 그룹이며, 불균형 그룹은 설사 및 항생제 투여 경험에 영향을 받은 불균형군 바이오마커가 검출된 그룹이고, 발달단계 2의 균형 그룹은 자연분만과 관련있는 균형군 바이오마커가 검출된 그룹, 불균형 그룹은 설사 및 항생제 투여 경험과 관련있는 불균형군 바이오마커가 검출된 그룹인 방법.
PCT/KR2020/007494 2019-06-11 2020-06-10 영유아의 장내 미생물 불균형도를 탐지하는 방법 WO2020251249A1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
US17/617,667 US20220293275A1 (en) 2019-06-11 2020-06-10 Method for detecting gut dysbiosis of infant

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2019-0068576 2019-06-11
KR20190068576 2019-06-11

Publications (1)

Publication Number Publication Date
WO2020251249A1 true WO2020251249A1 (ko) 2020-12-17

Family

ID=73780914

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/007494 WO2020251249A1 (ko) 2019-06-11 2020-06-10 영유아의 장내 미생물 불균형도를 탐지하는 방법

Country Status (3)

Country Link
US (1) US20220293275A1 (ko)
KR (1) KR102621775B1 (ko)
WO (1) WO2020251249A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2621983A (en) * 2022-08-24 2024-03-06 Univ Surrey Training object detection neural networks

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102578552B1 (ko) * 2021-07-14 2023-09-15 주식회사 아이도트 질환 자동 진단을 위한 학습 데이터 생성 방법 및 그를 이용한 질환 자동 진단 시스템
KR102529575B1 (ko) * 2022-10-06 2023-05-08 주식회사 엔젠바이오 마이크로바이옴을 이용하여 유아 성장 관련 맞춤형 솔루션을 제공하는 방법 및 분석장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008116892A1 (en) * 2007-03-28 2008-10-02 Nestec S.A. Probiotics to improve gut microbiota
KR20140037544A (ko) * 2012-09-19 2014-03-27 주식회사 쎌바이오텍 과민성 대장 증후군 예방 또는 치료용 조성물
KR101445243B1 (ko) * 2014-03-28 2014-09-29 서울대학교산학협력단 장내 세균의 군집과 기능의 변화를 이용한 대사성 및 염증성 질환의 조기진단
KR20170072879A (ko) * 2014-10-29 2017-06-27 네스텍 소시에테아노님 생애 초기에 미생물총 불균형을 회복하기 위한 l. 루테리의 용도

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100659695B1 (ko) * 2004-06-25 2006-12-20 전미숙 유아의 성장발달단계를 체크하는 서비스를 제공하는시스템 및 방법
US9848760B2 (en) * 2009-06-29 2017-12-26 Gearbox, Llc Devices for continual monitoring and introduction of gastrointestinal microbes
AU2010308329B2 (en) * 2009-10-19 2016-10-13 Labrador Diagnostics Llc Integrated health data capture and analysis system
GB201505364D0 (en) 2015-03-27 2015-05-13 Genetic Analysis As Method for determining gastrointestinal tract dysbiosis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008116892A1 (en) * 2007-03-28 2008-10-02 Nestec S.A. Probiotics to improve gut microbiota
KR20140037544A (ko) * 2012-09-19 2014-03-27 주식회사 쎌바이오텍 과민성 대장 증후군 예방 또는 치료용 조성물
KR101445243B1 (ko) * 2014-03-28 2014-09-29 서울대학교산학협력단 장내 세균의 군집과 기능의 변화를 이용한 대사성 및 염증성 질환의 조기진단
KR20170072879A (ko) * 2014-10-29 2017-06-27 네스텍 소시에테아노님 생애 초기에 미생물총 불균형을 회복하기 위한 l. 루테리의 용도

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
STEWART, CHRISTOPHER J. ET AL.: "Temporal development of the gut microbiome in early childhood from the TEDDY study", NATURE, vol. 562, 24 October 2018 (2018-10-24), pages 583 - 588, XP036900247, DOI: 10.1038/s41586-018-0617-x *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2621983A (en) * 2022-08-24 2024-03-06 Univ Surrey Training object detection neural networks

Also Published As

Publication number Publication date
US20220293275A1 (en) 2022-09-15
KR20200141949A (ko) 2020-12-21
KR102621775B1 (ko) 2024-01-08

Similar Documents

Publication Publication Date Title
WO2020251249A1 (ko) 영유아의 장내 미생물 불균형도를 탐지하는 방법
WO2021182829A1 (ko) 장관 면역조절 기능과 염증성 장 질환의 예방 또는 치료 활성을 갖는 락토바실러스 람노서스 균주
WO2018143678A1 (ko) 신규 유산균 및 이의 용도
Madoroba et al. Diversity and dynamics of bacterial populations during spontaneous sorghum fermentations used to produce ting, a South African food
Coda et al. Sourdough-type propagation of faba bean flour: Dynamics of microbial consortia and biochemical implications
McOrist et al. A comparison of five methods for extraction of bacterial DNA from human faecal samples
Morandi et al. Enterococcus lactis sp. nov., from Italian raw milk cheeses
Janczyk et al. Microbial community composition of the crop and ceca contents of laying hens fed diets supplemented with Chlorella vulgaris
Yu et al. Molecular identification and quantification of lactic acid bacteria in traditional fermented dairy foods of Russia
WO2016053003A1 (ko) 비배당체가 세포내에 축적되어 있는 미생물 제제의 제조방법 및 이에 의해 제조된 미생물 제제
WO2019066599A2 (ko) 신규 유산균 및 이의 용도
WO2016190511A1 (ko) 한국 전통 누룩으로부터 분리한 제빵용 신규의 토종 천연 효모 및 토종 천연 유산균
WO2021221398A1 (ko) 우수한 면역기능 증진 효과를 갖는 신규한 유산균 및 이를 포함하는 식품조성물, 건강기능성 식품 조성물 및 프로바이오틱스
WO2011158998A1 (ko) 비타민 k2 생성능이 높은 바실러스 아미로리퀴파시엔스 균주
WO2017047968A1 (ko) 다양한 기능성을 가진 신규 유산균 및 이의 용도
Ohashi et al. Analysis of Clostridium cluster XI bacteria in human feces
Nikolaitchouk et al. Characterization of Actinomyces isolates from samples from the human urogenital tract: description of Actinomyces urogenitalis sp. nov.
Lombardi et al. Characterization of Streptococcus macedonicus strains isolated from artisanal Italian raw milk cheeses
WO2018004224A2 (ko) 신규 스포리치아과 미생물 및 그의 용도
Perri et al. Sprouting process affects the lactic acid bacteria and yeasts of cereal, pseudocereal and legume flours
Soto et al. Molecular microbial analysis of Lactobacillus strains isolated from the gut of calves for potential probiotic use
Caro et al. Characterization of Lactococcus strains isolated from artisanal Oaxaca cheese
Ma et al. Protease-producing lactic acid bacteria with antibacterial properties and their potential use in soybean meal fermentation
Vela et al. Streptococcus entericus sp. nov., isolated from cattle intestine.
WO2024071624A1 (ko) 키위 발효물을 포함하는 알코올성 간손상 예방 또는 개선용 조성물

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20822143

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20822143

Country of ref document: EP

Kind code of ref document: A1

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205A DATED 03.05.2022)

122 Ep: pct application non-entry in european phase

Ref document number: 20822143

Country of ref document: EP

Kind code of ref document: A1