이에, 본 발명은 비배양 분석 방법으로 분석한 영유아 장내 미생물 군집 데이터베이스를 구축하였으며, 장내 미생물 불균형의 지표가 되는 여러 가지 메타 데이터를 함께 고려하여 유의미한 패턴을 탐색하는 연구를 진행하였다. 또한, 대량 데이터 분석에 효과적인 기계학습을 통해 장내 미생물 관점에서 영유아 발달 단계, 영유아 장내 미생물 불균형 상태, 및 영유아 장내 미생물 불균형 지표종을 규정하였다.
본 발명의 일 예는, 영유아의 장내 미생물 군집 분석을 이용하여 영유아 장내 미생물 불균형 정도를 탐지 또는 분석하는 방법을 제공하는 것이다. 상기 영유아의 장내 미생물 군집 분석에 영유아 장내 미생물 불균형 정도를 탐지하는 미생물 바이오마커를 이용할 수 있다.
본 발명의 일 예는, 영유아의 장내 미생물 군집 분석을 이용하여 영유아 장내 미생물 불균형 정도를 탐지 또는 분석하는 방법을 제공하는 것이다. 상기 영유아의 장내 미생물 군집 분석에 영유아 장내 미생물 불균형 정도를 탐지하는 미생물 바이오마커를 이용할 수 있다.
본 발명의 추가 예는 상기 영유아 장내 미생물 불균형 정도를 탐지하는 미생물 바이오마커 또는 상기 바이오마커를 검출하는 제제를 포함하는, 영유아 장내 미생물 불균형 정도 및/또는 장 발달단계의 탐지용 조성물 또는 키트를 제공하는 것이다.
본 발명의 추가 예는 상기 영유아 장내 미생물 불균형 정도를 탐지하는 미생물 바이오마커 또는 상기 바이오마커를 검출하는 제제를 포함하는, 장내 미생물을 이용한 영유아의 장 성숙도의 탐지용 조성물 또는 키트를 제공하는 것이다.
본 발명의 추가 일 예는 상기 얻어진 영유아의 장내 미생물 불균형도를 개선하는 방법 또는 영유아의 장내 미생물 성숙도를 높이는 방법에 관한 것이다. 상기 바이오마커를 검출하는 제제를 포함하는 영유아 장내 미생물 불균형의 판별용 또는 위험도 예측용 키트를 제공하는 것이다.
본 발명은 배양 비의존적 방법(CIMs)으로 속(Genus) 또는 종(Species) 수준의 정확도를 가지는, 영유아의 장내 미생물 불균형 판별용 또는 위험도 예측용 바이오마커를 제공하는 것이다. 또한, 본 발명은 영유아 장내 미생물 군집 분석을 활용하여 영유아 장내 미생물 불균형의 판별 또는 위험도 예측하는 방법에 관한 것이며, 이에 따라 장내 미생물 불균형 해소를 위한 추가 처치단계를 포함하여 영유아 성장 상태를 개선할 수 있는 방법에 관한 것이다. 구체적으로, 영유아의 장내 미생물 군집을 분석하여 영유아의 장내 미생물 불균형 및 성장 상태를 진단할 수 있는 정보를 제공할 수 있다.
영유아 시기는 장내 미생물 환경이 만들어지는 시기이며, 미생물 군집이 지속적으로 변화하며, 장내 미생물의 환경의 균형을 점착 찾아가게 된다. 따라서, 성인과 달리 영유아의 장내 미생물 군집의 균형 또는 불균형 여부의 결정은 다양한 인자를 고려하여 설정해야 한다. 따라서, 본 발명은 영유아의 장내 미생물의 균형여부 또는 발달 상태를 탐지하기 위해, 장내 미생물 군집을 활용한 영유아의 장내 미생물 불균형도 또는 발달 상태를 탐지하고자 하며, 더욱 바람직하게는 영유아의 메타데이타 정보, 예를 들면, 월령, 식이, 분만방법. 항생제 투여 이력 등의 정보를 조합하여 탐지할 수 있다.
본 명세서에서 영유아 장내 미생물의 불균형군 또는 장내 미생물의 불균형 이라 함은 장내 미생물의 불균형에 양의 상관성을 갖는 또는 장내 미생물의 불균형에 기여하거나 초래하는 메타 데이터와 연관되어 있는 장내 미생물 군집을 보유한 샘플군을 의미하고, 균형군이라 함은, 장내 미생물의 균형에 양의 상관성을 갖는 또는 장내 미생물의 균형에 기여하거나 초래하는 메타 데이터와 연관되어 있는 장내 미생물 군집을 보유한 샘플군을 의미한다.
예를 들면, 장내 미생물 불균형과 관련된 메타 데이터는 장내 미생물 불균형을 일으키는 것으로 알려진 설사, 제왕절개, 항생제 복용, 분유 수유이다. 동일한 발달 단계 내에서, 장내 미생물 불균형 관련 그룹과 구별되는 샘플군은 모유 수유, 자연 분만과 관련되어 있으므로 장내 미생물의 균형과 관련된 그룹으로 규정할 수 있다. 장내 미생물의 불균형 및 장내 미생물의 균형과 강한 연관을 보이는 메타 데이터 인자를 정리하면, 영유아의 발달단계를 1 및 2그룹으로 구분하는 경우, 발달단계 1의 균형 그룹은 자연분만 및 모유수유이며, 불균형 그룹은 설사 및 항생제 투여 경험이고, 발달단계 2의 균형 그룹은 자연분만이며, 불균형 그룹은 설사 및 항생제 투여 경험이다.
상기 영유아 발달 단계는 식이단계, 월령 및 영유아 발달 지수 (장내 미생물 군집의 정보에 기초)로 이루어지는 군에서 선택된 1종 이상의 기준으로 판별할 수 있으며, 상기 영유아 발달 지수는 발달단계 특이적 바이오마커를 이용하여 구분할 수 있으며, 각 발달 단계에 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 발달지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 발달지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 발달단계 1로 선정하고, 설정값 이상인 경우를 발달단계 2로 선정한다. 본 발명의 일 예에 따라 영유아의 발달 단계에 특이적인 미생물 바이오마커의 일예는 영유아의 발달단계 1에 특이적인 바이오마커는 하기 표 10 및 표 11에 기재되어 있고, 발달단계 2에 특이적인 바이오마커는 하기 표 12 및 표 13에 기재되어 있다.
상기 영유아의 "장내 미생물의 불균형도"라 함은 영유아의 성장 속도에 맞는 장내 미생물 군집 환경 (장내 미생물의 균형)에 근접 여부 또는 장내 미생물 군집의 발달 상태를 의미한다. 이에, 본 발명에 따른 영유아의 장내 미생물 군집의 불균형도를 검출하여 영유아의 장내 미생물 군집의 발달 상태를 파악하고, 아이의 성장속도에 맞추어 적정 속도로 장내 미생물 군집의 균형도를 달성하고자 한다.
본 발명의 구체적 일 예에서, 본 발명에 따른 영유아의 장내 미생물 군집 불균형군과 균형군의 구별은 발달단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 수행할 수 있다.
구체적으로, 발달단계 1의 균형군 특이적 바이오마커는 표 29 및 표 30과 도 10의 계통도에 나타내고, 발달단계 1의 불균형군 특이적 바이오마커는 표 33 및 표 34과 도 11의 계통도에 나타낸다. 또한 발달단계 2의 균형군 특이적 바이오마커는 표 31, 표 32 및 도 12의 계통도에 나타내고, 발달단계 2의 불균형군 특이적 바이오마커는 표 35 및 표 36과 도 13의 계통도에 나타낸다.
본 발명에 따른 탐지 방법에 의해 분석한 영유아의 장내 미생물 불균형도 탐지결과로서, 미생물 생태나이, 미생물의 다양성, 유익한 미생물, 또래 영유아의 장내 미생물 우점종에 대한 정보를 제공할 수 있다. 미생물 생태나이(microbiota age)는 아이의 성장 속도에 따른 장내 미생물 군집이 성숙 정도를 나타내며, 예를 들면 영유아의 월령 별 장내 미생물 군집의 균형도 또는 불균형도로 표시할 수 있다. 미생물 다양성(commensal diversity)은 장내 미생물 종류의 다양성을 나타내며, 장내 존재하는 미생물의 종류의 다양성으로 표시될 수 있다. 유익한 미생물은 영유아의 성장에 긍정적 영향을 미치는 미생물의 분포를 의미한다. 장내 미생물 군집에서 유익한 미생물의 발달이 부족하면 질환 발생 위험이 높아진다. 유산균은 초기 장내 미생물 군집에서 소화를 도와 영양분 흡수에 기여하고 면역력을 강화하는 역할을 하고 있으며, 장내 미생물 군집이 안정을 찾으면 사라져 그 비율이 감소한다.
이하, 본 발명에 따른 영유아 장 발달단계 및/또는 장내 미생물 불균형도 탐지방법에 대해 구성 단계 별로 상세히 설명하고자 하다.
본 발명의 일 예에서, 영유아 장내 미생물 불균형도 탐지방법은 하기 단계를 포함할 수 있다:
(A) 시험대상 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 얻는 단계,
(B) 시험대상 영유아의 메타데이타 정보를 얻는 단계,
(C) 상기 단계(A)의 장내 미생물 군집 정도 및 단계(B)의 메타데이타 정보로 이루어지는 군에서 선택된 1이상의 정보에 근거하여, 기준 영유아의 발달 단계 구분기준에 따라 장내 미생물 군집의 발달 단계를 선정하는 단계, 및
(D) 상기 선정된 발달 단계에 따라, 발달 단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 장내 미생물 군집의 불균형군 또는 균형군 여부를 결정하는 단계.
더욱 자세하게는, 본 발명의 일 예에서 영유아 장내 미생물 불균형도 탐지방법의 (A) 시험대상 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 얻는 단계는, 다양한 방법으로 시험 대상의 미생물 군집 정보를 얻을 수 있으며, 예를 들면
(A-1) 시험 대상의 시료, 예컨대 대변 시료로부터 장내 미생물의 유전체 DNA를 얻는 단계;
(A-2) 상기 장내 미생물 유전체 DNA로부터 16S rRNA 유전 정보를 얻는 단계; 및
(A-3) 상기 장내 미생물의 16S rRNA 정보를 분석하여 시험대상 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 분석하는 단계를 포함할 수 있다.
(A-1) 실험 대상 영유아의 대변 시료로부터 장내 미생물의 유전체 DNA를 얻는 단계
상기 시험 대상은 영유아일 수 있으며, 본 발명에서 "영유아"란, 생후 36개월 이하의 신생아 또는 유아를 의미한다.
본 발명의 일 실시예에서, 국제건강기구(WHO)에서 규정한 대로 생후 4주 초과 내지 만 3세(36개월)의 영유아를 선별하여, 각 영유아의 법정대리을 통해 채집된 시험 대상 영유아의 분변 총 120개 샘플을 수집하였다. 상기 시험 대상의 대변 샘플은 미생물의 변이를 막는 완충액에 담겨 수집되었다. 상기 완충액은 4%(w/v) SDS(Sodium Dodecyl Sulfate), 50mM Tris-HCl, 50mM EDTA 및 500mM NaCl로 구성되었다.
상기 수집된 대변 시료로부터 DNA를 얻는 단계는 배양 비의존적 방법(CIMs)으로 이루어질 수 있다. 상기 배양 비의존적 방법을 이용함으로써, 미생물 배양 과정에서 발생하는 데이터 왜곡을 방지할 수 있으며, 실제 장내 미생물 생태계와 유사한 미생물 군집 규모 정보를 얻을 수 있는 장점이 있다.
(A-2) 상기 장내 미생물 DNA로부터 장내 미생물의 16S rRNA 유전 정보를 얻는 단계
상기 16S rRNA 유전 정보를 얻는 단계는, 차세대 유전체 염기서열분석(NGS) 플랫폼을 이용하여, 상기 추출된 DNA의 16S rRNA 유전자 서열을 분석하는 단계일 수 있다.
상기 추출된 DNA의 16S rRNA 유전자 서열을 분석하는 단계는, 16S rRNA의 가변 영역(variable region)을 특이적으로 증폭할 수 있는 프라이머 세트를 이용하여 PCR을 수행하는 단계, 바람직하게는 16S rRNA의 V3 내지 V4 영역을 특이적으로 증폭할 수 있는 프라이머 세트를 이용하여 PCR을 수행하는 단계, 더욱 바람직하게는 하기 서열을 갖는 universal primer를 이용하여 PCR을 수행하여 앰플리콘을 생성하는 단계를 포함할 수 있으며, universal primer의 예시적인 서열은 하기와 같다:
정방향 universal primer (서열번호 161): 5'-CCTACGGGNGGCWGCAG -3'
역방향 universal primer (서열번호 162): 5'-GACTACHVGGGTATCTAATCC -3'
(A-3) 상기 장내 미생물의 16S rRNA 정보를 분석하여 시험대상 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 분석하는 단계
군집 정보를 분석하는 단계는, 상기 차세대 유전체 염기서열분석 (NGS)기법으로 하나의 샘플에서 생성된 수천 개의 유전자 서열을 표준 균주 및 비배양 미생물의 16S 리보솜 RNA 유전자 서열 데이터베이스 (EzTaxon) 및 이지바이오클라우드 분석시스템 (http://www.ezbiocloud.com)으로 미생물 커뮤니티(bacterial community) 정보를 문(phylum)에서 종(species) 수준까지 분석하는 단계일 수 있다. 차세대 유전체 염기서열분석기법의 결과물이 같다면, 군집 정보 분석을 위한 방법은 Eztaxon 및 이지바이오클라우드 분석 시스템에 국한되지 않는다.
상기 미생물 마커는, 상기 기계 학습을 수행하기 위한 부트스트랩 반복 결과, 전체 반복 수 중 각 미생물이 특정 발달 단계 특이적인 미생물로 판정된 횟수의 비율을 근거로 선별되는 것일 수 있다. 바람직하게는, 상기 미생물 마커의 선별 단계 이후, 선별된 미생물 마커의 해당 발달 단계에서의 군집 규모가 다른 발달 단계에서의 군집 규모에 비해 낮은 경우, 해당 미생물 마커를 제외하는 검증 단계를 추가로 포함할 수 있다. 바람직하게는, 상기 미생물 마커는 서열번호 1 내지 160의 염기서열 중 어느 하나의 염기서열로 이루어지는 16S rRNA를 포함하는 미생물일 수 있다.
상기 미생물 군집을 분석하는 단계는, 표준 균주 및 비배양 미생물의 16S rRNA 유전자 서열의 데이터베이스를 이용하여, 상기 분석된 16S rRNA 유전자 서열을 분석하여, 서열번호 1 내지 160의 염기서열 중 어느 하나의 염기 서열을 가지는 미생물 바이오마커 군집 규모(population)를 분석하는 단계를 포함할 수 있다.
상기 미생물 군집을 분석하는 단계는, 본 발명에서 제공하는 서열번호 1 내지 160의 16S rRNA를 포함하는 미생물의 존부를 확인하고 존재가 확인된 미생물에 대해서만 군집 규모를 분석함으로써, 전체 미생물 군집을 동정하는 것보다 영유아 장내 미생물 불균형의 판별 및 예후 예측에 필요한 시간과 노동력을 절감할 수 있다.
상기 미생물 군집을 분석하는 단계는, 16S rRNA 데이터베이스를 이용하여 미생물을 속 또는 종 수준으로 동정 및 분류하는 단계 및/또는 각 미생물 군집 규모(population)를 분석하는 단계를 포함하는 것일 수 있다.
상기 미생물의 동정 및 분류에 사용되는 데이터베이스는 필요에 따라 당업자가 적절히 선택하여 사용할 수 있으며, 예를 들어, EzBioCloud, SILVA, RDP 및 Greengene으로 이루어지는 군에서 선택되는 하나 이상의 데이터베이스일 수 있으나, 이에 제한되는 것은 아니다.
상기 미생물 군집 규모는 전체 장내 미생물 균총에서 특정 미생물 군집이 차지하는 비율(%)로 나타내어질 수 있다. 상기 미생물 군집이 차지하는 비율(%)은 전체 시퀀싱 리드 수 중 특정 미생물의 16S rRNA 리드 수 빈도(frequency)의 백분율로 나타내어 질 수 있다. 상기 특정 미생물은 본 발명이 제공하는 영유아 장내 미생물 불균형의 판별 또는 예측용 미생물 바이오마커일 수 있다.
(B) 시험대상 영유아의 메타데이타 정보를 얻는 단계
본 발명의 영유아 장내 미생물 불균형의 판별 또는 예측에 관한 정보를 제공하는 방법은, (B) 시험 영유아로부터 장내 미생물 불균형 관련 항목이 포함된 메타 데이터를 수집하는 단계를 포함한다.
상기 메타 데이터의 수집 단계는 상기 제(A-1)단계의 시험 대상의 대변 시료 수집과 동시에 및/또는 이시에 이루어질 수 있다.
상기 메타 데이터는 영유아의 발달 단계, 건강 상태, 및/또는 장내 미생물 불균형 상태를 판단하기 위한 인자라면 제한없이 수집되어 분석에 이용될 수 있으며, 예를 들어 영유아의 성별, 월령, 키, 체중, 영유아의 식이 형태, 수유 방법, 유산균 포함 식이 진행 여부, 대변의 형태, 대변의 색, 항생제 복용 정보, 질병 진단 정보, 모체의 해당 영유아 임신기간 중 식이 형태, 영유아의 출산 후 모체의 식이 형태 및 모체의 항생제 복용 정보로 이루어지는 군에서 선택되는 하나 이상의 인자를 포함하는 데이터를 수집할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 메타 데이터 수집 과정에서 수집되는 정보 중 상기 식이 형태 정보는, 유산균을 포함하는 식이 섭취 여부, 발효 식품의 섭취 정보, 또는 비발효 건강기능식품 또는 비발효식품의 섭취 정보로 이루어지는 군에서 하나 이상의 정보일 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 일 실시예에서, 다양한 설문 항목을 이용하여 장내 미생물 불균형 정보 관련 메타 데이터가 수집되었다. 상기 메타 데이터를 얻는 단계는, 설문 항목을 이용하여, 장내 미생물 불균형에 영향을 미칠 수 있는 인자가 포함된 설문 항목에 대한 전체 설문 항목의 답변을 상기에서 분석한 16S rRNA 시퀀스 데이터에 첨부 수집하여 저장 혹은 데이터베이스화 하는 단계일 수 있다.
구체적 설문은 설문은 수유식, 이유식, 유아식 및 일반식 중에서 샘플 수집 시에 해당하는 식이 유형으로 설문지를 작성할 수 있도록 설문지를 A(수유), B(이유), C(일반)의 세 가지 유형으로 나누었으며, 설문지 유형은 연구대상 영유아의 법정대리인의 판단으로 선택하도록 하였다. 설문 항목은 분만 방법, 수유 방법, 이유식, 유아식 및 일반식의 종류, 대변 형태 등으로 이루어져 있다. 구체적인 설문 문항을 표 2에 나타내었다.
(C) 상기 단계(A)의 장내 미생물 군집 정도 및 단계(B)의 메타데이타 정보로 이루어지는 군에서 선택된 1이상의 정보에 근거하여, 기준 영유아의 발달 단계 구분기준에 따라 장내 미생물 군집의 발달 단계를 선정하는 단계
상기 시험 영유아의 발달 단계 구분기준를 선정하는 방법은, 식이단계, 월령 및 영유아 발달 지수 (장내 미생물 군집의 정보에 기초)로 이루어지는 군에서 선택된 1종 이상의 기준으로 판별할 수 있다. 상기 영유아 발달 지수는 하기 표 10 내지 표 13의 바이오마커는 영유아의 장내 미생물 군집의 발달 단계를 구분하는 바이오마커로서 2차로 선정된 최종 바이오마커를 활용한 것이다. 하기 표 14에 각 발달 단계 판별 기준에 따른 발달 단계 판별 방법을 요약하였다.
구체적으로, 식이단계를 이용한 영유아 발달 단계의 구분, 월령을 이용한 영유아 발달 단계의 구분 또는 발달단계 특이적 바이오마커를 이용한 영유아 발달 단계의 구분할 수 있다.
상기 발달단계 특이적 바이오마커를 시험 영유아의 발달 단계를 선정하는 방법은, 시험 영유아의 대변으로부터 수집한 16S rRNA 분석 결과를 영유아 장내 미생물 발달 단계 예측 모델에 적용하고 영유아 발달 지수를 계산하는 단계를 포함한다.
상기 기준 영유아의 발달 단계 구분기준은,
(A')기준 영유아의 장내 미생물 군집에 관한 종(species) 수준으로 구별되는 균종과 이들 균종의 점유비율을 얻는 장내 미생물 군집 정보를 얻는 단계,
(B')기준 영유아의 메타데이타 정보를 얻는 단계, 및
(C')상기 단계(A')의 장내 미생물 군집 정도 및 단계(B')의 메타데이타 정보로 이루어지는 군에서 선택된 1이상의 정보에 근거하여, 기준 영유아의 발달 단계 구분기준을 결정하는 단계를 포함한다.
상기 단계(C')에서 기준 영유아의 발달 단계 구분기준을 결정하는 단계는, 기준 영유아의 식이단계, 월령 및 발달단계 특이적 미생물 바이오마커로 이루어지는 군에서 선택된 1종 이상을 이용하여 수행될 수 있다.
상기 단계(C)에서 발달 단계를 선정하는 단계에서, 기준 영유아의 발달 단계 구분기준은 고형 식이, 생후 15개월 도과 여부 또는 영유아 발달지수 1.19 충족 여부인 것일 수있다.
식이단계를 이용한 영유아 발달 단계의 구분
식이단계를 통한 영유아 발달 단계 판별은, 영유아가 섭취하는 식이를 액상의 수유식, 겔상의 이유식, 고형의 유아식 및 고형의 일반식으로 분류하고, 영유아의 메타데이타 정보 (식이)에 근거하여 액상의 수유식 또는 겔상의 이유식 식이 단계를 발달단계 1로, 고형 식이 즉 유아식 또는 일반식을 섭취하는 단계를 발달단계 2로 분류하는 방법이다. 따라서 액상 또는 겔상의 수유식 또는 이유식에서 고형의 식이를 섭취하는 시점을 판단 기준으로 삼는다.
월령을 이용한 영유아 발달 단계의 구분
생후 개월수(월령)를 기준으로 한 발달 단계 판별의 경우, 영유아의 메타데이타 정보 (영유아의 월령)에 근거하여, 조사 대상 영유아의 월령이 15개월 미만인 경우 발달단계 1로, 월령이 15개월 이상인 경우 발달단계 2로 판별한다. 식이 형태가 겔상에서 고형으로 전환되는 시기와, 실시예 4-2의 DMM clustering 방법을 통해 그룹이 분류된 시기를 통해 15개월이라는 기준을 규정하였다. 따라서, 상기 방법으로 규정한 15개월이라는 기준은 식이 단계가 가장 뚜렷하게 나누어지는 시기인 것과, 장내 미생물 군집의 미생물 종류와 각각의 미생물 점유율이 가장 크게 변화하는 시기인 것을 의미한다. 출생 직후의 영유아 장내 미생물은 면역, 모유의 소화 및 장내 안정화 등에 기여하는 미생물 종류가 주를 이루며, 15개월을 기점으로 미생물 종 다양성이 큰 폭으로 증가하고 식이섬유 등 다양한 음식물의 대사와 관련된 미생물 종류가 주를 이룬다.
발달단계 특이적 바이오마커를 이용한 영유아 발달 단계의 구분
영유아 발달 지수를 기준으로 하는 경우, 수집된 장내 미생물의 군집 분석 데이터에 근거하여 각 발달 단계에 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 상술한 영유아 발달 단계 예측 모델에 적용함으로써 발달 단계를 판별하는 방법이다.
상기 발달단계 특이적 미생물 바이오마커를 이용하여 발달단계 1 및 발달단계 2로 구분하는 경우, 상기 발달단계 1에 특이적인 바이오마커는 상기 표 10 및 표 11에 기재된 균종으로 이루어지는 군에서 선택된 1종 이상이고, 상기 발달단계 2에 특이적인 바이오마커는 상기 표 12 및 표 13에 기재된 균종으로 이루어지는 군에서 선택된 1종 이상일 수 있다.
각 발달 단계에 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 발달지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 발달지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 발달단계 1로 선정하고, 설정값 이상인 경우를 발달단계 2로 선정한다.
상기 단계(C')에서 기준 영유아의 발달 단계 구분기준을 결정하는 단계는, 영유아의 발달 단계 1 내지 2의 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 영유아 발달 지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 영유아 발달 지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 발달 단계 1로 선정하고, 설정값 이상인 경우를 발달 단계 2로 선정하는 것이다.
상기 단계(C)에서 발달 단계를 선정하는 단계에서, 시험대상 영유아의 발달 단계에 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 영유아 발달 지수를 산정하고,
상기 시험대상 영유아의 산정된 영유아 발달 지수가, 상기 기준 영유아의 발달 단계 구분기준인 cut-off 값을 기준에 따라 설정값 미만인 경우를 발달 단계 1로 선정하고, 설정값 이상인 경우를 발달 단계 2로 선정하는 것일 수 있다.
본 실험에서는, 상기 실시예 4-7에 의해, 발달지수 1.19를 기준으로 1.19 미만인 경우 발달단계 1로, 발달지수 1.19 이상인 경우 발달단계 2로 판별한다.
설문의 응답에 의존하는 식이 단계 및 생후 개월 수를 기준으로 발달 단계를 판별하는 경우, 상기 표 2의 문항을 포함하는 형태의 설문에 대한 응답이 선행되어야 한다. 영유아 발달 지수를 기준으로 한 판별의 경우, 실시예 2의 방법을 이용한 장내 미생물 분석이 선행되어야 한다.
영유아 장내 미생물 생태계는 부모 및 주변 환경에 상주하는 미생물들이 무균 상태의 신생아에 전달되어 정착해 나감으로써 형성되고, 영유아의 성장과 식이에 따라 영유아 장내의 종 풍부도 및 다양성이 증가한다. 이러한 증가 추세에서, 영유아 발달 단계 특이적 바이오마커는 영유아의 성장에 따른 장내 미생물 생태계의 발달 양상을 구체적으로 나타낸다. 영유아의 발달단계 1에 특이적인 바이오마커는 상기 표 10 및 표 11에 기재되어 있고, 발달단계 2에 특이적인 바이오마커는 상기 표 12 및 표 13에 기재되어 있다.
상기 영유아 발달 지수는, 하기 수학식 4 내지 7의 수학식를 이용하여 산출하여 수행되는 것일 수 있다:
[수학식 4]
[수학식 5]
[수학식 6]
[수학식 7]
(D) 상기 선정된 발달 단계에 따라, 발달 단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 장내 미생물 군집의 불균형군 또는 균형군 여부를 결정하는 단계
시험 영유아의 장내 미생물 불균형 여부를 선정하는 방법은, 상기에서 판별한 시험 영유아의 발달 단계에 따라, 발달 단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 수행한다.
본 발명에 따른 영유아의 장내 미생물 군집 불균형군과 균형군의 구별은 발달단계별 불균형군 특이적 바이오마커와 발달단계별 균형군 특이적 바이오마커를 이용하여 수행할 수 있다.
구체적으로, 발달단계 1의 균형군 특이적 바이오마커는 표 29 및 표 30과 도 10의 계통도에 나타내고, 발달단계 1의 불균형군 특이적 바이오마커는 표 33 및 표 34과 도 11의 계통도에 나타낸다. 또한 발달단계 2의 균형군 특이적 바이오마커는 표 31 및 표 32 도 12의 계통도에 나타내고, 발달단계 2의 불균형군 특이적 바이오마커는 표 35 및 표 36과 도 13의 계통도에 나타낸다.
구체적인 일예에서, 표 37의 영유아 장내 미생물 불균형 판별 기준을 이용하여, 상기 시험 영유아의 대변으로부터 수집한 16S rRNA 분석 결과를 영유아 장내 미생물 불균형 예측 모델에 적용하고 영유아 장내 미생물 불균형 지수를 계산하는 단계를 포함한다.
상기 영유아 장내 미생물 불균형 예측 모델은 영유아 장내 미생물 불균형 및/또는 장내 균형 예측용 미생물 바이오마커의 장내 미생물 군집 규모를 데이터베이스와 대조하여 시험 대상의 영유아 불균형 지수를 계산하기 위한 파라미터를 제공하는 것일 수 있다.
상기 영유아 장내 미생물 불균형 예측 모델은 시험 대상에서 검출된 영유아 장내 미생물 불균형군 및/또는 균형군 특이적 바이오마커 목록 및 coefficient값을 기계 학습 함수 및 지수화 수학식(하기 수학식 1 내지 7)에 대입하여 미지 시료에 대한 영유아 불균형 지수를 계산하고 영유아 장내 미생물 불균형의 판별 및/또는 예측에 활용하는 것일 수 있다.
상기 데이터베이스는 미생물 바이오마커 특정을 위해 수집된 영유아 샘플군의 장내 균총 데이터베이스를 활용하는 것일 수 있으며, 구체적으로, WHO에서 명시한 생후 4주 초과 내지 만 3세(36개월)이하의 영유아를 대상으로 모집한 인체 장내 마이크로바이옴 데이터베이스일 수 있다.
상기 영유아 장내 미생물 불균형 예측 모델은 기계 학습(machine learning)을 이용하여 영유아 장내 미생물 불균형이군 및/또는 장내 균형군 특이적 미생물 바이오마커를 선별 및 영유아 장내 미생물 불균형 판별을 위한 영유아 장내 미생물 불균형 지수를 계산하여 영유아 장내 미생물 불균형을 판별할 수 있는 것을 특징으로 한다.
미생물 군집 분석 결과를 지수화하는 단계는 기계 학습 함수 및 지수화 수학식(하기 수학식 1 내지 7)에 대입하여 미생물 마커와 해당 마커의 Coefficient 값을 이용하여 영유아 장내 미생물 불균형 판별을 위한 영유아 장내 미생물 불균형 지수를 계산하는 과정을 포함할 수 있다.
상기 단계(c') 기준 영유아의 발달 단계 구분기준을 결정하는 단계이후에, 기준 영유아의 상기 단계 (D')에서 발달 단계별 불균형군의 결정 기준을 선정하는 단계를 추가로 포함하며,상기 단계 (D')에서 발달 단계별 불균형군의 결정 기준은, 기준 영유아의 각 발달 단계별 균형군 또는 불균형군 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 불균형 결정 지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 불균형 판결 지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 균형군로 선정하고, 설정값 이상인 경우를 불균형군으로 선정하는 것일 수 있다.
상기 시험 대상이 영유아 장내 미생물 불균형인지 여부를 결정하는 단계는 상기 지수가 전체 데이터베이스의 영유아 장내 미생물 불균형 지수 분포상의 위치를 결정하는 단계를 포함할 수 있다. 상기 영유아 미생물 불균형 지수는 전체 데이터베이스의 영유아 장내 미생물 불균형 지수 분포에서, 균형 구간에 포함되거나 가까워 질수록 장내 미생물 불균형의 예후가 좋아지는 것으로 판단할 수 있다. 상기 전체 데이터베이스는 예를 들어, 상기 예측 모델의 구축에 사용된 트레이닝 세트, 테스트 세트 및 시험 대상 시료를 포함하는 전체 샘플의 영유아 장내 미생물 불균형 지수 데이터베이스일 수 있으나, 이에 제한되는 것은 아니다.
상기 (D) 장내 미생물 군집의 불균형군 또는 균형군 여부를 결정하는 단계에서, 시험대상 영유아의 각 발달 단계별 균형군 또는 불균형군 특이적인 미생물 바이오마커의 균종(species)과 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 불균형 결정 지수를 산정하고,
상기 시험대상 영유아의 산정된 불균형 결정 지수가, 상기 기준 영유아의 불균형 결정 지수의 구분기준인 cut-off 값 기준에 따라 설정값 미만인 경우를 균형군으로 선정하고, 설정값 이상인 경우를 불균형군로 선정하는 것일 수 있다.
상기 불균형 결정 지수는, 하기 수학식 4 내지 7의 수학식를 이용하여 산출하여 수행되는 것일 수 있다:
[수학식 4]
[수학식 5]
[수학식 6]
[수학식 7]
상기 영유아 장내 미생물 불균형 지수는 영유아 장내 미생물 불균형 지수의 분포 구간을 적어도 2 이상의 구간으로 구분하여 표시하는 것일 수 있으며, 바람직하게는 발달 단계에 따라 적정, 빠름, 느림의 3개의 구간으로 구분하여 표시할 수 있다.
상기 구간의 구분은 상기 영유아 장내 불균형 지수의 특이도가 가장 높은 값을 기준으로 하여 구분되는 것일 수 있다.
본 발명의 일 예에서, 발달 단계 1과 발달 단계 2에서 각각 영유아 장내 불균형 지수를 기준으로 불균형 및 균형 단계를 분류하였으며, 발달 단계 별로 하위 0 내지 70%는 균형, 70 내지 100%는 불균형 단계로 분류하였다.
보다 구체적으로, 발달 단계 1에서 하위 0 내지 70%는 적정, 70 내지 100%는 '빠름' 단계이며, 발달 단계 2에서 하위 0 내지 70%는 적정, 70 내지 100%는 '느림' 단계로 규정하였다.
상기 구분에서, '빠름' 및 '느림' 단계는 발달 단계 1에서 나타나는 장내 불균형 특이적 바이오마커가 발달 단계 2에서 주로 나타나는 미생물들인 점과, 발달 단계 2에서 나타나는 장내 불균형 특이적 바이오마커는 발달 단계 1에서 주로 나타나는 미생물들인 점을 통해 규정하였다.
본 발명의 영유아 장내 미생물 불균형의 예측에 관한 정보를 제공하는 방법은, 시간에 따른 시험 대상의 영유아 장내 미생물 불균형 지수 변화를 모니터링하는 단계를 더 포함할 수 있다.
상기 시간에 따른 영유아의 장내 미생물 불균형 지수 변화를 모니터링하는 단계는, 시간의 경과에 따라 영유아 장내 미생물 불균형 지수 분포 구간이 하위 0%에 가까워 질수록 예후가 좋은 것으로 결정하는 것일 수 있다.
본 발명의 영유아 장내 미생물 불균형도의 탐지방법은, 추가로 (E)시험 영유아의 장내 미생물 군집의 불균형 여부를 결정하는 단계에서 결정된 그룹에 따라, 프리바이오틱스(prebiotic), 프로바이오틱스(probiotics), 약물, 식이, 및 생활습관 제안 등으로 이루어지는 군에서 선택된 1종 이상의 처리를 수행하여, 영유아의 장 불균형도를 개선하거나 장 성숙도를 개선하는 단계를 포함하는 장내 미생물의 균형을 달성하기 위한 단계를 수행할 수 있다.
상기 프로바이오틱스 또는 프리바이오틱스는 시험 대상의 장내 미생물 발달단계 및 장내 미생물의 불균형 정도를 이용하여, 미생물 종류 및 함량을 결정할 수 있다.
상기 프로바이오틱스의 예는, 영유아 장내 미생물이 발달 단계에 따라 기준 영유아 집단의 장내 미생물 균형군의 마커 미생물을 포함할 수 있으며 구체적으로 시험 대상이 발달단계 1로 분석된 경우 표 29 및 표 30에 나타낸 발달단계 1의 균형군 특이적 바이오마커 미생물 중 1종 이상을 포함하며, 시험 대상이 발달단계 2로 분석된 경우 표 31 및 표 32에 나타낸 발달단계 2의 균형군 특이적 바이오마커 미생물을 1종 이상 포함할 수 있다.
또한, 상기 프리바이오틱스는, 시험 대상이 발달단계 1로 분석된 경우, 표 29 및 표 30에 나타낸 발달단계 1의 균형군 특이적 바이오마커 미생물 중 1종 이상의 상대적 풍부도를 증가 및/또는 표 33 및 표 34에 나타낸 발달단계 1의 불균형군 특이적 바이오마커 미생물 중 1종 이상의 감소를 달성하는 물질을 포함할 수 있다. 또는, 시험 대상이 발달단계 2로 분석된 경우, 상기 프리바이오틱스는 표 31 및 표 32에 나타낸 발달단계 2의 균형군 특이적 바이오마커 미생물을 1종 이상의 상대적 풍부도를 증가 및/또는 표 35 및 표 36에 나타낸 발달단계 2의 불균형군 특이적 바이오마커 미생물을 1종 이상의 상대적 풍부도(상대적 점유 비율)를 감소하는 물질을 포함할 수 있다.
본 발명의 영유아 장내 미생물 불균형군 및/또는 장내 균형군 특이적 바이오마커 및 이를 이용한 영유아 장내 미생물 불균형 예측 모델을 이용한 영유아 장내 미생물 불균형 지수 제공 절차는 하기의 단계를 거쳐 수행될 수 있다.
(1) 시험 대상 영유아의 채변 샘플 수집 단계,
(2) 상기 채변 샘플로부터 시험대상의 DNA를 추출하고, 추출된 DNA를 주형으로 16S rRNA의 universal primer로 PCR을 수행하여 앰플리콘(amplicon)을 생성하는 단계,
(3) 차세대 유전체 서열분석 (NGS) 플랫폼을 이용하여, 상기 앰플리콘의 16S rRNA 유전자 서열을 분석하는 단계,
(4) 표준(standard) 균주 및 비배양 미생물의 16S rRNA 유전자 서열의 데이터베이스를 이용하여 상기 분석된 16S rRNA 유전자 서열을 분석하여, 시험 대상의 미생물 군집 분석을 수행하는 단계,
(5) 시험 대상 영유아로부터 장내 미생물 불균형 관련 항목이 포함된 메타 데이터를 수집하는 단계,
(6) 상기 (4) 혹은 (5)의 결과에 근거하여, 기준(refernece) 영유아의 발달 단계 구분에 따라, 시험 영유아의 발달 단계를 선정하는 단계,
(7) 시험 영유아의 해당 발달 단계에 따른 기준 영유아 집단의 장내 미생물 불균형이군 및 장내 미생물 균형군의 미생물 군집과 구성 미생물의 점유율 분포를 비교하는 단계, 및
(8) 상기 비교 결과, 영유아 장내 미생물 불균형 지수 기준을 충족하는 경우, 시험 영유아의 장내 미생물 군집의 불균형 여부를 결정하는 단계.
상기 영유아 장내 미생물 불균형 예측 결과를 지수화하여 분석 리포트로 제공할 수 있다. 상기 분석 리포트는 하기의 정보를 포함할 수 있다.
(1) 검사 대상의 발달 단계 및 장내 미생물 불균형 지수
검사 대상에 대하여 영유아 장내 미생물 불균형 예측 모델을 적용하여 영유아 장내 미생물 불균형 지수를 계산한 결과를 포함한다.
(2) 검출된 영유아 장내 미생물 불균형 바이오마커 미생물의 정보
또한, 상기 분석 리포트에는 영유아 장내 미생물 불균형 바이오마커에 해당하는 미생물 중에서 대표적인 미생물에 대한 설명과 비율을 나타낼 수 있다.
본 발명이 제공하는 영유아 장내 미생물 불균형 바이오마커(infant dysbiosis biomarker)를 통해 장내 미생물 분석 결과에 대하여 영유아 장내 미생물 불균형의 판별이 가능하다. 구체적으로, 본 발명은 영유아 장내 미생물 불균형 바이오마커 및 이를 이용한 영유아 장내 미생물 불균형의 판단 또는 장내 미생물 불균형 예측 방법, 또는 영유아 장내 미생물 불균형의 판단 또는 장내 미생물 불균형 예측용 키트를 제공하며, 이를 통해 영유아 장내 미생물 불균형의 판단 또는 영유아 장내 미생물 불균형에 대한 정량적인 예측이 가능하다.
이하 본 발명을 실시예에 의해 더욱 자세히 설명한다. 그러나 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 권리범위를 제한하지 않는다.
실시예 1. 영유아 시료 및 메타 데이터 수집
1-1. 영유아의 선별 기준 및 시료 수집
본 실험을 위해 국제건강기구(WHO)에서 규정한 대로, 생후 4주 초과 내지 만 3세(36개월)이하의 영유아를 선별하였으며, 연구대상 영유아의 법정대리인으로부터 채집된 영유아의 분변을 전달받아 총 120개 샘플을 수집했다. 상기 분변은 미생물의 변성을 막는 완충액에 담겨 전달 되었다. 완충액의 조성은 표 1에 나타내었다.
1-2. 영유아의 메타 데이터 수집
각 샘플 수집 시에는, 해당 시기에서의 영유아 식생 습관에 대해 알기 위한 항목으로 구성된 설문지를 함께 작성하여 제출받았다.
설문은 수유식, 이유식, 유아식 및 일반식 중에서 샘플 수집 시에 해당하는 식이 유형으로 설문지를 작성할 수 있도록 설문지를 A(수유), B(이유), C(일반)의 세 가지 유형으로 나누었으며, 설문지 유형은 연구대상 영유아의 법정대리인의 판단으로 선택하도록 하였다. 설문 항목은 분만 방법, 수유 방법, 이유식, 유아식 및 일반식의 종류, 대변 형태 등으로 이루어져 있다. 구체적인 설문 문항을 표 2에 나타내었다.
Type A(수유) 설문지 |
1. 아이 정보(1) 성별 (2) 개월 (3) 키 (4) 몸무게2. 분만 정보(1)자연 분만 (2) 제왕 절개 (3)자연분만 시도 중 제왕절개3. 엄마의 항생제 복용 시기(1) 임신기간 중 (2) 출산 시 (3)잘 모름 (4) 해당사항 없음4. 출산 후부터 현재까지 엄마의 항생제 복용 경험(1) 예 (항생제명) (2) 아니오 5. 수유 방법(1) 모유 수유 (2) 분유 수유 ( ) (3)혼합 수유 ( ) (분유 수유나 혼합 수유를 하시는 경우에는 현재 사용하시는 제품명 기재)* ‘(1) 모유 수유’ 또는 ‘(2) 분유 수유’를 선택하신 경우 7번 문항으로 이동6. 5번 문항에서 ‘(3)혼합 수유’를 선택한 경우, 모유와 분유의 비율은 다음 중 어느 정도입니까? (1) 주로 모유 (2) 주로 분유 (3)모유, 분유 비슷한 비율 (4) 잘 모름7. 임신 기간 중, 유산균 식품 (정제된 약품 형태가 아닌 치즈, 요거트 등의 발효식품)을 일주일에 몇 일 정도 섭취하였습니까? (1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음8. 임신 기간 중, 프로바이오틱스 또는 프리바이오틱스 제품 (치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 섭취하였습니까? (1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음9. 현재, 귀하는 유산균 식품 (정제된 약품 형태가 아닌 치즈, 요거트 등의 발효식품)을 일주일에 몇 일 정도 섭취하고 있습니까? (1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음10. 현재, 귀하는 프로바이오틱스 또는 프리바이오틱스 제품 (치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 복용하고 있습니까? (1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음11. 현재, 아이는 프로바이오틱스 또는 프리바이오틱스 제품 (치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 복용하고 있습니까? (분유에 섞어서 먹이는 것 포함) (1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음12. 지난 한 달 사이에 아이가 항생제를 복용한 적이 있습니까? (1) 예 (2) 아니오 (3)잘 모름 * ‘(2) 아니오’ 또는 ‘(3)잘 모름’을 선택하신 경우 14번 문항으로 이동13. 아이가 항생제를 복용했을 때의 복용 기간은 다음 중 무엇입니까? (1) 1-2일 (2) 3-6일 (3)7일 이상14. 지난 한 달 동안 일반적인 대변의 형태는 다음 중 무엇입니까? (1) 설사가 많음 (2) 일반적인 묽은변 (3)기타 (_________________________________)15. 지난 한 달 동안 일반적인 대변의 색깔은 다음 중 무엇입니까? (한 가지만 선택해주세요.) (1) 황금색 (2) 갈색 (3)검은색 (4) 쑥색 (녹색) (5) 이 외의 다른 색 (_________________)16. 아이가 다음과 같은 질병을 병원에서 진단 받은 적이 있습니까? (중복 선택 가능) (1) 해당사항 없음 (2) 아토피 (3)자폐증 (4) ADHD (5) 유아비만 (6) 기타 질병 (__________________) |
[Type B(이유) 설문지]
1. 아이 정보
(1) 성별 (2) 개월 (3) 키 (4) 몸무게
2. 분만 정보
(1) 자연 분만 (2) 제왕 절개 (3)자연분만 시도 중 제왕절개
3. 엄마의 항생제 복용 시기
(1) 임신기간 중 (2) 출산 시 (3)잘 모름 (4) 해당사항 없음
4. 출산 후부터 현재까지 엄마의 항생제 복용 경험
(1) 예 (항생제명) (2) 아니오
5. 이유식 혹은 유아식을 수유와 함께 진행하고 계십니까?
(1) 예 (2) 아니오
* ‘(2) 아니오’를 선택하신 경우 8번 문항으로 이동
6. 5번 문항에서 ‘(1) 예’를 선택하신 경우, 수유 방법은 다음 중 무엇입니까? (분유 수유 혹은 혼합 수유라면, 사용하시는 제품의 이름을 함께 적어 주십시오)
(1) 모유 수유 (2) 분유 수유 ( ) (3)혼합 수유 ( )
*(1) 또는 (2) 번을 선택하신 경우 8번 문항으로 이동
7. 6번 문항에서 ‘(4) 혼합 수유’를 선택한 경우, 모유 수유와 분유 수유의 비율은 어떠합니까?
(1) 주로 모유 수유 (2) 주로 분유 수유 (3)모유, 분유 수유 동등한 비율
8. 현재, 엄마는 유산균 식품 (정제된 약품 형태가 아닌 치즈, 요거트 등의 발효식품)을 일주일에 몇 일 정도 섭취하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
9. 현재, 엄마는 프로바이오틱스 또는 프리바이오틱스 제품 (치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 섭취하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
10. 아이가 일반적으로 섭취하는 이유식은 무엇입니까?
(1) 초기 이유식 (물 같은 미음) (2) 중기 이유식 (묽은 죽, 으깬 것) (3)후기 이유식 (된죽) (4) 유아식 (죽 이외의 음식)
11. 현재, 아이는 유산균 식품(정제된 약품 형태가 아닌 치즈, 요거트 등의 발효식품) 을 일주일에 몇 일 정도 섭취하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
12. 현재, 아이는 프로바이오틱스 또는 프리바이오틱스 제품 (치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 복용 하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
13. 지난 한 달 사이에 아이가 항생제를 복용한 적이 있습니까? * 모르시면 공백
(1) 예 (항생제명: _________________) (2) 아니오
*(2) 아니오 경우 15번 문항으로 이동
14. 아이의 항생제 복용 기간은 어떻게 됩니까?
(1) 1-2일 (2) 3-6일 (3)7일 이상
15. 현재 이유식을 진행하는 경우, 지난 한 달 동안 아이의 일반적인 대변 형태는 다음 중 무엇입니까?
(1) 설사가 많음 (2) 일반적인 묽은변 (3)기타 (__________________)
* 17번 문항으로 이동해주세요.
16. 유아식을 진행하는 경우, 지난 한 달 동안 아이의 일반적인 대변 형태는 다음 중 무엇입니까? (한 가지만 선택해주세요.)
(1) 심한 변비 (큰 구슬 모양으로 나오는 단단한 변) (2) 약한 변비 (구슬 모양이 보이는 울퉁불퉁한 변) (3)건조한 변 (표면이 갈리진 모양이 보이는 변) (4) 촉촉한 변 (표면이 매끈한 변) (5) 묽은 변 (수분을 많이 함유하여 여러 덩어리로 분리 된 변) (6) 약한 설사 (수분이 매우 많아 진흙처럼 나오는 변) (7) 심한 설사 (물처럼 나오는 변)
17. 지난 한 달 동안 일반적인 대변의 색깔은 다음 중 무엇입니까? (한 가지만 선택해주세요.)
(1) 황금색 (2) 갈색 (3)검은색 (4) 쑥색 (녹색) (5) 이 외의 다른 색 (_________________)
18. 아이가 다음과 같은 질병을 진단 받은 적이 있습니까? (중복 선택 가능)
(1) 해당사항 없음 (2) 아토피 (3)자폐증 (4) ADHD (5) 유아비만 (6) 기타 질병 (__________________)
19. 질병 진단을 받았다면 증상이 이유식 혹은 유아식을 시작 후 나타났습니까?
(1) 예 (2) 아니오
[Type C(일반) 설문지]
. 아이 정보
(1) 성별 (2) 개월 (3) 키 (4) 몸무게
2. 분만 정보
(1) 자연 분만 (2) 제왕 절개 (3)자연분만 시도 중 제왕절개
3. 엄마의 항생제 복용 시기
(1) 임신기간 중 (2) 출산 시 (3)잘 모름 (4) 해당사항 없음
4. 출산 후부터 현재까지 엄마의 항생제 복용 경험
(1) 예 (항생제명) (2) 아니오
5. 현재 수유 중입니까?
(1) 예 (2) 아니오
* ‘(2) 아니오’를 선택하신 경우 8번 문항으로 이동
6. 현재 수유를 진행하는 경우, 수유 방법은 다음 중 무엇입니까? 분유 수유나 혼합 수유를 하시는 경우에는 현재 사용하시는 제품의 이름을 함께 적어 주십시오.
(1) 모유 수유 (2) 분유 수유 ( ) (3)혼합 수유 ( )
* ‘(1) 모유 수유’ 또는 ‘(2) 분유 수유’를 선택하신 경우 8번 문항으로 이동
7. 6번 문항에서 ‘(3)혼합 수유’를 선택한 경우, 모유와 분유의 비율은 다음 중 어느 정도입니까?
(1) 주로 모유 (2) 주로 분유 (3)모유, 분유 비슷한 비율 (4) 잘 모름
8. 아이가 주로 섭취하는 일반식 재료 3가지를 적어주세요.
(1) ______________________ (2) ______________________ (3)______________________
9. 현재, 아이는 유산균 식품 (정제된 약품 형태가 아닌 치즈, 요거트 등의 발효식품)을 일주일에 몇 일 정도 섭취하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
10. 현재, 아이는 프로바이오틱스 또는 프리바이오틱스 제품(치즈, 요거트 등의 발효식품 형태가 아닌 건강기능제품)을 일주일에 몇 일 정도 복용 하고 있습니까?
(1) 주 1 - 2일 (2) 주 3 - 5일 (3)주 6 - 7일 (4) 섭취하지 않음
11. 현재, 아이의 설탕이 포함된 음료 (탄산, 과일주스 등)의 주간 섭취 빈도는 다음 중 무엇입니까?
(1) 매일 (2) 3-5일 (3)1-2일 (4) 주 1일 이하 (5) 섭취하지 않음 (6) 잘 모름
12. 현재, 아이의 설탕이 포함된 과자(예: 초콜릿, 사탕, 젤리 등)의 주간 섭취 빈도는 다음 중 무엇입니까?
(1) 매일 (2) 3-5일 (3)1-2일 (4) 주 1일 이하 (5) 섭취하지 않음 (6) 잘 모름
13. 지난 한 달 사이에 아이가 항생제를 복용한 적이 있습니까?
(1) 예 (2) 아니오 (3)잘 모름
* ‘(2) 아니오’ 또는 ‘(3)잘 모름’을 선택하신 경우 14번 문항으로 이동
14. 아이가 항생제를 복용했을 때의 복용 기간은 다음 중 무엇입니까?
(1) 1-2일 (2) 3-6일 (3)7일 이상
15. 지난 한 달 동안 일반적인 대변의 형태는 다음 중 무엇입니까? (한 가지만 선택해주세요.)
(1) 심한 변비 (큰 구슬 모양으로 나오는 단단한 변) (2) 약한 변비 (구슬 모양이 보이는 울퉁불퉁한 변) (3)건조한 변 (표면이 갈리진 모양이 보이는 변) (4) 촉촉한 변 (표면이 매끈한 변) (5) 묽은 변 (수분을 많이 함유하여 여러 덩어리로 분리 된 변) (6) 약한 설사 (수분이 매우 많아 진흙처럼 나오는 변) (7) 심한 설사 (물처럼 나오는 변)
16. 지난 한 달 동안 일반적인 대변의 색깔은 다음 중 무엇입니까? (한 가지만 선택해주세요.)
(1) 황금색 (2) 갈색 (3)검은색 (4) 쑥색 (녹색) (5) 붉은색 (6) 이 외의 다른 색 (_________________)
17. 아이가 다음과 같은 질병을 진단 받은 적이 있습니까? (중복 선택 가능)
(1) 해당사항 없음 (2) 아토피 (3)자폐증 (4) ADHD (5) 유아비만 (6) 기타 질병 (__________________)
18. 질병 진단을 받았다면 증상이 일반식을 시작한 후 나타났습니까?
(1) 예 (2) 아니오
실시예 2. 차세대염기서열분석(Next Generation Sequencing; NGS)을 이용한 장내 미생물 군집 분석
2-1. 16S 리보솜 RNA 유전자 서열 획득 및 분석
상기 1-1의 방법으로 수집된 대변 샘플을 이용하여 대변의 genomic DNA를 추출하였다. 모든 샘플은 DNA 완충액에 담겨 수집된 상태이므로, 구체적으로, 수집 직후 FastPrep (MP Biomedicals)에서 speed 6.0으로 40 초간 homogenization하여 물리적인 방법으로 유전체 DNA(genomic DNA)를 추출하였다.
구체적으로, 상기 유전체 DNA 추출 방법으로 추출된 DNA를 이용, universal primer를 사용하여 중합효소 연쇄 반응(PCR reaction)을 통해 광범위한 Taxonomic group을 대상으로 한 다양한 유형의 앰플리콘(amplicon)을 생성하였다. 상기 universal primer의 서열은 하기와 같으며, 앰플리콘 형성을 위한 PCR pre-mix의 조성 및 PCR 수행 조건을 표 3 및 표 4에 각각 나타내었다.
정방향 universal primer (서열번호 161): 5'-CCTACGGGNGGCWGCAG-3'
역방향 universal primer (서열번호 162): 5'-GACTACHVGGGTATCTAATCC-3'
조성(component) |
함량(1X) |
template (유전체 DNA) |
0.5 ul |
2x buffer |
10 ul |
정방향 universal primer (10 pmole) |
0.5 ul |
약방향 universal primer (10 pmole) |
0.5 ul |
Polymerase |
0.3 ul |
3' D.W |
8.2 ul |
전체 |
20 ul |
단계(cycle step) |
온도(temperature) |
시간(time) |
Initial denaturation |
95 ℃ |
3 min |
Denaturation annealing& Extension(25 cycles) |
95 ℃55 ℃72 ℃ |
30 sec30 sec30 sec |
Final extension |
72 ℃4 ℃ |
5 min∞ |
이렇게 생성된 앰플리콘들은 정제한 후 Bioanalyzer (Agilent), qPCR 등을 이용하여 앰플리콘 품질 검사 단계(Quality Control; QC)를 수행하여, 대변의 genomic DNA에서 추출된 장내 미생물의 16S rRNA 서열을 얻은 것을 확인한 후, MiSeq(Illumina) 장비를 통해 차세대 염기서열 분석기술(Next Generation Sequencing; NGS)을 이용하여, 상기 시료의 16s 리보솜 RNA 유전자 서열 분석을 시행하였다.
시료 전처리 및 QC 과정의 모식도를 도 1에 나타내었다. 구체적으로, DNA 증폭 과정에서 Gel QC 결과 650bp 부근에서 DNA band가 나타나는 것을 확인하고, Picogreen 시약을 이용한 DNA 정량 분석 결과 DNA 농도가 5 ng/ul 이상이 되도록 하였다. 샘플 혼합 단계에서는 Bioanalyzer QC 결과 DNA peak에 main peak 이외의 short peak이 관찰되지 않는 지 확인하고, picogreen QC 결과 DNA 농도가 5 ng/ul 이상을 기준으로 quality control을 수행하였다.
2-2. 미생물 군집 분석
상기 차세대염기서열분석기법 (NGS)으로 하나의 샘플에서 수천 개의 유전자 서열을 생성한 후에는, 표준 균주 및 비배양 미생물의 16S 리보솜 RNA 유전자 서열 데이터베이스 (EzTaxon) 및 이지바이오클라우드 분석시스템 (http://www.ezbiocloud.com)으로 미생물 커뮤니티(bacterial community) 정보를 문(phylum)에서 종(species) 단계까지 분석하였다. 분석 정보는 천랩의 인체 마이크로바이옴 데이터베이스에 상기 실시예 1-2의 메타 데이터와 함께 축적하였다.
시료에서 얻어진 미생물의 16S rRNA 중에서 가장 큰 비율을 차지하는 11개 분류군의 개월수 별 변화를 도 2에 나타내었다. 상기 11개 분류군은 각각 Anaerostipes 속, Bacterioides 속, Bifidobacterium 속, Blautia 속, Clostridium 속, Lachnospiraceae 과 미발표 속, Enterococcus 속, Escherichia 속, Faecalibacterium 속, Streptococcus 속 및 veillonella 속으로 구성되었다.
영유아의 월령에 따른 11개 분류군의 변화를 보다 구체적으로 살펴보면, 영유아의 성장에 따라 Bifidobacterium 속의 감소 및 Bacteroides 속 및 Faecalibacterium 속의 증가가 두드러지게 나타났다. Bifidobacterium 속은 신생아의 면역력 강화 및 영양분 흡수에 도움을 주는 대표적인 유산균으로, 모유를 통해 장내에 전달되어 초기 장내 미생물들의 정착을 돕는 것으로 알려져 있다. 도 2에서 확인할 수 있는 바와 같이, 전체 장내 균총 규모를 1로 두었을 때 Bifidobacterium 균은 2개월 째에 0.7수준으로 증가하였다가 10개월 이후 장내 균총 내 규모가 감소하여 0.2 수준으로 유지되었다.
시간에 따른 균총 내 증가세가 두드러진 Bacteroides 속 및 Faecalibacterium 속 미생물들은 식물성 탄수화물의 대사 및 짧은 사슬 지방산의 생성과 연관되어 있다. 영유아의 월령이 늘어나고 이유식 및 유아식을 하는 인원이 증가함에 따라 식이섬유 분해 및 짧은 사슬 지방산 생성균이 증가하는 것으로 추정할 수 있다. 짧은 사슬 지방산은 주로 섬유질이 분해되는 과정에서 나타나는 산물로, 에너지 생산 촉진, 비타민 생성 촉진, 장내 세포 결속 강화 등 인체에 유익한 영향을 주는 물질로 알려져 있다.
Bacteriodes 균은 8개월 이전의 영아에서는 전체 균총 내 차지하는 비율이 약 0.05 수준으로 매우 낮았으나, 9개월 이후 점차 그 비율이 증가하여 두 돌에 이르면 0.48 수준으로 규모가 증가하였다.
Faecalibacteium 속 미생물의 경우, 3개월까지는 분포가 매우 낮게 나타났으나, 3개월 이후 군집 규모가 점차 증가하여 12개월에 이르면 0.2 수준이 되었고, 이후 약 0.25 수준에서 군집 규모가 유지되는 양상을 보였다.
실시예 3. 장내 미생물 분석 데이터 그룹화 및 그룹 별 특징 선택
3-1. DMM clustering을 이용한 장내 미생물 분석 데이터 그룹화
디리클레 다항분포 혼합모델 (Dirichlet multinomial mixtures, DMM) 클러스터링은 다양한 요인을 모두 적용하여 그룹화(grouping)할 수 있는 분석 방법으로, 방대한 장내 미생물 분석 데이터를 반영하기에 적합하다. DMM 클러스터링 방법에 따라 장내 미생물 군집의 확률분포를 하기 수학식 1과 같이 설정하여 최적의 그룹을 찾았다.
[수학식 1]
우선 각 샘플의 군집을 계통군의 확률 벡터
(i=1,..., N)로 나타낸다. 이때 N은 총 샘플의 개수에 해당한다. 그리고 위 확률 벡터는 각 군집 그룹별로 다른 하이퍼파라미터
(k=1,..., K)를 가지는 디리클레 분포의 혼합 사전분포로부터 생성된다. K는 총 군집 그룹의 개수이며,
는 혼합모델의 가중치에 해당한다.
샘플들의 관측값
은 위 군집별 확률벡터로부터 다항분포 샘플링으로 생성된다. 최종적으로 관측값의 likelihood는 수학식 2와 같이 정의된다.
[수학식 2]
위 likelihood와 사전분포를 조합하면 수학식 3과 같은 사후분포를 도출할 수 있다.
[수학식 3]
베이지안 방법론에서는 이를 최대로 하는 모델의 하이퍼파라미터를 찾는다. 이때, Expectation-maximization 방법을 이용하였으며, Laplace approximation 값을 이용하여 모델의 적합도를 판별하였다. 이는 통계분석 프로그램 R의 DirichletMultinomial 패키지를 이용하여 계산하였다.
3-2. 기계 학습(Machine learning) 모델 구축
기계 학습을 위해서, 모든 영유아 샘플은 training set과 test set으로 나누어졌다. Training set은 기계학습 모델의 학습에, test set은 기계학습 모델에 대한 평가에 사용하였다. 상기 실시예 3-1의 방법으로 나눈 각각의 그룹에서 샘플을 약 2:1의 비율로 무작위로 선정하여 test set과 training set을 규정하였다. 기계 학습 모델 구축 시, 회귀계수의 기대값을 도출하기 위해 100번의 부트스트랩 반복 (bootstrap replication)으로 상기의 샘플 선정 과정을 반복하였으며, test set과 training set은 부트스트랩(bootstrap) 반복 수행마다 무작위로 재설정된다.
기계 학습은 실시예 3-1과 같이 나눈 그룹 별 장내 미생물 패턴을 통계적으로 유의미하게 인식하는 단계로서, 이러한 예측 모델은 라소(Least absolute shrinkage and selection operator, LASSO)를 이용하였다. LASSO의 특징 선택 알고리즘은 모델의 회귀계수(regression coefficient)의 합계에 벌점(penalty)을 부과하여 그룹을 나누는 예측 변수와 가장 강한 연관관계를 보이는 미생물만을 선택할 수 있도록 하는 특징이 있다(Friedman, Hastie & Thirani, J Stat Softw, 2010., S. J. Kim, K. Koh, M. Lustig, S. Boyd and D. Gorinevsky, in IEEE Journal of Selected Topics in Signal Processing, 2007.).
LASSO 모델의 예측 함수는 하기 수학식 4와 같다.
[수학식 4]
[수학식 5]
각 변수는 하기와 같다.
상기 X 는 모델의 독립변수이며 이는 영유아 대변 분석 결과 상의 미생물 군집 비율에 해당한다.
상기 β는 모델의 회귀계수(Coefficient)이고 미생물과 예측 변수의 관련도를 나타낸다.
상기
는 모델의 예측 점수이고 0에서 1사이의 확률값을 가진다.
상기
는 학습에 사용한 n개의 시료의 미생물 군집 비율에 해당하며, 상기
는 사용한 시료의 실제 데이터(그룹화에 사용된 실제 변수에 따라 각각 0과 1의 값)에 해당한다.
상기 m은 학습에 사용된 미생물 분류군 수로서, 자연수 값을 가진다.
상기 λ 값 은 기계 학습 모델의 하이퍼파라미터(hyper parameter)이다.
이때 사용하는 가중치인 정규화 파라미터(regularization parameter)를 미생물 군집데이터에 맞게 설정하는 단계가 가장 먼저 필요하다. 이를 위해 정규화 파라미터를 0.0001 에서 10000 사이에서 지수 스케일로 균등하게 10개로 잘라 10개의 모델을 생성하여 가장 좋은 예측 결과(가장 높은 AUC 수치)를 주는 모델 파라미터를 선별하는 과정을 거쳤다. 이러한 그리드서치(grid search)를 통해 최적화(optimization)된 하이퍼파라미터(hyperparameter)를 얻을 수 있다.
3-3. 그룹별 바이오마커의 탐색
실시예 3-2에서 찾은 최적의 모델 파라미터를 이용하여 특징적 선택 (feature selection) 과정을 진행하였다. 상기 100번의 반복 학습에서 각 그룹의 마커로 판별된 빈도는 Robustness, 각 그룹의 관련도(
)를 평균 계산한 값은 Coefficient라고 정의된다. Coefficient 값은 바이오마커의 영향력을 나타낸 값으로서, 각 바이오마커가 각 그룹에서 어느 그룹에 특정하는지에 대한 정보 역시 포함하고 있다.
각각의 그룹에서 더 많은 군집 규모(population)를 보이는 경우에 따라, Coefficient 값은 음수값과 양수값으로 분포하며, 이를 수학식 4와 같은 logistic function에 적용하여 각 그룹에 대한 특이점을 판별한다. 제1그룹에 더 많이 분포할 경우 음수값, 제2그룹에 더 많이 분포할 경우 양수값으로 표현되도록 설정하였다.
3-4. 그룹 별 바이오마커의 특징 선택
상기 실시예 3-3의 LASSO 적용 결과를 각 그룹을 구분하는 기준에 따라 보정하여, 최종 미생물 바이오마커를 선정한다. 예를 들어, 제1그룹에 특이적인 바이오마커로 판별된 미생물은 제1그룹에 특이적인 마커로서 판별한 미생물이기 때문에, 제2그룹에 비해 제1그룹에서 미생물 분류군의 군집 규모(population)가 더 높은 비율을 보여야 한다. 따라서, 제1그룹의 최종적인 바이오마커는 제2그룹에서 미생물 분류군의 군집 규모(population)가 더 높은 비율로 나타난 미생물 분류군을 제외하여 선별한다. 이러한 과정을 통해 LASSO를 적용하여 얻어낸 바이오마커를 각 그룹을 나누는 미리 규정된 기준에 따라 보정할 수 있다.
3-5. Test set을 이용한 모델 검증
상기 실시예 3-2에서 100번 반복으로 선정된 Test set을 최적화 기계 학습 모델에 적용하였다. 실시예 3-5에서 선택한 특이적 마커와 해당 마커의 Coefficient 값을 이용하여 그룹 판별을 위한 예측점수(prediction score)를 계산할 수 있다.
실시예 3-5에서 선별한 미생물들의 계수(coefficient)를
, 선별한 미생물들의 군집 규모가 장내 균총에서 차지하는 비율을
X' 라고 할 때, 예측 점수
는 하기 수학식 6와 같이 계산한다. 수학식 6에서 각 파라미터 정의는 상기한 바와 같다.
[수학식 6]
상기 수학식 6에서,
는 선별한 미생물들의 coefficient이고,
X' 는 선별한 미생물들의 군집 규모 비율이다.
상기 예측점수(prediction score)는 Test set의 장내 미생물 군집 데이터에서 실시예 3-5를 통해 선택한 미생물 마커를 찾고 상기 미생물 마커의 군집 규모 비율을 해당 바이오마커의 Coefficient와 내적곱을 하여 0 내지 1의 값으로 계산한다.
Test set에 대한 예측 모델 적용 결과의 ROC 곡선 (receiver operating characteristic curve) 및 AUC (area under curve) 그래프를 통해 이를 검증할 수 있다. ROC 곡선의 경우 활 모양으로 크게 굽어져 있는지, AUC값의 경우 1에 가까운 값을 보이는지를 통해 test set에 적용한 예측 모델이 유의미함을 알 수 있다.
3-6. 예측 모델 판별 결과의 지수화
기계 학습 모델의 예측 확률은 Train set의 판별 결과에 근거하여 계산된 확률이며 이는 실제 인구에서 정확히 판별한 확률이 아니다. 이에 정확한 임상적 해석을 부여하기 위해, 0과 1사이의 확률값을 학습에 사용한 제1그룹와 제2그룹의 비율로 나눠 리스케일하였다. 수학식 7에서 각 파라미터 정의는 상기한 바와 같다.
[수학식 7]
상기 수학식 7에서,
는 특정 그룹의 판별을 위한 시험 대상의 예측 점수이고,
P0 는 예측 모델 구축에 사용된 training set에 존재하는 제2그룹 샘플의 비율이며,
Ncase 는 training set 내 제2그룹 샘플의 수이고,
Ntrain 는 training set의 전체 샘플 수이다.
위에서 구한 판별 지수를 통해 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy) 값을 확인한다. 민감도는 제2그룹 전체 시료 중 실제로 제2그룹인 비율, 특이도는 제2그룹으로 판정된 전체 시료 중 실제 제2그룹인 비율을 의미하며, 정확도는 전체 시료 중 제1그룹 또는 제2그룹이 각각 정확하게 판정된 비율을 나타낸다.
구체적으로, 전체 샘플에서 분포하는 민감도, 특이도, 정확도 값을 20등분하여 판별 지수의 기준(cut off)을 정한다. 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy)는 하기 수학식 8 내지 10과 같이 계산한다. 수학식 8 내지 10에서 각 파라미터 정의는 상기한 바와 같다.
[수학식 8]
[수학식 9]
[수학식 10]
상기 수학식 8 내지 10에서,
TP는 제2그룹에 해당하는 시료에서 판별 지수(
)가 cut-off보다 큰 경우의 수이고,
TN은 제2그룹에 해당하는 시료에서 판별 지수(
)가 cut-off보다 작은 경우의 수이고,
FP는 제1그룹에 해당하는 시료에서 판별 지수(
)가 cut-off보다 큰 경우의 수이고,
FN은 제1그룹에 해당하는 시료에서 판별 지수(
)가 cut-off보다 작은 경우의 수이다.
정확도가 가장 높게 계산된 지수를 기준으로 판별할 경우, 해당 지수에서 나타나는 특이도 혹은 민감도로 제1그룹 혹은 제2그룹에 대한 정확한 판별능을 기대할 수 있다.
실시예 4. 영유아 발달 단계의 규정
4-1. 식이 단계를 통한 영유아 샘플 분류
실시예 1의 샘플 수집 시에는 해당 시기에서의 영유아 식생 습관에 대해 알기 위한 설문지에 근거하여, 전체 120개 영유아 샘플에 대한 수유식, 이유식, 일반식의 분포를 도 3a에 나타내고 식이 단계 별 개월수(age) 분포를 살펴보았다. 수유식, 이유식, 일반식의 식이 단계는 영유아가 섭취하는 식이의 형태에 따라 정의하며, 각각 액상 (수유식), 겔상(이유식), 고형(일반식)의 식품을 섭취하는 식이 형태를 의미한다. 도 3b에 따르면 식이 단계는 생후 약 6개월, 15개월을 기준으로 다르게 분포한다. 상기 일반식 식이는 성인과 동일한 고형 식이를 의미한다.
다만, 생후 6 내지 24개월에 해당하는 영유아의 식이 단계는 넓게 혼재되어 있다. 이 시기의 식이 단계를 세분화하여 살펴보기 위해, 초기 이유식(갈색), 중기 이유식(분홍색), 후기 이유식(회색), 유아식(노란색)으로 나누어 개월수(age)를 살펴보았다. 이유식 단계는 상기 표 2의 B유형 설문 10번 문항을 이용하였으며, 그 결과를 도 3b에 나타내었다. 도 3b에 따르면, 초기, 중기, 후기 이유식과 유아식이 생후 약 15개월을 기점으로 구분된다. 초기 이유식은 물 같은 미음 위주(겔상), 중기 이유식은 묽은 죽, 으깬 것 위주(겔상), 후기 이유식은 된죽 위주(겔상), 유아식은 죽 이외의 음식 위주(고형)의 식이를 한다고 답변한 경우이다.
도 3a 및 3b로 미루어볼 때, 실시예 1의 샘플은 식이 구분을 통해 2개 그룹으로 나눌 수 있으며, 구체적으로, 수유식(액상)과 이유식(겔상)을 하는 그룹과, 유아식 및 일반식(고형)을 하는 그룹으로 구분할 수 있다.
따라서, 식이의 형태에 따라 영유아를 액상 및 겔상 식이와 고형 식이를 하는 시기에 따라 발달단계 1 및 발달단계 2로 규정하였다. 전체 영유아의 개월수(age) 별 식이 단계 분포를 표 5에 나타내었다.
영유아 식이 단계에 따른 샘플 수 분포
구분 |
0-10개월 |
11-14개월 |
15-36개월 |
계 |
수유식 |
28 |
0 |
0 |
28 |
초기 이유식 |
4 |
0 |
0 |
4 |
중기 이유식 |
18 |
1 |
0 |
19 |
후기 이유식 |
2 |
9 |
1 |
12 |
유아식 |
1 |
3 |
7 |
11 |
일반식 |
0 |
1 |
45 |
46 |
계 |
53 |
14 |
53 |
120 |
4-2. 장내 미생물 분석 데이터를 통한 발달 단계의 그룹화
상기 실시예 3-1의 DMM 클러스터링 방법에 따라, 장내 미생물 데이터를 이용하여 전체 영유아 샘플을 그룹화하였으며 도 4a 및 도 4b에 그 결과를 나타내었다. DMM 클러스터링 방법에 따르면, 전체 영유아 샘플은 총 2개 발달단계 그룹으로 나누어졌으며, 도 4a에 그 결과를 나타내었다. 제1그룹에서 69개 샘플, 제2그룹에서 51개 샘플로 나타났으며, 제1그룹과 제2그룹에 생후 개월수(월령)를 적용한 결과, 약 15개월을 기준으로 샘플들이 두 가지 그룹으로 분리되어 분포하였다. 이러한 결과는 도 4b에 나타내었다. 따라서 상기 그룹화 결과가 영유아의 월령과 유의미한 상관 관계를 나타냄을 확인하였다. 실시예 4-1을 참고하여, 제1그룹은 발달단계 1, 제2그룹은 발달단계 2로 명명하였다.
총 샘플 수: 120
제1그룹: 발달단계 1
제1그룹 샘플 수: 69
제2그룹: 발달단계 2
제2그룹 샘플 수: 51
4-3. 발달 단계별 기계 학습 모델의 적용
상기 실시예 3-2에 따라, 상기 규정한 발달단계별 장내 미생물 분석 데이터를 기계 학습에 적용하였다. 모델의 하이퍼파라미터에 해당하는 정규화 파라미터 즉, 본 발명에 따른 최적화된 영유아 발달 단계 예측 모델은 상기 수학식 1의
값 중 가장 좋은 예측 결과를 보이는 값을 통해 선택되었다. 발달 단계를 판별하는 최적화 예측 결과값(하이퍼파라미터)은 10으로 확정하였다.
4-4. 발달 단계 예측 모델을 이용한 바이오마커의 특징적 선택(1차)
실시예 4-3의 결과에 따라, 각 발달 단계에서 1차적으로 나타나는 특징적인 바이오마커를 선별하였다. 발달단계 1과 관련된 바이오마커는 종 수준(Species level)에서 44개, 속 수준(Genus level)에서 12개 분류군으로 나타났다. 반면, 발달단계 2와 관련된 바이오마커는 종 수준(Species level)에서 59개, 속 수준(Genus level)에서 22개 분류군으로 나타났다. 표 6 내지 표 9에는 발달단계 1과 관련된 종 및 속 수준 바이오마커, 발달단계 2와 관련된 종 및 속 수준 바이오마커의 종류를 나타내었다.
하기 표 6 내지 9에서, coefficient 는 상기 수학식 4의 β에 해당하며, 음수 값은 발달단계 1에 특이적인 미생물, 양수 값은 발달단계 2에 특이적인 미생물임을 의미한다. robustness 는 부트스트랩 반복 100회 중 각 미생물이 각 발달단계로 나타난 횟수를 비율로 나타낸 것이며, 1에 가까울수록 해당 그룹에 특이적임을 의미한다. 또한, 균형균 비율 및 불균형균 비율은 각 미생물 군집의 규모 (population)를 의미하며, 각각 동정된 전체 미생물의 총 reads 수에 대비하여 해당 미생물이 차지하는 reads 수를 통해 비율을 계산하여 얻은 수치이다.
하기 표 6 내지 표 9의 바이오마커는 영유아의 장내 미생물 군집의 발달 단계를 구분하는 바이오마커로서 1차로 선정된 것이다. 하기 표 7 및 표 9에서 기재된 (Genus) 수준 바이오마커라 함은 미생물 바이오마커의 종(speies)가 구분되나, 구체적으로 동정이 종 수준까지 수행되지 않은 것으로서, 실질적으로 species 수준에서 구별되는 미생물 바이오마커임을 의미한다.
발달단계 1과 관련된 종(Species) 수준 바이오마커(1차)
시료번호(species level)(균종명) |
coefficients |
robustness |
균형군 비율(%) |
불균형군 비율(%) |
Enterococcus faecalis |
-0.618223 |
1 |
1.885624 |
0.01247 |
Streptococcus peroris |
-0.497649 |
0.95 |
0.414597 |
0.014475 |
Bifidobacterium longum |
-0.314397 |
1 |
28.477828 |
4.755615 |
Bifidobacterium scardovii |
-0.244088 |
0.916667 |
1.498041 |
0.681195 |
Enterococcus faecium |
-0.201899 |
0.95 |
7.106151 |
1.48029 |
Rothia mucilaginosa |
-0.152262 |
0.533333 |
0.177708 |
0.001652 |
Veillonella parvula |
-0.129975 |
0.716667 |
0.876127 |
0.032537 |
Clostridioides difficile |
-0.061403 |
0.35 |
0.331878 |
0.100077 |
Veillonella dispar |
-0.056745 |
0.5 |
2.840242 |
0.776448 |
Bifidobacterium pseudolongum |
-0.055155 |
0.333333 |
0.102172 |
0.032258 |
Lactobacillus paracasei |
-0.052383 |
0.3 |
0.662389 |
0.099017 |
Lactobacillus fermentum |
-0.047133 |
0.3 |
0.182245 |
0.111444 |
Staphylococcus aureus |
-0.046645 |
0.266667 |
0.190544 |
0.003756 |
Streptococcus sinensis |
-0.03878 |
0.2 |
0.124871 |
0.123921 |
Lactobacillus delbrueckii |
-0.036624 |
0.316667 |
0.034776 |
0.000525 |
Streptococcus salivarius |
-0.029187 |
0.25 |
4.33701 |
2.858201 |
Clostridium paraputrificum |
-0.024316 |
0.15 |
0.225459 |
0.042078 |
Bacteroides caccae |
-0.024235 |
0.15 |
0.209986 |
0.211941 |
Clostridium tertium |
-0.023736 |
0.183333 |
0.243511 |
0.010923 |
Bifidobacterium animalis |
-0.012494 |
0.15 |
0.226015 |
0.217978 |
Clostridium butyricum |
-0.012275 |
0.116667 |
0.172851 |
0.003612 |
Granulicatella adiacens |
-0.011808 |
0.133333 |
0.032141 |
0.016157 |
FWNZ_s (Genus Klebsiella) |
-0.011279 |
0.116667 |
1.046689 |
0.030994 |
Streptococcus gallolyticus |
-0.010265 |
0.183333 |
1.033063 |
0.269234 |
Enterobacteriaceae |
-0.009719 |
0.166667 |
1.469605 |
0.367475 |
Bifidobacterium breve |
-0.009272 |
0.183333 |
7.049017 |
1.053326 |
Clostridium perfringens |
-0.009186 |
0.1 |
0.152768 |
0.005388 |
Escherichia coli |
-0.007864 |
0.166667 |
6.548644 |
1.762086 |
Terrisporobacter petrolearius |
-0.006267 |
0.083333 |
0.025722 |
0.080401 |
Bacteroides vulgatus |
-0.005773 |
0.1 |
1.839026 |
1.638793 |
PAC001163_s (Genus Blautia) |
-0.004732 |
0.066667 |
0.336045 |
0.060607 |
KQ235774_s (Genus Klebsiella) |
-0.004721 |
0.05 |
0.113268 |
0.106438 |
Sutterella wadsworthensis |
-0.004474 |
0.05 |
0.027164 |
0.112334 |
Clostridium ramosum |
-0.002546 |
0.05 |
0.713797 |
0.236914 |
Bacteroides dorei |
-0.001847 |
0.033333 |
0.2586 |
1.951592 |
Prevotella copri |
-0.001655 |
0.016667 |
0.087912 |
0.017899 |
Veillonella atypica |
-0.001547 |
0.033333 |
0.447658 |
0.065735 |
Citrobacter koseri |
-0.001237 |
0.016667 |
0.041994 |
0.023602 |
CP011914_s (Genus Eubacterium) |
-0.00086 |
0.016667 |
0.013024 |
0.033725 |
Clostridium celatum |
-0.000719 |
0.016667 |
0.598248 |
1.369989 |
PAC001178_s (Genus Epulopiscium) |
-0.000559 |
0.016667 |
0.284282 |
0.030382 |
Collinsella aerofaciens |
-0.000549 |
0.016667 |
0.210585 |
0.184206 |
Leuconostoc lactis |
-0.000532 |
0.016667 |
0.033191 |
0.012436 |
Bacteroides uniformis |
-0.000289 |
0.033333 |
0.091656 |
1.41397 |
발달단계 1과 관련된 속(Genus) 수준 바이오마커(1차)
시료번호(species level)(균종명) |
coefficients |
robustness |
균형군 비율(%) |
불균형군 비율(%) |
Enterococcus |
-0.205616 |
0.983333 |
9.101523 |
1.514777 |
Bifidobacterium |
-0.13326 |
0.983333 |
40.409598 |
14.897967 |
Streptococcus |
-0.078202 |
0.733333 |
6.331705 |
3.528536 |
Lactobacillus |
-0.04119 |
0.633333 |
2.375967 |
0.931366 |
Rothia |
-0.013894 |
0.283333 |
0.191178 |
0.00428 |
Veillonella |
-0.005144 |
0.15 |
5.807609 |
2.012367 |
Clostridioides |
-0.004674 |
0.066667 |
0.342586 |
0.10047 |
Enterobacteriaceae_g (Genus Enterobacteriaceae) |
-0.0043 |
0.1 |
1.469605 |
0.367475 |
Klebsiella |
-0.002829 |
0.066667 |
1.051937 |
0.031341 |
Actinomyces |
-0.001029 |
0.05 |
0.306497 |
0.029024 |
Clostridium |
-0.000232 |
0.016667 |
2.230602 |
1.767117 |
Staphylococcus |
-0.000149 |
0.033333 |
0.191791 |
0.003814 |
발달단계 2와 관련된 종(speceis) 수준 바이오마커(1차)
시료번호(species level)
(균종명)
|
coefficients
|
robustness
|
균형군 비율(%)
|
불균형군 비율(%)
|
Hungatella hathewayi |
0.000251 |
0.016667 |
0.094561 |
0.073049 |
Clostridium innocuum |
0.000519 |
0.016667 |
0.536483 |
0.496771 |
Blautia obeum |
0.000728 |
0.016667 |
0.025596 |
0.283337 |
Roseburia intestinalis |
0.000808 |
0.016667 |
0.033406 |
0.376978 |
Clostridium neonatale |
0.000935 |
0.066667 |
0.561752 |
0.061132 |
Bacteroides ovatus |
0.001029 |
0.016667 |
0.170532 |
1.268938 |
DQ799557_s (Genus Bacteroides) |
0.001128 |
0.016667 |
0.079239 |
0.269888 |
PAC001177_s (Family Lachnospiraceae) |
0.001172 |
0.1 |
0.095936 |
0.16772 |
Coprobacillus cateniformis |
0.001199 |
0.016667 |
0.032492 |
0.015334 |
LT907848_s (Genus Anaerobutyricum) |
0.001287 |
0.016667 |
0.180159 |
0.692164 |
PAC001143_s (Genus Eisenbergiella) |
0.001374 |
0.016667 |
0.012706 |
0.27321 |
PAC001046_s (Family Lachnospiraceae) |
0.001967 |
0.016667 |
0.000392 |
0.434514 |
PAC001305_s (Family Lachnospiraceae) |
0.001981 |
0.033333 |
0.000453 |
0.177736 |
Intestinibacter bartlettii |
0.001984 |
0.033333 |
0.534782 |
0.886648 |
Bacteroides xylanisolvens |
0.003104 |
0.05 |
0.043177 |
0.756637 |
CCMM_s (Family Erysipelotrichaceae) |
0.003396 |
0.1 |
0.126861 |
0.53309 |
KQ968618_s (Genus Akkermansia) |
0.003604 |
0.066667 |
0.000306 |
0.666025 |
Megasphaera micronuciformis |
0.003705 |
0.016667 |
0.033965 |
0.040222 |
Clostridium nexile |
0.003745 |
0.116667 |
0.591177 |
0.435947 |
Roseburia inulinivorans |
0.003771 |
0.05 |
0.035658 |
0.738106 |
Ruminococcus gnavus |
0.004187 |
0.183333 |
3.57294 |
2.883981 |
Eggerthella lenta |
0.005097 |
0.066667 |
0.143669 |
0.123881 |
Bifidobacterium adolescentis |
0.005224 |
0.05 |
0.006449 |
1.546615 |
Romboutsia timonensis |
0.005618 |
0.083333 |
0.666966 |
0.798258 |
Lactobacillus rogosae |
0.005688 |
0.083333 |
0.052894 |
0.563106 |
DQ799511_s (Genus Blautia) |
0.006537 |
0.066667 |
0.002242 |
0.054269 |
Clostridium clostridioforme |
0.008845 |
0.083333 |
0.124666 |
0.190663 |
Akkermansia muciniphila |
0.011069 |
0.183333 |
0.605722 |
1.20175 |
Cellulosilyticum lentocellum |
0.011502 |
0.066667 |
0.022776 |
0.037526 |
Parasutterella excrementihominis |
0.014228 |
0.1 |
0.001163 |
0.321641 |
Agathobaculum butyriciproducens |
0.015198 |
0.116667 |
0.000282 |
0.165948 |
Eubacterium hallii |
0.015404 |
0.2 |
0.094473 |
1.256658 |
Faecalimonas umbilicata |
0.016121 |
0.166667 |
0.049223 |
0.204978 |
LN913006_s (Genus Blautia) |
0.016775 |
0.133333 |
0.036213 |
0.425286 |
Ruminococcus bromii |
0.019532 |
0.183333 |
0.015017 |
0.603128 |
PAC001136_s (Genus Clostridium) |
0.021142 |
0.233333 |
0.004555 |
0.188245 |
Fusicatenibacter saccharivorans |
0.024694 |
0.216667 |
0.314287 |
1.907538 |
Ruminococcus faecis |
0.027194 |
0.15 |
0.124086 |
0.669968 |
Bifidobacterium catenulatum |
0.027944 |
0.316667 |
1.915472 |
5.482113 |
Faecalibacterium prausnitzii |
0.03736 |
0.383333 |
0.98172 |
9.068555 |
Bacteroides fragilis |
0.049211 |
0.5 |
1.637415 |
5.670545 |
Prevotella buccae |
0.049889 |
0.25 |
0.000156 |
0.560138 |
Blautia faecis |
0.05423 |
0.35 |
0.000464 |
0.520471 |
Sellimonas intestinalis |
0.054853 |
0.366667 |
0.032135 |
0.243094 |
Lactobacillus plantarum |
0.057454 |
0.4 |
0.600968 |
0.335825 |
PAC001048_s (Genus Ruminococcaceae) |
0.063003 |
0.35 |
0.002535 |
0.281593 |
Roseburia cecicola |
0.072292 |
0.383333 |
0.108276 |
0.459604 |
Clostridium spiroforme |
0.096748 |
0.383333 |
0.07068 |
0.044219 |
Veillonella ratti |
0.120458 |
0.7 |
1.346032 |
1.103508 |
Agathobacter rectalis |
0.133908 |
0.666667 |
0.057285 |
0.579458 |
Clostridium symbiosum |
0.13445 |
0.65 |
0.145693 |
0.118909 |
Anaerostipes hadrus |
0.171178 |
0.816667 |
0.304226 |
3.597979 |
Gemmiger formicilis |
0.175736 |
0.75 |
0.080487 |
1.546753 |
Alistipes onderdonkii |
0.202069 |
0.616667 |
0.000477 |
0.411531 |
Blautia hansenii |
0.271272 |
0.883333 |
0.151363 |
0.166795 |
PAC001148_s (Family Lachnospiraceae) |
0.28366 |
0.933333 |
0.271439 |
0.640186 |
Bifidobacterium bifidum |
0.309518 |
0.916667 |
0.87911 |
0.874891 |
Ruminococcus torques |
0.379602 |
0.866667 |
0.002731 |
0.228165 |
Blautia wexlerae |
0.660876 |
1 |
0.634202 |
6.432939 |
발달단계 2와 관련된 속(Genus) 수준 바이오마커(1차)
시료번호(species level)
(균종명)
|
coefficients
|
robustness
|
균형군 비율(%)
|
불균형군 비율(%)
|
Coprococcus_g2 (Family Lachnospiraceae) |
0.000345 |
0.033333 |
0.634298 |
0.518112 |
Prevotella |
0.000503 |
0.033333 |
0.728 |
1.326638 |
Agathobacter |
0.000716 |
0.066667 |
0.057737 |
0.59893 |
PAC000672_g (Family Ruminococcaceae) |
0.00116 |
0.033333 |
0.002775 |
0.282116 |
Pseudoflavonifractor |
0.001503 |
0.05 |
0.159467 |
0.221574 |
Lachnospira |
0.001773 |
0.016667 |
0.316929 |
1.607492 |
Eubacterium_g5 (Family Lachnospiraceae) |
0.001984 |
0.05 |
0.278224 |
2.044322 |
Alistipes |
0.00218 |
0.05 |
0.000794 |
0.539207 |
Clostridium_g24 (Family Lachnospiraceae) |
0.003903 |
0.1 |
0.479107 |
1.181915 |
Akkermansia |
0.004259 |
0.1 |
0.607531 |
1.890071 |
Ruminococcus_g5 (Family Lachnospiraceae) |
0.005001 |
0.133333 |
3.606215 |
2.937409 |
Roseburia |
0.021967 |
0.416667 |
0.179598 |
1.660123 |
Fusicatenibacter |
0.022191 |
0.366667 |
0.317638 |
1.958465 |
Sellimonas |
0.0305 |
0.5 |
0.033008 |
0.279463 |
Ruminococcus_g2 (Family Ruminococcaceae) |
0.033029 |
0.483333 |
0.020473 |
1.177464 |
Bacteroides |
0.03449 |
0.7 |
4.901392 |
16.590086 |
Eisenbergiella |
0.036326 |
0.4 |
0.042349 |
0.415958 |
Subdoligranulum |
0.043866 |
0.65 |
0.145427 |
1.898761 |
Ruminococcus_g4 (Family Lachnospiraceae) |
0.054933 |
0.683333 |
0.178463 |
1.097635 |
Anaerostipes |
0.146638 |
0.883333 |
0.552492 |
3.926105 |
Faecalibacterium |
0.153494 |
0.95 |
0.98321 |
9.194765 |
Blautia |
0.326798 |
1 |
1.464729 |
8.879734 |
4-5. 발달 단계 예측 모델을 이용한 미생물의 특징적 선택(2차)
상기 실시예 4-4의 방법으로 1차적으로 선택한 특징적 바이오마커를, 상기 실시예 3-4에 기재된 방법으로 보정을 수행하였다. 구체적으로, 상기 표 6의 발달단계 1 특이적 종 수준 바이오마커 중, 발달단계 2에서 미생물 분류군의 군집 규모가 더 높은 비율로 나타난 Bacteroides caccae, Terrisporobacter pertrolearius 등 총 7개 미생물 종을 제외하였다. 또한 상기 표 8의 발달단계 2 특이적 바이오마커 중 발달단계 1에서 미생물 분류군의 군집 규모가 더 높은 비율로 나타난 Lachnospiraceae 과 미발표종, Clostridium innocuum, Hungatella hathewayi 등의 총 14개 미생물 종을 제외하였다.
상기 제외된 미생물 분류군를 고려하여, 발달 단계별 특징적 바이오마커를 하기 표 10 내지 표 13에 나타내었다. 하기 표 10 내지 표 13의 바이오마커는 영유아의 장내 미생물 군집의 발달 단계를 구분하는 바이오마커로서 2차로 선정된 최종 바이오마커이다. 발달단계 1에 특이적 바이오마커는 Species level 37개 분류군, Genus level 동정 미생물이 12개 분류군으로 이루어져 있고, 발달단계 2 특이적 바이오마커는 Species level 47개 분류군, Genus level 20개 분류군으로 이루어져 있다. 표 11 및 표 13에서 기재된 (Genus) 수준 바이오마커라 함은 미생물 바이오마커의 종(speies)가 구분되나, 구체적으로 동정이 종 수준까지 수행되지 않은 것으로서, 실질적으로 species 수준에서 구별되는 미생물 바이오마커임을 의미한다.
발달단계 1과 관련된 바이오마커(2차)
시료번호(species level)(균종명) |
coefficients |
robustness |
균형군 비율(%) |
불균형군 비율(%) |
Enterococcus faecalis |
-0.618223 |
1 |
1.885624 |
0.01247 |
Streptococcus peroris |
-0.497649 |
0.95 |
0.414597 |
0.014475 |
Bifidobacterium longum |
-0.314397 |
1 |
28.477828 |
4.755615 |
Bifidobacterium scardovii |
-0.244088 |
0.916667 |
1.498041 |
0.681195 |
Enterococcus faecium |
-0.201899 |
0.95 |
7.106151 |
1.48029 |
Rothia mucilaginosa |
-0.152262 |
0.533333 |
0.177708 |
0.001652 |
Veillonella parvula |
-0.129975 |
0.716667 |
0.876127 |
0.032537 |
Clostridioides difficile |
-0.061403 |
0.35 |
0.331878 |
0.100077 |
Veillonella dispar |
-0.056745 |
0.5 |
2.840242 |
0.776448 |
Bifidobacterium pseudolongum |
-0.055155 |
0.333333 |
0.102172 |
0.032258 |
Lactobacillus paracasei |
-0.052383 |
0.3 |
0.662389 |
0.099017 |
Lactobacillus fermentum |
-0.047133 |
0.3 |
0.182245 |
0.111444 |
Staphylococcus aureus |
-0.046645 |
0.266667 |
0.190544 |
0.003756 |
Streptococcus sinensis |
-0.03878 |
0.2 |
0.124871 |
0.123921 |
Lactobacillus delbrueckii |
-0.036624 |
0.316667 |
0.034776 |
0.000525 |
Streptococcus salivarius |
-0.029187 |
0.25 |
4.33701 |
2.858201 |
Clostridium paraputrificum |
-0.024316 |
0.15 |
0.225459 |
0.042078 |
Clostridium tertium |
-0.023736 |
0.183333 |
0.243511 |
0.010923 |
Bifidobacterium animalis |
-0.012494 |
0.15 |
0.226015 |
0.217978 |
Clostridium butyricum |
-0.012275 |
0.116667 |
0.172851 |
0.003612 |
Granulicatella adiacens |
-0.011808 |
0.133333 |
0.032141 |
0.016157 |
FWNZ_s (Genus Klebsiella) |
-0.011279 |
0.116667 |
1.046689 |
0.030994 |
Streptococcus gallolyticus |
-0.010265 |
0.183333 |
1.033063 |
0.269234 |
Enterobacteriaceae |
-0.009719 |
0.166667 |
1.469605 |
0.367475 |
Bifidobacterium breve |
-0.009272 |
0.183333 |
7.049017 |
1.053326 |
Clostridium perfringens |
-0.009186 |
0.1 |
0.152768 |
0.005388 |
Escherichia coli |
-0.007864 |
0.166667 |
6.548644 |
1.762086 |
Bacteroides vulgatus |
-0.005773 |
0.1 |
1.839026 |
1.638793 |
PAC001163_s (Genus Blautia) |
-0.004732 |
0.066667 |
0.336045 |
0.060607 |
KQ235774_s (Genus Klebsiella) |
-0.004721 |
0.05 |
0.113268 |
0.106438 |
Clostridium ramosum |
-0.002546 |
0.05 |
0.713797 |
0.236914 |
Prevotella copri |
-0.001655 |
0.016667 |
0.087912 |
0.017899 |
Veillonella atypica |
-0.001547 |
0.033333 |
0.447658 |
0.065735 |
Citrobacter koseri |
-0.001237 |
0.016667 |
0.041994 |
0.023602 |
PAC001178_s (Genus Epulopiscium) |
-0.000559 |
0.016667 |
0.284282 |
0.030382 |
Collinsella aerofaciens |
-0.000549 |
0.016667 |
0.210585 |
0.184206 |
Leuconostoc lactis |
-0.000532 |
0.016667 |
0.033191 |
0.012436 |
발달단계 1과 관련된 속(Genus) 수준 바이오마커(2차)
시료번호(species level)(균종명) |
coefficients |
robustness |
균형군 비율(%) |
불균형군 비율(%) |
Enterococcus |
-0.205616 |
0.983333 |
9.101523 |
1.514777 |
Bifidobacterium |
-0.13326 |
0.983333 |
40.409598 |
14.897967 |
Streptococcus |
-0.078202 |
0.733333 |
6.331705 |
3.528536 |
Lactobacillus |
-0.04119 |
0.633333 |
2.375967 |
0.931366 |
Rothia |
-0.013894 |
0.283333 |
0.191178 |
0.00428 |
Veillonella |
-0.005144 |
0.15 |
5.807609 |
2.012367 |
Clostridioides |
-0.004674 |
0.066667 |
0.342586 |
0.10047 |
Enterobacteriaceae_g (Genus Enterobacteriaceae) |
-0.0043 |
0.1 |
1.469605 |
0.367475 |
Klebsiella |
-0.002829 |
0.066667 |
1.051937 |
0.031341 |
Actinomyces |
-0.001029 |
0.05 |
0.306497 |
0.029024 |
Clostridium |
-0.000232 |
0.016667 |
2.230602 |
1.767117 |
Staphylococcus |
-0.000149 |
0.033333 |
0.191791 |
0.003814 |
발달단계 2와 관련된 종(speceis) 수준 바이오마커(2차)
시료번호(species level)
(균종명)
|
coefficients
|
robustness
|
균형군 비율(%)
|
불균형군 비율(%)
|
Blautia obeum |
0.000728 |
0.016667 |
0.025596 |
0.283337 |
Roseburia intestinalis |
0.000808 |
0.016667 |
0.033406 |
0.376978 |
Bacteroides ovatus |
0.001029 |
0.016667 |
0.170532 |
1.268938 |
DQ799557_s (Genus Bacteroides) |
0.001128 |
0.016667 |
0.079239 |
0.269888 |
PAC001177_s (Family Lachnospiraceae) |
0.001172 |
0.1 |
0.095936 |
0.16772 |
LT907848_s (Genus Anaerobutyricum) |
0.001287 |
0.016667 |
0.180159 |
0.692164 |
PAC001143_s (Genus Eisenbergiella) |
0.001374 |
0.016667 |
0.012706 |
0.27321 |
PAC001046_s (Family Lachnospiraceae) |
0.001967 |
0.016667 |
0.000392 |
0.434514 |
PAC001305_s (Family Lachnospiraceae) |
0.001981 |
0.033333 |
0.000453 |
0.177736 |
Intestinibacter bartlettii |
0.001984 |
0.033333 |
0.534782 |
0.886648 |
Bacteroides xylanisolvens |
0.003104 |
0.05 |
0.043177 |
0.756637 |
CCMM_s (Family Erysipelotrichaceae) |
0.003396 |
0.1 |
0.126861 |
0.53309 |
KQ968618_s (Genus Akkermansia) |
0.003604 |
0.066667 |
0.000306 |
0.666025 |
Megasphaera micronuciformis |
0.003705 |
0.016667 |
0.033965 |
0.040222 |
Roseburia inulinivorans |
0.003771 |
0.05 |
0.035658 |
0.738106 |
Bifidobacterium adolescentis |
0.005224 |
0.05 |
0.006449 |
1.546615 |
Romboutsia timonensis |
0.005618 |
0.083333 |
0.666966 |
0.798258 |
Lactobacillus rogosae |
0.005688 |
0.083333 |
0.052894 |
0.563106 |
DQ799511_s (Genus Blautia) |
0.006537 |
0.066667 |
0.002242 |
0.054269 |
Clostridium clostridioforme |
0.008845 |
0.083333 |
0.124666 |
0.190663 |
Akkermansia muciniphila |
0.011069 |
0.183333 |
0.605722 |
1.20175 |
Cellulosilyticum lentocellum |
0.011502 |
0.066667 |
0.022776 |
0.037526 |
Parasutterella excrementihominis |
0.014228 |
0.1 |
0.001163 |
0.321641 |
Agathobaculum butyriciproducens |
0.015198 |
0.116667 |
0.000282 |
0.165948 |
Eubacterium hallii |
0.015404 |
0.2 |
0.094473 |
1.256658 |
Faecalimonas umbilicata |
0.016121 |
0.166667 |
0.049223 |
0.204978 |
LN913006_s (Genus Blautia) |
0.016775 |
0.133333 |
0.036213 |
0.425286 |
Ruminococcus bromii |
0.019532 |
0.183333 |
0.015017 |
0.603128 |
PAC001136_s (Genus Clostridium) |
0.021142 |
0.233333 |
0.004555 |
0.188245 |
Fusicatenibacter saccharivorans |
0.024694 |
0.216667 |
0.314287 |
1.907538 |
Ruminococcus faecis |
0.027194 |
0.15 |
0.124086 |
0.669968 |
Bifidobacterium catenulatum |
0.027944 |
0.316667 |
1.915472 |
5.482113 |
Faecalibacterium prausnitzii |
0.03736 |
0.383333 |
0.98172 |
9.068555 |
Bacteroides fragilis |
0.049211 |
0.5 |
1.637415 |
5.670545 |
Prevotella buccae |
0.049889 |
0.25 |
0.000156 |
0.560138 |
Blautia faecis |
0.05423 |
0.35 |
0.000464 |
0.520471 |
Sellimonas intestinalis |
0.054853 |
0.366667 |
0.032135 |
0.243094 |
PAC001048_s (Genus Lachnospiraceae) |
0.063003 |
0.35 |
0.002535 |
0.281593 |
Roseburia cecicola |
0.072292 |
0.383333 |
0.108276 |
0.459604 |
Agathobacter rectalis |
0.133908 |
0.666667 |
0.057285 |
0.579458 |
Anaerostipes hadrus |
0.171178 |
0.816667 |
0.304226 |
3.597979 |
Gemmiger formicilis |
0.175736 |
0.75 |
0.080487 |
1.546753 |
Alistipes onderdonkii |
0.202069 |
0.616667 |
0.000477 |
0.411531 |
Blautia hansenii |
0.271272 |
0.883333 |
0.151363 |
0.166795 |
PAC001148_s (Family Lachnospiraceae) |
0.28366 |
0.933333 |
0.271439 |
0.640186 |
Ruminococcus torques |
0.379602 |
0.866667 |
0.002731 |
0.228165 |
Blautia wexlerae |
0.660876 |
1 |
0.634202 |
6.432939 |
발달단계 2와 관련된 속(Genus) 수준 바이오마커(2차)
시료번호(species level)
(균종명)
|
coefficients
|
robustness
|
균형군 비율(%)
|
불균형군 비율(%)
|
Prevotella |
0.000503 |
0.033333 |
0.728 |
1.326638 |
Agathobacter |
0.000716 |
0.066667 |
0.057737 |
0.59893 |
PAC000672_g (Family Ruminococcaceae) |
0.00116 |
0.033333 |
0.002775 |
0.282116 |
Pseudoflavonifractor |
0.001503 |
0.05 |
0.159467 |
0.221574 |
Lachnospira |
0.001773 |
0.016667 |
0.316929 |
1.607492 |
Eubacterium_g5 (Family Lachnospiraceae) |
0.001984 |
0.05 |
0.278224 |
2.044322 |
Alistipes |
0.00218 |
0.05 |
0.000794 |
0.539207 |
Clostridium_g24 (Family Lachnospiraceae) |
0.003903 |
0.1 |
0.479107 |
1.181915 |
Akkermansia |
0.004259 |
0.1 |
0.607531 |
1.890071 |
Roseburia |
0.021967 |
0.416667 |
0.179598 |
1.660123 |
Fusicatenibacter |
0.022191 |
0.366667 |
0.317638 |
1.958465 |
Sellimonas |
0.0305 |
0.5 |
0.033008 |
0.279463 |
Ruminococcus_g2 (Family Ruminococcaceae) |
0.033029 |
0.483333 |
0.020473 |
1.177464 |
Bacteroides |
0.03449 |
0.7 |
4.901392 |
16.590086 |
Eisenbergiella |
0.036326 |
0.4 |
0.042349 |
0.415958 |
Subdoligranulum |
0.043866 |
0.65 |
0.145427 |
1.898761 |
Ruminococcus_g4 (Family Lachnospiraceae) |
0.054933 |
0.683333 |
0.178463 |
1.097635 |
Anaerostipes |
0.146638 |
0.883333 |
0.552492 |
3.926105 |
Faecalibacterium |
0.153494 |
0.95 |
0.98321 |
9.194765 |
Blautia |
0.326798 |
1 |
1.464729 |
8.879734 |
4-6. 영유아 발달 단계 예측 모델의 검증
상기 실시예 3-5의 방법을 이용하여, 영유아 발달 단계를 학습한 최적화 기계 학습 모델이 실제로 영유아 발달 단계를 정확하게 구별하는지 살펴보았다.
최적화 기계 학습 모델이 Test set에 대한 발달 단계를 판정한 결과의 ROC 곡선 (receiver operating characteristic curve) 및 AUC (area under curve) 그래프를 도 6에 나타내었다. ROC 곡선이 활 모양으로 크게 굽어져 있고, AUC는 0.98로 1에 가까운 값을 보이므로 상기 실시예 4-3에서 영유아 발달 단계를 예측한 결과가 유의미함을 확인하였다.
4-7. 영유아 발달 단계의 판별 지수
상기 실시예 4-6의 예측 결과에 정확한 임상적 해석을 부여하기 위해, 상기 실시예 3-6과 실질적으로 동일한 방법으로, 각 바이오마커 미생물의 군집 규모 비율과 Coefficient의 내적곱으로 계산한 0과 1사이의 확률값을, 학습에 사용한 발달단계 1과 발달단계 2의 비율로 나눠 리스케일하였다.
상기 수학식 7에서,
는 발달단계 2의 판별을 위한 시험 대상의 예측 점수이고, P
0 는 예측 모델 구축에 사용된 training set에 존재하는 발달단계 2에 해당하는 샘플의 비율이며, N
case 는 training set 내 발달단계 2에 해당하는 샘플의 수이고, N
train 은 training set의 전체 샘플 수이다. 이렇게 계산된 지수는 '영유아 발달 지수'로 명명하였다.
상기 영유아 발달 지수를 통해 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy) 값을 확인하였다. 상기 수학식 8 내지 10에서, FP는 발달단계 1에 해당하는 시료에서 영유아 발달 지수(
)가 cut-off보다 큰 경우의 수이고, FN은 발달단계 1에 해당하는 시료에서 영유아 발달 지수(
)가 cut-off보다 작은 경우의 수이고, TP는 발달단계 2에 해당하는 시료에서 영유아 발달 지수(
)가 cut-off보다 큰 경우의 수이고, TN은 발달단계 2에 해당하는 시료에서 영유아 발달 지수(
)가 cut-off보다 작은 경우의 수이고, 이러한 결과를 도 6에 나타내었다.
정확도가 약 98%로 계산된 가장 높은 지수 1.19를 기준으로 영유아 발달 단계를 판별할 경우, 발달단계 2를 정확하게 맞추는 특이도는 약 98%, 영유아 발달단계 1을 정확하게 판단하는 민감도는 약 97%이다. 해당 정확도 그래프를 도 6에 나타내었다.
영유아 발달 지수 1.19를 기준으로 장내 미생물 불균형 여부를 판별할 때, 특이도는 약 98%로 발달 단계를 정확하게 구별할 수 있으므로 임상학적으로 높은 판별능을 보이는 것을 알 수 있다. 따라서, 영유아 발달 지수가 1.19 이상인 경우, 발달단계 2로 판별할 수 있으며, 1.19 미만으로 계산되는 경우, 발달단계 1로 판별할 수 있다.
4-8. 영유아 장내 미생물 발달 단계의 구분
(A) 영유아 발달 단계의 구분 개요
영유아 발달 단계는 식이단계, 월령 및 영유아 발달 지수 (장내 미생물 군집의 정보에 기초)로 이루어지는 군에서 선택된 1종 이상의 기준으로 판별할 수 있다. 상기 영유아 발달 지수는 하기 표 10 내지 표 13의 바이오마커는 영유아의 장내 미생물 군집의 발달 단계를 구분하는 바이오마커로서 2차로 선정된 최종 바이오마커를 활용한 것이다. 하기 표 14에 각 발달 단계 판별 기준에 따른 발달 단계 판별 방법을 요약하였다.
영유아 발달 단계 판별 기준
구분
|
발달단계 1 |
발달단계 2 |
식이 단계 |
수유식(액상 식이)이유식(겔상 식이) |
고형 식이 |
생후 개월수(월령) |
15개월 미만 |
15개월 이상 |
영유아 발달 지수 |
발달 지수 1.19 미만 |
발달 지수 1.19 이상 |
(B) 식이단계를 이용한 영유아 발달 단계의 구분
식이단계를 통한 영유아 발달 단계 판별은, 영유아가 섭취하는 식이를 액상의 수유식, 겔상의 이유식, 고형의 유아식 및 고형의 일반식으로 분류하고, 영유아의 메타데이타 정보 (식이)에 근거하여 액상의 수유식 또는 겔상의 이유식 식이 단계를 발달단계 1로, 고형 식이 즉 유아식 또는 일반식을 섭취하는 단계를 발달단계 2로 분류하는 방법이다. 따라서 액상 또는 겔상의 수유식 또는 이유식에서 고형의 식이를 섭취하는 시점을 판단 기준으로 삼는다.
(C) 월령을 이용한 영유아 발달 단계의 구분
생후 개월수(월령)를 기준으로 한 발달 단계 판별의 경우, 영유아의 메타데이타 정보 (영유아의 월령)에 근거하여, 조사 대상 영유아의 월령이 15개월 미만인 경우 발달단계 1로, 월령이 15개월 이상인 경우 발달단계 2로 판별한다.
15개월이라는 기준 시기는 식이 형태가 겔상에서 고형으로 전환되는 시기이며, 실시예 4-2의 DMM clustering 방법을 통해 그룹이 분류되는 시기이다. 영유아의 장내 미생물 생태계는 특정 시점, 예를 들면 15개월을 기점으로 미생물 종류, 미생물 종의 양, 미생물 종의 다양성이 가장 크게 변한다. 출생 직후부터 15개월까지는 면역, 모유의 소화 및 장내 안정화 등에 기여하는 미생물 종으로 이루어져 있으며, 15개월 이후로 식이섬유 등 다양한 음식물의 대사와 관련된 미생물 종이 늘어나고 종 다양성이 큰 폭으로 증가한다.
(D) 발달단계 특이적 바이오마커를 이용한 영유아 발달 단계의 구분
영유아 발달 지수를 기준으로 하는 경우, 수집된 장내 미생물의 군집 분석 데이터에 근거하여 각 발달 단계에 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 상술한 영유아 발달 단계 예측 모델에 적용함으로써 발달 단계를 판별하는 방법이다. 각 발달 단계에 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 발달지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 발달지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 발달단계 1로 선정하고, 설정값 이상인 경우를 발달단계 2로 선정한다.
본 실험에서는, 상기 실시예 4-7에 의해, 발달지수 1.19를 기준으로 1.19 미만인 경우 발달단계 1로, 발달지수 1.19 이상인 경우 발달단계 2로 판별한다.
설문의 응답에 의존하는 식이 단계 및 생후 개월 수를 기준으로 발달 단계를 판별하는 경우, 상기 표 2의 문항을 포함하는 형태의 설문에 대한 응답이 선행되어야 한다. 영유아 발달 지수를 기준으로 한 판별의 경우, 실시예 2의 방법을 이용한 장내 미생물 분석이 선행되어야 한다.
영유아 장내 미생물 생태계는 부모 및 주변 환경에 상주하는 미생물들이 무균 상태의 신생아에 전달되어 정착해 나감으로써 형성되고, 영유아의 성장과 식이에 따라 영유아 장내의 종 풍부도 및 다양성이 증가한다. 이러한 증가 추세에서, 영유아 발달 단계 특이적 바이오마커는 영유아의 성장에 따른 장내 미생물 생태계의 발달 양상을 구체적으로 나타낸다. 영유아의 발달단계 1에 특이적인 바이오마커는 상기 표 10 및 표 11에 기재되어 있고, 발달단계 2에 특이적인 바이오마커는 상기 표 12 및 표 13에 기재되어 있다.
발달단계 1에 특이적인 바이오마커 중 Enterococcus, Streptococcus, 및 Lactobacillus는 Firmicutes 문(phylum)에 포함되고, Bifidobacterium은 Actinobacteria 문(phylum)에 포함되는 미생물이다. 상기 Enterococcus, Bifidobacterium, Streptococcus, 및 Lactobacillus는 모두 유산균으로, 유산균은 산모의 신체로부터 자녀로 전달되어 가장 먼저 무균 상태의 신생아의 장에 정착하는 미생물로, 다른 미생물보다 장내 환경에 용이하게 정착한 뒤, 항균 물질을 분비하여 다양한 외부 항원의 정착을 막는 역할을 한다. 또한 발달단계 1에 특이적인 종 수준 바이오마커 중 하나인 Bifidobacterium longum의 경우에는, 외부 항원에서 나타나는 단백질 가수분해 효소를 세르핀이라는 물질로 저해하는 기작으로 면역력에 기여한다. 무엇보다, 유산균은 유당을 분해하는 미생물로, 영유아가 모유를 잘 소화할 수 있도록 돕는 역할이 가장 크다. phylum Proteobacteria에 포함되는 대장균 계열(Escherichia)의 경우, 유산균이 전해지기 전, 태변에서 가장 많이 발견되는 미생물로, 신생아의 장내 환경에 가장 먼저 정착하여 장내의 산소를 흡수함으로써 장내를 혐기성 환경으로 조성하여, 안정화에 도움을 준다.
발달단계 2에 특이적인 바이오마커는 크게 Blautia, Faecalibacterium, Anaerostipes을 비롯한 phylum firmicutes 계열과 Prevotella, Bacteroides의 phylum Bacteroidetes 계열로 나눌 수 있다.
장내 미생물 군집이 유산균 위주의 phylum Firmicutes, Actinobacteria(발달단계 1)에서 phylum Firmicutes, Bacteroidetes로 전환된 것을 알 수 있다. Phylum Firmicutes 및 Bacteroidetes가 장내 미생물 군집에서 두드러지는 양상은 성인에게서 가장 보편적으로 나타나는 특징이다. 이러한 양상은 영유아의 장내 미생물 생태계가 성인의 장내 환경과 비슷한 모습으로 발달하고 있는 것을 의미한다. 영유아가 신체적으로 성장하고, 필요로 하는 영양소가 다양해짐에 따라, 섭취하는 식품 또한 다양해지면서 장내 미생물 군집의 미생물 종과, 각각의 미생물 종들이 가진 대사적 다양성이 증가하게 된다.
발달단계 2에 특이적인 바이오마커의 구성은 상기 실시예 2-2에서 언급한 바와 같이 섬유질 대사와 관련된 짧은 사슬 지방산 생성균이 주를 이루고 있다. 특히, 발달단계 2의 Firmicutes 문의 경우, 대표적인 짧은 사슬 지방산의 생성균이 가장 많이 포함된 Clostridiales 목(order)의 미생물 종들(Blautia, Faecalibacterium, Anaerostipes)이 가장 높은 coefficient 값을 보인다.
Phylum Bacteroidetes의 genus Prevotella 및 Bacteroides는 식이섬유와 단백질을 분해하는 대표적인 미생물이다. 이 미생물들은 인종, 지역, 개인을 아우르는, 성인의 장 유형(enterotype)을 나누는 기준으로 2011년 학술지 nature를 통해 언급된 바 있다. 장 유형에 대한 후속 연구에서 주로 고식이섬유-저단백질 식습관에서 Prevotella가 나타나고, 저식이섬유(단순당)-고단백질 식습관에서 Bacteroides가 많이 나타나는 특징이 보고된 바 있다. 발달단계 2에서 Prevotella 및 Bacteroides가 가지는 coefficient 및 robustness 값을 보면, Bacteroides가 Prevotella에 비해 모두 높은 값을 보이고 있다. 이를 통해, 영유아의 장내 미생물 유형은 주로 Bacteroides 형으로 발달하는 것을 알 수 있다. 단, 아직 Prevotella 및 Bacteroides 유형을 정확히 규명하기에는 연구가 미흡한 실정이며, 영유아 장내 미생물에서 주로 나타나는 장 유형에 대한 해석의 여지 또한 아직 많다.
실시예 5. 영유아의 발달 단계 별 장내 미생물의 불균형 및 균형 구분
5-1. 발달 단계 별 장내 미생물 분석 데이터의 그룹화
상기 실시예 3-1의 DMM 클러스터링 방법에 따라, 장내 미생물 분석 데이터를 이용하여 발달 단계 별 영유아 샘플을 그룹화하였다. 각 발달 단계에서 2개 그룹이 나뉘었으며, 총 4개 그룹이 클러스터링되었다. 각 발달 단계 별 영유아 샘플은 다음과 같이 분포한다.
총 샘플 수: 120
발달 단계1 제1 그룹 샘플 수: 36
발달 단계1 제2 그룹 샘플 수: 33
발달 단계2 제 3 그룹 샘플 수: 32
발달 단계2 제 4 그룹 샘플 수: 19
5-2. 영유아 메타 데이터를 이용한 영유아 장내 미생물 불균형의 규정
장내 미생물 불균형 및 균형 관련 인자들과의 연관성을 계산하기 위해, Chong의 2018년 연구(Factors Affecting Gastrointestinal Microbiome Development in Neonates. Nutrients. 2018 Feb 28;10(3).)를 참고하였다.
장내 미생물 불균형은 일반적으로 생태계의 종 다양성을 낮아지게 하는 요인인 가공식품 섭취, 항생제 복용 등에 의해 일어나는 불균형 상태로 정의된다. 장내 미생물 균형 상태를 정의하는 뚜렷한 기준은 아직 없으나, 본 발명에서는 불균형 인자를 포함하지 않는 건강한 영유아 샘플의 장내 미생물 생태계를 균형 상태로 정의하였다. 따라서, 장내 미생물의 불균형군이라 함은 장내 불균형을 일으키는 메타 데이터와 연관되어 있는 장내 미생물 군집을 보유한 샘플군으로 정의하고, 균형군이라 함은 장내 불균형의 완화하는 메타 데이터와 연관되어 있는 장내 미생물 군집을 보유한 샘플군으로 정의한다. 장내 미생물 불균형 및 균형과 관련된 인자는 표 2의 설문지로 수집한 메타 데이터와 상기 Chong의 2018년 연구에서 언급한 항목을 참고하여 선정하였다. 신생아의 장내 미생물에 영향을 미치는 요인은 영유아의 나이, 항생제 복용 여부, 출산 형태, 수유 방법, 설사 유무 등이다. 표 15에 선정한 항목 및 답변에 따른 분류를 나타내었다.
장내 미생물 불균형 관련 인자 각각을 군집 좌표와 (permutational) MANOVA를 수행하여 P-value와 R2를 계산하였다. P-value가 낮고 R2가 높을수록 해당 인자와 군집 좌표의 상관관계가 높다고 볼 수 있다. 또한 각 장내 미생물 불균형 관련 인자들의 좌표 중심점을 계산하여 해당 인자와 양의 상관관계를 갖는 샘플들의 위치를 예측하였다. 위 분석들은 통계분석 프로그램 R의 vegan 패키지를 이용하여 계산하였다. 발달단계 1에 대한 P-value 및 R2값을 표 16에, 발달단계 1에 대한 메타 데이터의 방향성에 대한 계산 결과를 표 17에 나타내었으며, 발달단계 2에 대한 P-value 및 R2값은 표 18에, 발달단계 2에 대한 메타 데이터의 방향성에 대한 계산 결과는 표 19에 나타내었다.
하기 표 17 및 표 19에서, coord1 및 coord2는 각각의 그룹에 유의적으로 관련이 있는 장내 불균형 관련 인자의 좌표 상 화살표(correlation arrows)의 위치이다. coord1은 가로축의 좌표값을, coord2는 세로축의 좌표값을 의미한다. 좌표 상 화살표는 각 그룹과 연관된 정도에 따라 해당 방향과 길이로 나타난다.
발달단계 1에 대한 장내 미생물 불균형 관련 인자의 연관성
메타 데이터 종류 |
R2
|
P-value |
lactation_bf
|
0.040322
|
0.0599
|
age_month
|
0.070071
|
0.0918
|
birth_mode_natural |
0.018764 |
0.2866 |
Antibiotics |
0.007639 |
0.6059 |
Diarrhea |
0.0049 |
0.7248 |
발달단계 1에 대한 장내 미생물 불균형 관련 인자의 방향성
메타 데이터 종류 |
coord1 |
coord2 |
age_month |
0.017031 |
-0.26416 |
antibioticsFALSE |
0.001282 |
0.009315 |
antibioticsTRUE |
-0.004248 |
-0.030855 |
diarrheaFALSE |
-0.002856 |
-0.000619 |
diarrheaTRUE |
0.062828 |
0.013628 |
birth_mode_naturalFALSE |
0.020454 |
0.030504 |
birth_mode_naturalTRUE |
-0.010909 |
-0.016269 |
lactation_bfFALSE |
0.031211 |
-0.016939 |
lactation_bfTRUE |
-0.038259 |
0.020764 |
발달단계 2에 대한 장내 미생물 불균형 관련 인자의 연관성
메타 데이터 종류 |
R2 |
P-value |
antibiotics |
0.075639 |
0.0211 |
age_month |
0.118405 |
0.0482 |
birth_mode_natural |
0.058039 |
0.0489 |
diarrhea |
0.017417 |
0.4513 |
발달단계 2에 대한 장내 미생물 불균형 관련 인자의 방향성
메타 데이터 종류 |
coord1 |
coord2 |
age_month |
-0.097983 |
0.329856 |
antibioticsFALSE |
-0.03849 |
-0.022217 |
antibioticsTRUE |
0.070565 |
0.040732 |
diarrheaFALSE |
-0.005357 |
0.00231 |
diarrheaTRUE |
0.131238 |
-0.056605 |
birth_mode_naturalFALSE |
0.056386 |
0.028105 |
birth_mode_naturalTRUE |
-0.03947 |
-0.019673 |
도 7a 및 도 7b은 DMM 클러스터링 결과로 그룹화된 각 발달단계에 따라 장내 미생물 불균형 관련 인자의 좌표 상 화살표를 나타낸 그래프이다. 선정된 메타 데이터의 장내 미생물 불균형 관련 인자 중에서, 생후 개월수(age_month)는 표 16 및 표 18에서 R2값이 각각 0.070071과 0.118405로 다른 불균형 관련 인자에 비해 가장 높은 상관 관계를 보였다. 표 17과 표 19의 좌표값을 통해 도 7에서 나타난 바를 보더라도, 생후 개월수가 다른 인자들에 비해 가장 구별되어 있음을 알 수 있다. 이는 생후 개월수가 발달 단계에 가장 큰 영향을 미치는 요인이되, 발달 단계 내의 두 그룹을 나누는 기준이 아니라는 것을 의미한다. 즉, 월령은 장내 미생물 불균형에는 유의미한 영향을 미치지 않았다
도 7a 및 도 7b를 보면, 상기 실시예 3-2에 따라 구분된 발달단계 1(도 7a )과 발달단계 2(도 7b의 두 그룹은 각각 설사 유무, 항생제 복용 여부, 출산 방식, 모유 수유 여부의 좌표값과 연관되어 있는 것을 알 수 있다. 도 7a에 따르면, 실시예 3-2에 따라 나뉜 발달단계 1에서 모유 수유(lactation_bfTRUE), 자연 분만(birth_mode_naturalTRUE)의 좌표값이 항생제 복용(antibioticsTRUE), 설사(diarrheaTRUE) 좌표값에 비해 1그룹의 중심점을 향하고 있고, 2그룹의 중심점은 설사(diarrheaTRUE) 좌표값과 강한 연관을 보인다. 도 7의 B패널에 따르면 자연 분만(birth_mode_naturalTRUE)의 좌표값이 항생제 복용(antibioticsTRUE), 설사(diarrheaTRUE) 좌표값에 비해 1그룹의 중심점을 향하고 있고, 2그룹의 중심점은 항생제 복용(antibioticsTRUE) 및 설사(diarrheaTRUE) 좌표값과 강한 연관성을 보인다.
따라서, 발달단계 1과 발달단계 2에서 DMM 클러스터링에 의해 각각 그룹화된 두 그룹은 장내 미생물 분석 데이터뿐만 아니라, 장내 미생물 불균형 메타 데이터와 관련성이 강한 그룹이다. 특히, 장내 미생물 불균형을 일으키는 것으로 알려진 설사, 제왕절개, 항생제 복용, 분유 수유와 관련된 그룹은 장내 미생물 불균형과 관련된 그룹으로 규정할 수 있다. 또한, 동일한 발달 단계 내에서, 장내 미생물 불균형 관련 그룹과 구별되는 샘플군은 모유 수유, 자연 분만과 관련되어 있으므로 장내 균형과 관련된 그룹으로 규정할 수 있다. 장내 미생물 불균형 및 장내 균형과 강한 연관을 보이는 메타 데이터 인자를 표 20에 나타내었다.
발달 단계 |
균형여부 |
관련 메타 데이터 인자 |
coord1
|
coord2
|
발달단계 1 |
균형 그룹 |
birth_mode_naturalTRUE |
-0.010909 |
-0.016269 |
lactation_bfTRUE |
-0.038259 |
0.020764 |
불균형 그룹 |
diarrheaTRUE |
0.062828 |
0.013628 |
antibioticsTRUE |
-0.004248 |
-0.030855 |
발달단계 2 |
균형 그룹 |
birth_mode_naturalTRUE |
-0.03947 |
-0.019673 |
불균형 그룹 |
diarrheaTRUE |
0.131238 |
-0.056605 |
antibioticsTRUE |
0.070565 |
0.040732 |
5-3. 발달 단계 별 기계 학습 모델의 적용
상기 실시예 3-2에 따라, 상기 규정한 발달 단계 별 장내 미생물 불균형 및 균형 그룹의 장내 미생물 분석 데이터를 기계 학습에 적용하였다. 모델의 하이퍼파라미터에 해당하는 정규화 파라미터 즉, 본 발명에 따른 최적화된 영유아 장내 미생물 불균형 예측 모델은 상기 수학식 1의
값 중 가장 좋은 예측 결과를 보이는 값을 통해 선택한다. 발달단계 1에서 불균형 여부를 판별하는 최적화 예측 결과값은 0.05, 발달단계 2의 최적화 예측 결과값은 100으로 확정하였다.
5-4. 장내 미생물 불균형 예측 모델을 이용한 바이오마커의 특징적 선택(1차)
1차 특징적 선택으로 나타난 장내 균형군과 관련된 바이오마커는 종 수준(Species level)에서 31개, 속 수준(Genus level)에서 26개 분류군으로 나타났다. 반면, 불균형군과 관련된 바이오마커는 종 수준(Species level)에서 26개, 속 수준(Genus level)에서 24개 분류군이다. 표 21 내지 표 28에는 균형군과 관련된 종 수준 바이오마커 및 균형군과 관련된 속 수준 바이오마커, 불균형군과 관련된 종 수준 바이오마커, 불균형군과 관련된 속 수준 바이오마커의 종류를 발달 단계 별로 각각 표시하였다.
하기 표 21 내지 28에서, 상기 실시예 3-4와 마찬가지로, coefficient 는 수학식 4의 β를 계산하여 얻고, 음수값일 경우 균형군에 특이적인 미생물임을 의미하며, 양수값일 경우 불균형군에 특이적인 미생물임을 의미한다. robustness 는 100번 반복 수행한 부트스트랩 결과를 통해 해당 미생물이 해당 결과로 나타난 경우를 계산하여 얻고, 1에 가까울수록 반복적으로 해당 그룹에 특이적인 결과임을 의미한다. 또한, 균형군 비율과 불균형 비율은 각각 동정된 전체 미생물의 총 reads 수에 대비하여 해당 미생물이 차지하는 reads 수를 통해 비율을 계산하여 얻고, 군집 규모(population)를 의미한다.
균형군과 관련된 종 수준 바이오마커(발달단계 1)
시료번호(species level)(균종명) |
coefficients |
robustness |
균형군 비율(%) |
불균형군 비율(%) |
Bifidobacterium longum |
-0.070612 |
0.933333 |
51.243026 |
21.23793 |
Lactobacillus gasseri |
-0.031707 |
0.616667 |
1.055237 |
0.22722 |
Streptococcus peroris |
-0.023587 |
0.4 |
0.814519 |
0.221563 |
Bifidobacterium bifidum |
-0.011173 |
0.3 |
1.745036 |
0.563617 |
Enterococcus faecalis |
-0.011012 |
0.3 |
3.588835 |
1.564981 |
Streptococcus pneumonia |
-0.007745 |
0.166667 |
0.203145 |
0.075435 |
Bifidobacterium breve |
-0.005682 |
0.216667 |
8.686701 |
7.201174 |
Rothia mucilaginosa |
-0.001013 |
0.033333 |
0.397782 |
0.075418 |
Streptococcus salivarius |
-0.000717 |
0.016667 |
4.78868 |
2.924272 |
Anaerostipes hadrus |
-0.00063 |
0.033333 |
0.266833 |
0.03419 |
Enterococcus faecium |
-0.000245 |
0.033333 |
6.333801 |
4.757783 |
Eggerthella lenta |
-0.000058 |
0.016667 |
0.189416 |
0.074407 |
균형군과 관련된 속 수준 바이오마커(발달단계 1)
시료번호(genus level)(균종명) |
coefficients |
robustness |
균형군 비율(%) |
불균형군 비율(%) |
Bifidobacterium |
-0.168201 |
1 |
62.580789 |
33.045218 |
Enterococcus |
-0.001554 |
0.083333 |
10.041681 |
6.371829 |
Akkermansia |
-0.000945 |
0.016667 |
0.212773 |
1.174082 |
Rothia |
-0.000901 |
0.05 |
0.407708 |
0.084993 |
Eggerthella |
-0.000268 |
0.016667 |
0.202414 |
0.076959 |
Lactobacillus |
-0.000171 |
0.016667 |
2.804877 |
2.013835 |
Ruminococcus_g5 (Family Ruminococcaceae) |
-0.000124 |
0.016667 |
0.727894 |
3.103867 |
Anaerostipes |
-0.000071 |
0.016667 |
0.30337 |
0.157415 |
불균형군과 관련된 종(speceis)수준 바이오마커(발달단계 1)
시료번호(species level)
(균종명)
|
coefficients
|
robustness
|
균형군 비율(%)
|
불균형군 비율(%)
|
FWNZ_s (Genus Klebsiella) |
0.000031 |
0.016667 |
0.149975 |
1.899234 |
Flavonifractor plautii |
0.000576 |
0.033333 |
0.005163 |
0.229055 |
Streptococcus gallolyticus |
0.001891 |
0.1 |
0.243751 |
1.754617 |
Clostridium neonatale |
0.002055 |
0.116667 |
0.010955 |
1.006057 |
Clostridioides difficile |
0.010121 |
0.25 |
0.091256 |
0.578815 |
Veillonella ratti |
0.017467 |
0.333333 |
0.561349 |
2.445463 |
Escherichia coli |
0.018013 |
0.316667 |
4.687128 |
9.505538 |
Clostridium paraputrificum |
0.021838 |
0.333333 |
0.042032 |
0.510855 |
Bacteroides vulgatus |
0.036621 |
0.6 |
0.140871 |
5.123635 |
Veillonella atypica |
0.063393 |
0.716667 |
0.043712 |
1.088948 |
Veillonella dispar |
0.171471 |
1 |
0.529256 |
4.334027 |
불균형군과 관련된 속(Genus) 수준 바이오마커(발달단계 1)
시료번호(genus level)
(균종명)
|
coefficients
|
robustness
|
균형군 비율(%)
|
불균형군 비율(%)
|
Pseudoflavonifractor |
0.00372 |
0.116667 |
0.009344 |
0.250999 |
Clostridioides |
0.007392 |
0.183333 |
0.116913 |
0.580252 |
Escherichia |
0.016107 |
0.35 |
4.706873 |
9.535802 |
Clostridium_g24 (Family Lachnospiraceae) |
0.016223 |
0.333333 |
0.052884 |
0.366841 |
Clostridium |
0.027992 |
0.566667 |
0.441519 |
3.809211 |
Bacteroides |
0.039796 |
0.65 |
2.059269 |
8.545303 |
Veillonella |
0.365429 |
1 |
1.498936 |
9.707073 |
균형군과 관련된 종 수준 바이오마커(발달단계 2)
시료번호(species level)
(균종명)
|
coefficients
|
robustness
|
균형군 비율(%)
|
불균형군 비율(%)
|
Fusicatenibacter saccharivorans |
-0.113431 |
0.716667 |
2.451463 |
0.770204 |
Faecalibacterium prausnitzii |
-0.067313 |
0.7 |
11.303225 |
4.18633 |
Blautia faecis |
-0.052685 |
0.433333 |
0.815303 |
0.01675 |
Bifidobacterium catenulatum |
-0.045657 |
0.483333 |
5.608016 |
2.749555 |
Anaerostipes hadrus |
-0.031165 |
0.3 |
4.493286 |
1.038971 |
Gemmiger formicilis |
-0.029734 |
0.45 |
1.934029 |
0.552129 |
Eubacterium eligens |
-0.016785 |
0.166667 |
0.841646 |
0.085065 |
Blautia wexlerae |
-0.010245 |
0.083333 |
5.646432 |
2.316964 |
Ruminococcus bromii |
-0.006754 |
0.083333 |
0.950139 |
0.068682 |
Eubacterium hallii |
-0.006486 |
0.1 |
1.470321 |
0.388819 |
Roseburia inulinivorans |
-0.004387 |
0.15 |
1.023162 |
0.008023 |
Bifidobacterium bifidum |
-0.002405 |
0.033333 |
0.722383 |
0.172211 |
LT907848_s (Genus Anaerobutyricum) |
-0.00205 |
0.033333 |
1.010872 |
0.061536 |
Bacteroides fragilis |
-0.001945 |
0.116667 |
4.954876 |
5.440352 |
Roseburia cecicola |
-0.000708 |
0.016667 |
0.637494 |
0.072541 |
Clostridium celatum |
-0.000548 |
0.016667 |
1.47384 |
0.790128 |
PAC001046_s (Family Lachnospiraceae) |
-0.00027 |
0.033333 |
0.681424 |
0.000712 |
Lactobacillus rogosae |
-0.000069 |
0.016667 |
0.634118 |
0.040713 |
Bacteroides uniformis |
-0.00002 |
0.016667 |
2.133196 |
0.316344 |
균형군과 관련된 속 수준 바이오마커(발달단계 2)
시료번호(species level)
(균종명)
|
coefficients
|
robustness
|
균형군 비율(%)
|
불균형군 비율(%)
|
Ruminococcus_g2 (Family Ruminococcaceae) |
-0.466909 |
0.916667 |
1.860715 |
0.070953 |
Lachnospira |
-0.384064 |
0.833333 |
1.875378 |
0.12984 |
Bacteroides |
-0.22437 |
0.766667 |
17.524886 |
14.548922 |
Faecalibacterium |
-0.165892 |
0.466667 |
11.503136 |
4.195657 |
Eubacterium_g5 (Family Lachnospiraceae) |
-0.116977 |
0.366667 |
2.608563 |
0.480289 |
Fusicatenibacter |
-0.070078 |
0.483333 |
2.514382 |
0.791564 |
Roseburia |
-0.038164 |
0.283333 |
2.255163 |
0.32842 |
Subdoligranulum |
-0.02894 |
0.183333 |
2.476985 |
0.559366 |
Blautia |
-0.016366 |
0.233333 |
8.472013 |
3.055045 |
CCMM_g (Family Erysipelotrichaceae) |
-0.013717 |
0.166667 |
0.811336 |
0.139387 |
Agathobacter |
-0.013303 |
0.116667 |
0.649122 |
0.123431 |
Akkermansia |
-0.009818 |
0.116667 |
1.838978 |
2.882973 |
Anaerostipes |
-0.008317 |
0.083333 |
4.771253 |
1.473928 |
Parasutterella |
-0.008229 |
0.066667 |
0.270422 |
0.176537 |
Romboutsia |
-0.005091 |
0.066667 |
0.927612 |
0.867899 |
PAC001046_g (Family Lachnospiraceae) |
-0.004184 |
0.033333 |
0.694255 |
0.000712 |
Eubacterium_g23 (Family Ruminococcaceae) |
-0.001176 |
0.016667 |
0.422063 |
0.00009 |
Alistipes |
-0.001155 |
0.016667 |
0.398863 |
1.24756 |
불균형군과 관련된 종(speceis) 수준 바이오마커(발달단계 2)
시료번호(species level)
(균종명)
|
coefficients
|
robustness
|
균형군 비율(%)
|
불균형군 비율(%)
|
Streptococcus salivarius |
0.000255 |
0.016667 |
2.374956 |
4.833057 |
Bacteroides dorei |
0.000329 |
0.016667 |
1.610086 |
2.637872 |
PAC001148_s (Family Lachnospiraceae) |
0.000436 |
0.016667 |
0.278625 |
0.597653 |
FWNZ_s (Genus Klebsiella) |
0.000743 |
0.05 |
0.032624 |
2.392581 |
Haemophilus parainfluenzae |
0.001315 |
0.033333 |
0.128404 |
0.246825 |
Lactobacillus paracasei |
0.001989 |
0.016667 |
0.108647 |
0.150154 |
Bifidobacterium longum |
0.002892 |
0.066667 |
3.680349 |
10.12144 |
Bacteroides ovatus |
0.002929 |
0.066667 |
1.300072 |
2.472146 |
Lactobacillus fermentum |
0.003348 |
0.1 |
0.187065 |
0.884733 |
Clostridioides difficile |
0.004256 |
0.066667 |
0.019651 |
0.344302 |
Veillonella ratti |
0.007767 |
0.15 |
0.663291 |
3.604658 |
Enterococcus faecium |
0.056388 |
0.633333 |
1.198365 |
2.516732 |
Veillonella dispar |
0.060976 |
0.65 |
0.153714 |
2.407966 |
Escherichia coli |
0.080391 |
0.8 |
0.409679 |
6.41716 |
Bifidobacterium breve |
0.090213 |
0.666667 |
0.358843 |
6.825921 |
불균형군과 관련된 속(Genus) 수준 바이오마커(발달단계 2)
시료번호(species level)
(균종명)
|
coefficients
|
robustness
|
균형군 비율(%)
|
불균형군 비율(%)
|
Clostridium_g35 (Family Lachnospiraceae) |
0.000291 |
0.016667 |
0.110759 |
0.221132 |
Clostridium |
0.000469 |
0.083333 |
1.860338 |
1.850075 |
Intestinibacter |
0.000528 |
0.016667 |
0.841446 |
1.174962 |
Bifidobacterium |
0.000938 |
0.016667 |
12.867602 |
20.307788 |
Sutterella |
0.001188 |
0.016667 |
0.211909 |
0.104892 |
Hungatella |
0.001625 |
0.016667 |
0.076689 |
0.191014 |
Prevotella |
0.005983 |
0.083333 |
1.247341 |
1.583361 |
Streptococcus |
0.007556 |
0.116667 |
2.765987 |
5.420648 |
Citrobacter |
0.014446 |
0.116667 |
0.130479 |
0.376519 |
Klebsiella |
0.024247 |
0.166667 |
0.032624 |
2.397416 |
Clostridioides |
0.034329 |
0.2 |
0.01975 |
0.344425 |
Enterococcus |
0.079289 |
0.5 |
1.223035 |
2.543823 |
PAC001138_g (Family Lachnospiraceae) |
0.105919 |
0.416667 |
0.352784 |
0.194167 |
Haemophilus |
0.157628 |
0.566667 |
0.137701 |
0.249095 |
Lactobacillus |
0.193791 |
0.616667 |
0.864182 |
1.122363 |
Veillonella |
0.297158 |
0.933333 |
0.895922 |
7.832423 |
Escherichia |
0.616597 |
0.933333 |
0.41046 |
6.437183 |
5-5. 장내 미생물 불균형 예측 모델을 이용한 미생물의 특징적 선택(최종)
실시예 3-4에 상기한 바와 같이, 기계 학습 적용 결과를 장내 미생물 균형군 혹은 불균형군 선별 기준에 따라 보정하여, 최종 미생물 바이오마커를 선정하였다. 발달 단계 별로 불균형군에서 미생물 분류군의 군집 규모가 더 높은 비율로 나타난 Akkermansia, Bacteroides fragilis 등의 총 5개 분류군을 균형군 특이적 바이오마커에서 제외하였다. 불균형 특이적 바이오마커에서는 균형군에서 더 높은 비율로 나타난 Clostridium, Sutterella 등의 총 3개 분류군을 제외하였다.
상기 제외된 미생물 분류군를 고려하여, 균형군 특이적 바이오마커를 발달 단계 별로 하기 표 29 내지 32에 나타내었다. 균형군 특이적 바이오마커는 발달단계 1에서 Species level 12개 분류군, Genus level 6개 분류군으로 이루어져 있고, 발달단계 2에서 Species level 18개 분류군, Genus level 16개 분류군으로 이루어져 있다.
2차 특징 선택으로 보정을 마친 불균형군 특이적 바이오마커는 표 33 내지 표 36에 나타내었다. 불균형군 특이적 바이오마커는 발달단계 1에서 Species level 11개 분류군, Genus level 7개 분류군으로 이루어져 있고, 발달단계 2에서 Species level 15개 분류군, Genus level 14개 분류군으로 이루어져 있다.
상기 발달단계별 균형군 특이적 바이오마커로서, 발달단계 1의 균형군 특이적 바이오마커는 표 29 및 표 30과 도 10의 계통도에 나타내고, 발달단계 1의 불균형군 특이적 바이오마커는 표 33 및 표 34과 도 11의 계통도에 나타낸다. 또한 발달단계 2의 균형군 특이적 바이오마커는 표 31 및 표 32 도 12의 계통도에 나타내고, 발달단계 1의 불균형군 특이적 바이오마커는 표 35 및 표 36과 도 13의 계통도에 나타낸다. 하기 표 30, 표 32, 표 34 및 표 36에서 기재된 속 (Genus) 수준 바이오마커라 함은 미생물 바이오마커의 종(speies)가 구분되나, 구체적으로 동정이 종 수준까지 수행되지 않아 동정 결과를 속 수준까지 기재한 species로서, 실질적으로 species 수준에서 구별되는 미생물 바이오마커임을 의미한다.
균형군과 관련된 종 수준 바이오마커(발달단계 1)
시료번호(species level)
(균종명)
|
16S rRNA
서열번호
|
16S rRNA 단편의
서열번호
|
균형군 비율(%)
|
불균형군 비율(%)
|
Bifidobacterium longum |
1 |
81 |
51.243026 |
21.23793 |
Lactobacillus gasseri |
2 |
82 |
1.055237 |
0.22722 |
Streptococcus peroris |
3 |
83 |
0.814519 |
0.221563 |
Bifidobacterium bifidum |
4 |
84 |
1.745036 |
0.563617 |
Enterococcus faecalis |
5 |
85 |
3.588835 |
1.564981 |
Streptococcus pneumoniae |
6 |
86 |
0.203145 |
0.075435 |
Bifidobacterium breve |
7 |
87 |
8.686701 |
7.201174 |
Rothia mucilaginosa |
8 |
88 |
0.397782 |
0.075418 |
Streptococcus salivarius |
9 |
89 |
4.78868 |
2.924272 |
Anaerostipes hadrus |
10 |
90 |
0.266833 |
0.03419 |
Enterococcus faecium |
11 |
91 |
6.333801 |
4.757783 |
Eggerthella lenta |
12 |
92 |
0.189416 |
0.074407 |
균형군과 관련된 속 수준 바이오마커(발달단계 1)
시료번호(genus level)
(균종명)
|
16S rRNA
서열번호
|
16S rRNA 단편의
서열번호
|
균형군 비율(%)
|
불균형군 비율(%)
|
Bifidobacterium |
13 |
93 |
62.580789 |
33.045218 |
Enterococcus |
14 |
94 |
10.041681 |
6.371829 |
Rothia |
15 |
95 |
0.407708 |
0.084993 |
Eggerthella |
16 |
96 |
0.202414 |
0.076959 |
Lactobacillus |
17 |
97 |
2.804877 |
2.013835 |
Anaerostipes |
18 |
98 |
0.30337 |
0.157415 |
균형군과 관련된 종 수준 바이오마커(발달단계 2)
시료번호(species level)
(균종명)
|
16S rRNA
서열번호
|
16S rRNA 단편의
서열번호
|
균형군 비율(%)
|
불균형군 비율(%)
|
Fusicatenibacter saccharivorans |
19 |
99 |
2.451463 |
0.770204 |
Faecalibacterium prausnitzii |
20 |
100 |
11.303225 |
4.18633 |
Blautia faecis |
21 |
101 |
0.815303 |
0.01675 |
Bifidobacterium catenulatum |
22 |
102 |
5.608016 |
2.749555 |
Anaerostipes hadrus |
10 |
90 |
4.493286 |
1.038971 |
Gemmiger formicilis |
23 |
103 |
1.934029 |
0.552129 |
Eubacterium eligens |
24 |
104 |
0.841646 |
0.085065 |
Blautia wexlerae |
25 |
105 |
5.646432 |
2.316964 |
Ruminococcus bromii |
26 |
106 |
0.950139 |
0.068682 |
Eubacterium hallii |
27 |
107 |
1.470321 |
0.388819 |
Roseburia inulinivorans |
28 |
108 |
1.023162 |
0.008023 |
Bifidobacterium bifidum |
4 |
84 |
0.722383 |
0.172211 |
LT907848_s (Genus Anaerobutyricum) |
29 |
109 |
1.010872 |
0.061536 |
Roseburia cecicola |
30 |
110 |
0.637494 |
0.072541 |
Clostridium celatum |
31 |
111 |
1.47384 |
0.790128 |
PAC001046_s (Family Lachnospiraceae) |
32 |
112 |
0.681424 |
0.000712 |
Lactobacillus rogosae |
33 |
113 |
0.634118 |
0.040713 |
Bacteroides uniformis |
34 |
114 |
2.133196 |
0.316344 |
균형군과 관련된 속 수준 바이오마커(발달단계 2)
시료번호(species level)
(균종명)
|
16S rRNA
서열번호
|
16S rRNA 단편의
서열번호
|
균형군 비율(%)
|
불균형군 비율(%)
|
Ruminococcus_g2 (Family Ruminococcaceae) |
35 |
115 |
1.860715 |
0.070953 |
Lachnospira |
36 |
116 |
1.875378 |
0.12984 |
Bacteroides |
37 |
117 |
17.524886 |
14.548922 |
Faecalibacterium |
38 |
118 |
11.503136 |
4.195657 |
Eubacterium_g5 (Family Lachnospiraceae) |
39 |
119 |
2.608563 |
0.480289 |
Fusicatenibacter |
40 |
120 |
2.514382 |
0.791564 |
Roseburia |
41 |
121 |
2.255163 |
0.32842 |
Subdoligranulum |
42 |
122 |
2.476985 |
0.559366 |
Blautia |
43 |
123 |
8.472013 |
3.055045 |
CCMM_g (Family Erysipelotrichaceae) |
44 |
124 |
0.811336 |
0.139387 |
Agathobacter |
45 |
125 |
0.649122 |
0.123431 |
Anaerostipes |
18 |
98 |
4.771253 |
1.473928 |
Parasutterella |
46 |
126 |
0.270422 |
0.176537 |
Romboutsia |
47 |
127 |
0.927612 |
0.867899 |
PAC001046_g (Family Lachnospiraceae) |
48 |
128 |
0.694255 |
0.000712 |
Eubacterium_g23 (Family Ruminococcaceae) |
49 |
129 |
0.422063 |
0.00009 |
불균형군과 관련된 종(speceis) 수준 바이오마커(발달단계 1)
시료번호(species level)
(균종명)
|
16S rRNA
서열번호
|
16S rRNA 단편의
서열번호
|
균형군 비율(%)
|
불균형군 비율(%)
|
FWNZ_s (Genus Klebsiella) |
50 |
130 |
0.149975 |
1.899234 |
Flavonifractor plautii |
51 |
131 |
0.005163 |
0.229055 |
Streptococcus gallolyticus |
52 |
132 |
0.243751 |
1.754617 |
Clostridium neonatale |
53 |
133 |
0.010955 |
1.006057 |
Clostridioides difficile |
54 |
134 |
0.091256 |
0.578815 |
Veillonella ratti |
55 |
135 |
0.561349 |
2.445463 |
Escherichia coli |
56 |
136 |
4.687128 |
9.505538 |
Clostridium paraputrificum |
57 |
137 |
0.042032 |
0.510855 |
Bacteroides vulgatus |
58 |
138 |
0.140871 |
5.123635 |
Veillonella atypica |
59 |
139 |
0.043712 |
1.088948 |
Veillonella dispar |
60 |
140 |
0.529256 |
4.334027 |
불균형군과 관련된 속(Genus) 수준 바이오마커(발달단계 1)
시료번호(genus level)
(균종명)
|
16S rRNA
서열번호
|
16S rRNA 단편의
서열번호
|
균형군 비율(%)
|
불균형군 비율(%)
|
Pseudoflavonifractor |
61 |
141 |
0.009344 |
0.250999 |
Clostridioides |
62 |
142 |
0.116913 |
0.580252 |
Escherichia |
63 |
143 |
4.706873 |
9.535802 |
Clostridium_g24 (Family Lachnospiraceae) |
64 |
144 |
0.052884 |
0.366841 |
Clostridium |
65 |
145 |
0.441519 |
3.809211 |
Bacteroides |
37 |
117 |
2.059269 |
8.545303 |
Veillonella |
66 |
146 |
1.498936 |
9.707073 |
불균형군과 관련된 종(speceis) 수준 바이오마커(발달단계 2)
시료번호(species level)
(균종명)
|
16S rRNA
서열번호
|
16S rRNA 단편의
서열번호
|
균형군 비율(%)
|
불균형군 비율(%)
|
Streptococcus salivarius |
9 |
89 |
2.374956 |
4.833057 |
Bacteroides dorei |
67 |
147 |
1.610086 |
2.637872 |
PAC001148_s (Family Lachnospiraceae) |
68 |
148 |
0.278625 |
0.597653 |
FWNZ_s (Genus Klebsiella) |
50 |
130 |
0.032624 |
2.392581 |
Haemophilus parainfluenzae |
69 |
149 |
0.128404 |
0.246825 |
Lactobacillus paracasei |
70 |
150 |
0.108647 |
0.150154 |
Bifidobacterium longum |
1 |
81 |
3.680349 |
10.12144 |
Bacteroides ovatus |
71 |
151 |
1.300072 |
2.472146 |
Lactobacillus fermentum |
72 |
152 |
0.187065 |
0.884733 |
Clostridioides difficile |
54 |
134 |
0.019651 |
0.344302 |
Veillonella ratti |
55 |
135 |
0.663291 |
3.604658 |
Enterococcus faecium |
11 |
91 |
1.198365 |
2.516732 |
Veillonella dispar |
60 |
140 |
0.153714 |
2.407966 |
Escherichia coli |
56 |
136 |
0.409679 |
6.41716 |
Bifidobacterium breve |
7 |
87 |
0.358843 |
6.825921 |
불균형군과 관련된 속(Genus) 수준 바이오마커(발달단계 2)
시료번호(species level)
(균종명)
|
16S rRNA
서열번호
|
16S rRNA 단편의
서열번호
|
균형군 비율(%)
|
불균형군 비율(%)
|
Clostridium_g35 (Family Lachnospiraceae) |
73 |
153 |
0.110759 |
0.221132 |
Intestinibacter |
74 |
154 |
0.841446 |
1.174962 |
Bifidobacterium |
13 |
93 |
12.867602 |
20.307788 |
Hungatella |
75 |
155 |
0.076689 |
0.191014 |
Prevotella |
76 |
156 |
1.247341 |
1.583361 |
Streptococcus |
77 |
157 |
2.765987 |
5.420648 |
Citrobacter |
78 |
158 |
0.130479 |
0.376519 |
Klebsiella |
79 |
159 |
0.032624 |
2.397416 |
Clostridioides |
62 |
142 |
0.01975 |
0.344425 |
Enterococcus |
14 |
94 |
1.223035 |
2.543823 |
Haemophilus |
80 |
160 |
0.137701 |
0.249095 |
Lactobacillus |
17 |
97 |
0.864182 |
1.122363 |
Veillonella |
66 |
146 |
0.895922 |
7.832423 |
Escherichia |
63 |
143 |
0.41046 |
6.437183 |
실시예 6: 영유아 장내 미생물 불균형 예측
6-1. 영유아 장내 미생물 불균형 예측 모델의 검증
실시예 3-5의 방법을 이용하여, 영유아 장내 미생물 불균형 여부를 학습한 기계 학습 모델이 실제로 영유아 장내 미생물 불균형 여부를 정확하게 구별하는지 살펴보았다. 예측 모델을 이용하여 Test set에 대한 장내 미생물 불균형 여부를 판정한 결과의 ROC 곡선 (receiver operating characteristic curve) 및 AUC (area under curve) 그래프를 도 8a 및 도 8b에 나타내었다. ROC 곡선이 활 모양으로 크게 굽어져 있고, AUC는 발달단계 1에서 0.88, 발달단계 2에서 0.92로 1에 가까운 값을 보이므로 상기 실시예 5-3에서 적용한 영유아 장내 미생물 불균형 예측 결과가 유의미함을 알 수 있다.
6-2: 영유아 장내 미생물 불균형의 판별 지수
실시예 3-6에서 상기한 바와 같이 정확한 임상적 해석을 부여하기 위해, 해당 바이오마커의 Coefficient와 내적곱을 하여 계산한 0과 1사이의 확률값을 학습에 사용한 장내 미생물 불균형군과 장내 균형군의 비율로 나눠 리스케일하였다. 상기 수학식 7에서,
는 영유아 장내 미생물 불균형 판별을 위한 시험 대상의 예측 점수이고, P
0 는 예측 모델 구축에 사용된 training set에 존재하는 장내 미생물 불균형 샘플의 비율이며, N
case 는 training set 내 장내 미생물 불균형 샘플의 수이고, N
train 는 training set의 전체 샘플 수이다. 이렇게 계산된 지수는 영유아 장내 미생물 불균형 지수로 명명하였다.
미지 시료에 대하여 장내 미생물 불균형 상태를 구분하는 지표로 상기 영유아 장내 미생물 불균형 지수를 사용할 수 있는지 검증하기 위해, 상기의 영유아 장내 미생물 불균형 지수를 통해 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy) 값을 확인해보았다.
구체적으로, 발달단계 1에서 0.3 ~ 1.67, 발달단계 2에서 0 ~ 2.68에 분포하는 민감도, 특이도, 정확도 값을 20등분하여 영유아 장내 미생물 불균형 지수의 기준(cut off)을 정하였다. 민감도(Sensitivity), 특이도(Specificity), 정확도(Accuracy)는 하기 수학식 8 내지 10과 같이 계산한다. 상기 수학식 8 내지 10에서, TP는 장내 미생물 불균형 시료에서 영유아 장내 미생물 불균형 지수(
)가 cut-off보다 큰 경우의 수이고, TN은 장내 미생물 불균형 시료에서 영유아 장내 미생물 불균형 지수(
)가 cut-off보다 작은 경우의 수이고, FP는 장내 균형 시료에서 영유아 장내 미생물 불균형 지수(
)가 cut-off보다 큰 경우의 수이고, FN은 장내 균형 시료에서 영유아 장내 미생물 불균형 지수(
)가 cut-off보다 작은 경우의 수이다. 이러한 계산 결과를 도 9a 및 도 9b에 나타내었다.
발달단계 1에서 정확도가 80%로 계산된 가장 높은 지수 1.17를 기준으로 장내 미생물 불균형 상태를 판별할 경우, 영유아 장내 균형을 정확하게 맞추는 특이도는 83%, 영유아 장내 미생물 불균형을 정확하게 판단하는 민감도는 76%이다. 해당 정확도 그래프를 도 9a에 나타내었다.
발달단계 2에서 정확도가 82%로 계산된 가장 높은 지수 1.7을 기준으로 장내 미생물 불균형 상태를 구분할 경우, 영유아 장내 균형을 정확하게 맞추는 특이도는 88%, 영유아 장내 미생물 불균형을 정확하게 판단하는 민감도는 74%이다. 해당 정확도 그래프를 도 9b에 나타내었다.
발달단계 1에서 1.17, 발달단계 2에서 1.7을 기준으로 장내 미생물 불균형 여부를 판별할 때, 각 지수에서 나타나는 특이도는 각각 83% 및 88%로 장내 미생물 균형 여부를 정확하게 구별할 수 있으므로 임상학적으로 더 높은 판별능을 보이는 것을 알 수 있다.
따라서, 발달단계 1에 해당하는 검사 대상 샘플의 영유아 장내 미생물 불균형 지수가 1.17 이상인 경우, 영유아 장내 미생물 불균형으로 판별할 수 있으며, 1.17 미만으로 계산되는 경우, 영유아 장내 균형으로 판별할 수 있다. 발달단계 2에 해당하는 검사 대상 샘플의 영유아 장내 미생물 불균형 지수가 1.7 이상인 경우, 영유아 장내 미생물 불균형으로 판별할 수 있으며, 1.7 미만으로 계산되는 경우, 영유아 장내 미생물 균형으로 판별할 수 있다.
6-3. 영유아 장내 미생물 불균형의 판정
영유아의 발달단계별 장내 미생물 불균형 여부는 영유아 장내 미생물 불균형에 특이적인 바이오마커를 분석함으로써 판별할 수 있다. 영유아 장내 미생물 불균형 바이오마커는 영유아 발달 단계에 따라 변화하므로, 영유아 장내 미생물 불균형에 대한 판별시 먼저 영유아 발달 단계의 확정이 필요하다.
구체적으로, 실시예 2의 방법을 이용하여 장내 미생물을 분석하며, 실시예 4의 방법으로 영유아 발달 단계를 규정한 후, 영유아 장내 미생물 불균형 예측 모델에 적용함으로써 영유아 장내 미생물 불균형 판별 지수를 얻는다. 발달 단계 별 장내 미생물 불균형 판별 지수 기준에 따라, 최종적으로 영유아 장내 미생물의 불균형도를 판별할 수 있다.
자세하게는, 영유아의 각 발달 단계별 균형군 또는 불균형군 특이적인 미생물 바이오마커의 균종(species)와 이들 균종의 장내 균총 내 비율(점유율)을 분석하여 불균형 판결 지수를 산정하여, 정확도, 민감도 및 특이도를 이용하여 불균형 판결 지수의 cut-off 값을 설정하고, 설정값 미만인 경우를 균형군로 선정하고, 설정값 이상인 경우를 불균형군으로 선정한다. 영유아 장내 미생물 불균형도을 판별하는 예시적인 기준을 하기 표 37에 나타내었다.
영유아 장내 미생물 불균형 판별 기준
발달 단계 구분
|
영유아 장내 미생물 불균형 예측 모델
|
장내 미생물 불균형 여부
|
발달단계 1 |
장내 미생물 불균형 판별 지수 1.17 미만 |
장내 미생물 균형 |
장내 미생물 불균형 판별 지수 1.17 이상 |
장내 미생물 불균형 |
발달단계 2 |
장내 미생물 불균형 판별 지수 1.7 미만 |
장내 미생물 균형 |
장내 미생물 불균형 판별 지수 1.7 이상 |
장내 미생물 불균형 |
상대적으로 안정된 장내 미생물 생태계가 이루어져 있는 성인의 경우, 건강군과 질병군에 대한 장내 미생물 군집 분포의 차이가 뚜렷하게 나타난다. 성인 기준으로, 장내 미생물 불균형(dysbiosis)은 항생제, 가공 식품 등의 요인으로 인해 장내 미생물 군집의 다양성이 낮아지고 균형이 망가진 상태를 의미한다. 최근, 과민성 대장 증후군(IBS), 비만, 당뇨 등 현대 질병의 요인으로 장내 미생물 불균형이 지목되고 있다.
영유아 장내 미생물 생태계의 경우, 무균 상태인 신생아의 장에 미생물이 정착을 하게 되며, 이러한 과정으로 인해 성인에 비해 종 다양성이 낮은 수치로 분석되는 등 다소 불안정해보일 수 있는 상태가 나타난다. 따라서, 영유아의 장내 미생물 불균형을 규정하기 위해서는 보편적으로 장내 미생물 불균형의 판단 기준이 되는 종 다양성을 배제하고, 동일한 발달 시기에 해당하는 모집군의 메타 데이터에 대한 특징 조사가 필요하다.
상기 언급한 바와 같이, 영유아 장내 미생물 불균형의 규정에는 장내 미생물 분석 데이터에 어떤 종류의 메타 데이터가 가장 큰 영향을 미치는지를 알아보는 것이 중요하다. 따라서 본 발명자들은 영유아 장내 미생물 불균형과 연관되어 있는 메타 데이터인 분만 형태, 수유 형태, 항생제 복용 여부 및 설사 여부 등의 항목을 문헌 조사를 통해 선정하여, 발달 단계 별로 그룹화된 장내 미생물 데이터에 어떤 항목이 가장 큰 영향을 미치는지 알아보았다. 이어서, 메타 데이터를 통해 의미가 부여된 각각의 그룹에서 강하게 연관되어 있는 미생물 종을 탐색함으로써 바이오마커를 선별하였다.
6-4. 영유아 장내 미생물 바이오마커와 관계
영유아 장내 미생물 불균형 바이오마커는 영유아 장내 미생물 불균형군과 영유아 장내 균형군에 특이적인 바이오마커의 16S rRNA sequence를 기반으로 neighbor joining 알고리즘을 이용하여 phylogenetic tree를 생성하였으며, 분류학적인 관점(order 수준)에서 subgroup을 구분하였다. 각각의 발달 단계에서 영유아 장내 미생물 불균형군과 영유아 장내 균형군에서 나타나는 바이오마커는 38개 subgroup으로 나눌 수 있다.
도 10 내지 도 13에 발달 단계 별 영유아 장내 미생물 불균형이군 및 영유아 장내 균형군의 종 및 속 수준 바이오마커의 계통수(phylogenic tree)를 표시하였다. 구체적으로, 발달단계, 균형여부 및 종/속 마커를 구분하여 하기 표에 나타낸다.
발달단계 |
균형여부 |
종/속 구분(마커) |
하위그룹 |
발달단계 1 |
균형군 |
특이적 속수준 마커 |
제1그룹 내지 제4그룹 |
특이적 종수준 마커 |
제5그룹 내지 제9그룹 |
불균형군 |
특이적 속수준 마커 |
제10그룹 내지 제12그룹 |
특이적 종수준 마커 |
제13그룹 내지 제17그룹 |
발달단계 2 |
균형군 |
특이적 속수준 마커 |
제18그룹 내지 제21그룹 |
특이적 종수준 마커 |
제22그룹 내지 제24그룹 |
불균형군 |
특이적 속수준 마커 |
제25그룹 내지 제31그룹 |
특이적 종수준 마커 |
제32그룹 내지 제38그룹 |
(A) 발달단계 1의 장내 균형군 바이오마커
발달단계 1에서 영유아 장내 균형군의 바이오마커를 나타낸 도 10를 참고하면, 발달단계 1에서 영유아 장내 균형군과 가장 큰 연관성을 보이는 바이오마커는 Bifidobacterium이며, 같은 subgroup 내의 Rothia와 함께 Actinobacteria에 속하는 유산균이다. Subgroup 1의 Lactobacillus, Enterococcus 역시 유산균으로서, 발달단계 1에서 유산균이 수행하는 면역력 강화, 영양소 흡수 등의 긍정적인 영향이 균형 그룹에서 더 잘 나타나는 것을 알 수 있다.
더욱 자세하게는 Lactobacillus 중에서 coefficient 값을 기준으로 가장 균형군에 특이적인 Lactobacillus gasseri(Subgroup 5)는, 대부분의 Lactobacillus와 마찬가지로 담즙산에 살아남을 수 있고, 장내 상피세포에 쉽게 부착하는 유전자를 가지고 있어, 대장에 오래 정착할 수 있다. 또한 성인 대상 연구에서 면역력 강화, 장 불편 완화, 설사 및 변비 완화 등의 효과가 모두 임상연구를 통해 검증된 바 있다. coefficient 값을 기준으로 가장 균형군에 특이적인 Bifidobacterium longum(Subgroup 9)의 경우에는, 산모의 질에서 검출되는 유산균으로, 자연 분만과 연관되어 있으며, 신생아의 면역력에 도움을 준다. 또한 성인 대상 연구에서 크론병(crohn's disease, CD)이나 궤양성 대장염(ulcerative colitis, UC)과 같은 염증성 장 질환(inflammatory bowel disease, IBD)을 완화하는 사례가 많이 보고되고 있다. 이처럼, 발달단계 1에서 장내 균형 그룹에 특이적인 바이오마커는 영유아 장내 미생물 발달에 긍정적인 역할이 두드러진다.
(B) 발달단계 1의 장내 불균형군 바이오마커
발달단계 1에서 영유아 장내 불균형군의 바이오마커를 나타낸 도 11를 참고하면, 발달단계 1에서 영유아 장내 미생물 불균형군에 가장 특이적인 바이오마커는 Phylum Firmicutes에 속하는 Veillonella 속 및 Clostridium 속과 Phylum Bacteroidetes에 속하는 Bacteroides속 이다.
이러한 미생물들은 액상(수유식) 내지 겔상(이유식)의 식이 형태가 아닌 식물성 탄수화물(단순당 및 섬유질) 및 단백질로 이루어지는 고형(유아식 및 일반식) 식이의 대사와 관련이 있으며, 짧은 사슬 지방산을 생성하는 특징이 있다. 성인의 경우, 섬유질에 대한 대사 능력과 짧은 사슬 지방산을 생성하는 기능을 가지는 미생물은 장내 미생물 생태계의 종 다양성을 높이는 유익한 역할을 한다. 하지만, 영유아의 경우, 발달단계 1에서 이러한 미생물이 검출되는 양상이 설사, 제왕 절개 등의 장내 미생물 불균형 인자와 연관되어 있는 것으로 분석되었다. 액상(수유식) 내지 겔상(이유식)의 식이 형태가 주로 이루어지는 영유아 발달단계 1에서 고형(유아식 및 일반식)으로 바뀌는 시기에 나타나는 미생물이 검출되는 것은 장내 미생물 생태계가 예상보다 일찍 발달한 것으로 해석할 수 있으며, 장내 미생물 불균형 인자와 관련된 것으로 미루어 장내 미생물 생태계가 이상적으로 발달하지 않고 있는 상태임을 알 수 있다.
(C) 발달단계 2의 장내 균형군 바이오마커
발달단계 2에서 영유아 장내 균형군의 바이오마커를 나타낸 도 12를 참고하면, 가장 큰 연관성을 보이는 바이오마커는 대다수가 짧은 사슬 지방산 생성균인 경우이다. 속 수준의 16개 바이오마커 중에서 subgroup 18에 해당하는 13개 바이오마커(Subdoligranulum, Faecalibacterium, Eubacterium_g23, Ruminococcus_g2, Romboutsia, Fusicatenibacter, Anaerostipes, Agathobacter, Lachnospira, Roseburia, Eubacterium_g5, Blautia, PAC001046_g)가 phylum Firmicutes에 속하며, Firmicutes에서 대표적인 짧은 사슬 지방산 생성균이 포함되는 order Clostridiales의 하위 미생물 종이다.
짧은 사슬 지방산은 식이섬유를 분해하는 과정에서 생성되는 대사 산물로, 에너지 생산 촉진, 비타민 생성 촉진, 장내 세포 결속 강화 등 인체에 유익한 영향을 주는 물질로 알려져 있다. 액상(수유식) 내지 겔상(이유식)의 식이 형태가 고형(유아식 및 일반식) 식이 형태로 전환됨에 따라, 장내 미생물 생태계가 적합하게 발달하고 있는 모습으로 판단할 수 있다. 특히, 상대적으로 높은 coefficient 및 robustness 값이 나타나는 Faecalibacterium prausnitzii는 대표적인 짧은 사슬 지방산 생성균으로, 성인에게서 항염증 효과가 나타난 사례가 보고된 바 있다. Eubacterium eligens, Anaerostipes hadrus, Blautia wexlerae 역시 짧은 사슬 지방산 생선균이며, 면역을 조절하고 염증을 완화하는 butyric acid를 대표적으로 생성한다. Eubacterium eligens는 과일, 채소 등에 많이 존재하는 수용성 식이섬유 팩틴(pectin)을 분해하여 소화를 돕는다. Anaerostipes hadrus는 과민성 대장 증후군의 완화와 관련되어 있는 것으로 알려졌으며, Blautia wexlerae는 비만인 사람의 장에는 건강한 사람에 비해 낮은 비율로 존재하는 것으로 알려졌다.
(D) 발달단계 2의 장내 불균형군 바이오마커
발달단계 2에서 영유아 장내 불균형군의 바이오마커를 나타낸 도 13를 참고하면, 가장 특이적인 바이오마커는 Enterococcus, Lactobacillus, Streptococcus (subgroup 25), Bifidobacterium (subgroup 30) 등의 유산균이다. 또한, Phylum Proteobacteria의 대장균 계열 Haemophilus (Subgroup 28), Escherichia, Klebsiella, Citrobacter (Subgroup 29) 역시 발달단계 2와 연관된 바이오마커로 선별되었다. 대장균류의 미생물들은 초기 장내 환경의 안정화를 돕는 미생물이지만, 균형이 망가진 장내 환경에서는 유해한 영향을 미친다. Haemophilus는 장내에서 염증을 유발할 수 있으며, 특히, Clostridioides difficile는 디피실레 감염증의 원인균이다.
짧은 사슬 지방산을 생성하는 order Clostridiales(Subgroup 27)의 4개 genus(Clostridium_g35, Hungatella, Clostridioides, Intestinibacter)가 영유아 장내 미생물 불균형에 특이적인 바이오마커로 포함되어 있다. 그러나, 해당 바이오마커의 robustness 값이 장내 균형군 특이적 바이오마커의 order Clostridiales의 미생물 종들에 비해 낮은 수치를 보이므로, 해당 바이오마커가 유의미하게 계산된 경우가 상대적으로 적다는 것을 알 수 있다.
발달단계 2에서 phylum Bacteroidetes의 Prevotella 및 Bacteroides를 살펴볼 때, Bacteroides는 균형군 특이적 바이오마커에, Prevotella는 불균형 특이적 바이오마커에 포함되어 있으므로, 영유아 시기에 더 이상적인 장내 미생물 생태계 유형은 Bacteroides 형으로 판단된다.
따라서, 발달단계 2에서 영유아 장내 미생물 불균형군에 특이적인 바이오마커가 검출되는 것은 초기의 장내 미생물 생태계가 아직 유지되고 있어 예상보다 늦게 발달하고 있는 상태로 해석할 수 있다. 해당 결과가 장내 미생물 불균형 인자와 관련되어 있으므로, 장내 미생물 생태계가 이상적으로 발달하지 않는 상태이다.