KR101539631B1 - 콩과작물 내의 이소플라본 함량 예측 모델을 이용한 콩과작물 내의 이소플라본 함량을 예측하는 방법 - Google Patents

콩과작물 내의 이소플라본 함량 예측 모델을 이용한 콩과작물 내의 이소플라본 함량을 예측하는 방법 Download PDF

Info

Publication number
KR101539631B1
KR101539631B1 KR1020120135714A KR20120135714A KR101539631B1 KR 101539631 B1 KR101539631 B1 KR 101539631B1 KR 1020120135714 A KR1020120135714 A KR 1020120135714A KR 20120135714 A KR20120135714 A KR 20120135714A KR 101539631 B1 KR101539631 B1 KR 101539631B1
Authority
KR
South Korea
Prior art keywords
soybean
daidzin
crop
mal
isoflavone content
Prior art date
Application number
KR1020120135714A
Other languages
English (en)
Other versions
KR20140069385A (ko
Inventor
김석원
송승엽
박종미
장혜림
안명숙
지은이
Original Assignee
한국생명공학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생명공학연구원 filed Critical 한국생명공학연구원
Priority to KR1020120135714A priority Critical patent/KR101539631B1/ko
Publication of KR20140069385A publication Critical patent/KR20140069385A/ko
Application granted granted Critical
Publication of KR101539631B1 publication Critical patent/KR101539631B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

본 발명은 콩과작물 종자의 유기용매 추출물을 대상으로 FT-IR 스펙트럼 데이터를 이용한 다변량통계분석 및 HPLC 분석 데이터를 이용한 정량 분석을 수행하고, 상기 두 데이터 간의 상관관계를 분석하여 PLS 회귀분석을 이용한 이소플라본 함량 예측 모델을 구축한 후, 이를 이용하여 미지의 콩과작물 내의 이소플라본 함량을 예측하는 콩과작물 내의 이소플라본 함량을 예측하는 방법에 관한 것으로, 본 발명은 고기능성 성분인 이소플라본 함량이 높은 우수한 계통을 신속하게 선발할 수 있는 시간 및 경제적 절감효과가 큰 효율적인 방법을 제공할 수 있다.

Description

콩과작물 내의 이소플라본 함량 예측 모델을 이용한 콩과작물 내의 이소플라본 함량을 예측하는 방법{Method for predicting isoflavone content in leguminous crop using prediction model of isoflavone content in leguminous crop}
본 발명은 콩과작물 내의 이소플라본 함량 예측 모델을 이용한 콩과작물 내의 이소플라본 함량을 예측하는 방법에 관한 것으로, 더욱 상세하게는 콩과작물 종자의 유기용매 추출물을 대상으로 FT-IR 스펙트럼 데이터를 이용한 다변량통계분석 및 HPLC 분석 데이터를 이용하여 정량 분석을 수행하고, 상기 두 데이터 간의 상관관계를 분석하여 PLS 회귀분석을 이용하여 이소플라본 함량 예측 모델을 구축한 후, 이를 이용하여 미지의 콩과작물 내의 이소플라본 함량을 예측하는 콩과작물 내의 이소플라본 함량을 예측하는 방법에 관한 것이다.
대사체학(metabolomics)은 개체 전체가 주어진 상황에서 생산하는 대사 산물의 총합을 다루는 영역으로 유전체학(genomics)의 전후의 유전학적 접근을 연계하는 역할을 하고 있는데, 대사산물(metabolite)은 유전학(genomics), 전사체학(transcriptomics), 단백질체학(proteomics) 등에서 다루고 있는 특정 개체의 유전자, 전사체, 단백질의 종류에 비해 매우 낮은 숫자로, 이들 대사 산물은 생물 종에 관계없이 동일한 화학구조를 가짐으로서 대사체학은 여러 오믹스(omics) 가운데 가장 접근하기에 용이하다. 식물계 전체에 존재하는 대사체는 약 20만 종류로 추정되며, 애기장대(Arabidopsis thaliana)의 경우 약 5천 종류의 대사 물질을 가지고 있다.
최근 기기분석의 발달에 힘입어 대사체 분석기술에 대한 관심이 고조되고 있으며 급진적인 기술발전이 이루어지고 있다. 특히 대사체지문분석기술(metabolite fingerprinting)은 시료의 전세포 추출물 대사체 정보로부터 다양한 다변량통계분석기법을 이용하여 대사체 수준에서 시료 간의 양적, 질적 패턴 차이를 규명하는 연구 분야로 주로 FT-IR(Fourier transform infrared spectroscopy), HNMR(proton nuclear magnetic resonance spectroscopy) 및 MS(mass spectrometry) 등의 분석 데이터를 이용하여 시료의 식별에 활용하고 있다(Krishnan et al. 2005 J Exp Bot 56:255-265). 특히 FT-IR 스펙트럼 데이터의 다변량 통계분석 기술은 유연관계가 높은 미생물 종의 식별, 식물세포벽 돌연변이주 선발, 고등식물의 종 구분 및 품종 식별(Kim et al. 2009 Plant Biotechnol Rep 3: 87-93)에 활용 가능함이 보고된 바 있다.
본 발명에서는 FT-IR 스펙트럼의 다변량통계분석 기법을 이용하여 대두콩을 대사체 수준에서 신속한 구분 및 식별체계를 확립함으로써 대두콩에 함유하고 있는 이소플라본의 질적, 양적 차이를 규명하고 더 나아가 기능성 성분인 이소플라본의 함량이 우수한 계통 선발을 위한 신속 품종식별 기술 발판을 구축하고자 한다.
한편, 국제공개특허 제2009-038206호에서는 '가시광선·근적외선 분광 분석법 및 포도 양조 방법'이 개시되어 있으나, 본 발명에서와 같이 콩과작물 내의 이소플라본 함량 예측 모델을 이용한 콩과작물 내의 이소플라본 함량을 예측하는 방법에 대해서는 개시된 바가 없다.
본 발명은 상기와 같은 요구에 의해 안출된 것으로서, 본 발명에서는 대두콩이 함유하고 있는 이소플라본 성분을 분석하기 위해 대두콩 153점을 FT-IR 스펙트럼 데이터를 이용한 다변량통계분석 및 HPLC 분석 데이터를 이용해 정량 분석을 수행하고, 상기 두 데이터 간의 상관관계를 분석하여 PLS 회귀분석(Partial Least Square regression)을 이용한 이소플라본 함량 예측 모델을 구축하였다.
이를 통해 미지의 콩과작물 내의 이소플라본 성분 함량을 측정하기 위해, 상기 구축된 이소플라본 함량 예측 모델을 이용하여 미지의 콩과작물의 FT-IR 스펙트럼 데이터 값을 도입하여 측정한 결과, 실측값과 높은 상관관계(상관 지수 R≥0.4)가 있는 것을 확인함으로써, 본 발명을 완성하였다.
상기 과제를 해결하기 위해, 본 발명은
(a) 콩과작물의 종자를 동결건조 후 분말화하는 단계;
(b) 상기 (a)단계의 분말화된 콩과작물의 종자를 유기용매로 추출하여 추출물을 얻는 단계;
(c) 상기 (b)단계의 추출물을 이용하여 FT-IR (Fourier-transform infrared) 스펙트럼 프로파일을 얻는 단계;
(d) 상기 (c)단계의 FT-IR 스펙트럼 프로파일을 이용하여 다변량 통계분석 (mutivariate analysis)을 수행하는 단계;
(e) 상기 (b)단계의 추출물을 HPLC(High Performance Liquid Chromatography)로 이소플라본 함량을 정량 분석하는 단계;
(f) 상기 (d)단계의 FT-IR 스펙트럼 프로파일의 다변량 통계 분석 결과 및 (e)단계의 이소플라본의 정량값 사이의 상관관계를 분석하는 단계;
(g) 상기 (f)단계의 분석된 상관관계를 PLS 회귀분석 (Partial Least Square regression)을 이용하여 콩과작물 내의 이소플라본 함량 예측 모델을 도출하는 단계; 및
(h) 상기 (g)단계의 도출된 콩과작물 내의 이소플라본 함량 예측 모델을 이용하여 미지의 콩과작물 내의 이소플라본 함량을 예측하는 단계를 포함하는 콩과작물 내의 이소플라본 함량을 예측하는 방법을 제공한다.
본 발명은 콩과작물을 대상으로 새로운 이소플라본 특이적 함량 예측 모델을 구축한 것으로, 고기능성 성분인 이소플라본 함량이 높은 우수한 계통을 신속하게 선발할 수 있는 시간 및 경제적 절감효과가 큰 효율적인 방법을 제공할 수 있다.
도 1은 FT-IR 스펙트럼을 이용한 대두콩의 다변량통계분석을 나타낸다. A : FT-IR 스펙트럼, B : PCA 스코어 플럿(plot), C : PCA 로딩값, D : PLS-DA 스코어 플럿
도 2는 FT-IR 스펙트럼 데이터와 이소플라본 성분들의 상관관계 분석을 나타낸다. A : 아글리콘 계열의 글리시테인(Glycitein), B : 글루코시드 계열의 다이진(Daidzin), C : 말로닐글루코시드 계열의 말-글리시틴(Mal-Glycitin), D : 아세틸글루코시드 계열의 제니스틴(Ac-Genistin)
도 3은 글루코시드 계열의 이소플라본인 다이진(Daidzin)의 PLS 정량 예측 모델을 이용한 예측값과 실측값의 상관분석을 나타낸다.
도 4는 말로닐글루코시드 계열의 이소플라본의 PLS 정량 예측 모델을 이용한 예측값과 실측값의 상관분석을 나타낸다. A : 말-다이진(Mal-Daidzin), B : 말-제니스틴(Mal-Genistin), C : 말-글리시틴(Mal-Glycitin)
도 5는 아세틸글루코시드 계열의 이소플라본인 아세틸-제니스틴(Ac-Genistin)의 PLS 정량 예측 모델을 이용한 예측값과 실측값의 상관분석을 나타낸다.
상기 목적을 달성하기 위해, 본 발명은
(a) 콩과작물의 종자를 동결건조 후 분말화하는 단계;
(b) 상기 (a)단계의 분말화된 콩과작물의 종자를 유기용매로 추출하여 추출물을 얻는 단계;
(c) 상기 (b)단계의 추출물을 이용하여 FT-IR (Fourier-transform infrared) 스펙트럼 프로파일을 얻는 단계;
(d) 상기 (c)단계의 FT-IR 스펙트럼 프로파일을 이용하여 다변량 통계분석 (mutivariate analysis)을 수행하는 단계;
(e) 상기 (b)단계의 추출물을 HPLC(High Performance Liquid Chromatography)로 이소플라본 함량을 정량 분석하는 단계;
(f) 상기 (d)단계의 FT-IR 스펙트럼 프로파일의 다변량 통계 분석 결과 및 (e)단계의 이소플라본의 정량값 사이의 상관관계를 분석하는 단계;
(g) 상기 (f)단계의 분석된 상관관계를 PLS 회귀분석 (Partial Least Square regression)을 이용하여 콩과작물 내의 이소플라본 함량 예측 모델을 도출하는 단계; 및
(h) 상기 (g)단계의 도출된 콩과작물 내의 이소플라본 함량 예측 모델을 이용하여 미지의 콩과작물 내의 이소플라본 함량을 예측하는 단계를 포함하는 콩과작물 내의 이소플라본 함량을 예측하는 방법을 제공한다.
본 발명의 일 구현 예에 따른 방법에서, 상기 콩과작물은 바람직하게는 강낭콩, 나방콩, 녹두, 동부, 리마콩, 렌즈콩, 말콩, 완두, 작두콩, 제비콩, 팥, 또는 대두콩 작물일 수 있고, 가장 바람직하게는 대두콩 작물일 수 있으나, 이에 제한되지 않는다.
본 발명의 일 구현 예에 따른 방법에서, 상기 유기용매는 헥산, 에테르, 벤젠, 아세트산에틸, 클로로포름, 아세토나이트릴, 메탄올 등 종래 알려진 추출 용매라면 어느 것이든 적용 가능하며, 바람직하게는 메탄올일 수 있고, 가장 바람직하게는 20~60%(v/v) 메탄올일 수 있으나, 이에 제한되지 않는다.
본 발명의 대사 관련 후보 돌연변이체의 대량 선발을 목적으로 FT-IR 기기를 사용하여 스펙트럼 프로파일을 획득하며, 스펙트럼 프로파일 중 1800~800 cm-1 범위의 데이터를 다변량 통계분석법 특히 PCA(Principle component analysis) 및 LDA(Linear discriminant analysis)를 사용하여 분석하였다. 이때 구동체계는 R 프로그램을 사용하나, 이에 한정되지 않는다.
본 발명의 일 구현 예에 따른 방법에서, 상기 콩과작물의 식별을 위한 FT-IR 스펙트럼 파장의 범위는 바람직하게는 1650~1550㎝-1 및 1150~1000㎝- 1 일 수 있으나, 이에 제한되지 않는다.
본 발명의 일 구현 예에 따른 방법에서, 상기 다변량 통계분석은 바람직하게는 PCA (Principle component analysis), LDA (Linear discriminant analysis) 및 PLS-DA (partial least squires discriminant analysis)로 이루어진 군으로부터 선택되는 하나 이상의 방법일 수 있고, 가장 바람직하게는 PCA 및 PLS-DA일 수 있으나, 이에 제한되지 않는다.
본 발명의 일 구현 예에 따른 방법에서, 상기 이소플라본은 바람직하게는 글루코시드(glucoside) 계열, 말로닐글루코시드(malonylglucoside) 계열 또는 아세틸글루코시드(Acetylglucoside) 계열의 이소플라본일 수 있고, 더욱 바람직하게는 다이진(daidzin), 글리시틴(glycitin) 또는 제니스틴(genistin)의 글루코시드 계열의 이소플라본; 말-다이진(mal-daidzin), 말-글리시틴(mal-glycitin) 또는 말-제니스틴(mal-genistin)의 말로닐글루코시드 계열의 이소플라본; 또는 아세틸-다이진(Ac-daidzin), 아세틸-글리시틴(Ac-glycitin) 또는 아세틸-제니스틴(Ac-genistin)의 아세틸글루코시드 계열의 이소플라본일 수 있고, 가장 바람직하게는 글루코시드 계열의 다이진(daidzin), 말로닐글루코시드 계열의 말-다이진(mal-daidzin), 말-글리시틴(mal-glycitin) 또는 말-제니스틴(mal-genistin), 아세틸글루코시드 계열의 아세틸-제니스틴(Ac-genistin)일 수 있으나, 이에 제한되지 않는다.
본 발명의 일 구현 예에 따른 방법에서, 상기 (h) 단계의 미지의 콩과작물 내의 이소플라본 함량의 예측은 미지의 콩과작물 종자의 유기용매 추출물의 FT-IR (Fourier-transform infrared) 스펙트럼 프로파일 값을 상기 (g)단계에서 도출된 콩과작물 내의 이소플라본 함량 예측 모델에 도입하여 이루어질 수 있다.
이하, 본 발명을 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.
재료 및 방법
대두콩
실험에 사용된 대두콩은 부산대학교에서 107점 (GB-1 ~ 107)을 분양받았고, 한국생명공학연구원에서 46점(GK-1 ~ 46)을 분양받아 총 153점을 사용하였다. 153점의 대두콩은 건조된 상태로 분쇄하여 분말형태로 사용하였다. 분쇄된 153점의 대두콩 종자시료는 -70℃ 초저온 냉동고에 보관하였다. 또한, 실험에 사용될 시료는 153점의 시료 중 23점을 추출하여 FT-IR 분석 및 HPLC 정량분석에 사용하였다(표 1).
Figure 112012098385550-pat00001
tr : table row
대두콩 전세포 추출물 제조
대두콩 23점의 대두콩 분말 20 mg을 1.5 ml 에펜도르프 튜브에 넣고 20%(v/v) 메탄올 용액을 200㎕씩 첨가하여 잘 섞어주었다. 각 튜브를 50℃ 수조에서 20분간 반응시킨 다음 13,000rpm에서 15분간 원심분리한 후 상층액을 새로운 튜브에 옮겼다. 새로운 튜브에 옮긴 시료는 다시 한번 13,000rpm에서 5분간 원심분리하고 찌꺼기가 들어가지 않도록 상층액을 조심스럽게 새로운 튜브에 옮겼다. 추출된 추출물은 -20℃에서 보관하여 FT-IR (Fourier transform infrared) 스펙트럼 분석에 사용하였다.
FT - IR 스펙트럼과 데이터 전처리 및 다변량 통계분석
FT-IR(Fourier transform infrared) 스펙트럼 조사는 Tensor 27 (Bruker Optics GmbH, Ettlingen, Germany)을 사용하였고, DTGS (deuterated triglycine sulfate) 검출기로 분석하였다. 추출된 각각의 시료를 5 ㎕씩 384-well ZnSe 플레이트에 분주하여, 37℃ 핫 플레이트에서 약 20분간 건조하였다. 건조된 ZnSe 플레이트는 Tensor 27에 장착된 HTS-XT (Bruker Optics GmbH) 고효율 자동화 장치를 이용하여 스펙트럼을 측정하였다. 각 시료의 스펙트럼은 총 4000 ~ 400 cm-1 범위에서 그리고 4 cm-1 간격으로 총 128회 반복 측정된 평균 스펙트럼을 분석에 사용되었다. 각 시료는 각각 3 반복으로 FT-IR 스펙트럼을 반복 측정하였다. FT-IR 스펙트럼 조사 및 데이터 변환에 사용된 프로그램은 Bruker에서 제공하는 OPUS Lab (ver. 6.5, Bruker Optics Inc.)를 사용하였다. FT-IR 스펙트럼 데이터의 다변량 통계분석을 위해 먼저 FT-IR 스펙트럼 데이터의 베이스라인 교정과 표준화는 OPUS Lab (var. 7.0, Bruker Optics Inc.)을 사용하였고, 평균 집중화(mean centering) 스펙트럼의 전처리 과정을 phyton 2.7 프로그램을 이용하여 수행하였다. 베이스라인 교정을 위해 FT-IR 스펙트럼 분석 영역의 양 끝점(1800-800cm-1)의 흡광도를 0으로 조정하였으며, 실험상의 오차를 최소화하기 위하여 각 스펙트럼을 동일 면적으로 표준화하였다. 이후 데이터의 평균 집중화 과정을 거쳐 2차 미분한 다음 다변량 통계분석 분석을 위한 표준화된 데이터로 사용하였다.
가공된 FT-IR 스펙트럼 데이터는 NIPALS 알고리즘 (Wold 1966 In: K. R. Krishnaiah (ed.). Multivariate Analysis. Academic Press, New York, p. 391-420)을 이용하여 R 프로그램(version 2.15.0)을 사용하여 PCA (Principal component analysis)와 PLS-DA (Partial least squares discrminant) 분석을 수행하였다(Trygg et al. 2007 J. Proteomes Res. 6: 467-479).
이소플라본 함량과 FT - IR 스펙트럼의 상관관계 분석 및 예측 모델링
대두콩으로부터 이소플라본 함량 예측 모델을 만들기 위해 X는 FT-IR 스펙트럼 데이터를 사용하고, Y는 HPLC 분석에서 얻어진 정량값을 사용하였다. 두 가지 변수의 정보를 적용하여 R 프로그램(version 2.15.0)을 이용해 PLS 회귀분석을 수행하였다. 두 부분으로 나눈 데이터셋(dateset)은 모델을 만들기 위한 트레이닝 셋(training set)으로 사용되었고, 회귀분석 모델(regression model)을 만들기 위한 테스트 셋(test set)으로 사용되지 않았지만, 모델을 예측하기 위해서 사용하였다. X와 Y 사이에서 산출된 상관관계 값을 회귀계수로 사용하였다.
또한, 예측 모델을 만들기 위해 예측 함량을 측정하였다. 예측 함량을 산출하기 위해서 23개의 데이터를 두 부분으로 나눠 13개의 데이터를 트레이닝 셋(training set)으로 사용하고, 10개의 데이터를 테스트 셋으로 사용하여 예측값을 산출하기 위해 사용하였다. 또한, PLS 모델에서 이소플라본 성분들의 실측값과 예측 모델에서 구한 예측값 사이에 RMSEP(root mean square error of prediction)을 측정하였다.
Figure 112012098385550-pat00002
여기서, Ycv ,i는 트레이닝 셋에 사용된 샘플이 제외된 교정식에서 Xi를 예측한 값이다.
또한, PLS 정량 예측 모델의 실용을 위해 임의의 FT-IR 스펙트럼 데이터 10개를 테스트 셋으로 사용하여 RMSEP와 예측값을 측정하였다.
실시예 1. 대두콩의 FT - IR 스펙트럼 비교 분석
대두콩으로부터 전세포 추출물의 FT-IR 스펙트럼 데이터의 다변량통계분석을 통해 주요 대두콩의 대사체 수준에서 유연관계 규명 및 식별체계를 확립하였다. 대두콩은 FT-IR 스펙트럼상의 1500 ~ 1700, 1300 ~ 1500, 950 ~ 1100 cm-1 부위에서 대사체의 양적, 질적 패턴 변화가 크게 이루어짐을 알 수 있었다(도 1A). FT-IR 스펙트럼의 1500 ~ 1700, 1300 ~ 1500 그리고 950 ~ 1100 cm-1 부위는 각각 아미드 I 과 II을 포함하는 아미노산 및 단백질계열의 화합물, 인산이에스테르 그룹을 포함한 핵산 및 인지질 그리고 단당류나 복합 다당류를 포함하는 탄수화물 계열의 화합물들의 질적, 양적 정보를 반영하는 부위이다(Lopez-Sanchez et al. 2010 J Agric Food Chem. 58: 82-87). 즉 FT-IR 스펙트럼 상의 질적, 양적 차이는 283종의 대두콩 종자 내에 함유되어 있는 아미노산이나 단백질, 지방산, 그리고 탄수화물 계통의 화합물들의 질적, 양적 차이가 현저하게 나타남을 의미한다. 따라서 FT-IR 스펙트럼 분석은 대두콩의 주요 대사체의 질적, 양적 변화를 예측하고 함량이 높은 계통의 선발 수단으로 신속한 활용이 가능할 것으로 기대된다.
실시예 2. 다변량통계분석
23점의 대두콩 FT-IR 스펙트럼 데이터의 PCA 분석 결과 PC 1과 2 스코어는 각각 92.2%, 1.7%의 설명력을 갖고 있으며 전체 변이량의 약 93.9%를 반영하고 있음을 알 수 있었다(도 1B).
대두콩의 대사체 수준 식별에 있어 중요한 FT-IR 스펙트럼 부위를 조사하였다(도 1C). FT-IR 로딩값을 보면 PC 1 및 2의 분류하는 기준을 확연히 볼 수 있다. 대두콩의 식별에 있어 중요한 FT-IR 스펙트럼 부위는 1650 ~ 1550 과 1150 ~ 1000 cm-1 부위임을 알 수 있었다(도 1C). 이 부위는 FT-IR 스펙트럼 상에서 차이를 보였던 부위(도 1A)와 거의 일치하는 것으로 아미드 I, II와 탄수화물 계열의 화합물들의 질적, 양적 차이가 대두콩의 대사체 수준 식별에 중요한 역할을 하고 있음을 알 수 있었다(도 1C).
PLS-DA 분석의 경우 이소플라본 함량의 차이가 뚜렷하게 나타나지는 않았다(도 1D). PLS-DA 스코어 플럿(plot)을 보면 대두콩 23점이 3개의 그룹을 형성하는 모습을 볼 수 있다. 이는 대두콩 간의 이소플라본 함량이 대사체 수준에서 유연관계에 있음을 확인할 수 있었다(도 1D). FT-IR 스펙트럼 데이터 이용한 PLS-DA 분석으로 대두콩 간의 이소플라본 함량 차이 구분이 가능함을 알 수 있었다.
실시예 3. 이소플라본 함량과 FT - IR 스펙트럼의 상관관계 분석
이소플라본 함량 예측 모델을 만들기 위해 PLS 회귀분석을 실행한 결과, FT-IR 스펙트럼과 HPLC에서 얻어진 정량값의 유연관계가 높음을 알 수 있었다(도 2). 이소플라본 성분들 중 아글리콘(aglycone) 계열에 글리시테인(glycitein)의 경우 상관지수가 R = 0.995로 높은 상관관계를 나타냈고(도 2A), 글루코시드 계열인 다이진(daidzin) 성분과의 상관지수가 R = 0.997로 높게 나타났다(도 2B). 또한, 말로닐글루코시드(malonylglucoside) 계열의 성분인 말-글리시틴(mal-glycitin) 성분의 상관지수가 R = 0.997로 높게 나타났고(도 2C), 아세틸글루코시드(acetylglucoside) 계열의 아세틸-제니스틴(Ac-genistin) 성분 또한 상관지수가 R = 0.995로 높게 나타났다(도 2D).
이와 같은 결과를 볼 때 FT-IR 스펙트럼과 이소플라본의 유연관계가 상당히 높을 것을 알 수 있었고, 다른 성분들 또한 높은 상관관계를 나타냈다. 이 관계들을 분석해 보면 PLS 함량 예측 모델로서 적합함을 알 수 있었다.
실시예 4. 이소플라본 성분별 PLS 함량 예측 모델링
이소플라본 PLS 함량 예측 모델을 제시하기 위해 FT-IR 스펙트럼과 HPLC 분석에서 얻어진 정량값을 PLS 기법을 이용하여 CV(cross-validation)의 RMSEP를 구할 수 있었다(표 2). 각각 성분들의 RMSEP 값을 분석한 결과, 예측 모델을 만들기 위한 CV에서 낮은 오차값을 얻을 수 있었다(표 2). 그 중에서 아글리콘 계열에 글리시테인(glycitein) 및 글루코시드 계열인 다이진(daidzin) 성분의 경우 7 component에서 38.81 및 66.93으로 각각 나타났고, 말로닐글루코시드(malonylglucoside) 계열의 성분인 말-글리시틴(mal-glycitin) 성분은 6 component에서 53.60으로 나타났다. 또한, 아세틸글루코시드(acetylglucoside) 계열의 아세틸-제니스틴(Ac-genistin) 성분은 10 component에서 10.06으로 나타났다. 이는 성분들 간에 함량의 차이를 반영하고 있기 때문에 최대치의 함량과 최소치의 함량 차이를 볼 때, 낮은 수준임을 알 수 있었다(표 1). 또한, 트레이닝 가변성을 볼 때, 아글리콘 계열에 글리시테인과 글루코시드 계열인 다이진(daidzin) 성분의 경우 7 component에서 96.70%와 96.46%으로 각각 나타났고, 말로닐글루코시드 계열의 성분인 말-글리시틴(mal-glycitin) 성분은 6 component에서 97.21%, 아세틸글루코시드 계열의 아세틸-제니스틴(Ac-genistin) 성분은 10 component에서 96.40%를 나타내고 있기 때문에 함량 간에 차이를 충분히 반영하였다고 판단된다(표 3).
위에서 얻어진 관계식을 이용하여 테스트 셋으로 작용한 10개의 개체에 대한 예측값을 구하였고, 이에 따른 트레이닝 셋과의 RMSEP와 R2 값을 구하였다(표 4). 이 결과에서 마찬가지로 아글리콘 계열에 글리시테인과 글루코시드 계열인 다이진 성분의 경우 7 component에서 6.39, 11.58의 RMSEP, 0.967, 0.986의 R2 값을 각각 나타났고, 말로닐글루코시드 계열의 성분인 말-글리시틴 성분은 6 component에서 7.56의 RMSEP, 0.972의 R2 값을 나타났다. 또한, 아세틸글루코시드 계열의 아세틸-제니스틴 성분은 10 component에서 1.52의 RMSEP, 0.964의 R2 값을 나타났다(표 4).
Figure 112012098385550-pat00003
Figure 112012098385550-pat00004
Figure 112012098385550-pat00005
상기 결과처럼, 상관관계식과의 유연성이 상당히 높게 나타났고, 이를 이용하여 10개의 개체에 대한 예측값을 구하여 상관관계식을 만들었다(도 3, 도 4 및 도 5). 아글리콘 계열에 다이드제인(daidzein) 성분의 경우 예측값과 실측값의 상관지수가 R2 = 0.068로 낮게 나타났고, 제니스테인(genistein) 성분의 경우 R2 = 0.027, 글리시테인(glycitein) 성분의 경우 R2 = 0.02로 상관지수가 낮게 나타났다(데이터 미제시). 이는 트레이닝 셋에 포함하고 있는 개체들 중에서 글리시테인 성분을 함유하지 않은 개체들까지 예측값을 나타냈기 때문이다(표 1).
R2 는 상관관계의 정도를 수량적으로 표시한 것으로서, 보통 r로 표시된다. r의 값이 +1의 경우에는 두 현상 사이에 완전한 적극적 상관관계가 있는 것이며, -1일 때는 완전한 소극적 상관관계가 있으며, 0일 때는 하등의 관계가 없다는 것을 의미한다. 상관계수의 산출에는 피어슨(Pearson)의 편차적법(偏差積法) 및 상대적 위치를 이용하는 스피어만의 열위차법(列位差法)이 주로 쓰여지고 있다.
글루코시드 계열인 다이진인 성분의 경우 예측값과 실측값의 상관지수가 R2 = 0.67로 예측치에 60~70% 정도가 실측값에 근접했다는 것을 알 수 있었다(도 3). 또한, 말로닐글루코시드 계열의 성분인 말-다이진(mal-daidzin) 성분은 예측값과 실측값의 상관지수가 R2 = 0.65로 70% 이상 실측값에 근접했다는 것을 나타냈다(도 4A). 또한, 말-제니스틴(mal-genistin) 및 말-글리시틴(glycitin)의 경우 상관지수가 각각 0.188, 0.176으로 나타내어 예측률이 40% 이상을 나타내 예측이 가능할 것으로 나타났다(도 4B 및 도 4C). 또한, 아세틸글루코시드 계열의 아세틸-제니스틴 성분의 예측값과 실측값의 상관지수가 R2 = 0.37로 나타났다(도 5). 이는 트레이닝 셋에 들어간 데이터들의 실측 데이터 범위가 낮고, 테스트 셋에 들어간 데이터의 실측값이 예측값의 범위보다 크게 나타나 낮은 상관지수의 값을 얻었다(표 1).

Claims (10)

  1. (a) 콩과작물의 종자를 동결건조 후 분말화하는 단계;
    (b) 상기 (a)단계의 분말화된 콩과작물의 종자를 유기용매로 추출하여 추출물을 얻는 단계;
    (c) 상기 (b)단계의 추출물을 이용하여 FT-IR(Fourier-transform infrared) 스펙트럼 프로파일을 얻는 단계;
    (d) 상기 (c)단계의 FT-IR 스펙트럼 프로파일을 이용하여 다변량 통계분석(mutivariate analysis)을 수행하는 단계;
    (e) 상기 (b)단계의 추출물을 HPLC(High Performance Liquid Chromatography)로 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량을 정량 분석하는 단계;
    (f) 상기 (d)단계의 FT-IR 스펙트럼 프로파일의 다변량 통계 분석 결과 및 (e)단계의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본의 정량값 사이의 상관관계를 분석하는 단계;
    (g) 상기 (f)단계의 분석된 상관관계를 PLS 회귀분석 (Partial Least Square regression)을 이용하여 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량 예측 모델을 도출하는 단계; 및
    (h) 상기 (g)단계의 도출된 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량 예측 모델을 이용하여 미지의 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량을 예측하는 단계를 포함하는 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량을 예측하는 방법.
  2. 제1항에 있어서, 상기 콩과작물은 강낭콩, 나방콩, 녹두, 동부, 리마콩, 렌즈콩, 말콩, 완두, 작두콩, 제비콩, 팥, 또는 대두콩 작물인 것을 특징으로 하는 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량을 예측하는 방법.
  3. 제1항에 있어서, 상기 유기용매는 메탄올인 것을 특징으로 하는 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량을 예측하는 방법.
  4. 제1항에 있어서, 상기 콩과작물의 식별을 위한 FT-IR 스펙트럼 파장의 범위는 1650~1550㎝-1 및 1150~1000㎝-1 인 것을 특징으로 하는 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량을 예측하는 방법.
  5. 제1항에 있어서, 상기 다변량 통계분석은 PCA (Principle component analysis), LDA (Linear discriminant analysis) 및 PLS-DA (partial least squires discriminant analysis)로 이루어진 군으로부터 선택되는 하나 이상의 방법을 통해 수행하는 것을 특징으로 하는 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량을 예측하는 방법.
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 제1항에 있어서, 상기 (h) 단계의 미지의 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량의 예측은 미지의 콩과작물 종자의 유기용매 추출물의 FT-IR (Fourier-transform infrared) 스펙트럼 프로파일 값을 상기 (g)단계에서 도출된 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량 예측 모델에 도입하여 이루어지는 것을 특징으로 하는 콩과작물 내의 다이진(daidzin) 또는 말-다이진(mal-daidzin)의 이소플라본 함량을 예측하는 방법.
KR1020120135714A 2012-11-28 2012-11-28 콩과작물 내의 이소플라본 함량 예측 모델을 이용한 콩과작물 내의 이소플라본 함량을 예측하는 방법 KR101539631B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120135714A KR101539631B1 (ko) 2012-11-28 2012-11-28 콩과작물 내의 이소플라본 함량 예측 모델을 이용한 콩과작물 내의 이소플라본 함량을 예측하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120135714A KR101539631B1 (ko) 2012-11-28 2012-11-28 콩과작물 내의 이소플라본 함량 예측 모델을 이용한 콩과작물 내의 이소플라본 함량을 예측하는 방법

Publications (2)

Publication Number Publication Date
KR20140069385A KR20140069385A (ko) 2014-06-10
KR101539631B1 true KR101539631B1 (ko) 2015-07-27

Family

ID=51124469

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120135714A KR101539631B1 (ko) 2012-11-28 2012-11-28 콩과작물 내의 이소플라본 함량 예측 모델을 이용한 콩과작물 내의 이소플라본 함량을 예측하는 방법

Country Status (1)

Country Link
KR (1) KR101539631B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101885652B1 (ko) * 2016-09-09 2018-08-06 강원대학교산학협력단 대사체 기술을 이용한 식물의 퇴화종실 판별 방법
CN107102069A (zh) * 2017-03-14 2017-08-29 上海优久生物科技有限公司 一种快速测定饲料添加剂中6种大豆异黄酮的方法
CN109425663B (zh) * 2017-08-24 2021-06-15 湖南中烟工业有限责任公司 一种基于稀疏性假设分解与解析混合质谱的方法
CN108195952A (zh) * 2017-12-07 2018-06-22 佛山科学技术学院 一种检测蜜醋黑豆中染料木苷的方法
CN114018666A (zh) * 2021-11-04 2022-02-08 山东东宇生态科技有限公司 一种大豆异黄酮的检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009278986A (ja) * 1999-12-17 2009-12-03 Mitsunori Ono 水溶性の豆ベース抽出物
KR101202282B1 (ko) * 2010-11-22 2012-11-16 고려대학교 산학협력단 1h-nmr 및 다변량통계분석을 이용한 인삼의 연근 판별 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009278986A (ja) * 1999-12-17 2009-12-03 Mitsunori Ono 水溶性の豆ベース抽出物
KR101202282B1 (ko) * 2010-11-22 2012-11-16 고려대학교 산학협력단 1h-nmr 및 다변량통계분석을 이용한 인삼의 연근 판별 방법

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
논문명1 *
논문명1*
논문명2 *
논문명2*

Also Published As

Publication number Publication date
KR20140069385A (ko) 2014-06-10

Similar Documents

Publication Publication Date Title
KR101539631B1 (ko) 콩과작물 내의 이소플라본 함량 예측 모델을 이용한 콩과작물 내의 이소플라본 함량을 예측하는 방법
Kim et al. NMR-based plant metabolomics: where do we stand, where do we go?
Wolfender et al. Plant metabolomics: from holistic data to relevant biomarkers
Marchev et al. Metabolomics and health: from nutritional crops and plant-based pharmaceuticals to profiling of human biofluids
Khakimov et al. Trends in the application of chemometrics to foodomics studies
Schripsema Application of NMR in plant metabolomics: techniques, problems and prospects
Zhang et al. Rapid determination of leaf water content using VIS/NIR spectroscopy analysis with wavelength selection
Choi et al. Classification of Ilex species based on metabolomic fingerprinting using nuclear magnetic resonance and multivariate data analysis
Mazurek et al. Analysis of milk by FT-Raman spectroscopy
Cozzolino Metabolomics in grape and wine: Definition, current status and future prospects
Monakhova et al. Current role and future perspectives of multivariate (chemometric) methods in NMR spectroscopic analysis of pharmaceutical products
Gavaghan et al. Directly coupled high-performance liquid chromatography and nuclear magnetic resonance spectroscopic with chemometric studies on metabolic variation in Sprague–Dawley rats
Kim et al. Isoflavones profiling of soybean [Glycine max (L.) Merrill] germplasms and their correlations with metabolic pathways
Colquhoun Use of NMR for metabolic profiling in plant systems
Lee et al. Seed maturity differentially mediates metabolic responses in black soybean
Turi et al. Metabolomics for phytochemical discovery: development of statistical approaches using a cranberry model system
Otify et al. Unveiling metabolome heterogeneity and new chemicals in 7 tomato varieties via multiplex approach of UHPLC-MS/MS, GC–MS, and UV–Vis in relation to antioxidant effects as analyzed using molecular networking and chemometrics
KR101721735B1 (ko) Ft-ir 분광분석기를 통한 부모계 계통으로부터 f1잡종종자의 신속한 구별
Ali et al. NMR spectroscopy and chemometrics as a tool for anti-TNFα activity screening in crude extracts of grapes and other berries
Roos et al. Classification and correlation of St. John's wort extracts by nuclear magnetic resonance spectroscopy, multivariate data analysis and pharmacological activity
Marshall et al. Monitoring chemical changes during food sterilisation using ultrahigh resolution mass spectrometry
Shree et al. Metabolite profiling and metabolomics of plant systems using 1H NMR and GC-MS
Simmler et al. Holistic analysis enhances the description of metabolic complexity in dietary natural products
Liu et al. Chemometric analysis based on HPLC multi-wavelength fingerprints for prediction of antioxidant components in Turpiniae Folium
Jun et al. Radical scavenging activity and content of cynarin (1, 3-dicaffeoylquinic acid) in Artichoke (Cynara scolymus L.)

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant