KR101859410B1 - Method, Apparatus for Regional Food Safety Factor Computing, And a Computer-readable Storage Medium for executing the Method - Google Patents

Method, Apparatus for Regional Food Safety Factor Computing, And a Computer-readable Storage Medium for executing the Method Download PDF

Info

Publication number
KR101859410B1
KR101859410B1 KR1020160135493A KR20160135493A KR101859410B1 KR 101859410 B1 KR101859410 B1 KR 101859410B1 KR 1020160135493 A KR1020160135493 A KR 1020160135493A KR 20160135493 A KR20160135493 A KR 20160135493A KR 101859410 B1 KR101859410 B1 KR 101859410B1
Authority
KR
South Korea
Prior art keywords
information
food
model
safety
nonlinear regression
Prior art date
Application number
KR1020160135493A
Other languages
Korean (ko)
Other versions
KR20180043420A (en
Inventor
김현정
김승민
옥경식
김장원
정도헌
김영민
정창후
김태홍
이종경
Original Assignee
한국식품연구원
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국식품연구원, 한국과학기술정보연구원 filed Critical 한국식품연구원
Priority to KR1020160135493A priority Critical patent/KR101859410B1/en
Publication of KR20180043420A publication Critical patent/KR20180043420A/en
Application granted granted Critical
Publication of KR101859410B1 publication Critical patent/KR101859410B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Mining

Abstract

본 발명은 지역별 식재료 안전지수 산출방법, 그 장치 및 그 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 본 발명에 따른 지역별 식재료 안전지수 산출방법은 식재료에 관한 지역별 재배환경 및 기상에 관한 정보와 식중독 발생 정보 간의 상관관계에 관한 비선형 회귀모델을 구축하여 안전진단모델을 도출하는 단계; 및 상기 안전진단모델에 기초하여 지역별 식재료 안전지수를 산출하는 단계를 포함한다.
이에 의해 식재료의 식중독 위험성을 증가시킬 것으로 예상되는 식재료의 지역별 재배환경에 관한 정보를 식재료 안전지수 산출의 기초자료로 활용함으로써 보다 정확한 식재료 안전지수를 산출할 수 있다. 또한, 비선형 회귀모델을 적용함으로써 입력과 출력의 패턴이 비선형적일 때에도 쉽게 적용할 수 있고, 입력 변수를 쉽게 추가하여 테스트할 수 있으며, 데이터 불균형의 문제를 해결하기 위해 새로운 샘플링 방식을 적용함으로써 모델링 성능을 향상시킬 수 있다.
The present invention relates to a computer-readable recording medium storing a program for executing a method for calculating a food safety index of a region, a device thereof, and a method for calculating the safety index of a region, And deriving a safety diagnostic model by constructing a nonlinear regression model on the correlation between the information on the weather and the occurrence of food poisoning; And calculating a regional food safety index based on the safety diagnosis model.
Thus, by using the information on the cultivation environment of the region of the foodstuffs expected to increase the food poisoning risk of the foodstuffs as the basic data of the foodstuff safety index, a more accurate food safety index can be calculated. In addition, by applying the nonlinear regression model, it is easy to apply even when the input and output patterns are nonlinear, and it is possible to test easily by adding input variables. By applying a new sampling method to solve the data unbalance problem, Can be improved.

Description

지역별 식재료 안전지수 산출방법, 그 장치 및 그 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체{Method, Apparatus for Regional Food Safety Factor Computing, And a Computer-readable Storage Medium for executing the Method}TECHNICAL FIELD [0001] The present invention relates to a method for calculating a food-material safety index for a region, a method for calculating the food-material safety index for each region, and a computer-readable storage medium storing a program for executing the method,

본 발명은 지역별 식재료 안전지수 산출방법, 그 장치 및 그 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 비선형 회귀모델을 적용한 지역별 식재료 안전지수 산출방법, 그 장치 및 그 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.The present invention relates to a method for calculating a food safety index of a region, a device therefor, and a computer-readable recording medium recording a program for executing the method, and more particularly, to a method for calculating a food safety index of a region to which a nonlinear regression model is applied, The present invention relates to a computer-readable recording medium storing a program for causing a computer to execute the program.

최근 식품 안전 사고가 빈번하게 일어나면서 식품 안전에 관한 국민의 관심이 높아지고 있다. 식품의 첨가물의 증가, 신종 유해물질의 등장, 유통망의 발달과 국제적인 무역의 증가로 인해 식품 안전 사고의 원인이나 행태가 복잡해짐에 따라 식품안전의 체계적이고 효율적인 관리의 필요성이 대두되고 있다. Recently, as food safety accidents are frequent, public concern about food safety is increasing. As the causes and behavior of food safety accidents become complicated due to the increase of food additives, the emergence of new harmful substances, the development of distribution network and the increase of international trade, the need for systematic and efficient management of food safety is emerging.

종래 식품의 식중독지수나 식단 관리 시스템 등은 온도와 습도 정보만을 기초로 하여 안전지수를 산출하여 식중독 지수를 예보하고 있다. 예컨대 온도와 습도정보에 기초한 식중독 지수 테이블에 기초해서 지역별 온도와 습도를 표에 적용하여 식중독 위험지수를 산출한다. Conventionally, the food poisoning index and the food management system of the food and the like are based on only temperature and humidity information, and the safety index is calculated to predict the food poisoning index. For example, based on the table of food poisoning indices based on temperature and humidity information, the food poisoning risk index is calculated by applying regional temperature and humidity to the table.

그러나 식중독 사고는 집단급식소와 음식점의 위생 관리에 기인한 것도 있지만, 원재료의 생산지, 유통 과정 가운데 오염문제로 기인한 경우도 적지 않다. However, food poisoning accidents are caused by hygiene control of group foodservice and restaurants, but there are also a few cases of contamination problems in the production and distribution of raw materials.

2002년부터 2013년 식약처 자료에 따르면, 국내 식품안전 사고 중 유해미생물로 인한 사고가 전체의 약 60%를 차지하고 있는 것으로 알려져 있다. 현재 전 세계적으로 신선 상태로 섭취되는 농산물에 의한 식중독 사고가 증가하고 있으며, 가열하지 않고 섭취하는 특성상 재배환경 오염에 따른 농산물 오염이 식품 안전 위험 요인 중 하나인 것으로 지목되고 있다.According to data from 2002 to 2013, it is known that accidents caused by harmful microorganisms account for about 60% of domestic food safety accidents. Currently, food poisoning accidents due to freshly consumed agricultural products are increasing in the world, and it is pointed out that contamination of agricultural products due to environmental pollution is one of food safety risk factors due to the characteristic of ingestion without heating.

이러한 유해미생물로 인한 식재료 오염은 주로 사람과 동물의 분변으로 야기되며, 홍수, 침수, 기온 상승 등 기상 조건에 따라 토질 및 수질 오염 가능성이 증가하고 이에 따라 식재료 오염 위험도가 상승한다. Food pollution caused by harmful microorganisms is mainly caused by feces of people and animals, and the possibility of soil and water pollution increases according to weather conditions such as flood, flood, temperature rise, and the risk of food contamination increases.

하지만, 종래 식중독 지수 산출방법은 이러한 식재료의 유통과정이나 조리과정에서 유입될 수 있는 식중독 바이러스나 식중독 원인균으로 인한 식중독 위험 가능성을 전혀 고려하지 못하고 있다.However, the conventional method of calculating food poisoning index does not take into consideration the possibility of food poisoning due to food poisoning virus or food poisoning causative bacteria which may be introduced during the distribution process or cooking process of such food ingredients.

한편, 종래에는 포아송 회귀모형이나 자기회귀(Auto Regressive; AR), 자기회귀누적이동평균모형(Auto Regressive Integrated Moving Average; ARIMA) 등의 시계열 회귀모델이 주로 식중독 예측 모델에 사용되어 왔다. In the past, time series regression models such as Poisson regression model, Auto Regressive (AR), and Auto Regressive Integrated Moving Average (ARIMA) have been used predominantly in food poisoning prediction models.

그러나, 종래의 시계열 회귀모델은 패턴이 비선형적일 때 적용이 불가능한 단점이 있다. 또한, 식중독 발생 등 위험 예측과 관련한 데이터는 일반적으로 발생샘플이 매우 적기 때문에 데이터 불균형 때문에 모델링 성능에 문제가 발생한다.However, the conventional time series regression model has a disadvantage that it can not be applied when the pattern is nonlinear. In addition, data on risk prediction, such as food poisoning, are generally problematic due to data imbalance due to very few occurrence samples.

본 발명에서는 식재료의 식중독 위험성을 증가시킬 것으로 예상되는 식재료의 지역별 재배환경에 관한 정보를 식재료 안전지수 산출의 기초자료로 하는 식재료 안전지수 산출장치 및 그 방법을 제공하는데 목적이 있다. 또한, 비선형 회귀모델을 적용한 식재료 안전지수 산출장치 및 그 방법을 제공하는데 목적이 있다. 또한, 식중독 발생 데이터의 새로운 샘플링 방법을 제공하는데 그 목적이 있다. The present invention aims at providing a food material safety index calculating device and method thereof, in which the information on the cultivation environment of a region of a foodstuff expected to increase the risk of food poisoning of food ingredients is used as a basis for calculating the food safety index. Also, it is an object of the present invention to provide a food material safety index calculating apparatus and a method thereof that employ a nonlinear regression model. Another object of the present invention is to provide a new sampling method of food poisoning occurrence data.

상기 목적은 지역별 식재료 안전지수 산출방법에 있어서, 식재료에 관한 지역별 재배환경 및 기상에 관한 정보와 식중독 발생 정보 간의 상관관계에 관한 비선형 회귀모델을 구축하여 안전진단모델을 도출하는 단계; 및 상기 안전진단모델에 기초하여 지역별 식재료 안전지수를 산출하는 단계를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출방법에 의해 달성될 수 있다. The above object is achieved by a non-linear regression model for the correlation between food-related information and food-related-environment-related information on the cultivation environment and weather of a food material, And calculating a regional food safety index based on the safety diagnosis model.

여기서, 상기 비선형 회귀모델은 서포트 벡터 회귀 모델(Support Vector Regression; SVR) 또는 최소 자승 서포트 벡터 머신(Least Squares Support Vector Machines; LS-SVM)을 포함할 수 있다. . Here, the non-linear regression model may include a support vector regression model (SVR) or a least squares support vector machine (LS-SVM). .

그리고, 상기 지역별 재배환경에 관한 정보는 지역별 침수 정보, 및 축산농가 정보를 포함하고, 상기 지역별 기상에 관한 정보는 온도 정보, 습도 정보, 및 강수량정보를 포함할 수 있다. The information on the cultivation environment for each region includes the flood information for each region and the information on the livestock farming, and the information about the weather for each region may include temperature information, humidity information, and precipitation amount information.

또한, 상기 식재료 안전지수는 식중독 지수를 포함할 수 있다. In addition, the food safety index may include a food poisoning index.

더 나아가, 상기 안전진단모델을 도출하는 단계는, 식재료에 관한 지역별 재배환경, 기상 및 식중독 발생정보를, 학습을 위한 데이터로 변환하는 단계; 상기 비선형 회귀모델의 구축을 위해 샘플들을 선택하는 단계; 및 상기 샘플들을 이용하여 상기 비선형 회귀모델을 학습하는 단계를 포함할 수 있다. Further, the step of deriving the safety diagnosis model may include converting the cultivation environment, meteorological conditions and food poisoning occurrence information for the local ingredients into data for learning; Selecting samples for building the nonlinear regression model; And learning the nonlinear regression model using the samples.

여기서, 상기 샘플들을 선택하는 단계는 시군구 단위의 식중독 발생정보를 시도 단위로 평균값을 취하여 샘플로 선택하는 단계를 포함할 수 있다. Here, the step of selecting the samples may include sampling the food poisoning occurrence information of each city or district unit by taking an average value in units of a trial.

그리고, 상기 지역별 재배환경에 관한 정보는 지역별 농산물 정보를 더 포함할 수 있다. Further, the information on the cultivation environment by region may further include information on agricultural products by region.

상기 목적은 식재료 안전지수산출방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해서도 달성될 수 있다. The above object can also be achieved by a computer-readable recording medium recording a program for executing the method of calculating the food safety index.

한편, 상기 목적은 지역별 식재료 안전지수 산출장치에 있어서, 식재료에 관한 지역별 재배환경 및 기상에 관한 정보와 식중독 발생 정보 간의 상관관계에 관한 비선형 회귀모델을 구축하여 안전진단모델을 도출하는 비선형 회귀모델링부; 및 지역별 재배환경 및 기상에 관한 데이터를 입력받아 상기 안전진단모델에 기초하여 지역별 안전지수를 산출하는 안전지수산출부를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치에 의해서도 달성될 수 있다. The above object is achieved by a nonlinear regression modeling unit for deriving a safety diagnosis model by constructing a nonlinear regression model on the correlation between information on the cultivation environment and weather of the region and the occurrence of food poisoning, ; And a safety index calculating unit that receives data on the cultivation environment and weather of each region and calculates a safety index for each region based on the safety diagnosis model.

여기서, 상기 비선형 회귀모델링부는 상기 수집한 정보를 모델 학습을 위한 학습데이터와 모델 테스트를 위한 테스트데이터로 구축하는 데이터베이스부; 상기 학습데이터를 이용하여 상기 비선형 회귀모델을 학습하는 비선형 회귀모델학습부; 및 상기 비선형 회귀모델을 테스트데이터를 이용하여 검증하는 모델검증부를 포함할 수 있다. Here, the nonlinear regression modeling unit may include a database unit that constructs the collected information as learning data for model learning and test data for model testing; A nonlinear regression model learning unit for learning the nonlinear regression model using the learning data; And a model verification unit for verifying the nonlinear regression model using test data.

상기한 바와 같이, 본 발명에 의한 식재료 안전지수 산출장치 및 그 방법은 식재료의 식중독 위험성을 증가시킬 것으로 예상되는 식재료의 지역별 재배환경에 관한 정보를 식재료 안전지수 산출의 기초자료로 활용함으로써 보다 정확한 식재료 안전지수를 산출할 수 있다. 또한, 비선형 회귀모델을 적용함으로써 입력과 출력의 패턴이 비선형적일 때에도 쉽게 적용할 수 있고, 입력 변수를 쉽게 추가하여 테스트할 수 있다는 점에서 장점이 있다. 또한, 데이터 불균형의 문제를 해결하기 위해 새로운 샘플링 방식을 적용함으로써 모델링 성능을 향상시킬 수 있다.As described above, the apparatus and method for calculating the safety index of a food according to the present invention can provide information on the cultivation environment of a foodstuff, which is expected to increase the risk of food poisoning of foodstuffs, The safety index can be calculated. In addition, the application of the nonlinear regression model makes it easy to apply even when the input and output patterns are non-linear, and it is advantageous in that the input variables can be easily added and tested. In addition, modeling performance can be improved by applying a new sampling method to solve the problem of data imbalance.

도 1은 본 발명의 제1 실시예에 따른 지역별 식재료 안전지수 산출장치의 개략도이다.
도 2는 본 발명의 일 실시예에 따른 비선형 회귀모델링부(20)의 개략도이다.
도 3은 2006년 5월 1일에서 2012년 4월 30일까지의 데이터로 학습된 본 발명에 따른 안전진단모델의 학습 집합에 대한 모델 피팅 결과를 나타낸다.
도 4는 2006/05/01 ~ 2012/04/30 데이터로 학습된 모델을 이후 4개월 데이터로 예측한 결과를 나타낸다.
도 5는 도 1의 지역별 식재료 안전지수 산출장치를 이용한 본 발명의 제2 실시예에 따른 지역별 식재료 안전지수 산출방법의 흐름도를 나타낸 것이고, 도 6은 도 5의 S10단계의 상세를 나타낸 도면이다.
1 is a schematic view of a food ingredient safety index calculating device according to a first embodiment of the present invention.
2 is a schematic diagram of a nonlinear regression modeling unit 20 according to an embodiment of the present invention.
FIG. 3 shows the model fitting results for the learning set of the safety diagnosis model according to the present invention learned from the data from May 1, 2006 to April 30, 2012.
Fig. 4 shows the result of prediction of the model learned from the data of 2006/05/01 to 2012/04/30 with the data of the next four months.
FIG. 5 is a flowchart illustrating a method of calculating the safe index of foodstuffs according to a second embodiment of the present invention using the regional food safety index calculating device of FIG. 1, and FIG. 6 is a detailed view of step S10 of FIG.

이하, 도면을 참조하여 본 발명의 구체적인 실시예들에 대해 설명하기로 한다.Hereinafter, specific embodiments of the present invention will be described with reference to the drawings.

본 발명에 따른 지역별 식재료 안전지수 산출장치와 그 산출방법은 식중독이 발현될 수 있는 기상 조건 및 환경 요인과 재배환경에 영향을 미칠 수 있는 다양한 지역적 조건들을 고려하여 지역별로 식품 안전을 예측할 수 있다. 본 발명은 실제 식중독이 발생했던 과거 정보를 활용하여 식중독 발생 시의 입력 데이터 패턴을 분석하여 주어진 날짜와 지역의 식중독 위험을 예측하는 비선형 회귀모델에 기초한 안전진단모델을 제시한다. According to the present invention, the food safety index calculating device and the calculating method thereof can predict the food safety by region in consideration of the weather conditions and environment factors in which food poisoning can be expressed and various regional conditions that may affect the cultivation environment. The present invention proposes a safety diagnosis model based on a nonlinear regression model that predicts the risk of food poisoning at a given date and region by analyzing input data patterns at the time of food poisoning, using past information on actual food poisoning.

도 1은 본 발명의 제1 실시예에 따른 지역별 식재료 안전지수 산출장치의 개략도이다. 1 is a schematic view of a food ingredient safety index calculating device according to a first embodiment of the present invention.

도 1을 참조하면, 본 발명의 제1 실시예에 따른 지역별 식재료 안전지수 산출장치는 비선형 회귀모델링부(20) 및 안전지수산출부(30)를 포함한다.Referring to FIG. 1, the regional food safety index calculating apparatus according to the first embodiment of the present invention includes a nonlinear regression modeling unit 20 and a safety index calculating unit 30.

비선형 회귀모델링부(20)는 식재료에 관한 지역별 재배환경 및 기상에 관한 정보와 식중독 발생 정보 간의 상관관계에 관한 안전진단모델을 비선형 회귀모델로 구축하는 것으로, 본 발명에 따른 안전진단모델은 종래의 식중독지수산출모델과는 달리 재배환경에 따른 식재료 안전을 진단하기 위해 지역별 재배환경의 특성을 고려한 모델이라는 점과, 안전진단모델 도출 시 비선형 회귀모델로서 서포트 벡터 회귀모델(Support Vector Regression;SVR)을 활용한다는 점에서 큰 특징이 있다. The nonlinear regression modeling unit 20 constructs a safety diagnosis model for the correlation between the information on the environment and the climate of the area and the occurrence of food poisoning in each region by using a nonlinear regression model. Unlike the food poisoning index calculation model, it is a model that considers the characteristics of the cultivation environment in each region in order to diagnose food safety according to the cultivation environment, and the support vector regression (SVR) as a nonlinear regression model in deriving the safety diagnosis model. There is a big feature in that it utilizes.

본 발명에서는 바텀업(bottom-up) 방식으로 접근하여 실제 식중독이 발생했던 과거 정보를 활용하여 식중독 발생 시의 재배 환경 및 지역, 기상 조건의 패턴을 분석하여 미래의 식중독 위험에 대한 예측이 가능하도록 안전진단모델을 개발한다. 일반적인 식중독 예측 모델에 사용되는 포아송 회귀모형이나 자기회귀(Auto Regressive; AR), 자기회귀누적이동평균모형(Auto Regressive Integrated Moving Average; ARIMA) 등의 시계열 회귀모델은 패턴이 비선형적일 때 적용이 불가능한 단점이 있다. 본 발명의 안전진단모델은 비선형 회귀모델을 이용하는데, 그 중에서도 기계학습 분류 기법인 서포트 벡터 머신(Support Vector Machine; SVM)의 회귀분석용 버전인 서포트 벡터 회귀모델 또는 최소 자승 서포트 벡터 머신(Least Squares Support Vector Machines; LS-SVM)을 적용한다. 식중독 예측 모델에 서포트 벡터 회귀모델을 적용한 것은 본 발명에서 처음 시도되는 것으로, 기존의 회귀모델에 비해 뛰어난 점은 패턴이 비선형적일 때에도 쉽게 적용할 수 있다는 것과 입력 요소를 쉽게 추가하여 테스트할 수 있다는 점에서 장점이 있다.According to the present invention, by using the bottom-up approach, it is possible to predict future food poisoning risks by analyzing patterns of cultivation environment, regions, and weather conditions at the time of food poisoning using past information that actual food poisoning occurred Develop a safety diagnosis model. Time series regression models such as the Poisson regression model, the Auto Regressive (AR), and the Auto Regressive Integrated Moving Average (ARIMA) used in the general food poisoning prediction model are disadvantages that can not be applied when the pattern is nonlinear . The safety diagnosis model of the present invention uses a nonlinear regression model. Among them, a support vector regression model or a least squares support vector machine (Least Squares), which is a regression analysis version of a support vector machine (SVM) Support Vector Machines (LS-SVM). The application of the support vector regression model to the food poisoning prediction model is first attempted in the present invention. The superiority over the existing regression model is that it can be easily applied even when the pattern is nonlinear, There are advantages in.

본 발명에 따른 안전진단모델의 구축에 필요한 데이터는 데이터수집부(10)를 통해 수집될 수 있다. 데이터수집부(10)는 지역별 식재료 안전지수 산출장치에 포함되어 구현될 수도 있고, 별도의 데이터수집서버로 구현될 수도 있다. Data necessary for constructing the safety diagnosis model according to the present invention can be collected through the data collection unit 10. [ The data collecting unit 10 may be included in the regional food safety index calculating apparatus or may be implemented as a separate data collection server.

도 1을 참조하면, 데이터수집부(10)에서 수집하는 식재료 안전에 관한 정보는 식재료의 재배환경에 관한 정보, 기상정보, 및 식중독 정보로서, 지역별 재배환경에 관한 정보는 지역별 침수 정보, 농산물 정보, 축산농가정보를 포함하고, 기상정보는 과거 및 현재의 기상정보로서 지역별 온도, 습도, 강수량 정보를 포함한다. 식중독 정보는 식중독 발생 현황 및 현장 조사결과 정보, 식중독 발생과 관련된 예상되는 원인 음식, 섭취 장소, 시간, 환자 통계 등에 대한 정보를 포함할 수 있다. 또한, 침수 정보는 침수지역, 침수원인 하천, 침수종류, 침수지의 용도, 침수시간에 관한 정보를 포함할 수 있다. 데이터수집부(10)는 미리 타겟되어 있는 특정 사이트에 있는 특정 정보를 수집하거나, 뉴스나 SNS 데이터에 포함된 식재료 및 식재료 안전 관련 정보를 수집한다. 데이터수집부(10)에서 수집하는 정보는 과거와 현재의 식재료의 재배환경에 관한 정보, 기상정보, 및 식중독 정보를 포함한다.1, the information on the safety of the foodstuffs collected by the data collecting unit 10 includes information on the cultivation environment of the foodstuffs, weather information and food poisoning information, information on the cultivation environment by region includes information on flood information by region, , And livestock farming information, and the weather information includes past, present, and current weather information including temperature, humidity, and precipitation information by region. Food poisoning information may include information on the status of food poisoning and on-site investigation results, possible cause foods related to food poisoning, place of consumption, time, and patient statistics. In addition, the flood information may include information on the flooded area, the source of flooding, the type of flood, the use of the floodplain, and the time of flood. The data collecting unit 10 collects specific information in a specific site targeted in advance or collects information related to food ingredients and food safety contained in news or SNS data. The information collected by the data collecting unit 10 includes past and present information on the cultivation environment of the foodstuff, weather information, and food poisoning information.

도 2는 본 발명의 일 실시예에 따른 비선형 회귀모델링부(20)의 개략도이다. 도 2를 참조하면, 비선형 회귀모델링부(20)는 데이터베이스부(21), 비선형 회귀모델학습부(23), 모델검증부(25) 및 안전기준산정부(27)를 포함한다. 데이터베이스부(21)는 데이터수집부(10)에서 수집한 정보를 모델 학습을 위한 학습데이터와 모델 테스트를 위한 테스트데이터로 구축한다. 비선형 회귀모델링부(20)는 학습데이터로 모델을 학습한 후 학습된 모델의 예측 정확도를 테스트데이터로 검증하게 된다. 2 is a schematic diagram of a nonlinear regression modeling unit 20 according to an embodiment of the present invention. 2, the nonlinear regression modeling unit 20 includes a database unit 21, a nonlinear regression model learning unit 23, a model verification unit 25, and a safety criterion calculation unit 27. [ The database unit 21 constructs the information collected by the data collecting unit 10 as learning data for model learning and test data for model testing. The nonlinear regression modeling unit 20 learns the model with the learning data and then verifies the prediction accuracy of the learned model with the test data.

본 발명에 따른 비선형 회귀모델링부(20)는 재배환경에 영향을 미칠 수 있는 다양한 지역적 조건들 및 식중독이 발현될 수 있는 여러 가지 기상환경 요인을 고려한다는 점에서 큰 특징이 있으며, 본 발명에서는 식재료 재배환경 및 식중독 발현에 영향을 미칠 수 있는 요소로서, 지역별 축산농가 규모, 과거 침수 발생 유무, 일일 최고기온, 일일 최저기온, 일일 평균기온, 습도, 강수량을 입력변수로 고려한다. 또한, 입력변수로서 해당 지역의 농산물 정보나 농산물 유통정보 또는 급식정보 등을 추가적으로 고려할 수 있다. 전술한 입력변수는 일 예에 불과하며, 재배환경 중에서 다른 입력변수가 고려될 수 있음은 물론이다. 데이터베이스에 구축되는 데이터는 지역별 데이터로서, 예컨대 시군구 단위의 데이터로 구축한다. 이는 지역별로 안전진단지수를 산출하기 위함이다. The nonlinear regression modeling unit 20 according to the present invention has a great feature in that it takes into consideration various local conditions that may affect the cultivation environment and various weather environment factors in which food poisoning can be manifested, Factors influencing the cultivation environment and food poisoning can be influenced by the size of the regional farmland, past flood occurrence, daily maximum temperature, daily minimum temperature, daily average temperature, humidity, and precipitation. In addition, as an input variable, agricultural products information, agricultural distribution information, or food information can be additionally considered in the area. It should be noted that the above-described input variables are only examples, and other input variables may be considered in the cultivation environment. The data to be built in the database is region-specific data, for example, data of units of city or district. This is to calculate the safety diagnosis index by region.

기계학습 모델을 사용하여 예측 모델을 만들 때 중요한 것은 예측 목적에 맞게 입력 샘플을 정의하고 예측해야할 출력값을 정의하는 것임. 또한 입력값을 구성하는 자질(feature)을 잘 선택하고 정의하는 것도 예측 성능을 좌우하는 중요한 요소이다. 본 발명에서는 지역별 재배환경의 차이를 충실히 반영하기 위해 전국 226개 시군구 단위로, 매일 날짜별로 안전진단 지수를 예측할 수 있도록 한다. 이를 위해 각 입력 샘플은 시군구당 하나씩 생성되어야 하며, 안전진단지수는 매일 계산하여야 하므로 날짜별로 각 시군구에 대해 하나씩 입력 샘플이 생성되도록 한다.When creating a predictive model using a machine learning model, it is important to define the input samples for the purpose of the prediction and to define the output values to be predicted. It is also important to select and define the features that make up the input value. In the present invention, in order to faithfully reflect the difference of the cultivation environment in each region, the safety diagnosis index can be predicted every day in 226 city and county districts nationwide. For this purpose, each input sample should be generated for each town / village, and since the safety diagnosis index should be calculated daily, one input sample is generated for each town / village by date.

아래 표 1은 본 발명의 안전진단모델의 입력샘플자질정의를 나타낸다. Table 1 below shows input sample qualification definitions of the safety diagnostic model of the present invention.

입력자질Input qualities 의미meaning 최고 기온highest temperature 해당 날짜, 지역의 최고기온Date, local maximum temperature 최저 기온Lowest temperature 해당 날짜, 지역의 최저기온The date, the lowest temperature in the region 평균 기온Average temperature 해당 날짜, 지역의 평균기온The date, the average temperature of the area 강수량Precipitation 해당 날짜, 지역의 평균 강수량Average date of precipitation 평균습도Average humidity 해당 날짜, 지역의 평균 습도Average date, average humidity 축산농가 개수Number of livestock farms 해당 지역의 축산농가 개수Number of livestock farms in the area 5년간 침수 빈도수Frequency of immersion for 5 years 해당 지역 최근 5년 사이의 침수 횟수Number of inundations in the region during the last five years 해당 월That month 해당 날짜의 월Month of the date 해당 주That week 해당 날짜의 주Week of the day

위 각 입력 샘플에 해당하는 출력값은 그날 그 지역에서 일어나는 식중독의 횟수로 정의하며, 입력 샘플이 학습데이터일 때 그 값은 과거 발생한 식중독 횟수이며 과거 발생한 식중독 통계 데이터로부터 추출한다. 입력 샘플이 테스트데이터일 때 그 값은 예측해야 할 값에 해당한다. 데이터베이스부(21)는 위와 같이 입력 샘플과 출력 값을 정의한 후 수집한 데이터를 사용하여 모델 학습과 테스트를 위한 데이터를 구축한다. The output value corresponding to each input sample is defined as the number of food poisoning occurrences in the area that day. When the input sample is the learning data, the value is the number of food poisoning occurred in the past and extracted from past food poisoning statistical data. When the input sample is test data, the value corresponds to the value to be predicted. The database unit 21 defines input samples and output values as described above, and then builds data for model learning and testing using the collected data.

특성characteristic value 수집된 데이터 기간Collected data duration 2002/01/01 ~2016/06/302002/01/01 - 2016/06/30 수집 대상 지역Collection area 전국 226개 시군구226 municipalities nationwide 입력 샘플 개수Number of input samples 1,079,5771,079,577 식중독이 발생한 (positive) 샘플 개수Number of positive samples of food poisoning 3,4193,419 식중독이 발생하지 않은 (negative) 샘플 개수Number of negative samples without food poisoning 1,076,1581,076,158

위 표 2는 데이터베이스부(21)에 구축된 데이터의 특성의 일 예를 나타낸 것으로, 데이터가 수집된 기간은 식중독 통계 자료가 존재하는 2002년 1월 1일부터 시작하여 2016년 6월 30일까지이고, 전국 시군구에 대해 조사하였다. 한편 식중독 데이터는 식중독이 발생한 샘플 개수가 그렇지 않은 샘플에 비해 아주 적은 불균형 데이터 러닝(Imbalanced Data Learning)의 문제가 발생하는데, 이 경우 모델 학습을 할 수 없다. 본 발명에서는 이를 해결하기 위해 새로운 샘플링 방법을 제시한다. 종래에는 샘플링 불균형의 방법을 해결하기 위해 주로 입력 좌표 상에서 샘플들 간의 거리를 고려하여 샘플링하는 방법을 채택하는 것이 주된 방법이었다면, 본 발명에서는 지역별로 주어지는 입력을 묶어 대푯값을 취하는 최적화된 샘플링 방식으로 이 문제를 해결한다. 즉, 식중독이 발생하지 않은 네거티브(negative) 샘플을 그대로 사용하지 않고 전처리 과정을 거치는데 예컨대, 시군구 단위의 샘플을 시도 단위로 묶어 각 자질의 평균값을 취하도록 한다. 이에 의해, 특정 날짜의 226개의 샘플이 17개로 축소되고, 이렇게 전처리를 거친 네거티브(negative) 샘플은 1,076,158에서 76,561개로 축소될 수 있다. Table 2 shows an example of the characteristics of the data constructed in the database unit 21. The data collection period starts from January 1, 2002, when food poisoning statistics are available, until June 30, 2016 And investigated nationwide city and county districts. On the other hand, food poisoning data has a problem of Imbalanced Data Learning, in which the number of samples of food poisoning is much smaller than that of samples that do not have food poisoning. The present invention proposes a new sampling method to solve this problem. Conventionally, in order to solve the sampling imbalance method, if it was the main method to adopt sampling method considering the distance between the samples on the input coordinates, in the present invention, an optimized sampling method of taking a representative value by grouping input given by region Solve the problem. That is, a negative sample without food poisoning is not used as it is, but a preprocessing process is performed. For example, a sample of a city or municipality unit is tied to a unit of trial to take an average value of each property. As a result, 226 samples of a specific date are reduced to 17, and the thus-processed negative samples can be reduced from 1,076,158 to 76,561.

비선형 회귀모델학습부(23)는 모델 학습을 위한 학습데이터로 모델을 학습하기 위한 것으로, 전술한 바와 같이, 안전진단모델은 비선형 회귀모델로서 서포트 벡터 회귀모델을 활용한다. 종래 선형관계, 로그선형관계, 또는 자기회귀 모델의 경우, 입력과 출력의 상관관계를 미리 정하고 모델링을 해야 하는 반면, 본 발명에 따른 비선형 회귀모델은 그러한 제약 없이 학습을 통해 상관관계 패턴을 찾아낸다. 즉, 종래의 방법과는 달리 입력변수를 상관관계에 대한 가정 없이 바로 추가할 수 있으므로, 새로운 입력에 대한 모델링이 용이하다. The nonlinear regression model learning unit 23 is for learning a model with learning data for model learning. As described above, the safety diagnosis model utilizes a support vector regression model as a nonlinear regression model. In the case of the conventional linear relationship, logarithmic linear relation, or autoregressive model, the correlation between the input and the output must be predetermined and modeled, while the nonlinear regression model according to the present invention finds correlation patterns through learning without such constraints . That is, unlike the conventional method, input variables can be directly added without assuming a correlation, so that modeling of a new input is easy.

아래 수학식 1은 본 발명의 안전진단모델인 서포트 벡터 회귀모델(Support Vector Regression;SVR)을 수식으로 나타낸 것이다. Equation (1) below expresses a support vector regression model (SVR) as a safety diagnosis model of the present invention.

Figure 112016101226979-pat00001
Figure 112016101226979-pat00001

s.t.

Figure 112016101226979-pat00002
,
Figure 112016101226979-pat00003
st
Figure 112016101226979-pat00002
,
Figure 112016101226979-pat00003

본 발명에 따른 비선형 회귀모델학습부(23)는 파이썬 머신 러닝 툴킷(python machine learning toolkit)인 scikit-learn의 SVM 라이브러리를 사용하여 서포트 벡터 회귀모델을 학습한다. 주어진 학습 데이터로 모델 학습이 끝나면 테스트 샘플들을 학습된 모델 수식에 넣어서 결과값을 계산한다. 이때 결과로 나온 값은 위에서 정의한 일일 식중독발생횟수가 되며, 해당 값이 높을수록 식중독 발생 가능성이 높아지므로 그 지역의 그날 식재료 위험도가 증가한다고 볼 수 있다.The nonlinear regression model learning unit 23 according to the present invention learns the support vector regression model using the scikit-learn SVM library, which is a python machine learning toolkit. When the model learning is finished with the given learning data, the test samples are put into the learned model formula and the result is calculated. The resulting value is the number of daily food poisonings as defined above, and the higher the value, the higher the likelihood of food poisoning.

전술한 바와 같이, 종래 식중독 예측 모델은 식중독 발생 샘플이 매우 부족하다는 문제 때문에 시군구 단위로 바로 모델링을 하지 못하고 전국 등으로 통합하여 모델링을 하였다. 따라서 종래 식중독 예측모델은 지역의 기상정보 등의 입력값이 그대로 사용되는 것이 아니라 평균값으로 사용되어 식중독 발생 당시의 기상상태가 정확히 반영되기 어렵다는 문제가 있었으나, 본 발명은 새로운 샘플링 방식을 적용함으로써 식중독 발생 시의 조건이 정확히 반영된 비선형 모델을 구축할 수 있다. As described above, the conventional food poisoning prediction model can not be directly modeled in city or municipal district due to the problem that food poisoning occurrence samples are very insufficient. Therefore, the conventional food poisoning prediction model has a problem that the input value of the local weather information is not used as it is, but it is used as an average value and it is difficult to accurately reflect the weather condition at the time of food poisoning occurrence. However, It is possible to construct a nonlinear model in which the conditions of the time are accurately reflected.

모델검증부(25)는 학습된 모델의 예측 정확도를 테스트데이터로 검증하기 위한 것으로, 학습된 비선형 회귀모델인 서포트 벡터 회귀모델이 학습 데이터에 얼마나 잘 부합되는 지를 판단하기 위해 학습데이터 자체에 대해 검증과 학습한 모델에 관한 검증을 실시한다. 이상적인 경우라면, 실제 식중독이 일어난 지역, 날짜의 샘플을 넣으면 1 이상의 값이 나오고, 그렇지 않은 샘플을 넣으면 0의 값이 나와야 한다. 따라서 0과 1의 중간인 0.5를 기준으로 0.5 이상이면 식중독 발생, 0.5 이하이면 발생하지 않은 걸로 간주하기로 한다.The model verification unit 25 is used for verifying the predicted accuracy of the learned model with the test data. The model verification unit 25 verifies the learning data itself in order to determine how well the support vector regression model, which is the learned nonlinear regression model, And verification of the learned model. Ideally, a value of 1 or more should be given if the actual sample of the food poisoning occurred, or a value of 0 if the sample is not included. Therefore, it is assumed that food poisoning occurs if the value is 0.5 or more based on 0.5, which is the midpoint between 0 and 1, and not occurs when the value is 0.5 or less.

도 3은 2006년 5월 1일에서 2012년 4월 30일까지의 데이터로 학습된 본 발명에 따른 안전진단모델의 학습 집합에 대한 모델 피팅 결과를 나타낸다. 각 샘플에 대한 모델 계산 값들을 범주로 나누어 카운팅한 후, 정규화된 히스토그램으로 나타낸 것이다. 왼편의 푸른색 히스토그램은 negative 샘플들의 결과값이고 오른편의 초록색 히스토그램은 positive 샘플들의 결과값으로, 0.5 기준으로 봤을 때 negative 샘플들의 precision은 90.8%, positive 샘플들의 precision은 79%로서 피팅 성능이 뛰어난 것을 알 수 있다. FIG. 3 shows the model fitting results for the learning set of the safety diagnosis model according to the present invention learned from the data from May 1, 2006 to April 30, 2012. The model calculations for each sample are divided into categories and counted, and are shown as normalized histograms. The blue histogram on the left is the result of the negative samples and the green histogram on the right is the result of the positive samples. The precision of the negative samples is 90.8% and the precision of the positive samples is 79% Able to know.

도 4는 2006/05/01 ~ 2012/04/30 데이터로 학습된 모델을 이후 4개월 데이터로 예측한 결과를 나타낸다. 도 3과 같은 확연한 차이는 없으나 분포상의 유의미한 차이를 보인다. 예를 들면, positive 샘플의 경우 결과값이 0.35 이상인 것들이 26.26%, negative 샘플의 경우 결과값이 0.35 이상인 것들이 19.48%을 차지하고 있다.Fig. 4 shows the result of prediction of the model learned from the data of 2006/05/01 to 2012/04/30 with the data of the next four months. There is no obvious difference as shown in FIG. 3, but there is a significant difference in distribution. For example, 26.26% of positive samples have a result of 0.35 or more, and 19.48% of negative samples have a result of 0.35 or more.

안전기준산정부(27)는 모델검증부(25)의 검증결과에 기초하여 안전진단지수에 따른 안전진단레벨을 산정한다. 여기서, 식재료의 안전진단지수 및 안전진단레벨은 해당 지역의 식재료가 얼마나 안전한지 여부를 나타내는 지수로서, 식중독지수 등을 포함하는 개념이다. The safety criterion estimating section 27 calculates the safety diagnosis level according to the safety diagnosis index based on the verification result of the model verifying section 25. [ Here, the safety diagnosis index and the safety diagnosis level of the ingredients are indexes indicating how safe the food ingredients are in the area, including the food poisoning index and the like.

아래 표 3은 본 발명의 일 실시예에 따른 안전진단지수에 따른 안전진단레벨을 예시한 것이다. Table 3 below illustrates the level of safety diagnosis according to the safety diagnosis index according to an embodiment of the present invention.

단계step 판단기준Judgment Criteria 경고warning [안전진단 지수] >= 0.5 AND [지수 값이 0.5이상인 하위지역비율] > 0[Safety Diagnostic Index]> = 0.5 AND [Rate of sub-region where the exponent value is 0.5 or more]> 0 주의caution [안전진단 지수] >= 0.25 AND [안전진단 지수] < 0.5 AND [지수 값이 0.5 이상인 하위지역비율] > 0[Safety Diagnosis Index]> = 0.25 AND [Safety Diagnosis Index] <0.5 AND [Rate of Sub Area with Index Value of 0.5 or More]> 0 관심Attention ([안전진단 지수] < 0.25 OR [지수 값이 0.5이상인 하위지역비율] <= 0) AND [안전진단 지수] >= 0.175 (Safety Diagnostic Index) <0.25 OR [Percentage of subregion where index value is 0.5 or more] <= 0) AND [Safety Diagnostic Index]> = 0.175 정상normal [안전진단 지수] < 0.175 [Safety Diagnostic Index] <0.175

위 표 3의 안전진단레벨은 반복적인 실험을 거쳐 도출된 최적화된 안전진단레벨의 기준으로, 학습결과 및 검증결과에 따라 변경될 수 있음은 물론이다. It should be noted that the safety diagnostic level in Table 3 is based on the optimized safety diagnostic level derived through repeated experiments and can be changed according to the learning result and the verification result.

안전지수산출부(30)는 지역별 재배환경 및 기상에 관한 데이터를 입력받고, 전술한 비선형 회귀모델링부(20)에서 도출한 안전진단모델에 기초하여 지역별 식재료 안전지수를 산출하고 해당 값에 따라 안전진단레벨을 판단하기 위한 것이다. 예컨대, 경기도 포천시의 기상정보(일일 최고기온, 일일 최저기온, 일일 평균기온, 습도, 강수량), 축산정보, 침수정보 등을 본 발명의 안전진단모델에 입력하여 식재료 안전지수를 산출한다. 그 값이 0.5보다 큰 경우에는 '경고' 0.25 ~ 0.5인 경우 '주의', 0.175 ~ 0.25인 경우 '관심', 0.175보다 작은 경우 '정상'으로 안전진단레벨을 판단한다. The safety index calculating unit 30 receives data on the cultivation environment and weather of each region and calculates the safety index of the foodstuffs according to the region based on the safety diagnosis model derived from the nonlinear regression modeling unit 20, To determine the diagnostic level. For example, the food safety index is calculated by inputting the weather information (daily maximum temperature, daily minimum temperature, daily average temperature, humidity, precipitation), information on livestock, and flood information in the safety diagnosis model of the present invention. If the value is greater than 0.5, the safety diagnostic level is determined to be 'Warning' for 'Warning' 0.25 to 0.5, 'Interest' for 0.175 to 0.25, and 'Normal' if less than 0.175.

본 발명에 따른 안전진단모델은 지역별 예컨대, 시군구 단위로 산출되므로, 시도 단위의 식재료 안전지수를 산출하는 경우에는 시군구 단위의 결과를 시도 단위로 묶어 종합적인 판단을 하게 된다.Since the safety diagnosis model according to the present invention is calculated on a regional basis, for example, in a city or municipal district, when a food safety index is calculated in units of a trial, the result of a city or municipal unit is collectively grouped into trial units.

아래 표 4는 2016년 6월 1일에서 2016년 6월 30일 사이의 식재료 안전진단의 검증결과로서, 주의 이상으로 판단된 지역 중에서 실제로 식중독이 발생했는지 검증한 결과이다.Table 4 below shows the results of the food safety diagnosis from June 1, 2016 to June 30, 2016, which is the result of verifying whether food poisoning actually occurred among the areas judged to be abnormal.

검증항목Verification item value Recall(positive)Recall (positive) 0.50.5 Precision(positive)Precision (positive) 0.067796610169491530.06779661016949153 Recall(negative)Recall (negative) 0.63815789473684210.6381578947368421 Precision(negative)Precision (negative) 0.96039603960396040.9603960396039604 Micro precision/recallMicro precision / recall 0.631250.63125

위 검증결과를 보면, 본 발명에서 구축한 안전진단레벨에 따른 판단결과가 매우 정확하다는 것을 확인할 수 있다. As a result of the above verification, it can be confirmed that the determination result according to the safety diagnosis level constructed in the present invention is very accurate.

한편, 전술한 바와 같이, 본 발명의 다른 실시예에 따르면, 해당 침수 발생 시에 대응하는 농산물 정보 및 농산물 유통정보를 추가적으로 고려할 수 있으며, 해당 지역에서 소비되는 농산물의 오염 위험도를 모델에 적용하여 안전진단지수를 산출할 수 있다. 또한, 급식소에 제공되는 농산물 정보 및 식단정보 등을 추가적으로 고려하여 지역별 급식소의 식재료 위험도 등을 진단할 수도 있다. As described above, according to another embodiment of the present invention, it is possible to further consider the agricultural product information and the agricultural product distribution information corresponding to the occurrence of the flooding, and apply the risk of contamination of agricultural products consumed in the area to the model, The diagnostic index can be calculated. In addition, it is possible to diagnose the risk of food ingredients in local foodservice stations by taking into account the information on agricultural products and the information on food provided in the foodservice stations.

도 5는 도 1의 지역별 식재료 안전지수 산출장치를 이용한 본 발명의 제2 실시예에 따른 지역별 식재료 안전지수 산출방법의 흐름도를 나타낸 것이고, 도 6은 도 5의 S10단계의 상세를 나타낸 도면이다. 이하에서 전술한 실시예와 중복되는 설명은 생략하기로 한다.FIG. 5 is a flowchart illustrating a method of calculating the safe index of foodstuffs according to a second embodiment of the present invention using the regional food safety index calculating device of FIG. 1, and FIG. 6 is a detailed view of step S10 of FIG. Hereinafter, a description overlapping with the above-described embodiment will be omitted.

도 5를 참조하면, 먼저 식재료의 재배환경 및 기상에 관한 정보와 식중독 발생 정보 간의 상관관계에 관한 비선형 회귀모델을 구축하여 안전진단모델을 도출한다(S10). Referring to FIG. 5, a safety diagnostic model is derived by constructing a nonlinear regression model on the correlation between the information about the cultivation environment and the weather of the foodstuff and the food poisoning occurrence information (S10).

도 6을 참조하면, 본 발명에 따른 비선형 회귀모델링부(20)는 데이터수집부(10)에서 식재료에 관한 지역별 재배환경 정보, 기상정보 및/또는 식중독 정보를 수집하여 저장한다(S11). 여기서, 지역별 재배환경 정보는 지역별 침수 정보, 농산물 정보, 축산농가 정보를 포함하고, 지역별 기상정보는 온도 정보, 습도 정보, 및 강수량정보를 포함한다. 정보소스는 관련정보가 공개되어 있는 웹사이트 또는 SNS나 뉴스가 될 수 있다. Referring to FIG. 6, the nonlinear regression modeling unit 20 according to the present invention collects and stores region-specific cultivation environment information, weather information, and / or food poisoning information on the ingredients in the data collection unit 10 (S11). Here, the cultivating environment information includes the local flood information, the agricultural product information, and the livestock farming information, and the regional weather information includes the temperature information, the humidity information, and the precipitation information. The information source may be a website or SNS or news where relevant information is disclosed.

데이터베이스부(21)에서 수집한 데이터를 학습을 위한 학습데이터와 테스트를 위한 테스트데이터로 구축하고(S21), 이때, 식중독 발생 데이터에서 데이터 불균형의 문제를 해결하기 위해 시군구 데이터를 시도로 묶어서 평균값을 대표값으로 취하는 방법으로 샘플링한다.The data collected by the database unit 21 is constructed as learning data for learning and test data for testing (S21). At this time, in order to solve the problem of data imbalance in the food poisoning occurrence data, Sampling is performed by taking a representative value.

비선형 회귀모델학습부(23)는 이렇게 샘플링된 학습데이터를 이용하여 비선형 회귀모델을 학습한다(S23).The nonlinear regression model learning unit 23 learns a nonlinear regression model using the thus-sampled learning data (S23).

그리고, 모델검증부(25)를 통해 학습된 비선형 회귀모델 즉, 안전진단모델을 검증하는 절차를 거친다(S25). 그리고, 안전기준산정부(27)는 학습된 비선형 회귀모델에 의해 도출된 지역별 식재료 안전지수를 안전진단레벨로 구분하기 위한 기준을 선정한다(S27).Then, the nonlinear regression model, that is, the safety diagnosis model, which has been learned through the model verifying unit 25, is verified (S25). Then, the safety criterion estimating section 27 selects a criterion for classifying the local food safety index derived by the learned nonlinear regression model into the safety diagnosis level (S27).

안전지수산출부(30)는 도 6의 절차에 의해 도출된 본 발명에 따른 안전진단모델을 이용하여 해당 날짜의 식재료 안전지수를 산출하게 되는데, 입력변수에 해당하는 기상정보와 재배환경정보 등을 이용하여 안전진단모델에 적용하여 해당 지역의 해당 날짜의 식재료 안전지수를 산출한다(S11).The safety index calculating unit 30 calculates the food safety index of the corresponding date by using the safety diagnosis model according to the present invention derived by the procedure of FIG. 6, wherein the weather information and the cultivation environment information corresponding to the input variables And applied to the safety diagnosis model to calculate the food safety index of the corresponding date (S11).

이와 같이, 종래 식중독위험지수 산출모델은 온도와 습도만을 고려하였지만, 본 발명에서는 침수여부, 축산농가정보 등 식재료의 오염여부에 영향을 미칠 수 있는 다양한 데이터를 고려함으로써 보다 정확한 식재료 안전지수를 산출할 수 있다. Thus, although the conventional food poisoning risk index calculation model only considers temperature and humidity, the present invention calculates a more accurate food safety index by considering various data that may affect the contamination of foodstuffs such as immersion status and livestock farming information .

한편, 본 발명에 따른 식재료 안전지수 산출방법 이를 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해서도 달성될 수 있다. Meanwhile, the method for calculating the food material safety index according to the present invention can also be achieved by a computer-readable recording medium having recorded thereon a program therefor.

이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합하거나 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.While the present invention has been described in connection with what is presently considered to be the most practical and preferred embodiment, it is to be understood that the invention is not limited to the disclosed embodiments. That is, within the scope of the present invention, all of the components may be selectively coupled to one or more of them. In addition, although all of the components may be implemented as one independent hardware, some or all of the components may be selectively combined to perform a part or all of the functions in one or a plurality of hardware. As shown in FIG. The codes and code segments constituting the computer program may be easily deduced by those skilled in the art. Such a computer program can be stored in a computer-readable storage medium, readable and executed by a computer, thereby realizing an embodiment of the present invention. As the storage medium of the computer program, a magnetic recording medium, an optical recording medium, a carrier wave medium, or the like may be included.

또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재할 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미가 있다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Furthermore, the terms "comprises", "comprising", or "having" described above mean that a component can be implanted unless otherwise specifically stated, But should be construed as including other elements. All terms, including technical and scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs, unless otherwise defined. Commonly used terms, such as predefined terms, should be interpreted to be consistent with the contextual meanings of the related art, and are not to be construed as ideal or overly formal, unless expressly defined to the contrary.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The foregoing description is merely illustrative of the technical idea of the present invention, and various changes and modifications may be made by those skilled in the art without departing from the essential characteristics of the present invention. Therefore, the embodiments disclosed in the present invention are intended to illustrate rather than limit the scope of the present invention, and the scope of the technical idea of the present invention is not limited by these embodiments. The scope of protection of the present invention should be construed according to the following claims, and all technical ideas within the scope of equivalents should be construed as falling within the scope of the present invention.

10: 데이터수집부 20: 비선형 회귀모델링부
21: 데이터베이스부 23: 비선형 회귀모델학습부
25: 모델검증부 27: 안전기준산정부
30: 안전지수산출부
10: data collecting unit 20: nonlinear regression modeling unit
21: Database part 23: Nonlinear regression model learning part
25: Model verification part 27: Safety standard Acquisition part
30: Safety Index Calculation Section

Claims (18)

지역별 식재료 안전지수 산출방법에 있어서,
식재료에 관한 지역별 재배환경 및 지역별 기상에 관한 정보와 식중독 발생 정보 간의 상관관계에 관한 비선형 회귀모델을 구축하여 안전진단모델을 도출하는 단계; 및
상기 안전진단모델에 기초하여 지역별 식재료 안전지수를 산출하는 단계를 포함하며;
상기 안전진단모델은 지역별 축산농가 규모 및 과거 침수 발생 유무를 입력변수로 하여 재배환경에서의 식재료 오염 가능성이 식재료 안전지수 산출에 반영되도록 비선형 회귀모델을 통해 구축되는 것을 특징으로 하는 지역별 식재료 안전지수 산출방법.
In calculating the regional food safety index,
Establishing a nonlinear regression model on the correlation between information on food environment and regional climate and information on the occurrence of food poisoning, and deriving a safety diagnosis model; And
Calculating a regional food safety index based on the safety diagnostic model;
The safety diagnosis model is constructed by using a nonlinear regression model so that the possibility of food contamination in the cultivation environment is reflected in the calculation of the food safety index, using the scale of the local farm farmers and the presence or absence of past flooding as input variables. Way.
제1항에 있어서,
상기 비선형 회귀모델은 서포트 벡터 회귀 모델(Support Vector Regression; SVR) 또는 최소 자승 서포트 벡터 머신(Least Squares Support Vector Machines; LS-SVM)을 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출방법.
The method according to claim 1,
Wherein the nonlinear regression model includes a support vector regression model (SVR) or a least squares support vector machine (LS-SVM).
제1항에 있어서,
상기 지역별 기상에 관한 정보는 온도 정보, 습도 정보, 및 강수량정보를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출방법.
The method according to claim 1,
Wherein the regional weather information includes temperature information, humidity information, and precipitation information.
제1항에 있어서,
상기 식재료 안전지수는 식중독 지수를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출방법.
The method according to claim 1,
Wherein the food safety index includes a food poisoning index.
제1항에 있어서,
상기 안전진단모델을 도출하는 단계는, 식재료에 관한 지역별 재배환경, 기상 및 식중독 발생정보를, 학습을 위한 데이터로 변환하는 단계;
상기 비선형 회귀모델의 구축을 위해 샘플들을 선택하는 단계; 및
상기 샘플들을 이용하여 상기 비선형 회귀모델을 학습하는 단계를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출방법.
The method according to claim 1,
The step of deriving the safety diagnosis model includes the steps of converting the cultivation environment, weather and food poisoning occurrence information for each food material into data for learning;
Selecting samples for building the nonlinear regression model; And
And learning the nonlinear regression model using the samples. &Lt; RTI ID = 0.0 &gt; 8. &lt; / RTI &gt;
제5항에 있어서,
상기 샘플들을 선택하는 단계는 시군구 단위의 식중독 발생정보를 시도 단위로 평균값을 취하여 샘플로 선택하는 단계를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출방법.
6. The method of claim 5,
Wherein the step of selecting the samples includes a step of selecting a sample by taking an average value of food poisoning occurrence information per city unit as a unit of trial.
제1항에 있어서,
상기 지역별 재배환경에 관한 정보는 지역별 농산물 정보를 더 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출방법.
The method according to claim 1,
Wherein the information on the cultivation environment of each region further includes information on agricultural products by region.
제1항 내지 제7항 중 어느 하나의 항에 따른 식재료 안전지수산출방법을 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
A computer-readable recording medium recording a program for executing the method of calculating the food material safety index according to any one of claims 1 to 7.
지역별 식재료 안전지수 산출장치에 있어서,
식재료에 관한 지역별 재배환경 및 지역별 기상에 관한 정보와 식중독 발생 정보 간의 상관관계에 관한 비선형 회귀모델을 구축하여 안전진단모델을 도출하는 비선형 회귀모델링부; 및
지역별 재배환경 및 기상에 관한 데이터를 입력받아 상기 안전진단모델에 기초하여 지역별 안전지수를 산출하는 안전지수산출부를 포함하고;
상기 안전진단모델은 지역별 축산농가 규모 및 과거 침수 발생 유무를 입력변수로 하여 재배환경에서의 식재료 오염 가능성이 식재료 안전지수 산출에 반영되도록 비선형 회귀모델을 통해 구축되는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치.
In the regional food safety index calculating device,
Nonlinear regression modeling unit to derive a safety diagnosis model by constructing a nonlinear regression model on the correlation between information on food - related environmental conditions and regional climate and information on the occurrence of food poisoning; And
A safety index calculation unit for receiving data on a cultivation environment and weather of each region and calculating a safety index for each region based on the safety diagnosis model;
The safety diagnosis model is constructed by using a nonlinear regression model so that the possibility of food contamination in the cultivation environment is reflected in the calculation of the food safety index, using the scale of the local farm farmers and the presence or absence of past flooding as input variables. Device.
제9항에 있어서,
상기 비선형 회귀모델은 서포트 벡터 회귀 모델(Support Vector Regression; SVR) 또는 최소 자승 서포트 벡터 머신(Least Squares Support Vector Machines; LS-SVM)에 기초로 하는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치.
10. The method of claim 9,
Wherein the nonlinear regression model is based on a support vector regression model (SVR) or a least squares support vector machine (LS-SVM).
제9항 또는 제10항에 있어서,
식재료에 관한 지역별 재배환경, 기상에 관한 정보, 및 식중독 발생정보를 수집하는 데이터수집부를 더 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치.
11. The method according to claim 9 or 10,
And a data collecting unit for collecting information on the cultivation environment, weather information, and food poisoning occurrence information about the local ingredients of the food.
제11항에 있어서,
상기 비선형 회귀모델링부는 상기 데이터수집부에서 수집한 정보를 모델 학습을 위한 학습데이터와 모델 테스트를 위한 테스트데이터로 구축하는 데이터베이스부;
상기 학습데이터를 이용하여 상기 비선형 회귀모델을 학습하는 비선형 회귀모델학습부; 및
상기 비선형 회귀모델을 테스트데이터를 이용하여 검증하는 모델검증부를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치.
12. The method of claim 11,
Wherein the nonlinear regression modeling unit comprises: a database unit for constructing information collected by the data collecting unit as learning data for model learning and test data for model testing;
A nonlinear regression model learning unit for learning the nonlinear regression model using the learning data; And
And a model verifying unit for verifying the nonlinear regression model using test data.
제12항에 있어서,
상기 데이터베이스부는 시군구 단위의 식중독 발생정보를 시도 단위로 평균값을 취하여 상기 학습데이터와 상기 테스트데이터로 구축하는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치.
13. The method of claim 12,
Wherein the database unit constructs the learning data and the test data by taking an average value of the food poisoning occurrence information per city unit in units of a trial.
제12항에 있어서,
상기 비선형 회귀모델링부는 상기 식재료 안전지수에 따른 안전진단레벨의 기준을 산정하는 안전기준산정부를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치.
13. The method of claim 12,
Wherein the nonlinear regression modeling unit includes a safety criterion calculating unit for calculating a criterion of a safety diagnosis level according to the food safety index.
제9항 또는 제10항에 있어서,
상기 지역별 기상에 관한 정보는 온도 정보, 습도 정보, 및 강수량정보를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치.
11. The method according to claim 9 or 10,
Wherein the regional weather information includes temperature information, humidity information, and rainfall information.
제12항에 있어서,
상기 식중독 발생정보는 식중독 발생지역, 원인식품, 원인균, 발생장소, 발생건수, 환자수, 및 섭취자수에 관한 정보를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치.
13. The method of claim 12,
Wherein the food poisoning occurrence information includes information on a food poisoning occurrence area, cause food, causative bacteria, occurrence place, number of incidents, number of patients, and number of consumed persons.
제9항에 있어서,
상기 지역별 침수 정보는 침수지역, 침수원인 하천, 침수종류, 침수지의 용도, 침수시간에 관한 정보를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치.
10. The method of claim 9,
Wherein the local flood information includes information on a flooded area, a source of flooding, a kind of flooded water, a use of a flooded field, and a flood time.
제9항 또는 제10항에 있어서,
상기 식재료 안전지수는 식중독 지수를 포함하는 것을 특징으로 하는 지역별 식재료 안전지수 산출장치.
11. The method according to claim 9 or 10,
Wherein the food safety index includes a food poisoning index.
KR1020160135493A 2016-10-19 2016-10-19 Method, Apparatus for Regional Food Safety Factor Computing, And a Computer-readable Storage Medium for executing the Method KR101859410B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160135493A KR101859410B1 (en) 2016-10-19 2016-10-19 Method, Apparatus for Regional Food Safety Factor Computing, And a Computer-readable Storage Medium for executing the Method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160135493A KR101859410B1 (en) 2016-10-19 2016-10-19 Method, Apparatus for Regional Food Safety Factor Computing, And a Computer-readable Storage Medium for executing the Method

Publications (2)

Publication Number Publication Date
KR20180043420A KR20180043420A (en) 2018-04-30
KR101859410B1 true KR101859410B1 (en) 2018-05-21

Family

ID=62081114

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160135493A KR101859410B1 (en) 2016-10-19 2016-10-19 Method, Apparatus for Regional Food Safety Factor Computing, And a Computer-readable Storage Medium for executing the Method

Country Status (1)

Country Link
KR (1) KR101859410B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101475445B1 (en) * 2013-08-29 2014-12-22 (유)호정솔루션 Method for providing product prediction service base on geographic information system
KR101609600B1 (en) * 2014-11-26 2016-04-07 한국식품연구원 Method and system for providing food quality information based on location

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101475445B1 (en) * 2013-08-29 2014-12-22 (유)호정솔루션 Method for providing product prediction service base on geographic information system
KR101609600B1 (en) * 2014-11-26 2016-04-07 한국식품연구원 Method and system for providing food quality information based on location

Also Published As

Publication number Publication date
KR20180043420A (en) 2018-04-30

Similar Documents

Publication Publication Date Title
Braunisch et al. Predicting species distributions based on incomplete survey data: the trade‐off between precision and scale
Hochachka et al. Data‐mining discovery of pattern and process in ecological systems
Kell et al. Evaluation of the prediction skill of stock assessment using hindcasting
Fu et al. Comparison of phenology models for predicting the onset of growing season over the Northern Hemisphere
Jones-Farrand et al. Comparison of statistical and theoretical habitat models for conservation planning: the benefit of ensemble prediction
Özçelik et al. Modeling stem profile of Lebanon cedar, Brutian pine, and Cilicica fir in Southern Turkey using nonlinear mixed-effects models
VanderZaag et al. Towards an inventory of methane emissions from manure management that is responsive to changes on Canadian farms
CN103310388B (en) Based on the composite index of grid operation method of calculation of information source entropy
Goswami et al. Sustainability assessment of smallholder farms in developing countries
CN110459329A (en) A kind of dengue fever risk integrative assessment method
Demartini et al. Integrating agricultural sustainability into policy planning: A geo-referenced framework based on Rough Set theory
CN106779188A (en) Plant pest Forecasting Methodology and device in a kind of plantation equipment
CN110133202A (en) A kind of method and device of the food materials monitoring freshness of intelligent kitchen
CN101872384A (en) Dynamic sustainability factor management
Parra-Lopez et al. A multi-criteria evaluation of the environmental performances of conventional, organic and integrated olive-growing systems in the south of Spain based on experts' knowledge
CN110705182B (en) Crop breeding adaptive time prediction method coupling crop model and machine learning
Sauquet et al. Water restrictions under climate change: a Rhône–Mediterranean perspective combining bottom-up and top-down approaches
CN111985728A (en) Method for establishing organic sorghum yield prediction model
Wu et al. Drought analysis framework based on copula and Poisson process with nonstationarity
Verma et al. Comparative analysis of CMIP5 and CMIP6 in conjunction with the hydrological processes of reservoir catchment, Chhattisgarh, India
Wang et al. Nonstationary flood and low flow frequency analysis in the upper reaches of Huaihe River Basin, China, using climatic variables and reservoir index as covariates
Purcell et al. A digital twin for grassland management
CN109034450B (en) Method for establishing potato late blight forecasting model in north China based on meteorological conditions
Liu et al. Evaluation of cultivated land quality using attention mechanism-back propagation neural network
Curtis et al. Plant distribution data show broader climatic limits than expert-based climatic tolerance estimates

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant