KR101888637B1 - 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템 - Google Patents

제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템 Download PDF

Info

Publication number
KR101888637B1
KR101888637B1 KR1020170034777A KR20170034777A KR101888637B1 KR 101888637 B1 KR101888637 B1 KR 101888637B1 KR 1020170034777 A KR1020170034777 A KR 1020170034777A KR 20170034777 A KR20170034777 A KR 20170034777A KR 101888637 B1 KR101888637 B1 KR 101888637B1
Authority
KR
South Korea
Prior art keywords
data
analysis
algorithm
information
template
Prior art date
Application number
KR1020170034777A
Other languages
English (en)
Inventor
이주연
김보현
전찬모
Original Assignee
한국생산기술연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생산기술연구원 filed Critical 한국생산기술연구원
Priority to KR1020170034777A priority Critical patent/KR101888637B1/ko
Application granted granted Critical
Publication of KR101888637B1 publication Critical patent/KR101888637B1/ko

Links

Images

Classifications

    • G06F17/5009

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 다양한 실시예는 데이터 분석 방법 및 플랫폼 구조 시스템에 관한 것으로, 해결하고자 하는 기술적 과제는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템을 제공하는데 있다.
이를 위해 본 발명은 대상 산업 및 제조 문제에 적합한 알고리즘 템플릿을 검색하여 선택하고, 데이터 분석을 수행할 대상 데이터를 선택하며, 정보를 입력하고 분석을 요청하는 데이터 모델링 단계; 선택된 알고리즘 템플릿과 입력된 정보를 기반으로 데이터 분석을 수행하고, 분석 데이터를 저장하는 데이터 분석 단계; 및 데이터 모델링 단계 및 데이터 분석 단계에서 사용할 수 있도록 생산 현장 정보를 제공하는 생산 현장 정보 제공 단계를 포함하는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템을 제공한다.

Description

제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템{Analysis methodology and platform architecture system for big data based on manufacturing specialized algorithm template}
본 발명의 다양한 실시예는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템에 관한 것이다.
사물 인터넷(IoT; Internet of Things) 기술의 발전을 통해 기존에는 획득이 불가능했던 다양한 종류의 데이터에 대한 실시간 수집이 가능해짐에 따라 데이터를 효율적으로 관리하고 해당 데이터로부터 의미 있는 결과를 도출하기 위한 연구에 대한 필요성이 높아지고 있다. 그러나, 대용량 데이터 분석을 위해서는 데이터를 저장하고 관리하기 위한 인프라 구축에 많은 비용과 시간이 소요되고 전문가에 대한 기술 의존도가 높은 분석 분야의 특성상 여러 기업에서 적용에 어려움을 겪고 있다.
특히, 데이터 분석을 수행하기 위해서는 전처리, 분석 및 시각화에 대한 알고리즘 선택과 각 알고리즘 활용을 위한 변수 입력이 필수적으로 요구되지만 데이터 분석에 대한 전문적 지식이 없는 제조 관련 작업자의 경우 제조 문제 해결을 위해 해당 과정을 수행하기에는 어려움이 있다.
다르게 설명하면, 제조업의 경우 해당 산업의 특성을 잘 이해하고 있는 공정 전문가가 데이터 분석을 수행해야 하는데 제조 전문가가 데이터 분석에 대한 전문 지식까지 갖춘 경우가 많지 않기 때문에, 대용량 데이터 기술을 활용해 국내 제조 기업의 경쟁력을 향상시키기 위해서는 데이터 분석을 지원하는 알고리즘 및 관리할 수 있는 체계화된 시스템적인 지원이 필요하다.
이러한 발명의 배경이 되는 기술에 개시된 상술한 정보는 본 발명의 배경에 대한 이해도를 향상시키기 위한 것뿐이며, 따라서 종래 기술을 구성하지 않는 정보를 포함할 수도 있다.
한국등록특허공보 10-1661818(2016.09.26.) "제조 공정 라인의 공정 및 품질 관리 방법" 한국등록특허공보 10-1530848 (2015.06.17.) "데이터마이닝을 이용하여 생산 공정에서 품질을 관리하는 장치 및 방법" 일본등록특허공보 4296160(2009.04.17.) "회로 기판의 품질 해석 시스템 및 품질 해석 방법"
본 발명의 해결하고자 하는 과제는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템을 제공하는데 있다.
즉, 본 발명의 해결하고자 하는 과제는 데이터 분석에 대한 전문적인 지식이 없는 사용자도 데이터 분석을 활용할 수 있도록 제조 문제(ex. 품질, 설비, 공정/에너지 등)에 적합한 전처리, 분석 및/또는 시각화(가시화) 알고리즘 과 각 알고리즘을 활용하기 위한 변수를 미리 정의해 놓은 후, 이러한 알고리즘의 조합을 템플릿 형태로 데이터 분석에 대한 전문적인 지식이 없는 사용자에게 제공하여 데이터 분석 모델을 쉽게 생성할 수 있도록 한 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법을 제공하는데 있다.
또한, 본 발명의 해결하고자 하는 과제는 모델링된 내용을 분석할 수 있도록 하는 분석 엔진과 제조 공정의 데이터를 수집하고 관리할 수 있는 데이터 스토리지 모듈을 포함하는 데이터 분석 플랫폼 구조 시스템을 제공하는데 있다.
본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법은 대상 산업 및 제조 문제에 적합한 알고리즘 템플릿을 검색하여 선택하고, 데이터 분석을 수행할 대상 데이터를 선택하며, 정보를 입력하고 분석을 요청하는 데이터 모델링 단계; 선택된 알고리즘 템플릿과 입력된 정보를 기반으로 데이터 분석을 수행하고, 분석 데이터를 저장하는 데이터 분석 단계; 및 데이터 모델링 단계 및 데이터 분석 단계에서 사용할 수 있도록 생산 현장 정보를 생성 즉시 또는 미리 정해진 시간동안 축적 후 온라인으로 제공하고 저장 및 관리하는 생산 현장 정보 관리 단계를 포함할 수 있다.
알고리즘 템플릿은 산업 분야 및 제조 문제 별 데이터의 특성을 고려하여 각각의 상황 별 적합한 전처리, 분석 및 시각화 기법을 선택적으로 사용할 수 있도록 제안하는 알고리즘의 집합을 의미한다.
데이터 모델링 단계에서는 대상 산업 및 제조 문제에 적합한 알고리즘 템플릿을 선택하고 분석을 수행할 대상 데이터를 선택하며, 정보를 입력하고 분석을 요청할 수 있다.
알고리즘 템플릿은 대상 산업 및 제조 문제에 적합한 전처리, 분석 및 시각화 알고리즘과 각 알고리즘을 활용하기 위한 변수 값을 포함하며 이들 각각은 한정하는 것은 아니지만 결측치 처리, 카운터, 구간화, 그룹화, 차원 축소, 정규화, 집합화 및 요약을 포함하는 전처리 알고리즘; 한정하는 것은 아니지만 분류, 예측, 군집화 및 이상치 탐지를 포함하는 분석 알고리즘; 및 한정하는 것은 아니지만 차트, 플랏, 그래프 및 테이블을 포함하는 해석/가시화 알고리즘을 포함할 수 있다.
알고리즘 활용을 위한 변수는 기본값, 필수값, 선택값으로 구성될 수 있다.
데이터 모델링 단계에서는 데이터 분석에 대한 사용자 이해 정도(일반 사용자 또는 분석 전문가)에 따라 모델링 프로세스가 다르게 적용될 수 있다.
일반 사용자는 데이터 분석 알고리즘에 대한 이해도가 낮은 사용자를 의미하며, 이는 알고리즘 활용을 위한 필수값 만을 입력해 분석을 요청할 수 있다.
분석 전문가는 데이터 분석 알고리즘에 대한 이해도가 높은 사용자를 의미하며, 사용자 판단에 따라 전처리, 분석 및 시각화 알고리즘을 변경할 수 있고 각 알고리즘을 활용하기 위한 변수(기본값, 필수값, 선택값)를 입력해 분석을 요청할 수 있다.
데이터 분석 단계 이후 데이터 분석 결과를 사용자에게 전달하는 데이터 분석 결과 전달 단계를 더 포함할 수 있다.
데이터 모델링 단계 이전에, 대상 산업 및 제조 문제를 선택하는 대상 산업 및 제조 문제 선택 단계; 대상 산업 및 제조 문제별 데이터 특성을 반영하여 전처리, 분석, 시각화 알고리즘을 선택하는 알고리즘 선택 단계; 선택된 알고리즘별 변수를 선택하는 알고리즘 변수 선택 단계; 및 선택된 알고리즘 및 선택된 변수를 템플릿화하여 등록하는 템플릿 정보 등록 단계를 더 포함할 수 있다.
사용자에게 대상 산업 및 제조 문제에 적합한 알고리즘 템플릿을 제공하기 위해서는 시스템 관리자(전문가)가 대상 산업 및 제조 문제를 분석하고 해당 데이터 특성에 맞는 전처리, 분석 및 시각화 알고리즘과 변수를 등록해야 한다.
이에 따라, 본 발명의 실시예는 시스템 관리자가 대상 산업 및 제조 문제를 분석해 적합한 알고리즘을 선택하는 단계; 각 알고리즘에 적합한 변수(기본값, 필수값, 선택값)를 설정하는 단계; 및 선택된 알고리즘 및 변수를 템플릿화 하여 등록하는 템플릿 정보 등록 단계를 더 포함할 수 있다.
데이터 모델링 단계는 대상 데이터의 전처리, 분석 및/또는 시각화 모델링을 위한 데이터 모델러; 및 모델 분석 스케줄을 관리하는 배치 스케줄러를 제공할 수 있다.
데이터 모델링 단계에서 데이터 분석 단계로 전달되는 모델링 정보는 XML 파일 형태일 수 있다.
본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 플랫폼 구조 시스템은 대상 산업 및 제조 문제에 적합한 알고리즘 템플릿을 검색하여 선택하고, 데이터 분석을 수행할 대상 데이터를 선택하며, 정보를 입력하고 분석을 요청하는 데이터 모델링 애플리케이션; 선택된 알고리즘 템플릿과 입력된 정보를 기반으로 데이터 분석을 수행하고, 분석 데이터를 저장하는 데이터 분석 플랫폼; 및 데이터 모델링 애플리케이션 및 데이터 분석 플랫폼에서 사용할 수 있도록 생산 현장 정보를 생성 즉시 또는 미리 정해진 시간동안 축적 후 온라인으로 제공하며 저장하고 관리하는 생산 현장 정보 관리부를 포함할 수 있다.
데이터 모델링 애플리케이션은 대상 데이터의 전처리, 분석 및/또는 시각화 모델링을 위한 데이터 모델러; 및 모델 분석 스케줄을 관리하는 배치 스케줄러를 포함할 수 있다.
데이터 분석 플랫폼은 데이터를 분석하는 데이터 분석 엔진; 분석된 데이터를 저장하는 데이터 스토리지 모듈; 및 생산 현장의 데이터를 데이터 스토리지 모듈로 전달하는 인터페이스를 포함할 수 있다.
데이터 분석 엔진은 데이터 모델링 애플리케이션에서 분석 요청된 데이터를 분석하는 분석 모듈; 및 전처리, 분석, 시각화 및 데이터 출력 라이브러리를 분석 모듈에 제공하는 알고리즘 라이브러리를 포함할 수 있다.
분석 모듈은 데이터 모델링 애플리케이션에서 분석 요청된 데이터를 해석하여 분석에 필요한 데이터, 사용 알고리즘 및 분석 조건에 대한 정보를 스크립 형태의 명령어로 생성하는 엔진 인터페이스 모듈; 스크립트 형태의 명령어를 이용하여 데이터 획득에서 분석까지의 전체 과정을 실행하고 관리하는 워크 플로우 모듈; 데이터 스토리지 모듈에 저장되고 분석에 필요한 데이터를 조회 및 이용하는 데이터 인터페이스 모듈; 알고리즘 라이브러리로부터 알고리즘 템플릿을 조합하여 분석에 이용하도록 하는 라이브러리 매니저; 및 분석에 필요한 데이터, 알고리즘 및 변수가 모두 조합되면 순차적으로 실행되는 전처리 모듈, 러너 모듈, 시각화 모듈을 포함할 수 있다.
데이터 모델링 애플리케이션에서 데이터 분석 플랫폼으로 전달되는 모델링 정보는 XML 파일 형태일 수 있다.
본 발명의 다양한 실시예는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템을 제공한다.
즉, 본 발명의 다양한 실시예는 데이터 분석에 대한 전문적인 지식이 없는 사용자도 데이터 분석을 활용할 수 있도록 제조 문제에 적합한 전처리, 분석 및/또는 시각화 알고리즘과 각 알고리즘을 활용하기 위한 변수를 미리 정의해 놓은 후, 이러한 알고리즘의 조합을 템플릿 형태로 데이터 분석에 대한 전문적인 지식이 없는 사용자에게 제공하여 데이터 분석 모델을 쉽게 생성할 수 있도록 한 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법을 제공한다.
또한, 본 발명의 다양한 실시예는 모델링된 내용을 분석할 수 있도록 하는 분석 엔진과 제조 공정의 데이터를 수집하고 관리할 수 있는 데이터 스토리지 모듈을 포함하는 데이터 분석 플랫폼 구조 시스템을 제공한다.
도 1은 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법을 설명하기 위한 알고리즘 템플릿의 구조를 도시한 개략도이다.
도 2a 및 도 2b는 알고리즘 템플릿의 개념을 설명하기 위한 도면이다.
도 3은 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석을 위한 플랫폼의 구조를 도시한 블럭도이다.
도 4는 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 엔진과 저장 모듈의 실행 흐름을 설명하기 위한 도면이다.
도 5는 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법의 사용 시나리오를 도시한 블럭도이다.
도 6은 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법의 예시적 실행 순서를 도시한 블럭도이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다.
본 발명의 실시예들은 당해 기술 분야에서 통상의 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위하여 제공되는 것이며, 하기 실시예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다. 오히려, 이들 실시예는 본 개시를 더욱 충실하고 완전하게 하고, 당업자에게 본 발명의 사상을 완전하게 전달하기 위하여 제공되는 것이다.
또한, 이하의 도면에서 각 층의 두께나 크기는 설명의 편의 및 명확성을 위하여 과장된 것이며, 도면상에서 동일 부호는 동일한 요소를 지칭할 수 있다. 본 명세서에서 사용된 바와 같이, 용어 "및/또는"은 해당 열거된 항목 중 어느 하나 및 하나 이상의 모든 조합을 포함할 수 있다. 또한, 본 명세서에서 "연결될 수 있다"라는 의미는 A 부재와 B 부재가 직접 연결되는 경우뿐만 아니라, A 부재와 B 부재의 사이에 C 부재가 개재되어 A 부재와 B 부재가 간접 연결되는 경우도 의미할 수 있다.
본 명세서에서 사용된 용어는 특정 실시예를 설명하기 위하여 사용되며, 본 발명을 제한하기 위한 것이 아니다. 본 명세서에서 사용된 바와 같이, 단수 형태는 문맥상 다른 경우를 분명히 지적하는 것이 아니라면, 복수의 형태를 포함할 수 있다. 또한, 본 명세서에서 사용되는 경우 "포함할 수 있다(comprise, include)" 및/또는 "포함하는(comprising, including)"은 언급한 형상들, 숫자, 단계, 동작, 부재, 요소 및/또는 이들 그룹의 존재를 특정하는 것이며, 하나 이상의 다른 형상, 숫자, 동작, 부재, 요소 및 /또는 그룹들의 존재 또는 부가를 배제하는 것이 아니다.
본 명세서에서 제1, 제2 등의 용어가 다양한 부재, 부품, 영역, 층들 및/또는 부분들을 설명하기 위하여 사용되지만, 이들 부재, 부품, 영역, 층들 및/또는 부분들은 이들 용어에 의해 한정되어서는 안 됨은 자명하다. 이들 용어는 하나의 부재, 부품, 영역, 층 또는 부분을 다른 영역, 층 또는 부분과 구별하기 위하여만 사용될 수 있다. 따라서, 이하 상술할 제1부재, 부품, 영역, 층 또는 부분은 본 발명의 가르침으로부터 벗어나지 않고서도 제2부재, 부품, 영역, 층 또는 부분을 지칭할 수 있다.
또한, 본 발명에 따른 데이터 분석 플랫폼 및/또는 다른 관련 기기 또는 부품은 임의의 적절한 하드웨어, 펌웨어(예를 들어, 주문형 반도체), 소프트웨어, 또는 소프트웨어, 펌웨어 및 하드웨어의 적절한 조합을 이용하여 구현될 수 있다. 예를 들어, 본 발명에 따른 데이터 분석 플랫폼 및/또는 다른 관련 기기 또는 부품의 다양한 구성 요소들은 하나의 집적회로 칩 상에, 또는 별개의 집적회로 칩 상에 형성될 수 있다. 또한, 데이터 분석 플랫폼의 다양한 구성 요소는 가요성(可撓性, flexibility) 인쇄 회로 필름 상에 구현 될 수 있고, 테이프 캐리어 패키지, 인쇄 회로 기판, 또는 데이터 분석 플랫폼과 동일한 서브스트레이트 상에 형성될 수 있다. 또한, 데이터 분석 플랫폼의 다양한 구성 요소는, 하나 이상의 컴퓨팅 장치에서, 하나 이상의 프로세서에서 실행되는 프로세스 또는 쓰레드(thread)일 수 있고, 이는 이하에서 언급되는 다양한 기능들을 수행하기 위해 컴퓨터 프로그램 명령들을 실행하고 다른 구성 요소들과 상호 작용할 수 있다. 컴퓨터 프로그램 명령은, 예를 들어, 랜덤 액세스 메모리와 같은 표준 메모리 디바이스를 이용한 컴퓨팅 장치에서 실행될 수 있는 메모리에 저장될 수 있다. 컴퓨터 프로그램 명령은 또한 예를 들어, CD-ROM, 플래시 드라이브 등과 같은 다른 비-일시적 컴퓨터 판독 가능 매체(non-transitory computer readable media)에 저장될 수 있다. 또한, 본 발명에 관련된 당업자는 다양한 컴퓨팅 장치의 기능이 상호간 결합되거나, 하나의 컴퓨팅 장치로 통합되거나, 또는 특정 컴퓨팅 장치의 기능이, 본 발명의 예시적인 실시예를 벗어나지 않고, 하나 이상의 다른 컴퓨팅 장치들에 분산될 수 될 수 있다는 것을 인식해야 할 수 있다.
일례로, 본 발명에 따른 데이터 분석 플랫폼은 중앙처리장치, 하드디스크 또는 고체상태 디스크와 같은 대용량 저장 장치, 휘발성 메모리 장치, 키보드 또는 마우스와 같은 입력 장치, 모니터 또는 프린터와 같은 출력 장치로 이루어진 통상의 상용 컴퓨터에서 운영될 수 있다.
일반적으로 데이터 분석을 수행하기 위해서는 전처리, 분석, 시각화/가시화에 대한 알고리즘 선택과 각 알고리즘 활용을 위한 변수 입력이 필수적으로 요구되지만, 데이터 분석에 대한 전문적 지식이 없는 제조 관련 작업자(예를 들면, 일반 사용자)의 경우 제조 문제 해결을 위해 해당 과정을 수행하기에는 어려움이 있다.
따라서, 본 발명의 다양한 실시예에서는 데이터 분석에 대한 전문적인 지식이 없는 사용자도 데이터 분석을 활용할 수 있도록 제조 문제별 적합한 전처리, 분석, 시각화 알고리즘 및 각 알고리즘을 활용하기 위한 변수를 미리 정의한 후 템플릿 형태로 시스템에서 제공할 수 있도록 한다.
여기서, 알고리즘 활용을 위한 변수는 기본값, 필수값, 선택값으로 구성될 수 있다. 기본값은 템플릿에서 기본적으로 제공하는 값으로 사용자 입력 없이 활용 가능하다. 필수값은 알고리즘 사용을 위해 필수적으로 입력해야 하는 값으로 분석 대상 데이터 선택이 해당될 수 있다. 선택값은 템플릿에서 기본적으로 제공하는 값 이외에 분석자가 상황에 맞게 변경할 수 있는 값으로 값 변경을 통해 분석 정확도를 더욱 향상시킬 수 있다.
본 발명의 다양한 실시예에서는 알고리즘 템플릿의 개념과 템플릿을 구성하기 위한 라이브러리, 템플릿을 활용해 분석을 수행하는 시스템 아키텍처, 템플릿과 라이브러리를 표현하기 위한 데이터 구조 등을 포함할 수 있다.
본 발명의 다양한 실시예에서 데이터 분석 플랫폼 구조는 분석을 위한 전처리, 분석, 시각화 알고리즘을 템플릿 형태로 제공하는데, 제조 특화형 알고리즘 템플릿은 제조 문제별로 해당 문제를 해결할 때 적합한 전처리, 분석, 시각화 알고리즘을 미리 정의해 그룹 형태로 묶은 모음을 의미하며, 이와 같이 하여 데이터 분석에 대한 전문적 지식이 없는 사용자도 제조 문제별 분석 유형 선택을 통해 데이터 분석을 수행할 수 있다(ex. 데이터 분석에 대한 전문적인 지식이 없는 품질 관리자가 알고리즘 템플릿을 활용해 제품의 불량진단을 수행)
이하에서, 알고리즘 템플릿 구조, 그리고 알고리즘 템플릿 개념을 설명한다.
도 1은 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법을 설명하기 위한 알고리즘 템플릿의 구조를 도시한 개략도이다.
도 1에 도시된 바와 같이, 본 발명의 다양한 실시예에서, 분석 알고리즘 라이브러리는, 예를 들면, 한정하는 것은 아니지만, 전처리, 분석 및/또는 시각화를 포함하며, 알고리즘 템플릿은, 예를 들면, 한정하는 것은 아니지만, 메타(meta), 알고리즘(전처리, 분석, 시각화), 프로세스 및/또는 컨피규레이션(기본값, 필수값, 선택값 등)을 포함할 수 있다.
여기서, 상술한 알고리즘(전처리, 분석, 시각화), 프로세스 및/또는 컨피규레이션(기본값, 필수값, 선택값 등) 등이 다양하게 정의, 변경 및/또는 수정될 수 있으며, 이러한 정의, 변경 및/또는 수정에 의해, 예를 들면, 도 1에 도시되어 있지 않지만, A 템플릿, B 템플릿 및/또는 C 템플릿 등이 준비될 수 있다.
도 2a 및 도 2b는 알고리즘 템플릿의 개념을 설명하기 위한 도면이다.
도 2a에 도시된 바와 같이, 예를 들면, 한정하는 것은 아니지만, 제조 특화형 알고리즘 템플릿은 제조문제, 분석유형 및 알고리즘 기준으로 구분될 수 있다. 여기서, 제조 문제는 품질, 설비, 공정 및/또는 에너지 등을 포함할 수 있다. 분석유형은 품질 제조문제의 경우 공정탐색, 불량판정, 불량원인진단 및/또는 품질값 예측 등을 포함할 수 있다. 또한 분석 유형은 설비 제조 문제의 경우 설비 이상 상태 진단, 설정-실측 차이 분석, 설비 건전성 관리 및/또는 설비 상태 진단 등을 포함할 수 있다. 또한, 분석 유형으로서 공정 탐색의 경우 알고리즘은 전처리 알고리즘, 분석 알고리즘, 시각화 알고리즘과 알고리즘들의 집합으로 구성된 공정 탐색 알고리즘 템플릿 등을 포함할 수 있다.
여기서, 템플릿은 각 분석유형별 문제를 해결하기 위해 사용되는 적합한 데이터 분석 알고리즘의 조합을 의미하며, SP(Support Process)는 각 분석 알고리즘을 활용하기 위해 필요한 프로세스, 이를테면 변수 입력과 같은 프로세스를 의미한다.
도 2b에 도시된 바와 같이, 알고리즘 템플릿은, 예를 들면, 한정하는 것은 아니지만, 품질 문제에 있어서, 품질관련 공정 탐색 템플릿, 불량원인진단 템플릿, 불량판정 템플릿 및/또는 품질값 예측 템플릿을 포함할 수 있는데, 이들 각각은 결측치 처리, 카운터, 구간화, 그룹화, 차원축소, 정규화, 집합화 및 요약 등을 포함하는 전처리 알고리즘과, 분류(DT, K-NN, SVM, ANN), 예측(Linear Regression, Locally Weight Learning(LWL)), 군집화(K-Means, DBSCAN, SOM, CLIQUE) 및/또는 이상치 탐지(LOF, Gaussian Model Based) 등을 포함하는 데이터 분석 알고리즘과, 차트(Chart), 플랏(Plot), 그래프(Graph) 및/또는 테이블(Table) 등을 포함하는 시각화/가시화 알고리즘을 포함할 수 있다.
일례로, 품질값 예측 알고리즘 템플릿은 전처리 알고리즘 중 결측치 처리가 포함되고, 데이터 분석 알고리즘 중 예측의 LWL이 선택되고, 또한 시각화 알고리즘 중 파이 차트가 선택되어 이루어질 수 있다. 도면 중 SP는 변수 셋팅을 의미하며, 이 역시 품질값 예측 알고리즘 템플릿에 포함된다.
이러한 방식으로, 본 발명의 일 실시예에서, 예를 들면, 한정하는 것은 아니지만, 품질 특화형 알고리즘 템플릿이 아래와 같이 정의될 수 있다. 즉, 품질 특화형 알고리즘 템플릿은 아래 표 1과 같이 공정탐색, 불량판정, 불량 원인진단, 품질값 예측에 대한 네 가지 종류의 알고리즘 템플릿을 제공할 수 있다. 공정 탐색 템플릿은 품질에 영향을 미치는 설비와 공정 변수를 그래프나 표 형태로 확인 할 수 있는 템플릿으로 상관관계 분석기법과 SAX 기법을 활용할 수 있다. 불량 원인 진단 템플릿은 공정조건과 Lot의 품질 정보를 활용해 불량의 원인을 분석하는 알고리즘 템플릿으로 C4.5 알고리즘이 사용될 수 있다. 사용자에게는 표 형태로 불량의 원인에 대한 결과값을 규칙 형태로 제공할 수 있다. 불량판정 템플릿은 생산된 Lot의 제품에 불량 제품이 있는가 여부를 검증하기 위한 템플릿으로 C4.5 알고리즘과 AdaBoost C2 알고리즘을 통해 개발되었고 Lot 생산 단계에서의 공정정보를 입력하면 해당 Lot의 불량 유무를 표 형태의 결과로 제공할 수 있다. 품질값 예측 템플릿은 생산된 전체 제품의 불량 가능 Lot의 수를 예측하는 템플릿으로 전체 생산 제품 중 불량이 발생가능한 Lot에 대한 정보를 파이차트 형태로 보여줄 수 있다.
알고리즘 템플릿명 정의 분석기법 결과 가시화
공정탐색 공정조건에 대한 시계열 데이터를 포괄적으로 탐색하여, 공정조건 특이값 사이의 연관성 규칙을 발견하기 위한 라이브러리 Symbolic
Aggregate
approXimation
(SAX), apriori
공정조건 특이값 사이의 연관성 규칙
불량판정 공공정조건 데이터를 기본으로 가공 제품 또는 Lot 의 불량 유무를 예측하는 라이브러리 C4.5 분류기 및 AdaBoostC2 양품 or 불량품 (양품 Lot or 불량 Lot)
원인진단 공정조건 데이터에서 가공 제품 또는 Lot 의 불량 원인을 진단하는 규칙 추출하여, 현장 전문가가 AdaBoost C2 분류기의 결과물을 더 잘 이해하도록 지원 AdaBoost C2, C4.5 Rule 공정조건에서 불량에 관한 규칙 추출
품질 값 예측 공정조건 데이터를 기본으로 가공 제품 또는 Lot 의 불량률과 같은 품질값을 예측하는 라이브러리 Locally Weighted Learning(LWL) 품질값(불량률, 무게, 강도 등)
도 3은 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석을 위한 플랫폼의 구조(100)를 도시한 블럭도이다.
도 3에 도시된 바와 같이, 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석을 위한 플랫폼 구조(100)는 데이터 모델링 애플리케이션(110)과, 데이터 분석 플랫폼(130)과, 생산 현장 정보 관리부(160)(샵 플로어, Shop Floor)를 포함할 수 있다.
데이터 모델링 애플리케이션(110)은, 예를 들면, 한정하는 것은 아니지만, 클라이언트측으로서 웹 기반 애플리케이션일 수 있다.
이러한 데이터 모델링 애플리케이션(110)은, 예를 들면, 한정하는 것은 아니지만, 사용자로 하여금 대상 산업 및/또는 제조 문제에 적합한 알고리즘 템플릿을 검색하여 선택하도록 하고, 데이터 분석을 수행할 대상 데이터를 선택하도록 하며, 또한 분석에 필요한 정보를 입력하고 분석을 요청하도록 할 수 있다.
다르게 설명하면, 데이터 모델링 애플리케이션(110)은 생산 현장 정보 관리부(160)에서 획득한 생산 관련 정보를 조회하고 대용량 제조 데이터 분석을 요청할 수 있는 기능을 제공하도록 할 수 있다.
이러한 데이터 모델링 애플리케이션(110)은 애플리케이션에서 입력된 대상 데이터 및 라이브러리 정보를 분석 모델링 파일 형태(예를 들면, XML 파일 형태)로 생성하여 데이터 분석 플랫폼(130)으로 전달할 수 있다.
조금 더 구체적으로, 데이터 모델링 애플리케이션(110)은 데이터 모델러(111)(Data Modeler) 및 배치 스케줄러(118)(Batch scheduler)를 포함할 수 있다.
데이터 모델러(111)는, 예를 들면, 한정하는 것은 아니지만, 분석에 필요한 전처리, 분석 및/또는 시각화에 대한 알고리즘을 선택하고 데이터 분석을 요청할 수 있는 기능을 제공할 수 있다. 즉, 사용자가 분석하고자 하는 내용이 제조 특화형 알고리즘 템플릿에 등록되어 있는 경우 사용자는 해당 알고리즘 템플릿을 이용해 분석을 수행할 수 있다. 제조 특화형 알고리즘 템플릿은 데이터 분석에 대한 사용자의 이해 정도에 따라 정보를 차등적으로 입력할 수 있는 환경을 제공할 수 있다.
여기서, 사용자가 입력해야 하는 정보는 기본값, 필수값 및/또는 선택값 세가지로 구분될 수 있다. 기본값은 알고리즘 템플릿에서 분석을 위해 기본적으로 제공하는 값으로 사용자는 추가 입력없이 해당 정보를 이용해 분석을 수행할 수 있다. 필수값은 데이터 테이블 별 키(Key) 값과 같은 사용자가 분석을 위해서 반드시 입력해야 하는 정보를 의미할 수 있다. 선택값은 사용자가 입력하지 않아도 분석이 가능하지만 데이터 분석에 대한 이해를 갖고 있는 사용자가 해당 값을 추가 입력할 경우 분석의 정확도를 높일 수 있는 값이다.
이와 같이, 알고리즘 템플릿에 변수값에 대한 레벨을 구분함에 따라 비전문가(일반 사용자)뿐만 아니라 전문가도 해당 알고리즘 템플릿을 활용해 분석을 수행할 수 있도록 한다.
이러한 데이터 모델러(111)는, 예를 들면, 한정하는 것은 아니지만, 대상 데이터의 전처리 모델러(112)(Preprocess Modeler), 분석 모델러(113)(Analysis Modeler) 및 시각화 모델러(114)(Visualizer)를 포함하고, 또한 템플릿으로서 품질 템플릿(115)(Quality Template), 설비 템플릿(116)(Machine Template) 및 에너지 템플릿(117)(Energy Template) 등을 포함할 수 있다. 이러한 구성에 의해 데이터 모델러(111)는 제조 문제와 분석 유형에 적합한 템플릿을 선택할 수 있고 필요에 따라서 분석에 필요한 다양한 전처리, 분석 및/또는 가시화에 대한 알고리즘을 선택하고 데이터 분석을 요청할 수 있도록 한다.
배치 스케줄러(118)는 분석 정보를 관리하는 역할을 할 수 있다. 즉, 알고리즘 템플릿을 이용한 분석 요청 정보 생성을 완료하면 사용자는 분석을 요청하는데, 분석이 요청되면 해당 정보는 상술한 배치 스케줄러(118)에 등록될 수 있다. 배치 스케줄러(118)는 요청된 분석 정보를 관리하는 모듈로 여러 개의 분석이 동시에 요청되었을 때 순차적으로 실행되도록 관리하는 기능과 사용자가 설정한 시간에 맞춰 반복적인 분석이 수행되도록 하는 기능 두 가지를 제공할 수 있다.
데이터 분석의 경우 데이터 용량에 따라 분석에 많은 시간이 소요될 수 있기 때문에 지속적인 분석이 필요한 경우 자동적으로 결과가 업데이트 되도록 하는 기능이 필요하다. 사용자는 분석 대상 데이터, 분석 주기 등의 정보를 배치 스케줄러(118)에 등록해 반복적인 분석이 수행되도록 할 수 있다. 배치 스케줄러(118)에 등록된 순서에 따라 분석 시점이 되면 해당 분석 요청 정보는 데이터 분석 플랫폼(130)으로 전달될 수 있다.
이러한 데이터 모델링 애플리케이션(110)에 의해, 기업의 사용자는 알고리즘 템플릿을 선택하고, 예를 들면, 한정하는 것은 아니지만, 상술한 네 가지 종류의 품질 특화형 템플릿을 웹 애플리케이션을 통해 분석을 요청 할 수 있다.
사용자는, 예를 들면, 한정하는 것은 아니지만, 불량판정, 공정탐색, 불량률(품질값) 예측, 불량원인진단 알고리즘 템플릿 중 분석을 희망하는 템플릿 선택 후 애플리케이션에서 제공하는 분석 데이터의 종류, 명칭, 데이터 형태를 확인 후 분석에 필요한 대상 데이터를 선택할 수 있다. 분석 대상 데이터는 전처리 과정을 위해 결측치 처리, 이상치 제거 등의 과정에 필요한 정보를 입력하고 분석 수행을 위한 정보를 입력할 수 있다. 각각의 입력 정보는 템플릿의 종류에 따라 다르게 구성되며 분석에 필요한 정보는 상술한 형태로 기본값, 필수값 및/또는 선택값 세가지 종류의 변수 형태로 제공될 수 있다. 변수 값에 대한 입력이 종료되면 해당 정보를 기반으로 사용자는 데이터 분석을 요청할 수 있다.
데이터 분석 플랫폼(130)은 선택된 알고리즘 템플릿과 입력된 정보를 기반으로 데이터 분석을 수행하고, 분석 데이터를 저장할 수 있다. 즉, 데이터 분석 플랫폼(130)은 생산 현장 정보 관리부(160)의 정보를 기반으로 데이터 모델링 애플리케이션(110)에서 입력된 사용자 요청 내용에 따라 실제 분석을 수행하는 플랫폼으로 크게 데이터를 분석하는 데이터 분석 엔진(131)(Data Analysis Engine), 데이터를 저장하는 데이터 스토리지 모듈(147)(Data Storage Module) 및 생산 현장 정보 관리부(160)(Shop Floor)의 데이터를 데이터 스토리지 모듈(147)로 전달하는 인터페이스 모듈(151) 을 포함할 수 있다.
데이터 분석 엔진(131)은, 예를 들면, 한정하는 것은 아니지만, 서버측으로서, 데이터 모델링 애플리케이션(110)에서 분석 요청된 데이터를 분석하는 분석 모듈(132)(Analysis Module)과, 각종 라이브러리를 제공하는 알고리즘 라이브러리 및 템플릿(141)(Algorithm Library & Template)을 포함할 수 있다.
분석 모듈(132)은 데이터 모델링 애플리케이션(110)에서 분석 요청된 데이터를 해석하여 분석에 필요한 데이터, 사용 알고리즘 및 분석 조건에 대한 정보를 스크립 형태의 명령어로 생성하는 엔진 인터페이스 모듈(133), 스크립트 형태의 명령어를 이용하여 데이터 획득에서 분석까지의 전체 과정을 실행하고 관리하는 워크 플로우 모듈(134), 데이터 스토리지 모듈(147)에 저장되고 분석에 필요한 데이터를 조회 및 이용하는 데이터 인터페이스 모듈(135), 알고리즘 라이브러리 및 템플릿(141)으로부터 알고리즘 템플릿을 조합하여 분석에 이용하도록 하는 라이브러리 매니저(136), 분석에 필요한 데이터, 알고리즘 및 변수가 모두 조합되면 순차적으로 실행되는 전처리 모듈(137), 러너 모듈(138), 시각화 모듈(139)을 포함할 수 있다. 더불어 분석 모듈(132)은 메타 매니저(140)도 포함할 수 있다.
또한, 알고리즘 라이브러리 및 템플릿(141)은, 예를 들면, 한정하는 것은 아니지만, 전처리 라이브러리(142), 분석 라이브러리(143), 시각화 라이브러리(144), 데이터 출력 라이브러리(145) 및 기타사양(146)을 포함할 수 있으며, 이들은 상술한 분석 모듈(132)에 제공될 수 있다.
한편, 데이터 스토리지 모듈(147)은 생산 현장 정보 관리부(160)에서 인터페이스 모듈(151)을 통해 전달된 정보를 저장하는데, 이는 대용량 데이터 처리를 지원하는 프리웨어 자바 소프트웨어 프레임워크인 아파치 하둡(Apache Hadoop) ECO 시스템을 기반으로 한다. 하둡 ECO 시스템에서 제공하는 다양한 모듈 중 생산 현장의 특징을 고려해 정보를 저장하고 분석 할 수 있도록 모듈을 구성할 수 있다. 본 발명의 다양한 실시예에서, 예를 들면, 한정하는 것은 아니지만, 맵리듀스(148)(MapReduce), YARN(149), HDFS(150), HBase, Hive 모듈 등을 사용할 수 있다. 데이터 스토리지 모듈(147)은 데이터 분석 엔진(131)의 분석 시점에 필요한 데이터를 공급하고 분석 결과를 저장할 수 있다.
인터페이스 모듈(151)은 생산 현장 정보 관리부(160)에 저장되어 있는 정보를 대용량 데이터 분석 시점에 맞게 데이터 분석 플랫폼(130)으로 전달하는 역할을 할 수 있다. 인터페이스 모듈(151)은 여러 사용자가 활용하는 대용량 분석 플랫폼의 특성을 고려하여 다양한 형태의 생산 현장 정보 관리부(160)의 데이터 저장소로부터 정보를 취합해 데이터 분석 플랫폼(130)으로 전달할 수 있는 기능을 제공할 수 있다.
또한, 인터페이스 모듈(151)은 데이터 전달 과정에서 발생할 수 있는 보안, 정보 오염 유무, 리소스(Resource) 관리 기능을 제공할 수 있다. 데이터의 특성에 따라 생성 즉시 데이터 분석 플랫폼(130)으로 전달되어야 하는 정보와 일정시간 축적 후 전달해야 하는 데이터가 구분되어야 하는데, 인터페이스 모듈(151)은 사용자가 입력한 해당 데이터 특성을 고려해 선택적으로 정보를 전달할 수 있다. 이를 위해, 인터페이스 모듈(151)은 데이터 플로우 매니저(152) 및 데이터 어댑터(153) 등을 포함할 수 있다.
이와 같이 하여 데이터 분석 플랫폼(130)은, 예를 들면, 한정하는 것은 아니지만, XML 파일 형태로 변환된 요청 분석 정보를 전달받아 처리할 수 있다. 즉, 전달된 정보는 상술한 데이터 흐름으로 분석이 수행될 수 있다. 구체적으로, 전달된 알고리즘 템플릿의 입력 정보를 기반으로 분석에 필요한 전처리, 분석 및/또는 시각화 알고리즘 템플릿을 조합해 분석에 활용할 수 있다. 분석이 종료되면 해당 결과는 분석 플랫폼 상의 데이터 베이스에 저장되고 최종 결과값은 사용자에게 전달될 수 있다.
일례로, 한정하는 것은 아니지만, 품질 특화형 알고리즘 템플릿을 활용해 분석한 결과는 애플리케이션 상에서 확인 할 수 있다. 애플리케이션에서는 각 알고리즘 템플릿 별 소정 형태의 특화된 가시화/시각화 방법론뿐만 아니라 기본적인 통계 결과, 그래프 등의 가시화 방법론 또한 제공할 수 있다. 사용자는 가시화 내용을 통해 공정의 품질 문제를 분석하고 파악 할 수 있다.
마지막으로, 생산 현장 정보 관리부 (160)는 데이터 모델링 애플리케이션(110) 및 데이터 분석 플랫폼(130)에서 사용할 수 있도록 생산 현장 정보를 제공할 수 있다. 일반적으로, 생산 현장 정보 관리부(160)에서는 해당 공장에서 발생하는 생산 관련 여러 종류의 데이터를 레거시 시스템(161)(Legacy System) 혹은 다른 형태의 데이터 베이스를 통해 관리할 수 있다. 일반적으로 레거시 시스템(161)에는 MES, ERP 등의 시스템을 포함할 수 있다. 여러 종류의 생산 관련 데이터는 인터페이스 모듈(151)을 통해 데이터 분석 플랫폼(130)의 데이터 스토리지 모듈(147)로 전달되어 저장 및 관리될 수 있다. 도면 중 미설명 부호 162는 다수의 설비들로부터 입수한 설비 데이터이다.
일례로, 한정하는 것은 아니지만, 생산 현장 정보 관리부(160)(공장 또는 Shop Floor)는 다수의 제조 설비로부터 다수의 공정조건(예를 들면, 사출의 경우 저속 스트로크, 형체력, 냉각시간, 유온, 주조압력, 용탕온도 등)을 설비 센서로부터 획득해 관리할 수 있다. 해당 공정조건은 설비가 제품을 생산하는 매 시점마다 획득한 뒤 생산 현장 데이터 수집 데이터 저장소에 저장할 수 있다. 설비에서 제작된 제품은 불량 검사 공정에서 불량 유무를 판별하는데, 다수의 제품 불량(예를 들면, 사출제품의 경우 유실, 소착, 주조불량, 찍힘, 흐름자국, 크랙 등)유형을 관리할 수 있다. 획득된 불량 정보는 MES 데이터 베이스에 저장될 수 있다. 대상 생산 현장 정보 관리부(160)에서는 Lot 단위로 불량 정보와 공정 정보를 관리할 수 있다. 생산 현장 데이터 수집 데이터 베이스와 MES 데이터 베이스에 저장된 센서 데이터와 품질 데이터는 Lot ID를 Key 값으로 병합된 뒤 인터페이스 모듈을 통해 대용량 데이터 분석 플랫폼(130)으로 전달될 수 있다. 사용자는 제조 공정의 특성을 고려하여 생산현장으로부터 전달되는 데이터의 시점과 방식을 인터페이스 모듈의 기능으로 조절 할 수 있는데, 예를 들면, 생산 현장 정보 관리부(160)에서 MES 데이터 베이스의 정보는 하루에 한번, 생산 현장 센싱 정보는 실시간으로 전달받도록 설정할 수 있다.
도 4는 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 엔진과 저장 모듈의 실행 흐름을 설명하기 위한 도면이다.
데이터 모델링 애플리케이션(110)에서 배치 스케줄러(118)를 통해 분석이 시작되도록 하면, 데이터 분석 플랫폼(130)의 데이터 분석 엔진(131)으로 XML 파일 형태의 모델링 정보가 전달된다.
전달된 파일은 분석 모듈(132)을 통해 해석되고 분석되는데, 분석 모듈(132)은 대략 8개의 세부 모듈로 구성될 수 있다. 데이터 모델링 애플리케이션(110)에서 파일 형태로 전달된 분석 관련 요청 정보는 ① 엔진 인터페이스 모듈(133)을 통해 해석 후 분석에 필요한 데이터, 사용 알고리즘, 분석 조건에 대한 정보를 스크립 형태의 명령어로 생성한다. ② 워크 플로우 모듈(134)은 스크립트 형태의 명령어를 활용해 데이터 획득에서부터 분석까지의 전체 과정을 실행하고 관리하는 역할을 수행한다. 분석에 필요한 정보는 모두 데이터 스토리지 모듈(147)에 저장되고 분석에 필요한 데이터를 조회하고 활용하는 과정에서 ③ 데이터 인터페이스 모듈(135)이 사용될 수 있다. 라이브러리를 통해 요청된 분석 알고리즘은 플랫폼에서 템플릿 형태로 관리되는데 해당 템플릿을 조합해 분석에 활용하는 역할을 ④ 라이브러리 매니저가 수행한다. 제조 특화형 알고리즘 템플릿을 구성하기 위해서는 전처리, 분석, 시각화 각 과정에 대한 알고리즘 정보가 필요하고 해당 알고리즘 별 입력 값, 분석 실행 값 등이 필요하다. 그러나 여러 개의 알고리즘 템플릿이 동일한 알고리즘을 중복적으로 활용할 수 있기 때문에 효율적인 알고리즘의 재활용을 위해 본 발명의 실시예에서는 템플릿 기반의 라이브러리 구성을 할 수 있도록 설계 및 구현할 수 있다. 각각의 알고리즘은 템플릿 형태로 구성되어 알고리즘 라이브러리에 저장된다. 알고리즘 라이브러리 및 템플릿(141)은 각 라이브러리 별로 구성에 대한 정보, 각 단계에서 필수적으로 입력해야 하는 값에 대한 정보 등을 포함한다. 분석에 필요한 데이터, 알고리즘, 변수 등이 모두 조합되면 ⑤ 전처리 모듈(137), 러너 모듈(138) 및/또는 시각화 모듈(139)이 차례로 실행되면서 분석이 수행된다.
⑥ 데이터 스토리지 모듈(147)은 생산 현장 정보 관리부(160)에서 인터페이스 모듈(151)을 통해 전달된 정보를 저장하는 기능을 수행하고 하둡 ECO 시스템을 기반으로 설계될 수 있다. 하둡 ECO 시스템에서 제공하는 다양한 모듈 중 생산 현장의 특징을 고려해 정보를 저장하고 분석 할 수 있도록 모듈을 구성할 수 있다. 본 발명의 실시예에서, 예를 들면, 한정하는 것은 아니지만, 맵리듀스(148), YARN(149), HDFS(150), HBase, Hive 모듈 등을 사용할 수 있다. 저장 플랫폼의 데이터는 데이터 분석 엔진(131)의 분석 시점에 필요한 데이터를 공급하고 분석 결과를 저장한다.
도 5는 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법의 사용 시나리오를 도시한 블럭도이다.
도 5에 도시된 바와 같이, 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법은 크게 데이터 분석 전문가에 의해 수행되는 단계(즉, 라이브러리 등록)와, 일반 사용자에 의해 수행되는 단계(즉, 라이브러리 활용)를 포함한다.
먼저 데이터 분석 전문가에 의해, 대상 산업 및 제조 문제를 선택하는 대상 산업 및/또는 제조 문제 선택 단계(S1)와, 대상 산업 및 제조 문제별 데이터 특성을 반영하여 전처리, 분석, 및/또는 시각화 알고리즘을 선택하는 알고리즘 선택 단계(S2)와, 선택된 알고리즘별 변수를 설정하는 알고리즘 변수 설정 단계(S3)와, 선택된 알고리즘 및 설정 변수를 템플릿화하여 등록하는 템플릿 정보 등록 단계(S4)가 수행될 수 있다.
이어서, 일반 사용자에 의해 데이터 모델링이 수행된다.
여기서, 데이터 모델링은 크게 3가지 프로세스로 이루어질 수 있다. 예를 들어, 프로세스 A는 비전문가(일반 사용자)가 활용하는 프로세스로 사용자 입력을 최소화하고 알고리즘 템플릿을 활용해 분석을 수행하는 프로세스로 기존의 분석 프로세스 대비 알고리즘 선택, 변수 선택 과정에 필요한 부분이 알고리즘 템플릿 활용으로 대체될 수 있다.
프로세스 B는 알고리즘 템플릿에서 제공하는 알고리즘 중 일부에 대해 사용자가 변경을 희망하는 경우로 알고리즘 템플릿에서 제공되는 알고리즘 이외에 추가적인 알고리즘 적용이 가능하다.
프로세스 C는 분석 전문가가 활용하는 프로세스로 알고리즘 템플릿에서 제공하는 알고리즘, 변수를 사용자가 모두 변경하는 경우이다.
좀 더 구체적으로, 먼저 사용자는 대상 산업 및 제조 문제에 적합한 알고리즘 템플릿을 검색 및 선택하고(S5), 또한 데이터 분석을 수행할 대상 데이터를 선택한다(S6).
이후, 정보 입력 후 분석 요청이 이루어지는데, 이때 알고리즘 변경 여부가 판단된다(S7).
알고리즘을 변경하지 않고 수행하는 경우, 프로세스 A로서 사용자는 필수값을 입력한 후(S8), 분석 요청하며(S9), 마지막으로 결과를 확인(S10)한다.
또한, 알고리즘을 변경하여 수행하는 경우, 선택값 입력 여부가 판단된다(S11).
선택값의 변경이 없을 경우, 프로세스 B로서, 사용자는 전처리 알고리즘을 선택하고(S12), 분석 알고리즘을 선택하며(S13), 시각화 알고리즘을 선택하고(S14), 분석 요청하며(S15), 마지막으로 결과를 확인(S16)한다.
더불어, 선택값의 변경이 있을 경우, 프로세스 C로서, 사용자는 전처리 알고리즘 선택 후 필수값 및 선택값을 입력하고(S17), 분석 알고리즘 선택 후 필수값 및 선택값을 입력하며(S18), 시각화 알고리즘 선택 후 필수값 및 선택값을 입력(S19)한 후, 분석 요청하며(S20), 마지막으로 결과를 확인(S21)한다.
도 6은 본 발명의 다양한 실시예에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법의 예시적 실행순서를 도시한 블럭도이다.
사용자는 데이터 모델링 애플리케이션(110)인 웹 애플리케이션(예를 들면, 브라우저의 분석 화면)을 통해 모델링을 수행한다(①).
즉, 데이터 모델링 애플리케이션(110)은 데이터 모델링 시 입력한 입력 정보 및 알고리즘 템플릿을 기반으로 모델링 XML 파일 생성하며(②), 이러한 XML 파일은 배치 스케줄러(118)에 스케줄 형태로 등록된 뒤 분석 시점이 되었을 때 프로젝트 분석을 수행하도록 한다(③).
프로젝트 실행이 수행되는데, 데이터 분석 플랫폼(130)이 모델링 XML 파일을 로드하고(④), XML 로드 정보를 기반으로 분석을 위한 세부 명령어를 작성하며(⑤), 입력된 내용을 기반으로 모듈 인스턴스 생성 및 실행 흐름을 생성한다(⑥).
다음으로, 프로세스 스트림이 실행되는데, 데이터 분석 플랫폼(130)이 분석에 필요한 데이터를 요청 및 데이터를 로드하며(⑦), 이어서 하둡과 같은 데이터 스토리지 모듈(147)로부터 SQL문 처리를 통해 데이터를 요청한다(⑧).
또한, 데이터 분석 플랫폼(130)은 로딩된 데이터를 기반으로 각 전처리 과정을 실행한다(⑨). 더불어, 데이터 분석 플랫폼(130)은 전처리된 데이터를 기반으로 알고리즘 분석을 수행한다(⑩).
이어서, 데이터 분석 플랫폼(130)은 분석이 종료된 최종 데이터를 데이터 베이스에 저장하거나 결과 파일을 생성한다(⑪). 더불어, 데이터 분석 플랫폼(130)은 최종 결과 SQL을 데이터 스토리지 시스템에 저장한다(⑫).
이상에서 설명한 것은 본 발명에 따른 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조를 실시하기 위한 하나의 실시예에 불과한 것으로서, 본 발명은 상기한 실시예에 한정되지 않고, 이하의 특허청구범위에서 청구하는 바와 같이 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변경 실시가 가능한 범위까지 본 발명의 기술적 정신이 있다고 할 것이다.
100; 제조 특화형 알고리즘 템플릿 기반 데이터 분석을 위한 플랫폼의 구조
110; 데이터 모델링 애플리케이션 111; 데이터 모델러
112; 전처리 모델러 113; 분석 모델러
114; 시각화 모델러 115; 품질 템플릿
116; 기계 템플릿 117; 에너지 템플릿
118; 배치 스케줄러 130; 데이터 분석 플랫폼
131; 데이터 분석 엔진 132; 분석 모듈
133; 엔진 인터페이스 모듈 134; 워크 플로우 모듈
135; 데이터 인터페이스 모듈 136; 라이브러리 매너저
137; 전처리 모듈 138; 러너 모듈
139; 시각화 모듈 140; 메타 매니저
141; 알고리즘 라이브러리 및 템플릿 142; 전처리 라이브러리
143; 분석 라이브러리 144; 시각화 라이브러리
145; 데이터 출력 라이브러리 146; 기타사양
147; 데이터 스토리지 모듈 148; 맵리듀스
149; YARN 150; HDFS
151; 인터페이스 모듈 152; 데이터 플로우 매니저
153; 데이터 어댑터
160; 생산 현장 정보 관리부(샵 플로어, Shop Floor)
161; 레거시 시스템 162; 설비 데이터

Claims (13)

  1. 대상 산업 및 제조 문제에 적합한 알고리즘 템플릿을 검색하여 선택하고, 데이터 분석을 수행할 대상 데이터를 선택하며, 정보를 입력하고 분석을 요청하는 데이터 모델링 단계;
    선택된 알고리즘 템플릿과 입력된 정보를 기반으로 데이터 분석을 수행하고, 분석 데이터를 저장하는 데이터 분석 단계; 및
    데이터 모델링 단계 및 데이터 분석 단계에서 사용할 수 있도록 생산 현장 정보를 생성 즉시 또는 미리 정해진 시간동안 축적 후 온라인으로 제공하는 생산 현장 정보 제공 단계를 포함하고,
    데이터 모델링 단계 이전에,
    대상 산업 및 제조 문제를 선택하는 대상 산업 및 제조 문제 선택 단계;
    대상 산업 및 제조 문제별 데이터 특성을 반영하여 전처리, 분석, 시각화 알고리즘을 선택하는 알고리즘 선택 단계;
    선택된 알고리즘별 변수를 설정하는 알고리즘 변수 설정 단계; 및
    선택된 알고리즘 및 설정 변수를 템플릿화하여 등록하는 템플릿 정보 등록 단계를 더 포함하며,
    데이터 모델링 단계는
    알고리즘을 변경하지 않고 수행하는 경우 필수값을 입력한 후, 분석 요청하여 이루어지며,
    데이터 모델링 단계는
    알고리즘을 변경하여 수행하는 경우로서,
    선택값의 변경이 없을 경우,
    전처리 알고리즘, 분석 알고리즘 및 시각화 알고리즘을 각각 선택한 후 분석 요청하여 이루어지고,
    선택값의 변경이 있을 경우,
    전처리 알고리즘 선택 후 필수값 및 선택값을 입력하고,
    분석 알고리즘 선택 후 필수값 및 선택값을 입력하며,
    시각화 알고리즘 선택 후 필수값 및 선택값을 입력한 후, 분석 요청하여 이루어지며,
    데이터 모델링 단계에서 데이터 분석 단계로 전달되는 모델링 정보는 XML 파일 형태인 것을 특징으로 하는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법.
  2. 삭제
  3. 삭제
  4. 제 1 항에 있어서,
    데이터 분석 단계 이후 데이터 분석 결과를 사용자에게 전달하는 데이터 분석 결과 전달 단계를 더 포함함을 특징으로 하는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법.
  5. 삭제
  6. 제 1 항에 있어서,
    데이터 모델링 단계는
    대상 데이터의 전처리, 분석 및/또는 시각화 모델링을 수행하고, 분석 정보를 관리하여 이루어짐을 특징으로 하는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법.
  7. 삭제
  8. 대상 산업 및 제조 문제에 적합한 알고리즘 템플릿을 검색하여 선택하고, 데이터 분석을 수행할 대상 데이터를 선택하며, 정보를 입력하고 분석을 요청하는 데이터 모델링 애플리케이션;
    선택된 알고리즘 템플릿과 입력된 정보를 기반으로 데이터 분석을 수행하고, 분석 데이터를 저장하는 데이터 분석 플랫폼; 및
    데이터 모델링 애플리케이션 및 데이터 분석 플랫폼에서 사용할 수 있도록 생산 현장 정보를 생성 즉시 또는 미리 정해진 시간동안 축적 후 온라인으로 제공하는 생산 현장 정보 관리부를 포함함을 특징으로 하는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 플랫폼 구조 시스템.
  9. 제 8 항에 있어서,
    데이터 모델링 애플리케이션은
    대상 데이터의 전처리, 분석 및/또는 시각화 모델링을 위한 데이터 모델러; 및
    분석 정보를 관리하는 배치 스케줄러를 포함함을 특징으로 하는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 플랫폼 구조 시스템.
  10. 제 8 항에 있어서,
    데이터 분석 플랫폼은
    데이터를 분석하는 데이터 분석 엔진;
    분석된 데이터를 저장하는 데이터 스토리지 모듈; 및
    생산 현장의 데이터를 데이터 스토리지 모듈로 전달하는 인터페이스 모듈을 포함함을 특징으로 하는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 플랫폼 구조 시스템.
  11. 제 8 항에 있어서,
    데이터 분석 엔진은
    데이터 모델링 애플리케이션에서 분석 요청된 데이터를 분석하는 분석 모듈; 및
    전처리, 분석, 시각화 라이브러리를 분석 모듈에 제공하는 알고리즘 라이브러리를 포함함을 특징으로 하는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 플랫폼 구조 시스템.
  12. 제 11 항에 있어서,
    분석 모듈은
    데이터 모델링 애플리케이션에서 분석 요청된 데이터를 해석하여 분석에 필요한 데이터, 사용 알고리즘 및 분석 조건에 대한 정보를 스크립 형태의 명령어로 생성하는 엔진 인터페이스 모듈;
    스크립트 형태의 명령어를 이용하여 데이터 획득에서 분석까지의 전체 과정을 실행하고 관리하는 워크 플로우 모듈;
    데이터 스토리지 모듈에 저장되고 분석에 필요한 데이터를 조회 및 이용하는 데이터 인터페이스 모듈;
    알고리즘 라이브러리로부터 알고리즘 템플릿을 조합하여 분석에 이용하도록 하는 라이브러리 매니저; 및
    분석에 필요한 데이터, 알고리즘 및 변수가 모두 조합되면 순차적으로 실행되는 전처리 모듈, 러너 모듈, 시각화 모듈을 포함함을 특징으로 하는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 플랫폼 구조 시스템.
  13. 제 8 항에 있어서,
    데이터 모델링 애플리케이션에서 데이터 분석 플랫폼으로 전달되는 모델링 정보는 XML 파일 형태인 것을 특징으로 하는 제조 특화형 알고리즘 템플릿 기반 데이터 분석 플랫폼 구조 시스템.
KR1020170034777A 2017-03-20 2017-03-20 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템 KR101888637B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170034777A KR101888637B1 (ko) 2017-03-20 2017-03-20 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170034777A KR101888637B1 (ko) 2017-03-20 2017-03-20 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템

Publications (1)

Publication Number Publication Date
KR101888637B1 true KR101888637B1 (ko) 2018-08-14

Family

ID=63230331

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170034777A KR101888637B1 (ko) 2017-03-20 2017-03-20 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템

Country Status (1)

Country Link
KR (1) KR101888637B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200092447A (ko) * 2019-01-04 2020-08-04 에스케이 주식회사 설명 가능한 인공지능 모델링 및 시뮬레이션 시스템 및 방법
KR20210014452A (ko) * 2019-07-30 2021-02-09 스퀘어네트 주식회사 제조 공정 비정상 데이터 탐지 시스템
CN112381137A (zh) * 2020-11-10 2021-02-19 重庆大学 新能源电力系统可靠性评估方法、装置、设备及存储介质
CN113535791A (zh) * 2020-04-14 2021-10-22 北京一起教育信息咨询有限责任公司 一种数据生成方法、装置及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240806A (ja) * 1997-02-21 1998-09-11 Matsushita Electric Ind Co Ltd 実装工場展開検討支援システム
JP2003308427A (ja) * 2002-02-15 2003-10-31 Fujitsu Ltd モデル構築プログラム、モデル構築方法およびモデル構築装置
JP4296160B2 (ja) 2005-03-29 2009-07-15 株式会社東芝 回路基板の品質解析システム及び品質解析方法
KR20130009985A (ko) * 2010-03-26 2013-01-24 이엠디 밀리포어 코포레이션 전자 보고서의 생성 방법
KR20130109436A (ko) * 2012-03-27 2013-10-08 주식회사 포스코 해석 자동화 시스템을 포함한 철강산업용 가상설비 시스템 및 그의 동작 방법
KR101530848B1 (ko) 2012-09-20 2015-06-24 국립대학법인 울산과학기술대학교 산학협력단 데이터마이닝을 이용하여 생산 공정에서 품질을 관리하는 장치 및 방법
KR101661818B1 (ko) 2014-12-23 2016-09-30 (주)해인씨앤에스 제조 공정 라인의 공정 및 품질 관리 방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240806A (ja) * 1997-02-21 1998-09-11 Matsushita Electric Ind Co Ltd 実装工場展開検討支援システム
JP2003308427A (ja) * 2002-02-15 2003-10-31 Fujitsu Ltd モデル構築プログラム、モデル構築方法およびモデル構築装置
JP4296160B2 (ja) 2005-03-29 2009-07-15 株式会社東芝 回路基板の品質解析システム及び品質解析方法
KR20130009985A (ko) * 2010-03-26 2013-01-24 이엠디 밀리포어 코포레이션 전자 보고서의 생성 방법
KR20130109436A (ko) * 2012-03-27 2013-10-08 주식회사 포스코 해석 자동화 시스템을 포함한 철강산업용 가상설비 시스템 및 그의 동작 방법
KR101530848B1 (ko) 2012-09-20 2015-06-24 국립대학법인 울산과학기술대학교 산학협력단 데이터마이닝을 이용하여 생산 공정에서 품질을 관리하는 장치 및 방법
KR101661818B1 (ko) 2014-12-23 2016-09-30 (주)해인씨앤에스 제조 공정 라인의 공정 및 품질 관리 방법

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200092447A (ko) * 2019-01-04 2020-08-04 에스케이 주식회사 설명 가능한 인공지능 모델링 및 시뮬레이션 시스템 및 방법
KR102142205B1 (ko) 2019-01-04 2020-08-06 에스케이 주식회사 설명 가능한 인공지능 모델링 및 시뮬레이션 시스템 및 방법
KR20210014452A (ko) * 2019-07-30 2021-02-09 스퀘어네트 주식회사 제조 공정 비정상 데이터 탐지 시스템
KR102265461B1 (ko) * 2019-07-30 2021-06-15 스퀘어네트 주식회사 제조 공정 비정상 데이터 탐지 시스템
CN113535791A (zh) * 2020-04-14 2021-10-22 北京一起教育信息咨询有限责任公司 一种数据生成方法、装置及电子设备
CN112381137A (zh) * 2020-11-10 2021-02-19 重庆大学 新能源电力系统可靠性评估方法、装置、设备及存储介质
CN112381137B (zh) * 2020-11-10 2024-06-07 重庆大学 新能源电力系统可靠性评估方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Zhang et al. IoT-enabled real-time production performance analysis and exception diagnosis model
Rødseth et al. Deep digital maintenance
KR101888637B1 (ko) 제조 특화형 알고리즘 템플릿 기반 데이터 분석 방법 및 플랫폼 구조 시스템
US20170109657A1 (en) Machine Learning-Based Model for Identifying Executions of a Business Process
Yang et al. A system architecture for manufacturing process analysis based on big data and process mining techniques
US20170109676A1 (en) Generation of Candidate Sequences Using Links Between Nonconsecutively Performed Steps of a Business Process
US20170109668A1 (en) Model for Linking Between Nonconsecutively Performed Steps in a Business Process
Garg et al. Challenges and techniques for testing of big data
US20170109667A1 (en) Automaton-Based Identification of Executions of a Business Process
US20170109636A1 (en) Crowd-Based Model for Identifying Executions of a Business Process
US20170109639A1 (en) General Model for Linking Between Nonconsecutively Performed Steps in Business Processes
KR20160148911A (ko) 산업유형별 공정 데이터 분석 및 검증 기술과 hw-sw 융합 프레임워크 기반의 정보통합 시스템
Gopal et al. Digital twin and IOT technology for secure manufacturing systems
Schreiber et al. Integrated production and maintenance planning for cyber-physical production systems
CN106873957A (zh) 一种业务流程的处理方法和设备
Corallo et al. Model-based Big Data Analytics-as-a-Service framework in smart manufacturing: A case study
Eitzinger et al. ClusterCockpit—A web application for job-specific performance monitoring
Kuehn Simulation in digital enterprises
CN110799997A (zh) 工业数据服务、数据建模、以及数据应用平台
Jun et al. Cloud-based big data analytics platform using algorithm templates for the manufacturing industry
CN105868956A (zh) 一种数据处理方法及装置
TWI257538B (en) On-line quality control information system and method
Meier et al. A process model for systematically setting up the data basis for data-driven projects in manufacturing
KR102411291B1 (ko) 스마트공장 데이터 품질평가 방법
CN113590835A (zh) 纺织行业数据的知识图谱构建方法、装置及处理器

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant