KR20210136652A

KR20210136652A - 인공신경망을 이용한 부품 단종 예측 장치 및 방법

Info

Publication number: KR20210136652A
Application number: KR1020200055195A
Authority: KR
Inventors: 이강택; 박연경
Original assignee: 엘아이지넥스원 주식회사
Priority date: 2020-05-08
Filing date: 2020-05-08
Publication date: 2021-11-17
Also published as: KR102352510B1

Abstract

본 발명은 인공신경망을 이용한 부품 단종 예측 방법 및 장치에 관한 것이며, 본 발명의 일실시예에 따른 인공신경망을 이용한 부품 단종 예측 방법은 상용부품 데이터베이스에서 대상 부품을 식별하고, 웹크롤러(Web Crawler)를 사용하여 부품의 단종 정보를 수집하는 데이터 수집단계; 상기 데이터 수집단계를 통해서 수집된 부품의 정보를 통합하는 데이터 통합단계; 인공신경망으로 학습 및 예측이 가능하도록 상기 통합된 부품 데이터를 가공하여 전처리하는 데이터 전처리 단계; 상기 데이터 전처리 단계를 통해서 벡터화된 데이터를 인공신경망(Neural Network)으로 입력하여 부품의 예측 단종정보를 출력하는 예측모델 구축 단계; 및 기술통계량을 기반으로 상기 예측모델의 성능기준을 설정하고, 상기 출력된 예측 단종정보가 상기 설정된 성능기준에 부합하는지 비교하여 예측모델의 성능을 검증하는 예측모델 성능 검증 단계를 포함한다.

Description

인공신경망을 이용한 부품 단종 예측 장치 및 방법{APPARATUS AND METHOD FOR PREDICTING COMMERCIAL PARTS DISCONTINUANCE USING ARTIFICIAL NEURAL NETWORK}

본 발명은 비정형 데이터와 인공 신경망을 이용하여 부품의 단종 정보를 예측할 수 있는 장치 및 방법에 관한 것이다.

과학과 기술이 빠르게 발전하면서 제품을 사용하는 사용자는 다양한 환경에서 정밀하게 기능하는 장비를 원하고 있으며, 이와 같은 기술발전 속도는 부품류의 빠른 교체주기와 짧은 수명주기를 갖도록 하고 있다. 이와 같은 기술발전 추세는 일상생활에서 접하는 전자제품뿐만 아니라 무기체계에도 적용되고 있다.

우리나라 군사 기술 및 무기체계는 현재 인공지능 등의 4차 산업혁명 핵심 요소를 근간으로 하여 현대 전장을 스마트 전장으로 갖추고 있으며 무기체계에 고도의 정밀화와 자동화를 갖추기 위해 노력하고 있다. 무기체계의 정밀화 및 자동화 추세에 따라서, 현대의 무기체계는 수천에서 수만 개의 최신 부품을 활용하여 대략 약 5년 내지 10년간 개발하고 있으며, 개발된 무기체계는 작전지역에 배치되어 최소 25년 내지 30년 이상 사용되고 있다. 최근 전자부품의 수명주기가 4년 내지 7년 정도로 예상되므로, 이를 고려하면 무기체계가 작전지역에 배치되는 순간부터 적용된 부품의 진부화는 이미 시작된다고 볼 수 있다. 진부화된 부품은 결과적으로 부품 단종(DMSMS, Diminishing Manufacturing Sources and Material Shortage) 문제를 발생시키며 무기체계의 정비 지연을 초래하여 전투력 유지에 심각한 영향을 미치게 된다.

미국을 비롯한 선진국에서도 무기체계 수명주기 기간 중 부품 단종으로 인해 많은 어려움을 겪고 있으며, 이로 인한 문제점을 최소화하기 위하여 여러 가지 기술 개발과 함께 관련 규정 정비 및 전담기구 운영 등 많은 노력을 기울이고 있다.

한편, 모든 부품에 대한 단종 정보는 무기체계 개발부터 폐기까지 관리하여 운용 간 문제가 발생하지 않도록 준비하는 것이 이상적이며, 부품에 대한 수명주기를 예측하여 수리 부속 보급 및 장비 운용 계획을 세우는 것이 중요하나 현재 이에 대한 대응 및 관리체계는 부재한 실정이다.

본 발명의 일실시예에 따르면, 본 발명은 상용 부품단종 예측도구에서 제공하는 부품에 대한 정형, 비정형 빅데이터를 수집하고, 데이터 전처리 및 Embedding 과정을 거쳐, 신경망 학습 알고리즘을 적용하여, 상용 부품에 대한 단종 정보를 예측할 수 있는 장치 및 방법을 제공하는 것을 목적으로 한다.

그러나 본 발명의 목적은 상기에 언급된 사항으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.

본 명세서의 일실시예에 따른 인공신경망을 이용한 부품 단종 예측 방법은 상용부품 데이터베이스에서 대상 부품을 식별하고, 웹크롤러(Web Crawler)를 사용하여 부품의 단종 정보를 수집하는 데이터 수집단계; 상기 데이터 수집단계를 통해서 수집된 부품의 정보를 통합하는 데이터 통합단계; 인공신경망으로 학습 및 예측이 가능하도록 상기 통합된 부품 데이터를 가공하여 전처리하는 데이터 전처리 단계; 상기 데이터 전처리 단계를 통해서 벡터화된 데이터를 인공신경망(Neural Network)으로 입력하여 부품의 예측 단종정보를 출력하는 예측모델 구축 단계; 및 기술통계량을 기반으로 상기 예측모델의 성능기준을 설정하고, 상기 출력된 예측 단종정보가 상기 설정된 성능기준에 부합하는지 비교하여 예측모델의 성능을 검증하는 예측모델 성능 검증 단계를 포함한다.

바람직하게는, 데이터 수집단계에서 수집된 데이터는 비정형 데이터를 포함하며, 부품번호, 제조사명, 카테고리, 부품의 설명, 수명주기 위험도 및 단종예측연도 중 적어도 하나 이상을 포함할 수 있다.

바람직하게는, 수명주기 위험도는 위험의 정도를 소정의 범주로 나타내며, 상기 단종예측연도는 숫자로 표현되는 것을 특징으로 한다.

바람직하게는, 데이터 전처리 단계에서 단종예측연도는 현재시점으로 보정하고, 누락된 데이터는 필터링을 통하여 삭제하고, 비정형데이터는 FastText 알고리즘을 이용하여 Embedding 적용 및 벡터화하는 것을 특징으로 한다.

바람직하게는, 데이터 전처리 단계 이후에 전처리한 데이터중 75%의 데이터는 학습데이터 셋으로 랜덤하게 추출하고, 25%의 데이터는 평가데이터 셋으로 랜덤하게 추출하여 예측모델 구축 단계 및 예측모델 성능 검증 단계의 입력 데이터로 입력하는 것을 특징으로 한다.

바람직하게는, 예측모델 구축 단계에서 인공신경망은 완전연결망(Fully Connected Network)인 것을 특징으로 한다.

바람직하게는, 예측모델 구축 단계에서 부품의 예측 단종정보는 수명주기 위험도 또는 단종예측연도이며, 수명주기 위험도는 위험 수준을 소정의 범주로 나타내는 범주형 데이터이며, 단종예측연도는 숫자로 표현되는 수치형 데이터인 것을 특징으로 한다.

바람직하게는, 수명주기 위험도는 출력함수로 Softmax를 설정하여 범주형 자료 형태로 출력될 수 있다.

바람직하게는, 예측모델 성능 검증 단계에서 예측 단종정보가 범주형 데이터인 경우 전체 범주에서 비중이 높은 범주의 값의 비율을 기준으로 성능기준을 설정하며, 예측 단종정보가 수치형 데이터인 경우 표준편차를 기준으로 성능기준을 설정하는 것을 특징으로 한다.

본 명세서의 일실시예에 따른 인공신경망을 이용한 부품 단종 예측 장치는 상용부품 데이터베이스에서 대상 부품을 식별하고, 웹크롤러를 사용하여 부품의 단종 정보를 수집하고, 수집된 부품 정보를 통합하는 데이터 수집부; 인공신경망으로 학습 및 예측이 가능하도록 상기 수집된 데이터를 가공하여 전처리하는 데이터 전처리부; 및 상기 데이터 전처리부를 통해서 벡터화된 데이터를 입력받아 부품의 예측 단종정보를 출력하는 인공신경망을 기반으로 학습모형 및 예측모델을 구축하는 학습모델 생성부; 및 기술통계량을 기반으로 상기 예측모델의 성능기준을 설정하고, 상기 출력된 예측 단종정보가 상기 설정된 성능기준에 부합하는지 비교하여 상기 구축된 예측모델의 성능을 검증하는 성능 검증부를 포함한다.

바람직하게는, 데이터 수집부의 수집된 부품 정보는 비정형 데이터를 포함하며, 부품번호, 제조사명, 카테고리, 부품의 설명, 수명주기 위험도 및 단종예측연도 중 적어도 하나 이상을 포함할 수 있다.

바람직하게는, 데이터 전처리부는 단종예측연도를 현재시점으로 보정하고, 누락된 데이터는 필터링을 통하여 삭제하고, 비정형데이터는 FastText 알고리즘을 이용하여 Embedding 적용 및 벡터화하는 것을 특징으로 한다.

바람직하게는, 데이터 전처리부는 데이터 전처리 단계 이후에 전처리한 데이터중 75%의 데이터는 학습데이터 셋으로 랜덤하게 추출하고, 25%의 데이터는 평가데이터 셋으로 랜덤하게 추출하여 학습모델 생성부 및 성능 검증부의 입력 데이터로 입력한다.

바람직하게는, 인공신경망은 완전연결망(Fully Connected Network)인 것을 특징으로 한다.

바람직하게는, 부품의 예측 단종정보는 수명주기 위험도 또는 단종예측연도이며, 수명주기 위험도는 위험 수준을 소정의 범주로 나타내는 범주형 데이터이며, 단종예측연도는 숫자로 표현되는 수치형 데이터인 것을 특징으로 한다.

또한, 수명주기 위험도는 출력함수로 Softmax를 설정하여 범주형 자료 형태로 출력된다.

바람직하게는, 성능 검증부는 예측 단종정보가 범주형 데이터인 경우 전체 범주에서 비중이 높은 범주의 값의 비율을 기준으로 성능기준을 설정하며, 예측 단종정보가 수치형 데이터인 경우 표준편차를 기준으로 성능기준을 설정하는 것을 특징으로 한다.

본 발명의 일실시예에 따르면, 부품 단종 정보가 없는 품목에 대한 단종정보를 예측할 수 있으며, 예측된 단종 정보의 성능을 측정할 수 있도록 기술통계량의 기준점을 설정하여 검증할 수 있어서 예측결과의 신뢰도를 높일 수 있는 효과가 있다.

또한, 부품 수명주기가 비교적 긴 무기체계에 적용함으로써 무기체계 설계부터 부품 단종을 고려한 제품 개발을 할 수 있으며, 이를 통해서 무기체계의 가용도 향상을 도모할 수 있는 효과가 있다.

도 1은 본 발명의 일실시예에 따른 인공신경망을 이용한 부품 단종 예측 방법을 순차적으로 도시한 순서도이다.
도 2는 본 발명의 일실시예에 따른 수집된 부품 정보를 전처리한 데이터를 예시적으로 나타낸 참고도이다.
도 3은 데이터 전처리 과정에서 사용되는 FastText 알고리즘의 하이퍼 파라미터를 나타낸 참고도이다.
도 4는 본 발명의 일실시예에 따른 학습모델 및 예측모델 구축 과정을 순차적으로 도시한 순서도이다.
도 5는 본 발명의 일실시예에 따른 인공신경망을 통해 학습된 모델을 기반으로 출력된 예측 단종정보 결과값을 나타낸 참고도이다.
도 6은 본 발명의 일실시예에 따른 학습모델 성능검증 결과를 나타낸 그래프이다.
도 7은 본 발명의 일실시예에 따른 인공신경망을 이용한 부품 단종 예측 장치를 개략적으로 도시한 블록도이다.

이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조 부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다. 또한, 이하에서 본 발명의 바람직한 실시예를 설명할 것이나, 본 발명의 기술적 사상은 이에 한정하거나 제한되지 않고 당업자에 의해 변형되어 다양하게 실시될 수 있음은 물론이다.

도 1은 본 발명의 일실시예에 따른 인공신경망을 이용한 부품 단종 예측 방법을 순차적으로 도시한 순서도이다.

우선, 대상 부품을 식별하고 웹기반 정보제공 도구를 선정하여 부품 데이터를 수집한다(S101). 대상 부품 식별은 상용부품 데이터베이스 등 사내에서 사용중인 부품 목록을 대상으로 식별할 수 있다. 또한, 웹기반 부품 정보제공 데이터베이스 중 예를 들면 IHS BOM Intelligence를 선정하여 데이터를 수집할 수도 있다.

IHS BOM Intelligence는 부품정보와 제품 생산 관리 향상에 필요한 Database 로서, 약 400여 개 이상 카테고리로 구분되어 있으며 전기전자 부품 및 제품의 정보를 Online, XML Web Service 및 Behind Fire Wall 등으로 선택하여 이용할 수 있다. 그리고, 웹크롤러(Web Crawler)를 사용하여 인터넷 상에 존재하는 자료를 검색하고 부품의 단종 정보를 수집한다. 웹크롤링 및 웹크롤러는 인터넷 상에 있는 수많은 자료들을 수집하여 프로그래밍하기 용이하도록 또는 데이터 분석하기 쉬운 형태로 가공하는 작업을 의미한다.

이와 같은 툴과 과정을 통해서 수집된 부품 데이터는 각 상용 부품에 대한 부품번호(Part Number), 제조사명(Mfr Name), 카테고리(Category), 부품설명(Description), 생산자가 제공한 부품설명 상세(Manufacturer Part Description), 생산자가 제공한 Package 설명 상세(Manufacturer Package Description), 수명주기 위험도 분류(Life Cycle Risk; LC Risk), 단종예측연도(Estimated YTEOL; Year To End Of Life) 등을 포함하며, 이와 같이 수집된 다수의 부품 단종 정보를 통합한다(S103).

이후, 인공신경망으로 학습 및 예측이 가능하도록 통합된 부품 데이터를 가공하여 전처리한다(S105).

데이터의 전처리 과정은 단종예측연도를 현재시점으로 보정하거나, 누락된 데이터를 필터링을 이용하여 삭제하는 작업 등을 포함한다. 예를 들어, 단종예측연도 시점이 2019년 1월 1일 기준 6년으로 설정되어 있다면, 현재일을 2020년 1월 1일이라고 가정한다면 현재일을 기준으로 5년으로 보정한다.

도 2는 본 발명의 일실시예에 따른 수집된 부품 정보 데이터를 전처리한 데이터를 예시적으로 나타낸 참고도이며, 이와 같은 비정형 데이터는 FastText 알고리즘을 이용하여 Embedding을 적용하고 벡터화함으로써 기계학습을 위한 인공신경망으로 입력할 수 있다. 상기 부품 정보 데이터 중 LC Risk는 HIGH, MEDIUM, LOW 등의 범주로 표현되는 범주형 데이터이며, Estimated YTEOL은 숫자로 표현되는 수치형 데이터이다.

도 3은 데이터 전처리 과정에서 사용되는 FastText 알고리즘의 하이퍼 파라미터를 나타낸 참고도이다.

FastText는 기본적으로 word2vec 모델을 확장한 것으로서, word2vec은 각 단어를 쪼개질 수 없는 원자적 단위로 취급해서 벡터를 만들지만, FastText는 단어를 문자(character)의 ngram 조합으로 취급한다. FastText에서 word_ngrams 파라미터를 '0'으로 설정한다면 각 단어를 쪼개질 수 없는 단위로 취급한다는 의미이므로 word2vec 모델과 동일하게 된다. FastText에서는 한 단어에 대한 벡터는 이들 ngram의 합으로 만들어진다. 예를 들면, "apple" 이란 단어의 벡터는, 하이퍼 파라미터의 최소 ngram(min_n)을 3으로 설정하고, 최대 ngram(max_n)을 6으로 설정하였을 경우, "<ap", "app", "appl", "apple>", "ppl", "ppple", "pple>", "ple", "ple>", "le>"과 같은 ngram 벡터들의 합으로 만들수 있다.

본 발명의 일실시예에 따르면, 데이터 전처리 단계 이후에 전처리한 데이터중 75%의 데이터는 학습데이터 셋으로 랜덤하게 추출하고, 25%의 데이터는 평가데이터 셋으로 랜덤하게 추출하여 예측모델 구축 및 예측모델 성능 검증시 각각의 입력 데이터로 입력할 수 있다.

이후, 데이터 전처리 단계를 통해서 벡터화된 데이터를 인공신경망(Neural Network)으로 입력하여 부품의 예측 단종정보를 출력하는 예측모델을 구축한다(S107).

도 4는 본 발명의 일실시예에 따른 학습모델 및 예측모델 구축 과정을 순차적으로 도시한 순서도이며, 도시된 바와 같이, 전처리 단계(S105)를 통해서 벡터화된 데이터를 인공신경망으로 입력하면(S20), 인공신경망을 통해서 데이터를 학습시키고(S30), 결과값인 수명주기 위험도(LC Risk)와 단종예측연도(YTEOL)를 예측하여(40), 최종적으로 부품 단종 예측모델을 구축한다(S50).

이때, 본 발명의 일실시예에 따르면, 인공신경망은 여러 층의 노드들로 구성한 네트워크를 의미하며, Input layer, hidden layer, output layer 등으로 구성될 수 있다. Input layer는 데이터, hidden layer는 backpropagation으로 학습되는 파라미터들의 값, output layer는 결과 값을 가지게 된다. 그리고, 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어를 Fully Connected Layer(FC Layer) 또는 Dense Layer라고도 하며, 상기 인공신경망을 FC Layer로 구성할 수도 있다.

도 5는 본 발명의 일실시예에 따른 인공신경망을 통해 학습된 모델을 기반으로 출력된 예측 단종정보 결과값을 나타낸 참고도이다.

도시된 바와 같이, 결과값 중 수명주기 위험도(a)는 위험 수준을 소정의 범주로 나타내는 범주형 데이터이며, 단종예측연도(b)는 숫자로 표현되는 수치형 데이터이다. 이때, 수명주기 위험도(a)는 출력함수로 Softmax를 설정하여 범주형 자료 형태로 출력할 수 있다. 상기 Softmax 함수는 예를들어 K개의 값이 존재할 때 각각의 값의 편차를 확대시켜서 큰 값은 상대적으로 더 크게, 작은 값은 상대적으로 더 작게 만든 다음에 normalization 시키는 함수이다. 따라서, FC layer의 마지막 layer의 출력값에 softmax를 적용하면 그 값들은 특정 범주에 속할 확률로 표현될 수 있다.

이후, 기술통계량을 기반으로 S107 단계에서 구축된 예측모델의 성능 평가 기준을 설정하고, S107 단계에서 출력된 예측 단종정보가 상기 설정된 성능 평가 기준에 부합하는지 비교하여 예측모델의 성능을 검증한다(S109).

이때, 예측 단종정보가 LC Risk와 같은 범주형 데이터인 경우 전체 범주에서 비중이 높은 범주의 값의 비율을 기준으로 성능기준을 설정하며, 예측 단종정보가 YTEOL과 같은 수치형 데이터인 경우 표준편차를 기준으로 성능기준을 설정한다.

본 발명의 출원인은 총 54,665 건의 데이터 중 75%인 40,998 건의 데이터를 무작위로 선정하여 학습 데이터로 모델 학습을 수행하였으며, 25%인 13,667 건의 데이터는 학습 모델 성능의 검증용으로 활용하여 실제 시뮬레이션을 수행하였다. 한편, 데이터 셋의 자료 불균형 문제로 인한 학습 모델의 성능을 적절하게 평가할 수 없는 경우가 발생 할 수 있으며, 가령 부품 데이터 90% 이상의 LC Risk가 'Med'라면, 아무 학습을 거치지 않은 모델에서도 90% 이상의 정확도 성능을 낼 수 있다. 따라서, 학습된 모델이 데이터 셋 불균형에 의한 성능을 초과하여, 적절하게 학습되었는지 확인하기 위해서는 성능에 대한 적절한 기준을 정하는 것이 필요하다. 본 성능 평가에서는 데이터 셋의 LC Risk 및 YTEOL에 대한 기술 통계량을 산출하여, 모델의 성능의 평가 기준으로 선정하였다. Excel 소프트웨어의 데이터 분석 기능을 이용하여 LC Risk 및 YTEOL에 대한 기술 통계량을 계산하였으며, 그 결과 학습 모델의 LC Risk의 식별 성능은 42.2%를 초과해야 하며, 예측된 YTEOL과 Real Value 간의 표준편차(Std)는 3.51 미만이어야 데이터 셋의 불균형에 따른 성능이 아닌 학습 모델의 적절성에 의한 성능으로 판단할 수 있다는 결론을 내렸다. 단, YTEOL에 대한 결측치 Data가 존재 할 경우 해당부품 LC Risk의 평균 YTEOL을 적용 하였다. 즉, 부품 '0402B474K100CT' 의 LC Risk가 'Low' 이나, YTEOL 값이 결측되어 있다면, 'Low'의 평균 YTEOL인 7.0 년을 적용하였다.

도 6은 학습모델 성능을 시뮬레이션한 검증 결과를 나타낸 그래프이며, 도 6(a)는 LC Risk의 예측에 대한 성능을 시뮬레이션한 결과이며, 도 6(b)는 YTEOL의 예측에 대한 성능을 시뮬레이션한 결과이다.

본 성능평가는 총 40,998개의 상용 품목의 LC Risk를 학습 하였으며, 13,667 개의 상용 품목에 대하여 LC Risk 및 YTEOL을 예측하여 성능을 검증하였다. 학습 모델은 Fully connected Neural Network을 적용하였으며, 6 layer, 256 unit/layer를 적용하였다. Categorical Data를 Output으로 학습하는 모델이므로, Output value 적용 함수로는 softmax를 설정하였으며, Epochs는 Heuristic을 적용하여 LC Risk는 100회로 설정하고 YTEOL은 200회로 설정하여 성능을 측정한 결과, LC Risk 학습 모델에 대한 Validation Accuracy는 0.85(즉, 85%)로 나타났으며, YTEOL 학습 모델에 대한 예측 표준편차는 1.77로 나타났다.

따라서, 하기 표 1과 같이 기술통계량을 기반으로 설정된 예측모델의 성능기준과 대비하여 예측 모델의 실제 성능은 우수한 것으로 도출되었다.

즉, 범주형 데이터인 LC Risk의 경우에는 비중이 높은 'LOW' 범주를 기준으로 42.4% 이상이어야 우수한 성능으로 볼 수 있으며, 수치형 데이터인 YTEOL의 경우에는 표준편차(Std)를 기준으로 3.51 미만이어야 우수한 성능으로 볼 수 있으며, 실제 성능평가 결과 LC Risk는 85%로 기준값 42.2% 이상이며, YTEOL은 1.77로 기준값 3.51 미만으로 좋은 예측 성능을 보여주고 있다.

도 7은 본 발명의 일실시예에 따른 인공신경망을 이용한 부품 단종 예측 장치를 개략적으로 도시한 블록도이다.

도시된 바와 같이, 인공신경망을 이용한 부품 단종 예측 장치는 데이터 수집부(10), 데이터 전처리부(20), 학습모델 생성부(30) 및 성능 검증부(40)를 포함한다.

데이터 수집부(10)는 상용부품 데이터베이스에서 대상 부품을 식별하고, 웹크롤러를 사용하여 부품의 단종 정보를 수집하고, 수집된 부품 정보를 통합한다.

데이터 전처리부(20)는 인공신경망으로 학습 및 예측이 가능하도록 상기 수집된 데이터를 가공하여 전처리하며, 예를 들어 단종예측연도는 현재시점으로 보정하고, 누락된 데이터는 필터링을 통하여 삭제하고, 비정형데이터는 FastText 알고리즘을 이용하여 Embedding 적용 및 벡터화한다.

한편, 전처리한 데이터중 소정의 데이터(예를 들면, 약 75%)는 학습데이터 셋으로 랜덤하게 추출하고, 소정의 데이터(예를 들면, 약 25%)는 평가데이터 셋으로 랜덤하게 추출하여 학습모델 생성부(30) 및 성능 검증부(40)의 입력 데이터로 입력된다.

학습모델 생성부(30)는 데이터 전처리부(20)를 통해서 벡터화된 데이터를 입력받아 부품의 예측 단종정보를 출력하는 인공신경망을 기반으로 학습모형 및 예측모델을 구축한다.

성능 검증부(40)는 기술통계량을 기반으로 학습모델 생성부(30)에 생성한 예측모델의 성능기준을 설정하고, 학습모델을 통해서 출력된 예측 단종정보가 설정된 성능기준에 부합하는지 비교하여 구축된 예측모델의 성능을 검증한다.

인공신경망을 이용한 부품 단종 예측 장치의 보다 상세한 구성과 동작은 앞서 도 1을 참조하여 설명한 바, 그 상세한 설명은 이하 생략한다.

이상에서 설명한 본 발명의 실시예를 구성하는 모든 구성요소들이 하나로 결합하거나 결합하여 동작하는 것으로 기재되어 있다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 또한, 이와 같은 컴퓨터 프로그램은 USB 메모리, CD 디스크, 플래쉬 메모리 등과 같은 컴퓨터가 읽을 수 있는 기록매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 기록매체로서는 자기 기록매체, 광 기록매체, 캐리어 웨이브 매체 등이 포함될 수 있다.

또한, 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 상세한 설명에서 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위 내에서 다양한 수정, 변경 및 치환이 가능할 것이다. 따라서, 본 발명에 개시된 실시예 및 첨부된 도면들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예 및 첨부된 도면에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구 범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리 범위에 포함되는 것으로 해석되어야 할 것이다.

10: 데이터 수집부
20: 데이터 전처리부
30: 학습모델 생성부
40: 성능 검증부

Claims

상용부품 데이터베이스에서 대상 부품을 식별하고, 웹크롤러(Web Crawler)를 사용하여 부품의 단종 정보를 수집하는 데이터 수집단계;
상기 데이터 수집단계를 통해서 수집된 부품의 정보를 통합하는 데이터 통합단계;
인공신경망으로 학습 및 예측이 가능하도록 상기 통합된 부품 데이터를 가공하여 전처리하는 데이터 전처리 단계;
상기 데이터 전처리 단계를 통해서 벡터화된 데이터를 인공신경망(Neural Network)으로 입력하여 부품의 예측 단종정보를 출력하는 예측모델 구축 단계; 및
기술통계량을 기반으로 상기 예측모델의 성능기준을 설정하고, 상기 출력된 예측 단종정보가 상기 설정된 성능기준에 부합하는지 비교하여 예측모델의 성능을 검증하는 예측모델 성능 검증 단계를 포함하는 인공신경망을 이용한 부품 단종 예측 방법.
제1항에 있어서,
상기 데이터 수집단계에서 수집된 데이터는 비정형 데이터를 포함하는 것을 특징으로 하는 인공신경망을 이용한 부품 단종 예측 방법.
제1항에 있어서,
상기 데이터 수집단계에서 수집된 데이터는 부품번호, 제조사명, 카테고리, 부품의 설명, 수명주기 위험도 및 단종예측연도 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 인공신경망을 이용한 부품 단종 예측 방법.
제3항에 있어서,
상기 수명주기 위험도는 위험의 정도를 소정의 범주로 나타내며, 상기 단종예측연도는 숫자로 표현되는 것을 특징으로 하는 인공신경망을 이용한 부품 단종 예측 방법.
제3항에 있어서, 상기 데이터 전처리 단계에서는,
상기 단종예측연도는 현재시점으로 보정하고, 누락된 데이터는 필터링을 통하여 삭제하고, 비정형데이터는 FastText 알고리즘을 이용하여 Embedding 적용 및 벡터화하는 것을 특징으로 하는 인공신경망을 이용한 부품 단종 예측 방법.
제1항에 있어서, 상기 예측모델 구축 단계에서,
상기 부품의 예측 단종정보는 수명주기 위험도 또는 단종예측연도이며,
상기 수명주기 위험도는 위험 수준을 소정의 범주로 나타내는 범주형 데이터이며, 상기 단종예측연도는 숫자로 표현되는 수치형 데이터인 것을 특징으로 인공신경망을 이용한 부품 단종 예측 방법.
제6항에 있어서,
상기 수명주기 위험도는 출력함수로 Softmax를 설정하여 범주형 자료 형태로 출력되는 것을 특징으로 하는 인공신경망을 이용한 부품 단종 예측 방법.
제6항에 있어서, 상기 예측모델 성능 검증 단계에서는,
상기 예측 단종정보가 범주형 데이터인 경우 전체 범주에서 비중이 높은 범주의 값의 비율을 기준으로 성능기준을 설정하며,
상기 예측 단종정보가 수치형 데이터인 경우 표준편차를 기준으로 성능기준을 설정하는 것을 특징으로 하는 인공신경망을 이용한 부품 단종 예측 방법.
상용부품 데이터베이스에서 대상 부품을 식별하고, 웹크롤러를 사용하여 부품의 단종 정보를 수집하고, 수집된 부품 정보를 통합하는 데이터 수집부;
인공신경망으로 학습 및 예측이 가능하도록 상기 수집된 데이터를 가공하여 전처리하는 데이터 전처리부; 및
상기 데이터 전처리부를 통해서 벡터화된 데이터를 입력받아 부품의 예측 단종정보를 출력하는 인공신경망을 기반으로 학습모형 및 예측모델을 구축하는 학습모델 생성부; 및
기술통계량을 기반으로 상기 예측모델의 성능기준을 설정하고, 상기 출력된 예측 단종정보가 상기 설정된 성능기준에 부합하는지 비교하여 상기 구축된 예측모델의 성능을 검증하는 성능 검증부를 포함하는 부품 단종 예측 장치.
제9항에 있어서,
상기 데이터 수집부의 상기 수집된 부품 정보는 비정형 데이터를 포함하며,
부품번호, 제조사명, 카테고리, 부품의 설명, 수명주기 위험도 및 단종예측연도 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 부품 단종 예측 장치.
제10항에 있어서, 상기 데이터 전처리부는
상기 단종예측연도는 현재시점으로 보정하고, 누락된 데이터는 필터링을 통하여 삭제하고, 비정형데이터는 FastText 알고리즘을 이용하여 Embedding 적용 및 벡터화하는 것을 특징으로 하는 부품 단종 예측 장치.
제9항에 있어서,
상기 부품의 예측 단종정보는 수명주기 위험도 또는 단종예측연도이며,
상기 수명주기 위험도는 위험 수준을 소정의 범주로 나타내는 범주형 데이터이며, 상기 단종예측연도는 숫자로 표현되는 수치형 데이터인 것을 특징으로 부품 단종 예측 장치.
제12항에 있어서, 상기 성능 검증부는,
상기 예측 단종정보가 범주형 데이터인 경우 전체 범주에서 비중이 높은 범주의 값의 비율을 기준으로 성능기준을 설정하며,
상기 예측 단종정보가 수치형 데이터인 경우 표준편차를 기준으로 성능기준을 설정하는 것을 특징으로 하는 부품 단종 예측 장치.