KR20210108074A - 플랜트 엔지니어링 업무 단계별 의사결정 지원을 위한 머신러닝 자동화 플랫폼 장치 - Google Patents
플랜트 엔지니어링 업무 단계별 의사결정 지원을 위한 머신러닝 자동화 플랫폼 장치 Download PDFInfo
- Publication number
- KR20210108074A KR20210108074A KR1020200022837A KR20200022837A KR20210108074A KR 20210108074 A KR20210108074 A KR 20210108074A KR 1020200022837 A KR1020200022837 A KR 1020200022837A KR 20200022837 A KR20200022837 A KR 20200022837A KR 20210108074 A KR20210108074 A KR 20210108074A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- analysis
- machine learning
- unit
- item
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06316—Sequencing of tasks or work
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
엔지니어링 전주기 데이터를 활용한 데이터 분석 장치에 관한 것이며, 엔지니어링 전주기 데이터를 활용한 분석 장치는, 엔지니어링 산업의 전주기에서 발생하는 프로젝트 데이터를 수집하는 데이터 수집부, 신규 프로젝트 데이터를 입력받는 데이터 입력부, 상기 데이터 입력부에서 입력받은 상기 신규 프로젝트 데이터를 머신러닝 기반으로 학습된 학습 모듈에 적용하여 데이터 분석을 수행하는 머신러닝부 및 상기 머신러닝부의 분석 결과를 시각화하여 제공하는 시각화부를 포함할 수 있다.
Description
본원은 엔지니어링 전주기 데이터를 활용한 데이터 관리 및 데이터 분석 장치에 관한 것이다.
엔지니어링 산업은 사업 전주기에 해당하는 기획 단계부터 설계, 구매, 시공, 운영, O&M의 플랜트 설비 예측정비에 이르기까지 각 단계마다 다양한 데이터가 발생하고 있으며, 발생되는 데이터를 활용하여 사업에서 발생될 수 있는 리스크를 최소화하기 위하여 MH(Man Hour) 및 비용 등의 다양한 지표를 산정하고 있다.
하지만, 현재 엔지니어링 산업에서는 데이터를 수집하고 활용할 수 있는 시스템이 체계적으로 갖추어 지지 않았기 때문에 데이터를 활용하여 여러 지표를 산정을 할 때 인적 오류를 포함한 여러 문제점을 야기할 수 있을 뿐만 아니라 사업 중간에서 상황을 파악하는데 오랜 시간이 걸린다는 문제점이 있다. 또한, 이러한 문제점은 엔지니어링 사업을 수행하는 데 있어 큰 피해액을 가지고 올 수도 있다.
그러므로 엔지니어링 산업의 각 단계에서 발생하는 데이터의 효율적인 관리를 통하여 위험요인을 분석하고 사용자가 사전에 대처하고 의사결정을 지원할 수 있도록 엔지니어링 데이터 관리와 데이터 분석 장치에 대한 연구가 필요하다.
본원의 배경이 되는 기술은 한국등록특허공보 제10-1229274호에 개시되어 있다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 엔지니어링 산업의 전주기에서 발생하는 프로젝트 데이터를 입력하고 사용자가 원하는 프로젝트 데이터 검색 기능을 지원하며, ITB 분석, 설계원가 예측, 설계오류 분석, 설계변경 분석, 플랜트 설비 예측정비를 엔지니어링 머신러닝 플랫폼을 활용하여 수행할 수 있는 엔지니어링 전주기 데이터를 활용한 데이터 관리 및 데이터 분석 장치를 제공하려는 것을 목적으로 한다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 분석된 결과를 대시보드형태로 시각화하여 제공할 수 있는 엔지니어링 전주기 데이터를 활용한 데이터 관리 및 데이터 분석 장치를 제공하려는 것을 목적으로 한다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 분석된 결과를 특정 표준화된 포맷으로 다운로드 할 수 있도록 제공하고, API를 제공하여 다른 어플리케이션에서 결과를 활용할 수 있도록 확장성을 고려할 수 있는 엔지니어링 전주기 데이터를 활용한 데이터 관리 및 데이터 분석 장치를 제공하려는 것을 목적으로 한다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 사용자가 신규 프로젝트를 입력했을 때, 기 입력된 프로젝트와 비교하여 가장 유사한 프로젝트를 출력해주고, 검색한 프로젝트에 대한 통계적 분석 결과를 시각화하여 제공할 수 있는 엔지니어링 전주기 데이터를 활용한 데이터 관리 및 데이터 분석 장치를 제공하려는 것을 목적으로 한다.
다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본원의 일 실시예에 따른 엔지니어링 전주기 데이터를 활용한 데이터 분석 장치는, 엔지니어링 산업의 전주기에서 발생하는 프로젝트 데이터를 수집하는 데이터 수집부, 신규 프로젝트 데이터를 입력받는 데이터 입력부, 상기 데이터 입력부에서 입력받은 상기 신규 프로젝트 데이터를 머신러닝 기반으로 학습된 학습 모듈에 적용하여 데이터 분석을 수행하는 머신러닝부 및 상기 머신러닝부의 분석 결과를 시각화하여 제공하는 시각화부를 포함할 수 있다.
또한, 상기 데이터 입력부는, 상기 엔지니어링 산업의 복수의 분석 단계 항목 중 분석을 수행할 어느 하나의 분석 단계 항목을 선택하는 사용자 입력 정보를 수신할 수 있다.
또한, 상기 엔지니어링 산업의 복수의 분석 단계 항목은, Bidding 분석 항목, Engineering 분석 항목, Construction & Commissioning 분석항목, O&M 분석 항목 중 적어도 어느 하나를 포함할 수 있다.
또한, 상기 머신러닝 기반으로 학습된 학습 모듈은, 회귀모델, 분류모델, 군집모델 및 딥러닝모델 중 적어도 어느 하나의 학습 모듈을 포함할 수 있다.
또한, 상기 머신러닝부는, 상기 엔지니어링 산업의 복수의 분석 단계 항목 중 ITB 분석 항목에 대하여 ITB 문서 데이터에 포함된 독소조항을 탐지하기 위해 머신러닝 기반으로 학습된 학습 모듈에 상기 신규 프로젝트 데이터를 적용하여 상기 독소조항 분석을 수행할 수 있다.
또한, 상기 머신러닝부는, 상기 엔지니어링 산업의 복수의 분석 단계 항목 중 설계원가 예측 분석 항목에 대하여 상기 머신러닝 기반으로 학습된 학습 모듈에 상기 신규 프로젝트 데이터를 적용하여 MH(Man Hour)를 예측 분석을 수행할 수 있다.
또한, 상기 머신러닝부는, 상기 엔지니어링 산업의 복수의 분석 단계 항목 중 설계오류 분석 항목에 대하여 상기 머신러닝 기반으로 학습된 학습 모듈에 상기 신규 프로젝트 데이터를 적용하여 프로젝트 지연일 분석을 수행할 수 있다.
또한, 상기 머신러닝부는, 상기 엔지니어링 산업의 복수의 분석 단계 항목 중 설계변경 분석 항목에 대하여 상기 머신러닝 기반으로 학습된 학습 모듈에 상기 신규 프로젝트 데이터를 적용하여 변경금액 분석을 수행할 수 있다.
또한, 상기 머신러닝부는, 상기 엔지니어링 산업의 복수의 분석 단계 항목 중 예측정비 분석 항목에 대하여 상기 머신러닝 기반으로 학습된 학습 모듈에 상기 신규 프로젝트 데이터를 적용하여 정비품목탐지 분석을 수행할 수 있다.
또한, 상기 머신러닝부는, 상기 엔지니어링 산업의 복수의 분석 단계 항목 각각에 대하여 복수의 학습 모델에 적용하여 수행된 학습 결과를 수집하고, 가장 높은 정확도를 나타내는 학습 모델의 학습 결과를 상기 엔지니어링 산업의 복수의 분석 단계 항목에 대한 분석 결과로 제공할 수 있다.
또한, 상기 데이터 입력부는, 상기 데이터 수집부에서 수집된 복수의 프로젝트 데이터 중 검색을 수행할 프로젝트에 관한 복수의 검색 항목을 선택하는 사용자 입력 정보를 수신하고, 상기 머신러닝부는, 상기 사용자 입력 정보와 상기 복수의 프로젝트 데이터 간의 유사도 분석을 수행하고, 유사도 분석 결과에 기반하여 적어도 어느 하나의 프로젝트 리스트를 제공할 수 있다.
본원의 일 실시예에 따르면, 엔지니어링 전주기 데이터를 활용한 데이터 분석 방법은, 엔지니어링 산업의 전주기에서 발생하는 프로젝트 데이터를 수집하는 단계, 신규 프로젝트 데이터를 입력받는 단계, 입력받은 상기 신규 프로젝트 데이터를 머신러닝 기반으로 학습된 학습 모듈에 적용하여 데이터 분석을 수행하는 단계 및 분석 결과를 시각화하여 제공하는 단계를 포함할 수 있다.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 엔지니어링 산업의 전주기에서 발생하는 데이터를 머신러닝부에서 분석하고 시각화하는 과정을 통해 리스크 최소화가 가능하다.
전술한 본원의 과제 해결 수단에 의하면, 엔지니어링 산업의 각 단계에서 발생하는 데이터의 효율적인 관리를 통하여 위험요인을 분석하고 사용자가 사전에 대처하고 의사결정을 지원할 수 있다.
다만, 본원에서 얻을 수 있는 효과는 상기된 바와 같은 효과들로 한정되지 않으며, 또 다른 효과들이 존재할 수 있다.
도 1은 본원의 일 실시예에 따른 엔지니어링 전주기 데이터를 활용한 데이터 분석 장치의 개략적인 블록도이다.
도 2는 본원의 일 실시예에 따른 데이터 분석 장치의 복수의 분석 단계 항목 선택 화면을 개략적으로 나타낸 도면이다.
도 3은 본원의 일 실시예에 따른 데이터 분석 장치의 ITB 문서에 대한 분석 결과를 개략적으로 나타낸 도면이다.
도 4는 본원의 일 실시예에 따른 데이터 분석 장치의 설계원가 예측 결과를 개략적으로 나타낸 도면이다.
도 5는 본원의 일 실시예에 따른 데이터 분석 장치의 설계오류 분석 결과를 개략적으로 나타낸 도면이다.
도 6은 본원의 일 실시예에 따른 데이터 분석 장치의 설계변경 분석 결과를 개략적으로 나타낸 도면이다.
도 7은 본원의 일 실시예에 따른 데이터 분석 장치의 예측정비 분석 결과를 개략적으로 나타낸 도면이다.
도 8은 본원의 일 실시예에 따른 데이터 분석 장치의 API를 제공하는 화면을 개략적으로 나타낸 도면이다.
도 9는 본원의 일 실시예에 따른 데이터 분석 장치의 데이터 검색 제공 화면 및 검색 결과를 개략적으로 나타낸 도면이다.
도 10은 본원의 일 실시예에 따른 데이터 분석 장치의 유사 프로젝트에 대한 통계적 시각화 결과를 개략적으로 나타낸 도면이다.
도 11은 본원의 일 실시예에 따른 엔지니어링 전주기 데이터를 활용한 데이터 분석 방법에 대한 동작 흐름도이다.
도 2는 본원의 일 실시예에 따른 데이터 분석 장치의 복수의 분석 단계 항목 선택 화면을 개략적으로 나타낸 도면이다.
도 3은 본원의 일 실시예에 따른 데이터 분석 장치의 ITB 문서에 대한 분석 결과를 개략적으로 나타낸 도면이다.
도 4는 본원의 일 실시예에 따른 데이터 분석 장치의 설계원가 예측 결과를 개략적으로 나타낸 도면이다.
도 5는 본원의 일 실시예에 따른 데이터 분석 장치의 설계오류 분석 결과를 개략적으로 나타낸 도면이다.
도 6은 본원의 일 실시예에 따른 데이터 분석 장치의 설계변경 분석 결과를 개략적으로 나타낸 도면이다.
도 7은 본원의 일 실시예에 따른 데이터 분석 장치의 예측정비 분석 결과를 개략적으로 나타낸 도면이다.
도 8은 본원의 일 실시예에 따른 데이터 분석 장치의 API를 제공하는 화면을 개략적으로 나타낸 도면이다.
도 9는 본원의 일 실시예에 따른 데이터 분석 장치의 데이터 검색 제공 화면 및 검색 결과를 개략적으로 나타낸 도면이다.
도 10은 본원의 일 실시예에 따른 데이터 분석 장치의 유사 프로젝트에 대한 통계적 시각화 결과를 개략적으로 나타낸 도면이다.
도 11은 본원의 일 실시예에 따른 엔지니어링 전주기 데이터를 활용한 데이터 분석 방법에 대한 동작 흐름도이다.
아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결" 또는 "간접적으로 연결"되어 있는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
본원의 플랜트 엔지니어링 업무 단계별 의사결정 지원을 위한 머신러닝 자동화 플랫폼 장치는 본원의 명칭일 수 있고, 청구항 말미(데이터 분석 장치) 및 엔지니어링 전주기 데이터를 활용한 데이터 분석 장치처럼 달리 지칭될 수 있다.
본원은 엔지니어링 산업의 전주기에서 발생하는 데이터를 활용하여 최적의 의사결정을 지원해주는 자동화된 머신러닝 기반 엔지니어링 플랫폼에 관한 것으로서, 엔지니어링 산업의 각 단계의 발생하는 데이터를 수집하고 해당데이터를 원클릭으로 분석하여 머신러닝 전주기에서 발생할 수 있는 리스크를 최소화할 수 있도록 하며, 입력된 데이터와 유사한 프로젝트를 검색하고 활용하는 방법 및 시스템에 관한 것이다.
엔지니어링은 과학적, 기술적 전문지식 통합적 활용하여 공학시스템의 기획, 설계, 개발, 구축, 운영에 필요한 공학기술적 서비스 제공한다. 엔지니어링 산업특성은 소수 발주자에 의한 일괄수주 방식 발주, 프로젝트 종합관리, 설계, 기자재 구매조달, 시공 등 통합 기술개발 필수, 경험지식활용과 활용기술이 접목되는 지식기반형 서비스 산업이다. 또한, 플랜트 엔지니어링은 일련의 기계 장치들이 연계되어 정상 운전 조건 하에서 원료부터 중간재 혹인 최종 제품의 연속적 제조를 시현하는 생산설비 및 관련 시스템이다. 플랜트의 기획, 설계, 시공, 운영 및 폐기에 이르는 전주기에 걸쳐 생산성, 성능, 품질에 직접적인 영향을 미치는 분야이다.
본원의 일 실시예에 따르면, 데이터 분석 장치(10)는 엔지니어링 산업의 전주기에서 발생하는 프로젝트 데이터를 수집하고, 사용자가 원하는 프로젝트 데이터 검색 기능을 지원할 수 있다. 또한, 데이터 분석 장치(10)는 ITB 분석, 설계원가 예측, 설계오류 분석, 설계변경 분석, 예측정비 등을 머신러닝 플랫폼을 활용하여 분석하여 제공할 수 있다. 데이터 분석 장치(10)는 분석된 결과를 사용자 단말(미도시)을 통해 제공할 수 있다. 또한, 데이터 분석 장치(10)는 사용자(관리자)가 분석 결과를 보고 빠른 판단으로 효과적인 의사결정을 할 수 있도록 대시보드 형태로 시각화하여 제공할 수 있다.
또한, 데이터 분석 장치(10)는 분석된 결과를 특정 표준화된 포맷으로 다운받을 수 있도록 제공할 수 있다. 또한, 데이터 분석 장치(10)는 API를 제공하여 다른 어플리케이션에서 결과를 활용할 수 있도록 하는 등의 확장성을 고려할 수 있다.
또한, 데이터 분석 장치(10)는 계속 변화하고 추가되는 엔지니어링 데이터의 특성을 고려하여, 단계별로 구분하여 신규 데이터를 추가할 수 있도록 하였으며, 입력된 데이터를 자동화된 머신러닝 기반의 학습 모델을 통해 손쉽게 분석하고 결과를 제공할 수 있다.
본원의 일 실시예에 따르면, 데이터 분석 장치(10)는 사용자 단말(미도시)로 데이터 입력 메뉴, 데이터 관리 메뉴 및 데이터 분석 메뉴 등을 제공할 수 있다. 예를 들어, 데이터 분석 장치(10)가 제공하는 어플리케이션 프로그램을 사용자 단말(미도시)이 다운로드하여 설치하고, 설치된 어플리케이션을 통해 데이터 입력 메뉴, 데이터 관리 메뉴 및 데이터 분석 메뉴가 제공될 수 있다.
데이터 분석 장치(10)는 사용자 단말(미도시)과 데이터, 콘텐츠, 각종 통신 신호를 네트워크를 통해 송수신하고, 데이터 저장 및 처리의 기능을 가지는 모든 종류의 서버, 단말, 또는 디바이스를 포함할 수 있다.
사용자 단말(미도시)은 네트워크를 통해 말 통합 장치(110)와 연동되는 디바이스로서, 예를 들면, 스마트폰(Smartphone), 스마트패드(Smart Pad), 태블릿 PC, 웨어러블 디바이스 등과 PCS(Personal Communication System), GSM(Global System for Mobile communication), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), Wibro(Wireless Broadband Internet) 단말기 같은 모든 종류의 무선 통신 장치 및 데스크탑 컴퓨터, 스마트 TV와 같은 고정용 단말기일 수도 있다.
데이터 분석 장치(10) 및 사용자 단말(미도시)간의 정보 공유를 위한 네트워크의 일 예로는 3GPP(3rd Generation Partnership Project) 네트워크, LTE(Long Term Evolution) 네트워크, 5G 네트워크, WIMAX(World Interoperability for Microwave Access) 네트워크, 유무선 인터넷(Internet), LAN(Local Area Network), Wireless LAN(Wireless Local Area Network), WAN(Wide Area Network), PAN(Personal Area Network), 블루투스(Bluetooth) 네트워크, Wifi 네트워크, NFC(Near Field Communication) 네트워크, 위성 방송 네트워크, 아날로그 방송 네트워크, DMB(Digital Multimedia Broadcasting) 네트워크 등이 포함될 수 있으며, 이에 한정된 것은 아니다.
도 1은 본원의 일 실시예에 따른 엔지니어링 전주기 데이터를 활용한 데이터 분석 장치의 개략적인 블록도이다.
도 1을 참조하면, 데이터 분석 장치(10)는 데이터 수집부(11), 데이터 입력부(12), 머신러닝부(13) 및 시각화부(14)를 포함할 수 있다. 다만, 데이터 분석 장치(10)의 구성이 이에 한정되는 것은 아니다. 예를 들어, 데이터 분석 장치(10)는 데이터 수집부(11)에서 수집된 복수의 프로젝트 데이터를 저장하기 위한 데이터베이스(미도시)를 포함할 수 있다. 또한, 데이터 분석 장치(10)는 사용자 단말(미도시)로 데이터 분석 결과를 제공하기 위한 데이터 제공부(미도시)를 포함할 수 있다. 데이터베이스(미도시)는 독조소항 분석을 위한 독소조항 사전, 설계오류 Delay 심각도 구분 항목, 설계변경 사업비 심각도 구분 항목, 설계변경 핵심단어 사전 등을 포함할 수 있다.
본원의 일 실시예에 따르면, 데이터 수집부(11)는 엔지니어링 산업의 전주기에서 발생하는 프로젝트 데이터를 수집할 수 있다. 예를 들어, 데이터 수집부(11)는 계약서, 시방서, ITB, 해양 및 육상 플랜트 데이터, ERP(전사적 자원관리), PMIS(사업관리 정보시스템), 상용데이터, 공공데이터, 빅데이터 통합 정보, 공공데이터, Open API 등을 수집할 수 있다. 데이터 수집부(11)는 엔지니어링 산업의 전주기에서 발생하는 다양한 데이터를 수집할 수 있다. 또한, 데이터 수집부(11)는 엔지니어링 산업의 프로젝트 데이터뿐만 아니라 다양한 분야의 산업의 전주기에서 발생하는 프로젝트 데이터를 수집할 수 있다. 프로젝트 데이터는, 엔지니어링 산업에서 발생하는 시계열 데이터일 수 있다. 또한, 프로젝트 데이터는 데이터베이스(미도시)에 저장된 데이터일 수 있다. 또한, 데이터 수집부(11)는 네트워크를 통해 외부 서버에서 엔지니어링 산업의 전주기에서 발생하는 프로젝트 데이터를 수집할 수 있다. 일례로, 외부 서버는, 엔지니어링 산업을 수행하는 기관의 서버일 수 있다.
본원의 다른 일 실시예에 따르면, 데이터 수집부(11)는 데이터 분석 장치(10)에서 분석된 데이터를 관리할 수 있다. 달리 말해, 데이터 수집부(11)는 데이터 입력부(12)에서 입력받은 신규 프로젝트 데이터를 데이터베이스(미도시)에 저장할 수 있다. 또한, 데이터 수집부(11)는 머신러닝부(13)에서 분석된 다양한 데이터의 분석 결과를 데이터베이스(미도시)에 저장할 수 있다. 데이터 수집부(11)는 엔지니어링 산업에서 발생하는 다양한 데이터를 수집할 뿐만 아니라, 엔지니어링 산업에서 발생하는 데이터를 분석한 분석 데이터를 데이터베이스(미도시)에 저장하여 관리할 수 있다.
본원의 일 실시예에 따르면, 데이터 입력부(12)는 신규 프로젝트 데이터를 입력 받을 수 있다. 신규 프로젝트 데이터는, 계약서, 시방서, ITB 등 엔지니어링 산업에서 발생하는 문서를 포함할 수 있다. 예를 들어, 데이터 입력부(12)는 사용자 단말(미도시)로부터 신규 프로젝트 데이터를 입력 받을 수 있다. 또한, 데이터 입력부(12)는 신규 프로젝트 데이터 및 엔지니어링 산업의 복수의 단계에서 발생하는 데이터를 각각 입력받을 수 있다. 또한, 데이터 입력부(12)는 기존의 엔지니어링 산업의 프로젝트 데이터가 아닌 신규 작성된 프로젝트 데이터를 입력 받을 수 있다. 달리 말해, 데이터 입력부(12)는 데이터베이스(미도시)에 저장된 데이터 셋으로부터 복수의 프로젝트와 관련된 데이터를 입력 받을 수 있다. 또한, 데이터 입력부(12)는 데이터 수집부(11)에서 수집된 프로젝트 데이터를 입력 받을 수 있다.
도 2는 본원의 일 실시예에 따른 데이터 분석 장치의 복수의 분석 단계 항목 선택 화면을 개략적으로 나타낸 도면이다.
본원의 일 실시예에 따르면, 데이터 입력부(12)는 엔지니어링 산업의 복수의 분석 단계 항목 중 분석을 수행할 어느 하나의 분석 단계 항목을 선택하는 사용자 입력 정보를 수신할 수 있다. 또한, 엔지니어링 산업의 복수의 분석 단계 항목은, Bidding 분석 항목, Engineering 분석 항목, Construction & Commissioning 분석항목, O&M 분석 항목 중 적어도 어느 하나를 포함할 수 있다. 도 2를 참조하면, Bidding 분석 항목은 ITB 분석 항목을 포함할 수 있다. 또한, Engineering 분석 항목, 설계원가 분석 항목, 설계오류 분석 항목, 설계변경 분석 항목을 포함할 수 있다. 또한, Construction & Commissioning 분석항목은 추가 항목을 포함할 수 있다. 또한, O&M 분석 항목은 예측정비 분석 항목을 포함할 수 있다. 엔지니어링 산업의 복수의 분석 단계 항목 각각은 추가 항목을 포함할 수 있다. 추가 항목은 새로운 주제의 데이터를 입력하기 위한 항목일 수 있다. 데이터 입력부(12)는 복수의 데이터를 포함하는 신규 프로젝트 전부를 제공받을 수 있으며, 각각의 프로젝트 데이터 또한, 따로 입력받을 수 있다. 달리 말해, 데이터 입력부(12)는 사용자가 Bidding 분석만을 수행하고자 하는 경우, Bidding 분석 항목에 포함된 추가 항목의 사용자 선택 정보에 기반하여 Bidding 분석을 수행하기 위한 데이터를 입력 받을 수 있다.
일예로, 데이터 입력부(12)는 사용자 단말(미도시)로부터 복수의 분석 항목 중 적어도 어느 하나의 항목을 선택한 사용자 입력 정보를 수신할 수 있다. 도 2를 참조하면, 데이터 입력부(12)는 복수의 분석 항목 중 Engineering 분석 항목에 포함된 설계원가 분석 항목을 선택한 사용자 입력 정보를 사용자 단말(미도시)로부터 수신할 수 있다. 데이터 입력부(12)는 사용자 단말(미도시)로부터 제공받은 사용자 입력 정보를 머신러닝부(13)로 제공할 수 있다.
달리 말해, 시각화부(14)는 사용자 단말(미도시)로 엔지니어링 산업의 복수의 분석 단계 항목을 제공하고, 데이터 입력부(12)는 사용자 단말(미도시)로부터 엔지니어링 산업의 복수의 분석 단계 항목 중 분석을 수행할 적어도 어느 하나의 분석 항목을 제공받고, 머신러닝부(13)는 입력받은 분석 항목에 대응하여 신규 프로젝트 데이터의 학습을 수행할 수 있다.
본원의 일 실시예에 따르면, 머신러닝부(13)는 데이터 입력부(12)에서 입력받은 신규 프로젝트 데이터를 머신러닝 기반으로 학습된 학습 모듈에 적용하여 데이터 분석을 수행할 수 있다. 머신러닝부(13)는 데이터 입력부(12)에서 입력받은 신규 프로젝트 데이터와 사용자의 분석 항목 선택 정보에 기반하여 머신러닝 기반으로 학습된 학습 모듈에 신규 데이터를 적용하여 데이터 분석을 수행할 수 있다.
본원의 다른 일 실시예에 따르면, 머신러닝부(13)는 데이터 수집부(11)에서 수집한 프로젝트 데이터를 머신러닝 기반으로 학습된 학습 모듈에 적용하여 데이터 분석을 수행할 수 있다. 달리 말해, 머신러닝부(13)는 데이터 입력부(12)에서 입력받은 데이터가 아닌 데이터베이스(미도시)에 저장된 기존의 프로젝트 데이터를 머신러닝 기반으로 학습된 학습 모듈에 적용하여 데이터 분석을 수행할 수 있다. 머신러닝부(13)는 머신러닝 기반으로 학습된 학습 모듈을 통해 ITB 문서 데이터는 독소조항을 탐지하는 학습을 수행할 수 있다. 또한, 머신러닝부(13)는 머신러닝 기반으로 학습된 학습 모듈을 통해 설계원가 분석에서 MH(Man Hour)를 예측하는 학습을 수행할 수 있다. 또한, 머신러닝부(13)는 머신러닝 기반으로 학습된 학습 모듈을 통해 설계오류 분석에서 지연일 분석을 예측하는 학습을 수행할 수 있다. 또한, 머신러닝부(13)는 머신러닝 기반으로 학습된 학습 모듈을 통해 설계변경 분석에서 변경금액을 분석하는 학습을 수행할 수 있다. 또한, 머신러닝부(13)는 머신러닝 기반으로 학습된 학습 모듈을 통해 예측정비 분석에서 정비품목탐지를 분석하는 학습을 수행할 수 있다.
또한, 머신러닝 기반으로 학습된 학습 모듈은, 회귀모델, 분류모델, 군집모델 및 딥러닝모델 중 적어도 어느 하나의 학습 모듈을 포함할 수 있다. 또한, 머신러닝부(13)는 피처 엔지니어링 기능을 포함할 수 있다. 피처 엔지니어링 기능은, 데이터 탐색, 데이터 변환, 특질 선정 기능을 포함할 수 있다.
일예로, 머신러닝부(13)는 알고리즘별(학습모델별)로 하이퍼 파라미터를 적용하여 모델 성능을 높일 수 있다. 하이퍼 파라미터는 각 층의 뉴런 수, 배치 크기, 매개변수 갱신 시의 학습률, 가중치 감소 등 모델의 성능을 좌우하는 값이다. 머신러닝부(13)는 하이퍼 파라미터의 최적화를 위해, 하이퍼 파라미터 값의 범위를 설정할 수 있다. 또한, 머신러닝부(13)는 설정된 범위에서 하이퍼 파라미터의 값을 무작위로 추출할 수 있다. (단계1) 또한, 머신러닝부(13)는 앞서 샘플링 한 하이퍼 파라미터 값을 사용하여 모델의 학습을 수행한 후 검증 데이터로 정확도를 평가할 수 있다. (단계2) 검증 데이터는 하이퍼 파라미터의 적절성을 평가하기 위한 데이터일 수 있다. 머신러닝부(13) 앞서 설명된 단계 1 및 단계 2를 미리 설정된 횟수만큼 반복하여 정확도를 판단하고 하이퍼 파라미터의 범위를 재설정할 수 있다. 머신러닝부(13)는 하이퍼 파라미터의 범위를 좁히는 방향으로 재설정할 수 있다. 머신러닝부(13)는 좁혀진 범위에서 하이퍼 파라미터의 값을 선택할 수 있다. 앞서 설명된 하이퍼 파라미터를 적용하여 모델 성능을 높이는 실시예는 일 실시예 일뿐, 이에 한정되는 것은 아니며, 보다 다양한 실시예가 적용될 수 있다.
도 3은 본원의 일 실시예에 따른 데이터 분석 장치의 ITB 문서에 대한 분석 결과를 개략적으로 나타낸 도면이다.
본원의 일 실시예에 따르면, 머신러닝부(13)는 엔지니어링 산업의 복수의 분석 단계 항목 중 ITB 분석 항목에 대하여 ITB 문서 데이터에 포함된 독소조항을 탐지하기 위해 머신러닝 기반으로 학습된 학습 모듈에 신규 프로젝트 데이터를 적용하여 독소조항 분석을 수행할 수 있다. 일예로, ITB 분석은 ITB(Invitation To Bid: 입찰안내서) 내에서 독소조항을 탐지하는 것으로, 머신러닝부(13)는 신규 프로젝트 데이터에 포함된 ITB 문서를 학습 모듈에 적용하여 독소조항을 분석할 수 있다. 여기서, 학습 모듈은 회귀모델, 분류모델, 군집모델 및 딥러닝모델 중 적어도 어느 하나를 포함할 수 있다. 독소조항은 일반적으로 법률이나 공식 문서 등에서 본래 의도하는 바를 교묘하게 제한하는 내용을 말한다. 즉, 법률의 경우 그 법률이 의도하는 목적이 있지만 이론적 혹은 현실적으로 그 의도를 막는 문구가 삽입되어 있는 것을 말한다.
예시적으로, 머신러닝부(13)는 미리 구축된 독소조항 사전과의 비교를 통해 ITB 문서 데이터에 포함된 독소조항 분석을 수행할 수 있다. 머신러닝부(13)는 입력받은 ITB 문서 데이터에서 미리 저장된 독소조항 사전에 포함된 독소조항 단어 중 어느 하나와 매칭을 통해 독소조항 분석을 수행할 수 있다. 독소조항 사전에는 사용자가 미리 설정한 단어들이 포함될 수 있다. 예를 들어, 머신러닝부(13)는 ITB 문서를 데이터 입력부(12)로부터 제공받을 수 있다. 머신러닝부(13)는 독소조항 사전을 이용하여, 표준화를 수행하기 위해 입력받은 ITB문서에 포함된 용어들의 형태소를 분리할 수 있다. 또한, 머신러닝부(13)는 분리된 용어에 포함된 복수의 단어를 독소조항 사전에 포함된 독소조항 단어들과의 비교를 위해 인공지능 기반의 알고리즘을 이용하여 유사도 연산을 수행할 수 있다. 여기서, 인공지능 기반의 알고리즘은 Fuzzy Data Matching 알고리즘일 수 있으나, 이에 한정되는 것은 아니다. Fuzzy Data Matching 알고리즘은 편집거리(레펜슈타인, Levenshtein Distance)를 기반으로 계산된 결과값을 사용하여 데이터 간에 매칭을 수행하는 알고리즘이다. 다만, 앞서 설명된 인공지능 기반의 알고리즘은 일 실시예일뿐, 이에만 한정되는 것은 아니며, 기 개발되었거나 향후 개발되는 다양한 신경망 체계를 적용할 수 있다.
본원의 일 실시예에 따르면, 도 3의 (a)를 참조하면, 머신러닝부(13)는 카테고리별로 구분된 복수의 독소조항 분석 선택 항목을 시각화부(14)를 통해서 사용자 단말(미도시)로 제공할 수 있다. 사용자는 사용자 단말(미도시)에 제공된 ITB 분석 항목을 통해, ITB 분석을 수행할 ITB 문서를 선택할 수 있다. 예를 들어, 도3의(a)에서는 ITB_AA문서가 선택되었다. 사용자는 복수의 카테고리 중 분석을 수행할 카테고리(Category)를 선택할 수 있다. 각각의 카테고리에는 독소조항 분석을 수행하기 위해 서로 다른 항목의 독소조항 분석 선택 항목들이 포함될 수 있다. 도 3 의(a)를 참조하면, 머신러닝부(13)는 사용자 단말(미도시)로부터 제공받은 제1독소조항 분석 선택 항목(Fit for purpose), 제2독소조항 분석 선택 항목(Open-ended cluse), 제3독소조항 분석 선택 항목(LD execution procedure), 제4독조소항 분석 선택 항목(Payment options: pay-when-paid vs Pay-if-paid), 제5독소조항 분석 선택 항목(Pre-payment: LOC with BL; SB LoC; LoC at-sight; Usance; Document against Payment DA/DP), 제6독소조항 분석 선택 항목(Liability for EPC Corporate; Joint liability, Several, Joint & Several)에 선택 입력 정보에 기반하여 ITB 분석을 수행할 수 있다. 도 3 의(b)를 참조하면, 머신러닝부(13)는 ITB 문서에 포함된 데이터의 문장에서, 제1독소조항 분석 선택 항목(Fit for purpose)에 대응하여, 주어, 동사, 목적어 각각에 대응하는 독소조항을 추출할 수 있다. 또한, 머신러닝부(13)는 ITB 문서에 포함된 데이터의 문장에서, 제5독소조항 분석 선택 항목(Pre-payment)에 대응하는 주어, 동사, 목적어 각각에 대응하는 독소조항을 추출할 수 있다. 또한, 시각화부(14)는 머신러닝부(13)에서 독소조항 분석 선택 항목에 대응하여 추출한 분석 내용을 사용자 단말(미도시)로 제공할 수 있다.
도 4는 본원의 일 실시예에 따른 데이터 분석 장치의 설계원가 예측 결과를 개략적으로 나타낸 도면이다.
본원의 일 실시예에 따르면, 머신러닝부(13)는 엔지니어링 산업의 복수의 분석 단계 항목 중 설계원가 예측 분석 항목에 대하여 머신러닝 기반으로 학습된 학습 모듈에 신규 프로젝트 데이터를 적용하여 신규 프로젝트 데이터에 대한 MH(Man Hour)를 예측하는 데이터 분석을 수행할 수 있다. 또한, 머신러닝부(13)는 MH(Man Hour)가 예측된 결과에 기반하여 국가(나라)별로 엔지니어링 단가를 입력한 입력정보데 기반하여 설계시수를 예측하는 분석을 수행할 수 있다.
예시적으로, 도 4를 참조하면, 머신러닝부(13)는 신규 프로젝트 데이터에 포함된 설계원가 예측에 필요한 데이터를 학습 모듈에 입력하고, MH(Man Hour)를 예측할 수 있다. 머신러닝부는, 구분된 항목(Discipline) 각각에 대응하여 MH(Man Hour)를 예측할 수 있다. 시각화부(14)는 예측된 MH(Man Hour)를 사용자 단말(미도시)로 제공할 수 있다. 데이터 입력부(12)는 사용자 단말(미도시)로부터 복수의 국가(나라) 중 적어도 어느 하나를 선택한 사용자 입력 정보를 수신할 수 있다. 머신러닝부(13)는 사용자의 국가(나라)를 선택한 입력 정보에 기반하여, 설계시수를 예측할 수 있다. 설계 시수는 엔지니어의 노동시간일 수 있다.
도 5는 본원의 일 실시예에 따른 데이터 분석 장치의 설계오류 분석 결과를 개략적으로 나타낸 도면이다.
본원의 일 실시예에 따르면, 머신러닝부(13)는 엔지니어링 산업의 복수의 분석 단계 항목 중 설계변경 분석 항목에 대하여 머신러닝 기반으로 학습된 학습 모듈에 신규 프로젝트 데이터를 적용하여 프로젝트 지연일 분석을 수행할 수 있다. 머신러닝부(13)는 신규 프로젝트에서 발생할 수 있는 프로젝트 지연일에 대하여 설계오류 Delay 심각도 구분 항목에 기반하여 신규 프로젝트의 설계오류 지연 심각도 분석을 수행할 수 있다. Delay 심각도 구분 항목은 제1공사기간 및 제2공사기간 각각에 대하여 안전, 경계, 위험, 심각으로 구분하여 수치화한 항목을 포함할 수 있다. 머신러닝 기반으로 학습된 학습 모듈은 프로젝트 기간을 입력으로 하고, 프로젝트 지연일 심각도를 출력으로 하는 학습을 통해 구축된 모듈일 수 있다.
예시적으로 도 5를 참조하면, 머신러닝부(13)는 신규 프로젝트 데이터에서 공사기간 일자를 추출할 수 있다. 머신러닝부(13)는 추출된 공사기간 일자(프로젝트 기간(PJT Months))가 제1공사기간(예를 들어, 26개월 이상) 또는 제2공사기간(예를 들어, 26개월 이하)에 해당하는지 여부를 판단할 수 있다. 머신러닝부(13)는 신규 프로젝트 데이터를 이용하여 복수의 오류 사유 분석 중 적어도 어느 하나의 오류 사유로 분류하고, 분류된 오류 사유를 특정 오류 유형과 대응시킬 수 있다. 달리 말해, 머신러닝부(13)는 신규 프로젝트 데이터의 오류 사유를 분석하고, 프로젝트 지연일 분석을 수행할 수 있다. 예를 들어, 머신러닝부(13)는 오류 사유가 제1오류 사유(valve access to be considered)일 경우, 오류 유형을 M1으로 분류할 수 있다. 또한 머신러닝부(13)는 오류 사유가 제2오류 사유(drain to be provide)일 경우, 오류 유형을 D1으로 분류할 수 있다. 또한, 머신러닝부(13)는 오류 사유가 제3오류 사유(clear clash between popings)일 경우, 오류 유형을 H1으로 분류할 수 있다. 또한, 머신러닝부(13)는 오류 사유가 제4오류 사유(low pocket remove on tagged piping to be considered)일 경우, 오류 유형을 O1으로 분류할 수 있다. 또한, 머신러닝부(13)는 오류 사유가 제5오류 사유(duplicated line number with P-101113 suction line to be corrected)일 경우, 오류 유형을 C1으로 분류할 수 있다. 머신러닝부(13)는 오류 유형, 오류 사유, 지연일(Delay), 프로젝트 기간(PJT Months)을 기반으로 설계오류 지연 심각도 분석을 수행할 수 있다. 머신러닝부(13)는 오류 유형, 오류 사유, 지연일(Delay), 프로젝트 기간(PJT Months)을 고려하여, 설계오류 지연 심각도 분석을 안전, 경계, 위험, 심각 중 적어도 하나로 분석을 수행할 수 있다. 일예로, 머신러닝부(13)는 신규 프로젝트 데이터에서 프로젝트 기간(PJT Months)을 추출하고, 프로젝트 기간을 입력으로 하는 학습 모델에 적용하여, 안전, 경계, 위험, 심각 중 적어도 하나를 출력하는 학습을 수행할 수 있다.
도 6은 본원의 일 실시예에 따른 데이터 분석 장치의 설계변경 분석 결과를 개략적으로 나타낸 도면이다.
본원의 일 실시예에 따르면, 머신러닝부(13)는 엔지니어링 산업의 복수의 분석 단계 항목 중 설계변경 분석 항목에 대하여 머신러닝 기반으로 학습된 학습 모듈에 신규 프로젝트 데이터를 적용하여 변경금액 분석을 수행할 수 있다. 머신러닝부(13)는 신규 프로젝트에서 설계변경으로 발생할 수 있는 프로젝트 설계변경 금액에 대하여 설계변경 사업비 심각도 구분 항목에 기반하여 신규 프로젝트의 변경 금액 분석을 수행할 수 있다. 달리 말해, 머신러닝부(13)는 엔지니어링 산업의 복수의 분석 단계 항목 중 설계변경 분석 항목에 대응하여 머신러닝 기반으로 학습된 학습 모듈에 신규 프로젝트 데이터를 적용하고, 신규 프로젝트 데이터에 포함된 텍스트 분석을 수행할 수 있다. 머신러닝부(13)는 설계변경 핵심단어 사전과 신규 프로젝트 데이터에 포함된 텍스트와의 유사도 연산을 수행하고, 설계변경 심각도 구분 항목에 기반하여 신규 프로젝터의 변경 금액 분석을 수행할 수 있다.
도 6을 참조하면, 머신러닝부(13)는 신규 프로젝트 데이터에 포함된 텍스트 분석을 통해 설계오류 단어를 추출할 수 있다. 머신러닝부(13)는 미리 저장된 설계변경 핵심단어 사전과 신규 프로젝트 데이터에 포함된 텍스트 분석을 통해 추출된 설계오류 단어의 비교 분석을 통해 설계변경오류 유형을 추출할 수 있다. 머신러닝부(13)는 설계변경 핵심단어 사전과 설계변경으로 인한 사업비 구간별 심각도 구분을 통해 설계변경 심각도 분석을 수행할 수 있다. 설계변경 핵심단어 사전은 공종, 설계오류 유형, 설계오류 핵심단어로 분류되어 저장된 모델일 수 있다.
예를 들어, 머신러닝부(13)는 신규 프로젝트 데이터에 포함된 텍스트 분석을 통해 용어들의 형태소를 분리할 수 있다. 머신러닝부(13)는 분리된 용어들로부터 설계변경 핵심단어 사전과의 유사도 연산을 통해 설계오류 핵심단어를 추출할 수 있다. 머신러닝부(13)는 추출된 설계오류 핵심단어를 기반으로 설계오류 유형을 구분할 수 있다. 머신러닝부(13)는 신규 프로젝트 데이터에 포함된 텍스트 분석을 통해 공종, 설계오류, 유형, 설계오류 핵심단어로 구분하여 데이터 셋을 구축할 수 있다. 머신러닝부(13)는 설계변경 사업비 심각도 구분 항목에 대응하여 설계변경 시 발생하는 변경 금액 분석을 수행할 수 있다.
도 7은 본원의 일 실시예에 따른 데이터 분석 장치의 예측정비 분석 결과를 개략적으로 나타낸 도면이다.
본원의 일 실시예에 따르면, 머신러닝부(13)는 엔지니어링 산업의 복수의 분석 단계 항목 중 예측정비 분석 항목에 대하여 머신러닝 기반으로 학습된 학습 모듈에 신규 프로젝트 데이터를 적용하여 정비품목탐지 분석을 수행할 수 있다. 예시적으로, 머신러닝부(13)는 Decision Tree 알고리즘, Random Forest 알고리즘, SVM 알고리즘 및 KNN알고리즘 중 적어도 어느 하나에 기초하여 학습 모델을 생성할 수 있다. 일예로, Decision Tree알고리즘은 분기마다 변수영역을 두 개로 구분하는 알고리즘이고, Random Forest알고리즘은 수많은 Decision Tree들이 Forest를 구성하여 각각의 예측결과를 하나의 결과변수로 평균화하는 알고리즘이다. SVM알고리즘은 데이터의 분포공간에서 가장 큰 폭의 경계를 구분하여 데이터가 속하는 분류를 판단하는 비확률적 알고리즘이고, KNN알고리즘은 학습데이터를 그룹으로 묶고 새로운 데이터를 주위 대부분의 데이터가 속한 그룹으로 분류하는 알고리즘이다. 예시적으로, 머신러닝부(13)에서 SVM알고리즘을 이용한 정비품목 탐지 분석의 정확도는 0.896의 정확도를 나타낸다.
도 7을 참조하면, 머신러닝부(13)는 다양한 알고리즘을 적용하여 정비품목탐지 분석을 수행할 수 있다. 머신러닝부(13)는 SVM 알고리즘을 이용하여 예측정비 분석 항목에 대한 정비품목탐지 분석을 수행할 수 있다. 머신러닝부(13)는 O&M 분석 항목에 포함된 예측정비 분석 항목을 SVM 알고리즘에 적용하여 정비품목탐지 분석을 수행하고, 분석 결과를 confusion matrix로 나타낼 수 있다. 시각화부(14)는 confusion matrix로 나타낸 분석 결과를 사용자 단말(미도시)로 제공할 수 있다. 머신러닝부(13)는 다양한 알고리즘을 수행한 결과를 기반으로 복수의 분석 항목에 대한 최종 모델을 확정할 수 있다.
본원의 일 실시예에 따르면, 머신러닝부(13)는 엔지니어링 산업의 복수의 분석 단계 항목 각각에 대하여 복수의 학습 모델에 적용하여 수행된 학습 결과를 수집할 수 있다. 또한, 머신러닝부(13)는 가장 높은 정확도를 나타내는 학습 모델의 학습 결과를 엔지니어링 산업의 복수의 분석 단계 항목에 대한 분석 결과로 제공할 수 있다. 예를 들어, 머신러닝부(13)는 ITB 분석 항목, 설계원가 분석 항목, 설계오류 분석 항목, 설계변경 분석 항목, 예측정비 분석 항목 각각에 대하여 복수의 머신러닝 학습 모델을 적용하여 분석을 수행할 수 있다. 머신러닝부(13)는 복수의 머신러닝 학습 모델을 적용하여 복수의 분석 항목 각각에 대한 분석을 수행하고, 가장 높은 정확도를 나타내는 학습모델을 해당 분석 항목의 학습 모델로 선정할 수 있다. 달리 말해, 머신러닝부(13)는 ITB분석 항목에 제1학습모델을 적용하여 독소조항을 분석할 수 있다. 또한, 머신러닝부(13)는 설계원가 분석 항목에 제2학습 모델을 적용하여 MH(Man Hour)를 예측 분석을 수행할 수 있다. 또한, 머신러닝부(13)는 설계오류 분석 항목에 제3학습 모델을 적용하여 프로젝트 지연일 분석을 수행할 수 있다. 또한, 머신러닝부(13)는 설계오류 분석 항목에 제4학습 모델을 적용하여 변경금액 분석을 수행할 수 있다. 또한, 머신러닝부(13)는 예측정비 분석 항목에 제5학습 모델을 적용하여 정비품목탐지 분석을 수행할 수 있다.
예시적으로, 머신러닝부(13)는 분석 결과 데이터에 기초하여 복수의 머신러닝 알고리즘 각각의 평가지수를 산출할 수 있다. 머신러닝부(13)는 회귀 알고리즘 유형에 대응하는 복수의 머신러닝 알고리즘 각각의 결과값에 대해 평균 제곱근 오차(RMSE: Root Mean Squared Error) 값을 이용하여 평가지수를 산출할 수 있다. 평균 제곱근 오차가 낮을수록 회귀 알고리즘의 정확성 및 신뢰성이 높은 알고리즘이므로, 머신러닝부(13)는 회귀 알고리즘 유형에 대응하는 복수의 머신러닝 알고리즘 각각의 평가지수를 산출하여 평균 제곱근 오차가 낮은 순으로 순위를 산출할 수 있다.
일예로, 복수의 머신러닝 학습 모델은 회기 알고리즘, 분류 알고리즘, 군집 알고리즘, 딥러닝 알고리즘에 기반하여 생성될 수 있다. 비지도 학습이란 학습용 데이터를 구축하는 것이 아니라 데이터 자체를 분석하거나 군집하면서 학습하는 알고리즘을 의미한다. 머신러닝부(13)는 군집 알고리즘에 기초하여 분석 패턴을 군집하여 산출할 수 있고, 분석 패턴 각각의 군집간 분리도에 기초하여 새로운 분석 패턴을 검출할 수 있다. 예시적으로, 비지도 학습을 위한 군집 알고리즘에는 로지스틱 회귀 알고리즘, 랜덤 포레스트 알고리즘, SVM(Support Vector Machine)알고리즘, 의사결정 알고리즘 및 군집 알고리즘이 이용될 수 있다. 또한, 머신러닝부(13)는 상술한 알고리즘 외에도 Extra Tree알고리즘, XG Boost알고리즘 및 Deep Learning 알고리즘, K-means 클러스터링 알고리즘, SOM(Self-Organizing-Maps) 알고리즘 EM & Canopy 알고리즘과 같은 군집 알고리즘을 통해 비지도 학습을 수행할 수 있다. Random Forest알고리즘은 수많은 Decision Tree들이 Forest를 구성하여 각각의 예측결과를 하나의 결과변수로 평균화하는 알고리즘이고, SVM알고리즘은 데이터의 분포공간에서 가장 큰 폭의 경계를 구분하여 데이터가 속하는 분류를 판단하는 비확률적 알고리즘이다. Extra Tree알고리즘은 Random forest와 비슷하나 속도가 Random forest에 비해 빠른 알고리즘이며, XGBoost알고리즘은 Random Forest의 Tree는 독립적이라면 XGBoost의 Tree의 결과를 다음 트리에 적용하는 boost방식의 알고리즘이다. Deep Learning알고리즘은 다층구조의 Neural Network을 기반으로 변수의 패턴이 결과에 미치는 영향을 가중치로 조절하며 학습하는 알고리즘이다. 또한, K-means 클러스터링 알고리즘은 전통적인 분류기법으로 대상집단을 거리의 평균값(유사도)을 기준으로 K개의 군집으로 반복 세분화하는 기법이고, SOM알고리즘은 인공신경망을 기반으로 훈련집합의 입력 패턴을 가중치로 학습하여 군집화하는 기법이다. 또한 EM & Canopy 알고리즘은 주어진 초깃값으로 가능성이 최대인 것부터 반복 과정을 통해 파라미터 값을 갱신하여 군집화 하는 기법을 의미한다.
본원의 다른 일 실시예에 따르면, 머신러닝부(13)는 데이터 입력부(12)에서 입력받은 신규 프로젝트 데이터에 대한 전처리를 수행할 수 있다. 예를 들어, 머신러닝부(13)는 프로젝트 데이터로부터 데이터 정제(이상값 탐지, 데이터 수정) 및 ETL(추출, 변환, 적재) 등을 수행할 수 있다. 또한, 머신러닝부(13)는 신규 프로젝트 데이터가 비정형 데이터인 경우 데이터 정규화를 수행할 수 있다. 데이터 정규화는 신규 프로젝트 데이터에 포함된 데이터의 변수 값들을 일정 기준으로 통일시키는 것일 수 있다. 또한, 머신러닝부(13)는 학습 모델을 구축하고, 구축된 학습 모델을 평가하고, 모델을 최적화할 수 있다.
예시적으로, 머신러닝부(13)는 데이터베이스(미도시) 및 데이터 입력부(12)로부터 분석 대상 데이터를 제공받을 수 있다. 머신러닝부(13)는 데이터베이스(미도시)에 미리 저장된 프로젝트 데이터를 분석 대상 데이터로 제공받을 수 있다. 또한, 머신러닝부(13)는 데이터 입력부(12)로부터 신규 프로젝트 데이터를 분석 대상 데이터로 제공받을 수 있다. 머신러닝부(13)는 피처 엔지니어링에 기반하여 분석 대상 데이터로부터 특질 변수를 추출할 수 있다. 분석 대상 데이터에는 숫자와 같이 수치형 변수를 포함하는 정형화된 데이터뿐만 아니라, 기호, 단어, 문장 등 텍스트 기반의 비정형 데이터를 포함할 수 있다. 머신러닝부(13)는 분석 대상 데이터에 포함된 정형 데이터 또는 비정형 데이터로부터 특질 변수를 추출할 수 있다.
본원의 일 실시예에 따르면, 데이터 입력부(12)는 비정형 데이터로부터 특질 변수 산출시 사용자에게 최적화된 특질 변수를 산출할 수 있도록 단어 사전을 등록하는 기능을 수행할 수 있다. 머신러닝부(13)는 분석 대상 데이터 중 비정형 데이터의 경우, 비지도 학습 기반 자연어 처리 알고리즘에 기초하여 특질 변수를 추출할 수 있다. 비정형 데이터로부터의 특질 변수 산출에 대해 구체적으로 살펴보면, 머신러닝부(13)는 분석 대상 데이터가 비정형 데이터를 포함하는 경우, 사용자 최적화된 단어 사전으로부터 최적 벡터값을 추출할 수 있다. 또한, 머신러닝부(13)는 최적 벡터값에 대한 주성분 분석(PCA: Principal Component Analysis)을 통해 비정형 데이터에 포함된 텍스트로부터 명사를 추출할 수 있다. 주성분 분석을 위한 알고리즘에는 Soynlp 알고리즘이 활용될 수 있으나, 이에 한정되는 것은 아니다. Soynlp 알고리즘은 별개의 학습 데이터를 요구하지 않으면서 분석 대상 데이터에 존재하는 단어를 추출할 수 있을 뿐만 아니라, 문장을 단어열로 분해하거나 품사를 판별할 수 있는 비지도 학습 기반 알고리즘이다. 머신러닝부(13)는 단어 사전에 기반하여 상기 명사를 포함하는 단어의 빈도에 따라 부여된 점수에 따라 상기 특질 변수를 산출할 수 있다. 예시적으로, 머신러닝부(13)는 상기 단어 사전에 기반하여 텍스트로부터 추출된 명사 즉 단어의 빈도가 높을수록 해당 단어에 높은 점수를 부여할 수 있다. 점수 부여 방식은 미리 설정된 빈도에 따라 차등적으로 점수를 부여하는 절대적인 방식을 통해 이루어질 수 있고, 분석 대상 데이터에서 등장하는 단어의 상대적인 비율에 따라 점수를 부여하는 상대적인 방식을 통해서도 이루어질 수 있다. (예를 들어, 등장 빈도가 상위 10%인 단어는 상위 30%인 단어보다 높은 점수가 부여될 수 있다)
본원의 일 실시예에 따르면, 시각화부(14)는 머신러닝부(13)의 분석 결과를 시각화하여 제공할 수 있다. 시각화부(14)는 머신러닝부(13)에서 분석한 결과를 분석 항목에 대응하여 서로 다른 GUI 를 적용하여 시각화하여 제공할 수 있다.
일예로, 도 2를 참조하면, 시각화부(14)는 복수의 분석 단계 항목을 사용자 단말(미도시)로 제공할 수 있다. 또한, 도 3의 (a)를 참조하면, 시각화부(14)는 ITB 분석을 위한 ITB 문서 선택 항목, 카테고리 선택항목, 독소조항 분석 선택 항목을 사용자 단말(미도시)로 제공할 수 있다. 또한, 도 3 의(b)를 참조하면, 시각화부(14)는 머신러닝부(13)에서 수행된 ITB 분석 결과를 사용자 단말(미도시)로 제공할 수 있다. 또한, 도 4를 참조하면, 시각화부(14)는 설계원가 예측 결과를 사용자 단말(미도시)로 제공할 수 있다. 또한, 도 5를 참조하면, 시각화부(14)는 설계오류 분석 결과를 사용자 단말(미도시)로 제공할 수 있다. 또한, 도 6을 참조하면, 시각화부(14)는 설계변경 분석 결과를 사용자 단말(미도시)로 제공할 수 있다. 또한, 도 7을 참조하면, 시각화부(14)는 예측정비 분석 결과를 사용자 단말(미도시)로 제공할 수 있다.
또한, 시각화부(14)는 머신러닝부(13)에서 추출된 분석 대상 데이터의 특성을 고려하여 추출된 특질 변수의 변수 속성 및 변수 값 분포를 시각화하여 제공할 수 있다. 변수 속성 및 변수 값 분포는 통계적으로 산출될 수 있으며, Key-valuew 형태로 제공될 수 있다. 머신러닝부(13)는 분석 대상 데이터에 따른 변수가 수치형 변수인 경우, 특성에 따라 통계량을 산출할 수 있다. 또한, 머신러닝부(13)는 분석 대상 데이터에 따른 변수가 카테고리형 변수인 경우 변수의 카테고리별 특질 변수의 카운트 수 및 카운트 비율을 산출할 수 있다. 시각화부(14)는 분석 대상 데이터의 변수 속성, 변수 값 분포 및 변수 설명을 사용자 단말(미도시)로 제공할 수 있다. 또한, 시각화부(14)는 통계량, 카테고리별 카운트 수 및 카운트 비율을 사용자 단말(미도시)로 제공할 수 있다. 사용자 단말(미도시)은 시각화부(14)에서 제공받은 데이터를 출력할 수 있다.
본원의 일 실시예에 따르면, 정형 데이터 즉, 수치화된 변수의 통계량과 비정형 데이터의 카테고리별 카운트 수 및 비율을 산출함으로써 변수에 대한 이해도가 향상될 수 있으며, 이를 특질 변수 산출에 활용함으로써 머신러닝 알고리즘의 입력 데이터로서 보다 신뢰성 있는 특질 변수가 산출될 수 있다. 또한, 사용자는 특질 변수 산출과정에서 분석 대상 데이터의 특성을 용이하게 파악할 수 있다.
도 8은 본원의 일 실시예에 따른 데이터 분석 장치의 API를 제공하는 화면을 개략적으로 나타낸 도면이다. 도 8을 참조하면, 데이터 분석 장치(10)는 Bidding 분석 단계, Engineering 분석 단계, Construction & Commissioning 분석 단계, O&M 분석 단계 각각의 분석 결과에 대해 확장성을 고려하여 API를 호출한 결과를 나타낼 수 있다.
도 9는 본원의 일 실시예에 따른 데이터 분석 장치의 데이터 검색 제공 화면 및 검색 결과를 개략적으로 나타낸 도면이고, 도 10은 본원의 일 실시예에 따른 데이터 분석 장치의 유사 프로젝트에 대한 통계적 시각화 결과를 개략적으로 나타낸 도면이다.
본원의 일 실시예에 따르면, 데이터 입력부(12)는 데이터 수집부(11)에서 수집된 복수의 프로젝트 데이터 중 검색을 수행할 프로젝트에 관한 복수의 검색 항목을 선택하는 사용자 입력 정보를 수신할 수 있다. 또한, 머신러닝부(13)는 사용자 입력 정보와 복수의 프로젝트 데이터 간의 유사도 분석을 수행하고, 유사도 분석 결과에 기반하여 적어도 어느 하나의 프로젝트 리스트를 제공할 수 있다.
예시적으로 도 9를 참조하면, 시각화부(14)는 사용자 단말(미도시)로 프로젝트 검색을 수행할 복수의 검색 항목을 제공할 수 있다. 데이터 입력부(12)는 사용자 단말(미도시)로부터 복수의 검색 항목 중 적어도 어느 하나를 선택한 사용자 입력 정보를 수신할 수 있다. 복수의 검색 항목은, 플랜트 종류, 프로젝트 코드, 프로젝트 명칭, 프로젝트 유형, 현장위치, 사업분야, 규모(용량), 프로젝트 기간, 발주처 등을 포함할 수 있다. 머신러닝부(13)는 사용자 입력 정보에 기반하여 데이터베이스(미도시)에 저장된 프로젝트 데이터와의 유사도 분석을 수행할 수 있다. 일예로, 유사도 분석은, Fuzzy Matching 알고리즘을 기반으로 수행될 수 있다. Fuzzy Matching 알고리즘은 편집거리(레펜슈타인, Levenshtein Distance)를 기반으로 계산된 결과값을 사용하여 데이터 간의 유사도를 계산해 주는 알고리즘일 수 있다. 머신러닝부(13)는 유사도 분석 결과에 기반하여 유사 프로젝트 리스트를 제공할 수 있다. 또한, 데이터 입력부(12)는 유사도 분석 결과에 기반하여 제공된 유사 프로젝트 리스트 중 적어도 어느 하나를 선택하는 사용자 입력 정보를 수신할 수 있다. 시각화부(14)는 사용자 입력 정보에 기반하여 유사 프로젝트를 제공할 수 있다.
또한, 도 10을 참조하면, 시각화부(14)는 유사 프로젝트에 대한 통계적 시각화 결과를 제공할 수 있다. 시각화부(14)는 검색 결과에 대해 프로젝트 지연일, MM 등을 통계적 기법으로 도출하고, 이를 시각화하여 제공할 수 있다.
이하에서는 상기에 자세히 설명된 내용을 기반으로, 본원의 동작 흐름을 간단히 살펴보기로 한다.
도 11은 본원의 일 실시예에 따른 엔지니어링 전주기 데이터를 활용한 데이터 분석 방법에 대한 동작 흐름도이다.
도 11에 도시된 엔지니어링 전주기 데이터를 활용한 데이터 분석 방법은 앞서 설명된 데이터 분석 장치(10)에 의하여 수행될 수 있다. 따라서, 이하 생략된 내용이라고 하더라도 데이터 분석 장치(10)에 대하여 설명된 내용은 엔지니어링 전주기 데이터를 활용한 데이터 분석 방법에 대한 설명에도 동일하게 적용될 수 있다.
단계 S101에서, 데이터 분석 장치(10)는 엔지니어링 산업의 전주기에서 발생하는 프로젝트 데이터를 수집할 수 있다.
단계 S102에서, 데이터 분석 장치(10)는 신규 프로젝트 데이터를 입력 받을 수 있다.
단계 S103에서, 데이터 분석 장치(10)는 입력받은 신규 프로젝트 데이터를 머신러닝 기반으로 학습된 학습 모듈에 적용하여 데이터 분석을 수행할 수 있다.
단계 S104에서, 데이터 분석 장치(10)는 데이터 분석 결과를 시각화하여 제공할 수 있다.
상술한 설명에서, 단계 S101 내지 S104는 본원의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다.
본원의 일 실시 예에 따른 엔지니어링 전주기 데이터를 활용한 데이터 분석 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
또한, 전술한 엔지니어링 전주기 데이터를 활용한 데이터 분석 방법은 기록 매체에 저장되는 컴퓨터에 의해 실행되는 컴퓨터 프로그램 또는 애플리케이션의 형태로도 구현될 수 있다.
전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.
10: 데이터 분석 장치
11: 데이터 수집부
12: 데이터 입력부
13: 머신러닝부
14: 시각화부
11: 데이터 수집부
12: 데이터 입력부
13: 머신러닝부
14: 시각화부
Claims (12)
- 엔지니어링 전주기 데이터를 활용한 데이터 분석 장치에 있어서,
엔지니어링 산업의 전주기에서 발생하는 프로젝트 데이터를 수집하는 데이터 수집부;
신규 프로젝트 데이터를 입력받는 데이터 입력부;
상기 데이터 입력부에서 입력받은 상기 신규 프로젝트 데이터를 머신러닝 기반으로 학습된 학습 모듈에 적용하여 데이터 분석을 수행하는 머신러닝부; 및
상기 머신러닝부의 분석 결과를 시각화하여 제공하는 시각화부,
를 포함하는, 데이터 분석 장치. - 제1항에 있어서,
상기 데이터 입력부는,
상기 엔지니어링 산업의 복수의 분석 단계 항목 중 분석을 수행할 어느 하나의 분석 단계 항목을 선택하는 사용자 입력 정보를 수신하는 것인, 데이터 분석 장치. - 제2항에 있어서,
상기 엔지니어링 산업의 복수의 분석 단계 항목은,
Bidding 분석 항목, Engineering 분석 항목, Construction & Commissioning 분석항목, O&M 분석 항목 중 적어도 어느 하나를 포함하는 것인, 데이터 분석 장치. - 제3항에 있어서,
상기 머신러닝 기반으로 학습된 학습 모듈은,
회귀모델, 분류모델, 군집모델 및 딥러닝모델 중 적어도 어느 하나의 학습 모듈을 포함하는 것인, 데이터 분석 장치. - 제4항에 있어서,
상기 머신러닝부는,
상기 엔지니어링 산업의 복수의 분석 단계 항목 중 ITB 분석 항목에 대하여 ITB 문서 데이터에 포함된 독소조항을 탐지하기 위해 머신러닝 기반으로 학습된 학습 모듈에 상기 신규 프로젝트 데이터를 적용하여 독소조항 분석을 수행하는 것인, 데이터 분석 장치. - 제5항에 있어서,
상기 머신러닝부는,
상기 엔지니어링 산업의 복수의 분석 단계 항목 중 설계원가 예측 분석 항목에 대하여 상기 머신러닝 기반으로 학습된 학습 모듈에 상기 신규 프로젝트 데이터를 적용하여 MH(Man Hour)를 예측 분석을 수행하는 것인, 데이터 분석 장치. - 제6항에 있어서,
상기 머신러닝부는,
상기 엔지니어링 산업의 복수의 분석 단계 항목 중 설계오류 분석 항목에 대하여 상기 머신러닝 기반으로 학습된 학습 모듈에 상기 신규 프로젝트 데이터를 적용하여 프로젝트 지연일 분석을 수행하는 것인, 데이터 분석 장치. - 제7항에 있어서,
상기 머신러닝부는,
상기 엔지니어링 산업의 복수의 분석 단계 항목 중 설계변경 분석 항목에 대하여 상기 머신러닝 기반으로 학습된 학습 모듈에 상기 신규 프로젝트 데이터를 적용하여 변경금액 분석을 수행하는 것인, 데이터 분석 장치. - 제8항에 있어서,
상기 머신러닝부는,
상기 엔지니어링 산업의 복수의 분석 단계 항목 중 예측정비 분석 항목에 대하여 상기 머신러닝 기반으로 학습된 학습 모듈에 상기 신규 프로젝트 데이터를 적용하여 정비품목탐지 분석을 수행하는 것인, 데이터 분석 장치. - 제9항에 있어서,
상기 머신러닝부는,
상기 엔지니어링 산업의 복수의 분석 단계 항목 각각에 대하여 복수의 학습 모델에 적용하여 수행된 학습 결과를 수집하고, 가장 높은 정확도 학습 결과를 나타내는 학습 모델의 학습 결과를 상기 엔지니어링 산업의 복수의 분석 단계 항목에 대한 분석 결과로 제공하는 것인, 데이터 분석 장치. - 제10항에 있어서,
상기 데이터 입력부는,
상기 데이터 수집부에서 수집된 복수의 프로젝트 데이터 중 검색을 수행할 프로젝트에 관한 복수의 검색 항목을 선택하는 사용자 입력 정보를 수신하고,
상기 머신러닝부는,
상기 사용자 입력 정보와 상기 복수의 프로젝트 데이터 간의 유사도 분석을 수행하고, 유사도 분석 결과에 기반하여 적어도 어느 하나의 프로젝트 리스트를 제공하는 것인, 데이터 분석 장치. - 엔지니어링 전주기 데이터를 활용한 데이터 분석 방법에 있어서,
엔지니어링 산업의 전주기에서 발생하는 프로젝트 데이터를 수집하는 단계;
신규 프로젝트 데이터를 입력받는 단계;
입력받은 상기 신규 프로젝트 데이터를 머신러닝 기반으로 학습된 학습 모듈에 적용하여 데이터 분석을 수행하는 단계; 및
분석 결과를 시각화하여 제공하는 단계,
를 포함하는, 데이터 분석 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200022837A KR102307132B1 (ko) | 2020-02-25 | 2020-02-25 | 플랜트 엔지니어링 업무 단계별 의사결정 지원을 위한 머신러닝 자동화 플랫폼 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200022837A KR102307132B1 (ko) | 2020-02-25 | 2020-02-25 | 플랜트 엔지니어링 업무 단계별 의사결정 지원을 위한 머신러닝 자동화 플랫폼 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210108074A true KR20210108074A (ko) | 2021-09-02 |
KR102307132B1 KR102307132B1 (ko) | 2021-09-30 |
Family
ID=77794204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200022837A KR102307132B1 (ko) | 2020-02-25 | 2020-02-25 | 플랜트 엔지니어링 업무 단계별 의사결정 지원을 위한 머신러닝 자동화 플랫폼 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102307132B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113807613A (zh) * | 2021-10-13 | 2021-12-17 | 国网安徽省电力有限公司 | 一种电网工程全周期预算优化配置工具 |
KR102484916B1 (ko) * | 2022-08-23 | 2023-01-06 | (주)위세아이텍 | 사용자 설정 기반 플랜트 예지정비 장치 및 방법 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3388986A1 (en) * | 2017-04-11 | 2018-10-17 | Accenture Global Solutions Limited | End-to-end project management platform with artificial intelligence integration |
KR20190131341A (ko) * | 2018-05-16 | 2019-11-26 | 이화여자대학교 산학협력단 | 해외 건설 계약서 내의 독소 조항 및 누락 조항의 자동 검토 프로그램 |
-
2020
- 2020-02-25 KR KR1020200022837A patent/KR102307132B1/ko active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3388986A1 (en) * | 2017-04-11 | 2018-10-17 | Accenture Global Solutions Limited | End-to-end project management platform with artificial intelligence integration |
KR20190131341A (ko) * | 2018-05-16 | 2019-11-26 | 이화여자대학교 산학협력단 | 해외 건설 계약서 내의 독소 조항 및 누락 조항의 자동 검토 프로그램 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113807613A (zh) * | 2021-10-13 | 2021-12-17 | 国网安徽省电力有限公司 | 一种电网工程全周期预算优化配置工具 |
KR102484916B1 (ko) * | 2022-08-23 | 2023-01-06 | (주)위세아이텍 | 사용자 설정 기반 플랜트 예지정비 장치 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR102307132B1 (ko) | 2021-09-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10977581B2 (en) | Systems and methods for secondary knowledge utilization in machine learning | |
US10636007B2 (en) | Method and system for data-based optimization of performance indicators in process and manufacturing industries | |
KR101987365B1 (ko) | 비정형 데이터를 활용한 인공지능 기반의 군 장비 고장 예측 시스템 및 방법 | |
CN107515898B (zh) | 基于数据多样性和任务多样性的轮胎企业销售预测方法 | |
CN103336790B (zh) | 基于Hadoop的邻域粗糙集快速属性约简方法 | |
KR102315668B1 (ko) | 클라우드 기반의 머신러닝 플랫폼과 사전정의 모델을 활용한 엔지니어링 데이터 관리 및 분석 장치 | |
CN103336791B (zh) | 基于Hadoop的粗糙集快速属性约简方法 | |
WO2016209213A1 (en) | Recommending analytic tasks based on similarity of datasets | |
Lin et al. | Applying enhanced data mining approaches in predicting bank performance: A case of Taiwanese commercial banks | |
KR102361423B1 (ko) | 인공지능 기반의 정비 수요 예측 시스템 및 방법 | |
Rahmaty et al. | Customer churn modeling via the grey wolf optimizer and ensemble neural networks | |
CN113361963A (zh) | 识别企业风险性的方法及装置 | |
KR102307132B1 (ko) | 플랜트 엔지니어링 업무 단계별 의사결정 지원을 위한 머신러닝 자동화 플랫폼 장치 | |
Sun et al. | The dynamic financial distress prediction method of EBW-VSTW-SVM | |
Lenka et al. | Empirical analysis of ensemble learning for imbalanced credit scoring datasets: a systematic review | |
WO2022188994A1 (en) | Computer-implemented methods referring to an industrial process for manufacturing a product and system for performing said methods | |
Sujatha et al. | Loan prediction using machine learning and its deployement on web application | |
El Qadi et al. | Feature contribution alignment with expert knowledge for artificial intelligence credit scoring | |
Kothamasu et al. | Sentiment analysis on twitter data based on spider monkey optimization and deep learning for future prediction of the brands | |
CN117196800A (zh) | 一种用于银行网点员工行为的数字化管理方法 | |
Ahmed et al. | Knowledge-based intelligent system for IT incident DevOps | |
Zhang et al. | Credit Evaluation of SMEs Based on GBDT‐CNN‐LR Hybrid Integrated Model | |
US20170330055A1 (en) | Sequential data analysis apparatus and program | |
CN111242520B (zh) | 特征合成模型的生成方法、装置及电子设备 | |
Kashyap | Machine Learning in Google Cloud Big Query using SQL |