KR102644982B1

KR102644982B1 - 클라우드 환경에서 구현되는 빅데이터 및 인공지능 기반의 서비스 제공 시스템

Info

Publication number: KR102644982B1
Application number: KR1020230035843A
Authority: KR
Inventors: 염진섭
Original assignee: 주식회사 와이티아이엔에스
Priority date: 2023-03-20
Filing date: 2023-03-20
Publication date: 2024-03-07

Abstract

클라우드 환경에서 구현되는 빅데이터 및 인공지능 기반의 서비스 제공 시스템이 개시된다. 개시된 시스템은, 사용자가 요구하는 대상 서비스의 목적 및 상기 대상 서비스를 제공받기 위해 필요한 필수 정보를 사용자 단말기로부터 입력받는 사용자 입력부와, 빅데이터 모듈 및 인공지능 모듈이 서로 연동되어 동작하여 상기 대상 서비스를 제공하는 서비스 제공부를 포함한다.

Description

클라우드 환경에서 구현되는 빅데이터 및 인공지능 기반의 서비스 제공 시스템{Big data and artificial intelligence based service providing system implemented in cloud environment}

본 발명의 실시예들은 클라우드 환경에서 구현되는 빅데이터 및 인공지능 기반의 서비스 제공 시스템에 관한 것이다.

배경 기술에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래 기술을 구성하는 것은 아니다.

IoT(Internet of Things), 인공지능, 빅데이터 등 4차 산업혁명 기반 기술을 활용한 엔지니어링 산업 혁신은 국가제조경쟁력 향상의 필수 요소로 인식되고 있다. 산업인터넷 기술의 발전을 통해 기존에는 획득이 불가능했던 다양한 종류의 데이터에 대한 실시간 수집이 가능해짐에 따라 데이터를 효율적으로 관리하고 해당 데이터로부터 의미있는 결과를 도출하기 위한 연구가 활발하게 진행되고 있고, 특히 빅데이터 기술 및 인공지능 기술이 활용되고 있다.

빅데이터 기술은 기존 데이터베이스로 처리할 수 있는 역량을 넘어서는 초대용량의 데이터를 수집, 저장, 처리, 분석하여 가치를 추출하는 기술을 의미한다. 인공지능 기술은 인간의 학습능력, 추론능력 및 지각능력 등의 일부 또는 전부를 컴퓨터 프로그램을 이용하여 인공적으로 구현하는 ICT(Information and Communications Technologies) 기술을 의미한다.

한편, 빅데이터 기술과 인공지능 기술을 융합하여 사용자 또는 기업에 대해 다양한 서비스를 제공하는 시도가 활발하게 진행되고 있다.

본 발명의 목적은 클라우드 환경에서 구현되는 빅데이터 및 인공지능 기반의 플랫폼을 이용한 서비스 제공 장치를 제안한다.

본 발명의 목적은 빅데이터 및 인공지능 기반의 플랫폼에 기반하여 사용자가 요구하는 대상 서비스를 지원하는 서비스 제공 시스템을 제안한다.

본 발명의 목적들은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 본 발명의 다른 목적 및 장점들은 하기의 설명에 의해서 이해될 수 있고, 본 발명의 실시예에 의해 보다 분명하게 이해될 것이다. 또한, 본 발명의 목적 및 장점들은 청구 범위에 나타낸 수단 및 그 조합에 의해 실현될 수 있음을 쉽게 알 수 있을 것이다.

본 발명의 일 실시예에 따른 클라우드 환경에서 구현되는 빅데이터 및 인공지능 기반의 서비스 제공 시스템은, 사용자가 요구하는 대상 서비스의 목적 및 상기 대상 서비스를 제공받기 위해 필요한 필수 정보를 사용자 단말기로부터 입력받는 사용자 입력부와, 빅데이터 모듈 및 인공지능 모듈이 서로 연동되어 동작하여 상기 대상 서비스를 제공하는 서비스 제공부를 포함한다. 이 때, 상기 빅데이터 모듈은 데이터를 수집, 저장, 처리 및 분석 중 적어도 하나가 수행된 빅데이터를 상기 인공지능 모듈로 전달하고, 상기 인공지능 모듈은 상기 빅데이터에 기초하여 학습 및 추론을 수행하고, 상기 인공지능 모듈은 상기 빅데이터 모듈의 상기 수집, 저장, 처리 및 분석 중 적어도 하나와 관련된 인공지능 모델을 상기 빅데이터 모듈로 전달하여 상기 수집, 저장, 처리 및 분석 중 적어도 하나를 수행한다. 그리고, 상기 빅데이터 모듈은, 내부 및 외부 데이터를 포함하는 상기 데이터를 수집하는 빅데이터 수집 수단과, 상기 수집된 데이터를 전처리 및 후처리하고, 상기 수집된 데이터, 상기 전처리 및 후처리된 데이터를 저장하는 빅데이터 저장 수단과, 상기 데이터 저장 수단에 저장된 데이터를 일괄 처리 및 실시간 처리하는 빅데이터 처리 수단과, 상기 데이터 처리 모듈에서 처리된 데이터를 분석하는 빅데이터 분석 수단을 포함한다.

본 발명에 따르면, 빅데이터와 인공지능이 연동된 플랫폼을 통해 데이터 처리, 머신 러닝, 인공지능 서비스 제공의 대량, 실시간, 고속, 효율성을 보장할 수 있다.

또한, 본 발명의 효과는 상기한 효과로 한정되는 것은 아니며, 본 발명의 상세한 설명 또는 청구범위에 기재된 발명의 구성으로부터 추론 가능한 모든 효과를 포함하는 것으로 이해되어야 한다.

도 1은 본 발명의 일 실시예에 따른 서비스 제공 시스템의 개략적인 구성을 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 빅데이터 모듈의 개략적인 구조를 도시한 도면이다.
도 3 및 도 4는 본 발명의 일 실시예에 따른 빅데이터 모듈의 순차적인 처리 동작을 개략적으로 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 인공지능을 개략적으로 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 서비스 제공 방법의 개략적인 흐름도를 도시한 도면이다.
도 7은 본 발명의 일 실시예에 따른 히스토리 정보의 개념을 설명하기 위한 도면이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.

"제1", "제2" 등의 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만 사용된다. "및/또는" 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

이하에서, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다.

도 1은 본 발명의 일 실시예에 따른 서비스 제공 시스템(1)의 개략적인 구성을 도시한 도면이다.

도 1을 참조하면, 서비스 제공 시스템(1)은 클라우드 환경에서 구현되는 것으로서, 사용자 입력부(10) 및 서비스 제공부(20)를 포함할 수 있다.

사용자 입력부(10)는 사용자가 요구하는 대상 서비스와 관련된 정보를 사용자 단말기(미도시)로부터 입력받을 수 있다. 사용자는 개인 또는 기업일 수도 있다.

서비스 제공부(20)는 빅데이터 모듈 및 인공지능 모듈이 서로 연동되어 동작하여 대상 서비스를 제공할 수 있다.

사용자 입력부(10) 및 서비스 제공부(20)는 메모리 및 프로세서를 기반으로 구현될 수 있다.

서비스 제공부(20)는 빅데이터 모듈(21) 및 인공지능 모듈(22)을 포함할 수 있다.

한편, 본 명세서에서 모듈이라 함은, 본 발명의 기술적 사상을 수행하기 위한 하드웨어 및 상기 하드웨어를 구동하기 위한 소프트웨어의 기능적, 구조적 결합을 의미할 수 있다. 예컨대, 상기 모듈은 소정의 코드와 상기 소정의 코드가 수행되기 위한 하드웨어 리소스의 논리적인 단위를 의미할 수 있으며, 반드시 물리적으로 연결된 코드를 의미하거나, 한 종류의 하드웨어를 의미하는 것은 아님은 본 발명의 기술분야의 평균적 전문가에게는 용이하게 추론될 수 있다.

빅데이터 모듈(21)은 빅데이터를 구축하는 모듈로서, 데이터의 수집, 저장, 처리, 분석 및 시각화를 수행할 수 있다. 인공지능 모듈(22)는 데이터를 이용하여 학습을 수행하며, 데이터를 기초로 추론 과정을 수행할 수 있다.

빅데이터 모듈(21)과 인공지능 모듈(22)는 서로 연동되어 동작할 수 있다. 즉, 빅데이터 모듈(21)은 수집, 저장, 처리 및 분석 중 적어도 하나가 수행된 빅데이터를 인공지능 모듈(22)로 전달할 수 있고, 인공지능 모듈(22)은 수집, 저장, 처리 및 분석 중 적어도 하나가 수행된 빅데이터에 기초하여 학습, 추론을 수행할 수 있다. 또한, 인공지능 모듈(22)은 빅데이터 모듈(21)의 수집, 저장, 처리 및 분석 중 적어도 하나와 관련된 인공지능 모델을 빅데이터 모듈(21)로 전달할 수 있고, 빅데이터 모듈(21)은 인공지능 모델에 기초하여 수집, 저장, 처리 및 분석 중 적어도 하나를 수행할 수 있다.

도 2는 본 발명의 일 실시예에 따른 빅데이터 모듈(21)의 개략적인 구조를 도시한 도면이고, 도 3은 본 발명의 일 실시예에 따른 빅데이터 모듈(21)의 순차적인 처리 동작을 개략적으로 설명하기 위한 도면이다.

도 2를 참조하면, 빅데이터 모듈(21)은 빅데이터 수집 수단(211), 빅데이터 저장 수단(212), 빅데이터 처리 수단(213), 빅데이터 분석 수단(214) 및 빅데이터 시각화 수단(215)를 포함할 수 있다.

빅데이터 수집은 빅데이터 분석이나 서비스를 제공할 때에 서비스의 품질을 결정하는데 중요한 핵심 단계로서(도 3 참조), 빅데이터 수집 수단(211)은 대상 데이터가 수집이 가능하고 사용이 가능한지의 여부, 이용 목적에 맞는 세부 항목이 포함되어 있는지 여부 및 개인 정보 침해의 여부를 고려하여 데이터를 수집할 수 있다.

빅데이터 수집 수단(211)은 정형/반정형/비정형 타입의 내부 데이터 및 외부 데이터를 포함하는 데이터를 수집할 수 있다.

정형 데이터는 미리 정해진 형식과 구조에 따라 저장된 데이터이다. 일례로, 정형 데이터는 RDB, 스프레드 시트, CSV 데이터 등일 수 있으며, ETL, FTP, Open API 등을 통해 수집될 수 있다(도 4의 (a) 참조).

반정형 데이터는 미리 정해진 구조에 따라 저장된 데이터이지만 형식과 구조가 변경될 수 있는 데이터이다. 일례로, 반정형 데이터는 HTML, XML, JSON, 웹문서, 웹로그, 센서 데이터 등일 수 있으며, 크롤링(Crawling), RSS, Open API, FTP 등을 통해 수집될 수 있다(도 4의 (b) 참조).

비정형 데이터는 정해진 구조가 없는 데이터이다. 일례로, 비정형 데이터는 소셜 데이터, 온라인 문서(워드, 한글 등), 이미지, 오디오, 비디오 등일 수 있으며, 크롤링, 스트리밍, RSS, Open API 등을 통해 수집될 수 있다(도 4의 (c) 참조).

내부 데이터는 사용자가 자체적으로 보유한 내부 파일 시스템, 데이터베이스 관리 시스템, 센서 등에 접근하여 수집된 데이터이고, 외부 데이터는 인터넷 등을 통해 연결된 외부에서 수집된 데이터이다.

빅데이터 저장 수단(212)은 데이터 수집 과정을 통해 확보된 빅데이터로부터 유용한 정보를 추출하기 위해 빅데이터를 효과적으로 저장 및 관리하는 동작을 수행할 수 있다. 즉, 빅데이터 저장 수단(212)은 수집된 데이터를 분석에 사용하기에 적합한 방식으로 안전하게 영구적인 방법으로 보관하며, 대용량의 다양한 형식의 데이터를 고성능으로 저장하고 필요한 경우 데이터를 검색하여 수정, 삭제 또는 원하는 내용을 읽어올 수 있다.

빅데이터 저장 수단(212)은 수집된 데이터를 전처리 및 후처리할 수 있으며, 미리 설정된 저장 모델을 이용하여 전처리 및 후처리된 데이터와, 전처리 및 후처리되지 않은 데이터를 저장할 수 있다(도 3 참조).

데이터의 전처리는 필터링, 유형변환, 정제를 포함할 수 있다.

필터링은 데이터 활용 목적에 맞지 않는 정보를 제거하는 과정이다. 이를 통해, 분석 시간이 단축되고, 저장 공간이 효율적으로 활용될 수 있다. 일례로, 자연어 처리 기술 및 머신 러닝 등과 같은 인공지능 모델을 사용될 수 있다. 실시예에 따르면, 인공지능 모델은 인공지능 모듈(22)에서 제공될 수 있다. 유형변환은 데이터의 유형을 변환하여 데이터의 분석이 용이한 형태로 변환하는 과정이다. 정제는 수집된 데이터의 불일치성을 교정하기 위한 과정으로서, 빠진값(missing value)을 처리하고 데이터 내의 노이즈를 제거하는 과정이다.

데이터의 후처리는 데이터 변환, 통합 및 축소를 포함할 수 있다.

데이터 변환은 다양한 형식으로 수집된 데이터를 분석에 용이하도록 일관성있는 형식으로 변환하는 과정으로서, 평활화(smoothing), 집계(aggregation), 일반화(generalization), 정규화(normalization), 속성생성(attribute/feature construction) 등을 포함한다. 데이터 통합은 상호 연관성이 있는 데이터를 하나로 결합하는 과정으로서, 연관관계 분석 등을 통해 중복 데이터를 검출 및 삭제하고, 서로 상반된 데이터 중 어느 하나를 선택하는 과정이다. 데이터 축소는 분석에 사용되지 않을 것으로 예상되는 불필요한 데이터들을 축소하되, 고유한 특성은 손상되지 않도록 하는 과정이다.

빅데이터 저장 수단(212)은 일례로, RDB, NoSQL, 분산 파일 시스템 등을 이용하여 빅데이터를 저장할 수 있다.

RDB는 관계형 데이터를 저장하거나, 수정하고 관리할 수 있게 해주는 데이터베이스로서, SQL를 이용하여 데이터베이스의 생성, 수정 및 검색할 수 있다. NoSQL는 비관계형 데이터로서, 테이블스키마(TableSchema)가 고정되지 않고, 테이블 간 조인(Join) 연산을 지원하지 않으며, 수평적 확장(Horizontal Scalability)이 용이하다. 분산 파일 시스템은 분산된 서버의 로컬 디스크에 파일을 저장하고 파일의 읽기, 쓰기 등과 같은 연산을 운영체제가 아닌 API를 제공하여 처리하는 파일 시스템이다.

빅데이터 처리 수단(213)은 데이터 저장 수단(212)에 저장된 데이터를 일괄 처리 및 실시간 처리할 수 있고, 일괄 처리 및 실시간 처리된 데이터를 데이터 저장 수단(212)에 저장할 수 있다(도 3 참조).

빅데이터 처리 수단(213)은, 기존의 데이터 처리 방식과는 다르게 의사 결정의 즉시성이 덜 요구되도록 데이터를 처리하여야 하고, 대용량의 데이터에 기반을 둔 분석을 수행하기 위해 장기적이고 전략적이며 때때로 일회성 거래 처리나 행동 분석을 지원하도록 데이터를 처리하여야 하며, 단순한 프로세싱 모델이 아닌 다양한 데이터 소스, 복잡한 로직 처리, 대용량 데이터 처리 등을 위해 처리의 복잡도가 가장 높고 통상적으로 분산 처리 기술을 필요로 한다.

빅데이터 처리 수단(213)은 획득된 빅데이터를 여러 서버로 분산하여 처리하고, 이를 다시 모아서 결과를 정리하는 분산, 병렬 기술 방식을 사용하여 데이터를 일괄 처리할 수 있다. 일례로서, 빅데이터 처리 수단(213)은 하둡의 맵리듀스 및 마이크로소프트의 드라이애드(Dryad)를 이용하여 데이터를 일괄 처리할 수 있다.

빅데이터 처리 수단(213)은 지속적으로 발생하는 스트림 데이터를 실시적으로 처리함으로써 지연을 최소화하고, 사용자에게 실시간으로 데이터 분석 결과를 보여줄 수 있다. 일례로서, 빅데이터 처리 수단(213)은 인-메모리(in-memory) 처리, 데이터 스트림 처리를 이용하여 데이터를 실시간 처리할 수 있다.

빅데이터 분석 수단(214)은 미리 설정된 분석 모델을 이용하여 데이터 처리 모듈(213)에서 처리된 데이터를 분석할 수 있다(도 3 참조).

빅데이터를 분석하기 위한 분석 모델은, 통계학과 전산학, 특히 머신 러닝(기계학습)이나 데이터 마이닝 분야, 텍스트 마이닝 분야에서 사용되던 분석 기법들의 알고리즘을 개선한 모델일 수 있다. 더불어, 분석 모델은, 소셜 미디어 등 비정형 데이터에 적용이 가능한 텍스트 마이닝, 오피니언 마이닝, 소셜 네트워크 분석, 군집 분석 등에 따른 모델일 수 있다.

텍스트 마이닝은 비정형 텍스트 데이터에서 가치와 의미가 있는 정보를 찾아내는 기술이다. 오피니언 마이닝은 소셜 미디어 등의 정형/비정형 텍스트의 긍정, 부정, 중립의 선호도를 판별하는 기술이다. 소셜 네트워크 분석은 소셜 네트워크 서비스에서 획득한 정보를 분석하는 기술이다. 군집 분석은 비슷한 특성을 가진 개체를 합쳐가면서 최종적으로 유사 특성의 군을 발굴하는데 사용되는 기술이다. 시맨틱 애노테이션은 특정 개체를 지식 베이스의 온톨로지와 매핑하여 추가적인 시맨틱 정보를 생성하는 것. 시맨틱 기술은 웹 상에 존재하는 정보의 의미를 구문의 형태를 인식하는 단순한 수준을 넘어 사람이 이해하는 수준으로 데이터의 의미를 인식해 처리하는 기술이다.

빅데이터 시각화 수단(215)은 크고 복잡한 빅데이터 속에서 의미있는 정보와 가치들을 찾아내어 사용자에게 직관적으로 표현하는 기능을 수행할 수 있다(도 3 참조).

빅데이터의 시각화는, 디스크의 파일이나 네트워크를 통해서 시각화하고자 하는 데이터를 획득하는 Acquire 과정, 데이터의 의미를 해석할 수 있도록 구조에 넣는 Parse 과정, 시각화의 대상이 되는 관심있는 데이터만 남기고 나머지는 제거하는 Filter 과정, 통계학이나 데이터 마이닝 등의 분석 기법을 이용하여 패턴을 파악하거나 수학적인 맥락(mathematical context)을 파악하는 Mine 과정, 막대그래프, 리스트(list), 트리구조(tree) 등의 기본적 시각화 모델을 이용하여 데이터를 표현하는 Represent 과정, 기본 표상(basic representation)을 더 명확하고 시각적으로 돋보이게 개선시키는 Refine 과정, 사용자가 데이터를 변경하거나 보이는 내용을 조절할 수 있는 방법을 제공하는 Interact 과정을 포함할 수 있다.

도 5는 본 발명의 일 실시예에 따른 인공지능을 개략적으로 설명하기 위한 도면이다.

도 5를 참조하면, 인공지능은 인간의 지능으로 할 수 있는 사고, 학습, 자기 계발 등을 컴퓨터가 할 수 있도록 하는 방법을 연구하는 컴퓨터 공학 및 정보 기술의 한 분야로, 컴퓨터가 인간의 지능적인 행동을 모방할 수 있도록 하는 것을 의미한다.

인공지능은 그 자체로 존재하는 것이 아니라, 컴퓨터 과학의 다른 분야와 직간접으로 많은 관련을 맺고 있다. 특히 현대에는 정보 기술의 여러 분야에서 인공지능적 요소를 도입하여, 그 분야의 문제 풀이에 활용하려는 시도가 매우 활발하게 이루어지고 있다.

머신 러닝은 인공지능의 한 분야로, 컴퓨터에 명시적인 프로그램 없이 배울 수 있는 능력을 부여하는 연구 분야이다. 머신 러닝은, 경험적 데이터를 기반으로 학습을 하고 예측을 수행하고 스스로의 성능을 향상시키는 시스템과 이를 위한 알고리즘을 연구하고 구축하는 기술이다. 머신 러닝의 알고리즘들은 엄격하게 정해진 정적인 프로그램 명령들을 수행하는 것이라기보다, 입력 데이터를 기반으로 예측이나 결정을 이끌어내기 위해 특정한 모델을 구축하는 방식을 취한다.

머신 러닝에서 데이터를 어떻게 분류할 것인가를 놓고, 많은 머신 러닝 알고리즘이 개발되었다. 의사결정 나무(Decision Tree), 베이지안 망(Bayesian network), 서포트 벡터 머신(SVM: support vector machine), 그리고 인공 신경망(ANN: Artificial Neural Network) 등이 대표적이다.

특히, 인공 신경망은 생물학적 뉴런의 동작 원리와 뉴런 간의 연결 관계를 모델링한 것으로 노드(node) 또는 처리 요소(processing element)인 다수의 뉴런(neuron)들이 레이어(layer) 구조의 형태로 연결된 정보 처리 시스템이다. 인공 신경망은 머신 러닝에서 사용되는 모델로써, 머신 러닝과 인지 과학에서 생물학의 신경망(동물의 중추신경계 중 특히 뇌)에서 영감을 얻은 통계학적 학습 알고리즘이다.

인공 신경망은 복수의 레이어를 포함할 수 있고, 레이어들 각각은 복수의 뉴런(노드)을 포함할 수 있다. 또한, 인공 신경망은 뉴런과 뉴런을 연결하는 시냅스(synapse, 에지)를 포함할 수 있다. 즉, 인공 신경망은 시냅스의 결합으로 네트워크를 형성한 인공 뉴런이 학습을 통해 시냅스의 결합 세기를 변화시켜 문제 해결 능력을 가지는 모델 전반을 의미할 수 있다.

인공 신경망은 일반적으로 다음의 세가지 인자, 즉 다른 레이어의 뉴런들 사이의 연결 패턴, 시냅스의 가중치를 갱신하는 학습 과정, 이전 레이어로부터 수신되는 입력에 대한 가중 합으로부터 출력값을 생성하는 활성화 함수에 의해 정의될 수 있다.

인공 신경망은, DNN(Deep Neural Network), RNN(Recurrent Neural Network), BRDNN(Bidirectional Recurrent Deep Neural Network), MLP(Multilayer Perceptron), CNN(Convolutional Neural Network)와 같은 방식의 네트워크 모델들을 포함할 수 있으나, 이에 한정되지 않는다.

인공신경망은 계층 수에 따라 단층 신경망(Single-Layer Neural Networks)과 다층 신경망(Multi-Layer Neural Networks)으로 구분된다. 단층 신경망은, 입력 레이어와 출력 레이어로 구성된다. 다층 신경망은 입력 레이어(input layer)와, 하나 이상의 은닉 레이어(hidden layer)와, 출력층(output layer)으로 구성된다.

입력 레이어는 외부의 자료들을 받아들이는 레이어로서, 입력 레이어의 뉴런 수는 입력되는 변수의 수와 동일하다.

은닉 레이어는 입력 레이어와 출력 레이어 사이에 위치하며, 입력 레이어로부터 신호를 받아 특성을 추출하여 출력 레이어로 전달한다.

출력 레이어는 은닉 레이어로부터 신호를 받고, 수신한 신호에 기반한 출력 값을 출력한다. 뉴런 간의 입력 신호는 각각의 가중치(연결 강도)와 곱해진 후 합산되며 이 합이 뉴런의 임계치보다 크면 뉴런이 활성화되어 활성화 함수를 통하여 획득한 출력값을 출력한다.

한편, 입력 레이어와 출력 레이어 사이에 복수의 은닉 레이어를 포함하는 심층 신경망은, 머신 러닝 기술의 한 종류인 딥 러닝을 구현하는 대표적인 인공 신경망일 수 있다.

인공 신경망은 훈련 데이터(training data)를 이용하여 학습(training)될 수 있다. 여기서 학습이란, 입력 데이터를 분류(classification)하거나 회귀분석(regression)하거나 군집화(clustering)하는 등의 목적을 달성하기 위하여, 학습 데이터를 이용하여 인공 신경망의 파라미터(parameter)를 결정하는 과정을 의미할 수 있다. 시냅스 가중치(weight)나 뉴런에 적용되는 바이어스(bias)가 인공 신경망의 파라미터의 대표적인 예이다.

훈련 데이터에 의하여 학습된 인공 신경망은, 입력 데이터를 입력 데이터가 가지는 패턴에 따라 분류하거나 군집화할 수 있다. 한편 훈련 데이터를 이용하여 학습된 인공 신경망을, 본 명세서에서는 학습 모델(trained model)이라 명칭할 수 있다.

인공 신경망의 학습 방식은 크게, 지도 학습(supervised learning), 비 지도 학습(unsupervised learning), 준 지도 학습(semi-supervised learning), 강화 학습(reinforcement learning)으로 분류될 수 있다.

지도 학습은 훈련 데이터로부터 하나의 함수를 유추해내기 위한 머신 러닝의 한 방법이다. 이 때, 유추되는 함수 중, 연속적인 값을 출력하는 것을 회귀분석(regression)이라 하고, 입력 벡터의 클래스(class)를 예측하여 출력하는 것을 분류(classification)라고 한다. 즉, 지도 학습에서는 훈련 데이터에 대한 레이블(label)이 주어진 상태에서 인공 신경망을 학습시킨다. 여기서, 레이블은 훈련 데이터가 인공 신경망에 입력되는 경우 인공 신경망이 추론해 내야 하는 정답(또는 결과 값)을 의미한다.

비 지도 학습은 머신 러닝의 일종으로, 훈련 데이터에 대한 레이블이 주어지지 않는다. 구체적으로, 비 지도 학습은, 훈련 데이터 및 훈련 데이터에 대응하는 레이블의 연관 관계 보다는, 훈련 데이터 자체에서 패턴을 찾아 분류하도록 인공 신경망을 학습시키는 학습 방법이다.

준 지도 학습은 머신 러닝의 일종으로, 레이블이 주어진 훈련 데이터와 레이블이 주어지지 않은 훈련 데이터를 모두 사용하는 학습 방법을 의미할 수 있다. 준 지도 학습의 기법 중 하나로, 레이블이 주어지지 않은 훈련 데이터의 레이블을 추론한 후 추론된 라벨을 이용하여 학습을 수행하는 기법이 있으며, 이러한 기법은 레이블링에 소요되는 비용이 큰 경우에 유용하게 사용될 수 있다.

강화 학습은, 에이전트(Agent)가 매 순간 어떤 행동을 해야 좋을지 판단할 수 있는 환경이 주어진다면, 데이터 없이 경험으로 가장 좋을 길을 찾을 수 있다는 이론이다.

이하, 도 6 및 도 7를 참고하여 빅데이터 및 인공지능 기반의 서비스 제공 방법을 설명하기로 한다.

도 6은 본 발명의 일 실시예에 따른 서비스 제공 방법의 개략적인 흐름도를 도시한 도면이다.

이하, 각 단계 별로 수행되는 과정을 설명한다.

단계(S1)에서, 사용자 입력부(10)는 사용자가 요구하는 대상 서비스의 목적 및 필수 정보를 사용자 단말기로부터 입력받을 수 있다.

대상 서비스는 인공지능에 기반한 서비스일 수 있다. 일례로, 대상 서비스는 수요 예측을 통한 재고량, 공급망 최적화 등의 운영 서비스, 컨텍스트 맞춤형 마케팅 등의 마케팅 서비스, 판매 여부 또는 판매량 예측 등의 영업 서비스, 성과관리 및 고용 등의 인사 관련 서비스, 보험 및 인슈어테크 등의 금융 서비스 등의 다양한 서비스일 수 있다.

필수 정보는 대상 서비스를 제공받기 위해 필수적으로 요구되는 정보일 수 있다. 일례로, 사용자가 기업인 경우, 필수 정보는 기업의 데이터베이스에 저장된 내부 데이터의 접근 권한, 대상 서비스와 관련된 기업의 업무 공간의 블루프린트 정보, 기업의 업무 공간에의 IoT 센서의 설치 여부 및 타입 등을 포함할 수 있다.

단계(S2)에서, 서비스 제공부(20)는 대상 서비스의 목적과 복수의 과거 서비스의 목적 간의 목적 유사도를 산출할 수 있다.

구체적으로, 서비스 제공부(20)의 빅데이터 모듈(21)은 빅데이터 저장 수단(212)을 통해 데이터를 복수의 키워드 별로 분류하여 개별적으로 저장할 수 있다. 키워드는 복수의 과거 서비스의 목적을 각각 구문 분석(파싱)하여 추출된 키워드일 수 있다.

서비스 제공부(20)의 인공지능 모듈(22)는 복수의 과거 서비스의 제공을 위해 사용되었던 복수의 학습 인공지능 모델을 저장할 수 있다. 더불어, 서비스 제공부(20)의 인공지능 모듈(22)는 복수의 과거 서비스 별 히스토리 정보를 더 저장할 수 있다.

도 7은 본 발명의 일 실시예에 따른 히스토리 정보의 개념을 설명하기 위한 도면이다.

도 7을 참조하면, 과거 서비스의 히스토리 정보는, i) 과거 서비스의 목적, ii) 과거 서비스의 목적을 달성하기 위해 사용되었던 과거 인공지능 모델 및 iii) 과거 인공지능 모델에 입력되었던 과거 입력 데이터의 매칭 정보일 수 있다. 과거 입력 데이터는 복수 개일 수 있다. 한편, 과거 입력 데이터 자체는 상술한 바와 같이 키워드 별로 분류하여 빅데이터 모듈(21)에 저장될 수 있다.

도 7에서 설명된 내용을 참조하면, 서비스 제공부(20)는 대상 서비스의 목적을 구문 분석하여 복수의 대상 키워드를 추출하고, 복수의 과거 서비스의 목적 별로 추출되는 과거 키워드의 유사도를 상기 추출된 대상 키워드 각각과 비교하여 키워드 유사도를 산출하고, 산출된 키워드 유사도를 이용하여 대상 서비스의 목적과 복수의 과거 서비스의 목적 간의 목적 유사도를 산출할 수 있다. 키워드 유사도의 산출은 공지의 기술이 사용될 수 있다.

단계(S3)에서, 서비스 제공부(20)는 미리 설정된 제1 임계치를 초과하는 목적 유사도를 가지는 과거 서비스의 목적이 하나 이상 존재하는지 여부를 판단할 수 있다. 일례로서, 목적 유사도의 최대값을 100%으로 가정할 때, 제1 임계치는 80%일 수 있다.

제1 임계치를 초과하는 목적 유사도를 가지는 과거 서비스의 목적이 하나 이상 존재하면 단계(S4)가 수행되고, 제1 임계치를 초과하는 목적 유사도를 가지는 과거 서비스의 목적이 존재하지 않으면 단계(S9)가 수행된다. 단계(S9)의 설명은 후술한다.

단계(S4)에서, 서비스 제공부(20)는 하나 이상의 과거 서비스의 목적 중 최대 목적 유사도를 가지는 제1 과거 서비스의 목적을 선택할 수 있다. 즉, 서비스 제공부(20)는 대상 서비스의 목적과 가장 큰 유사도를 가지는 제1 과거 서비스의 목적을 하나 이상의 과거 서비스의 목적에서 선택할 수 있다.

단계(S5)에서, 서비스 제공부(20)는 제1 과거 서비스의 목적과 매칭된 제1 과거 학습 인공지능 모델을 대상 학습 인공지능 모델로 선정할 수 있다.

즉, 대상 서비스의 목적이 제1 과거 서비스의 목적과 유사하면, 제1 과거 서비스를 위한 과거 학습 인공지능 모델이 대상 서비스의 제공을 위해 사용될 수 있다. 이 경우, 서비스 제공부(20)는 과거 학습 인공지능 모델을 대상 서비스를 위한 대상 학습 인공지능 모델로 사용할 수 있다. 이를 통해, 본 발명은 대상 학습 인공지능 모델을 빠르고 효율적으로 선정할 수 있다.

단계(S6)에서, 서비스 제공부(20)는 대상 서비스의 목적과 제1 과거 서비스의 목적 간의 목적 유사도가 제2 임계치를 초과하는지 여부를 판단할 수 있다. 이 때, 제2 임계치는 제1 임계치보다 높은 값을 가질 수 있다. 일례로, 목적 유사도의 최대값을 100%으로 가정할 때, 제1 임계치는 80%일 수 있고, 제2 임계치는 90%일 수 있다.

대상 서비스의 목적과 제1 과거 서비스의 목적 간의 목적 유사도가 제2 임계치를 초과하면 단계(S7)가 수행되고, 대상 서비스의 목적과 제1 과거 서비스의 목적 간의 목적 유사도가 제2 임계치를 초과하지 않으면 단계(S11)가 수행된다. 단계(S11)의 설명은 후술한다.

단계(S7)에서, 서비스 제공부(20)는 제1 과거 학습 인공지능 모델과 매칭된(즉, 제1 과거 학습 인공지능 모델에 입력되었던) 제1 과거 입력 데이터 중 적어도 일부를 대상 학습 인공지능 모델의 대상 입력 데이터의 적어도 일부로 사용할 수 있다. 그리고, 단계(S8)에서, 서비스 제공부(20)는 필요 시 추가 데이터를 수집 및 저장하여 대상 입력 데이터의 저장을 완료할 수 있다.

즉, 대상 서비스의 목적이 제1 과거 서비스의 목적과 매우 유사하면, 제1 과거 서비스의 제공을 위해 제1 과거 학습 인공지능 모델에 입력되었던 제1 과거 입력 데이터가 대상 학습 인공지능 모델에 활용될 수 있다. 이를 통해, 본 발명은 대상 입력 데이터를 수집 및 저장하는데 소요되는 시간 및 연산량이 감소될 수 있다.

이하, 단계(S7) 및 단계(S8)에서 수행되는 내용을 구체적으로 설명한다. 이 때, 설명의 편의를 위해 사용자를 대상 기업으로 가정하여 설명한다.

학습 인공지능 모델에 입력되는 입력 데이터는 내부 데이터 및 외부 데이터 중 하나 이상을 포함할 수 있다. 따라서, 제1 과거 입력 데이터 역시 과거 내부 데이터 및 과거 외부 데이터 중 하나 이상을 포함할 수 있다.

대상 학습 인공지능 모델은 제1 과거 학습 인공지능 모델과 동일하다. 따라서, 제1 과거 학습 인공지능 모델에 입력되는 제1 과거 입력 데이터에 과거 내부 데이터가 포함되어 있다면, 대상 입력 데이터 역시 대상 내부 데이터를 포함하여야 한다.

내부 데이터는 대상 기업의 고유의 데이터로서, 다른 기업의 내부 데이터와는 서로 관련성이 없는 데이터이다. 따라서, 다른 기업의 내부 데이터를 대상 기업의 내부 데이터 즉 대상 내부 데이터로 활용하여 대상 학습 인공지능 모델에 입력한 경우, 부정확한 모델 출력값이 출력되며, 결국 대상 기업이 원하는 대상 서비스를 제공받을 수 없다.

따라서, 제1 과거 입력 데이터에 과거 내부 데이터가 포함되는 경우, 서비스 제공부(20)는 과거 내부 데이터와 동일한 타입의 대상 내부 데이터가 대상 입력 데이터에 포함되어야 하는 것으로 판단할 수 있다. 이 때, 서비스 제공부(20)는 상술한 바와 같이 과거 내부 데이터를 대상 내부 데이터로 사용하지 않으며, 상술한 필수 정보에 포함된 사용자의 내부 데이터 접근 권한에 기초하여 대상 기업에 대한 내부 데이터, 즉, 대상 내부 데이터를 수집 및 저장하고, 저장된 대상 내부 데이터를 대상 입력 데이터로 사용할 수 있다.

그리고, 과거 내부 데이터에 과거 IoT 센싱 데이터가 포함되는 경우, 대상 입력 데이터에서도 대상 IoT 센싱 데이터가 포함되어야 하며, 과거 IoT 센싱 데이터는 대상 IoT 센싱 데이터와 동일한 종류의 IoT 센서에서 생성된 센싱 데이터이어야 한다.

따라서, 서비스 제공부(20)는 상술한 필수 정보 중 IoT 센서 설치 정보에 기초하여 과거 IoT 센싱 데이터를 생성하는 제1 IoT 센서가 대상 기업의 업무 공간에 설치되었는지를 판단할 수 있다.

만약, 제1 IoT 센서가 대상 기업의 업무 공간에 설치된 경우, 서비스 제공부(20)는 제1 IoT 센서로부터 센싱 데이터를 획득함으로써 대상 내부 데이터에 포함된 대상 IoT 센싱 데이터를 수집 및 저장할 수 있다.

반대로, 제1 IoT 센서가 대상 기업의 업무 공간에 설치되어 있지 않는 경우, 서비스 제공부(20)는 상술한 필수 정보 중 대상 기업의 업무 공간의 블루프린트 정보 및 과거 IoT 센싱 데이터에 기초하여 제1 IoT 센서의 타입 및 대상 기업의 업무 공간에서의 제1 IoT 센서의 설치 위치를 포함하는 센서 설치 요청 정보를 사용자 단말기로 전송할 수 있다. 이 후, 서비스 제공부(20)는 사용자 단말기로부터 센서 설치 완료 정보를 수신할 수 있으며, 센서 설치 완료 정보에 따라 대상 IoT 센싱 데이터를 수집 및 저장할 수 있다. 이에 따라, 대상 기업의 제1 IoT 센서의 설치가 용이해진다.

한편, 상술한 바와 같이, 대상 학습 인공지능 모델은 제1 과거 학습 인공지능 모델과 동일하므로, 제1 과거 입력 데이터에 과거 외부 데이터가 포함되어 있다면, 대상 입력 데이터 역시 대상 외부 데이터를 포함하여야 한다. 외부 데이터는 대상 기업의 고유의 데이터가 아니므로, 과거 외부 데이터가 대상 외부 데이터로 활용될 수 있다.

따라서, 제1 과거 입력 데이터에 과거 외부 데이터가 포함되는 경우, 서비스 제공부(20)는 과거 외부 데이터와 동일한 타입의 대상 외부 데이터가 대상 입력 데이터에 포함되어야 하는 것으로 판단할 수 있다. 이 때, 서비스 제공부(20)는 대상 서비스의 목적에서 추출된 키워드에 기초하여 과거 외부 데이터 중 대상 입력 데이터에 포함된 대상 외부 데이터로 사용할 과거 외부 데이터 A 및 대상 외부 데이터로 사용하지 못하는 과거 외부 데이터 B가 존재하는지 여부를 판단할 수 있다. 여기서, 과거 외부 데이터 A는 대상 서비스의 목적에서 추출된 키워드와 대응되는 과거 외부 데이터일 수 있고, 과거 외부 데이터 B는 대상 서비스의 목적에서 추출된 키워드와 대응되지 않는 과거 외부 데이터일 수 있다.

과거 외부 데이터에 과거 외부 데이터 A가 존재하는 것으로 판단된 경우, 서비스 제공부(20)는 사용자 입력부(10)로의 대상 서비스의 입력 시점과 과거 외부 데이터 A의 최근 업데이트 시점 간의 제1 시간 간격이 미리 설정된 임계 시간 간격보다 작은지 여부를 판단할 수 있다.

이 때, 임계 시간 간격은 대상 기업의 업무 분야의 급변성을 고려하여 설정될 수 있다. 일례로, 트렌드가 빠르게 변화하는 업무 분야(사업, 프로젝트 등)는 트렌드가 빠르게 변화하지 않는 업무 분야보다 임계 시간 간격이 더 작을 수 있다.

만약, 과거 외부 데이터 A가 존재하고, 제1 시간 간격이 임계 시간 간격보다 작은 경우, 과거 외부 데이터 A가 업데이트되지 않아도 무방하므로, 서비스 제공부(20)는 과거 외부 데이터 A를 그대로 대상 외부 데이터로 사용할 수 있다.

반대로, 과거 외부 데이터 A가 존재하고, 제1 시간 간격이 임계 시간 간격보다 크거나 같은 경우, 서비스 제공부(20)는 과거 외부 데이터 A의 최근 업데이트 시점부터 대상 서비스의 입력 시점의 기간 동안 생성된 추가 외부 데이터를 수집 및 저장하여 과거 외부 데이터 A를 업데이트할 수 있고, 업데이트된 과거 외부 데이터 A를 대상 외부 데이터로 사용할 수 있다.

한편, 과거 외부 데이터에 과거 외부 데이터 B가 존재하는 것으로 판단된 경우, 서비스 제공부(20)는 대상 서비스의 입력 시점의 이전에 생성된 신규 외부 데이터를 수집 및 저장하고, 저장된 신규 외부 데이터를 대상 외부 데이터로 사용할 수 있다. 즉, 서비스 제공부(20)는 과거 외부 데이터 B를 대신하여 신규 외부 데이터를 수집 및 저장하여 대상 외부 데이터로 사용할 수 있다.

단계(S7) 및 단계(S8)를 통해 대상 입력 데이터의 저장이 완료된 경우, 단계(S12)가 수행될 수 있다. 단계(S12)의 설명은 후술한다.

한편, 대상 서비스의 목적과 제1 과거 서비스의 목적 간의 목적 유사도가 제2 임계치를 초과하지 않은 경우, 단계(S11)에서, 서비스 제공부(20)는 신규 데이터를 수집 "G 저장하여 대상 입력 데이터의 저장을 완료할 수 있다. 단계(S11)가 수행된 후 단계(S12)가 수행되며, 단계(S12)의 설명은 후술한다.

구체적으로, 상술한 바와 같이, 대상 학습 인공지능 모델은 제1 과거 학습 인공지능 모델과 동일하게 설정되므로, 제1 과거 학습 인공지능 모델에 입력되는 제1 과거 입력 데이터는 대상 학습 인공지능 모델에 입력되는 대상 입력 데이터와 동일할 수 있다.

따라서, 제1 과거 입력 데이터에 과거 내부 데이터가 포함되면, 대상 입력 데이터는 대상 내부 데이터를 포함할 수 있다. 즉, 단계(S11)에서, 서비스 제공부(20)는 과거 내부 데이터를 대신하여 대상 내부 데이터를 수집 및 저장할 수 있다. 이 경우, 단계(S11)에서 수행되는 "대상 내부 데이터를 수집 및 저장"하는 과정은 앞서 설명한 단계(S7) 및 단계(S8)의 "대상 내부 데이터의 수집 및 저장"하는 과정과 동일하므로, 상세한 설명은 생략한다.

더불어, 제1 과거 입력 데이터에 과거 외부 데이터가 포함되면, 대상 입력 데이터는 대상 외부 데이터를 포함할 수 있다. 즉, 단계(S11)에서, 서비스 제공부(20)는 대상 외부 데이터를 수집 및 저장할 수 있다. 이 때, 대상 서비스의 목적과 제1 과거 서비스의 목적 간의 목적 유사도는 제2 임계치를 초과하지 않으므로, 단계(S11)에서 수행되는 "대상 외부 데이터를 수집 및 저장"하는 과정은 앞서 설명한 단계(S7) 및 단계(S8)의 "과거 외부 데이터 B를 대신하여 신규 외부 데이터를 수집 및 저장하여 대상 외부 데이터로 사용"하는 과정과 동일할 수 있다. 이하, 중복되는 설명은 생략한다.

한편, 단계(S3)에서 제1 임계치를 초과하는 목적 유사도를 가지는 과거 서비스의 목적이 존재하지 않는 것으로 판단된 경우, 단계(S9)에서, 서비스 제공부(20)는 대상 서비스의 목적에서 추출된 대상 키워드를 이용하여 하나 이상의 후보 학습 인공지능 모델을 대상 서비스 제공자에게 추천할 수 있다. 즉, 복수의 과거 서비스의 목적 모두는 대상 서비스의 목적과 관련성이 없으므로, 서비스 제공부(20)는 대상 서비스의 제공을 위해, 대상 키워드를 이용하여 새로운 학습 인공지능 모델로 사용될 하나 이상의 후보 학습 인공지능 모델을 대상 서비스 제공자에게 추천할 수 있다.

이 후, 단계(S10)에서, 서비스 제공부(20)는 하나 이상의 후보 학습 인공지능 모델 중 대상 서비스 제공자가 선택한 후보 학습 인공지능 모델을 대상 학습 인공지능 모델로 선정할 수 있다.

그리고, 단계(S11)에서, 서비스 제공부(20)는 신규 데이터를 수집 "G 저장하여 대상 입력 데이터의 저장을 완료할 수 있다. 이 때, 대상 입력 데이터에 대상 내부 데이터 및/또는 대상 외부 데이터가 포함되었는지 여부는 대상 서비스 제공자에 의해 직접 판단될 수 있다. 한편, 대상 내부 데이터가 포함된 경우, 대상 입력 데이터 중 대상 내부 데이터의 저장 과정은 단계(S7) 및 단계(S8)의 "대상 내부 데이터의 수집 및 저장"하는 과정과 동일할 수 있다. 그리고, 대상 외부 데이터가 포함된 경우, 대상 외부 데이터의 저장 과정은 단계(S7) 및 단계(S8)의 "과거 외부 데이터 B를 대신하여 신규 외부 데이터를 수집 및 저장하여 대상 외부 데이터로 사용"하는 과정과 동일할 수 있다. 이하, 중복되는 설명은 생략한다.

단계(S1) 내지 단계(S11)를 통해 대상 학습 인공지능 모델이 선정되고, 대상 입력 데이터의 저장이 완료된 경우, 서비스 제공부(20)는, 단계(S12)에서 저장된 대상 입력 데이터를 대상 학습 인공지능 모델에 입력하여 인공지능 모델 출력값을 도출할 수 있고, 단계(S13)에서 인공지능 모델 출력값과 대응되는 대상 서비스를 사용자 단말기로 제공할 수 있다. 이에 따라, 사용자는 대상 서비스를 제공받을 수 있다.

또한, 본 발명의 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 일 실시예들의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 청구범위뿐 아니라 청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.

Claims

클라우드 환경에서 구현되는 빅데이터 및 인공지능 기반의 서비스 제공 시스템에 있어서,
사용자가 요구하는 대상 서비스의 목적 및 상기 대상 서비스를 제공받기 위해 필요한 필수 정보를 사용자 단말기로부터 입력받는 사용자 입력부; 및
빅데이터 모듈 및 인공지능 모듈이 서로 연동되어 동작하여 상기 대상 서비스를 제공하는 서비스 제공부;를 포함하되,
상기 빅데이터 모듈은 데이터를 수집, 저장, 처리 및 분석 중 적어도 하나가 수행된 빅데이터를 상기 인공지능 모듈로 전달하고, 상기 인공지능 모듈은 상기 빅데이터에 기초하여 학습 및 추론을 수행하고,
상기 인공지능 모듈은 상기 빅데이터 모듈의 상기 수집, 저장, 처리 및 분석 중 적어도 하나와 관련된 인공지능 모델을 상기 빅데이터 모듈로 전달하여 상기 수집, 저장, 처리 및 분석 중 적어도 하나를 수행하며,
상기 빅데이터 모듈은, 내부 및 외부 데이터를 포함하는 상기 데이터를 수집하는 빅데이터 수집 수단과, 상기 수집된 데이터를 전처리 및 후처리하고, 상기 수집된 데이터, 상기 전처리 및 후처리된 데이터를 복수의 키워드 별로 분류하여 저장하는 빅데이터 저장 수단과, 상기 빅데이터 저장 수단에 저장된 데이터를 일괄 처리 및 실시간 처리하는 빅데이터 처리 수단과, 상기 빅데이터 처리 수단에서 처리된 데이터를 분석하는 빅데이터 분석 수단을 포함하고,
상기 인공지능 모듈은, 복수의 학습 인공지능 모델을 저장하고, 복수의 과거 서비스 별 히스토리 정보를 더 저장하되, 상기 과거 서비스는 과거 사용자에게 이미 제공되었던 서비스이고, 상기 히스토리 정보는 상기 과거 서비스의 목적, 상기 과거 서비스의 제공을 위한 과거 학습 인공지능 모델 및 상기 과거 학습 인공지능 모델에 입력되었던 과거 입력 데이터 간의 매칭 정보이며,
상기 서비스 제공부는,
구분 분석을 통한 키워드 추출을 기반으로 상기 대상 서비스의 목적과 상기 복수의 과거 서비스의 목적 간의 목적 유사도를 산출하고,
미리 설정된 제1 임계치를 초과하는 목적 유사도를 가지는 상기 과거 서비스의 목적이 하나 이상 존재하는 경우, 상기 하나 이상의 과거 서비스의 목적 중 최대 목적 유사도를 가지는 제1 과거 서비스의 목적을 선택하고, 상기 제1 과거 서비스의 목적과 매칭된 제1 과거 학습 인공지능 모델을 상기 대상 서비스의 제공을 위한 대상 학습 인공지능 모델로 선정하고,
상기 대상 서비스의 목적과 상기 제1 과거 서비스의 목적 간의 목적 유사도가 상기 제1 임계치보다 큰 제2 임계치를 초과하는 경우, 상기 제1 과거 학습 인공지능 모델에 입력되었던 제1 과거 입력 데이터 중 적어도 일부를 상기 대상 학습 인공지능 모델의 대상 입력 데이터의 적어도 일부로 사용하고,
상기 제1 임계치를 초과하는 목적 유사도를 가지는 상기 과거 서비스의 목적이 존재하지 않는 경우, 상기 대상 서비스의 목적에서 추출된 키워드를 이용하여 하나 이상의 후보 학습 인공지능 모델을 상기 대상 서비스의 제공자에게 추천하여 상기 하나 이상의 후보 학습 인공지능 모델 중 어느 하나를 상기 대상 학습 인공지능 모델로 선정하되,
상기 목적 유사도가 상기 제2 임계치를 초과하는 상황에서, 상기 서비스 제공부는,
상기 제1 과거 입력 데이터에 과거 내부 데이터가 포함되는 경우, 상기 필수 정보에 포함된 상기 사용자의 내부 데이터 접근 권한에 기초하여 상기 사용자에 대한 대상 내부 데이터를 수집 및 저장하고, 상기 저장된 대상 내부 데이터를 상기 대상 입력 데이터로 사용하되,
상기 과거 내부 데이터에 과거 IoT 센싱 데이터가 포함된 경우, 상기 필수 정보 중 IoT 센서 설치 정보에 기초하여 상기 과거 IoT 센싱 데이터를 생성하는 제1 IoT 센서가 상기 사용자의 업무 공간에 설치되었는지를 판단하고,
상기 제1 IoT 센서가 상기 사용자의 업무 공간에 설치된 경우, 상기 제1 IoT 센서로부터 상기 대상 내부 데이터에 포함된 대상 IoT 센싱 데이터를 수집 및 저장하고,
상기 제1 IoT 센서가 상기 사용자의 업무 공간에 설치되어 있지 않는 경우, 상기 필수 정보 중 상기 사용자의 업무 공간의 블루프린트 정보 및 상기 과거 IoT 센싱 데이터에 기초하여 상기 제1 IoT 센서의 타입 및 상기 사용자의 업무 공간에서의 상기 제1 IoT 센서의 설치 위치를 포함하는 센서 설치 요청 정보를 상기 사용자 단말기로 전송하고, 상기 사용자 단말기로부터 센서 설치 완료 정보를 수신하며, 상기 센서 설치 완료 정보에 따라 상기 대상 IoT 센싱 데이터를 수집 및 저장하고,
상기 제1 과거 입력 데이터에 과거 외부 데이터가 포함되는 경우, 상기 대상 서비스의 목적에서 추출된 키워드에 기초하여 상기 과거 외부 데이터 중 상기 대상 입력 데이터에 포함된 대상 외부 데이터로 사용할 과거 외부 데이터 A 및 상기 대상 외부 데이터로 사용하지 못하는 과거 외부 데이터 B가 존재하는지 여부를 판단하고,
상기 과거 외부 데이터 A가 존재하고, 상기 사용자 입력부로의 상기 대상 서비스의 입력 시점과 상기 과거 외부 데이터 A의 최근 업데이트 시점 간의 제1 시간 간격이 미리 설정된 임계 시간 간격보다 작은 경우, 상기 과거 외부 데이터 A를 상기 대상 외부 데이터로 사용하고,
상기 과거 외부 데이터 A가 존재하고, 상기 제1 시간 간격이 상기 임계 시간 간격보다 크거나 같은 경우, 상기 최근 업데이트 시점부터 상기 대상 서비스의 입력 시점의 기간 동안 생성된 추가 외부 데이터를 수집 및 저장하여 상기 과거 외부 데이터 A를 업데이트하고, 상기 업데이트된 과거 외부 데이터 A를 상기 대상 외부 데이터로 사용하고,
상기 과거 외부 데이터 B가 존재하는 경우, 상기 대상 서비스의 입력 시점의 이전에 생성된 신규 외부 데이터를 수집 및 저장하고, 상기 저장된 신규 외부 데이터를 상기 대상 외부 데이터로 사용하되,
상기 임계 시간 간격은 상기 사용자의 업무 분야의 급변성을 고려하여 설정되는,
빅데이터 및 인공지능 기반의 서비스 제공 시스템.
삭제
삭제