KR20160070218A - 데이터 분석 서비스 추천 시스템 및 방법 - Google Patents

데이터 분석 서비스 추천 시스템 및 방법 Download PDF

Info

Publication number
KR20160070218A
KR20160070218A KR1020140175650A KR20140175650A KR20160070218A KR 20160070218 A KR20160070218 A KR 20160070218A KR 1020140175650 A KR1020140175650 A KR 1020140175650A KR 20140175650 A KR20140175650 A KR 20140175650A KR 20160070218 A KR20160070218 A KR 20160070218A
Authority
KR
South Korea
Prior art keywords
analysis
information
data
user
algorithm
Prior art date
Application number
KR1020140175650A
Other languages
English (en)
Inventor
구태연
원희선
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020140175650A priority Critical patent/KR20160070218A/ko
Priority to US14/861,162 priority patent/US20160162818A1/en
Publication of KR20160070218A publication Critical patent/KR20160070218A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

데이터 분석 서비스 추천 시스템 및 방법이 개시된다. 데이터 분석 서비스 추천 시스템은 분석 서비스들의 목록을 저장하는 서비스 카다로그(Service Catalog), 분석 대상이 되는 데이터들의 목록을 저장하는 데이터 카다로그(Data Catalog), 분석 알고리즘들의 목록을 저장하는 알고리즘 카다로그(Algorithm Catalog), 단어 또는 문장형태로 사용자 요구사항을 입력받는 상호 분석툴(Interactive Analytic Tool), 사용자 요구사항을 전달받아 사용자 요구사항에 상응하는 분석 서비스를 서비스 카다로그에서 추출하는 분석 헬퍼(Analysis Helper), 사용자 요구사항을 전달받아 데이터 카다로그 및 알고리즘 카다로그에서 사용자 요구사항에 상응하는 데이터 및 분석 알고리즘을 추출하고, 추출한 데이터 및 분석 알고리즘을 하나의 작업(Job)으로 정의하여 작업을 생성하는 분석작업 생성기(Analysis Job Generator)를 포함하되, 분석작업 생성기는 생성한 작업을 상기 분석 헬퍼로 전달함으로써, 상호 분석툴을 통해 작업이 사용자에게 추천 분석 서비스 정보로 전달되게 한다.

Description

데이터 분석 서비스 추천 시스템 및 방법{System and method for recommending data analysis services}
본 발명은 데이터 분석 서비스를 추천하는 시스템 및 방법에 관한 것이다.
빅데이터를 이용한 분석 시장은 데이터 소유자가 제공하는 데이터 마켓과 이를 분석하기 위한 분석 알고리즘 마켓으로 이원화되어 있다. 상업적 또는 학문적 목적으로 빅데이터 분석이 수행되기 위해서는, 데이터 소유자와 데이터로부터 분석 결과를 도출하기 위한 분석 알고리즘을 소유한 자가 연결되어야 한다. 하지만, 데이터 소유자와 분석 알고리즘 소유자를 연결해 줄 수 있는 장치의 부재로, 분석가는 자신의 분석 알고리즘을 활용할 데이터가 부족한 상황이고, 데이터 소유자는 자신의 데이터를 효율적으로 활용을 못하고 있는 상황이다.
최근, 하둡을 기반으로 한 빅데이터 플랫폼 분야의 발전으로 인하여, 데이터 마켓, 분석 알고리즘 마켓 등이 가시화 되고 있다. 이를 통해, 많은 빅데이터 플랫폼 기술들은 데이터와 분석 알고리즘간의 연동을 시도하고 있으나, 이를 위한 정형화된 방법의 부재로 가시화 되지 않고 있다.
개인, 기업, 공공 기관이 가지는 있는 데이터들은 현재 시스템적, 제도적으로 개인 정보 보호라는 명목으로 잘 활용되지 못하고 있다. 또한, 기술적으로는, 많은 데이터 분석 알고리즘과 기법들이 등장하고 있으나, 이런 기술들을 활용할 수 있는 데이터 소유자는 이러한 기술들을 이용하기 위하여 너무 난해한 분석 방법을 숙지해야 하거나, 자신이 가진 데이터의 활용도를 모르는 경우가 많아, 가치있는 데이터들이 사라지고 있는 실정이다. 이를 해결하기 위해서, 빅데이터 플랫폼 기술이 발전하고 있고, 이를 활용하기 위한 다양한 방법들이 제시되고 있지만, 고급 사용자들을 위한 기술들만 나와 있는 실정이다.
본 발명은 하나의 분석 작업을 위하여 사용자의 요구사항에 해당하는 데이터와 이를 분석할 수 있는 분석 알고리즘을 추천해 주고, 추천된 다수의 분석 서비스 중 사용자의 선택한 분석 서비스가 자동으로 빅데이터 플랫폼에서 수행되게 하는 데이터 분석 서비스 추천 시스템 및 방법을 제안하는 것이다.
본 발명의 일 측면에 따르면, 데이터 분석 서비스 추천 시스템이 개시된다.
본 발명의 실시예에 따른 데이터 분석 서비스 추천 시스템은 분석 서비스들의 목록을 저장하는 서비스 카다로그(Service Catalog), 분석 대상이 되는 데이터들의 목록을 저장하는 데이터 카다로그(Data Catalog), 분석 알고리즘들의 목록을 저장하는 알고리즘 카다로그(Algorithm Catalog), 단어 또는 문장형태로 사용자 요구사항을 입력받는 상호 분석툴(Interactive Analytic Tool), 상기 사용자 요구사항을 전달받아 상기 사용자 요구사항에 상응하는 분석 서비스를 상기 서비스 카다로그에서 추출하는 분석 헬퍼(Analysis Helper), 상기 사용자 요구사항을 전달받아 상기 데이터 카다로그 및 상기 알고리즘 카다로그에서 상기 사용자 요구사항에 상응하는 데이터 및 분석 알고리즘을 추출하고, 상기 추출한 데이터 및 분석 알고리즘을 하나의 작업(Job)으로 정의하여 작업을 생성하는 분석작업 생성기(Analysis Job Generator)를 포함하되, 상기 분석작업 생성기는 상기 생성한 작업을 상기 분석 헬퍼로 전달함으로써, 상기 상호 분석툴을 통해 상기 작업이 사용자에게 추천 분석 서비스 정보로 전달되게 한다.
상기 상호 분석툴은 상기 입력받은 사용자 요구사항을 파싱하여 키워드 형태로 변환한다.
상기 분석 작업 생성기는 추출한 데이터의 형태 및 속성 정보와 상기 사용자 요구사항을 기반으로 상기 분석 알고리즘을 추출한다.
상기 분석 작업 생성기는 상기 데이터와 상기 분석 알고리즘을 연결하기 위한 입출력 변수 및 알고리즘 변수를 상기 정의한 작업에 포함시킨다.
상기 작업을 전달받아 분석 정보를 생성하는 워크플로우 생성기(Workflow Generator) 및 상기 분석 정보를 전달받아 축적하며, 상기 축적된 분석 정보를 이용하여 사용자 요구사항에 상응하는 워크플로우를 생성하고, 상기 생성한 워크플로우를 상기 분석 헬퍼로 전달함으로써, 상기 상호 분석툴을 통해 생성한 워크플로우가 추천 분석 서비스 정보로 사용자에게 전달되게 하는 룰 엔진(Rule Engine)을 더 포함한다.
상기 워크플로우 생성기는 상기 전달받은 작업 내에 포함된 데이터 및 분석 알고리즘에 대한 정보를 이용하여 해당하는 빅데이터 시스템 정보 및 키워드 형태의 사용자 요구사항을 포함하는 상기 분석 정보를 생성한다.
상기 룰 엔진은 상기 축적된 분석 정보를 워크플로우 생성에 필요한 기준지수로 등록하며, 축적한 분석 정보과 분석 정보들을 학습한 정보를 이용하여 현재 사용자 요구사항에 해당하는 워크플로우를 생성한다.
상기 추천 분석 서비스 정보 중 어느 하나를 사용자가 선택하면, 선택된 추천 분석 서비스가 빅데이터 플랫폼에서 분석 작업이 수행된다.
본 발명의 다른 측면에 따르면, 데이터 분석 서비스 추천 시스템에서 수행되는 데이터 분석 서비스 추천 방법이 개시된다.
본 발명의 실시예에 따른 데이터 분석 서비스 추천 방법은 단어 또는 문장형태로 사용자 요구사항을 입력받는 단계, 상기 사용자 요구사항을 전달받아 상기 사용자 요구사항에 상응하는 분석 서비스를 서비스 카다로그(Service Catalog)에서 추출하는 단계-상기 서비스 카다로그는 분석 서비스들의 목록을 저장함-, 상기 사용자 요구사항을 전달받아 데이터 카다로그 및 알고리즘 카다로그에서 상기 사용자 요구사항에 상응하는 데이터 및 분석 알고리즘을 추출하는 단계-상기 데이터 카다로그는 분석 대상이 되는 데이터들의 목록을 저장하고, 상기 알고리즘 카다로그는 분석 알고리즘들의 목록을 저장함-, 상기 추출한 데이터 및 분석 알고리즘을 하나의 작업(Job)으로 정의하여 작업을 생성하는 단계 및 상기 생성한 작업을 사용자에게 추천 분석 서비스 정보로 전달하는 단계를 포함한다.
상기 사용자 요구사항을 입력받는 단계는, 상기 입력받은 사용자 요구사항을 파싱하여 키워드 형태로 변환한다.
상기 사용자 요구사항에 상응하는 데이터 및 분석 알고리즘을 추출하는 단계는, 추출한 데이터의 형태 및 속성 정보와 상기 사용자 요구사항을 기반으로 상기 분석 알고리즘을 추출한다.
상기 작업을 생성하는 단계는, 상기 데이터와 상기 분석 알고리즘을 연결하기 위한 입출력 변수 및 알고리즘 변수를 상기 정의한 작업에 포함시킨다.
상기 작업을 전달받아 분석 정보를 생성하는 단계, 상기 분석 정보를 전달받아 축적하는 단계, 상기 축적된 분석 정보를 이용하여 사용자 요구사항에 상응하는 워크플로우를 생성하는 단계 및 상기 생성한 워크플로우를 추천 분석 서비스 정보로 사용자에게 전달하는 단계를 더 포함한다.
상기 분석 정보를 생성하는 단계는, 상기 전달받은 작업 내에 포함된 데이터 및 분석 알고리즘에 대한 정보를 이용하여 해당하는 빅데이터 시스템 정보 및 키워드 형태의 사용자 요구사항을 포함하는 상기 분석 정보를 생성한다.
상기 워크플로우를 생성하는 단계는, 상기 축적된 분석 정보를 워크플로우 생성에 필요한 기준지수로 등록하며, 축적한 분석 정보과 분석 정보들을 학습한 정보를 이용하여 현재 사용자 요구사항에 해당하는 워크플로우를 생성한다.
본 발명은 하나의 분석 작업을 위하여 사용자의 요구사항에 해당하는 데이터와 이를 분석할 수 있는 분석 알고리즘을 추천해 주고, 추천된 다수의 분석 서비스 중 사용자의 선택한 분석 서비스가 자동으로 빅데이터 플랫폼에서 수행되게 할 수 있다.
도 1은 데이터 분석 서비스 추천 시스템의 구성을 개략적으로 예시한 도면.
도 2는 데이터 분석 서비스 추천 방법을 나타낸 흐름도.
도 3은 도 2의 데이터 분석 서비스 추천 방법을 설명하기 위한 도면.
도 4는 추천 분석 서비스의 선택에 따른 분석 서비스 제공 방법을 나타낸 도면.
도 5는 로그 분석 시스템의 구성을 예시한 도면.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 이를 상세한 설명을 통해 상세히 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 본 명세서의 설명 과정에서 이용되는 숫자는 하나의 구성요소를 다른 구성요소와 구분하기 위한 식별기호에 불과하다.
또한, 본 명세서에서, 일 구성요소가 다른 구성요소와 "연결된다" 거나 "접속된다" 등으로 언급된 때에는, 상기 일 구성요소가 상기 다른 구성요소와 직접 연결되거나 또는 직접 접속될 수도 있지만, 특별히 반대되는 기재가 존재하지 않는 이상, 중간에 또 다른 구성요소를 매개하여 연결되거나 또는 접속될 수도 있다고 이해되어야 할 것이다.
이하, 본 발명의 실시예를 첨부한 도면들을 참조하여 상세히 설명하기로 한다. 본 발명을 설명함에 있어 전체적인 이해를 용이하게 하기 위하여 도면 번호에 상관없이 동일한 수단에 대해서는 동일한 참조 번호를 사용하기로 한다.
도 1은 데이터 분석 서비스 추천 시스템의 구성을 개략적으로 예시한 도면이다.
도 1을 참조하면, 데이터 분석 서비스 추천 시스템은 포털(Portal)(110), 툴킷(Toolkit)(120) 및 프레임워크(Framework)(130)를 포함하는 계층 구조를 가진다.
포털(110)은 사용자가 자신의 요구사항에 따라 메뉴를 선택하도록 사용자에게 보여지는 구성으로, 상호 분석툴(Interactive Analytic Tool)(111), 서비스 카다로그(Service Catalog)(112), 데이터 카다로그(Data Catalog)(113), 알고리즘 카다로그(Algorithm Catalog)(114), 계정 관리자(Account Manager)(115) 및 비쥬얼라이저(Visualizer)(116)를 포함한다.
툴킷(120)은 분석 헬퍼(Analysis Helper)(121), 분석작업 생성기(Analysis Job Generator)(122), 워크플로우 생성기(Workflow Generator)(123) 및 알고리즘 관리자(Algorithm Manager)(124)를 포함한다.
프레임워크(130)는 분석 워크플로우(Analytics Workflow)(131), 워크플로우 스케줄러(Workflow Scheduler)(132), 플랫폼 인터페이스(Platform Interface)(133) 및 룰 엔진(Rule Engine)(134)를 포함한다.
상호 분석툴(111)은 단어 또는 문장형태로 사용자의 요구사항을 입력받고, 입력받은 사용자의 요구사항을 파싱하여 키워드 형태로 변환한다. 사용자는 자신의 요구사항을 상호 분석툴(111)을 이용하여 반영할 수 있다. 상호 분석툴(111)은 키워드 형태의 사용자 요구사항을 분석 헬퍼(121)로 전달한다. 그리고, 상호 분석툴(111)은 사용자에 전달되는 정보를 출력한다.
서비스 카다로그(112)는 분석 서비스들의 목록을 저장한다. 예를 들어, 서비스 카다로그(112)는 분석 서비스 목록에 따른 분석 서비스 정보들을 저장한 별도의 데이터베이스와 연동할 수 있다.
데이터 카다로그(113)는 분석 대상이 되는 데이터들의 목록을 저장한다.
알고리즘 카다로그(114)는 분석 알고리즘들의 목록을 저장한다.
예를 들어, 데이터 카다로그(113) 및 알고리즘 카다로그(114)는 빅데이터 플랫폼에서 제공되는 데이터들의 목록 및 분석 알고리즘들의 목록을 저장할 수 있으며, 각 목록에 따른 데이터들 및 분석 알고리즘들을 저장하는 별도의 데이터베이스와 연동할 수 있다.
계정 관리자(115)는 사용자의 계정을 생성 및 관리한다.
비쥬얼라이저(116)는 상호 분석툴(111), 서비스 카다로그(112), 데이터 카다로그(113), 알고리즘 카다로그(114), 계정 관리자(115)가 제공하는 기능이 메뉴로 표시되도록 시각화하거나, 사용자에게 전달되는 정보들을 시각화한다.
분석 헬퍼(121)는 상호 분석툴(111)로부터 전달받은 사용자 요구사항에 상응하는 분석 서비스를 서비스 카다로그(112)에서 추출한다. 그리고, 분석 헬퍼(121)는 키워드 형태의 사용자 요구사항을 분석 작업 생성기(122)로 전달한다.
분석 작업 생성기(122)는 분석 헬퍼(121)로부터 전달받은 키워드 형태의 사용자 요구사항을 이용하여 데이터 카다로그(113) 및 알고리즘 카다로그(114)에서 사용자 요구사항에 상응하는 데이터 및 분석 알고리즘을 추출한다. 예를 들어, 분석 작업 생성기(122)는 데이터 카다로그(113) 및 알고리즘 카다로그(114)에 저장된 데이터 목록 및 분석 알고리즘 목록을 분석하여 사용자 요구사항에 상응하는 데이터와 해당 데이터를 분석할 수 있는 분석 방법(즉, 분석 알고리즘)을 추출할 수 있다. 즉, 분석 작업 생성기(122)는 추출한 데이터의 형태 및 속성 정보와 사용자 요구사항을 기반으로 데이터를 분석할 수 있는 분석 알고리즘을 추출할 수 있다.
이어, 분석 작업 생성기(122)는 추출한 데이터 및 분석 알고리즘을 하나의 작업(Job)으로 정의하고, 정의한 작업에 데이터와 분석 알고리즘을 연결하기 위한 입출력 변수 및 알고리즘 변수를 포함시킨다. 이렇게 생성된 작업은 분석 헬퍼(121)로 전달되며, 상호 분석툴(111)을 통해 사용자에게 추천 분석 서비스 정보로 전달될 수 있다.
그리고, 분석 작업 생성기(122)는 좀더 고도화된 분석 서비스 제공을 위하여, 생성한 작업을 워크플로우 생성기(123)로 전달한다.
워크플로우 생성기(123)는 전달받은 작업을 이용하여 분석 정보를 생성하고, 생성한 분석 정보를 룰 엔진(134)으로 전달한다. 예를 들어, 워크플로우 생성기(123)는 전달된 작업 내에 포함된 데이터 및 분석 알고리즘에 대한 정보와 워크플로우 스케줄러(132)를 이용하여 해당 빅데이터 시스템 정보 및 키워드 형태의 사용자 요구사항을 포함하는 분석 정보를 생성할 수 있다.
알고리즘 관리자(124)는 분석 알고리즘들을 저장한 별도의 데이터베이스와 연동하며, 저장된 분석 알고리즘을 관리한다.
분석 워크플로우(131)는 한 개이상의 작업으로 구성된 분석 프로세스의 묶음이다. 예를 들어, 분석 작업 생성기(122)를 통해 생성된 여러 개의 작업이 최소 단위로 묶여서 사용자가 원하는 분석이 처리될 수 있다. 여기서, 작업들간의 관계를 결정하고, 현재 분석 작업이 어디까지 진행되고 있는지를 관리 감독하거나 수정하는 역할을 수행하는 것이 워크플로우 생성기(123)이다.
워크플로우 스케줄러(132)는 빅데이터 플랫폼과 워크플로우 생성기(123)를 통해 결정된 워크플로우를 직접 스케줄링하고 관라하는 역할을 수행한다.
플랫폼 인터페이스(133)는 빅데이터 플랫폼과 데이터 분석 서비스 추천 시스템을 연결하는 인터페이스이다.
룰 엔진(134)은 워크플로우 생성기(123)로부터 분석 정보를 전달받아 축적하며, 축적된 분석 정보를 이용하여 사용자 요구사항에 상응하는 워크플로우를 생성한다. 예를 들어, 룰 엔진(134)은 축적된 분석 정보들을 워크플로우 생성에 필요한 기준지수로 등록하며, 축적한 분석 정보들과 분석 정보들을 학습한 정보를 이용하여 현재 사용자 요구사항에 해당하는 워크플로우를 생성할 수 있다.
그리고, 룰 엔진(134)은 생성한 워크플로우를 분석 헬퍼(121)로 전달하고, 분석 헬퍼(121)는 전달받은 워크플로우를 상호 분석 툴(111)로 전달함으로써, 워크플로우가 추천 분석 서비스 정보로 사용자에게 전달될 수 있다.
도 2는 데이터 분석 서비스 추천 방법을 나타낸 흐름도이고, 도 3은 도 2의 데이터 분석 서비스 추천 방법을 설명하기 위한 도면이다. 데이터 분석 서비스 추천 방법의 각 단계의 수행에 따른 구성부간 데이터 흐름이 도 3에서 확인될 수 있다.
S210 단계에서, 상호 분석툴(111)은 단어 또는 문장형태로 사용자의 요구사항을 입력받는다. 그리고, 상호 분석툴(111)은 입력받은 사용자의 요구사항을 파싱하여 키워드 형태로 변환한 후, 키워드 형태의 사용자 요구사항을 분석 헬퍼(121)로 전달한다.
S220 단계에서, 분석 헬퍼(121)는 상호 분석툴(111)로부터 전달받은 사용자 요구사항에 상응하는 분석 서비스를 서비스 카다로그(112)에서 추출한다. 그리고, 분석 헬퍼(121)는 키워드 형태의 사용자 요구사항을 분석 작업 생성기(122)로 전달한다.
S230 단계에서, 분석 작업 생성기(122)는 분석 헬퍼(121)로부터 전달받은 키워드 형태의 사용자 요구사항을 이용하여 데이터 카다로그(113) 및 알고리즘 카다로그(114)에서 사용자 요구사항에 상응하는 데이터 및 분석 알고리즘을 추출한다.
S240 단계에서, 분석 작업 생성기(122)는 추출한 데이터 및 분석 알고리즘을 하나의 작업(Job)으로 정의하고, 정의한 작업에 데이터와 분석 알고리즘을 연결하기 위한 입출력 변수 및 알고리즘 변수를 포함시킴으로써, 작업을 생성한다.
S250 단계에서, 분석 작업 생성기(122)는 생성한 작업을 분석 헬퍼(121)로 전달함으로써, 상호 분석툴(111)을 통해 작업을 사용자에게 추천 분석 서비스 정보로 전달한다. 그리고, 분석 작업 생성기(122)는 좀더 고도화된 분석 서비스 제공을 위하여, 생성한 작업을 워크플로우 생성기(123)로 전달한다.
S260 단계에서, 워크플로우 생성기(123)는 전달받은 작업을 이용하여 분석 정보를 생성하고, 생성한 분석 정보를 룰 엔진(134)으로 전달함으로써, 룰 엔진(134)이 분석 정보를 축적하게 한다.
S270 단계에서, 룰 엔진(134)은 축적된 분석 정보를 이용하여 사용자 요구사항에 상응하는 워크플로우를 생성한다. 그리고, 룰 엔진(134)은 생성한 워크플로우를 분석 헬퍼(121)로 전달하고, 분석 헬퍼(121)는 전달받은 워크플로우를 상호 분석 툴(111)로 전달함으로써, 워크플로우가 추천 분석 서비스 정보로 사용자에게 전달될 수 있다.
도 4는 추천 분석 서비스의 선택에 따른 분석 서비스 제공 방법을 나타낸 도면이다.
도 4를 참조하면, 1단계로, 사용자 의도 분석을 통해 서비스 카다로그(112)를 이용하여 분석 서비스가 추천되고, 2단계로, 분석 작업 생성기(122)를 통해 분석 알고리즘 및 데이터 쌍의 작업이 추천되고, 3단계로, 워크플로우 생성기(123)를 통해 작업들간의 관계 정의를 통한 정확한 분석 서비스 추천이 제공된다.
이와 같은 데이터 분석 서비스 추천 시스템을 적용한 시스템을 도 5에서 확인할 수 있다. 도 5는 로그 분석 시스템의 구성을 예시한 도면이다.
한편, 본 발명의 실시예에 따른 데이터 분석 서비스 추천 방법은 다양한 전자적으로 정보를 처리하는 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 저장 매체에 기록될 수 있다. 저장 매체는 프로그램 명령, 데이터 파일, 데이터 구조등을 단독으로 또는 조합하여 포함할 수 있다.
저장 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 소프트웨어 분야 당업자에게 공지되어 사용 가능한 것일 수도 있다. 저장 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media) 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 또한 상술한 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 전자적으로 정보를 처리하는 장치, 예를 들어, 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
110: 포털(Portal)
111: 상호 분석툴(Interactive Analytic Tool)
112: 서비스 카다로그(Service Catalog)
113: 데이터 카다로그(Data Catalog)
114: 알고리즘 카다로그(Algorithm Catalog)
115: 계정 관리자(Account Manager)
116: 비쥬얼라이저(Visualizer)
120: 툴킷(Toolkit)
121: 분석 헬퍼(Analysis Helper)
122: 분석작업 생성기(Analysis Job Generator)
123: 워크플로우 생성기(Workflow Generator)
124: 알고리즘 관리자(Algorithm Manager)
130: 프레임워크(Framework)
131: 분석 워크플로우(Analytics Workflow)
132: 워크플로우 스케줄러(Workflow Scheduler)
133: 플랫폼 인터페이스(Platform Interface)
134: 룰 엔진(Rule Engine)

Claims (15)

  1. 분석 서비스들의 목록을 저장하는 서비스 카다로그(Service Catalog);
    분석 대상이 되는 데이터들의 목록을 저장하는 데이터 카다로그(Data Catalog);
    분석 알고리즘들의 목록을 저장하는 알고리즘 카다로그(Algorithm Catalog);
    단어 또는 문장형태로 사용자 요구사항을 입력받는 상호 분석툴(Interactive Analytic Tool);
    상기 사용자 요구사항을 전달받아 상기 사용자 요구사항에 상응하는 분석 서비스를 상기 서비스 카다로그에서 추출하는 분석 헬퍼(Analysis Helper);
    상기 사용자 요구사항을 전달받아 상기 데이터 카다로그 및 상기 알고리즘 카다로그에서 상기 사용자 요구사항에 상응하는 데이터 및 분석 알고리즘을 추출하고, 상기 추출한 데이터 및 분석 알고리즘을 하나의 작업(Job)으로 정의하여 작업을 생성하는 분석작업 생성기(Analysis Job Generator)를 포함하되,
    상기 분석작업 생성기는 상기 생성한 작업을 상기 분석 헬퍼로 전달함으로써, 상기 상호 분석툴을 통해 상기 작업이 사용자에게 추천 분석 서비스 정보로 전달되게 하는 것을 특징으로 하는 데이터 분석 서비스 추천 시스템.
  2. 제1항에 있어서,
    상기 상호 분석툴은 상기 입력받은 사용자 요구사항을 파싱하여 키워드 형태로 변환하는 것을 특징으로 하는 데이터 분석 서비스 추천 시스템.
  3. 제1항에 있어서,
    상기 분석 작업 생성기는 추출한 데이터의 형태 및 속성 정보와 상기 사용자 요구사항을 기반으로 상기 분석 알고리즘을 추출하는 것을 특징으로 하는 데이터 분석 서비스 추천 시스템.
  4. 제1항에 있어서,
    상기 분석 작업 생성기는 상기 데이터와 상기 분석 알고리즘을 연결하기 위한 입출력 변수 및 알고리즘 변수를 상기 정의한 작업에 포함시키는 것을 특징으로 하는 데이터 분석 서비스 추천 시스템.
  5. 제1항에 있어서,
    상기 작업을 전달받아 분석 정보를 생성하는 워크플로우 생성기(Workflow Generator); 및
    상기 분석 정보를 전달받아 축적하며, 상기 축적된 분석 정보를 이용하여 사용자 요구사항에 상응하는 워크플로우를 생성하고, 상기 생성한 워크플로우를 상기 분석 헬퍼로 전달함으로써, 상기 상호 분석툴을 통해 생성한 워크플로우가 추천 분석 서비스 정보로 사용자에게 전달되게 하는 룰 엔진(Rule Engine)을 더 포함하는 데이터 분석 서비스 추천 시스템.
  6. 제5항에 있어서,
    상기 워크플로우 생성기는 상기 전달받은 작업 내에 포함된 데이터 및 분석 알고리즘에 대한 정보를 이용하여 해당하는 빅데이터 시스템 정보 및 키워드 형태의 사용자 요구사항을 포함하는 상기 분석 정보를 생성하는 것을 특징으로 하는 데이터 분석 서비스 추천 시스템.
  7. 제5항에 있어서,
    상기 룰 엔진은 상기 축적된 분석 정보를 워크플로우 생성에 필요한 기준지수로 등록하며, 축적한 분석 정보과 분석 정보들을 학습한 정보를 이용하여 현재 사용자 요구사항에 해당하는 워크플로우를 생성하는 것을 특징으로 하는 데이터 분석 서비스 추천 시스템.
  8. 제1항에 있어서,
    상기 추천 분석 서비스 정보 중 어느 하나를 사용자가 선택하면, 선택된 추천 분석 서비스가 빅데이터 플랫폼에서 분석 작업이 수행되는 것을 특징으로 하는 데이터 분석 서비스 추천 시스템.
  9. 데이터 분석 서비스 추천 시스템에서 수행되는 데이터 분석 서비스 추천 방법에 있어서,
    단어 또는 문장형태로 사용자 요구사항을 입력받는 단계;
    상기 사용자 요구사항을 전달받아 상기 사용자 요구사항에 상응하는 분석 서비스를 서비스 카다로그(Service Catalog)에서 추출하는 단계-상기 서비스 카다로그는 분석 서비스들의 목록을 저장함-;
    상기 사용자 요구사항을 전달받아 데이터 카다로그 및 알고리즘 카다로그에서 상기 사용자 요구사항에 상응하는 데이터 및 분석 알고리즘을 추출하는 단계-상기 데이터 카다로그는 분석 대상이 되는 데이터들의 목록을 저장하고, 상기 알고리즘 카다로그는 분석 알고리즘들의 목록을 저장함-;
    상기 추출한 데이터 및 분석 알고리즘을 하나의 작업(Job)으로 정의하여 작업을 생성하는 단계; 및
    상기 생성한 작업을 사용자에게 추천 분석 서비스 정보로 전달하는 단계를 포함하는 데이터 분석 서비스 추천 시스템.
  10. 제9항에 있어서,
    상기 사용자 요구사항을 입력받는 단계는,
    상기 입력받은 사용자 요구사항을 파싱하여 키워드 형태로 변환하는 것을 특징으로 하는 데이터 분석 서비스 추천 방법.
  11. 제9항에 있어서,
    상기 사용자 요구사항에 상응하는 데이터 및 분석 알고리즘을 추출하는 단계는,
    추출한 데이터의 형태 및 속성 정보와 상기 사용자 요구사항을 기반으로 상기 분석 알고리즘을 추출하는 것을 특징으로 하는 데이터 분석 서비스 추천 방법.
  12. 제9항에 있어서,
    상기 작업을 생성하는 단계는,
    상기 데이터와 상기 분석 알고리즘을 연결하기 위한 입출력 변수 및 알고리즘 변수를 상기 정의한 작업에 포함시키는 것을 특징으로 하는 데이터 분석 서비스 추천 방법.
  13. 제9항에 있어서,
    상기 작업을 전달받아 분석 정보를 생성하는 단계;
    상기 분석 정보를 전달받아 축적하는 단계;
    상기 축적된 분석 정보를 이용하여 사용자 요구사항에 상응하는 워크플로우를 생성하는 단계; 및
    상기 생성한 워크플로우를 추천 분석 서비스 정보로 사용자에게 전달하는 단계를 더 포함하는 데이터 분석 서비스 추천 방법.
  14. 제13항에 있어서,
    상기 분석 정보를 생성하는 단계는,
    상기 전달받은 작업 내에 포함된 데이터 및 분석 알고리즘에 대한 정보를 이용하여 해당하는 빅데이터 시스템 정보 및 키워드 형태의 사용자 요구사항을 포함하는 상기 분석 정보를 생성하는 것을 특징으로 하는 데이터 분석 서비스 추천 방법.
  15. 제13항에 있어서,
    상기 워크플로우를 생성하는 단계는,
    상기 축적된 분석 정보를 워크플로우 생성에 필요한 기준지수로 등록하며, 축적한 분석 정보과 분석 정보들을 학습한 정보를 이용하여 현재 사용자 요구사항에 해당하는 워크플로우를 생성하는 것을 특징으로 하는 데이터 분석 서비스 추천 방법.


KR1020140175650A 2014-12-09 2014-12-09 데이터 분석 서비스 추천 시스템 및 방법 KR20160070218A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020140175650A KR20160070218A (ko) 2014-12-09 2014-12-09 데이터 분석 서비스 추천 시스템 및 방법
US14/861,162 US20160162818A1 (en) 2014-12-09 2015-09-22 System and method for recommending data analysis services

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140175650A KR20160070218A (ko) 2014-12-09 2014-12-09 데이터 분석 서비스 추천 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20160070218A true KR20160070218A (ko) 2016-06-20

Family

ID=56094639

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140175650A KR20160070218A (ko) 2014-12-09 2014-12-09 데이터 분석 서비스 추천 시스템 및 방법

Country Status (2)

Country Link
US (1) US20160162818A1 (ko)
KR (1) KR20160070218A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022107995A1 (ko) * 2020-11-23 2022-05-27 (주)피씨엔 빅데이터 크로스 모델 데이터 통합 처리 방법 및 장치
KR102511977B1 (ko) 2022-12-19 2023-03-22 주식회사 비브라이트 식약처 공공데이터를 활용한 식제품 큐레이팅 서비스를 제공하는 방법 및 그 시스템
KR102589677B1 (ko) 2023-02-17 2023-10-17 주식회사 비브라이트 식약처 데이터에 기반하여 식제품 및 구성 비율을 추천하는 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022107995A1 (ko) * 2020-11-23 2022-05-27 (주)피씨엔 빅데이터 크로스 모델 데이터 통합 처리 방법 및 장치
KR102511977B1 (ko) 2022-12-19 2023-03-22 주식회사 비브라이트 식약처 공공데이터를 활용한 식제품 큐레이팅 서비스를 제공하는 방법 및 그 시스템
KR102589677B1 (ko) 2023-02-17 2023-10-17 주식회사 비브라이트 식약처 데이터에 기반하여 식제품 및 구성 비율을 추천하는 장치

Also Published As

Publication number Publication date
US20160162818A1 (en) 2016-06-09

Similar Documents

Publication Publication Date Title
CN113377850B (zh) 认知物联网大数据技术平台
US20160034560A1 (en) Method and system for securely storing private data in a semantic analysis system
US11010812B2 (en) Smart device recommendations
US9015011B2 (en) Assistant tool
CN102236549A (zh) 跨动态边界的运行时分析的可视化
CN110263186A (zh) 用于识别、选择和呈现媒体内容项目的方法和系统
US8959076B2 (en) Managing a service catalog through crowdsourcing
US20160283893A1 (en) Automated, accelerated prototype generation system
JP2004362223A (ja) 情報マイニングシステム
KR20150142081A (ko) 비정형 문화관광 데이터 수집 및 정형화를 통한 맞춤형 문화관광 콘텐츠 추천 시스템 및 방법
EP3436982B1 (en) Modular electronic data analysis computing system
US10762089B2 (en) Open ended question identification for investigations
KR20160070218A (ko) 데이터 분석 서비스 추천 시스템 및 방법
Ferreira et al. A semantic approach to the discovery of workflow activity patterns in event logs
US11868708B2 (en) Method and system for labeling and organizing data for summarizing and referencing content via a communication network
Kiziltan et al. Constraint detection in natural language problem descriptions
US11651013B2 (en) Context-based text searching
KR20140026796A (ko) 맞춤형 특허분석 서비스 시스템 및 그 방법
Ku et al. Service recommendation system for big data analysis
WO2016135883A1 (ja) サービス設計支援システムおよびサービス設計支援方法
CN110069691A (zh) 用于处理点击行为数据的方法和装置
CN109165327A (zh) 人机对话方法、装置及计算机可读存储介质
US10902046B2 (en) Breaking down a high-level business problem statement in a natural language and generating a solution from a catalog of assets
KR102019752B1 (ko) 컴퓨터 수행 가능한 ui/ux 전략제공방법 및 이를 수행하는 ui/ux 전략제공장치
JP6403864B2 (ja) サービス設計支援システムおよびサービス設計支援方法

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination