KR20180061458A - 정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법 및 시스템 - Google Patents

정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법 및 시스템 Download PDF

Info

Publication number
KR20180061458A
KR20180061458A KR1020160159403A KR20160159403A KR20180061458A KR 20180061458 A KR20180061458 A KR 20180061458A KR 1020160159403 A KR1020160159403 A KR 1020160159403A KR 20160159403 A KR20160159403 A KR 20160159403A KR 20180061458 A KR20180061458 A KR 20180061458A
Authority
KR
South Korea
Prior art keywords
industry
information
analysis
analyzing
model
Prior art date
Application number
KR1020160159403A
Other languages
English (en)
Inventor
김경원
정종진
임태범
금승우
문재원
박종빈
Original Assignee
전자부품연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전자부품연구원 filed Critical 전자부품연구원
Priority to KR1020160159403A priority Critical patent/KR20180061458A/ko
Publication of KR20180061458A publication Critical patent/KR20180061458A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0282Rating or review of business operators or products

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 기존 산업 평가 분석을 위해 사용되는 정형 데이터와, 뉴스 기사, 블로그, SNS 등의 산업 평가에 영향을 미칠 수 있는 다양한 종류의 비정형 데이터를 기반으로 산업평가 정보를 분석하여 제공하는 방법 및 시스템에 관한 것으로, 종래의 정형 데이터 기반의 산업평가 정보 제공 서비스가 제공하지 못하는 정보의 적시성을 보장하고 빠르게 변화하는 산업 트렌드를 반영하여 적시에 산업 평가 분석 정보를 제공하기 위한 방법과 시스템을 제안한다. 본 발명에서는 산업 평가 분석을 위해 정형 데이터뿐 아니라 비정형 데이터를 이용하여 산업 평가 분석을 수행한다. 본 발명에서는 기존 정형 데이터 기반 산업평가 정보 제공 서비스에서 제공하지 못하는 적시성 있는 산업평가 정보를 비정형 데이터 기반으로 제공하며, 비정형 데이터 기반으로 산업간 연관도를 분석하여 산업평가 정보에 반영한다. 본 발명에서는 기계학습 기반의 산업별 모델을 생성하여 정형/비정형 데이터에 기반하여 산업별 평가 정보를 분석하고, 모델 구성 팩터 분석 및 모델 업데이트를 통해 산업평가 정보의 정확도를 향상시킨다.

Description

정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법 및 시스템 {Method and system for analyzing evaluation information of industry based on sturectured and unstructured data convergence}
본 발명은 기존에 산업 평가 분석을 위해 사용되는 정형 데이터와, 뉴스 기사, 블로그, SNS 등의 산업 평가에 영향을 미칠 수 있는 다양한 종류의 비정형 데이터를 기반으로 산업평가 정보를 분석하여 제공하는 방법 및 시스템에 관한 것이다.
본 발명은 2016년도 미래창조과학부 및 정보통신기술진흥센터의 지원사업(R7120-16-1016, 산업분석 정보 적시 제공을 위한 정형·비정형 빅데이터 융합 기반 산업 평가 분석 SW 개발)의 연구결과로서 수행되었다.
기존에 산업평가 정보를 제공하는 상용 서비스들이 다수 존재하고 있다. 이러한 서비스들은 분석 대상 산업군에 포함되는 각 기업의 회계 정보(연매출, 부채비율, 순이익 등) 및 신용정보 등의 정형화된 정보(정형 데이터)를 기반으로 한 산업별 통계 정보를 바탕으로 대상 산업에 대한 평가 정보를 제공하고 있다.
그러나 산업평가 정보를 분석하기 위해 사용되는 정형 데이터(특히 회계관련 정보)는 그 공개 및 집계에 오랜 시간이 걸린다. 예를 들면, 기업의 회계정보 중 가장 중요하다고 할 수 있는 재무제표는 집계 및 공개에 1년 이상의 시간이 소요된다. 따라서, 종래의 정형 데이터에 기반한 산업 평가에 있어서는 현 시점에서의 정확한 산업평가 정보 분석이 어려우며 빠르게 변화하는 산업 트렌드를 반영하기 어려운 문제점이 있다.
대한민국등록특허: 공고일자 2013년 5월 22일 등록번호 10-1265976 대한민국등록특허: 공고일자 2015년 9월 23일 등록번호 10-1555092
본 발명에서는 종래의 문제를 해결하기 위해, 산업 평가 분석에 사용되는 정형 데이터와 뉴스 기사, 블로그, SNS 등 산업 평가에 영향을 미치는 수집가능한 비정형 데이터 분석을 통해, 종래의 정형 데이터 기반의 산업평가 정보 제공 서비스가 제공하지 못하는 정보의 적시성을 보장하고 빠르게 변화하는 산업 트렌드를 반영하여 적시에 산업 평가 분석 정보를 제공하기 위한 방법과 시스템을 제안한다.
상기 과제를 해결하기 위하여, 본 발명에서는 산업 평가 분석을 위해 정형 데이터뿐 아니라 비정형 데이터를 이용하여 산업 평가 분석을 수행한다.
본 발명에서는 기존 정형 데이터 기반 산업평가 정보 제공 서비스에서 제공하지 못하는 적시성 있는 산업평가 정보를 비정형 데이터 기반으로 제공하며, 비정형 데이터 기반으로 산업간 연관도를 분석하여 산업평가 정보에 반영한다.
본 발명에서는 기계학습 기반의 산업평가 모형을 생성하여 정형/비정형 데이터에 기반하여 산업평가 정보를 분석하고, 모형 구성 팩터 분석 및 모형 업그레이드를 통해 산업평가 정보의 정확도를 향상시킨다.
본 발명의 한 특징에 따르면, 기존의 정형 데이터와, 산업별 다중 분류된 비정형 데이터 소스를 키워드 기반으로 구축된 산업별 키워드맵을 포함하는 비정형 데이터를 기반으로 하여 산업평가 정보를 분석하고 그 결과를 제공하는 정형/비정형 융합형 산업평가 정보 분석 시스템이 제공된다.
본 발명의 시스템은 상기 정형 데이터 및 비정형 데이터를 기반으로 하여 산업 평가 및 예측 분석을 위한 산업별 평가 모형; 상기 산업별 평가 모형의 최적화를 위해 모형 구성요소 분석을 통해 구성요소, 가중치를 조정하여 모형의 정확도를 높이기 위한 산업별 평가정보 분석 모듈부; 상기 산업별 평가정보 분석 모듈부에 의해 산업별 평가정보 분석 과정에서 도출된 정보 및 상기 산업별 평가 모형의 구성요소들을 이용하여 산업간 연관요소를 분석하는 산업간 연관정보 예측 분석 모듈부; 산업평가 정보 분석 및 산업간 연관정보 분석을 통해 도출된 결과를 기반으로 상기 산업별 평가 모형을 구성하는 팩터를 변경하고 가중치를 조정하여 상기 산업별 평가 분석 모형을 보정하고 업그레이드하는 모듈을 포함한다.
상기 산업별 평가 모형은 기존의 정형 지수 및 데이터를 기반으로 산업별 등급을 산출하여 평가하는 모형; 입력된 비정형 데이터의 정보를 이용하여 모든 산업에 동일 적용이 가능하도록 정형 데이터와 비정형 데이터 팩터를 이용하여 전문가의 휴리스틱 기반으로 설계된 수식을 기반으로 하여 설계되는 통계적 분석 모형; 정형/비정형 데이터를 기반으로 산업 연관관계, 산업별 키워드 연관관계, 산업별 키워드의 가중치 등의 기계학습을 통해 분석된 산업별 특성을 반영하여 각 산업별로 다른 가중치를 적용하고, 산업별로 관심도, 호감도, 위험도, 산업연관관계 등 산업 평가를 위한 분석 및 예측 결과를 도출하기 위한 산업별 다차원 평가 모형을 포함한다.
또한, 상기 산업별 평가정보 분석 모듈부는 산업별 평가 모형의 최적화를 위해 모형 구성요소 분석을 통해 구성요소, 가중치를 조정하여 모형의 정확도를 높이기 위한 것으로서, 정형 지수 기반의 등급 평가 모형을 이용하여 산업별 등급을 산출하는 등급 평가모듈; 각 산업별로 분류된 비정형 데이터를 통해 대상 산업과 관련된 키워드 출현 빈도를 기반으로 분석하여 산업별 비정형 데이터 소스의 영향도, 키워드 중요도, 키워드간 연결강도 정보를 기반으로 키워드의 가중치를 결정하고, 이를 반영하여 산업별 관심도를 분석하는 관심도 분석 모듈; 비정형 데이터의 산업별 키워드맵에 포함된 팩터 및 산업별 긍부정 키워드맵을 이용하여 산업에 대한 긍부정 빈도를 측정하여 대상 산업에 대한 호감도를 도출하는 산업별 호감도 분석모듈; 정형/비정형 데이터를 기반으로 도출된 상기 산업별 지수(산업 평가 등급, 관심도, 호감도)를 종합적으로 반영하여 대상 산업의 위험 정도를 최종적으로 결정하되, 기 도출된 산업별 등급, 관심도, 호감도 등의 시계열 추이를 분석하여 특정 산업의 위험도를 예측하여 결과를 도출하는 산업별 위험도 분석모듈을 포함한다.
또한 상기 산업간 연관정보 예측 분석 모듈부는 산업별 키워드를 기반으로 하여 산업간 키워드들의 연관관계를 분석하여, 특정 산업간의 연결강도, 선후행 산업 연관도, 산업간 영향도 등을 분석하는 산업간 키워드 연관관계 분석모듈; 산업별로 분석/도출된 정보(산업 평가 등급, 관심도, 호감도, 위험도 등)들 간의 연관정보 분석을 통해 각 산업들이 서로간에 미치는 영향도를 분석하여, 산업별 키워드 연관도를 이용하여 산업간 상관관계를 분석하고 정형 데이터 기반의 전후방 산업 연관도 등을 반영하여 산업간의 연관도를 분석하는 산업간 다차원 연관도 분석모듈; 상기한 산업간 연관 정보 분석을 통해 특정 산업의 트렌드를 분석하며, 도출된 산업간 연관도 및 산업별 트렌드 결과를 시계열로 분석하여 특정 산업에서의 예측 정보를 도출하는 산업 트렌드 예측 및 분석모듈을 포함한다.
또한 상기 시스템에는, 상기 도출된 산업별 평가 등급, 관심도, 호감도, 위험도 등의 분석 정보, 산업간 연관정보, 산업별 키워드맵 등의 정보를 시각화하여 사용자에게 제공하는 모듈이 추가로 포함될 수 있다.
한편, 본 발명의 다른 특징에 따르면, 정형 데이터 및 비정형 데이터(산업별 다중 분류된 비정형 데이터 소스를 키워드 기반으로 구축된 산업별 키워드맵가 포함됨)를 기반으로 하여 산업평가 정보를 분석하고 그 결과를 제공하는 정형/비정형 융합형 산업평가 정보 분석 방법이 제공된다. 이 방법은, 입력된 정형 데이터에 기반하여 산업별 등급 평가 모형을 생성하는 절차; 입력받은 정형 데이터와 비정형 데이터를 이용해 전문가의 휴리스틱 기반으로 설계된 수식을 기반으로 하여 통계적 분석 모형을 생성하는 절차; 그리고 정형/비정형 데이터를 기반으로 산업 연관관계, 산업별 키워드 연관관계, 산업별 키워드의 가중치 등의 기계학습을 통해 분석된 산업별 특성을 반영하여 개별 산업별로 다차원 평가 모형을 생성하는 절차; 산업별 평가 모형의 최적화를 위해 모형 구성요소 분석을 통해 구성요소, 가중치를 조정하여 모형의 정확도를 높이기 위하여 산업별 평가정보 분석을 수행하는 절차; 산업별 평가정보 분석이 완료되면, 산업별 평가 분석 과정에서 도출된 정보 및 산업별 다차원 분석 모형의 구성요소들을 이용하여 산업별 연관요소를 분석하려 산업간 연관정보 예측 분석을 진행하는 절차; 산업평가 정보 분석 및 산업간 연관정보 분석을 통해 도출된 정보들을 최적화하기 위하여 기 설계된 산업 평가/분석 모형을 보정 및 업그레이드하는 절차를 포함한다.
여기서, 상기 산업별 평가정보 분석 절차는 상기 산업평가 정보 분석 모형으로부터, 정형 데이터에 기반해서 산업별 등급을 산출하는 절차와, 비정형 데이터를 기반으로 하여 산업별 관심도와 호감도, 위험도를 분석하는 절차를 포함한다.
또한 상기 산업간 연관정보 예측 분석 절차는, 산업별 키워드를 기반으로 하여 산업간 키워드들의 연관관계를 분석하여, 특정 산업간의 연결강도, 선후행 산업 연관도, 산업간 영향도 등을 분석하는 산업간 키워드 연관관계 분석 절차; 산업별로 분석/도출된 정보(산업 평가 등급, 관심도, 호감도, 위험도 등)들 간의 연관정보 분석을 통해 각 산업들이 서로간에 미치는 영향도를 분석하여, 산업별 키워드 연관도를 이용하여 산업간 상관관계를 분석하고 정형 데이터 기반의 전후방 산업 연관도 등을 반영하여 산업간의 연관도를 분석하는 산업간 다차원 연관도 분석 절차; 상기한 산업간 연관 정보 분석을 통해 특정 산업의 트렌드를 분석하며, 도출된 산업간 연관도 및 산업별 트렌드 결과를 시계열로 분석하여 특정 산업에서의 예측 정보를 도출하는 산업 트렌드 예측 및 분석 절차를 포함한다.
이상 소개한 본 발명의 목적 및 구성은 이하에서 도면과 함께 설명하는 구체적인 실시 내용을 통해 보다 더 명확해질 것이다.
본 발명에 따르면 비정형 데이터 분석을 통해 빠르게 변화하는 산업 트렌드 및 위험 정보를 반영한 산업평가 정보를 적시에 제공할 수 있다.
본 발명은 정형/비정형 데이터를 기반으로 산업평가 모형을 생성하여 산업평가 정보를 분석하며, 산업평가 모형 구성 팩터와 가중치 등의 차등 반영을 통해 산업평가 정보의 정확도를 향상시킬 수 있다.
본 발명은 산업별 평가에 영향을 미치는 비정형 데이터 분석을 통해 산업별 위험요소를 조기에 발견할 수 있으며, 이를 이용하여 산업별 위험 알림 및 이슈 변화에 대한 정보를 제공할 수 있다.
도 1은 본 발명의 개요도
도 2는 비정형 데이터의 선처리 프로세스 흐름도
도 3은 본 발명의 정형/비정형 데이터 융합 기반 산업평가 정보 분석 시스템의 구성도
도 4는 본 발명의 정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법의 프로세스 흐름도
도 1은 본 발명에서 제안하는 정형/비정형 데이터 융합 기반 산업평가 정보 분석 시스템 및 그 주변 구성을 보여준다. 분산/병렬 저장소(10)에 정형 데이터(11)와 비정형 데이터(12)가 저장되어 있다. 본 발명의 산업평가 정보 분석 시스템(20)은 기존 산업 평가 분석에 사용되는 정형 데이터(11) 기반의 기업별 재무 정보 및 산업별 기업 통계정보와 통계청 등에서 제공하는 산업별 평가 지표에, 추가적으로 산업 평가에 영향을 미치는 비정형 데이터(12)를 활용하여 산업평가 정보를 분석하여 제공한다.
본 발명의 산업평가 정보 분석 시스템(20)에서 산업평가 정보 분석을 위해 사용하는 비정형 데이터(12)에는 수집 가능한 뉴스 기사, 블로그, SNS 들이 있으며, 웹이나 별도로 제공되는 가공되지 않은 통계정보를 포함하는 LOD(Linked Open Data) 문서를 가공하여 사용한다. LOD 문서는 PDF와 같은 형태로 통계 정보 등이 제공되는 문서를 의미한다.
본 발명에서 제안하는 분석 시스템(20)에 정형 데이터(11)와 함께 사용되는 비정형 데이터(12)는 아래와 같은 과정을 거쳐서 활용 가능한 형태로 1차 가공, 즉, 선처리된다. 도 2에 이 과정을 간략하게 나타내었다.
1) 기존 산업 평가를 위해 사용되는 산업별 정보를 기반으로 하여 산업별 키워드 사전 구성(13)
2) 산업별 키워드 사전을 기반으로 비정형 데이터(뉴스 기사, 블로그, SNS 등) 수집(14)
3) 수집된 비정형 데이터 소스를 산업별로 다중 분류(15)
4) 산업별 다중 분류된 비정형 데이터 소스를 키워드 기반으로 분석하여 산업별 키워드맵 구축(16)
도 2의 비정형 데이터의 1차 가공 프로세스에 대해 간략하게 설명하면 다음과 같다. 먼저 기존 정형 데이터 기반으로 키워드 사전을 구성한다(13). 키워드 사전은 산업별로 작성되며, 해당 산업에 포함되는 기업명, 기업관련 키워드, 기업의 생산 품목, 관련 인물 등으로 구분하여 산업별 키워드 사전이 구축된다. 다음에, 구축된 키워드 사전을 기반으로 웹이나 LOD(Linked Open Data) 등에서 비정형 데이터(문서, 웹페이지 등)를 수집하게 된다(14). 수집된 비정형 데이터(문서, 웹페이지 등)에 대해서는 추가 가공이 이루어지며, 각 문서를 형태소 분석하여 문서에 포함되는 키워드들을 추출하게 되고, 추출된 키워드들을 기반으로 해당 문서들을 산업별로 다중 분류한다(15). 다중 분류란 수집된 하나의 문서가 A산업과 B산업에 동시에 해당될 수 있음을 의미한다. 이렇게 수집된 문서들은 다중 분류되고, 각 문서에서 추출된 키워드들의 연관관계를 분석하여, 산업별 키워드맵을 구성한다(16). 이러한 일련의 과정을 거쳐 가공 및 생성된 키워드맵에는 산업별 키워드 출현빈도, 키워드 간 연결강도, 긍부정 키워드 출현 빈도, 해당 산업에서의 하나의 키워드에 대한 중요도(가중치), 해당 키워드의 산업간 연관도 등 가공 과정에서 생성되는 정보들이 포함되게 된다. 이러한 과정을 거쳐 구성된 산업별 키워드맵을 기반으로 산업평가 정보를 분석/예측하는 모형을 생성하게 된다.
도 3은 도 1에 나타낸 본 발명의 산업평가 정보 분석 시스템(20)의 세부 구성도이다. 기존의 정형 데이터(11)(산업별/기업별 매출, 부도율, 재무재표 구성요소 등) 및 상기와 같이 분석/가공되어 키워드맵으로 생성된 비정형 데이터(12)를 기반으로 하여 산업 평가 및 예측 분석을 위한 정형/비정형 융합형 산업별 평가 모형(21)을 생성한다. 이 모형은 산업별로 산업 평가 분석을 위해서 기계학습을 수행하기 위한 모형이다. 이 평가 모형(21)의 세부 구성을 살펴보면, 기존의 정형 지수 및 데이터를 기반으로 산업별 등급을 산출하여 평가하는 모형(211), 전문가의 휴리스틱이 반영된 통계적 분석 모형(212), 산업별 특성을 반영한 다차원 평가 모형(213)이 있다. 여기서, 산업별 평가 정보 분석을 위해 생성되는 모형들은 기계학습을 통해 도출된 산업별 분석 모형 구성 팩터, 팩터간 가중치 등이 반영되어 생성되며, 산업별 모형을 구성하는 팩터, 가중치는 산업간 연관정보 변화에 따라 지속적인 보정이 이루어질 수 있도록 구성된다.
각 모형에 대해서 구체적으로 설명한다.
정형 지수 기반 등급 평가 모형(211)은 기존 산업 또는 기업 평가시에 사용되고 있는 공지의 모형을 사용할 수 있다. 등급평가 모형(211)은 기존 신용평가 기관에서 사용되고 있는 정형 데이터 기반 산업 등급을 산정하기 위한 모형을 의미한다. 등급 평가 모형은 신용평가 기관마다 조금씩 상이한 모형을 구성하여 사용하고 있다. 일반적으로 자체 설계한 재무 모형을 적용하여 해당 산업에 포함되는 각 기업의 평점을 산출하고, 해당 기업의 평판, 신용도, 성장 가능성 등의 비재무 모형을 적용하여 평점을 산출한다. 그 후, 소기업의 경우에는 대표자의 신용 모형도 적용한다. 이러한 모형들을 결합하여 등급을 산출하는 결합모형을 이용하여 등급을 산정하고, 전문가의 심사를 통해 등급 조정을 하여 최종 등급을 결정한다. 특정 산업에 해당하는 기업들의 등급을 모두 도출한 후, 해당 산업에 포함되는 기업들을 등급 평균에 자산 가중, 매출 가중 등을 반영하여 최종 산업 등급을 결정한다. 결론적으로, 등급 평가 모형(211)은 기존의 방식과 같이 정형 데이터를 기반으로 일련의 등급 평가과정을 모형으로 만든 것을 의미한다.
통계적 분석 모형(212)은 기존 정형 데이터(11)와 가공된 비정형 데이터(12) 팩터를 이용하여 전문가의 휴리스틱 기반으로 설계된 수식을 기반으로 하여 설계된 모형이다. 등급 평가 모형과 통계적 분석 모형의 경우, 특정 산업의 특징이 반영되지 않고, 모든 산업에 공통적으로 적용이 가능한 팩터들을 기반으로 구성된다. 통계적 분석 모형(212)은 기존 정형 데이터를 기반으로 등급을 산정하는 방법과 유사하게, 가공된 비정형 데이터(산업별 키워드, 키워드 빈도수, 긍부정키워드 빈도수 등)의 정보를 이용하여 모든 산업에 동일 적용이 가능한 통계적 수식을 이용하는 모형을 의미한다. 이 모형은 비정형 데이터 기반 산업 평가를 위한 초기 모형으로, 산업별 특성을 세부적으로 반영하지 않고 모든 산업에 대한 예측을 위한 모형으로 활용된다. 예를 들면, 최근 A산업에 해당하는 키워드의 빈도 수가 증가하고 있는 추세라면 'A 산업의 관심도가 증가 추세'라는 결론을 통계적 수식으로 도출하는 모형이다.
산업별 다차원 평가 모형(213)은 정형/비정형 데이터를 기반으로 산업 연관관계, 산업별 키워드 연관관계, 산업별 키워드의 가중치 등의 기계학습을 통해 분석된 산업별 특성을 반영하여 개별 산업별로 모형을 생성한다. 산업별 다차원 평가 모형(213)은 통계 모형을 발전시켜 각 산업별로 다른 가중치를 적용하는 모형을 의미한다. 산업별 다차원 평가 모형(213)은 각 산업별로 상이한 별도의 모형으로 생성되며, 이 모형에서는 산업별 특성을 반영한 상세한 모형을 구성한다. 예를 들면, 커피원두와 우유라는 키워드와 커피 간의 연결 강도가 커피가공업에는 큰 영향을 줄 수 있지만 커피생산업에는 큰 영향을 주지 못하는 것과 같다. 또한, 산업간의 영향도를 모형에 반영할 수 있다. 예를 들면, 철강 산업의 하향이 자동차 산업에 영향을 미치는 것과 같이 전후방 산업에 대한 연관도도 반영되어 모형이 구성된다. 본 발명에서는 산업별 다차원 평가 모형(213)을 구성하는 팩터들 중에 기 구축된 산업별 키워드맵에 포함된 키워드들 간의 관계를 기반으로 구성하게 된다. 산업별 다차원 평가 모형(213)은 산업별로 관심도, 호감도, 위험도, 산업연관관계 등 산업 평가를 위한 분석 및 예측 결과를 도출하기 위한 다양한 모형들을 의미한다.
다음, 상기 산업별 평가 모형(21)의 최적화를 위해 모형의 구성요소 분석을 통해 구성요소, 가중치를 조정하여 모형의 정확도를 높이기 위한 산업별 분석 모듈부(22)를 이용하여, 상기 산업평가 정보 분석을 위해 설계된 모형(21)으로부터, 등급 평가모듈(221)은 정형 데이터에 기반해서 산업별 등급을 산출하고, 산업별 관심도 분석모듈(222) 산업별 호감도 분석모듈(223) 산업별 위험도 분석모듈(224)은 비정형 데이터를 기반으로 하여 산업별 관심도와 호감도, 위험도를 분석한다. 이 산업별 분석 모듈부(22)는 산업별 평가 모형(21)의 최적화를 위해 모형 구성요소 분석을 통해 구성요소, 가중치를 조정하여 모형의 정확도를 높이기 위한 것으로서, 위에서 분석 및 데이터 학습을 통해 구성된 모형을 이용하여 실제 산업별 결과를 도출하는 각종 모듈들을 포함한다.
등급 평가모듈(221)은 정형 지수 기반의 등급 평가 모형을 이용하여, 위에서 설명한 절차를 거쳐 산업별 등급을 산출하는 모듈이다.
산업별 관심도 분석모듈(222)은 각 산업별로 분류된 기사, SNS의 분석을 통해 대상 산업과 관련된 키워드 출현 빈도를 기반으로 분석한다. 이 때, 구축된 산업별 키워드맵에 포함된 정보들이 사용되며, 산업별 비정형 데이터 소스의 영향도, 키워드 중요도, 키워드간 연결강도 등의 정보 등을 기반으로 키워드의 가중치를 결정하고, 이를 반영하여 산업별 관심도를 분석한다. 이 관심도 분석 모듈(222)은 통계적 분석 모형과 산업별 다차원 평가 모형을 이용하여 해당 산업의 특정 시점에 대한 관심도를 도출하는 모듈로서, 통계적 모형을 이용하여 특정 산업의 관심도를 도출하는 경우의 예를 들면, 특정 산업에 해당하는 키워드 빈도수를 기반으로 이 산업의 관심도를 수치로 도출하게 된다. 추가적으로, 산업별 다차원 모형을 이용하여 산업별 키워드 연결강도 등의 추가적인 정보를 이용하여 산업별 가중치 적용한 관심도를 도출할 수 있다.
산업별 호감도 분석모듈(223)은 비정형 데이터 분석을 통해 산업에 대한 긍부정 빈도를 측정하여 도출한다. 호감도 분석에도 관심도 분석과 같이 기구축된 산업별 키워드맵에 포함된 팩터들이 사용되며, 추가적으로 산업별 긍부정 키워드맵을 이용하여 대상 산업에 대한 호감도를 도출한다. 이 호감도 분석 모듈(222)은 관심도 분석과 유사한 과정으로 산업별 호감도를 도출한다. 산업별 호감도는 통계 모형 이용시에는 긍부정(호감) 키워드의 빈도수 혹은 호감지수를 이용하여 도출될 수 있으며, 다차원 모형 적용시에는 산업별 호감 키워드 가중치가 다르게 적용된 긍부정 사전을 이용하여 산업별 가중치를 다르게 적용할 수 있도록 구성된다.
산업별 위험도 분석모듈(224)은 정형/비정형 데이터를 기반으로 도출된 산업별 지수(산업 평가 등급, 관심도, 호감도 등)를 종합적으로 반영하여 대상 산업의 위험 정도를 최종적으로 결정한다. 여기서의 위험도 예측 분석은 기 도출된 산업별 등급, 관심도, 호감도 등의 시계열 추이를 분석하여 특정 산업의 위험도를 예측하여 결과를 도출한다. 예를 들면, 산업별 특성에 따라, 관심도는 높아지고 있으나 호감도가 낮아지고 있는 경우에 해당 산업의 위험도가 높다고 판단할 수 있다. 위험도 예측 분석에는 예를 든 관심도와 호감도 뿐 아니라, 산업별로 다르게 적용될 수 있는 펙터들과 이들을 대표하는 지표/지수를 이용하여 위험도를 예측할 수 있다.
산업별 평가정보 분석이 완료되면, 산업간 연관정보 예측 분석 모듈부(23)에 의한 분석이 진행된다. 산업평가 분석 모듈부(22)를 이용하여 특정산업에 대한 평가 및 예측을 진행했다면, 이 과정에서 도출된 정보 및 산업별 다차원 분석 모형의 구성요소들을 이용하여 산업간 연관요소를 분석하는 모듈이 본 산업간 연관정보 예측 분석 모듈부(23)이다. 산업간 연관정보 예측 분석 모듈부(23)는 산업간 키워드들의 연관관계 분석모듈(231), 산업간 다차원 연관도 분석모듈(232), 특정 산업의 트렌드 예측 및 분석모듈(233)로 구성된다. 구체적으로 설명한다.
산업간 키워드들의 연관관계 분석모듈(231)은 산업별 키워드를 기반으로 하여 산업간 키워드들의 연관관계를 분석하는 모듈이다. 이를 통해 특정 산업간의 연결강도, 선후행 산업 연관도, 산업간 영향도 등을 분석할 수 있다. 이 산업별 키워드 연관도 분석 모듈은, 앞서 모형의 구성에서도 언급한 바와 같이 산업별 키워드들 중에 여러 산업에 다른 의미와 비중으로 사용되는 키워드들이 존재하는데 이러한 산업별 키워드들간의 연결관계 및 강도를 분석하는 과정을 의미한다. 이 과정을 통해 산업별 키워드맵을 동적으로 재구성할 수 있으며, 산업간의 연관관계를 도출하는 데 사용할 수도 있다.
산업간 다차원 연관도 분석모듈(232)은 산업별로 분석/도출된 정보(산업 평가 등급, 관심도, 호감도, 위험도 등)들 간의 연관정보 분석을 통해 각 산업들이 서로간에 미치는 영향도를 분석한다. 구체적으로, 산업간 다차원 연관관계 분석 모듈(232)은 산업별 키워드 연관도를 이용하여 산업간 상관관계를 분석하고, 정형 데이터 기반의 전후방 산업 연관도 등을 반영하여 산업간의 연관도를 분석한다. 산업간 연관도 분석은 산업별 다차원 평가 모형을 동적으로 업데이트할 때도 활용할 수 있으며, 산업별 위험도 예측에도 활용할 수 있다.
산업 트렌드 예측 및 분석모듈(233)은 산업별 위험도 예측 분석과 산업연관도 분석을 기반으로 상향 산업, 하향 산업 등 산업에 대한 트렌드 결과를 도출하는 모듈이다. 상기한 산업간 연관 정보 분석을 통해 특정 산업의 트렌드를 분석할 수 있으며, 도출된 산업간 연관도 및 산업별 트렌드 결과를 시계열로 분석하여 특정 산업에서의 예측 정보를 도출한다. 또한, 산업별 트렌드, 산업 연관정보를 통해 부상하는 산업 및 하향 산업에 대한 예측이 가능하며, 특정 산업에 대한 위험 조기 알람, 이슈 산업 제시 등 다양한 서비스 구현 및 제공이 가능하다.
산업평가 정보 분석 및 산업간 연관정보 분석을 통해 도출된 정보들은 기 설계된 산업 평가/분석 모형 보정 및 업그레이드 모듈(24)에 의해서 보정 및 업그레이드된다. 즉, 분석된 결과를 기반으로 기존 설계되었던, 산업별 모형을 구성하는 팩터가 변경될 수 있으며, 팩터들의 가중치가 조정될 수 있다.
위에 설명한 바와 같이 각 산업별 특화된 예측을 위한 모형들을 구성하고, 산업별 키워드 연관도, 산업간 연관도, 산업 트렌드 등을 분석 예측하기 위한 분석 모형들을 구성하는 데는 많은 정보들이 이용되고, 이러한 정보들은 모형을 구성하는 팩터들과 가중치로 이루어진다. 각 산업별 도출 목표에 따라 모형 구성 팩터와 가중치가 존재하는데, 본 발명에서는 정형/비정형 데이터에 따라 각 분석모형을 구성하는 팩터들과 가중치가 동적으로 변화할 수 있는 선순환 구조를 이룰 수 있도록 구성하고 있다.
이러한 과정을 계속 반복하면서 특정 산업에 대한 평가 정보 예측 정확도를 향상시킬 수 있다.
다시 도 1로 돌아가, 본 발명에서 제안하는 산업평가 정보 분석 시스템(20)을 통해 도출된 산업별 평가 등급, 관심도, 호감도, 위험도 등의 분석 정보, 산업간 연관정보, 산업별 키워드맵 등의 정보들은 다양한 형태의 시각화 모듈(30)을 통해 사용자에게 제공될 수 있다. 시각화 모듈(30)은 예를 들어, 서비스 사용자를 위해 정형 데이터 및 비정형 데이터 분석 결과를 간략하게 보여주시는 대쉬보드, 대쉬보드를 구성하는 분석결과를 상세하게 제공하는 상세보기, 사용자가 선택하는 분석결과만을 동시에 그래프를 통해 겹쳐서 보여줄 수 있는 동적 시각화 영역, 사용자가 정한 기준치 이상/이하일 때 위험 알림을 제공하는 위험알람 보드 등으로 구성할 수 있다.
도 4는 본 발명의 다른 실시예에 따른 정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법의 프로세스 흐름도이다. 각 처리 단계의 세부적인 내용은 앞에서 도 2 및 도 3의 설명시에 설명한 것과 동일하므로 도 4에서는 상세한 내용 설명은 생략한다.
먼저 정형 데이터와 비정형 데이터가 입력된다(101, 103). 비정형 데이터는 도 2에 나타낸 것과 같이 1차 가공됨은 앞에서 설명하였다.
정형 데이터(산업별/기업별 매출, 부도율, 재무재표 구성요소 등)에 기반하여 산업별 등급 평가 모형을 생성한다(105). 이 모형은 기존 산업 또는 기업 평가시에 사용되고 있는 공지의 모형을 사용할 수 있다.
입력받은 정형 데이터와 비정형 데이터를 이용해 전문가의 휴리스틱 기반으로 설계된 수식을 기반으로 하여 통계적 분석 모형을 생성한다(107).
그리고 정형/비정형 데이터를 기반으로 산업 연관관계, 산업별 키워드 연관관계, 산업별 키워드의 가중치 등의 기계학습을 통해 분석된 산업별 특성을 반영하여 개별 산업별로 다차원 평가 모형을 생성한다(109).
산업별 평가 모형의 최적화를 위해 모형 구성요소 분석을 통해 구성요소, 가중치를 조정하여 모형의 정확도를 높이기 위하여, 상기 산업평가 정보 분석을 위해 생성한 모형으로부터, 정형 데이터에 기반해서 산업별 등급을 산출하고(111), 비정형 데이터를 기반으로 하여 산업별 관심도와 호감도, 위험도를 분석한다(113). 산업별 관심도, 호감도, 위험도 분석에 관한 자세한 내용은 앞에서 설명한 바 있다.
산업별 평가정보 분석이 완료되면, 산업간 연관정보 예측 분석이 진행된다(115). 산업별 평가 분석 과정에서 도출된 정보 및 산업별 다차원 분석 모형의 구성요소들을 이용하여 산업별 연관요소를 분석하는 것이다. 산업간 연관정보 예측 분석에는 산업간 키워드들의 연관관계 분석, 산업간 다차원 연관도 분석, 특정 산업의 트렌드 예측 및 분석이 포함된다.
산업평가 정보 분석 및 산업간 연관정보 분석을 통해 도출된 정보들을 최적화하기 위하여 기 설계된 산업 평가/분석 모형을 보정 및 업그레이드한다(117).
상술한 과정을 계속 반복하면서 특정 산업에 대한 평가 정보 예측 정확도를 향상시킬 수 있다. 또한, 상기 과정에 의해 도출된 산업별 평가 등급, 관심도, 호감도, 위험도 등의 분석 정보, 산업간 연관정보, 산업별 키워드맵 등의 정보들은 다양한 형태로 시각화되어 사용자에게 제공될 수 있다.

Claims (8)

  1. 정형 데이터와, 산업별 다중 분류된 비정형 데이터 소스를 키워드 기반으로 구축된 산업별 키워드맵을 포함하는 비정형 데이터를 기반으로 하여 산업평가 정보를 분석하고 그 결과를 제공하는 정형/비정형 융합형 산업평가 정보 분석 시스템으로서,
    상기 정형 데이터 및 비정형 데이터를 기반으로 하여 산업 평가 및 예측 분석을 위한 산업별 평가 모형,
    상기 산업별 평가 모형의 최적화를 위해 모형 구성요소 분석을 통해 구성요소, 가중치를 조정하여 모형의 정확도를 높이기 위한 산업별 평가정보 분석 모듈부,
    상기 산업별 평가정보 분석 모듈부에 의해 산업별 평가정보 분석 과정에서 도출된 정보 및 상기 산업별 평가 모형의 구성요소들을 이용하여 산업간 연관요소를 분석하는 산업간 연관정보 예측 분석 모듈부,
    산업평가 정보 분석 및 산업간 연관정보 분석을 통해 도출된 결과를 기반으로 상기 산업별 평가 모형을 구성하는 팩터를 변경하고 가중치를 조정하여 상기 산업별 평가 분석 모형을 보정하고 업그레이드하는 모듈을 포함하는, 산업평가 정보 분석 시스템.
  2. 제1항에 있어서, 상기 산업별 평가 모형은
    기존의 정형 지수 및 데이터를 기반으로 산업별 등급을 산출하여 평가하는 모형,
    입력된 비정형 데이터의 정보를 이용하여 모든 산업에 동일 적용이 가능하도록 정형 데이터와 비정형 데이터 팩터를 이용하여 전문가의 휴리스틱 기반으로 설계된 수식을 기반으로 하여 설계되는 통계적 분석 모형,
    정형/비정형 데이터를 기반으로 산업 연관관계, 산업별 키워드 연관관계, 산업별 키워드의 가중치 등의 기계학습을 통해 분석된 산업별 특성을 반영하여 각 산업별로 다른 가중치를 적용하고, 산업별로 관심도, 호감도, 위험도, 산업연관관계 등 산업 평가를 위한 분석 및 예측 결과를 도출하기 위한 산업별 다차원 평가 모형을 포함하는 산업평가 정보 분석 시스템.
  3. 제1항에 있어서, 상기 산업별 평가정보 분석 모듈부는 산업별 평가 모형의 최적화를 위해 모형 구성요소 분석을 통해 구성요소, 가중치를 조정하여 모형의 정확도를 높이기 위한 것으로서,
    정형 지수 기반의 등급 평가 모형을 이용하여 산업별 등급을 산출하는 등급 평가모듈,
    각 산업별로 분류된 비정형 데이터를 통해 대상 산업과 관련된 키워드 출현 빈도를 기반으로 분석하여 산업별 비정형 데이터 소스의 영향도, 키워드 중요도, 키워드간 연결강도 정보를 기반으로 키워드의 가중치를 결정하고, 이를 반영하여 산업별 관심도를 분석하는 관심도 분석 모듈,
    비정형 데이터의 산업별 키워드맵에 포함된 팩터 및 산업별 긍부정 키워드맵을 이용하여 산업에 대한 긍부정 빈도를 측정하여 대상 산업에 대한 호감도를 도출하는 산업별 호감도 분석모듈,
    정형/비정형 데이터를 기반으로 도출된 상기 산업별 지수(산업 평가 등급, 관심도, 호감도)를 종합적으로 반영하여 대상 산업의 위험 정도를 최종적으로 결정하되, 기 도출된 산업별 등급, 관심도, 호감도 등의 시계열 추이를 분석하여 특정 산업의 위험도를 예측하여 결과를 도출하는 산업별 위험도 분석모듈을 포함하는 산업평가 정보 분석 시스템.
  4. 제1항에 있어서, 상기 산업간 연관정보 예측 분석 모듈부는
    산업별 키워드를 기반으로 하여 산업간 키워드들의 연관관계를 분석하여, 특정 산업간의 연결강도, 선후행 산업 연관도, 산업간 영향도 등을 분석하는 산업간 키워드 연관관계 분석모듈,
    산업별로 분석/도출된 정보(산업 평가 등급, 관심도, 호감도, 위험도 등)들 간의 연관정보 분석을 통해 각 산업들이 서로간에 미치는 영향도를 분석하여, 산업별 키워드 연관도를 이용하여 산업간 상관관계를 분석하고 정형 데이터 기반의 전후방 산업 연관도 등을 반영하여 산업간의 연관도를 분석하는 산업간 다차원 연관도 분석모듈,
    상기한 산업간 연관 정보 분석을 통해 특정 산업의 트렌드를 분석하며, 도출된 산업간 연관도 및 산업별 트렌드 결과를 시계열로 분석하여 특정 산업에서의 예측 정보를 도출하는 산업 트렌드 예측 및 분석모듈을 포함하는 산업평가 정보 분석 시스템.
  5. 제1항에 있어서, 상기 도출된 산업별 평가 등급, 관심도, 호감도, 위험도 등의 분석 정보, 산업간 연관정보, 산업별 키워드맵 등의 정보를 시각화하여 사용자에게 제공하는 모듈을 추가로 포함하는 산업평가 정보 분석 시스템.
  6. 정형 데이터 및 비정형 데이터를 기반으로 하여 산업평가 정보를 분석하고 그 결과를 제공하는 정형/비정형 융합형 산업평가 정보 분석 방법으로서,
    입력된 정형 데이터에 기반하여 산업별 등급 평가 모형을 생성하는 절차,
    입력받은 정형 데이터와 비정형 데이터를 이용해 전문가의 휴리스틱 기반으로 설계된 수식을 기반으로 하여 통계적 분석 모형을 생성하는 절차,
    정형/비정형 데이터를 기반으로 산업 연관관계, 산업별 키워드 연관관계, 산업별 키워드의 가중치 등의 기계학습을 통해 분석된 산업별 특성을 반영하여 개별 산업별로 다차원 평가 모형을 생성하는 절차,
    산업별 평가 모형의 최적화를 위해 모형 구성요소 분석을 통해 구성요소, 가중치를 조정하여 모형의 정확도를 높이기 위하여 산업별 평가정보 분석을 수행하는 절차,
    산업별 평가정보 분석이 완료되면, 산업별 평가 분석 과정에서 도출된 정보 및 산업별 다차원 분석 모형의 구성요소들을 이용하여 산업별 연관요소를 분석하려 산업간 연관정보 예측 분석을 진행하는 절차,
    산업평가 정보 분석 및 산업간 연관정보 분석을 통해 도출된 정보들을 최적화하기 위하여 기 설계된 산업 평가/분석 모형을 보정 및 업그레이드하는 절차를 포함하는 산업평가 정보 분석 방법.
  7. 제6항에 있어서, 상기 산업별 평가정보 분석 절차는
    상기 산업평가 정보 분석 모형으로부터, 정형 데이터에 기반해서 산업별 등급을 산출하는 절차와, 비정형 데이터를 기반으로 하여 산업별 관심도와 호감도, 위험도를 분석하는 절차를 포함하는 산업평가 정보 분석 방법.
  8. 제6항에 있어서, 상기 산업간 연관정보 예측 분석 절차는
    산업별 키워드를 기반으로 하여 산업간 키워드들의 연관관계를 분석하여, 특정 산업간의 연결강도, 선후행 산업 연관도, 산업간 영향도 등을 분석하는 산업간 키워드 연관관계 분석 절차,
    산업별로 분석/도출된 정보(산업 평가 등급, 관심도, 호감도, 위험도 등)들 간의 연관정보 분석을 통해 각 산업들이 서로간에 미치는 영향도를 분석하여, 산업별 키워드 연관도를 이용하여 산업간 상관관계를 분석하고 정형 데이터 기반의 전후방 산업 연관도 등을 반영하여 산업간의 연관도를 분석하는 산업간 다차원 연관도 분석 절차,
    상기한 산업간 연관 정보 분석을 통해 특정 산업의 트렌드를 분석하며, 도출된 산업간 연관도 및 산업별 트렌드 결과를 시계열로 분석하여 특정 산업에서의 예측 정보를 도출하는 산업 트렌드 예측 및 분석 절차를 포함하는 산업평가 정보 분석 방법.

KR1020160159403A 2016-11-28 2016-11-28 정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법 및 시스템 KR20180061458A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160159403A KR20180061458A (ko) 2016-11-28 2016-11-28 정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160159403A KR20180061458A (ko) 2016-11-28 2016-11-28 정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR20180061458A true KR20180061458A (ko) 2018-06-08

Family

ID=62600230

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160159403A KR20180061458A (ko) 2016-11-28 2016-11-28 정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR20180061458A (ko)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101987365B1 (ko) * 2018-11-26 2019-06-10 (주)위세아이텍 비정형 데이터를 활용한 인공지능 기반의 군 장비 고장 예측 시스템 및 방법
CN111476660A (zh) * 2020-04-27 2020-07-31 大汉电子商务有限公司 一种基于数据分析的智能风控系统及方法
KR20200119426A (ko) * 2019-04-02 2020-10-20 주식회사 자이냅스 기업 부실 징후 시점 예측 장치 및 방법
KR102193228B1 (ko) 2020-02-19 2020-12-18 주식회사 페어랩스 딥러닝 기반 비재무정보 평가 장치 및 그 방법
KR102260591B1 (ko) * 2020-10-12 2021-06-08 동국대학교 산학협력단 데이터 기반의 의사결정 지원시스템 및 동작 방법
KR102275986B1 (ko) * 2020-10-12 2021-07-13 동국대학교 산학협력단 솔루션 기반 데이터 분석 및 예측 장치 및 동작 방법
CN113807645A (zh) * 2021-07-26 2021-12-17 北京清博智能科技有限公司 一种基于开源情报的产业链风险推演方法
CN114693147A (zh) * 2022-04-08 2022-07-01 国家电网有限公司大数据中心 一种基于eci指数的行业信息分析系统
KR20220097822A (ko) * 2020-12-31 2022-07-08 사단법인 디엠씨코넷 비정형 기업 데이터를 이용한 기업성장 예측 시스템
CN116976755A (zh) * 2023-09-20 2023-10-31 北京正开科技有限公司 一种基于数据处理的产业协同分析评价系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101265976B1 (ko) 2011-11-08 2013-05-22 한국과학기술정보연구원 정량적 정보 기반의 산업기술시장 분석 시스템 및 그 방법
KR101555092B1 (ko) 2013-07-19 2015-09-23 농협은행(주) 통계 정보를 이용한 산업위험 예측 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101265976B1 (ko) 2011-11-08 2013-05-22 한국과학기술정보연구원 정량적 정보 기반의 산업기술시장 분석 시스템 및 그 방법
KR101555092B1 (ko) 2013-07-19 2015-09-23 농협은행(주) 통계 정보를 이용한 산업위험 예측 장치 및 방법

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101987365B1 (ko) * 2018-11-26 2019-06-10 (주)위세아이텍 비정형 데이터를 활용한 인공지능 기반의 군 장비 고장 예측 시스템 및 방법
KR20200119426A (ko) * 2019-04-02 2020-10-20 주식회사 자이냅스 기업 부실 징후 시점 예측 장치 및 방법
KR102193228B1 (ko) 2020-02-19 2020-12-18 주식회사 페어랩스 딥러닝 기반 비재무정보 평가 장치 및 그 방법
CN111476660B (zh) * 2020-04-27 2023-06-20 大汉电子商务有限公司 一种基于数据分析的智能风控系统及方法
CN111476660A (zh) * 2020-04-27 2020-07-31 大汉电子商务有限公司 一种基于数据分析的智能风控系统及方法
KR102260591B1 (ko) * 2020-10-12 2021-06-08 동국대학교 산학협력단 데이터 기반의 의사결정 지원시스템 및 동작 방법
KR102275986B1 (ko) * 2020-10-12 2021-07-13 동국대학교 산학협력단 솔루션 기반 데이터 분석 및 예측 장치 및 동작 방법
KR20220097822A (ko) * 2020-12-31 2022-07-08 사단법인 디엠씨코넷 비정형 기업 데이터를 이용한 기업성장 예측 시스템
CN113807645A (zh) * 2021-07-26 2021-12-17 北京清博智能科技有限公司 一种基于开源情报的产业链风险推演方法
CN114693147A (zh) * 2022-04-08 2022-07-01 国家电网有限公司大数据中心 一种基于eci指数的行业信息分析系统
CN114693147B (zh) * 2022-04-08 2024-08-13 国家电网有限公司大数据中心 一种基于eci指数的行业信息分析系统
CN116976755A (zh) * 2023-09-20 2023-10-31 北京正开科技有限公司 一种基于数据处理的产业协同分析评价系统
CN116976755B (zh) * 2023-09-20 2024-03-19 北京正开科技有限公司 一种基于数据处理的产业协同分析评价系统

Similar Documents

Publication Publication Date Title
KR20180061458A (ko) 정형/비정형 데이터 융합 기반 산업평가 정보 분석 방법 및 시스템
CN108564286B (zh) 一种基于大数据征信的人工智能金融风控授信评定方法和系统
Liao et al. Does corporate social performance pay back quickly? A longitudinal content analysis on international contractors
Aguwa et al. Voice of the customer: Customer satisfaction ratio based analysis
Daneshvar Rouyendegh et al. Selecting the best project using the fuzzy ELECTRE method
CN110717654B (zh) 基于用户评论的产品质量评价方法和系统
CN110084627A (zh) 预测目标变量的方法和装置
Kukuk et al. Corporate credit default models: a mixed logit approach
US20240346531A1 (en) Systems and methods for business analytics model scoring and selection
Chernyavskaya et al. Assessment of the Main Indicators' Relationship of Projects of Information and Communication Services' Development.
Eckert et al. Tracking economic activity with alternative high-frequency data
Bantis et al. Forecasting GDP growth rates in the United States and Brazil using Google Trends
Saini et al. Comparative impact of logistics performance index, ease of doing business and logistics cost on economic development: a fuzzy QCA analysis
Awad et al. Performance of urban rail transit: a review of measures and interdependencies
CN111626855A (zh) 债券信用利差预测方法及系统
Laynesa Alcantara et al. Dynamics of entering politically risky foreign markets
Fayek et al. Application of fuzzy logic to quality assessment of infrastructure projects at conceptual cost estimating stage
Niu et al. The bullwhip effect in servitized manufacturers
Zhang Impact of an improved random forest-based financial management model on the effectiveness of corporate sustainability decisions
CN117435489A (zh) 基于需求文档自动分析软件功能点方法及系统
CA3160715A1 (en) Systems and methods for business analytics model scoring and selection
CN117132383A (zh) 一种信贷数据处理方法、装置、设备及可读存储介质
Liu et al. Three-dimensional dynamic monitoring of environmental cost based on state-space model
Cheung The upward pricing pressure test for merger analysis: An empirical examination
KR102543211B1 (ko) 비정형 기업 데이터를 이용한 기업성장 예측 시스템