KR20220050007A - Big data analysis system for advertise marketing and method thereof - Google Patents

Big data analysis system for advertise marketing and method thereof Download PDF

Info

Publication number
KR20220050007A
KR20220050007A KR1020200133821A KR20200133821A KR20220050007A KR 20220050007 A KR20220050007 A KR 20220050007A KR 1020200133821 A KR1020200133821 A KR 1020200133821A KR 20200133821 A KR20200133821 A KR 20200133821A KR 20220050007 A KR20220050007 A KR 20220050007A
Authority
KR
South Korea
Prior art keywords
information
analysis
marketing
results
unit
Prior art date
Application number
KR1020200133821A
Other languages
Korean (ko)
Inventor
윤통현
Original Assignee
(주)플래틱스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)플래틱스 filed Critical (주)플래틱스
Priority to KR1020200133821A priority Critical patent/KR20220050007A/en
Publication of KR20220050007A publication Critical patent/KR20220050007A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Fuzzy Systems (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to a big data analysis system for marketing, which enables small and medium-sized businesses, having difficulty in collecting sufficient information only with internal information, to effectively collect information that can provide desired marketing information through a model optimized for marketing, and to analyze the collected information in a systematic way, and a method thereof. The big data analysis system for marketing searches for internal customer information and information from sources (websites) on a network selected based on keywords, collects the results in an information collection unit, distributes and stores the information collected by the information collection unit in consideration of characteristics, analyzes the distributed and stored information by an analysis method including value analysis through item association analysis, provides the results, and effectively analyzes time-sequentially changing information dissemination status of customers through a repetitive process of storing the analysis results and the provided results again as data and analyzing the correlation between the stored data and newly accumulated and analyzed data, thereby effectively providing marketing support information or management support information even if the analysis information possessed by itself is limited, and enables specialized analysis companies to construct these components rather than individual companies and use the collected information universally, thereby providing marketing support information desired by individual customers through analysis methods required by the individual customers. In this case, the individual customers can secure the marketing support information or the management support information through big data analysis at a low cost.

Description

광고마케팅을 위한 빅데이터 분석 시스템 및 방법{Big data analysis system for advertise marketing and method thereof}Big data analysis system for advertise marketing and method thereof

본 발명은 마케팅을 위한 빅데이터 분석 시스템 및 방법에 관한 것으로, 특히 내부 정보 만으로는 충분한 정보The present invention relates to a big data analysis system and method for marketing, and in particular, information sufficient only with internal information

를 수집하기 어려운 중소업체들이 마케팅에 최적화된 모델을 통해 원하는 마케팅 정보를 제공할 수 있는 정보를효과적으로 수집하고 수집된 방대한 정보를 체계적 방법으로 분석할 수 있도록 한 마케팅을 위한 빅데이터 분석시스템 및 방법에 관한 것이다.A big data analysis system and method for marketing that allows small and medium-sized businesses that are difficult to collect effectively collect information that can provide desired marketing information through a marketing-optimized model and systematically analyze the collected information. it's about

빅데이터에 대한 수집과 분석에 대한 관심이 높아지면서 포털이나 대형 유통사 혹은 제조사와 같이 많은 회원을As interest in the collection and analysis of big data increases, many members such as portals, large distributors or manufacturers

보유하고 회원의 방대한 사용 로그 정보를 수집할 수 있는 업체들이 회원의 사용 로그를 분석하는 것으로 특정Companies that possess and can collect vast amount of member usage log information analyze members’ usage logs.

한 트랜드 정보를 산출하거나 타겟 그룹을 구분하는 등의 빅데이터 활용을 고려하고 있다.The use of big data, such as calculating one trend information or classifying a target group, is being considered.

기본적으로 빅데이터에 대한 처리는 방대한 정보를 효과적으로 처리하기 위한 분산 저장 및 분산 처리에 대한 Basically, the processing of big data is about distributed storage and distributed processing to effectively process vast amounts of information.

기술, 다양한 정형 및 비정형 데이터를 수집 및 연관 분석하는 기술, 목적 없이 얻어지는 정보들로부터 유의미technology, technology to collect and correlate various structured and unstructured data, and meaningfulness from information obtained without purpose

한 정보를 산출하는 기술 등이 복합적으로 적용되고 있으며, 아직 이러한 빅데이터 분석에 따른 효과가 가시적Technology that calculates one piece of information is being applied in a complex way, and the effect of such big data analysis is still not visible.

으로 입증되고 있지 않기 때문에 방대한 연산과 수많은 데이터의 분석을 위한 시스템 구축 비용과 분석할 수많Because it has not been proven as

은 데이터의 확보가 가능한 대형 업체위주로 빅데이터 분석을 마케팅에 활용하고자 하는 연구와 시도가 이루어Research and attempts have been made to utilize big data analysis in marketing mainly for large companies that can secure data.

지고 있는 실정이다.is currently being lost.

이 중에서 웹 컨텐츠의 급증이나 회원 사용 로그의 급증에 대응하기 위한 대용량 데이터의 분산 저장과 분산 처 Among them, distributed storage and distributed processing of large-capacity data to respond to the rapid increase in web content or the increase in member usage logs.

리에 관해서는 상당한 기술적 진보와 활용이 이루어지고 있으나 아직 빅데이터로부터 유의미한 정보를 산출하는Although considerable technological advances and utilization have been made in relation to data management, there are still

것에 관해서는 많은 연구가 필요한 실정이다.Much research is needed in this regard.

특히, 이러한 빅데이터 분석에 대해서는 그 실질적인 활용을 위한 다양한 분석 방법이 연구중이기 때문에 현재In particular, for such big data analysis, various analysis methods are being studied for practical use.

빅데이터 분석을 경영 활동에 활용하는 경우는 주로 자사 이용고객이 제공한 내부의 데이터를 분석하여 통계나When big data analysis is used for business activities, it is mainly used to analyze internal data provided by customers

트랜드 분석 등에 일부 활용하고 있는 정도이며, 아직까지 이러한 빅데이터 분석 결과를 전적으로 신뢰하고 있Some of them are being used for trend analysis, etc.

지는 못한 실정이다. 하지만, 다양한 모바일 기기의 방대한 활용, 다양한 소셜 네트워크의 활용, 다양한 네트워It has not been lost. However, the vast use of various mobile devices, the use of various social networks, and the

크 인프라의 확장에 의해서 추적 및 수집 가능한 다양한 사용자 이용 로그 정보들이 기하급수적으로 쌓이고 있Various user usage log information that can be tracked and collected by the expansion of the network infrastructure is being accumulated exponentially.

는 실정이므로 이를 활용한 빅데이터 분석이 향후 산업 전반에 걸쳐 필수적인 마케팅 지원이나 경영 지원 정보In the future, big data analysis using this is essential for marketing support or management support information throughout the industry.

가 될 것임은 누구도 부인하지 못하고 있다.No one can deny that it will be.

결국, 정형화되어 수집 및 활용이 용이한 자사 이용고객의 정보를 충분히 보유하지 못하거나 빅데이터 분석을 In the end, the company does not have enough information about its customers, which is standardized and easy to collect and utilize, or it is difficult to analyze big data.

위한 시스템 비용을 감당하기 어려운 중소기업은 대형 포털이나 금융사, 대기업 등과 같이 빅데이터 분석을 통Small and medium-sized enterprises (SMEs) that cannot afford the system cost for

해 시장에 접근하는 업체들과의 경쟁에서 도태되거나 종속되는 상황으로 발전할 가능성이 높다.There is a high possibility that it will develop into a situation of being shunned or subordinated in competition with companies accessing the market.

일반적으로 업체가 제품이나 서비스의 개발을 통해 사업화에는 성공했지만 이후 자금 부족 등에 의해 도산하는Generally, companies succeed in commercialization through product or service development, but later go bankrupt due to lack of funds.

소위 '죽음의 계곡(Death valley)'을 통과하는 것은 상당히 어려워 일반적으로 수백 혹은 수천 분의 일이라는Passing through the so-called 'Death valley' is quite difficult, usually in hundreds or thousands.

확률로 이야기된다. 이러한 죽음의 계곡을 지나 제품이나 서비스를 시장에 출시했다 하더라도 초기시장과 주류talk about probabilities. Even if a product or service is launched on the market after passing through this valley of death, the initial market and mainstream

시장으로 진입하기까지의 사이에는 일시적으로 수요가 정체되거나 후퇴하는 단절현상을 거치게 되는데 이를 캐Before entering the market, demand temporarily stagnates or goes through a disconnection phenomenon that retreats.

즘(chasm)이라 하며, 이 단계를 넘어서야 기술범용화를 거쳐 일반대중에게 확산되고 시장 전체에 대한 파급효과It is called chasm, and it is only after this stage is exceeded that the technology goes through generalization, spreads to the general public, and has a ripple effect on the entire market.

가 나타난다. 이러한 죽음의 계곡이나 캐즘은 일반적인 중소기업의 2대 위기 상황으로 구분되며 이를 극복하기appears. These valleys of death or chasms are divided into two major crisis situations for small and medium-sized enterprises (SMEs), and

위해서는 시장의 트랜드나 제품 혹은 서비스의 확산을 위한 마케팅의 효과를 효율적으로 검증하여 마케팅 방향To effectively verify the effectiveness of marketing for the spread of market trends, products or services, the marketing direction

을 설정하는 적절한 경영 지원 정보가 필수적이다.Appropriate management support information to establish this is essential.

앞서 언급했던 바와 같이 대형 포털이나 대기업 등은 자본이나 축적된 자사 이용고객들의 정보를 활용한 빅데이 As mentioned above, large portals and large corporations use the capital or accumulated information of their customers for Big Day.

터 분석으로 이러한 경영 정보를 활용할 수 있거나 곧 활용할 수 있게 되겠지만 중소기업이나 벤처기업 등은 이Such management information can or will be used soon through market analysis, but SMEs and venture companies

러한 빅데이터 분석을 통한 경영 정보 활용이 어려운 일일 수밖에 없다.It is inevitably difficult to utilize management information through such big data analysis.

한편, 대형 포털의 경우 자사가 보유하는 방대한 정보들을 활용할 수 있는 빅데이터 분석 도구를 무료로 제공하On the other hand, large portals provide free big data analysis tools that can utilize the vast amount of information they have.

여 플랫폼 시장에 대한 선점을 원하는 경우가 있어 이를 통해서 자신이 보유한 여러 정보들을 분석해 볼 수 있There are cases where you want to preempt the platform market, so you can analyze various information you have.

는 기회가 있기는 하지만 아직 대용량 데이터에 대한 분산 저장과 알려져 있는 분석 방식을 통한 정적인 분석Although there is an opportunity, it is still a static analysis through distributed storage of large data and known analysis methods.

정도가 일반적일 뿐 중소기업이나 벤처기업이 이러한 시스템을 자사에 맞추어 커스터마이징하거나 시간에 따라The degree is general, but small and medium-sized enterprises or venture companies can customize these systems for themselves or

가변되는 시장 상황을 효과적으로 분석하기 위한 방법론 및 분석 프로세스를 직접 개발하여 적용하기는 여전히It is still difficult to directly develop and apply methodologies and analysis processes to effectively analyze changing market conditions.

어려운 상황이다. 따라서, 빅데이터 분석을 통한 경영 정보 확보를 포기하고 전통적인 마케팅 방법론을 따르거difficult situation. Therefore, we give up on securing business information through big data analysis and follow traditional marketing methodologies.

나 빅데이터 분석을 실시하더라도 신뢰성이 없는 단순 보조 자료 정도로만 활용하고 있다.Even if big data analysis is performed, it is used only as a simple auxiliary data that is not reliable.

도 1은 종래의 일반적인 빅데이터 분석 과정을 보인 개념도이다.1 is a conceptual diagram illustrating a conventional general big data analysis process.

도시된 바와 같이 내부 정보인 정형화된 자사 회원의 사용 로그를 수집하는 회원 사용 로그 획득부(1)와, 회원 As shown, the member use log acquisition unit 1 that collects the standardized use log of its own members, which is internal information, and the member

의 방대한 사용 로그들을 분산 저장하는 분산 저장부(2)와, 분산 저장된 정보들을 분산 처리 방식으로 분석하는A distributed storage unit (2) that distributes and stores vast usage logs of

분석부(3)와, 이렇게 분석된 정보를 정리하여 사용자에게 결과로 제공하는 결과 제공부(4)로 이루어진다.It consists of an analysis unit 3 and a result providing unit 4 that organizes the analyzed information and provides the results to the user.

이러한 구성을 이용하여 수많은 회원이 발생시키는 사용 로그 정보들을 분석하는 [0012] 것으로 사용자들의 연령별 취Using this configuration to analyze usage log information generated by numerous members by age of users

향, 사용 시간, 사용 위치, 선호 관심 등에 대한 정보를 분석하여 트랜드 확인이나 마케팅의 타겟을 설정하는It analyzes information on fragrance, time of use, location of use, preferred interest, etc. to identify trends or set marketing targets.

등의 마케팅 혹은 경영 정보로 활용하고 있다.It is used for marketing or management information such as

하지만, 회원의 수가 적거나, 사용 로그로 수집할 수 있는 정보가 제한적일 경우 분석의 신뢰성이 낮고 분석할 However, if the number of members is small or the information that can be collected from the usage log is limited, the reliability of the analysis is low and the analysis

수 있는 대상 자체가 한정적일 수밖에 없다. 특히, 트랜드나 마케팅 타겟을 설정하는 거시적 경영 방향을 설정The possible objects themselves are bound to be limited. In particular, set macro management directions to set trends or marketing targets

하는 정보 외에 당장 어떻게 광고를 제공하고 어떠한 채널을 통해 마케팅을 실시하면 좋을 것인지, 실시한 마케In addition to information on how to provide advertisements right away and through which channels to conduct marketing,

팅의 효과는 어떠한지, 온라인 마케팅에서 영향력이 큰 바이럴 마케팅의 전파 상황은 어떠한 지 등에 대한 좀What is the effect of chatting and what is the spread of viral marketing, which has a great influence in online marketing?

더 직접적인 단기 경영 지원 정보나 단기 마케팅 지원 정보는 기존 시스템의 구성을 통해서는 중소기업이 효과More direct short-term management support information or short-term marketing support information is effective for SMEs through the configuration of the existing system.

적으로 확보하기는 어렵다.It is difficult to secure as an enemy.

결국, 자사 회원의 수가 적거나 회원이 제공하는 이용 정보로서는 원하는 분석 결과를 얻을 수 없는 중소기업이As a result, small and medium-sized enterprises (SMEs) that have a small number of members or cannot obtain the desired analysis results from the usage information provided by members.

나 벤처기업의 경우도 자사의 실정에 맞는 최적화된 경영이나 마케팅 지원 정보를 효과적으로 획득할 수 있으면In the case of a venture company, if it is possible to effectively obtain information on management or marketing support optimized for the situation of the company,

서, 바이럴 마케팅과 같이 정보가 분산되어 수집이 어렵고 시계열적 연관 분석이 요구되는 경우에도 적절한 데Therefore, it is suitable for cases such as viral marketing where it is difficult to collect information because it is distributed and time-series correlation analysis is required.

이터를 수집하여 원하는 분석 결과를 제공할 수 있는 새로운 형태의 빅데이터 분석 시스템 및 방법이 요구되고A new type of big data analysis system and method that can collect data and provide desired analysis results is required.

있는 실정이다.there is a situation.

전술한 문제점을 개선하기 위한 본 발명 실시예들의 목적은 내부 고객 정보와 키워드를 기반으로 선택된 네트워An object of the embodiments of the present invention for improving the above-described problems is to provide a network selected based on internal customer information and keywords.

크 상의 소스들(웹사이트)로부터의 정보를 탐색하여 그 결과를 정보 수집부에서 수집하고, 복수의 정보 수집부Search for information from sources (websites) on the website and collect the results in an information collection unit, and a plurality of information collection units

특성을 고려하여 수집된 정보를 분산 저장하며, 분산 저장된 정보를 항목 연관 분석을 통한 가치 분석을 포함하In consideration of the characteristics, the collected information is distributed and stored, and the distributed and stored information includes value analysis through item association analysis.

는 분석 방식으로 분석하여 그 결과를 제공하되, 분석 결과와 제공 결과를 다시 데이터로서 저장한 후 신규 축analyzes in an analysis method and provides the results, but saves the analysis results and the provided results as data again

적되어 분석되는 데이터와의 연관성을 분석하는 반복적 프로세스를 통해 시계열적으로 변화되는 고객의 정보 확Through an iterative process of analyzing the correlation with the data that is stored and analyzed, it is possible to confirm customer information that changes in time series.

산 상태를 효과적으로 분석함으로써 자체 보유 분석 정보가 한정적이라 하더라도 마케팅 지원 정보나 경영 지원By effectively analyzing the living conditions, marketing support information or management support even if the analysis information possessed is limited

정보를 효과적으로 제공할 수 있도록 한 마케팅을 위한 빅데이터 분석 시스템 및 방법을 제공하는 것이다.It is to provide a big data analysis system and method for marketing that can effectively provide information.

본 발명 실시예들의 다른 목적은 자사 고객의 한정된 정보가 아닌 필요로 하는 정보를 웹상에서 능동적으로 수Another object of the embodiments of the present invention is to actively provide necessary information, not limited information of its customers, on the web.

집하되 수집 대상에 따른 다양한 비정형 정보를 효과적으로 분석하기 위해서 수집 대상에 따라 다양한 비정형In order to effectively analyze various atypical information according to the collection target, various atypical information according to the collection target

항목들로 수집되는 수집 정보를 처리 가능한 수준으로 정형화하는 정보 수집부를 구성하는 것으로 다양하게 수It can be done in various ways by configuring the information collection unit that formalizes the collected information collected by items to a processable level.

집되는 웹상 정보들을 항목을 기준으로 가치 분석이 가능하도록 하며, 분석된 정보를 신규 분석 정보와 항목을It enables the value analysis of the collected information on the web based on the items, and uses the analyzed information to create new analysis information and items.

기반으로 재분석하도록 하는 과정을 반복하도록 함으로써 항목을 기준으로 하는 1:N 관계의 연관 분석이 가능하By repeating the process of reanalysis based on

도록 하여 시계열 분석과 바이럴 마케팅에 대한 분석이 가능하도록 한 마케팅을 위한 빅데이터 분석 시스템 및A big data analysis system for marketing that enables time series analysis and analysis of viral marketing

방법을 제공하는 것이다.to provide a way

본 발명 실시예들의 또 다른 목적은 분석된 정보를 활용 데이터베이스에 저장한 후 사용자의 요구나 결과 제공 Another object of the embodiments of the present invention is to provide a user's request or result after storing the analyzed information in a utilization database

어플리케이션에 의해 활용 데이터베이스의 내용을 처리하여 사용자에게 결과로서 제공하며, 이러한 결과 제공을The contents of the utilization database are processed by the application and provided to the user as a result, and the provision of these results is

위한 분석 과정에서 산출된 이벤트를 분석하여 이들 중 일부를 다시 분산 저장하거나 재활용 가능하도록 활용Analyze the events generated during the analysis process for

데이터베이스에 저장하도록 함으로써 결과 제공을 위한 실제 업무 처리자의 경험에 따라 산출되는 정보들을 분By storing it in the database, the information generated according to the experience of the actual work processor to provide results is divided.

석에 추가 반영하고 다른 사용자들이 재활용할 수 있도록 한 마케팅을 위한 빅데이터 분석 시스템 및 방법을 A big data analysis system and method for marketing that is additionally reflected in the table and can be recycled by other users

제공하는 것이다.will provide

상기와 같은 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 마케팅을 위한 빅데이터 분석 시스템은 기In order to achieve the above object, the big data analysis system for marketing according to an embodiment of the present invention is

설정된 종류의 웹사이트로부터 설정된 탐색 기준에 따라 정보를 탐색한 후 탐색된 정보를 파싱하여 미리 마련된After searching for information from a set type of website according to the set search criteria, the searched information is parsed and prepared in advance.

계층적 공통 코드와 항목을 기준으로 하는 포맷으로 변환하는, 웹사이트 종류별로 마련된 정보 수집부와; 상기an information collecting unit provided for each type of website that converts the hierarchical common code and the format based on the item; remind

정보 수집부가 변환한 정보를 공통 코드와 크기를 참조하여 분산 저장하는 분산 저장부와; 상기 분산 저장부가a distributed storage unit for distributing and storing the information converted by the information collection unit with reference to a common code and size; The distributed storage unit

분산 저장한 정보에 분산 처리 방식으로 접근하여 항목 기준 가치 분석을 포함하는 분석 프로세스들에 따라 분Distributed and stored information is accessed in a distributed processing method and divided according to analysis processes including item-based value analysis.

석한 후 그 결과를 활용 데이터베이스에 저장하고, 활용 데이터베이스에 기 저장된 이전 가치 분석 결과와 신규After analysis, the results are stored in the utilization database, and the previous value analysis results stored in the utilization database and the new

분석된 가치 분석 결과를 항목을 기준으로 재분석하여 그 결과를 활용 데이터베이스에 더 저장하는 분석부와;an analysis unit for re-analyzing the analyzed value analysis result based on the item and further storing the result in the utilization database;

활용 데이터베이스의 분석 결과를 원하는 프로세스로 재분석하거나 요청된 쿼리에 따라 검색하여 그 결과를 출Reanalyze the analysis results of the utilization database as a desired process or search according to the requested query and output the results.

력하며 출력 내용을 분석하여 데이터 포맷에 따라 상기 분산 저장부에 데이터로 제공하거나 재사용을 위해 활용It analyzes the output contents and provides it as data to the distributed storage unit according to the data format or utilizes it for reuse.

데이터 베이스에 저장하는 결과 제공부를 포함한다.It includes a result providing unit to be stored in the database.

또한, 정보 수집부의 탐색 기준을 제공하고, 분석부의 분석 프로세스를 갱신하며, 결과 제공부에 재분석 프로세In addition, it provides the search criteria of the information collection unit, updates the analysis process in the analysis unit, and re-analysis process in the result provision unit.

스나 쿼리를 제공하고 그 결과를 사용자에게 제공하는 사용자 지원부를 포함할 수 있다.It may include a user support unit that provides scans or queries and provides the results to users.

정보 수집부는 탐색 기준으로 기 설정된 회원 정보를 포함하며, 해당 회원에 관련된 정보를 탐색할 수 있다. The information collection unit includes member information set as a search criterion, and may search for information related to the member.

한편, 정보 수집부는 탐색 기준으로 키워드를 포함하며, 범용 사용자를 위한 기초 정보로 복수의 웹사이트로부 On the other hand, the information collection unit includes keywords as a search criterion, and as basic information for general-purpose users, from a plurality of websites

터 상기 키워드에 따른 정보를 탐색하고 탐색 결과를 분류하기 위해 마련된 계층적 공통 키워드로 구분하며, 정It is divided into hierarchical common keywords prepared to search for information according to the above keywords and classify the search results.

보를 파싱하여 관련성 정보가 설정된 항목들을 포함하는 포맷으로 변환할 수 있다.By parsing the beam, it can be converted into a format including items for which relevance information is set.

정보 수집부는 수집되는 개인정보는 익명 처리하고 식별 정보는 암호화하거나 삭제할 수 있다.The information collection unit can anonymize collected personal information and encrypt or delete identification information.

또한, 정보 수집부는 항목을 기준으로 포맷을 변환하되, 비정형 데이터를 포함할 수도 있다. In addition, the information collection unit converts the format based on the item, but may include unstructured data.

정보 수집부는 검색 포털 사이트, 소셜 네트워크 사이트, 클라우드 사이트를 포함하는 개방형 웹사이트 별로 각 The information collection unit is each open website, including search portal sites, social network sites, and cloud sites.

웹사이트에 접속하여 검색이나 공개된 오픈 API를 통해 탐색 기준에 따른 정보를 수집할 수 있다. 여기서, 정보You can access the website and collect information according to the search criteria through a search or open API. here, information

수집부는 웹사이트 종류별로 구분되어 구성되며, 각 정보 수집부는 웹사이트 종류에 따라 탐색 결과를 공통 코The collection unit is divided by type of website, and each information collection unit collects search results according to the type of website in a common code.

드로 구분하기 위한 기준이나 탐색 결과를 항목을 기준으로 파싱하기 위한 기준이 다른 것이 바람직하다.It is preferable that the criteria for classifying the plots and the criteria for parsing the search results based on the items are different.

분석부는 분석 결과를 분산 저장부에 데이터로서 다시 제공할 수 있다. The analysis unit may provide the analysis result back to the distributed storage unit as data.

분석부는 항목을 기준으로 수행되는 가치 분석 결과를 활용 데이터베이스에 저장하여 1:N의 연관 분석을 위한 The analysis unit stores the value analysis results performed based on items in the utilization database for 1:N correlation analysis.

데이터를 반복적으로 수집하는 것이 바람직하다.It is desirable to collect data repeatedly.

결과 제공부는 외부 분석 솔루션 혹은 외부 분석 솔루션과의 연계를 위한 인터페이스이거나 외부 사용자 사이트 The result providing unit is an interface for linking with an external analysis solution or an external analysis solution, or an external user site

에 커스터마이징될 수 있는 분석 구성을 포함할 수 있다.may include customizable analysis configurations.

본 발명의 다른 실시예에 따른 마케팅을 위한 빅데이터 분석 방법은 기 설정된 종류의 웹사이트에 따라 구분되The big data analysis method for marketing according to another embodiment of the present invention is classified according to a preset type of website.

는 정보 수집부가 설정된 탐색 기준에 따라 정보를 탐색하여 그 탐색 내용을 미리 마련된 계층적 공통 코드와Searches for information according to the search criteria set by the information collection unit, and compares the search contents with the hierarchical common code prepared in advance.

항목을 기준으로 하는 포맷으로 변환하는 정보 수집 단계와; 상기 정보 수집 단계에서 수집된 변환된 정보를 수an information collection step of converting an item-based format; The converted information collected in the information collection step can be

신한 분산 저장부가 공통 코드와 크기를 기준으로 수신 정보를 분산 저장하는 분산 저장 단계와; 상기 분산 저a distributed storage step in which a Shinhan distributed storage unit distributes and stores received information based on a common code and size; the dispersion low

장 단계에서 분산 저장된 정보를 이용하여 요구되는 분석을 수행하는 분석부가 상기 분산 저장된 정보에 분산An analysis unit that performs a required analysis using the distributed and stored information in the chapter stage is distributed to the distributed and stored information

처리 방식으로 접근하여 항목 기준 가치 분석을 포함하는 분석 프로세스들에 따라 분석을 실시한 후 그 결과를Approach as a processing method, conduct analysis according to analysis processes including item-based value analysis, and then analyze the results

활용 데이터베이스에 저장하고, 활용 데이터베이스에 기 저장된 이전 가치 분석 결과와 신규 분석된 가치 분석It is stored in the utilization database, and the results of the previous value analysis and the newly analyzed value analysis pre-stored in the utilization database

결과를 항목을 기준으로 재분석하여 그 결과를 활용 데이터베이스에 다시 저장하는 분석 단계와; 사용자에게 결an analysis step of re-analyzing the results based on the items and storing the results back in the utilization database; to the user

과를 제공하는 결과 제공부가 활용 데이터베이스의 분석 결과를 원하는 프로세스로 재분석하거나 요청된 쿼리에The result providing unit that provides results re-analyzes the analysis results of the utilization database into a desired process, or responds to the requested query.

따라 검색하여 그 결과를 출력하며 출력 내용을 분석하여 데이터 포맷에 따라 상기 분산 저장부에 데이터로 제It searches and outputs the results, analyzes the output contents, and submits them as data to the distributed storage unit according to the data format.

공하거나 재사용을 위해 활용 데이터 베이스에 저장하는 결과 제공 단계를 포함한다.It includes a step of providing the results, which is shared or stored in a utilization database for reuse.

정보 수집부에 탐색 기준을 제공하고, 분석부의 분석 프로세스를 갱신하며, 결과 제공부에 재분석 프로세스나Provides search criteria to the information collection unit, updates the analysis process in the analysis unit, and provides re-analysis processes or

쿼리를 제공하고 그 결과를 사용자에게 제공하는 사용자 지원부를 통해 사용자의 요구를 수신하여 처리하는 단A unit that receives and processes user requests through the user support department, which provides queries and provides the results to users.

계를 포함할 수 있다.may include a system.

정보 수집 단계에서, 정보 수집부는 탐색 기준으로 기 설정된 회원 정보를 포함하며, 해당 회원에 관련된 정보In the information collection step, the information collection unit includes member information set as a search criterion, and information related to the member

를 탐색할 수 있다.can be explored.

정보 수집단계에서, 정보 수집부는 탐색 기준으로 키워드를 포함하며, 범용 사용자를 위한 기초 정보로 복수의In the information collection step, the information collection unit includes keywords as search criteria, and includes a plurality of basic information for general-purpose users.

웹사이트로부터 상기 키워드에 따른 정보를 탐색하고 탐색 결과를 분류하기 위해 마련된 계층적 공통 키워드로It is a hierarchical common keyword prepared to search information according to the keyword from the website and classify the search result.

구분하며, 정보를 파싱하여 관련성 정보가 설정된 항목들을 포함하는 포맷으로 변환할 수 있다.It can be classified and converted into a format including items for which relevance information is set by parsing the information.

상기 정보 수집 단계에서, 정보 수집부는 검색 포털 사이트, 소셜 네트워크 사이트, 클라우드 사이트를 포함하 In the information collection step, the information collection unit includes a search portal site, a social network site, and a cloud site.

는 개방형 웹사이트 별로 각 웹사이트에 접속하여 검색이나 공개된 오픈 API를 통해 탐색 기준에 따른 정보를by accessing each open website and searching for information according to the search criteria through a search or public open API

수집할 수 있다. 또한, 이러한 정보 수집부는 웹사이트 종류별로 구분되어 구성되며, 각 정보 수집부는 웹사이can be collected In addition, these information collection units are divided by type of website, and each information collection unit is a website.

트 종류에 따라 탐색 결과를 공통 코드로 구분하기 위한 기준이나 탐색 결과를 항목을 기준으로 파싱하기 위한Criteria for classifying search results into common codes according to the type of site, or for parsing search results based on items

기준이 다를 수 있다.Criteria may be different.

분석 단계에서, 분석부는 분석 결과를 분산 저장부에 데이터로서 다시 제공할 수 있다.분석 단계에서, 분석부는 항목을 기준으로 수행되는 가치 분석 결과를 활용 데이터베이스에 저장하여 1:N의 연관 분석을 위한 데이터를 반복적으로 수집할 수 있다. In the analysis step, the analysis unit may provide the analysis result back as data to the distributed storage unit. In the analysis step, the analysis unit stores the value analysis result performed based on the item in the utilization database for 1:N correlation analysis. Data can be collected repeatedly.

본 발명 실시예에 따른 마케팅을 위한 빅데이터 분석 시스템 및 방법은 내부 고객 정보와 키워드를 기반으로 선Big data analysis system and method for marketing according to an embodiment of the present invention is selected based on internal customer information and keywords

택된 네트워크 상의 소스들(웹사이트)로부터의 정보를 탐색하여 그 결과를 정보 수집부에서 수집하고, 복수의Search for information from sources (websites) on the selected network and collect the results in the information collection unit,

정보 수집부 특성을 고려하여 수집된 정보를 분산 저장하며, 분산 저장된 정보를 항목 연관 분석을 통한 가치In consideration of the characteristics of the information collection unit, the collected information is distributed and stored, and the distributed and stored information is valued through item association analysis.

분석을 포함하는 분석 방식으로 분석하여 그 결과를 제공하되, 분석 결과와 제공 결과를 다시 데이터로서 저장Analyze with an analysis method that includes analysis and provide the results, but save the analysis results and the provided results again as data

한 후 신규 축적되어 분석되는 데이터와의 연관성을 분석하는 반복적 프로세스를 통해 시계열적으로 변화되는Then, through an iterative process that analyzes the correlation with the newly accumulated and analyzed data,

고객의 정보 확산 상태를 효과적으로 분석함으로써 자체 보유 분석 정보가 한정적이라 하더라도 마케팅 지원 정By effectively analyzing the spread of customer information, even if the analysis information possessed by the company is limited,

보나 경영 지원 정보를 효과적으로 제공할 수 있는 효과가 있는 것은 물론이고, 이러한 구성을 개별 업체가 아Not only does it have the effect of effectively providing information on management support and management, but also individual companies do not

닌 분석 전문 업체가 구성하고 수집되는 정보를 범용적으로 활용하여 개별 고객사에서 요구하는 분석 방식을 통Through the analysis method required by individual customers, by using the information that is organized and collected by a specialized analysis company

해 개별 고객사가 원하는 마케팅 지원 정보를 제공하는 방식도 가능하며 이 경우 개별 고객사는 빅데이터 분석It is also possible to provide marketing support information that individual customers want. In this case, individual customers can analyze big data

을 통한 마케팅 지원 정보나 경영 지원 정보를 낮은 비용으로 확보할 수 있는 효과가 있다.It has the effect of securing marketing support information or management support information at a low cost.

본 발명 실시예에 따른 마케팅을 위한 빅데이터 분석 시스템 및 방법은 자사 고객의 한정된 정보가 아닌 필요로The big data analysis system and method for marketing according to the embodiment of the present invention requires not limited information of its customers.

하는 정보를 웹상에서 능동적으로 수집하되 수집 대상에 따른 다양한 비정형 정보를 효과적으로 분석하기 위해In order to actively collect information on the web, but to effectively analyze various atypical information according to the collection target,

서 수집 대상에 따라 다양한 비정형 항목들로 수집되는 수집 정보를 처리 가능한 수준으로 정형화하여 분산 저Distributed storage by standardizing the collected information collected in various atypical items according to the collection target to a processable level

장하는 정보 수집부를 구성하는 것으로 다양하게 수집되는 웹상 정보들을 항목을 기준으로 가치 분석이 가능하It constitutes the information collection unit, and it is possible to analyze the value of various collected information on the web based on the items.

도록 하며, 분석된 정보를 신규 분석 정보와 항목을 기반으로 재분석하도록 하는 과정을 반복하도록 함으로써by repeating the process of re-analyzing the analyzed information based on new analysis information and items.

항목을 기준으로 하는 1:N 관계의 연관 분석이 가능하도록 하여 시계열 분석과 바이럴 마케팅에 대한 신속하여By enabling correlation analysis of 1:N relationships based on items, it is possible to quickly analyze time series analysis and viral marketing.

신뢰성 있는 분석 결과를 경제적으로 제공할 수 있는 효과가 있다.It has the effect of economically providing reliable analysis results.

본 발명 실시예에 따른 마케팅을 위한 빅데이터 분석 시스템 및 방법은 분석된 정보를 활용 데이터베이스에 저A big data analysis system and method for marketing according to an embodiment of the present invention stores the analyzed information in a utilization database

장한 후 사용자의 요구나 결과 제공 어플리케이션에 의해 활용 데이터베이스의 내용을 처리하여 사용자에게 결After processing the contents of the utilization database by the user's request or the result providing application, the result is provided to the user.

과로서 제공하며, 이러한 결과 제공을 위한 분석 과정에서 산출된 이벤트를 분석하여 이들 중 일부를 다시 분산It is provided as a result, and some of them are redistributed by analyzing the events produced in the analysis process to provide these results.

저장하거나 재활용 가능하도록 활용 데이터베이스에 저장하도록 함으로써 결과 제공을 위한 실제 업무 처리자의By storing it in the utilization database so that it can be stored or recycled,

경험에 따라 산출되는 정보들을 분석에 추가 반영하고 다른 사용자들이 재활용할 수 있도록 하여 제공되는 마케팅 정보의 품질을 높이고 사용에 따라 신뢰성과 만족도가 높아지는 효과가 있다.It has the effect of increasing the quality of provided marketing information by additionally reflecting the information generated according to experience in the analysis and allowing other users to recycle it, and increases reliability and satisfaction according to its use.

도 1은 종래 빅데이터 분석 시스템의 구성도.
도 2는 본 발명의 실시예에 따른 빅데이터 분석 시스템의 개념도.
도 3은 본 발명의 실시예에 따른 빅데이터 분석 시스템의 구성도
1 is a block diagram of a conventional big data analysis system.
2 is a conceptual diagram of a big data analysis system according to an embodiment of the present invention.
3 is a block diagram of a big data analysis system according to an embodiment of the present invention;

상기한 바와 같은 본 발명을 첨부된 도면들과 실시예들을 [0040] 통해 상세히 설명하도록 한다.The present invention as described above will be described in detail with reference to the accompanying drawings and embodiments.

본 발명에서 사용되는 기술적 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려The technical terms used in the present invention are only used to describe specific embodiments, and are not intended to limit the present invention.

는 의도가 아님을 유의해야 한다. 또한, 본 발명에서 사용되는 기술적 용어는 본 발명에서 특별히 다른 의미로Note that this is not the intention. In addition, the technical terms used in the present invention have a different meaning in particular in the present invention.

정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로Unless defined, it has a meaning commonly understood by one of ordinary skill in the art to which the present invention pertains.

해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다. 또한,should not be construed in an overly inclusive sense or in an overly narrow sense. In addition,

본 발명에서 사용되는 기술적인 용어가 본 발명의 사상을 정확하게 표현하지 못하는 잘못된 기술적 용어일 때에When the technical term used in the present invention is an incorrect technical term that does not accurately express the idea of the present invention

는, 당업자가 올바르게 이해할 수 있는 기술적 용어로 대체되어 이해되어야 할 것이다. 또한, 본 발명에서 사용should be understood by being replaced with technical terms that can be correctly understood by those skilled in the art. Also used in the present invention

되는 일반적인 용어는 사전에 정의되어 있는 바에 따라, 또는 전후 문맥상에 따라 해석되어야 하며, 과도하게The general terms used should be interpreted according to the definition in the dictionary or according to the context, and excessively

축소된 의미로 해석되지 않아야 한다.It should not be construed in a reduced sense.

또한, 본 발명에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함한다.Also, the singular expression used in the present invention includes the plural expression unless the context clearly dictates otherwise.

본 발명에서, "구성된다" 또는 "포함한다" 등의 용어는 발명에 기재된 여러 구성 요소들, 또는 여러 단계를 반In the present invention, terms such as “consisting of” or “comprising” refer to several elements or several steps described in the invention.

드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을It should not be construed as all-inclusive, and some components or some steps thereof may not be included.

수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.It should be construed that it may further include additional components or steps.

또한, 본 발명에서 사용되는 제 1, 제 2 등과 같이 서수를 포함하는 용어는 구성 요소들을 설명하는데 사용될In addition, terms including ordinal numbers such as 1st, 2nd, etc. used in the present invention will be used to describe the components.

수 있지만, 구성 요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성 요소를 다른 구성 요소However, the components should not be limited by terms. The terms refer to one component as another

로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성 요소는It is used only for the purpose of distinguishing from For example, without departing from the scope of the present invention, the first component may be

제 2 구성 요소로 명명될 수 있고, 유사하게 제 2 구성 요소도 제 1 구성 요소로 명명될 수 있다.The second component may be named, and similarly, the second component may also be referred to as the first component.

이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동Hereinafter, a preferred embodiment according to the present invention will be described in detail with reference to the accompanying drawings, but regardless of the reference numerals, the same

일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.Elements that work or are similar are given the same reference numerals, and overlapping descriptions thereof will be omitted.

또한, 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고In addition, in describing the present invention, detailed descriptions of related known technologies may obscure the gist of the present invention.

판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 발명의 사상을 쉽게 이해할 수 있도록 하기If it is determined, a detailed description thereof will be omitted. In addition, the accompanying drawings are to make it easier to understand the spirit of the present invention

위한 것일 뿐, 첨부된 도면에 의해 본 발명의 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다.It should be noted that the spirit of the present invention is not to be construed as being limited only for the purpose of the accompanying drawings.

도 2는 본 발명의 실시예에 따른 빅데이터 분석 시스템의 개념도를 보인 것으로, 도시된 바와 같이 보유한 내부2 is a conceptual diagram of a big data analysis system according to an embodiment of the present invention, and the internal

정보만을 이용하는 것이 아니라 능동적으로 웹상에서 생성되는 수많은 이용자 정보들을 수집하는 정보탐색 수집Information search and collection that not only uses information, but actively collects numerous user information generated on the web

시스템(10)과, 이렇게 수집된 방대한 정보를 분산 저장하는 분산 저장 시스템(20)과, 분산 저장된 정보에 분산The system 10, the distributed storage system 20 for distributing and storing the vast amount of information collected in this way, and distributing to the distributed and stored information

처리 방식으로 접근하여 분석을 수행하고 분석 결과 중 재활용이 가능한 정보를 다시 분산 저장하도록 하는 분A person who conducts analysis by approaching the processing method and distributes and stores recyclable information among the analysis results

석 시스템(30)과, 분석 시스템(30)을 통해 분석된 결과를 수신하여 제공하거나, 분석 시스템(30)이 분석한 결과The analysis system 30 and the analysis system 30 receive and provide the analysis result, or the analysis system 30 analyzes the result

들을 기준으로 필요한 분석을 재실시하도록 하거나, 혹은 쿼리에 따라 분석 결과를 검색하여 결과를 제공하며,to re-perform the necessary analysis based on the results, or to search the analysis results according to the query and provide the results;

재활용할 수 있는 검색 결과 정보는 그 종류에 따라 분산 저장 시스템(20)에 데이터로 제공하고 분석된 자체로Search result information that can be recycled is provided as data to the distributed storage system 20 according to the type and analyzed as it is.

서 활용할 수 있다면 이를 분석 시스템(30)에서 재활용하도록 제공하는 결과 제공 시스템(40)과, 정보탐색 수집If it can be utilized in the analysis system 30, the result providing system 40 that provides it for recycling, and information search and collection

시스템(10)이 수집할 정보에 대한 탐색 기준을 제공하고, 분석 시스템(30)에 분석할 내용(스크립트, 분석 알고The system 10 provides search criteria for the information to be collected, and the content to be analyzed (scripts, analysis, and the analysis system 30) is provided to the analysis system 30.

리즘, 설정 등의 프로세스)을 제공하거나 분석할 내용을 갱신하며, 결과 제공 시스템(40)에 재분석을 위한 내용process, etc.) or update the content to be analyzed, and the content for re-analysis in the result providing system 40

(스크립트, 분석 알고리즘, 설정 등의 프로세스)이나 쿼리를 제공하고 그 결과를 사용자에게 제공하는 사용자(a process such as a script, analysis algorithm, setup, etc.) or a user who provides a query and provides the results to the user

지원 시스템(50)을 포함한다. 여기서, 사용자 지원 시스템(50)은 상기 각 시스템들에 접근하도록 하는 사용자support system 50 . Here, the user support system 50 allows a user to access each of the systems.

인터페이스일 수 있으나 각 시스템의 일부 기능들을 구비한 시스템일 수 있으므로 구체적인 구성은 다양할 수It may be an interface, but it may be a system with some functions of each system, so the specific configuration may vary.

있다.there is.

결국, 도시된 구성은 정형화된 내부 정보를 수집하여 이를 분석하는 기존 방식이 아니라 모바일 서비스, 포털,In the end, the configuration shown is not the traditional method of collecting and analyzing standardized internal information, but rather the mobile service, portal,

소셜 네트워크 서비스, 클라우드 서비스 등을 포함하는 다양한 서비스를 제공하는 웹사이트에서 발생되는 다양Diversity arising from websites that provide various services including social network services and cloud services

한 정보들 중에서 원하는 분석 대상에 적합한 정보들을 수집하여 이들로부터 원하는 마케팅이나 경영 지원을 위Among the information, information suitable for the desired analysis target is collected and the desired marketing or management support is provided.

한 정보 분석을 실시하는 방식이다.It is a method of performing information analysis.

만일 회원에 대한 정보를 일부 구비하고 있는 경우, 해당 회원에 대한 내부 [0048] 정보는 물론이고 해당 다양한 웹사If you have some information about the member, as well as internal information about the member, the various websites

이트에서 해당 회원에 관련된 정보들을 더 수집하는 방식으로 다양한 관련 정보들을 수집할 수도 있다.Various related information may be collected by collecting more information related to the member on the website.

정보를 수집하는 웹사이트는 예를 들어 구글, 네이버, 다음, 빙, 네이트, 야후, 바이두 등의 다양한 포털일 수 Websites collecting information may be, for example, various portals such as Google, Naver, Daum, Bing, Nate, Yahoo, Baidu, etc.

있고 이로부터 특정한 검색 결과나 회원 식별자를 이용한 정보들을 수집할 수 있고, 각 포털에서 결과로 제공하In addition, information using specific search results or member identifiers can be collected from this, and information provided by each portal

는 웹페이지, 뉴스, 블로그, 문서 등을 정보 수집 대상으로 할 수 있다. 이러한 포털에서는 검색 뿐만 아니라may target web pages, news, blogs, documents, etc. for information collection. In these portals, not only

해당 포털에서 제공하는 각종 서비스에 대한 검색과 정보 수집이 가능하도록 하는 오픈 API(ApplicationAn open API (Application) that enables search and information collection for various services provided by the portal.

Program Interface)를 제공하기도 한다. 이러한 정보를 수집하는 웹사이트는 예를 들어 페이스북, 트위터, 유튜Program Interface) is also provided. Websites that collect this information include, for example, Facebook, Twitter, YouTube

브, 핀터레스트, 싸이월드, 라인, 인스타그램, 미투데이, 텀블러, 리슨미, 라스트 에프엠 등의 다양한 소셜 네Various social networks such as V, Pinterest, Cyworld, Line, Instagram, Me2day, Tumblr, Listen Me, and Last FM

트워크일 수 있다. 이러한 소셜 네트워크는 대부분 외부에서 해당 소셜 네트워크의 내부 정보를 검색하거나 수It can be a network. Most of these social networks are externally searchable for inside information or

집할 수 있도록 하는 오픈 API를 제공하는 경우가 많다.They often provide an open API that allows you to do this.

그 외에도 다양한 클라우드 서비스 사이트, 모바일 서비스 사이트 등 다양한 웹사이트들로부터 정보를 수집할 In addition, it is possible to collect information from various websites such as various cloud service sites and mobile service sites.

수 있으며 이러한 사이트들 역시 오픈 API를 제공하는 경우가 많다.In many cases, these sites also provide open APIs.

따라서, 로봇을 이용한 정보의 수집이 가능하므로 원하는 기준(키워드, 시간, 인기도, 필터링 조건 등)에 따른Therefore, it is possible to collect information using a robot, so it is possible to collect information according to the desired

방대한 정보를 수집할 수 있다.It can collect vast amounts of information.

그러나 이렇게 다양한 웹상의 정보를 단순하게 수집한다고 하여 이를 직접 빅데이터 분석에 활용할 수 있는 것However, just because such a variety of information on the web is simply collected, it can be directly used for big data analysis.

은 아니며, 이렇게 수집된 데이터를 분산 처리 방식을 통한 분석 스크립트로 분석한다고 하여 마케팅에 적합한It is not, and it is suitable for marketing because the collected data is analyzed with an analysis script through a distributed processing method.

정보를 생성할 수 있는 것은 아니다.It is not possible to generate information.

따라서, 본 발명의 실시예에서는 기본적으로 두 가지 새로운 방식을 도입한다. 우선 수집 정보를 어느 정도 정 Accordingly, the embodiment of the present invention basically introduces two new methods. First, to a certain extent, the collected information

형화하도록 웹사이트의 종류에 대응되는 정보 수집부들을 구성하는 방식과, 시계열적 분석이나 온라인 마케팅에The method of composing information collection units corresponding to the types of websites to form

서 중요도가 높아지는 바이럴 마케팅 분석을 위해서 항목을 기준으로 가치분석을 실시한 후 이를 저장하고 새로For viral marketing analysis, which increases in importance, value analysis is performed based on items, and then stored

수집되어 분석된 데이터와의 연관성을 분석하는 반복적 프로세스를 통해 항목을 기준으로 1:N 관계의 연관 분석Association analysis of 1:N relationships based on items through an iterative process of analyzing associations with collected and analyzed data

이 가능하도록 함으로써 마케팅 지원을 위한 잠재적 가치 분석이 가능하도록 하는 방식을 도입한다.By making this possible, we introduce a method that enables potential value analysis for marketing support.

그 외에도 실제 마케팅 전문가들의 분석 요청(원하는 분석을 위한 스크립트, 알고리즘, 설정 등)이나 검색 쿼리 In addition, analysis requests from real marketing experts (scripts, algorithms, settings, etc. for the desired analysis) or search queries

등에 따른 결과 정보를 생성하여 사용자에게 제공함과 아울러 생성된 결과 정보 중 실무적으로 의미가 있는 분Result information is generated and provided to users according to

석 정보들이 재활용할 수 있도록 하는 방식도 적용함으로써 단순한 대용량 데이터 분석이 아닌 실질적으로 의미By applying a method that allows the analysis of historical information to be reused, it is practically meaningful rather than simply analyzing large amounts of data.

가 있는 마케팅 지원이나 경영 지원을 위한 분석 정보가 제공될 수 있도록 한다. 또한, 이러한 본 발명의 실시Make it possible to provide analysis information for marketing support or management support. In addition, the practice of this invention

예에 따른 시스템을 특정한 업체를 위한 종속적 시스템이 아닌 범용 사용자를 대상으로 하는 전문 서비스로 특The system according to the example is not a subordinate system for a specific company, but a specialized service for general-purpose users.

화시킬 경우 범용적으로 수집되는 정보들을 각 서비스 이용 업체들의 분석 요구에 맞추어 분석한 후 그 결과를In the case of a generalization, the generally collected information is analyzed according to the analysis needs of each service user, and then the result is analyzed.

제공할 수 있다. 이 경우 시스템 활용도가 높아지므로 서비스 이용 업체의 부담을 줄일 수 있고, 각 서비스 이can provide In this case, the system utilization increases, so the burden on service users can be reduced, and each service

용 업체의 마케팅 담당자가 분석한 결과들을 재활용 가능하게 수집하므로 이러한 다양한 서비스 이용 업체들이As the analysis results of the marketing managers of the companies are collected in a recyclable way, these various service users

원하는 결과를 빠르고 다양하게 획득할 수 있게 된다. 또한, 분석 결과를 신규 수집되는 정보들과 통합하여 재You will be able to obtain the desired results quickly and in a variety of ways. In addition, by integrating the analysis results with newly collected information,

분석하는 것으로 시계열적 분석이나 항목을 기준으로 하는 연관 분석등의 효율을 높일 수 있다.By analyzing, it is possible to increase the efficiency of time series analysis or correlation analysis based on items.

이러한 구성을 적용한 좀 더 구체적인 예를 도 3을 통해 살펴보도록 한다.A more specific example to which such a configuration is applied will be described with reference to FIG. 3 .

도 3은 본 발명의 실시예에 따른 빅데이터 분석 시스템의 구성도로서, 도시된 바와 같이, 기 설정된 종류의 웹 3 is a block diagram of a big data analysis system according to an embodiment of the present invention. As shown, a preset type of web

사이트로부터 설정된 탐색 기준에 따라 정보를 탐색한 후 탐색된 정보를 파싱하여 미리 마련된 계층적 공통 코After searching for information according to the search criteria set from the site, the searched information is parsed to provide a hierarchical common code

드와 항목을 기준으로 하는 포맷으로 변환하는, 웹사이트 종류별로 마련된 정보 수집부(100)와, 정보 수집부An information collection unit 100 and an information collection unit provided for each type of website, converting it into a format based on the data and items

(100)가 변환한 정보를 공통 코드와 크기를 참조하여 분산 저장소(300)에 분산 저장하는 분산 저장부(200)와,A distributed storage unit 200 for distributing and storing the information converted by (100) in the distributed storage 300 with reference to a common code and size;

분산 저장부(200)가 분산 저장한 정보에 분산 처리 방식으로 접근하여 항목 기준 가치 분석을 포함하는 분석 프An analysis program that includes item-based value analysis by accessing the distributed storage unit 200 in a distributed processing method

로세스들에 따라 분석한 후 그 결과를 데이터베이스부(400)에 저장하고, 데이터베이스부(400)에 기 저장된 이전After analyzing according to the processes, the result is stored in the database unit 400 , and previously stored in the database unit 400 .

가치 분석 결과와 신규 분석된 가치 분석 결과를 항목을 기준으로 재분석하여 그 결과를 데이터베이스부(400)에The value analysis result and the newly analyzed value analysis result are reanalyzed based on the item, and the result is stored in the database unit 400

더 저장하는 분석부(500)와, 데이터베이스부(400)의 분석 결과를 원하는 프로세스로 재분석하거나 요청된 쿼리The analysis unit 500 that stores further and the analysis result of the database unit 400 are reanalyzed into a desired process or a requested query

에 따라 검색하여 그 결과를 출력하며 출력 내용을 분석하여 데이터 포맷에 따라 상기 분산 저장부에 데이터로search according to the data format and output the results, and analyze the output contents and convert the data to the distributed storage unit according to the data format.

제공하거나 재사용을 위해 데이터베이스부(400)에 저장하는 결과 제공부(600)와, 정보 수집부(100)의 탐색 기준Search criteria of the result providing unit 600 and the information collection unit 100 to provide or store in the database unit 400 for reuse

을 제공하고, 분석부(500)의 분석 프로세스를 갱신하며, 결과 제공부(600)에 재분석 프로세스나 쿼리를 제공하to provide, update the analysis process of the analysis unit 500, and provide a reanalysis process or query to the result providing unit 600

고 그 결과를 사용자에게 제공하는 사용자 지원부(700)를 포함한다.and a user support unit 700 that provides the result to the user.

여기서, 사용자 지원부(700)는 통합적인 사용자 인터페이스를 의미하는 [0057] 것으로 단순한 인터페이스뿐만 아니라Here, the user support unit 700 refers to an integrated user interface as well as a simple interface.

연관되는 각 기능부(정보 수집부(100), 분석부(500), 결과 제공부(600))에 대한 확장 기능을 제공할 수도 있으It is also possible to provide an extension function for each related functional unit (information collecting unit 100, analysis unit 500, result providing unit 600).

며, 경우에 따라서는 상기 각 기능부의 일부 기능으로서 해당 기능부에 포함될 수도 있다. 따라서, 사용자 지원and, in some cases, may be included in the corresponding functional unit as a partial function of each functional unit. Therefore, user support

부(700)는 다양하게 구성되거나 다양한 기능을 가질 수 있으므로 본 발명의 실시예에 따른 구성으로 한정되지The unit 700 may be configured in various ways or may have various functions, so it is not limited to the configuration according to the embodiment of the present invention.

않는다.does not

한편, 도시된 분산 저장부(200)와 분산 저장소(300)는 데이터를 크기에 따라 구분하여 여러 곳의 저장 장소에On the other hand, the illustrated distributed storage unit 200 and distributed storage 300 divide the data according to the size and store the data in several storage places.

데이터를 저장하는 다양한 분산 저장 방식을 이용할 수 있는데, 본 실시예에서는 널리 알려져 있는 하둡 파일Various distributed storage methods for storing data can be used. In this embodiment, a well-known Hadoop file

시스템(HDFS)을 분산 저장의 기본으로 한다. 이 경우 분석부(500)는 하둡 파일 시스템을 이용하는 맵 리듀스를The system (HDFS) is the basis for distributed storage. In this case, the analysis unit 500 performs map reduce using the Hadoop file system.

분산 처리의 기본으로 활용할 수 있다.It can be used as a basis for distributed processing.

도시된 데이터베이스부(400)는 분산 저장되는 파일의 정보나 정보 수집부(100)의 탐색을 위한 탐색 기준을 저장The illustrated database unit 400 stores information on files that are distributed and stored or a search criterion for searching the information collection unit 100 .

하는 메타데이터베이스(410)와, 분류를 위한 계층적 통합 코드에 대한 정보를 구비한 코드Code having information on the metadata database 410 and the hierarchical integration code for classification

데이터베이스(420)와, 분석부(500)와 결과 제공부(600)가 분석을 위해 분석 결과를 저장하고 항목 기반 가치 분The database 420, the analysis unit 500, and the result providing unit 600 store the analysis results for analysis, and item-based value division

석 결과를 누적하며 검색 결과 중 재활용을 위한 결과를 저장하는 활용 데이터베이스(420)를 포함한다.It includes a utilization database 420 that accumulates the results and stores the results for recycling among the search results.

즉, 앞서 설명된 도 3의 설명에서 실질적으로 설명된 데이터베이스부(400)는 활용 데이터베이스(420)를 의미한 That is, the database unit 400 substantially described in the description of FIG. 3 described above means the utilization database 420 .

다. 그 외의 데이터베이스(410, 430)는 이후 추가로 설명한다.all. Other databases 410 and 430 will be further described later.

한편, 도시된 구성에서 정보 수집부(100)는 회원 정보 획득부(110)와 정보 탐색 수집부(120)를 포함하는데, 이 Meanwhile, in the illustrated configuration, the information collection unit 100 includes a member information acquisition unit 110 and an information search collection unit 120 , which

중에서 회원 정보 획득부(110)는 선택적으로 적용될 수 있다. 도시된 회원 정보 획득부(110)는 정보 수집 시 내Among them, the member information obtaining unit 110 may be selectively applied. The illustrated member information acquisition unit 110 is within the information collection

부 회원 정보나 내부 회원의 이용 정보를 수집하며 필요에 따라 정보 탐색 수집부(120)에서 다양한 웹사이트로It collects sub-member information or internal member usage information, and as necessary, the information search and collection unit 120 to various websites

부터 정보를 수집할 때 회원 정보에 관련된 정보를 수집할 수 있도록 하는 정보를 제공해 줄 수 있다.You can provide information that enables you to collect information related to member information when collecting information from the company.

물론, 정보 수집부(100)는 사용자 지원부(700)를 통해 사용자가 설정하는 키워드를 기준으로 설정되는 웹사이트 Of course, the information collection unit 100 is a website set based on the keyword set by the user through the user support unit 700 .

들에서 정보를 수집하는 정보 탐색 수집부(120) 만을 구성할 수도 있다.It is also possible to configure only the information search and collection unit 120 that collects information from the fields.

앞서 설명했던 바와 같이 본 발명의 실시예에서는 다양한 웹사이트들로부터 원하는 정보를 탐색하여 수집하면서As described above, in an embodiment of the present invention, while searching for and collecting desired information from various websites,

이들을 파싱하여 적절한 분류 코드와 항목을 가지는 포맷으로 변환하는 정보 수집부를 웹사이트의 종류별로 구The information collection unit that parses them and converts them into a format with appropriate classification codes and items is constructed for each type of website.

성한다.make up

이를 도 4를 참조하여 좀 더 상세히 설명한다.This will be described in more detail with reference to FIG. 4 .

도 4는 본 발명의 실시예에 따른 정보 탐색 수집부(120)의 구성과, 이러한 정보 탐색 수집부(120)의 정보 탐색 4 is a configuration of the information search and collection unit 120 according to an embodiment of the present invention, and the information search of the information search and collection unit 120

을 위한 탐색 기준이 설정된 메타데이터 데이터베이스(410) 및 해당 탐색 기준을 메타데이터 데이터베이스(41The metadata database 410 in which the search criteria for

0)에 제공하는 사용자 지원부(700)의 구성이 도시된다.The configuration of the user support unit 700 provided to 0) is shown.

본 발명의 실시예에서는 도시된 정보탐색 수집부(120)가 빅데이터 분석이 가능하도록 다양한 정보를 수집하는In an embodiment of the present invention, the illustrated information search and collection unit 120 collects various information to enable big data analysis.

방식을 채택하는데, 이를 좀 더 구체적으로 살펴본다.method, which we will look at in more detail.

우선 정형화된 내부 정보가 아닌 다양한 결과 제공 포맷이나 제공 결과들(웹페이지, 문서, 게시판, 덧글 등)을 First of all, it is not a standardized internal information, but various result provision formats or provided results (web pages, documents, bulletin boards, comments, etc.)

통합적으로 분석할 수 있도록 항목을 기준으로 규격화하고 검색된 내용을 종류별로 구분하기 위해서 분류 기준Standardized based on items for integrated analysis, and classification criteria to classify searched content by type

을 계층적 통합 코드로 구분하도록 한다. 이를 위에서 각 웹사이트 종류에 따라 각각 달리 제공되는 탐색 결과to be classified as a hierarchical integration code. The search results provided above for each type of website are different.

들을 파싱 방식으로 분석하여 통합 코드와 항목을 기준으로 하는 포맷으로 변환하도록 하는 정보 검색부를 웹사The information retrieval unit that analyzes the data in a parsing method and converts it into an integrated code and item-based format

이트 종류에 맞추어 구성하도록 한다. 이를 통해서 웹사이트 자체의 규정이 변경되거나 탐색 결과의 상태가 변It should be configured according to the type of site. This may change the rules of the website itself or change the status of the search results.

화되더라도 해당 정보 검색부만 갱신하면 되도록 하고, 신규 웹사이트를 추가할 경우에도 대응되는 정보 검색부Even if a new website is added, only the relevant information retrieval unit needs to be updated.

를 추가하면 되도록 하여 정보 탐색을 위한 관리가 용이하도록 함과 아울러 다양한 웹사이트에 따라 수집 정보In addition to making it easy to manage for information search by adding

가 다양하더라도 수집 정보들을 통합적으로 분석 가능한 데이터로 변환할 수 있게 된다. 물론 이렇게 포맷을 맞Even if there are various types of data, the collected information can be converted into data that can be analyzed in an integrated way. Of course, format like this

춘다 하더라도 유사성을 가지는 항목들 중 하나를 선택하여 항목을 결정하는 정도까지 탐색 결과를 구분하는 것Separating the search results to the extent of determining the item by selecting one of the items with similarity even if

은 가능하지만 그 항목의 데이터 종류까지도 일치시키는 것은 대단히 어렵다. 따라서 관련 항목으로 수집되는is possible, but it is very difficult to match even the data type of the item. Therefore, it is collected as a related item

데이터라 하더라도 그 데이터는 정형 혹은 비정형 데이터일 수 있고, 이는 분석부에서 정형 데이터와 비정형 데Even if it is data, the data can be structured or unstructured data.

이터를 연동하여 처리하는 여러 알려져 있는 방식들 중 하나를 선택하여 처리하도록 한다.Select one of several known methods for interworking data and process it.

이를 위하여 도시된 정보탐색 수집부(120)는 메타데이터(410)에 설정된 탐색 [0068] 기준(키워드, 탐색 대상 정보의 생For this purpose, the illustrated information search and collection unit 120 is a search criterion set in the metadata 410 (keyword, generation of search target information).

성 시간, 대상 웹사이트, 탐색 주기, 탐색 정도, 회원 정보 등)에 따라 정보를 탐색하도록 하는 수집 관리 모듈Collection management module to search information according to sex time, target website, browsing cycle, browsing degree, member information, etc.)

(122)과, 수집 관리 모듈(122)의 요청에 따라 설정된 웹사이트(800)에 접속하여 정보를 탐색하는 정보 탐색 모122 and an information search mode for accessing the website 800 set according to the request of the collection management module 122 to search for information

듈(121)과, 정보 탐색 모듈(121)에 의해 탐색된 정보를 해당 웹사이트의 특성을 고려하여 파싱한 후 관계성이After parsing the module 121 and the information searched for by the information search module 121 in consideration of the characteristics of the website, the relationship

정의된 항목들을 기준으로 포맷을 변환하는 데이터 생성 모듈(123)과, 데이터 생성 모듈(123)이 생성한 정보를The data generation module 123 that converts the format based on the defined items, and the information generated by the data generation module 123

분산 저장부(200)에 제공하는 데이터 제공 모듈(124)을 포함한다.and a data providing module 124 provided to the distributed storage 200 .

여기서, 데이터 생성 모듈(123)은 탐색된 정보를 파싱하여 규격화된 포맷으로 변환하면서 해당 정보가 속하는 Here, the data generation module 123 parses the searched information and converts it into a standardized format while the information belongs to

분류를 계층적 공통 코드 정보로 추가할 수 있다. 예를 들어, 해당 정보가 최근 사용했던 립스틱에 관한 정보라Classification can be added as hierarchical common code information. For example, if the information is about the lipstick you used recently.

면 여성용품-화장품-립스틱에 해당하는 공통 코드 정보일 수 있다.It may be common code information corresponding to cotton women's products - cosmetics - lipsticks.

또한, 필요한 경우 데이터 생성 모듈(123)은 수집되는 개인정보를 익명 처리하고 식별 정보는 암호화하거나 삭In addition, if necessary, the data generation module 123 anonymizes the collected personal information and encrypts or deletes the identification information.

제하는 보안 관련 처리를 수행할 수도 있다.Security-related processing may also be performed.

한편, 탐색된 정보는 임의의 웹사이트로부터 얻은 정보이기 때문에 특정 웹사이트에서는 제공되는 항목을 다른 On the other hand, since the searched information is information obtained from an arbitrary website, items provided on a specific website are different from other information.

웹사이트에서는 제공하지 않을 수 있고, 특정 웹페이지에서는 확인되는 항목이 다른 웹페이지에서는 확인되지It may not be provided on the website, and items that are verified on a specific web page may not be verified on other web pages.

않을 수도 있으므로 빅데이터 분석을 위해서 관계성을 설정한 항목들을 마련하고 그로부터 해당 웹사이트에 적This may not be the case, so for big data analysis, prepare items that have relationship settings and apply them to the website from there.

합한 항목을 선택하여 마련된 포맷으로 정리할 수 있도록 한다. 예를 들어, 사용자의 성별, 나이, 위치와 같은Select the combined items so that you can organize them in a prepared format. For example, the user's gender, age, location,

항목들은 관련 항목에 대응되는 정보가 수집될 수도 있고 수집되지 않을 수도 있다. 따라서, 이러한 경우 수집For the items, information corresponding to the related items may or may not be collected. Therefore, in these cases the collection

대상 기본 정보로서 성별, 나이, 위치 등을 관계성이 있는 항목으로 마련하고 이들 중에서 해당 웹사이트에서As basic target information, gender, age, location, etc. are prepared as relevant items, and among them,

얻어지는 정보를 대응되는 항목으로 설정할 수 있다. 다른 예로서, 사용자의 위치 정보가 소정 웹사이트에서는The obtained information can be set as a corresponding item. As another example, the user's location information on a certain website

사용자 IP 정보로서 대략적 사용자 위치를 확인할 수 있는 정보로 수집되고, 다른 웹사이트에서는 주소 정보로As user IP information, it is collected as information that can confirm the approximate user location, and is used as address information on other websites.

수집되며, 또 다른 웹사이트에서는 GPS 정보로 수집될 수 있는데, 이들은 모두 위치 항목으로 관계성을 가질 수collected, and may be collected as GPS information on another website, all of which may have a relationship as a location item.

있다. 하지만 이들은 각각 데이터 구조가 상이하다. 따라서, 이들을 특정한 정보(주소나 GPS 위치)로 변환하여there is. However, they each have a different data structure. Therefore, by converting them into specific information (address or GPS location),

포맷에 맞출 수도 있고 관계성을 가지는 위치 항목들 중 적절한 세부 항목들로 분류하여 포맷을 구성할 수도 있It can fit the format or can configure the format by classifying it into appropriate sub-items among location items having a relationship.

다.all.

이러한 항목 정보는 이후 분석 시 항목들 간 관계성에 따른 가치 분석이나 항목을 기준으로 하는 1:N 정보 생성 In the subsequent analysis of this item information, value analysis according to the relationship between items or 1:N information creation based on items

에 따른 연관 분석 등에서 활용될 수 있으므로 그 포맷 설정은 중요한 부분이라 할 수 있으며, 본 발명의 실시Since it can be utilized in the analysis of association according to

예에서는 이러한 포맷 설정을 웹사이트의 특성을 반영하여 파싱할 수 있도록 함으로서 수집 대상의 특성에 최적In the example, this format setting is optimal for the characteristics of the collection target by allowing parsing by reflecting the characteristics of the website.

화된 변환이 가능하게 된다.Transformation is possible.

도 5는 본 발명의 실시예에 따른 분산 저장부(200)의 구성 예를 보인 것으로 도시된 바와 같이 분산 저장부5 is a configuration example of the distributed storage unit 200 according to an embodiment of the present invention, as shown in the diagram, the distributed storage unit

(200)는 웹사이트 종류별로 별도로 마련된 복수의 정보 수집부들에 대응되는 복수의 단위 분산 저장부(210)를200 includes a plurality of unit distributed storage units 210 corresponding to a plurality of information collection units separately provided for each type of website.

구비하는데, 이러한 단위 분산 저장부(210)는 정보 수집부가 자신의 변환 규칙에 맞추어 제공하는 포맷의 탐색This unit distributed storage unit 210 searches for the format provided by the information collection unit according to its own conversion rule.

정보를 수집하고 그에 대한 통합 코드를 코드 데이터베이스(430)에서 확인하여 분류 식별자를 부가하고 그 크기Collect information and check the integrated code for it in the code database 430 to add a classification identifier and the size

를 구분하여 분산 저장소(300)에 분산하여 저장한다.is divided and stored in the distributed storage 300 .

각 단위 분산 저장부(210)는 수집된 정보를 분산 저장소(300)에 분산 저장하면서 분산 저장한 위치, 파일명, 그Each unit distributed storage unit 210 distributes and stores the collected information in the distributed storage 300 while distributed storage location, file name, and

룹 코드, 입력 날짜 등에 대한 정보를 메타데이터 데이터베이스(410)에 제공하는 수집 에이전트 모듈(211)과,A collection agent module 211 that provides information about the group code, input date, etc. to the metadata database 410, and

수집되는 데이터의 크기에 따라 분할하여 저장하도록 하는 데이터 흐름 제어 모듈(212)을 포함한다.and a data flow control module 212 for dividing and storing the collected data according to the size of the collected data.

도 6은 본 발명의 실시예에 따른 분석부(500) 구성을 보인 것으로, 도시된 바와 같이 분산 저장부(200)에 의해FIG. 6 shows the configuration of the analysis unit 500 according to an embodiment of the present invention, and as shown in FIG.

분산 저장소(300)에 분산 저장된 데이터를 쿼리하거나 맵리듀스 방식 등으로 분산 처리하고 필요한 경우 그 분Query distributed data stored in the distributed storage 300 or distributed processing using a MapReduce method, etc. and, if necessary,

석 결과 중 데이터와 같은 포맷을 재활용을 위해 다시 분산 저장소(300)에 데이터로 저장하도록 하는 분산 처리Distributed processing to store data in the same format as data in the analysis result back to the distributed storage 300 for recycling

모듈(510)과, 항목 기반 가치 분석을 포함하는 다양한 분석 프로세스(분석 스크립트, 알고리즘, 설정 등)를 관It manages the module 510 and various analysis processes (analysis scripts, algorithms, settings, etc.) including item-based value analysis.

리하는 분석 프로세스 모듈(530)과, 분석 프로세스 모듈(530)의 각 분석 프로세스에 따라 분석을 자동적으로 수The analysis process module 530 and the analysis process module 530 automatically perform the analysis according to each analysis process.

행하여 그 결과를 산출하는 데이터 분석 모듈(520)과, 데이터 프로세스 모듈(530)의 개별 분석 프로세스들을 등The individual analysis processes of the data analysis module 520 and the data processing module 530 for performing and calculating the result, etc.

록, 갱신, 제거하고, 필요한 경우 코드 데이터베이스(430)로부터 통합 코드 정보를 확인하여 데이터 분석 모듈data analysis module by locking, updating, removing, and, if necessary, checking the integrated code information from the code database 430

(520)에 제공하며, 데이터 분석 모듈(520)이 분석한 결과를 수집하여 활용 데이터베이스(420)에 기록하는 분석Analysis of providing to 520, collecting the results analyzed by the data analysis module 520 and recording it in the utilization database 420

제어 모듈(540)을 포함한다. 사용자 지원부(700)는 분석부(500)에 원하는 분석을 위한 분석 프로세스를 제공하a control module 540 . The user support unit 700 provides an analysis process for the desired analysis to the analysis unit 500 .

거나 기존 프로세스를 갱신하거나 혹은 기존 프로세스를 삭제하는 등에 대한 정보를 제공할 수 있다.Alternatively, information on updating an existing process or deleting an existing process can be provided.

상기 분석 제어 모듈(540)은 효과적인 바이럴 마케팅 분석을 위해서 항목 기준 [0076] 연관성 분석에 의한 가치 분석을The analysis control module 540 performs value analysis by item-based correlation analysis for effective viral marketing analysis.

포함하는 분석 프로세스들(조회, 정형.비정형 연계분석, 통계분석, 텍스트 분석, 기계학습, 배치 분석, 데이터Analysis processes including (inquiry, structured and unstructured linkage analysis, statistical analysis, text analysis, machine learning, batch analysis, data

연관 관계 파악, 패턴 추출, 랭킹, 이슈 분석, 시기 분석, 연관어 분석, 상관 분석, 회귀 분석 등)을 이용하여Using correlation analysis, pattern extraction, ranking, issue analysis, timing analysis, related word analysis, correlation analysis, regression analysis, etc.)

수집된 데이터를 분석한 후 그 결과를 활용 데이터베이스(420)에 저장하고, 활용 데이터베이스에 기 저장된 이After analyzing the collected data, the result is stored in the utilization database 420, and the data previously stored in the utilization database is stored.

전 가치 분석 결과와 신규 분석된 가치 분석 결과를 항목을 기준으로 재분석하여 그 결과를 활용 데이터베이스Re-analyze the previous value analysis result and the newly analyzed value analysis result based on the items and use the results database

(420)에 더 저장한다. 이러한 과정이 반복되면 항목에 대해 1:N 분석 정보를 누적할 수 있고 이를 통해 연관 분Save more to 420. If this process is repeated, 1:N analysis information can be accumulated for items, and through this

석이 가능하게 되므로 분석 결과들의 변화에 대해서 다양한 정보를 확인할 수 있게 된다. 예를 들어 특정 립스Since analysis becomes possible, various information about changes in analysis results can be confirmed. For example, certain lips

틱에 대한 사용 정보들이 시간에 따라 어떻게 확산되거나 어떠한 방향(나이, 지역, 특정 소속, 웹사이트 기준How does usage information about tics spread over time or in what direction (by age, region, specific affiliation, website)?

방향)으로 변화되는지 확인할 수 있으며 이를 광고의 실시와 관련하여 분석하는 것으로 바이럴 마케팅 효과를direction), and by analyzing this in relation to the execution of advertisements, the effect of viral marketing can be

확인할 수 있다.can be checked

한편, 데이터 분석 모듈(520)이나 분석 제어 모듈(540)은 분석된 결과를 다시 데이터로서 분산 저장소(300)에On the other hand, the data analysis module 520 or the analysis control module 540 stores the analyzed result as data again in the distributed storage 300 .

저장하도록 할 수 있다.can be saved.

여기서, 활용 데이터베이스(420)는 하둡 분산 처리를 효과적으로 수행하기 위해 고속 데이터베이스 분석을 지원 Here, the utilization database 420 supports high-speed database analysis to effectively perform Hadoop distributed processing.

하는 데이터베이스로서, 로(Row)의 길이가 수조개에 이르는 빅데이터 분산 처리를 위한 NoSQL 기반 데이터베이NoSQL-based database for distributed processing of big data with a length of trillions of rows

스인 HBase를 이용할 수 있다. 이는 인메모리 기반으로 구성되어 빅데이터 분석 속도를 높일 수 있으며, 분석부You can use HBase. It is configured on an in-memory basis to speed up big data analysis, and the analysis unit

(500)를 통해 분석된 결과를 저장하여 저장 내용을 다양한 서비스에 빠르게 활용할 수 있도록 한다. 물론 활용(500) to store the analyzed result so that the stored content can be quickly utilized for various services. of course use

데이터베이스(420)는 이러한 HBase외에도 다양한 다른 종류의 데이터베이스와의 호환성을 제공하기 위해 메모리The database 420 has a memory in order to provide compatibility with various other types of databases in addition to the HBase.

스토어 및 인터페이스의 형태를 가질 수도 있다. 따라서 다양한 종류의 메모리 기반 데이터베이스로 동작할 수It may have the form of a store and an interface. Therefore, it can operate as various types of memory-based databases.

있다.there is.

도 7은 본 발명의 실시예에 따른 결과 제공부(600)의 구성을 보인 것으로, 도시된 바와 같이 활용 데이터베이스 7 shows the configuration of the result providing unit 600 according to an embodiment of the present invention, and as shown in the figure, the utilization database

(420)의 분석 결과를 원하는 프로세스로 재분석하거나 요청된 쿼리에 따라 검색하여 그 결과를 출력하도록 하는To reanalyze the analysis result of 420 as a desired process or search according to the requested query and output the result

정보 유통 모듈(610)과 활용 데이터베이스(420)를 활용할 프로세스나 쿼리를 제공하는 서비스 어플리케이션 모A service application module that provides a process or query to utilize the information distribution module 610 and the utilization database 420

듈(620)과, 결과 출력 내용을 분석하여 데이터 포맷에 따라 로그와 분석이 가능한 이벤트는 분산 저장부를 통해By analyzing the module 620 and the result output, the log and the event that can be analyzed according to the data format are transmitted through the distributed storage unit.

분산 저장소에 데이터로 제공하고 즉시 활용 및 서비스가 가능한 결과 이벤트는 재사용을 위해 활용 데이터베이Delivered as data to distributed storage and immediately available and serviceable, resulting events are available for reuse in the Leverage Database

스(420)에 저장하는 이벤트 분석 모듈(630)을 포함할 수 있다.It may include an event analysis module 630 that is stored in the switch 420 .

여기서, 서비스 어플리케이션 모듈(620)은 사용자와 연동하는 시스템으로서 실질적으로 사용자 지원부(700)에 Here, the service application module 620 is a system that interworks with the user and is substantially connected to the user support unit 700 .

연동되는 인터페이스일 수 있고, 실질적인 분석 프로세스나 쿼리는 사용자 지원부(700)를 통해서 제공되는 것일It may be a linked interface, and the actual analysis process or query may be provided through the user support unit 700 .

수 있다.can

한편, 사용자 지원부(700)의 일부 기능은 결과 제공부(600)와 통합될 수 있는데, 이 경우 상기 정보 유통 모듈On the other hand, some functions of the user support unit 700 may be integrated with the result providing unit 600, in this case the information distribution module

(610)은 활용 데이터베이스(420)에 저장된 분석 결과들을 활용하는 기능 외에도 필요한 경우 분석부(500)에 새In addition to the function of utilizing the analysis results stored in the utilization database 420, the 610 indicates a new function in the analysis unit 500 if necessary.

로운 분석 프로세스를 제공하여 그에 따른 분석 결과를 수집하여 사용자에게 출력하도록 하는 일종의 디스패처A kind of dispatcher that provides a new analysis process to collect the analysis results and output them to the user

기능을 제공할 수도 있다. 이 경우 결과 제공부(600)는 외부 분석 솔루션 혹은 외부 분석 솔루션과의 연계를 위It can also provide functions. In this case, the result providing unit 600 is for linking with an external analysis solution or an external analysis solution.

한 인터페이스이거나 외부 사용자 사이트에 커스터마이징될 수 있는 분석 구성을 포함할 수도 있고, 서비스 어It can be an interface or it can contain an analytics configuration that can be customized to an external user site,

플리케이션 모듈은 분산 처리를 위한 분석 엔진(예를 들어 분산 처리 데이터베이스의 분석을 위한 도구인 알스The application module is an analysis engine for distributed processing (for example, Ars, a tool for analysis of distributed processing databases).

튜디오(R-studio)를 통해 구성된 분석 엔진)일 수도 있다.It may be an analysis engine configured through R-studio).

한편, 사용자인 마케터, 관리자, 광고주 등은 자신이 필요한 분석을 위해 키워드 등의 탐색 기준을 제공하여 정On the other hand, users, such as marketers, managers, and advertisers, provide search criteria such as keywords for the analysis they need.

보를 수집하도록 하면 본 발명의 실시예에 따른 빅데이터 분석 시스템은 해당 탐색 기준에 따라 정보들을 주기When information is collected, the big data analysis system according to an embodiment of the present invention provides information according to the corresponding search criteria.

적으로 수집한다. 이렇게 수집되는 정보들을 분산 저장하고, 분산 처리 방식으로 접근하여 분석하되 분석 정보Collectively The collected information is distributed and stored, and the analysis information is analyzed by accessing it in a distributed processing method.

들을 연관 분석이 가능하도록 반복적으로 분석하여 정보들을 누적한다. 이렇게 누적되는 분석 정보들을 필요에Information is accumulated by repeating analysis to enable correlation analysis. This accumulated analysis information

따라 원하는 기준으로 쿼리하여 결과를 산출하거나 새로운 분석 프로세스를 제시하여 그 분석 결과를 활용할 수You can query based on the desired criteria to produce results, or propose a new analysis process to utilize the analysis results.

있으며, 이는 실무적인 노하우에 따른 것으로 분석 시스템 설계자가 모두 지원할 수 없는 부분이다. 이러한 실It is based on practical know-how, and it is a part that analysis system designers cannot all support. these threads

무적인 분석 프로세스나 쿼리에 따른 결과들을 활용 데이터베이스에 저장하는 것으로 관련된 분석 데이터에 대By storing the results according to the invincible analysis process or query in the utilization database,

한 분석 결과를 요청하는 경우 즉시 재활용할 수 있고, 이러한 분석에 따른 지속적인 사용자의 사용 기록들은If you request one analysis result, it can be recycled immediately, and the continuous user usage records according to this analysis are

분석부에서 기계학습 방식으로 학습되어 관련 분석의 신뢰성을 높일 수 있다.It is learned by the machine learning method in the analysis unit, so that the reliability of the related analysis can be increased.

이상에서는 본 발명에 따른 바람직한 실시예들에 대하여 도시하고 또한 설명하였다. 그러나 본 발명은 상술한In the above, preferred embodiments according to the present invention have been shown and described. However, the present invention

실시예에 한정되지 아니하며, 특허 청구의 범위에서 첨부하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능할 것이다.It is not limited to the embodiment, and without departing from the gist of the present invention appended in the claims, any person skilled in the art to which the invention pertains will be able to implement various modifications.

10: 정보탐색 수집 [0084] 시스템 20: 분산 저장 시스템
30: 분석 시스템 40: 결과 제공 시스템
50: 사용자 지원 시스템 100: 정보 수집부
200: 분산 저장부 300: 분산 저장소
400: 데이터베이스부 500: 분석부
600: 결과 제공부 700: 사용자 지원부
10: information search and collection system 20: distributed storage system
30: analysis system 40: result providing system
50: user support system 100: information collection unit
200: distributed storage 300: distributed storage
400: database unit 500: analysis unit
600: result providing unit 700: user support unit

Claims (1)

기 설정된 종류의 웹사이트로부터 설정된 탐색 기준에 따라 정보를 탐색한 후 탐색된 정보를 파싱하여 미리 마
련된 계층적 공통 코드와 항목을 기준으로 하는 포맷으로 변환하는, 웹사이트 종류별로 마련된 정보 수집부와;
상기 정보 수집부가 변환한 정보를 공통 코드와 크기를 참조하여 분산 저장하는 분산 저장부와;
상기 분산 저장부가 분산 저장한 정보에 분산 처리 방식으로 접근하여 항목 기준 가치 분석을 포함하는 분석 프
로세스들에 따라 분석한 후 그 결과를 활용 데이터베이스에 저장하고, 상기 활용 데이터베이스에 기 저장된 이
전 가치 분석 결과와 신규 분석된 가치 분석 결과를 항목을 기준으로 재분석하여 그 결과를 상기 활용 데이터베
이스에 더 저장하는 분석부와;
상기 활용 데이터베이스의 분석 결과를 원하는 프로세스로 재분석하거나 요청된 쿼리에 따라 검색하여 그 결과
를 출력하며 출력 내용을 분석하여 데이터 포맷에 따라 상기 분산 저장부에 데이터로 제공하거나 재사용을 위해
상기 활용 데이터 베이스에 저장하는 결과 제공부를 포함하는 것을 특징으로 하는 마케팅을 위한 빅데이터 분석
시스템.
After searching for information from a preset type of website according to the set search criteria, the searched information is parsed and
an information collection unit provided for each type of website, converting into a format based on related hierarchical common codes and items;
a distributed storage unit for distributing and storing the information converted by the information collection unit with reference to a common code and size;
An analysis program that includes item-based value analysis by accessing the distributed and stored information by the distributed storage unit in a distributed processing method
After analyzing according to the processes, the results are stored in the utilization database, and the data previously stored in the utilization database are stored.
Re-analyze the previous value analysis results and the newly analyzed value analysis results based on the items, and use the results in the above utilization database
an analysis unit to further store it in Ys;
Reanalyze the analysis result of the utilization database as a desired process or search according to the requested query.
output and analyze the output contents and provide it as data to the distributed storage unit according to the data format or for reuse
Big data analysis for marketing, characterized in that it comprises a result providing unit for storing in the utilization database
system.
KR1020200133821A 2020-10-15 2020-10-15 Big data analysis system for advertise marketing and method thereof KR20220050007A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200133821A KR20220050007A (en) 2020-10-15 2020-10-15 Big data analysis system for advertise marketing and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200133821A KR20220050007A (en) 2020-10-15 2020-10-15 Big data analysis system for advertise marketing and method thereof

Publications (1)

Publication Number Publication Date
KR20220050007A true KR20220050007A (en) 2022-04-22

Family

ID=81452654

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200133821A KR20220050007A (en) 2020-10-15 2020-10-15 Big data analysis system for advertise marketing and method thereof

Country Status (1)

Country Link
KR (1) KR20220050007A (en)

Similar Documents

Publication Publication Date Title
KR101463974B1 (en) Big data analysis system for marketing and method thereof
CN107341215B (en) Multi-source vertical knowledge graph classification integration query system based on distributed computing platform
US11663254B2 (en) System and engine for seeded clustering of news events
US10546006B2 (en) Method and system for hybrid information query
Che et al. From big data to big data mining: challenges, issues, and opportunities
CN105205104A (en) Cloud platform data acquisition method
CN102053983A (en) Method, system and device for querying vertical search
CN106294695A (en) A kind of implementation method towards the biggest data search engine
US10127617B2 (en) System for analyzing social media data and method of analyzing social media data using the same
Hammond et al. Cloud based predictive analytics: text classification, recommender systems and decision support
Mehrotra et al. Comparative analysis of K-Means with other clustering algorithms to improve search result
Ali et al. A state of art survey for big data processing and nosql database architecture
Pokorný Big data storage and management: Challenges and opportunities
Jeon et al. Distributed L-diversity using spark-based algorithm for large resource description frameworks data
KR102025813B1 (en) Device and method for chronological big data curation system
KR20210037488A (en) Big Data Analytics-Based Advertising Marketing System
KR20220050007A (en) Big data analysis system for advertise marketing and method thereof
Sarkar et al. Introducing hdinsight
CN115185973A (en) Data resource sharing method, platform, device and storage medium
CN116795859A (en) Data analysis method, device, computer equipment and storage medium
KR20210105687A (en) Big data analysis system for marketing and method thereof
KR20220156731A (en) Big Data Building and Data Mining System through Marketing Information Collection and Analysis for Small and Medium Businesses
Jian et al. Based on automatic correlation keyword grouping and combination based deep information search corresponding to specific language big data—Case of leisure recreation
KR20240015277A (en) Big data analysis system for marketing and method thereof
KR20220106416A (en) Sports Marketing System