KR20220095654A - Social data collection and analysis system - Google Patents

Social data collection and analysis system Download PDF

Info

Publication number
KR20220095654A
KR20220095654A KR1020200187384A KR20200187384A KR20220095654A KR 20220095654 A KR20220095654 A KR 20220095654A KR 1020200187384 A KR1020200187384 A KR 1020200187384A KR 20200187384 A KR20200187384 A KR 20200187384A KR 20220095654 A KR20220095654 A KR 20220095654A
Authority
KR
South Korea
Prior art keywords
data
analysis
social
unit
collection
Prior art date
Application number
KR1020200187384A
Other languages
Korean (ko)
Inventor
손지만
Original Assignee
주식회사 그랩투비소프트랩
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 그랩투비소프트랩 filed Critical 주식회사 그랩투비소프트랩
Priority to KR1020200187384A priority Critical patent/KR20220095654A/en
Publication of KR20220095654A publication Critical patent/KR20220095654A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

The present invention relates to a social data collection analysis system and a method thereof. The method comprises the following steps: (a) a collection part collects data corresponding to a set keyword from a connected social site; (b) a filter part filters the collected data in accordance with a score given in accordance with preset criteria; and (c) an analysis part generates analysis information by extracting the frequency of a keyword included in the filtered data. In accordance with the present invention, by collecting, from a social site, big data for all kinds of tendency/preference/approval rating/market/response research, learning the big data, and analyzing the similarity of the learned big data in accordance with a set keyword to thus generate various indexes and statistical information, the social data collection analysis system is capable of reducing an analysis period, and analysis and storage costs for the big data, and improving a response rate in accordance with the utilization of the analyzed big data.

Description

소셜 데이터 수집 분석 시스템 { Social data collection and analysis system}Social data collection and analysis system { Social data collection and analysis system}

본 발명은 소셜 데이터 수집 분석 시스템 및 그 방법에 관한 것으로 더욱 상세하게는, 소셜 사이트로부터 수집한 빅데이터에 대한 학습을 수행하고, 학습한 빅데이터를 설정한 키워드에 따라 유사도를 분석하여 각종 지표와 통계 정보를 생성하는 기술에 관한 것이다.The present invention relates to a social data collection and analysis system and method, and more particularly, it performs learning on big data collected from social sites, and analyzes similarity according to keywords that set the learned big data to obtain various indicators and It relates to techniques for generating statistical information.

빅데이터란 기존의 데이터베이스 관리 도구로 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을의미한다.Big data refers to a large amount of structured or unstructured data sets that go beyond the ability to collect, store, manage, and analyze data with existing database management tools, and technology to extract values from these data and analyze the results.

다양한 종류의 대용량 데이터에 대한 생성, 수집, 분석, 표현을 그 특징으로 하는 빅데이터 기술의 발전은 다변화된 현대 사회를 더욱 정확하게 예측하여 효율적으로 작동하게 하고 개인화된 현대 사회 구성원마다 맞춤형정보를 제공, 관리, 분석할 수 있도록 한다.The development of big data technology, which is characterized by the generation, collection, analysis, and expression of various types of large-capacity data, more accurately predicts the diversified modern society and makes it work efficiently, and provides customized information for each individualized modern society member; management and analysis.

이와 같이, 빅데이터는 정치, 사회, 경제, 문화, 과학 기술 등 전 영역에 걸쳐서 사회와 인류에게 유용한 정보를 제공할 수 있는 가능성을 제시하며 그 중요성이 부각되고 있다.As described above, big data presents the possibility of providing useful information to society and mankind in all areas such as politics, society, economy, culture, and science and technology, and its importance is being highlighted.

빅데이터 분석에는 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계 학습, 자연 언어 처리, 패턴 인식등이 동원될 수 있다. 특히, 최근 소셜 미디어와 같은 비정형 데이터의 증가로 인해 분석 기법들 중에서 텍스트마이닝, 오피니언 마이닝, 소셜 네트워크 분석, 군집 분석 등이 주목을 받고 있다.Data mining, machine learning, natural language processing, pattern recognition, etc. used in existing statistics and computer science can be mobilized for big data analysis. In particular, text mining, opinion mining, social network analysis, and cluster analysis among analysis techniques are receiving attention due to the recent increase in unstructured data such as social media.

그러나, 종래의 빅데이터 수집은 수집할 정보의 탐색을 규칙기반 엔진을 통해 사용자가 입력한 규칙대로만 판단하고, 정보수집 방식이 크롤링 또는 스크래핑 으로 국한되어 있어 획일적인 단점이 있다.However, the conventional big data collection has a uniform disadvantage because the search for information to be collected is judged only according to the rules input by the user through the rule-based engine, and the information collection method is limited to crawling or scraping.

아울러, 수집할 정보를 탐색할 때 마다 매번 그 변수와 파라미터를 지정해야하는 번거로움이 있으며, 정보 수집 대상이 웹브라우저에 국한된다는 문제점이 있다.In addition, there is a problem of having to designate the variables and parameters every time the information to be collected is searched for, and the information collection target is limited to a web browser.

본 발명의 목적은, 소셜 사이트로부터 각종 성향/선호도/지지율/시장/반응 조사를 위한 빅데이터를 수집하여 학습을 수행하고, 학습한 빅데이터를 설정한 키워드에 따라 유사도를 분석하여 각종 지표와 통계 정보를 생성함으로써, 빅데이터의 분석기간, 분석비용 및 저장비용을 감소시키고, 분석한 빅데이터 활용에 따른 응답률을 향상시키는 기술에 관한 것이다.It is an object of the present invention to perform learning by collecting big data for research on various tendencies/preferences/approvals/market/reactions from social sites, and by analyzing similarity according to keywords set with the learned big data, various indicators and statistics It relates to a technology that reduces the analysis period, analysis cost, and storage cost of big data by generating information, and improves the response rate according to the use of analyzed big data.

이러한 기술적 과제를 달성하기 위한 본 발명의 일 실시예는 소셜 데이터 수집 분석 시스템으로서, 접속된 소셜사이트로부터 설정된 키워드에 대응하는 데이터를 수집하는 수집부; 수집된 데이터를 기 설정된 기준에 따라 부여된 점수에 따라 필터링하는 필터부; 및 필터링된 데이터에 포함된 키워드의 빈도수를 추출하여 분석정보를 생성하는 분석부를 포함하되, 수집부는 데이터 수집을 위한 기초데이터를 json파일로 설정하여 관리하고, 텍스트,댓글, 음성 또는 이미지 중에 어느 하나를 포함하는 데이터를 수집하는 것을 특징으로 한다.One embodiment of the present invention for achieving this technical problem is a social data collection and analysis system, the collection unit for collecting data corresponding to a keyword set from an accessed social site; a filter unit for filtering the collected data according to a score given according to a preset criterion; and an analysis unit for generating analysis information by extracting the frequency of keywords included in the filtered data, but the collection unit sets and manages the basic data for data collection as a json file, and any one of text, comments, voice, or images It is characterized in that it collects data including

바람직하게 기초데이터는 소셜 사이트의 접속주소, 계정, 데이터 수집을 위한 검색어 및 수집한 데이터의 저장경로 중에 어느 하나를 포함하는 것을 특징으로 한다Preferably, the basic data is characterized in that it includes any one of an access address of a social site, an account, a search word for data collection, and a storage path of the collected data.

수집부는, 소셜 사이트로부터 수집한 데이터를 데이터베이스에 임시 저장하되, 다수의 소셜 사이트별로 데이터수집을 위한 크롤링(crawling) 엔진 또는 스크래핑(scraping) 엔진을 구비하며, API 또는 Restful이 지원되지않는 소셜 사이트의 경우, 스크래핑 엔진을 통해 데이터를 수집하는 것을 특징으로 한다.The collection unit temporarily stores data collected from social sites in a database, but has a crawling engine or scraping engine for data collection for a plurality of social sites, and API or Restful of social sites that are not supported In this case, it is characterized by collecting data through a scraping engine.

수집부는, 설정변경을 통해 API, Restful, 크롤링 또는 스크래핑 중에 어느 하나의 방식으로 데이터를 수집하는것을 특징으로 한다.The collection unit is characterized in that it collects data in any one of API, Restful, crawling, and scraping methods through setting changes.

필터부는, 수집한 데이터에 대해 한글 형태소 분석, 문장과 키워드간의 유사도 또는 단어의 출현 횟수 중에 어느 하나의 기준에 따라 키워드 또는 금지어 각각에 점수를 부여하고, 베이시안 기계 학습(Bayesian MachineLearning)에 의한 결과를 토대로 데이터베이스에 수집된 데이터를 정렬 또는 필터링하는 것을 특징으로 한다.The filter unit assigns a score to each of the keywords or prohibited words according to any one of the criteria of Hangeul morpheme analysis, similarity between sentences and keywords, or the number of occurrences of words for the collected data, and results by Bayesian Machine Learning It is characterized in that the data collected in the database is sorted or filtered based on the

분석부는, 분석정보를 데이터베이스에 기 저장된 설정값에 따라 분류하여 시계열적인 차트, 다이어그램 또는 동영상 형태의 데이터 흐름도를 생성하는 것을 특징으로 한다.The analysis unit classifies the analysis information according to preset values stored in the database to generate a data flow chart in the form of a time-series chart, diagram, or moving picture.

전술한 시스템을 기반으로 하는 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 방법은, 수집부가 접속된소셜 사이트로부터 설정된 키워드에 대응하는 데이터를 수집하는 (a) 단계; 필터부가 수집된 데이터를 기 설정된 기준에 따라 부여된 점수에 따라 필터링하는 (b) 단계; 및 분석부가 필터링된 데이터에 포함된 키워드의 빈도수를 추출하여 분석정보를 생성하는 (c) 단계를 포함한다.A social data collection and analysis method according to an embodiment of the present invention based on the above-described system includes: (a) collecting data corresponding to a keyword set from a social site accessed by a collection unit; (b) filtering the collected data by the filter unit according to a score given according to a preset criterion; and (c) generating analysis information by the analysis unit extracting the frequency of keywords included in the filtered data.

바람직하게 (a) 단계는, 수집부가 소셜 사이트로부터 데이터 수집을 위한 기초데이터를 json파일로 설정하여 관리하는 (a-1) 단계; 수집부가 API, Restful, 크롤링 또는 스크래핑 중에 어느 하나의 데이터 수집 방식을 설정하는 (a-2) 단계; 수집부가 기초데이터와 부합하는 소셜 사이트에 접속하는 (a-3) 단계; 수집부가 접속된 소셜사이트로부터 설정된 키워드에 대응하는 데이터를 설정된 데이터 수집 방식으로 수집하는 (a-4) 단계; 및 수집부가 소셜 사이트로부터 수집한 데이터를 데이터베이스에 임시 저장하는 (a-5) 단계를 포함하는 것을 특징으로한다Preferably, step (a) comprises: (a-1) in which the collection unit sets and manages the basic data for data collection from the social site as a json file; (a-2) step of the collection unit setting any one data collection method among API, Restful, crawling, or scraping; (a-3) step of the collecting unit accessing a social site that matches the basic data; (a-4) collecting, by a collecting unit, data corresponding to the set keyword from the accessed social site in a set data collecting method; and (a-5) temporarily storing the data collected by the collection unit from the social site in a database.

(b) 단계는, 필터부가 수집된 데이터를 기 설정된 기준에 따라 키워드 또는 금지어 각각에 대한 점수를 부여하는 (b-1) 단계; 필터부가 점수가 부여된 키워드 또는 금지어에 대해 베이시안 기계 학습을 수행하는 (b-2)단계; 및 필터부가 베이시안 기계 학습 결과를 토대로 데이터베이스에 수집된 데이터를 정렬 또는 필터링하는(b-3) 단계를 포함하는 것을 특징으로 한다.The step (b) includes: (b-1) giving the collected data by the filter unit a score for each keyword or prohibited word according to a preset criterion; (b-2) performing Bayesian machine learning on the keyword or forbidden word to which the filter unit is scored; and (b-3) of the filter unit sorting or filtering the data collected in the database based on the Bayesian machine learning result.

(c) 단계는, 분석부가 필터링된 데이터에 포함된 키워드의 빈도수를 추출하여 분석정보를 생성하는 (c-1) 단계;분석부가 데이터베이스에 기 저장된 보고서 설정값을 색인하는 (c-2) 단계; (c-2) 단계의 색인결과, 보고서 설정값이 '0'인 경우, 분석부가 생성한 분석정보를 포함하는 페이지의 배너를 이미지로 생성하는 (c-3) 단계; (c2) 단계의 색인결과, 보고서 설정값이 '1'인 경우, 분석부가 생성한 분석정보를 word count 보고서로 생성하는(c-4) 단계; 및 분석부가 생성한 분석정보를 데이터베이스에 기 저장된 설정값에 따라 분류하여 시계열적인 차트, 다이어그램 또는 동영상 형태의 데이터 흐름도를 생성하는 (c-5) 단계를 포함하는 것을 특징으로 한다.Step (c) includes: (c-1) generating analysis information by extracting the frequency of keywords included in the filtered data by the analysis unit; (c-2) indexing the report setting values previously stored in the database by the analysis unit ; (c-3) generating a banner of a page including the analysis information generated by the analysis unit as an image when the index result of step (c-2) and the report setting value is '0'; (c-4) generating the analysis information generated by the analysis unit as a word count report when the index result of step (c2) and the report setting value is '1'; and (c-5) generating a data flow chart in the form of a time-series chart, diagram, or moving picture by classifying the analysis information generated by the analysis unit according to preset values stored in the database.

상기와 같은 본 발명에 따르면, 소셜 사이트로부터 각종 성향/선호도/지지율/시장/반응 조사를 위한 빅데이터를수집하여 학습을 수행하고, 학습한 빅데이터를 설정한 키워드에 따라 유사도를 분석하여 각종 지표와 통계 정보를 생성함으로써, 빅데이터의 분석기간, 분석비용 및 저장비용을 감소시키고, 분석한 빅데이터 활용에 따른 응답률을 향상시키는 효과가 있다.According to the present invention as described above, learning is performed by collecting big data for research on various tendencies/preferences/approvals/market/reactions from social sites, and similarity is analyzed according to keywords set with the learned big data to analyze various indicators and statistical information, it has the effect of reducing the analysis period, analysis cost, and storage cost of big data, and improving the response rate according to the use of the analyzed big data.

도 1은 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템을 도시한 구성도.
도 2는 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템의 세부구성을 도시한 도면.
도 3은 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템의 코드생성부 및 근거리통신부를 도시한 도면.
도 4는 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템의 프레임워크 구성을 도시한 도면.
도 5는 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템의 동작흐름을 도시한 도면.
도 6은 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템의 네트워크 구성을 도시한 도면.
도 7은 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 방법을 도시한 순서도.
도 8은 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 방법의 제S100단계의 세부과정을 도시한 순서도.
도 9는 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 방법의 제S200단계의 세부과정을 도시한 순서도.
도 10은 발명의 일 실시예에 따른 소셜 데이터 수집 분석 방법의 제S300단계의 세부과정을 도시한 순서도.
1 is a block diagram illustrating a social data collection and analysis system according to an embodiment of the present invention.
2 is a diagram illustrating a detailed configuration of a social data collection and analysis system according to an embodiment of the present invention.
3 is a diagram illustrating a code generation unit and a short-range communication unit of a social data collection and analysis system according to an embodiment of the present invention.
4 is a diagram illustrating a framework configuration of a social data collection and analysis system according to an embodiment of the present invention.
5 is a diagram illustrating an operational flow of a social data collection and analysis system according to an embodiment of the present invention.
6 is a diagram illustrating a network configuration of a social data collection and analysis system according to an embodiment of the present invention.
7 is a flowchart illustrating a social data collection and analysis method according to an embodiment of the present invention.
8 is a flowchart illustrating a detailed process of step S100 of the social data collection and analysis method according to an embodiment of the present invention.
9 is a flowchart illustrating a detailed process of step S200 of the social data collection and analysis method according to an embodiment of the present invention.
10 is a flowchart illustrating a detailed process of step S300 of the social data collection and analysis method according to an embodiment of the present invention.

본 발명의 구체적인 특징 및 이점들은 첨부 도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다. 이에앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 발명자가 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와개념으로 해석되어야 할 것이다. 또한, 본 발명에 관련된 공지 기능 및 그 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는, 그 구체적인 설명을 생략하였음에 유의해야 할 것이다The specific features and advantages of the present invention will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Prior to this, the terms or words used in the present specification and claims are based on the technical idea of the present invention based on the principle that the inventor can appropriately define the concept of the term in order to describe his invention in the best way. It should be interpreted with the corresponding meaning and concept. In addition, it should be noted that, if it is determined that the detailed description of the well-known functions related to the present invention and its configuration may unnecessarily obscure the gist of the present invention, the detailed description thereof is omitted.

도 1은 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템(S)을 도시한 구성도이고, 도 2는 본 발명의일 실시예에 따른 소셜 데이터 수집 분석 시스템(S)의 세부구성을 도시한 도면이다.1 is a block diagram showing a social data collection and analysis system (S) according to an embodiment of the present invention, Figure 2 shows a detailed configuration of the social data collection and analysis system (S) according to an embodiment of the present invention it is one drawing

도 1 및 도 2에 도시된 바와 같이, 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템(S)은, 수집부(100) 필터부(200) 및 분석부(300)를 포함하여 구성된다.1 and 2 , the social data collection and analysis system (S) according to an embodiment of the present invention is configured to include a collection unit 100 , a filter unit 200 , and an analysis unit 300 . .

먼저, 수집부(100)는 소셜 사이트로부터 데이터 수집을 위한 기초데이터를 json파일로 설정하여 관리하고, 접속된 소셜 사이트로부터 설정된 키워드에 대응하는 데이터를 수집한다.First, the collection unit 100 sets and manages basic data for data collection from a social site as a json file, and collects data corresponding to a keyword set from an accessed social site.

이때, 수집부(100)가 수집하는 데이터는 텍스트, 음성 또는 이미지 중에 어느 하나를 포함하고, 태그와 키워드를 기준으로 댓글을 수집할 수 있다.In this case, the data collected by the collecting unit 100 may include any one of text, voice, and image, and comments may be collected based on tags and keywords.

또한, 기초데이터는 소셜 사이트의 접속주소, 계정, 데이터 수집을 위한 검색어 및 수집한 데이터의 저장경로중에 어느 하나를 포함하며, 기초데이터에 포함되는 값은 관리자에 의해 추가 및 변경될 수 있다.In addition, the basic data includes any one of an access address of a social site, an account, a search word for data collection, and a storage path of the collected data, and the value included in the basic data may be added or changed by an administrator.

수집부(100)는 소셜 사이트로부터 수집한 데이터를 데이터베이스에 임시 저장하고, 다수의 소셜 사이트별로 데이터 수집을 위한 크롤링(crawling) 엔진 또는 스크래핑(scraping) 엔진을 구비하며, API 또는 Restful이 지원되지 않는 소셜 사이트의 경우, 스크래핑 엔진을 통해 데이터를 수집한다.The collection unit 100 temporarily stores data collected from social sites in a database, has a crawling engine or scraping engine for data collection for each social site, and API or Restful is not supported. For social sites, data is collected through scraping engines.

수집부(100)는 소셜 사이트 외에 레거시(legacy) 데이터베이스로부터 키워드와 대응하는 데이터 수집을 위한 별도의 모듈을 구비할 수 있다.The collection unit 100 may include a separate module for collecting data corresponding to keywords from a legacy database in addition to the social site.

수집부(100)는 데이터 수집 방식을 설정변경을 통해 API, Restful, 크롤링 또는 스크래핑 중에 어느 하나의 방식으로 변경할 수 있다.The collection unit 100 may change the data collection method to any one of API, Restful, crawling, or scraping through setting change.

필터부(200)는 기 설정된 기준에 따라 키워드 또는 금지어 각각에 대한 점수를 부여하고, 점수에 따라 데이터베이스에 수집된 데이터를 정렬 또는 필터링한다.The filter unit 200 gives a score for each keyword or prohibited word according to a preset criterion, and sorts or filters data collected in the database according to the score.

이때, 기 설정된 기준이란 한글 형태소 분석, 문장과 키워드간의 유사도 또는 단어의 출현 횟수 중에 어느 하나를 포함하며, 설정된 기준에 포함되는 값은 관리자에 의해 추가 및 변경될 수 있다.In this case, the preset criterion includes any one of Hangul morpheme analysis, similarity between sentences and keywords, or the number of occurrences of words, and a value included in the set criterion may be added or changed by an administrator.

또한, 필터부(200)는 키워드 또는 금지어 각각에 부여한 점수에 따라 베이시안 기계 학습(Bayesian MachineLearning)에 의한 결과를 토대로 데이터베이스에 수집된 데이터를 정렬 또는 필터링하도록 구성된다.In addition, the filter unit 200 is configured to sort or filter the data collected in the database based on the results of Bayesian machine learning (Bayesian MachineLearning) according to the score given to each of the keywords or prohibited words.

따라서, 본 발명의 일 실시예에 따른 필터부(200)는 관리자가 매번 변수와 파라미터를 설정하지 않고, 베이시안 기계 학습에 의해 파라미터와 변수를 결정함에 따라 능동적인 필터링이 가능하다.Accordingly, in the filter unit 200 according to an embodiment of the present invention, active filtering is possible as an administrator determines parameters and variables by Bayesian machine learning without setting variables and parameters every time.

즉, 관리자가 입력한 규칙대로만 판단하는 것이 아니라, 규칙 기반의 학습을 통해 패턴과 규칙을 재정의 하여탐색 및 필터링이 가능하다.In other words, it is possible to search and filter by redefining patterns and rules through rule-based learning, rather than judging only according to the rules entered by the administrator.

분석부(300)는 필터링된 데이터에 포함된 키워드의 빈도수를 추출하여 생성한 분석정보를 포함하는 페이지의 배너를 이미지로 생성하거나, word count 보고서를 포함한 분석정보를 생성하고, 데이터베이스에 기 저장된 설정값에 부합하는 기계 학습을 통해 필터링된 데이터를 선별하여 저장 및 관리한다.The analysis unit 300 extracts the frequency of keywords included in the filtered data to generate a banner of a page including the generated analysis information as an image, or generates analysis information including a word count report, and sets pre-stored in the database It selects, stores, and manages filtered data through machine learning that matches the value.

분석부(300)는 생성한 분석정보를 데이터베이스에 기 저장된 설정값에 따라 분류하여 시계열적인 차트, 다이어그램 또는 동영상 형태의 데이터 흐름도를 생성한다.The analysis unit 300 classifies the generated analysis information according to preset values stored in the database to generate a data flow chart in the form of a time-series chart, diagram, or video.

아울러, 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템(S)은 도 3에 도시된 바와 같이, 코드생성부(400) 및 근거리통신부(500)를 더 포함하여 구성될 수 있다.In addition, the social data collection and analysis system (S) according to an embodiment of the present invention may be configured to further include a code generation unit 400 and a short-range communication unit 500 as shown in FIG. 3 .

코드생성부(400) 분석정보 확인을 위한 레포트 페이지의 url을 바코드로 생성하여 모바일 디바이스를 통해 분석정보 확인이 가능하도록 구성된다. 이때, 바코드는 일차원 바코드 또는 이차원 바코드(QR코드) 중에 어느 하나로 생성될 수 있다.The code generation unit 400 is configured to generate the url of the report page for checking the analysis information as a barcode so that the analysis information can be checked through the mobile device. In this case, the barcode may be generated as either a one-dimensional barcode or a two-dimensional barcode (QR code).

근거리통신부(500)는 NFC 또는 비콘(beacon)에 의한 태깅시 화면을 레포트 페이지로 이동시켜 모바일 디바이스를 통해 분석정보 확인이 가능하도록 구성된다.The short-distance communication unit 500 is configured to move the screen to the report page when tagging by NFC or a beacon so that analysis information can be checked through a mobile device.

즉, 본 발명의 일 실시예에 따르면, 코드생성부(400) 및 근거리통신부(500)를 구성함으로써, 단순히 웹브라우저를 통한 데이터 접근에 국한되지 않고, 바코드 또는 NFC를 통해 모바일 디바이스를 통해서도 분석정보 확인이 가능하게 한다.That is, according to an embodiment of the present invention, by configuring the code generating unit 400 and the short-distance communication unit 500, it is not limited to simply accessing data through a web browser, but also analysis information through a mobile device through a barcode or NFC. make it possible to check

도 4는 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템(S)의 프레임워크 구성을 도시한 도면이다.4 is a diagram illustrating a framework configuration of a social data collection and analysis system (S) according to an embodiment of the present invention.

도 4에 도시된 바와 같이, Scikit-learn을 기반으로 텐서플로(Tensorflow)를 백엔드 엔진으로 구성되고, 케라스(keras)를 프론트 엔진으로 구성된다.As shown in Fig. 4, based on Scikit-learn, Tensorflow is configured as a backend engine, and Keras is configured as a front engine.

데이터 요약을 위해 newspaper모듈을 구성하고, 수집한 데이터에 포함된 텍스트의 형태소 분석과 konply라이브러리의 수치해석을 위해 판다스(pandas) 및 seaborn을 이용한다.For data summary, newspaper module is configured, and pandas and seaborn are used for morphological analysis of texts included in collected data and numerical analysis of konply library.

데이터를 분류하고 분석하는 마이닝 기능을 위해 analyzer를 구현하고, 소셜 네트워크와 레거시 데이터베이스에서의 데이터 수집을 위해 collector를 구성하였다. 이때, 분석과 분류를 위한 가공 정보를 임시로 보관하고 필터 처리저의 원장 정보 보관을 위해 MYSQL의 메모리 스토리지엔진 기반의 Integrity DB를 구성하였다.An analyzer is implemented for the mining function to classify and analyze data, and a collector is configured to collect data from social networks and legacy databases. At this time, MYSQL's memory storage engine-based Integrity DB was configured to temporarily store processing information for analysis and classification and to store the ledger information of the filter processor.

또한, 사용자가 확인할 레포트의 다양한 차트 플로팅과 동영상 기반 트렌드 정보를 보여주기 위해 matplotlib,ffmpeg 및 ggplot 라이브러리를 이용하였다.In addition, matplotlib, ffmpeg and ggplot libraries were used to show various chart plotting and video-based trend information of the report to be checked by the user.

웹서버의 구성은 node.js의 express서버 기반의 언어로 구성되고, 사용자가 하나의 UI를 통해 모바일 장비, 웹 및 응용프로그램까지 사용할 수 있도록 Electron의 기술을 사용하였다.The configuration of the web server is composed of the express server-based language of node.js, and Electron technology is used so that users can use mobile devices, web and application programs through a single UI.

도 5는 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템(S)의 프레임워크 구성에 따른 동작흐름을 도시한 도면이다. 도 5를 참조하여 프레임워크 구성에 따른 동작흐름에 대해 살피면 아래와 같다.5 is a diagram showing an operation flow according to the framework configuration of the social data collection and analysis system (S) according to an embodiment of the present invention. Referring to FIG. 5, the operation flow according to the framework configuration is as follows.

1) Configuration에 의해 Collector가 소셜 클라우드나 레거시 데이터베이스를 읽는다.1) Collector reads social cloud or legacy database by configuration.

2) 실행환경 레거시 데이터베이스나 소셜 클라우드의 사이트로부터 정보를 수집한다.2) Execution Environment Collect information from legacy databases or social cloud sites.

3) 인티그레이션용 메모리기반 데이터베이스에서 정보를 읽어들여 분류/분석한다.3) Read information from memory-based database for integration and classify/analyze it.

4) Predictor가 분석된 데이터를 학습하고 예측치를 기반으로 시각화를 하여 레포트를 생성한다.4) The predictor learns the analyzed data and creates a report by visualizing it based on the prediction.

5) 웹/모바일/응용프로그램을 하나의 통합 뷰어로 보여준다.5) Shows web/mobile/application programs as one integrated viewer.

도 6은 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 시스템(S)의 네트워크 구성을 도시한 도면이다.6 is a diagram illustrating a network configuration of a social data collection and analysis system (S) according to an embodiment of the present invention.

도 6에 도시된 바와 같이, Collector는 Social Network과 Leagacy DBMS에서 수집한 정보를 가공하고 임시보관하기 위해 Integration DB정보를 제공하고, 분석된 정보를 기반으로 학습/예측하기 위해 Predictor를 제공하며,사용자가 하나의 뷰를 다양한 장비에서 동일하게 확인할 수 있도록 Electron Viewer를 제공한다.As shown in Fig. 6, Collector provides Integration DB information to process and temporarily store information collected from Social Network and Leagacy DBMS, and provides Predictor to learn/predict based on the analyzed information, User provides Electron Viewer so that one view can be checked equally on various devices.

이하, 도 7을 참조하여 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석 방법에 대해 살피면 아래와 같다.Hereinafter, a social data collection and analysis method according to an embodiment of the present invention will be described with reference to FIG. 7 .

먼저, 수집부(100)가 접속된 소셜 사이트로부터 설정된 키워드에 대응하는 데이터를 수집한다(S100).First, the collection unit 100 collects data corresponding to the keyword set from the accessed social site (S100).

이어서, 필터부(200)가 수집된 데이터를 기 설정된 기준에 따라 부여된 점수에 따라 필터링한다(S200).Next, the filter unit 200 filters the collected data according to a score given according to a preset criterion (S200).

그리고, 분석부(300)가 필터링된 데이터에 포함된 키워드의 빈도수를 추출하여 분석정보를 생성한다(S300).Then, the analysis unit 300 extracts the frequency of keywords included in the filtered data to generate analysis information (S300).

이하, 도 8을 참조하여 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석방법의 제S100단계에 대해 살피면 아래와 같다.Hereinafter, the step S100 of the social data collection and analysis method according to an embodiment of the present invention will be described with reference to FIG. 8 .

먼저, 수집부(100)가 소셜 사이트로부터 데이터 수집을 위한 기초데이터를 json파일로 설정하여 관리한다(S102).First, the collection unit 100 sets and manages the basic data for data collection from the social site as a json file (S102).

이어서, 수집부(100)가 API, Restful, 크롤링 또는 스크래핑 중에 어느 하나의 데이터 수집 방식을 설정한다(S104).Next, the collection unit 100 sets any one data collection method among API, Restful, crawling, and scraping (S104).

뒤이어, 수집부(100)가 기초데이터와 부합하는 소셜 사이트에 접속한다(S106).Subsequently, the collection unit 100 accesses a social site that matches the basic data (S106).

이어서, 수집부(100)가 접속된 소셜 사이트로부터 설정된 키워드에 대응하는 데이터를 설정된 데이터 수집 방식으로 수집한다(S108).Next, the collecting unit 100 collects data corresponding to the set keyword from the accessed social site in a set data collecting method ( S108 ).

그리고, 수집부(100)가 소셜 사이트로부터 수집한 데이터를 데이터베이스에 임시 저장한다(S110).Then, the collection unit 100 temporarily stores the data collected from the social site in the database (S110).

이하, 도 9를 참조하여 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석방법의 제S200단계의 세부과정에 대해 살피면 아래와 같다.Hereinafter, the detailed process of step S200 of the social data collection and analysis method according to an embodiment of the present invention will be described with reference to FIG. 9 .

제S100단계 이후, 필터부(200)가 수집된 데이터를 기 설정된 기준에 따라 키워드 또는 금지어 각각에 대한 점수를 부여한다(S202).After step S100, the filter unit 200 assigns a score to each of the keywords or prohibited words according to a preset criterion for the collected data (S202).

이어서, 필터부(200)가 점수가 부여된 키워드 또는 금지어에 대해 베이시안 기계 학습을 수행한다(S204).Next, the filter unit 200 performs Bayesian machine learning on the scored keywords or prohibited words ( S204 ).

그리고, 필터부(200)가 베이시안 기계 학습 결과를 토대로 데이터베이스에 수집된 데이터를 정렬 또는 필터링 한다(S206).Then, the filter unit 200 sorts or filters the data collected in the database based on the Bayesian machine learning result (S206).

이하, 도 10을 참조하여 본 발명의 일 실시예에 따른 소셜 데이터 수집 분석방법의 제S300단계의 세부과정에 대해 살피면 아래와 같다.Hereinafter, the detailed process of step S300 of the social data collection and analysis method according to an embodiment of the present invention will be described with reference to FIG. 10 .

제S200단계 이후, 분석부(300)가 필터링된 데이터에 포함된 키워드의 빈도수를 추출하여 분석정보를 생성한다(S302).After step S200, the analysis unit 300 extracts the frequency of keywords included in the filtered data to generate analysis information (S302).

이어서, 분석부(300)가 데이터베이스에 기 저장된 보고서 설정값을 색인한다(S304).Next, the analysis unit 300 indexes the report setting values previously stored in the database (S304).

제S304단계의 색인결과 보고서 설정값이 '0'인 경우, 분석부(300)가 생성한 분석정보를 포함하는 페이지의 배너를 이미지로 생성한다(S306).When the index result report setting value in step S304 is '0', the banner of the page including the analysis information generated by the analysis unit 300 is generated as an image (S306).

반면에, 제S304단계의 색인결과 보고서 설정값이 '1'인 경우, 분석부(300)가 생성한 분석정보를 word count 보고서로 생성한다(S308)On the other hand, when the index result report set value in step S304 is '1', the analysis information generated by the analysis unit 300 is generated as a word count report (S308)

그리고, 분석부(300)가 생성한 분석정보를 데이터베이스에 기 저장된 설정값에 따라 분류하여 시계열적인 차트,다이어그램 또는 동영상 형태의 데이터 흐름도를 생성한다(S310).Then, the analysis information generated by the analysis unit 300 is classified according to the preset values stored in the database to generate a data flow chart in the form of a time-series chart, diagram, or moving picture (S310).

이상으로 본 발명의 기술적 사상을 예시하기 위한 바람직한 실시예와 관련하여 설명하고 도시하였지만, 본 발명은 이와 같이 도시되고 설명된 그대로의 구성 및 작용에만 국한되는 것이 아니며, 기술적 사상의 범주를 일탈함이 없이 본 발명에 대해 다수의 변경 및 수정이 가능함을 당업자들은 잘 이해할 수 있을 것이다. 따라서 그러한 모든 적절한 변경 및 수정과 균등 물들도 본 발명의 범위에 속하는 것으로 간주되어야 할 것이다.Although the above has been described and illustrated in relation to a preferred embodiment for illustrating the technical idea of the present invention, the present invention is not limited to the configuration and operation as shown and described as such, and deviates from the scope of the technical idea. It will be apparent to those skilled in the art that many changes and modifications may be made to the present invention without reference to the invention. Accordingly, all such suitable alterations and modifications and equivalents are to be regarded as being within the scope of the present invention.

S: 소셜 데이터 수집 분석 시스템
100: 수집부
200: 필터부
300: 분석부
400: 코드생성부
500: 근거리통신부
S: Social data collection and analysis system
100: collection unit
200: filter unit
300: analysis unit
400: code generator
500: short-distance communication department

Claims (10)

접속된 소셜 사이트로부터 설정된 키워드에 대응하는 데이터를 수집하는 수집부; 수집된 데이터를 기 설정된 기준에 따라 부여된 점수에 따라 필터링하는 필터부; 및 필터링된 데이터에 포함된 키워드의 빈도수를 추출하여 분석정보를 생성하는 분석부를 포함하되,상기 수집부는,상기 데이터 수집을 위한 기초데이터를 json파일로 설정하여 관리하고, 텍스트, 댓글, 음성 또는 이미지 중에 어느 하나를 포함하는 데이터를 수집하는 것을 특징으로 하는 소셜 데이터 수집 분석 시스템.
a collection unit that collects data corresponding to keywords set from the accessed social sites; a filter unit for filtering the collected data according to a score given according to a preset criterion; and an analysis unit generating analysis information by extracting the frequency of keywords included in the filtered data, wherein the collection unit sets and manages the basic data for data collection as a json file, text, comment, voice or image A social data collection and analysis system, characterized in that it collects data including any one of them.
제1항에 있어서,
상기 기초데이터는,소셜 사이트의 접속주소, 계정, 데이터 수집을 위한 검색어 및 수집한 데이터의 저장경로 중에 어느 하나를 포함하는 것을 특징으로 하는 소셜 데이터 수집 분석 시스템.
According to claim 1,
The basic data, Social data collection and analysis system, characterized in that it includes any one of an access address of a social site, an account, a search word for data collection, and a storage path of the collected data.
제1항에 있어서,
상기 수집부는,소셜 사이트로부터 수집한 데이터를 데이터베이스에 임시 저장하되,
다수의 소셜 사이트별로 데이터 수집을 위한 크롤링(crawling) 엔진 또는 스크래핑(scraping) 엔진을 구비하며,API 또는 Restful이 지원되지 않는 소셜 사이트의 경우, 스크래핑 엔진을 통해 데이터를 수집하는 것을 특징으로 하는 소셜 데이터 수집 분석 시스템.
According to claim 1,
The collecting unit temporarily stores data collected from social sites in a database,
Social data comprising a crawling engine or scraping engine for data collection for each social site, and collecting data through a scraping engine for social sites that do not support API or Restful collection analysis system.
제1항에 있어서,
상기 수집부는,설정변경을 통해 API, Restful, 크롤링 또는 스크래핑 중에 어느 하나의 방식으로 데이터를 수집하는 것을 특징으로 하는 소셜 데이터 수집 분석 시스템.
According to claim 1,
The collection unit, Social data collection and analysis system, characterized in that by collecting data in any one of API, Restful, crawling, and scraping through setting change.
제1항에 있어서,
상기 필터부는,수집한 데이터에 대해 한글 형태소 분석, 문장과 키워드간의 유사도 또는 단어의 출현 횟수 중에 어느 하나의기준에 따라 키워드 또는 금지어 각각에 점수를 부여하고,베이시안 기계 학습(Bayesian Machine Learning)에 의한 결과를 토대로 데이터베이스에 수집된 데이터를 정렬 또는 필터링하는 것을 특징으로 하는 소셜 데이터 수집 분석 시스템.
According to claim 1,
The filter unit assigns a score to each of the keywords or prohibited words according to any one of the criteria of Hangul morphological analysis of the collected data, the similarity between sentences and keywords, or the number of occurrences of the word, and in Bayesian Machine Learning Social data collection and analysis system, characterized in that for sorting or filtering the data collected in the database based on the results of
제1항에 있어서,
상기 분석부는,상기 분석정보를 데이터베이스에 기 저장된 설정값에 따라 분류하여 시계열적인 차트, 다이어그램 또는 동영상 형태의 데이터 흐름도를 생성하는 것을 특징으로 하는 소셜 데이터 수집 분석 시스템.
According to claim 1,
The analysis unit, Social data collection and analysis system, characterized in that by classifying the analysis information according to preset values stored in the database to generate a data flow chart in the form of a time-series chart, diagram, or video.
(a) 수집부가 접속된 소셜 사이트로부터 설정된 키워드에 대응하는 데이터를 수집하는 단계;
(b) 필터부가 수집된 데이터를 기 설정된 기준에 따라 부여된 점수에 따라 필터링하는 단계; 및
(c) 분석부가 필터링된 데이터에 포함된 키워드의 빈도수를 추출하여 분석정보를 생성하는 단계를포함하는 것을 특징으로 하는 소셜 데이터 수집 분석 방법.
(a) collecting, by a collecting unit, data corresponding to the keyword set from the accessed social site;
(b) filtering the collected data by the filter unit according to a score given according to a preset criterion; and
(c) generating analysis information by the analysis unit extracting the frequency of keywords included in the filtered data.
제7항에 있어서,
상기 (a) 단계는,
(a-1) 수집부가 소셜 사이트로부터 데이터 수집을 위한 기초데이터를 json파일로 설정하여 관리하는 단계;
(a-2) 수집부가 API, Restful, 크롤링 또는 스크래핑 중에 어느 하나의 데이터 수집 방식을 설정하는 단계;
(a-3) 수집부가 기초데이터와 부합하는 소셜 사이트에 접속하는 단계;
(a-4) 수집부가 설정된 키워드에 대응하는 데이터를 설정된 데이터 수집 방식으로 수집하는 단계; 및
(a-5) 수집부가 수집한 데이터를 데이터베이스에 임시 저장하는 단계를
포함하는 것을 특징으로 하는 소셜 데이터 수집 분석 방법.
8. The method of claim 7,
The step (a) is,
(a-1) the collecting unit setting and managing the basic data for data collection from the social site as a json file;
(a-2) the collection unit setting any one data collection method among API, Restful, crawling, or scraping;
(a-3) step of the collecting unit accessing a social site that matches the basic data;
(a-4) collecting, by a collection unit, data corresponding to the set keyword in a set data collection method; and
(a-5) temporarily storing the data collected by the collecting unit in the database;
Social data collection and analysis method comprising the.
제7항에 있어서,
상기 (b) 단계는,
(b-1) 필터부가 수집된 데이터를 기 설정된 기준에 따라 키워드 또는 금지어 각각에 대한 점수를 부여하는 단계;
(b-2) 필터부가 점수가 부여된 키워드 또는 금지어에 대해 기계 학습을 수행하는 단계; 및
(b-3) 필터부가 기계 학습 결과를 토대로 데이터베이스에 수집된 데이터를 정렬 또는 필터링하는 단계를 포함하는 것을 특징으로 하는 소셜 데이터 수집 분석 방법.
8. The method of claim 7,
The step (b) is,
(b-1) the filter unit giving the collected data a score for each keyword or prohibited word according to a preset criterion;
(b-2) performing, by the filter unit, machine learning on the scored keywords or prohibited words; and
(b-3) a social data collection and analysis method comprising the step of sorting or filtering the data collected in the database by the filter unit based on the machine learning results.
제7항에 있어서,
상기 (c) 단계는,
(c-1) 분석부가 필터링된 데이터에 포함된 키워드의 빈도수를 추출하여 분석정보를 생성하는 단계;
(c-2) 분석부가 데이터베이스에 기 저장된 보고서 설정값을 색인하는 단계;
(c-3) 상기 (c-2) 단계의 색인결과, 보고서 설정값이 '0'인 경우, 분석부가 생성한 분석정보를 포함하는 페이지의 배너를 이미지로 생성하는 단계;
(c-4) 상기 (c-2) 단계의 색인결과, 보고서 설정값이 '1'인 경우, 분석부가 생성한 분석정보를 word count 보고서로 생성하는 단계; 및
(c-5) 분석부가 생성한 분석정보를 데이터베이스에 기 저장된 설정값에 따라 분류하여 시계열적인 차트, 다이어그램 또는 동영상 형태의 데이터 흐름도를 생성하는 단계를 포함하는 것을 특징으로 하는 소셜 데이터 수집 분석 방법.

8. The method of claim 7,
Step (c) is,
(c-1) generating analysis information by the analysis unit extracting the frequency of keywords included in the filtered data;
(c-2) indexing the report setting values previously stored in the database by the analysis unit;
(c-3) generating a banner of a page including the analysis information generated by the analysis unit as an image when the index result of the step (c-2) and the report setting value is '0';
(c-4) generating the analysis information generated by the analysis unit as a word count report when the index result of step (c-2) and the report setting value is '1'; and
(c-5) classifying the analysis information generated by the analysis unit according to preset values stored in the database to generate a data flow chart in the form of a time-series chart, diagram, or video.

KR1020200187384A 2020-12-30 2020-12-30 Social data collection and analysis system KR20220095654A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200187384A KR20220095654A (en) 2020-12-30 2020-12-30 Social data collection and analysis system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200187384A KR20220095654A (en) 2020-12-30 2020-12-30 Social data collection and analysis system

Publications (1)

Publication Number Publication Date
KR20220095654A true KR20220095654A (en) 2022-07-07

Family

ID=82398051

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200187384A KR20220095654A (en) 2020-12-30 2020-12-30 Social data collection and analysis system

Country Status (1)

Country Link
KR (1) KR20220095654A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102538774B1 (en) * 2022-10-25 2023-06-01 황지인 Method and apparatus for using review analysis based on artificial intelligence model

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102538774B1 (en) * 2022-10-25 2023-06-01 황지인 Method and apparatus for using review analysis based on artificial intelligence model

Similar Documents

Publication Publication Date Title
US9317613B2 (en) Large scale entity-specific resource classification
JP5092165B2 (en) Data construction method and system
WO2017097231A1 (en) Topic processing method and device
Huang et al. Topic detection from large scale of microblog stream with high utility pattern clustering
CN110232126B (en) Hot spot mining method, server and computer readable storage medium
KR100974064B1 (en) System for providing information adapted to users and method thereof
CA2919878A1 (en) Refining search query results
CN111708774A (en) Industry analytic system based on big data
JP5943756B2 (en) Search for ambiguous points in data
KR20200000208A (en) Social data collection analysis system and method
KR20220095654A (en) Social data collection and analysis system
CN110874366A (en) Data processing and query method and device
KR100557874B1 (en) Method of scientific information analysis and media that can record computer program thereof
KR102025813B1 (en) Device and method for chronological big data curation system
KR20210060830A (en) Big data intelligent collecting method and device
CN110825792A (en) High-concurrency distributed data retrieval method based on golang middleware coroutine mode
CN113360313B (en) Behavior analysis method based on massive system logs
Trieschnigg et al. Hierarchical topic detection in large digital news archives: exploring a sample based approach
Kotenko et al. The intelligent system for detection and counteraction of malicious and inappropriate information on the Internet
KR100667917B1 (en) A method of providing website searching service and a system thereof
CN109101506A (en) Based on visual searching method and system
KR101718599B1 (en) System for analyzing social media data and method for analyzing social media data using the same
KR20240015278A (en) Social data collection analysis system
JP2022137569A (en) Information management system
KR100931772B1 (en) A method of providing website searching service and a system thereof