KR20230099822A - System of making market report based on ai and method thereof - Google Patents

System of making market report based on ai and method thereof Download PDF

Info

Publication number
KR20230099822A
KR20230099822A KR1020210189184A KR20210189184A KR20230099822A KR 20230099822 A KR20230099822 A KR 20230099822A KR 1020210189184 A KR1020210189184 A KR 1020210189184A KR 20210189184 A KR20210189184 A KR 20210189184A KR 20230099822 A KR20230099822 A KR 20230099822A
Authority
KR
South Korea
Prior art keywords
data
market
report
market research
sentences
Prior art date
Application number
KR1020210189184A
Other languages
Korean (ko)
Inventor
임승환
Original Assignee
(주)제스아이앤씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)제스아이앤씨 filed Critical (주)제스아이앤씨
Priority to KR1020210189184A priority Critical patent/KR20230099822A/en
Publication of KR20230099822A publication Critical patent/KR20230099822A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Biophysics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 AI기반의 시장 조사 보고서 작성 시스템 및 이를 이용한 시장 조사 보고서 작성 방법에 관한 것으로서, 보다 상세하게는 시장 수요에 따라서 시장분석을 위한 빅데이터 수집, 분석으로 시장조사, 업계 동향 조사, 통계조사, 여론조사 등과 같은 수치화된 데이터 분석을 수행하고, AI가 동향 및 정책 방향 제시를 위한 전문적인 수준의 보고서 생산과 동시에 생성된 보고서의 산츨 근거를 제시함으로써 생성된 보고서의 신뢰성과 산출 결과에 대한 검증이 가능하도록 하고, AI의 반복학습을 통하여 보고서 생성에 대한 신뢰성과 검증 능력을 향상시킬 수 있도록 하는 AI기반의 시장 조사 보고서 작성 시스템 및 이를 이용한 시장 조사 보고서 작성 방법에 관한 것이다.
본 발명에 따르면 중소기업들이 전문적인 기획 인력이 부족한 중소기업에서 즉각적으로 기업의 의사결정에 적용하여 신규 제품 및 서비스 개발, 시장분석 등에 적용이 가능한 보고서를 작성하여 활용할 수 있는 효과가 있다.
The present invention relates to an AI-based market research report writing system and a method for writing a market research report using the same, and more specifically, market research, industry trend research, and statistical research by collecting and analyzing big data for market analysis according to market demand. , quantified data analysis such as public opinion polls, AI produces professional-level reports to present trends and policy directions, and at the same time presents the basis for calculation of generated reports, thereby verifying the reliability of generated reports and the results of their calculations. It relates to an AI-based market research report writing system and a method of writing a market research report using the same, which enables this to be possible and improves the reliability and verification ability of report generation through repeated AI learning.
According to the present invention, there is an effect that small and medium-sized enterprises can write and utilize reports that can be applied to new product and service development, market analysis, etc.

Description

AI기반의 시장 조사 보고서 작성 시스템 및 이를 이용한 시장 조사 보고서 작성 방법{SYSTEM OF MAKING MARKET REPORT BASED ON AI AND METHOD THEREOF}AI-based market research report writing system and method of writing a market research report using the same {SYSTEM OF MAKING MARKET REPORT BASED ON AI AND METHOD THEREOF}

본 발명은 AI기반의 시장 조사 보고서 작성 시스템 및 이를 이용한 시장 조사 보고서 작성 방법에 관한 것으로서, 보다 상세하게는 시장 수요에 따라서 시장분석을 위한 빅데이터 수집, 분석으로 시장조사, 업계 동향 조사, 통계조사, 여론조사 등과 같은 수치화된 데이터 분석을 수행하고, AI가 동향 및 정책 방향 제시를 위한 전문적인 수준의 보고서 생산과 동시에 생성된 보고서의 산츨 근거를 제시함으로써 생성된 보고서의 신뢰성과 산출 결과에 대한 검증이 가능하도록 하고, AI의 반복학습을 통하여 보고서 생성에 대한 신뢰성과 검증 능력을 향상시킬 수 있도록 하는 AI기반의 시장 조사 보고서 작성 시스템 및 이를 이용한 시장 조사 보고서 작성 방법에 관한 것이다.The present invention relates to an AI-based market research report writing system and a method for writing a market research report using the same, and more specifically, market research, industry trend research, and statistical research by collecting and analyzing big data for market analysis according to market demand. Verification of the reliability and calculation results of the generated report by performing quantified data analysis such as , public opinion polls, etc., and presenting the calculation basis of the generated report at the same time as the AI produces a professional-level report for presenting trends and policy directions. It is about an AI-based market research report writing system and a method of writing a market research report using the AI-based market research report writing system that enables this and improves the reliability and verification ability of report generation through repeated AI learning.

모든 국내외 기업들은 기업의 제품 및 서비스 개발, 마케팅, 광고, 홍보, 경영계획 수립 등의 중요한 의사결정을 위하여 웹, 뉴스, 정책자료, 기타 보고서, 소셜미디어, SNS에서 연관된 키워드 검색 등을 통해서 시장 동향, 산업 동향, 경쟁사 동향, 시장 니즈, 소비자 니즈, 트렌드 등과 소비자 반응에 대한 정보를 수집하고 이를 이용하여 시장 조사 보고서 작성에 활용한다.All domestic and foreign companies use the web, news, policy materials, other reports, social media, and SNS to make important decisions such as product and service development, marketing, advertising, public relations, and business plan establishment. , Industry trends, competitor trends, market needs, consumer needs, trends, etc. are collected and used to prepare market research reports.

기업들은 이러한 시장조사 자료를 신규 제품 및 서비스를 개발, 판매, 마케팅 활동에 있어서 성공의 중요 요소인 시장 조사 및 분석, 설계, 개발 단계에 활용하고 있다.Companies use these market research data in the stages of market research, analysis, design, and development, which are important factors for success in developing, selling, and marketing new products and services.

2019년 CMO Survey 조사에 따르면 전세계 유수의 기업이 마케팅 예산의 약 32%를 시장 조사 및 인사이트 분석에 배분하고 활용하고 있지만, 재정적인 여건이 되지 않는 기업들은 시장조사 및 분석을 제대로 진행하고 있지 못한 상황이다.According to the 2019 CMO Survey, leading companies around the world are allocating and utilizing about 32% of their marketing budgets for market research and insight analysis, but companies that do not have financial conditions are not properly conducting market research and analysis. am.

여건이 허락하는 일부 중소기업 이상에서는 자체 기획인력을 통한 시장조사를 하거나, 전문 산업별 시장 분석 보고서를 제공하는 서비스를 이용하여 기업이 속한 산업군에 대한 시장 자료 확보를 위해서 보고서를 구매하여 이용하고 있다. 그러나, 기획인력확보의 부재 또는 산업별 시장 분석 보고서의 비용 및 보고서 품질 문제로 인해서 자금 여력이 있는 중소기업 이상의 기업들만 가능한 상황이며, 여전히 기업에 필요한 맞춤형 보고서를 위해서는 자체 기획인력의 확보, 보고서 재가공이나 별도의 시장 조사가 필요한 상황이다.More than a few small and medium-sized enterprises (SMEs) where conditions allow, conduct market research through their own planning personnel or purchase and use reports to secure market data for the industry to which the company belongs by using a service that provides market analysis reports for each specialized industry. However, due to the lack of planning manpower or cost and report quality problems of industry-specific market analysis reports, only small and medium-sized enterprises (SMEs) or higher with financial resources can do so. market research is required.

특히, 해외시장에 대한 동향조사의 경우, KOTRA 시장 보고서 외에 시장 조사 단계에 있어서 그 어려움이 가중되고 있다.In particular, in the case of trend research on overseas markets, the difficulty is increasing in the market research stage besides the KOTRA market report.

또한, 대부분의 국내외 기업들은 웹이나 SNS 상에서 수집한 정보의 신뢰성 문제와 함께 정보 과잉으로 인해 기업들의 잘못된 시장 조사 및 시장 분석 보고서가 작성되고, 잘못된 정보를 담고 있는 보고서가 기업의 중요한 의사결정에 반영되고 있는 상황이다.In addition, most domestic and foreign companies have problems with the reliability of information collected on the web or SNS, and due to information overload, incorrect market research and market analysis reports are written, and reports containing incorrect information are reflected in important decision-making of the company. situation is going on.

특히, 전문기획 인력이 없거나 부족한 중소기업들은 이러한 시장 조사를 제대로 수행하지 못하거나, 웹과 SNS 상의 잘못된 정보에 기반한 시장 조사 및 분석 보고서 작성으로 중소기업의 신규 제품 및 서비스 개발, 광고 홍보 마케팅 전략 수립, 시장 및 소비자 요구사항 예측, 소비자 반응 조사 등에 있어서 심각한 경영 계획의 판단착오로 직결되는 문제로도 확대될 수 있는 문제점이 있다.In particular, SMEs that do not have or lack professional planning personnel do not properly conduct such market research or prepare market research and analysis reports based on incorrect information on the web and SNS to develop new products and services, establish advertising promotion marketing strategies, and market And there is a problem that can be expanded to a problem that is directly connected to a serious misjudgment in business planning in predicting consumer requirements, surveying consumer responses, and the like.

2017년말을 기준으로 국내 산업별 중소기업 수는 약 630만개로 전체 기업의 90% 이상을 차지하고, 전체 종사자의 82.9%를 차지하고 있으며, 국내 일자리 창출의 97%, 세계 일류 상품 수 401개를 차지하는 등, 국내에서 중소기업은 산업에서 중요한 위치와 가치를 지니고 있다.As of the end of 2017, the number of SMEs by industry in Korea was about 6.3 million, accounting for more than 90% of all companies, 82.9% of all employees, 97% of domestic job creation, and 401 world-class products. SMEs have an important position and value in the industry.

하지만, 전문적인 기획 인력을 보유하지 못하고 있는 30인 미만 중소기업이 전체 사업자 비율에서 95.6%를 차지 하고 있는 상황이어서 중소기업들은 시장 조사 및 분석을 위한 전문 인력 확보 문제와 비용 문제, 보고서의 품질 문제 등으로 시장 분석 보고서 서비스, 시장 조사 리서치 기관을 이용하는 것도 제한적이다.However, as SMEs with less than 30 employees who do not have professional planning personnel account for 95.6% of the total business operators, SMEs face problems in securing professional manpower for market research and analysis, cost problems, and report quality problems. The use of market analysis report services and market research research institutes is also limited.

이와 같이, 중소기업들에게 중요한 시장 조사 및 분석 단계를 위한 시장 자료 확보가 어렵고, 기업 경영에 있어서 중요 의사결정 등에서 경험기반의 의사결정을 하는 문제 등이 발생한다.As such, it is difficult to secure market data for market research and analysis, which is important for SMEs, and problems arise in making experience-based decisions in important decisions in business management.

특히, 최신 시장 동향과 트렌드에 민감하며, 최근 창업이 증가하고 있는 벤처기업 및 스타트업 기업들은 전문기획 인력뿐만 아니라 자체 인력 부족과 경험 부족으로 시장 조사 및 분석 보고서 생산에 한계를 지니는 반면, 최신 시장에 대한 트렌드에 대한 주기적인 정보수집이 절대적으로 필요한 상황에서 보고서 건별로 수주가 소요되고 최소 수백만원에 달하는 시장 조사를 위한 외주보고서 의뢰를 감당하기에 한계가 있다.In particular, venture companies and start-up companies, which are sensitive to the latest market trends and trends, and whose business establishments are increasing recently have limitations in market research and production of analysis reports due to lack of professional planning personnel as well as their own personnel and experience. In a situation where periodic information collection on trends is absolutely necessary, each report takes several weeks and there is a limit to handling outsourcing reports for market research worth at least millions of won.

KRKR 10-2018-0075852 10-2018-0075852 AA KRKR 10-2018-0059167 10-2018-0059167 AA

전술한 문제점을 해결하기 위한 본 발명은 AI기반으로 수집된 데이터로부터 핵심 단어 추출, 핵심 문장 추출, 문장 작문 기능 개발을 통해서 전문적인 시장 조사 및 분석 보고서를 자동 생성하며, 전문적인 시장 조사 및 분석기법이 적용된 AI에 대한 딥러닝 학습모델을 개발하여 생성된 보고서에 대한 신뢰성 확보를 위한 검증 기술을 제공할 수 있는 AI기반의 시장 조사 보고서 작성 시스템 및 이를 이용한 시장 조사 보고서 작성 방법을 제공하는 것을 목적으로 한다.The present invention for solving the above problems automatically generates professional market research and analysis reports through the development of key word extraction, key sentence extraction, and sentence writing functions from data collected based on AI, and professional market research and analysis techniques. The purpose of this is to provide an AI-based market research report writing system that can provide verification technology to secure the reliability of the generated report by developing a deep learning learning model for applied AI and a method of writing a market research report using the same do.

또한 본 발명은 웹과 SNS, 정책자료, 통계자료, 공개데이터로부터 시장 자료 수집/분류/분석 기술을 개발하고, 멀티프로세싱 데이터 크롤링 모듈 인터페이스를 개발하고 수집 데이터에 대한 데이터 전처리 기능을 개발하는 AI기반의 시장 조사 보고서 작성 시스템 및 이를 이용한 시장 조사 보고서 작성 방법을 제공하는 것을 목적으로 한다.In addition, the present invention is AI-based to develop market data collection / classification / analysis technology from the web, SNS, policy data, statistical data, and open data, develop a multi-processing data crawling module interface, and develop a data pre-processing function for collected data. Its purpose is to provide a market research report writing system and a market research report writing method using the same.

또한 본 발명은 시장조사에 대한 최종 보고서 생성시 Appendix 형태로 보고서 생성에 사용한 근거를 제시하고, 자료를 첨부할 수 있도록 하는 기술을 개발하고, 최종 보고서 생성시 HTML5 기반 지능형 컨텐츠 퍼블리싱 기술을 개발하도록 하는 AI기반의 시장 조사 보고서 작성 시스템 및 이를 이용한 시장 조사 보고서 작성 방법을 제공하는 것을 목적으로 한다.In addition, the present invention presents the grounds used for generating a report in the form of an appendix when generating a final report on market research, develops a technology that enables data to be attached, and develops an HTML5-based intelligent content publishing technology when generating a final report. Its purpose is to provide an AI-based market research report writing system and a market research report writing method using the same.

전술한 문제점을 해결하기 위해 안출된 본 발명은 웹(400)을 통해 시장에 대한 데이터를 수집하고, 수집된 데이터를 분석하여 시장 상황에 대한 보고서를 작성하는 작성 시스템으로서, 멀티 프로세싱 크롤링 기술 및 분산 AI 에이전트 기술을 바탕으로 웹(400)에 존재하는 초대용량 시장 자료를 수집하는 데이터수집부(102)와; 상기 데이터수집부(102)가 수집한 데이터를 저장하는 데이터DB(104)와; 상기 데이터에 대해서 중요 단어를 추출하며, 상기 웹(200)에서 수집된 문서기반에서 단어 단위로 추출한 후 단어의 빈도수 계산을 하는 빈도수 키워드 알고리즘을 통해 중요 단어를 추출하는 데이터전처리모듈(106)과; AI 기반의 딥러닝 학습 방법을 사용하여 상기 데이터에 대한 자동 요약 기술을 적용하고, 수집된 데이터에서 문장을 추출하고 그 문장이 포함된 문서를 요약 하는 딥러닝학습모듈(108)과; 지능형 컨텐츠 퍼블리싱 기능을 기반으로 수집된 데이터에 AI 기반으로 핵심 단어, 문장을 추출하고, 빈도 수에 따른 중요도 분류, 연관성을 높은 단어 간의 관계를 추출하여 이를 바탕으로 시장 조사 및 분석 보고서에 필요한 문장을 구성하여 보고서를 작성하는 보고서작성모듈(110);을 포함한다.The present invention, conceived to solve the above problems, is a writing system that collects market data through the web 400 and analyzes the collected data to create a report on the market situation. Based on the AI agent technology, a data collection unit 102 that collects super-capacity market data existing on the web 400; a data DB (104) for storing the data collected by the data collection unit (102); A data pre-processing module 106 for extracting important words from the data and extracting important words through a frequency keyword algorithm that calculates the frequency of words after extracting them word by word from the document base collected on the web 200; A deep learning learning module 108 that applies an automatic summary technique to the data using an AI-based deep learning learning method, extracts sentences from the collected data, and summarizes documents including the sentences; Key words and sentences are extracted based on AI from the data collected based on the intelligent content publishing function, and the importance is classified according to frequency, and the relationship between words with high relevance is extracted. A report creation module 110 configured to create a report; includes.

상기 데이터수집부(102)는 상기 웹(400)을 통해 복수의 데이터를 수집하는 데이터크롤링모듈(102a)과; 상기 웹(400)을 통해 수집한 데이터에 대해서 AI 기반으로 핵심 단어와 문장을 자동으로 추출하는 데이터수집모듈(102b)과; 사용자가 키워드 검색을 통해서 선택적으로 확인이 가능하며 이를 통해 효율적으로 원하는 시장 조사 및 분석 보고서를 생성할 수 있도록 핵심 단어 추출 알고리즘을 실행하는 데이터분류모듈(102c)과; 추출된 핵심 단어에 대한 데이터를 상기 데이터DB(104)에 저장하는 데이터저장모듈(102d);을 포함한다.The data collection unit 102 includes a data crawling module 102a for collecting a plurality of data through the web 400; A data collection module (102b) for automatically extracting key words and sentences based on AI from the data collected through the web (400); A data classification module 102c that executes a key word extraction algorithm so that a user can selectively check through keyword search and efficiently generate a desired market research and analysis report through this; and a data storage module (102d) for storing data on the extracted key words in the data DB (104).

상기 보고서작성모듈(110)은 사용자 요구사항에 맞춰 수집된 정형/비정형 시장자료와 비교하여 핵심 단어 및 문장을 추출하고, 추출된 핵심 단어 및 문장의 결합을 통해서 시장 조사 및 분석 보고서를 생성하되, 상기 AI는 전문적인 시장 조사 및 분석 기법에 의거하여 생성된 컨텐츠를 템플릿 기반으로 보고서를 제공하며, 보고서 생성시 HTML5기반 차트, 그래프와 같은 동적 콘텐츠를 생성하여 적용하는 것을 특징으로 한다.The report writing module 110 extracts key words and sentences by comparing them with structured/atypical market data collected according to user requirements, and generates a market research and analysis report through a combination of the extracted key words and sentences, The AI provides a template-based report of content generated based on professional market research and analysis techniques, and is characterized by generating and applying dynamic content such as HTML5-based charts and graphs when generating a report.

상기 보고서작성모듈(110)은 수집된 데이터의 핵심 단어 및 문장의 문서 단위별 관계로부터 전역 수준의 관계를 추출하되, AI에 대한 반복훈련을 통해서 각각 단편적 관계 추출 모델의 훈련의 제1단계, 전역 관계를 위한 메모리 증강 신경망 훈련의 제2단계, 메모리 증강 신경망 훈련의 결과를 반영한 관계 추출 모델의 재훈련의 제3단계로 수행되는 것을 특징으로 한다.The report writing module 110 extracts the global-level relationship from the document-by-document relationship of the key words and sentences of the collected data, and the first step of training each fragmentary relationship extraction model through repeated training for AI, the global It is characterized in that it is performed as a second step of training the memory enhancement neural network for relationships and a third step of retraining a relationship extraction model reflecting the results of memory enhancement neural network training.

다른 실시예에 따른 본 발명은 전 항의 작성 시스템을 이용한 작성 방법으로서, 제품 및 시장에 관련되어 정형/비정형 시장자료를 포함하는 사용자 요구사항 입력 단계와; 상기 사용자가 입력한 요구사항을 분석하여 주된 목표를 이해하는 단계와; 데이터수집부(102)가 시장자료를 인터넷(200)을 통해 연결된 복수의 웹(400) 상에서 수집하는 단계와; 데이터전처리모듈(106)이 상기 인터넷(200)을 통해 수집된 데이터를 전처리하여 보고서의 내용과 직접적으로 관련된 데이터를 분류하는 단계와; 보고서작성모듈(110)이 자연어처리(NLP) 엔진을 이용하여 단어를 추출하거나 문장에 대한 이해를 바탕으로 텍스트 변환 후 사람이 이해 가능한 수준의 단어를 나열하고 문장을 추출해서 컨텐츠를 생성함으로써 시장 보고서를 작성하는 단계;를 포함한다.The present invention according to another embodiment is a preparation method using the preparation system of the preceding paragraph, comprising the steps of inputting user requirements including structured/atypical market data related to products and markets; analyzing the requirements input by the user to understand the main goal; Collecting, by the data collection unit 102, market data on a plurality of webs 400 connected through the Internet 200; pre-processing the data collected through the Internet 200 by the data pre-processing module 106 and classifying data directly related to the content of the report; The report writing module 110 extracts words using a natural language processing (NLP) engine or converts text based on understanding of sentences, lists words at a level that can be understood by humans, extracts sentences, and generates content to generate market reports. Writing a; includes.

본 발명에 따르면 중소기업들이 전문적인 기획 인력이 부족한 중소기업에서 즉각적으로 기업의 의사결정에 적용하여 신규 제품 및 서비스 개발, 시장분석 등에 적용이 가능한 보고서를 작성하여 활용할 수 있는 효과가 있다.According to the present invention, there is an effect that small and medium-sized enterprises can write and utilize reports that can be applied to new product and service development, market analysis, etc.

또한 웹 상에서 수집된 데이터에서 사용자 요구사항에 맞춰서 생성된 보고서 검증을 위해 AI에 대한 교차검증(Cross-Validation) 알고리즘을 학습시키고, 보고서의 과편향 검증을 통해서 보고서의 내용을 검증하는 알고리즘을 적용하고, 수집된 데이터 분석 과정에서 지속적인 반복학습과 생성된 보고서를 재분석하는 과정을 거치면서 보고서의 신뢰성을 향상시킬 수 있는 효과가 있다.In addition, cross-validation algorithms for AI are trained to verify reports generated according to user requirements from data collected on the web, and algorithms that verify the contents of reports are applied through over-bias verification of reports. However, in the process of analyzing the collected data, there is an effect of improving the reliability of the report through the process of continuous iterative learning and reanalysis of the generated report.

도 1은 본 발명의 작성 시스템을 이용하여 시장조사 및 분석 보고서를 제공하는 플랫폼의 작업흐름을 나타낸 개념도.
도 2는 본 발명의 작성 시스템의 구성을 나타낸 블럭도.
도 3은 작성 시스템을 이용하여 시장조사 및 분석 보고서를 작성하는 과정을 나타낸 순서도.
도 4는 분석 보고서를 작성하는 상세한 과정을 나타낸 순서도.
도 5는 시장조사 및 분석 보고서의 자동 생성기능을 나타낸 개념도.
도 6은 크롤링을 통해 수집된 데이터에 대한 토픽모델링을 이용한 문장 추출 방법을 나타낸 개념도.
1 is a conceptual diagram showing a workflow of a platform for providing market research and analysis reports using the writing system of the present invention.
Fig. 2 is a block diagram showing the configuration of the creation system of the present invention;
Figure 3 is a flow chart showing a process of creating a market research and analysis report using the writing system.
Figure 4 is a flow chart showing a detailed process of creating an analysis report.
5 is a conceptual diagram showing an automatic generation function of a market research and analysis report;
6 is a conceptual diagram illustrating a sentence extraction method using topic modeling for data collected through crawling;

이하에서 도면을 참조하여 본 발명의 실시예에 따른 "AI기반의 시장 조사 보고서 작성 시스템 및 이를 이용한 시장 조사 보고서 작성 방법"을 설명한다.Hereinafter, an embodiment of the present invention will be described with reference to the drawings, "AI-based market research report writing system and method of writing a market research report using the same".

도 1은 본 발명의 작성 시스템을 이용하여 시장조사 및 분석 보고서를 제공하는 플랫폼의 작업흐름을 나타낸 개념도이며, 도 2는 본 발명의 작성 시스템의 구성을 나타낸 블럭도, 도 3은 작성 시스템을 이용하여 시장조사 및 분석 보고서를 작성하는 과정을 나타낸 순서도, 도 4는 분석 보고서를 작성하는 상세한 과정을 나타낸 순서도, 도 5는 시장조사 및 분석 보고서의 자동 생성기능을 나타낸 개념도. 도 6은 크롤링을 통해 수집된 데이터에 대한 토픽모델링을 이용한 문장 추출 방법을 나타낸 개념도이다.1 is a conceptual diagram showing the workflow of a platform for providing market research and analysis reports using the writing system of the present invention, Figure 2 is a block diagram showing the configuration of the writing system of the present invention, Figure 3 is using the writing system A flowchart showing the process of creating a market research and analysis report, Figure 4 is a flowchart showing a detailed process of creating an analysis report, Figure 5 is a conceptual diagram showing the automatic generation of market research and analysis reports. 6 is a conceptual diagram illustrating a sentence extraction method using topic modeling for data collected through crawling.

본 발명의 "AI기반의 시장 조사 보고서 작성 시스템"(이하, '작성 시스템'이라 함)은 AI(인공지능)가 사용자 요구사항에 맞춰서 시장 자료를 수집 및 분석하고, 이용자 및 기업에 필요한 시장 동향, 산업 동향, 제품 동향, 경쟁사 동향, 소비자 동향 등 시장 조사 및 분석 단계에 맞춰서 학습된 AI가 기업이 요구하는 시장 조사 및 분석 보고서를 자동 생성하고 제공하는 서비스 플랫폼을 제공하는 기능을 한다.The "AI-based market research report writing system" (hereinafter referred to as 'writing system') of the present invention collects and analyzes market data according to user requirements by AI (Artificial Intelligence), and market trends necessary for users and companies. , Industry trends, product trends, competitor trends, consumer trends, etc. AI learned in accordance with the market research and analysis stage functions to provide a service platform that automatically generates and provides market research and analysis reports required by companies.

인터넷(200)을 통해 다수의 작성 시스템(100)은 중소기업에서 신규 제품 및 서비스 개발을 위해 활용하는 NPD Process에서 각 단계별 (1)AI가 전문 시장 조사 및 분석 기법을 적용하여 자동으로 보고서 생성하는 기술, (2)AI 성능 향상을 위한 딥러닝 학습 모델, (3)생성된 보고서에 대한 신뢰도 확보를 위한 검증 기술, (4)시장 조사 및 분석 보고서 근거제시 기술, (5) 대용량 시장 자료 수집 기술 등을 실행한다.Through the Internet (200), a number of writing systems (100) are used for each step in the NPD Process used by small and medium-sized businesses to develop new products and services (1) AI technology that automatically generates reports by applying specialized market research and analysis techniques , (2) deep learning learning model to improve AI performance, (3) verification technology to secure the reliability of generated reports, (4) market research and analysis report presentation technology, (5) mass market data collection technology, etc. run

그리고 작성 시스템(100)은 AI가 시장 조사 및 분석 보고서 생성을 위해서 보고서 생성 시 전문적인 시장 조사 및 분석 기법(STEEP, PEST (PESTLE), U&A분석, 고객 VOC분석, 고객선호도 분석, 구입경로 확인 등)을 적용이 될 수 있도록 주요 정형/비정형 데이터를 이용하여 AI를 학습시키고, 반복학습, 강화학습을 통해서 성능 향상된 AI를 통해서 수집된 데이터로부터 사용자 요구사항에 맞춤형으로 보고서를 생성하여 제공한다. 또한 전문 기획 및 마케팅 인력을 보유하지 못한 중소기업에서 즉시 활용이 가능한 품질의 시장 조사 및 분석 보고서를 제공하여 신규 제품 및 서비스 개발, 영업 및 마케팅 활동에 활용이 가능하도록 하는 서비스를 제공할 수 있다.In addition, the writing system 100 is a professional market research and analysis technique (STEEP, PEST (PESTLE), U & A analysis, customer VOC analysis, customer preference analysis, purchase route confirmation, etc. ) is applied, AI is trained using major structured/unstructured data, and reports are created and provided customized to user requirements from data collected through AI with improved performance through repetitive learning and reinforcement learning. In addition, it can provide a service that can be used for new product and service development, sales and marketing activities by providing quality market research and analysis reports that can be immediately used by small and medium-sized enterprises that do not have professional planning and marketing personnel.

작성 시스템(100)은 사용자 요구사항에 맞춰 수집된 정형/비정형 시장자료와 비교하여 핵심 단어 추출, 문장 추출, 추출된 핵심 단어, 문장의 결합을 통해서 시장 조사 및 분석 보고서를 생성하는 기술을 개발하여 제공하며, 학습된 AI는 전문적인 시장 조사 및 분석 기법에 의거하여 보고서를 생성하여 제공하고, 생성된 컨텐츠를 템플릿 기반으로 활용 가능한 보고서를 제공한다. 그리고 보고서 생성시 HTML5기반 차트, 그래프 등 동적 콘텐츠를 생성하여 적용하는 기술을 구현한다.The writing system 100 compares structured / unstructured market data collected according to user requirements, extracts key words, extracts sentences, and develops technology for generating market research and analysis reports through combination of extracted key words and sentences. The learned AI creates and provides reports based on professional market research and analysis techniques, and provides reports that can be used based on templates. And when creating a report, implement the technology to create and apply dynamic content such as HTML5-based charts and graphs.

작성 시스템(100)은 시장 조사 및 분석 보고서를 생성 하는데 있어서 AI가 전문적인 시장 조사 및 분석기법이 적용이 되는 학습모델을 개발 제공하며, AI의 성능향상과 의사결정을 위해서 AI에 대한 딥러닝 학습모델을 설계하고 적용한다. 또한 AI 학습데이터 셋을 통한 반복학습 모델을 제공하며, AI의 의사결정에 의한 최적의 결과를 추론하는 강화학습 모델을 제공한다.The writing system 100 develops and provides a learning model to which AI professional market research and analysis techniques are applied in generating market research and analysis reports, and deep learning for AI for performance improvement and decision making. Design and apply the model. In addition, it provides an iterative learning model through an AI learning data set, and a reinforcement learning model that infers the optimal result by AI decision-making.

작성 시스템(100)은 AI가 생성한 시장 조사 및 분석 보고서에 대해서 검증을 통해서 시장 자료에 대한 신뢰성 확보 기술을 개발하며, 생성된 보고서에 대한 교차검증 기법을 적용한다. 그리고 생성된 보고서에 대한 과편향 분별 기법을 적용하여 생성된 최종 보고서를 재등록하고 최신 데이터들을 지속적으로 적용하여 보고서 생산 수준을 향상 시킬 수 있는 기능을 제공한다.The writing system 100 develops technology for ensuring reliability of market data through verification of market research and analysis reports generated by AI, and applies a cross-verification technique to the generated reports. In addition, it provides a function to improve the level of report production by re-registering the final report generated by applying the over-bias classification technique to the generated report and continuously applying the latest data.

작성 시스템(100)에 포함된 데이터수집부(102)는 멀티 프로세싱 크롤링 기술 및 분산 AI 에이전트 기술을 바탕으로 웹과 SNS에 존재하는 초대용량 시장 자료를 수집하여 데이터DB(104)에 저장한다. 시장 자료는 웹과 SNS 크롤링, 정책 데이터, 시장 뉴스 및 통계, 공개데이터, 문서파일, 기업내부 데이터를 모두 포함할 수 있다. 작성 시스템(100)의 데이터 수집기술은 시장 분석 보고서를 제공하기 위해서 사용자가 보유하고 있는 문서파일 및 시스템과 RESTFul 방식의 연동 규격을 제공하도록 구현될 수 있다.The data collection unit 102 included in the creation system 100 collects super-capacity market data existing on the web and SNS based on multi-processing crawling technology and distributed AI agent technology and stores them in the data DB 104. Market data can include web and social media crawling, policy data, market news and statistics, open data, document files, and internal company data. The data collection technology of the writing system 100 may be implemented to provide a document file and system possessed by the user and a RESTFul method interlocking specification in order to provide a market analysis report.

보고서작성모듈(110)은 이러한 목적을 실행하기 위해 아래와 같은 기능을 구비할 수 있다.The report creation module 110 may have the following functions in order to accomplish this purpose.

- AI기반 전문적인 시장 조사 및 분석 보고서 자동 생성 기능- Automatic generation of AI-based professional market research and analysis reports

- 수집된 데이터로부터 핵심 단어, 문장 추출, 연관어, 의미분석 과정을 통한 작문 생성 기능- Composition generation function through the process of extracting key words and sentences, related words, and semantic analysis from collected data

- 전문시장 조사 및 분석 기법을 적용된 RNN기반 작문 생성 기능- RNN-based composition generation function applied with specialized market research and analysis techniques

- 생성된 보고서에 대한 교차검증 및 과편향 판별을 통한 보고서 검증 기능- Report verification function through cross-validation of generated reports and over-bias determination

- 웹&SNS, 정책자료, 통계자료, 공개데이터로부터 시장 자료 수집/분류/분석 기능- Collect/classify/analyze market data from web & SNS, policy data, statistical data, and public data

- 멀티 프로세싱 데이터 크롤링 모듈 인터페이스 (RSS, OpenAPI, HTM5, Meta, File, RDB, 소셜웹사이트, 이미지 및 영상 수집, 공개 데이터 연동 등)- Multi-processing data crawling module interface (RSS, OpenAPI, HTM5, Meta, File, RDB, social website, image and video collection, open data linkage, etc.)

- 시장 자료에 대한 데이터 전처리 기능 (NLP, ETL, Data Labeling)- Data pre-processing function for market data (NLP, ETL, Data Labeling)

- 수집된 데이터에 대한 군집화/차원축소 등을 통한 데이터 분류 기능- Data classification function through clustering/dimensional reduction for collected data

- 반복 학습 및 강화학습이 적용된 딥러닝 학습 모델- Deep learning model with iterative learning and reinforcement learning applied

- 최종 보고서 생성시 차트, 그래프 적용된 시각화 기능 제공- Visualization function applied to charts and graphs is provided when creating the final report

- 시장 조사 및 분석 보고서 템플릿 DB 개발- Market research and analysis report template DB development

또한 AI를 통해서 생성된 보고서에 대한 출처 등에 대한 근거자료를 추적하고, 그래프 및 이미지 등의 자료를 Appendix 형태로 제공하는데, 사용자에게 제공되는 최종 보고서에 대한 교정 작업 및 보고서에 사용된 데이터에 대한 자료 근거, 출처 등을 제공함으로써 보고서에 대한 사용자 의사결정을 돕는 기반 자료로 활용될 수 있다.In addition, supporting data on the source of the report generated through AI is tracked, and data such as graphs and images are provided in the form of an appendix. It can be used as basic data to help users make decisions about reports by providing evidence and sources.

본 발명의 작성 시스템(100)이 자료 조사 및 분석할 수 있는 시장의 범위에는 제한이 없으며, 전기/전자기기, 패션/의류/잡화, 모바일 액세사리, 생활가전 등 소비자 대상 제조업이 주요 적용분야가 될 것이다. 또한 지능형 로봇 제조와 O2O 서비스, 블록체인, 바이오헬스 등 기술기반 벤쳐/스타트업에도 적용 가능하다.There is no limit to the market range in which the writing system 100 of the present invention can research and analyze data, and consumer manufacturing such as electrical/electronic devices, fashion/clothing/miscellaneous goods, mobile accessories, and household appliances will be the main application fields. will be. It can also be applied to technology-based ventures/startups such as intelligent robot manufacturing, O2O service, blockchain, and biohealth.

그리고 유치원이나 어린이집, 전문학원 등 교육서비스업에도 적용이 가능하며, 보험회사나 금융권등 금융서비스업에도 적용이 가능할 것이다.In addition, it can be applied to educational service industries such as kindergartens, daycare centers, and specialized academies, and it will also be applicable to financial service industries such as insurance companies and financial institutions.

보고서작성모듈(110)은 지능형 컨텐츠 퍼블리싱 기능을 기반으로 수집된 데이터에 AI 기반으로 핵심 단어, 문장을 추출하고 빈도 수에 따른 중요도 분류, 연관성을 높은 단어 간의 관계를 추출하여 이를 바탕으로 시장 조사 및 분석 보고서에 필요한 문장을 구성하여 보고서를 작성한다. 시장 조사 및 분석 보고서를 작성하기 위해서 사용자의 요구사항에 맞춰서 요구사항을 이해하고 수집된 데이터로부터 유사하거나 연관성이 높은 핵심 단어, 문장 추출하고, 사용자 요구사항에 맞도록 문장을 구성, 각 주요 근거자료에 대한 문서를 요약하여 전문적인 시장 조사 및 분석 보고서를 생성한다.The report writing module 110 extracts key words and sentences based on AI from the data collected based on the intelligent content publishing function, classifies the importance according to the number of frequencies, and extracts the relationship between words with high relevance, and based on this, market research and Write the report by composing the sentences necessary for the analysis report. In order to prepare a market research and analysis report, understand the requirements according to the user's requirements, extract similar or highly related key words and sentences from the collected data, compose the sentences to meet the user's requirements, and provide each main supporting data Summarizes documents on to generate professional market research and analysis reports.

데이터크롤링모듈(102a)과 데이터수집모듈(102b)이 웹(400)을 통해 수집한 데이터에 대해서 AI 기반으로 핵심 단어와 문장을 자동으로 추출한다.The data crawling module 102a and the data collection module 102b automatically extract key words and sentences based on AI from the data collected through the web 400.

데이터분류모듈(102c)은 사용자가 키워드 검색을 통해서 선택적으로 확인이 가능하며 이를 통해 효율적으로 원하는 시장 조사 및 분석 보고서를 생성할 수 있도록 핵심 단어 추출 알고리즘을 개발하여 적용한다.The data classification module 102c develops and applies a key word extraction algorithm so that a user can selectively check through a keyword search and efficiently generate a desired market research and analysis report.

데이터전처리모듈(106)은 정답 셋이 없는 Unsupervised Learning 기법으로 수집된 데이터에 대해서 중요 단어를 추출하는 것으로 웹(200)에서 수집된 문서기반에서 단어 단위로 추출한 후 단어의 빈도수 계산을 하는 빈도수 키워드 알고리즘을 통해 중요 단어를 추출하고, 중요 단어에 대한 가중치를 계산한 후 집단 간 텍스트 특성의 차이나 토큰 사이의 관계 등을 분석하여 상위 적당 K개수의 가중치를 가지는 키워드를 선정한다.The data pre-processing module 106 extracts important words from the data collected by the Unsupervised Learning technique without three correct answers, and extracts word by word from the document base collected on the web 200, and then calculates the frequency of words. Frequency keyword algorithm After extracting important words through and calculating weights for important words, the differences in text characteristics between groups or the relationship between tokens are analyzed to select keywords with the top K number of appropriate weights.

또한 수집된 데이터의 핵심 단어 및 문장의 문서 단위별 관계를 추출한다. 관계 추출의 목적은 구조화되지 않은 정보에서 구조화된 정보를 추출함으로써 입력받은 정보에 있을 수 있는 중의성을 줄이고, 해당 정보를 처리 과정에서 그 과정을 단순화하여 처리를 더욱 빠르고 정확하게 분석하기 위한 것이다.In addition, it extracts the relationship between key words and sentences of the collected data by document unit. The purpose of relation extraction is to reduce the ambiguity that may exist in the input information by extracting structured information from unstructured information, and to simplify the process in the process of processing the information to analyze the process more quickly and accurately.

관계 추출은 크게 2가지 종류로 나뉘는데 전역 수준의 관계 추출(Global Level Relation Extraction)과 문장 수준의 관계 추출(Mention Level Relation Extraction)로서, 본원발명에서는 전역 수준의 관계 추출을 하되, 언급 수준의 관계 추출을 병행함으로써 정보의 누락을 최대한 방지하여 성능과 완성도를 유지하도록 한다.Relationship extraction is largely divided into two types: Global Level Relation Extraction and Mention Level Relation Extraction. In the present invention, global-level relationship extraction is performed, but mention-level relationship extraction In parallel, omission of information is prevented as much as possible to maintain performance and completeness.

데이터로부터 관계 추출에서 한국어처럼 주어나 목적어가 자주 생략되는 언어의 경우에는 추출한 결과가 생략된 주어나 목적어에 해당되는 개체들의 관계를 제대로 표현하지 못한다는 약점이 존재하지만, 각 개체간 관계를 외부 메모리에 저장하고 분석하여 여러 문장에 걸쳐 표현되는 개체간 상호관계를 추출하는 관계 추출 모델을 개발함으로써 이러한 약점을 극복하였다.In the case of languages in which subjects and objects are frequently omitted, such as Korean, in extracting relationships from data, there is a weakness in that the extracted result does not properly express the relationship between entities corresponding to the omitted subject or object, but the relationship between each entity is stored in an external memory. This weakness was overcome by developing a relation extraction model that extracts the interrelationships between entities expressed over several sentences by storing and analyzing them in the .

작성 시스템(100)은 단편적 관계 추출 모델과 외부 메모리 신경망으로 구성하고, AI에 대한 반복훈련을 통해서 각각 단편적 관계 추출 모델의 훈련, 전역 관계를 위한 메모리 증강 신경망 훈련, 마지막으로 메모리 증강 신경망 훈련의 결과를 반영한 관계 추출 모델의 재훈련으로 총 3단계로 실행되도록 구성하였다.The writing system 100 is composed of a fragmentary relation extraction model and an external memory neural network, and through repeated training for AI, training of each fragmentary relation extraction model, memory augmentation neural network training for global relations, and finally, the result of memory augmentation neural network training. Retraining of the relationship extraction model reflecting

또한 수집된 데이터에 대한 자동 요약 및 유사 데이터 검색 기술을 구현하였다. 즉, 비지도 학습 알고리즘인 K-Means Clustering을 이용하여 수집된 데이터에서 문장 추출하고 그 문장이 포함된 문서를 요약할 수 있도록 하였다.In addition, automatic summary of collected data and similar data search technology were implemented. That is, sentences were extracted from the collected data using K-Means Clustering, an unsupervised learning algorithm, and documents containing the sentences were summarized.

수집된 데이터에 대한 자동 요약 기술은 문장 벡터 생성 시 기존의 TF-IDF 방법을 이용한 벡터 생성이 아닌 딥러닝학습모듈(108)이 AI 기반의 딥러닝 학습 방법을 사용하여 단어 불일치 문제 등을 해결하고, 문장 벡터 생성 후 요약 기술로 클러스터링 기반 추출 요약 방법을 사용하도록 하였다.The automatic summary technology for the collected data solves the problem of word mismatch by using the AI-based deep learning method of the deep learning learning module (108) rather than the vector generation using the conventional TF-IDF method when generating sentence vectors. , a clustering-based extraction summary method was used as a summary technique after generating a sentence vector.

그리고 수집된 데이터에 대한 가상의 벡터 공간에 투사하고 그 차원을 축소한 후 이를 시각화하여 지능적으로 유사 문서를 탐색할 수 있는 기술을 적용하여 수집된 데이터에 대한 유사 데이터 검색 방법으로 활용할 수 있도록 한다.Then, by projecting the collected data into a virtual vector space, reducing its dimensionality, and then visualizing it, a technology that can intelligently search for similar documents is applied so that it can be used as a similar data search method for the collected data.

수집된 데이터를 가상의 벡터 공간에 투사하면, 벡터 공간 모델을 이용하여 데이터 간의 유사도를 수치화할 수 있고, 이로부터 유사 문서 검색이 가능하며, 데이터를 벡터 공간에 임베딩하고 검색 등을 수행하기 위해서는 문서를 고정 길이의 벡터로 표현하도록 변환하기 위해 텍스트 및 문장 임베딩 기술과 문서 자동 요약 기술을 활용하여 유사 데이터 검색에 활용할 수 있다.If the collected data is projected onto a virtual vector space, the degree of similarity between data can be quantified using a vector space model, and similar documents can be searched for from this. In order to convert it into a fixed-length vector, it can be used for similar data search using text and sentence embedding technology and document automatic summary technology.

또한 투사된 벡터 공간을 t-distributed Stochastic Neighbor Embedding(t-SNE)을 이용 같은 차원축소 기법을 통해서 인간이 시각적으로 인지할 수 있는 공간인 3차원 이하로 변형할 수 있고, 이를 시각화하여 검색 인터페이스를 활용하기 위해 TensorBoard를 활용한다.In addition, the projected vector space can be transformed into less than three dimensions, a space that humans can visually perceive, through dimension reduction techniques such as using t-distributed Stochastic Neighbor Embedding (t-SNE). To use it, use TensorBoard.

이상 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명하였지만, 상술한 본 발명의 기술적 구성은 본 발명이 속하는 기술 분야의 당업자가 본 발명의 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해되어야 하고, 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Although the preferred embodiments of the present invention have been described with reference to the accompanying drawings, the technical configuration of the present invention described above is another specific form without changing the technical spirit or essential features of the present invention by those skilled in the art to which the present invention belongs. It will be understood that it can be implemented as. Therefore, the embodiments described above should be understood as illustrative and not restrictive in all respects, and the scope of the present invention is indicated by the claims to be described later rather than the detailed description, and the meaning and scope of the claims and All changes or modified forms derived from the equivalent concept should be construed as being included in the scope of the present invention.

100 : 작성 시스템 200 : 인터넷
300 : 사용자단말기 400 : 웹
100: writing system 200: Internet
300: user terminal 400: web

Claims (5)

웹(400)을 통해 시장에 대한 데이터를 수집하고, 수집된 데이터를 분석하여 시장 상황에 대한 보고서를 작성하는 작성 시스템으로서,
멀티 프로세싱 크롤링 기술 및 분산 AI 에이전트 기술을 바탕으로 웹(400)에 존재하는 초대용량 시장 자료를 수집하는 데이터수집부(102)와;
상기 데이터수집부(102)가 수집한 데이터를 저장하는 데이터DB(104)와;
상기 데이터에 대해서 중요 단어를 추출하며, 상기 웹(200)에서 수집된 문서기반에서 단어 단위로 추출한 후 단어의 빈도수 계산을 하는 빈도수 키워드 알고리즘을 통해 중요 단어를 추출하는 데이터전처리모듈(106)과;
AI 기반의 딥러닝 학습 방법을 사용하여 상기 데이터에 대한 자동 요약 기술을 적용하고, 수집된 데이터에서 문장을 추출하고 그 문장이 포함된 문서를 요약 하는 딥러닝학습모듈(108)과;
지능형 컨텐츠 퍼블리싱 기능을 기반으로 수집된 데이터에 AI 기반으로 핵심 단어, 문장을 추출하고, 빈도 수에 따른 중요도 분류, 연관성을 높은 단어 간의 관계를 추출하여 이를 바탕으로 시장 조사 및 분석 보고서에 필요한 문장을 구성하여 보고서를 작성하는 보고서작성모듈(110);을 포함하는, AI기반의 시장 조사 보고서 작성 시스템.
As a writing system that collects data on the market through the web 400 and analyzes the collected data to create a report on the market situation,
Based on multi-processing crawling technology and distributed AI agent technology, a data collection unit 102 that collects super-large market data existing on the web 400;
a data DB (104) for storing the data collected by the data collection unit (102);
A data pre-processing module 106 for extracting important words from the data and extracting important words through a frequency keyword algorithm that calculates the frequency of words after extracting them word by word from the document base collected on the web 200;
A deep learning learning module 108 that applies an automatic summary technique to the data using an AI-based deep learning learning method, extracts sentences from the collected data, and summarizes documents including the sentences;
Key words and sentences are extracted based on AI from the data collected based on the intelligent content publishing function, and the importance is classified according to frequency, and the relationship between words with high relevance is extracted. A report writing module 110 configured to write a report; including, AI-based market research report writing system.
제1항에 있어서,
상기 데이터수집부(102)는
상기 웹(400)을 통해 복수의 데이터를 수집하는 데이터크롤링모듈(102a)과;
상기 웹(400)을 통해 수집한 데이터에 대해서 AI 기반으로 핵심 단어와 문장을 자동으로 추출하는 데이터수집모듈(102b)과;
사용자가 키워드 검색을 통해서 선택적으로 확인이 가능하며 이를 통해 효율적으로 원하는 시장 조사 및 분석 보고서를 생성할 수 있도록 핵심 단어 추출 알고리즘을 실행하는 데이터분류모듈(102c)과;
추출된 핵심 단어에 대한 데이터를 상기 데이터DB(104)에 저장하는 데이터저장모듈(102d);을 포함하는, AI기반의 시장 조사 보고서 작성 시스템.
According to claim 1,
The data collection unit 102
a data crawling module (102a) for collecting a plurality of data through the web (400);
A data collection module (102b) for automatically extracting key words and sentences based on AI from the data collected through the web (400);
A data classification module 102c that executes a key word extraction algorithm so that a user can selectively check through keyword search and efficiently generate a desired market research and analysis report through this;
A data storage module (102d) for storing the data for the extracted key words in the data DB (104); including, AI-based market research report writing system.
제1항에 있어서,
상기 보고서작성모듈(110)은
사용자 요구사항에 맞춰 수집된 정형/비정형 시장자료와 비교하여 핵심 단어 및 문장을 추출하고, 추출된 핵심 단어 및 문장의 결합을 통해서 시장 조사 및 분석 보고서를 생성하되, 상기 AI는 전문적인 시장 조사 및 분석 기법에 의거하여 생성된 컨텐츠를 템플릿 기반으로 보고서를 제공하며, 보고서 생성시 HTML5기반 차트, 그래프와 같은 동적 콘텐츠를 생성하여 적용하는 것을 특징으로 하는, AI기반의 시장 조사 보고서 작성 시스템.
According to claim 1,
The report writing module 110
Key words and sentences are extracted by comparing with structured/atypical market data collected according to user requirements, and market research and analysis reports are generated through the combination of the extracted key words and sentences. An AI-based market research report writing system that provides reports based on templates for content generated based on analysis techniques, and generates and applies dynamic content such as HTML5-based charts and graphs when generating reports.
제3항에 있어서,
상기 보고서작성모듈(110)은 수집된 데이터의 핵심 단어 및 문장의 문서 단위별 관계로부터 전역 수준의 관계를 추출하되,
AI에 대한 반복훈련을 통해서 각각 단편적 관계 추출 모델의 훈련의 제1단계, 전역 관계를 위한 메모리 증강 신경망 훈련의 제2단계, 메모리 증강 신경망 훈련의 결과를 반영한 관계 추출 모델의 재훈련의 제3단계로 수행되는 것을 특징으로 하는, AI기반의 시장 조사 보고서 작성 시스템.
According to claim 3,
The report writing module 110 extracts global-level relationships from the relationship of key words and sentences of the collected data by document units,
Through repetitive AI training, the first step of training the fragmentary relationship extraction model, the second step of training the memory enhancement neural network for global relationships, and the third step of retraining the relationship extraction model reflecting the results of the memory enhancement neural network training. Characterized in that it is performed as, AI-based market research report writing system.
제1항 내지 제4항 중 어느 한 항의 작성 시스템을 이용한 작성 방법으로서,
제품 및 시장에 관련되어 정형/비정형 시장자료를 포함하는 사용자 요구사항 입력 단계와;
상기 사용자가 입력한 요구사항을 분석하여 주된 목표를 이해하는 단계와;
데이터수집부(102)가 시장자료를 인터넷(200)을 통해 연결된 복수의 웹(400) 상에서 수집하는 단계와;
데이터전처리모듈(106)이 상기 인터넷(200)을 통해 수집된 데이터를 전처리하여 보고서의 내용과 직접적으로 관련된 데이터를 분류하는 단계와;
보고서작성모듈(110)이 자연어처리(NLP) 엔진을 이용하여 단어를 추출하거나 문장에 대한 이해를 바탕으로 텍스트 변환 후 사람이 이해 가능한 수준의 단어를 나열하고 문장을 추출해서 컨텐츠를 생성함으로써 시장 보고서를 작성하는 단계;를 포함하는, AI기반의 시장 조사 보고서 작성 방법.
A creation method using the creation system of any one of claims 1 to 4,
inputting user requirements including structured/unstructured market data related to products and markets;
analyzing the requirements input by the user to understand the main goal;
Collecting, by the data collection unit 102, market data on a plurality of webs 400 connected through the Internet 200;
pre-processing the data collected through the Internet 200 by the data pre-processing module 106 and classifying data directly related to the content of the report;
The report writing module 110 extracts words using a natural language processing (NLP) engine or converts text based on understanding of sentences, lists words at a level that can be understood by humans, extracts sentences, and generates content to generate market reports. Comprising; AI-based market research report writing method.
KR1020210189184A 2021-12-28 2021-12-28 System of making market report based on ai and method thereof KR20230099822A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210189184A KR20230099822A (en) 2021-12-28 2021-12-28 System of making market report based on ai and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210189184A KR20230099822A (en) 2021-12-28 2021-12-28 System of making market report based on ai and method thereof

Publications (1)

Publication Number Publication Date
KR20230099822A true KR20230099822A (en) 2023-07-05

Family

ID=87159120

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210189184A KR20230099822A (en) 2021-12-28 2021-12-28 System of making market report based on ai and method thereof

Country Status (1)

Country Link
KR (1) KR20230099822A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117391742A (en) * 2023-10-18 2024-01-12 广州电力交易中心有限责任公司 Method for analyzing market operation economy

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180059167A (en) 2016-11-25 2018-06-04 주식회사 비즈니스인사이트 Combined Qualitative and Quantitative Marketing Platform method and apparatus thereof
KR20180075852A (en) 2016-12-27 2018-07-05 전자부품연구원 System and method for intelligent marketing analysis through processing non-fixed form bigdata

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180059167A (en) 2016-11-25 2018-06-04 주식회사 비즈니스인사이트 Combined Qualitative and Quantitative Marketing Platform method and apparatus thereof
KR20180075852A (en) 2016-12-27 2018-07-05 전자부품연구원 System and method for intelligent marketing analysis through processing non-fixed form bigdata

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117391742A (en) * 2023-10-18 2024-01-12 广州电力交易中心有限责任公司 Method for analyzing market operation economy

Similar Documents

Publication Publication Date Title
Lovaglio et al. Skills in demand for ICT and statistical occupations: Evidence from web‐based job vacancies
Aziz et al. Sentiment analysis and topic modelling for identification of government service satisfaction
Shah et al. User review classification and star rating prediction by sentimental analysis and machine learning classifiers
CN116468460A (en) Consumer finance customer image recognition system and method based on artificial intelligence
Saleiro et al. TexRep: A text mining framework for online reputation monitoring
Pandiaraja et al. An analysis of E-commerce identification using sentimental analysis: a survey
Salah et al. Extracting debate graphs from parliamentary transcripts: A study directed at uk house of commons debates
Ogunleye The Concept of Data Mining
KR20230099822A (en) System of making market report based on ai and method thereof
Onwuegbuche et al. Support vector machine for sentiment analysis of Nigerian banks financial tweets
Choudhari et al. Sentiment Analysis and Machine Learning Based Sentiment Classification: A Review.
Uskenbayeva et al. Creation of Data Classification System for Local Administration
Ko et al. Semantic properties of customer sentiment in tweets
Das et al. Opinion based on polarity and clustering for product feature extraction
Copaceanu Sentiment Analysis Using Machine Learning Approach
Harshvardhan et al. Topic modelling Twitterati sentiments using Latent Dirichlet allocation during demonetization
KR20230099820A (en) System of analyzing market based on ai and method thereof
Haripriya et al. Detection of sarcasm from consumer sentiments on social media about luxury brands
Turdjai et al. Simulation of marketplace customer satisfaction analysis based on machine learning algorithms
Jardim et al. A Multilingual Lexicon-based Approach for Sentiment Analysis in Social and Cultural Information System Data
Ryanto et al. Partner Sentiment Analysis for Telkom University on Twitter Social Media Using Decision Tree (CART) Algorithm
Kumar et al. Social media analysis for sentiment classification using gradient boosting machines
Sadiq et al. Mining Career Patterns from Job Portals with Relevance to Oman
US11983228B1 (en) Apparatus and a method for the generation of electronic media
Bharadi Sentiment Analysis of Twitter Data Using Named Entity Recognition

Legal Events

Date Code Title Description
E902 Notification of reason for refusal