KR102656015B1 - Deep learning-based customer perspective key keyword derivation device and method - Google Patents

Deep learning-based customer perspective key keyword derivation device and method Download PDF

Info

Publication number
KR102656015B1
KR102656015B1 KR1020220066162A KR20220066162A KR102656015B1 KR 102656015 B1 KR102656015 B1 KR 102656015B1 KR 1020220066162 A KR1020220066162 A KR 1020220066162A KR 20220066162 A KR20220066162 A KR 20220066162A KR 102656015 B1 KR102656015 B1 KR 102656015B1
Authority
KR
South Korea
Prior art keywords
customer
perspective
keyword
keywords
embedding space
Prior art date
Application number
KR1020220066162A
Other languages
Korean (ko)
Other versions
KR20230166332A (en
Inventor
김남규
김준우
부현경
연진욱
한민아
Original Assignee
국민대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국민대학교산학협력단 filed Critical 국민대학교산학협력단
Priority to KR1020220066162A priority Critical patent/KR102656015B1/en
Publication of KR20230166332A publication Critical patent/KR20230166332A/en
Application granted granted Critical
Publication of KR102656015B1 publication Critical patent/KR102656015B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

본 발명은 딥러닝 기반 고객 관점 중요 키워드 도출 장치 및 방법에 관한 것으로, 상기 장치는 기업 관점 정보와 고객 관점 정보를 포함하는 텍스트 데이터셋을 기반으로 임베딩(embedding) 학습을 통해 관점별 키워드에 관한 임베딩 공간을 독립적으로 생성하는 임베딩 학습부; 기업 관점 임베딩 공간 상에서 복수의 키워드들을 선별하여 기업 관점 키워드 리스트를 생성하는 키워드 리스트 생성부; 상기 기업 관점 임베딩 공간과 고객 관점 임베딩 공간을 통합하여 고객 관점 통합 임베딩 공간을 생성하는 임베딩 공간 통합부; 상기 기업 관점 키워드 리스트의 각 키워드를 기준으로 상기 기업 관점 임베딩 공간 및 상기 고객 관점 통합 임베딩 공간 상에서 주변 단어들을 각각 선별하여 기업 및 고객 중심의 키워드 주변 단어 리스트들을 독립적으로 생성하는 주변 단어 리스트 생성부; 및 상기 각 키워드를 기준으로 상기 기업 및 고객 중심의 키워드 주변 단어 리스트들을 상호 비교하여 고객 관점 중요 키워드를 결정하는 고객 중심 키워드 추천부;를 포함한다.The present invention relates to a deep learning-based device and method for deriving important keywords from a customer's perspective. The device provides embedding information on keywords for each perspective through embedding learning based on a text dataset containing corporate perspective information and customer perspective information. An embedding learning unit that independently generates space; a keyword list generator that selects a plurality of keywords in the enterprise perspective embedding space and generates a enterprise perspective keyword list; an embedding space integration unit that integrates the enterprise-view embedding space and the customer-view embedding space to create a customer-view integrated embedding space; a surrounding word list generator that independently generates company- and customer-oriented keyword surrounding word lists by selecting neighboring words in the corporate viewpoint embedding space and the customer viewpoint integrated embedding space based on each keyword in the corporate viewpoint keyword list; and a customer-centered keyword recommendation unit that determines important keywords from the customer's perspective by comparing word lists surrounding the company- and customer-centered keywords based on each keyword.

Description

딥러닝 기반 고객 관점 중요 키워드 도출 장치 및 방법{DEEP LEARNING-BASED CUSTOMER PERSPECTIVE KEY KEYWORD DERIVATION DEVICE AND METHOD}Deep learning-based customer perspective key keyword derivation device and method {DEEP LEARNING-BASED CUSTOMER PERSPECTIVE KEY KEYWORD DERIVATION DEVICE AND METHOD}

본 발명은 키워드 발굴 기술에 관한 것으로, 보다 상세하게는 서로 다른 두 도메인인 기업과 고객 도메인으로부터 임베딩 기법과 오토인코더 기반의 임베딩 얼라인먼트 그리고 키버트를 활용하여 고객 관점에서의 주요 키워드를 발굴하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치 및 방법에 관한 것이다.The present invention relates to keyword discovery technology, and more specifically, deep learning to discover key keywords from the customer's perspective using an embedding technique, autoencoder-based embedding alignment, and keyvert from two different domains, the company and customer domains. It relates to a device and method for deriving important keywords from a customer perspective.

최근 기술의 개발 속도가 빨라지고 한정된 수요에 공급이 넘쳐남에 따라, 기업들은 고객지향성을 갖춘 주요 제품 도출을 발굴하는 추세이다. 또한, 현재 대부분의 기업들은 고객지향성에 초점을 둔 제품 및 경영 의사결정을 하는 것으로 변화하고 있다. 이에 따라 고객 관점의 주요 키워드를 발굴하는 것이 중요해지고 있다.Recently, as the pace of technology development has accelerated and limited demand has become oversupplied, companies are seeking to develop key products with customer orientation. Additionally, most companies are currently changing their product and management decisions to focus on customer orientation. Accordingly, it is becoming important to discover key keywords from the customer's perspective.

하지만, 기업이 제품에 대한 고객의 요구 사항을 전부 알아내기에는 한계가 존재하며 기업과 고객이 필요로 생각하는 주요 제품의 특징에는 간극이 존재한다. 이에 따른 간극을 좁히기 위해, 기업과 고객 데이터를 연결할 수 있는 방안이 필요로 하고 있다. 이와 관련하여 현재 기업들은 고객의 문제와 니즈를 확인하고 고객 가치를 창출하는 활동을 하며 고객의 사고 방식을 이해하고자 노력하고 있다.However, there are limits to a company's ability to find out all of its customers' requirements for its products, and there is a gap between the key product features that companies and customers think they need. In order to narrow the gap, a way to connect companies and customer data is needed. In relation to this, companies are currently striving to understand customers' ways of thinking by identifying customer problems and needs and carrying out activities to create customer value.

하지만, 현재 기업에서는 다양한 제품에 대한 고객의 주요 키워드 포착 방안에 한계가 나타나고 있다.However, there are currently limitations in how companies can capture key keywords from customers for various products.

한국공개특허 제10-2014-0081721호 (2014.07.01)Korean Patent Publication No. 10-2014-0081721 (2014.07.01)

본 발명의 일 실시예는 서로 다른 두 도메인인 기업과 고객 도메인으로부터 임베딩 기법과 오토인코더 기반의 임베딩 얼라인먼트 그리고 키버트를 활용하여 고객 관점에서의 주요 키워드를 발굴하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치 및 방법을 제공하고자 한다.One embodiment of the present invention is a deep learning-based customer perspective important keyword derivation device that discovers key keywords from the customer perspective using an embedding technique, autoencoder-based embedding alignment, and keyvert from two different domains, the company and customer domains. and methods are provided.

실시예들 중에서, 딥러닝 기반 고객 관점 중요 키워드 도출 장치는 기업 관점 정보와 고객 관점 정보를 포함하는 텍스트 데이터셋을 기반으로 임베딩(embedding) 학습을 통해 관점별 키워드에 관한 임베딩 공간을 독립적으로 생성하는 임베딩 학습부; 기업 관점 임베딩 공간 상에서 복수의 키워드들을 선별하여 기업 관점 키워드 리스트를 생성하는 키워드 리스트 생성부; 상기 기업 관점 임베딩 공간과 고객 관점 임베딩 공간을 통합하여 고객 관점 통합 임베딩 공간을 생성하는 임베딩 공간 통합부; 상기 기업 관점 키워드 리스트의 각 키워드를 기준으로 상기 기업 관점 임베딩 공간 및 상기 고객 관점 통합 임베딩 공간 상에서 주변 단어들을 각각 선별하여 기업 및 고객 중심의 키워드 주변 단어 리스트들을 독립적으로 생성하는 주변 단어 리스트 생성부; 및 상기 각 키워드를 기준으로 상기 기업 및 고객 중심의 키워드 주변 단어 리스트들을 상호 비교하여 고객 관점 중요 키워드를 결정하는 고객 중심 키워드 추천부;를 포함한다.Among the embodiments, the deep learning-based customer perspective important keyword derivation device independently generates an embedding space for keywords for each perspective through embedding learning based on a text dataset containing company perspective information and customer perspective information. Embedding Learning Department; a keyword list generator that selects a plurality of keywords in the enterprise perspective embedding space and generates a enterprise perspective keyword list; an embedding space integration unit that integrates the enterprise-view embedding space and the customer-view embedding space to create a customer-view integrated embedding space; a surrounding word list generator that independently generates company- and customer-oriented keyword surrounding word lists by selecting neighboring words in the corporate viewpoint embedding space and the customer viewpoint integrated embedding space based on each keyword in the corporate viewpoint keyword list; and a customer-centered keyword recommendation unit that determines important keywords from the customer's perspective by comparing word lists surrounding the company- and customer-centered keywords based on each keyword.

상기 임베딩 학습부는 상기 기업 관점 정보에 관한 제1 텍스트 데이터셋 및 상기 고객 관점 정보에 관한 제2 텍스트 데이터셋 각각에 대해 Word2Vec을 포함하는 임베딩 학습 모델을 적용하여 상기 기업 관점 임베딩 공간 및 상기 고객 관점 임베딩 공간을 각각 생성할 수 있다.The embedding learning unit applies an embedding learning model including Word2Vec to each of the first text dataset about the enterprise perspective information and the second text dataset about the customer perspective information to create the enterprise perspective embedding space and the customer perspective embedding space. Each space can be created.

상기 키워드 리스트 생성부는 상기 기업 관점 임베딩 공간 상에 분포하는 키워드들 중에서 KeyBERT를 포함하는 키워드 추출 모델을 적용하여 출력된 스코어(score)를 기준으로 상위 N개(상기 N은 자연수)의 키워드들을 결정하여 상기 기업 관점 키워드 리스트를 생성할 수 있다.The keyword list generator determines the top N keywords (where N is a natural number) based on the score output by applying a keyword extraction model including KeyBERT among the keywords distributed in the enterprise perspective embedding space. A list of keywords from the corporate perspective can be created.

상기 임베딩 공간 통합부는 상기 기업 관점 임베딩 공간을 입력으로 사용하고 상기 고객 관점 임베딩 공간을 출력으로 사용하는 오토인코더(AutoEncoder) 기반의 임베딩 얼라인먼트(embedding alignment)를 수행하여 상기 고객 관점 통합 임베딩 공간을 생성할 수 있다.The embedding space integration unit performs AutoEncoder-based embedding alignment using the enterprise perspective embedding space as an input and the customer perspective embedding space as an output to generate the customer perspective integrated embedding space. You can.

상기 임베딩 공간 통합부는 상기 기업 관점 임베딩 공간 및 상기 고객 관점 임베딩 공간에 공통으로 분포하는 공통 키워드들 중에서 상기 기업 관점 키워드 리스트에 포함되지 않는 키워드들을 대상으로 오토인코더 모델에 대한 학습을 수행할 수 있다.The embedding space integrator may perform learning on an autoencoder model for keywords that are not included in the enterprise-view keyword list among common keywords commonly distributed in the enterprise-view embedding space and the customer-view embedding space.

상기 임베딩 공간 통합부는 상기 공통 키워드들 중에서 상기 기업 관점 키워드 리스트에 포함된 키워드들과 상기 기업 관점 임베딩 공간 상에만 분포하는 키워드들을 대상으로 상기 오토인코더 모델을 적용하여 상기 고객 관점 임베딩 공간 상의 임베딩 값으로 매핑할 수 있다.The embedding space integrator applies the autoencoder model to keywords included in the enterprise perspective keyword list among the common keywords and keywords distributed only in the enterprise perspective embedding space to generate an embedding value in the customer perspective embedding space. It can be mapped.

상기 임베딩 공간 통합부는 상기 공통 키워드들 중에서 상기 기업 관점 키워드 리스트에 포함된 키워드들에 대해서는 상기 고객 관점 임베딩 공간 상의 벡터값을 상기 임베딩 값으로 대체할 수 있다.The embedding space integrator may replace vector values in the customer perspective embedding space with the embedding values for keywords included in the enterprise perspective keyword list among the common keywords.

상기 주변 단어 리스트 생성부는 상기 각 키워드를 중심으로 상기 기업 및 고객 중심의 키워드 주변 단어 리스트들의 개별 주변 단어들을 상기 각 키워드에 연결하여 키워드 주변 단어 네트워크를 생성할 수 있다.The surrounding word list generator may generate a keyword surrounding word network by connecting individual surrounding words from the company- and customer-centered keyword surrounding word lists to each keyword, centered on each keyword.

이때, 상기 키워드 주변 단어 네트워크의 노드는 상기 각 키워드 및 상기 개별 주변 단어들 각각에 대응되고, 노드 간 에지는 상기 각 키워드와 상기 개별 주변 단어들 간의 연결 관계에 대응될 수 있다.At this time, the nodes of the keyword-surrounding word network may correspond to each of the keywords and the individual neighboring words, and edges between nodes may correspond to connection relationships between each keyword and the individual neighboring words.

상기 고객 중심 키워드 추천부는 상기 각 키워드를 기준으로 상기 기업 및 고객 중심의 키워드 주변 단어 리스트들에서 서로 중복되지 않는 주변 단어들을 상기 고객 관점 중요 키워드로 결정할 수 있다.Based on each keyword, the customer-centered keyword recommendation unit may determine surrounding words that do not overlap with each other in the word lists surrounding the company- and customer-centered keywords as important keywords from the customer's perspective.

상기 고객 중심 키워드 추천부는 상기 키워드 주변 단어 네트워크를 시각화하여 표시하고 상기 키워드 주변 단어 네트워크 상에서 상기 고객 관점 중요 키워드를 강조하여 표시할 수 있다.The customer-centered keyword recommendation unit may visualize and display a network of words surrounding the keyword and highlight and display important keywords from the customer's perspective on the network of words surrounding the keyword.

실시예들 중에서, 딥러닝 기반 고객 관점 중요 키워드 도출 방법은 임베딩 학습부를 통해 기업 관점 정보와 고객 관점 정보를 포함하는 텍스트 데이터셋을 기반으로 임베딩(embedding) 학습을 통해 관점별 키워드에 관한 임베딩 공간을 독립적으로 생성하는 단계; 키워드 리스트 생성부를 통해 기업 관점 임베딩 공간 상에서 복수의 키워드들을 선별하여 기업 관점 키워드 리스트를 생성하는 단계; 임베딩 공간 통합부를 통해 상기 기업 관점 임베딩 공간과 고객 관점 임베딩 공간을 통합하여 고객 관점 통합 임베딩 공간을 생성하는 단계; 주변 단어 리스트 생성부를 통해 상기 기업 관점 키워드 리스트의 각 키워드를 기준으로 상기 기업 관점 임베딩 공간 및 상기 고객 관점 통합 임베딩 공간 상에서 주변 단어들을 각각 선별하여 기업 및 고객 중심의 키워드 주변 단어 리스트들을 독립적으로 생성하는 단계; 및 고객 중심 키워드 추천부를 통해 상기 각 키워드를 기준으로 상기 기업 및 고객 중심의 키워드 주변 단어 리스트들을 상호 비교하여 고객 관점 중요 키워드를 결정하는 단계;를 포함한다.Among the embodiments, the deep learning-based method of deriving important keywords from a customer perspective creates an embedding space for keywords for each perspective through embedding learning based on a text dataset containing corporate perspective information and customer perspective information through an embedding learning unit. independently creating steps; Generating a corporate viewpoint keyword list by selecting a plurality of keywords in the corporate viewpoint embedding space through a keyword list generator; Integrating the company perspective embedding space and the customer perspective embedding space through an embedding space integration unit to create a customer perspective integrated embedding space; Through the surrounding word list generation unit, surrounding words are selected from the corporate perspective embedding space and the customer perspective integrated embedding space based on each keyword in the corporate perspective keyword list, respectively, to independently generate company and customer-oriented keyword surrounding word lists. step; and determining important keywords from the customer's perspective by comparing word lists surrounding the company- and customer-oriented keywords based on each keyword through a customer-oriented keyword recommendation unit.

상기 고객 관점 통합 임베딩 공간을 생성하는 단계는 상기 기업 관점 임베딩 공간을 입력으로 사용하고 상기 고객 관점 임베딩 공간을 출력으로 사용하는 오토인코더(AutoEncoder) 기반의 임베딩 얼라인먼트(embedding alignment)를 수행하여 상기 고객 관점 통합 임베딩 공간을 생성하는 단계를 포함할 수 있다.The step of generating the customer perspective integrated embedding space is performed by performing AutoEncoder-based embedding alignment using the enterprise perspective embedding space as an input and the customer perspective embedding space as an output. It may include creating a unified embedding space.

상기 고객 관점 통합 임베딩 공간을 생성하는 단계는 상기 기업 관점 임베딩 공간 및 상기 고객 관점 임베딩 공간에 공통으로 분포하는 공통 키워드들 중에서 상기 기업 관점 키워드 리스트에 포함되지 않는 키워드들을 대상으로 오토인코더 모델에 대한 학습을 수행하는 단계를 포함할 수 있다.The step of generating the customer perspective integrated embedding space involves learning an autoencoder model for keywords that are not included in the enterprise perspective keyword list among common keywords commonly distributed in the enterprise perspective embedding space and the customer perspective embedding space. It may include steps to perform.

상기 고객 관점 통합 임베딩 공간을 생성하는 단계는 상기 공통 키워드들 중에서 상기 기업 관점 키워드 리스트에 포함된 키워드들과 상기 기업 관점 임베딩 공간 상에만 분포하는 키워드들을 대상으로 상기 오토인코더 모델을 적용하여 상기 고객 관점 임베딩 공간 상의 임베딩 값으로 매핑하는 단계를 포함할 수 있다.The step of generating the customer perspective integrated embedding space includes applying the autoencoder model to keywords included in the enterprise perspective keyword list among the common keywords and keywords distributed only on the enterprise perspective embedding space to generate the customer perspective. It may include mapping to an embedding value in the embedding space.

개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.The disclosed technology can have the following effects. However, since it does not mean that a specific embodiment must include all of the following effects or only the following effects, the scope of rights of the disclosed technology should not be understood as being limited thereby.

본 발명의 일 실시예에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 장치 및 방법은 기업 상품 정보와 고객 리뷰를 독립적으로 임베딩하여 개별 키워드를 식별하고, 기업 데이터와 고객 데이터를 벡터 공간에서 동시에 분석할 수 있는 방안을 제공할 수 있다.The deep learning-based customer perspective important keyword derivation device and method according to an embodiment of the present invention identifies individual keywords by independently embedding corporate product information and customer reviews, and can simultaneously analyze corporate data and customer data in vector space. We can provide a solution.

본 발명의 일 실시예에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 장치 및 방법은 식별된 키워드의 주변 단어 비교를 통해 고객 중심의 키워드를 식별할 수 있는 새로운 방안을 제공하고, 제품에서 기업이 중요시하는 키워드를 고객 관점에서 식별화하며, 식별화된 결과를 시각화하여 고객 관점의 주요 키워드를 포착할 수 있다.The deep learning-based customer perspective important keyword derivation device and method according to an embodiment of the present invention provides a new method for identifying customer-oriented keywords through comparison of surrounding words of the identified keyword, and provides a new method for identifying customer-oriented keywords and identifying important keywords that companies value in products. Keywords are identified from the customer's perspective, and the identified results can be visualized to capture key keywords from the customer's perspective.

도 1은 본 발명에 따른 중요 키워드 도출 시스템을 설명하는 도면이다.
도 2는 도 1의 중요 키워드 도출 장치의 시스템 구성을 설명하는 도면이다.
도 3은 도 1의 중요 키워드 도출 장치의 기능적 구성을 설명하는 도면이다.
도 4는 본 발명에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 방법을 설명하는 순서도이다.
도 5는 본 발명에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 과정을 설명하는 도면이다.
도 6은 본 발명에 따른 키버트 기반의 키워드 도출 과정의 일 실시예를 설명하는 도면이다.
도 7 내지 9는 본 발명에 따른 오토인코더 기반의 임베딩 얼라인먼트 과정의 일 실시예를 설명하는 도면이다.
도 10은 본 발명에 따른 키워드 주변 단어들의 비교 과정의 일 실시예를 설명하는 도면이다.
1 is a diagram illustrating an important keyword derivation system according to the present invention.
FIG. 2 is a diagram explaining the system configuration of the important keyword derivation device of FIG. 1.
FIG. 3 is a diagram explaining the functional configuration of the important keyword derivation device of FIG. 1.
Figure 4 is a flowchart explaining a method of deriving important keywords from a customer perspective based on deep learning according to the present invention.
Figure 5 is a diagram illustrating the process of deriving important keywords from a customer perspective based on deep learning according to the present invention.
Figure 6 is a diagram illustrating an embodiment of the keybert-based keyword derivation process according to the present invention.
7 to 9 are diagrams illustrating an embodiment of an autoencoder-based embedding alignment process according to the present invention.
Figure 10 is a diagram illustrating an embodiment of a comparison process of words surrounding a keyword according to the present invention.

본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.Since the description of the present invention is only an example for structural or functional explanation, the scope of the present invention should not be construed as limited by the examples described in the text. In other words, since the embodiments can be modified in various ways and can have various forms, the scope of rights of the present invention should be understood to include equivalents that can realize the technical idea. In addition, the purpose or effect presented in the present invention does not mean that a specific embodiment must include all or only such effects, so the scope of the present invention should not be understood as limited thereby.

한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.Meanwhile, the meaning of the terms described in this application should be understood as follows.

"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.Terms such as “first” and “second” are used to distinguish one component from another component, and the scope of rights should not be limited by these terms. For example, a first component may be named a second component, and similarly, the second component may also be named a first component.

어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.When a component is referred to as being “connected” to another component, it should be understood that it may be directly connected to the other component, but that other components may exist in between. On the other hand, when a component is referred to as being “directly connected” to another component, it should be understood that there are no other components in between. Meanwhile, other expressions that describe the relationship between components, such as "between" and "immediately between" or "neighboring" and "directly neighboring" should be interpreted similarly.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다"또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Singular expressions should be understood to include plural expressions unless the context clearly indicates otherwise, and terms such as “comprise” or “have” refer to implemented features, numbers, steps, operations, components, parts, or them. It is intended to specify the existence of a combination, and should be understood as not excluding in advance the possibility of the presence or addition of one or more other features, numbers, steps, operations, components, parts, or combinations thereof.

각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.For each step, identification codes (e.g., a, b, c, etc.) are used for convenience of explanation. The identification codes do not explain the order of each step, and each step clearly follows a specific order in context. Unless specified, events may occur differently from the specified order. That is, each step may occur in the same order as specified, may be performed substantially simultaneously, or may be performed in the opposite order.

본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The present invention can be implemented as computer-readable code on a computer-readable recording medium, and the computer-readable recording medium includes all types of recording devices that store data that can be read by a computer system. . Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, and optical data storage devices. Additionally, the computer-readable recording medium can be distributed in a computer system connected to a network, so that the computer-readable code can be stored and executed in a distributed manner.

여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.All terms used herein, unless otherwise defined, have the same meaning as commonly understood by a person of ordinary skill in the field to which the present invention pertains. Terms defined in commonly used dictionaries should be interpreted as consistent with the meaning they have in the context of the related technology, and cannot be interpreted as having an ideal or excessively formal meaning unless clearly defined in the present application.

도 1은 본 발명에 따른 중요 키워드 도출 시스템을 설명하는 도면이다.1 is a diagram illustrating an important keyword derivation system according to the present invention.

도 1을 참조하면, 도 1을 참조하면, 중요 키워드 도출 시스템(100)은 사용자 단말(110), 중요 키워드 도출 장치(130) 및 데이터베이스(150)을 포함할 수 있다.Referring to FIG. 1 , the important keyword derivation system 100 may include a user terminal 110, an important keyword derivation device 130, and a database 150.

사용자 단말(110)은 사용자에 의해 운용되는 단말 장치에 해당할 수 있다. 본 발명의 실시예에서 사용자는 하나 이상의 사용자로 이해될 수 있으며, 하나 이상의 사용자들 각각은 하나 이상의 사용자 단말(110)에 대응될 수 있다. 즉, 도 1에서는 하나의 사용자 단말(110)로 표현되어 있으나, 제1 사용자는 제1 사용자 단말, 제2 사용자는 제2 사용자 단말, ..., 제n(상기 n은 자연수) 사용자는 제n 사용자 단말에 각각 대응될 수 있다.The user terminal 110 may correspond to a terminal device operated by a user. In an embodiment of the present invention, a user may be understood as one or more users, and each of the one or more users may correspond to one or more user terminals 110. That is, in Figure 1, it is represented as one user terminal 110, but the first user is the first user terminal, the second user is the second user terminal, ..., the nth (where n is a natural number) user is the first user terminal. n may each correspond to a user terminal.

또한, 사용자 단말(110)은 본 발명에 따른 중요 키워드 도출 시스템(100)을 구성하는 하나의 장치로서 구현될 수 있으며, 중요 키워드 도출 시스템(100)은 딥러닝 기반 고객 관점 중요 키워드 도출 목적에 따라 다양한 형태로 변형되어 구현될 수 있다.In addition, the user terminal 110 can be implemented as a device that constitutes the important keyword derivation system 100 according to the present invention, and the important keyword derivation system 100 is based on deep learning based on the purpose of deriving important keywords from the customer's perspective. It can be transformed and implemented in various forms.

또한, 사용자 단말(110)은 중요 키워드 도출 장치(130)와 연결되어 동작 가능한 스마트폰, 노트북 또는 컴퓨터로 구현될 수 있으며, 반드시 이에 한정되지 않고, 태블릿 PC 등 포함하여 다양한 디바이스로도 구현될 수 있다.In addition, the user terminal 110 may be implemented as a smartphone, laptop, or computer that can be operated by being connected to the important keyword derivation device 130, but is not necessarily limited thereto, and may also be implemented as a variety of devices, including tablet PCs, etc. there is.

한편, 사용자 단말(110)은 중요 키워드 도출 장치(130)와 네트워크를 통해 연결될 수 있고, 복수의 사용자 단말(110)들은 중요 키워드 도출 장치(130)와 동시에 연결될 수도 있다.Meanwhile, the user terminal 110 may be connected to the important keyword deriving device 130 through a network, and a plurality of user terminals 110 may be connected to the important keyword deriving device 130 at the same time.

중요 키워드 도출 장치(130)는 본 발명에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 방법을 수행하는 컴퓨터 또는 프로그램에 해당하는 서버로 구현될 수 있다. 또한, 중요 키워드 도출 장치(130)는 사용자 단말(110)과 유선 네트워크 또는 블루투스, WiFi, LTE 등과 같은 무선 네트워크로 연결될 수 있고, 네트워크를 통해 사용자 단말(110)과 데이터를 송·수신할 수 있다. 또한, 중요 키워드 도출 장치(130)는 독립된 외부 시스템(도 1에 미도시함)과 연결되어 동작하도록 구현될 수 있다.The important keyword derivation device 130 may be implemented as a server corresponding to a computer or program that performs the deep learning-based customer perspective important keyword derivation method according to the present invention. In addition, the important keyword derivation device 130 may be connected to the user terminal 110 through a wired network or a wireless network such as Bluetooth, WiFi, LTE, etc., and may transmit and receive data with the user terminal 110 through the network. . Additionally, the important keyword derivation device 130 may be implemented to operate in connection with an independent external system (not shown in FIG. 1).

일 실시예에서, 중요 키워드 도출 장치(130)는 클라우드 서버로 구현될 수 있으며, 다른 실시예에서, 중요 키워드 도출 장치(130)는 하나의 그래픽 처리 장치(Graphics Processing Unit, GPU)로 구현될 수도 있다.In one embodiment, the important keyword deriving device 130 may be implemented as a cloud server, and in another embodiment, the important keyword deriving device 130 may be implemented as a single graphics processing unit (Graphics Processing Unit, GPU). there is.

데이터베이스(150)는 중요 키워드 도출 장치(130)의 동작 과정에서 필요한 다양한 정보들을 저장하는 저장장치에 해당할 수 있다. 예를 들어, 데이터베이스(150)는 학습 데이터 및 임베딩 모델에 관한 정보를 저장하거나 또는 중요 키워드 알고리즘 및 오토인코더 모델에 관한 정보를 저장할 수 있으며, 반드시 이에 한정되지 않고, 중요 키워드 도출 장치(130)가 본 발명에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 방법을 수행하는 과정에서 다양한 형태로 수집 또는 가공된 정보들을 저장할 수 있다.The database 150 may correspond to a storage device that stores various information required during the operation of the important keyword derivation device 130. For example, the database 150 may store information about learning data and an embedding model, or may store information about an important keyword algorithm and an autoencoder model, but is not necessarily limited thereto, and the important keyword derivation device 130 In the process of performing the deep learning-based customer perspective key keyword derivation method according to the present invention, information collected or processed in various forms can be stored.

또한, 도 1에서, 데이터베이스(150)는 중요 키워드 도출 장치(130)와 독립적인 장치로서 도시되어 있으나, 반드시 이에 한정되지 않고, 논리적인 저장장치로서 중요 키워드 도출 장치(130)에 포함되어 구현될 수 있음은 물론이다.In addition, in FIG. 1, the database 150 is shown as a device independent of the important keyword derivation device 130, but is not necessarily limited thereto, and may be implemented as a logical storage device included in the important keyword derivation device 130. Of course it is possible.

도 2는 도 1의 중요 키워드 도출 장치의 시스템 구성을 설명하는 도면이다.FIG. 2 is a diagram explaining the system configuration of the important keyword derivation device of FIG. 1.

도 2를 참조하면, 중요 키워드 도출 장치(130)는 프로세서(210), 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)를 포함할 수 있다.Referring to FIG. 2, the important keyword derivation device 130 may include a processor 210, a memory 230, a user input/output unit 250, and a network input/output unit 270.

프로세서(210)는 본 발명의 실시예에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 프로시저를 실행할 수 있고, 이러한 과정에서 읽혀지거나 작성되는 메모리(230)를 관리할 수 있으며, 메모리(230)에 있는 휘발성 메모리와 비휘발성 메모리 간의 동기화 시간을 스케줄 할 수 있다. 프로세서(210)는 중요 키워드 도출 장치(130)의 동작 전반을 제어할 수 있고, 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)와 전기적으로 연결되어 이들 간의 데이터 흐름을 제어할 수 있다. 프로세서(210)는 중요 키워드 도출 장치(130)의 CPU(Central Processing Unit) 또는 GPU(Graphics Processing Unit)로 구현될 수 있다.The processor 210 can execute a deep learning-based customer perspective important keyword derivation procedure according to an embodiment of the present invention, and manage the memory 230 that is read or written in this process. The synchronization time between volatile memory and non-volatile memory can be scheduled. The processor 210 can control the overall operation of the important keyword derivation device 130 and is electrically connected to the memory 230, the user input/output unit 250, and the network input/output unit 270 to control data flow between them. can do. The processor 210 may be implemented as a CPU (Central Processing Unit) or a GPU (Graphics Processing Unit) of the important keyword derivation device 130.

메모리(230)는 SSD(Solid State Disk) 또는 HDD(Hard Disk Drive)와 같은 비휘발성 메모리로 구현되어 중요 키워드 도출 장치(130)에 필요한 데이터 전반을 저장하는데 사용되는 보조기억장치를 포함할 수 있고, RAM(Random Access Memory)과 같은 휘발성 메모리로 구현된 주기억장치를 포함할 수 있다. 또한, 메모리(230)는 전기적으로 연결된 프로세서(210)에 의해 실행됨으로써 본 발명에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 방법을 실행하는 명령들의 집합을 저장할 수 있다.The memory 230 may be implemented as a non-volatile memory such as a solid state disk (SSD) or a hard disk drive (HDD) and may include an auxiliary memory used to store all data required for the important keyword derivation device 130. , may include a main memory implemented as volatile memory such as RAM (Random Access Memory). In addition, the memory 230 is executed by the electrically connected processor 210 and can store a set of instructions for executing the deep learning-based customer perspective important keyword derivation method according to the present invention.

사용자 입출력부(250)은 사용자 입력을 수신하기 위한 환경 및 사용자에게 특정 정보를 출력하기 위한 환경을 포함하고, 예를 들어, 터치 패드, 터치 스크린, 화상 키보드 또는 포인팅 장치와 같은 어댑터를 포함하는 입력장치 및 모니터 또는 터치 스크린과 같은 어댑터를 포함하는 출력장치를 포함할 수 있다. 일 실시예에서, 사용자 입출력부(250)은 원격 접속을 통해 접속되는 컴퓨팅 장치에 해당할 수 있고, 그러한 경우, 중요 키워드 도출 장치(130)는 독립적인 서버로서 수행될 수 있다.The user input/output unit 250 includes an environment for receiving user input and an environment for outputting specific information to the user, and includes an input adapter such as, for example, a touch pad, a touch screen, an on-screen keyboard, or a pointing device. It may include an output device including a device and an adapter such as a monitor or touch screen. In one embodiment, the user input/output unit 250 may correspond to a computing device connected through a remote connection, and in such case, the important keyword derivation device 130 may be performed as an independent server.

네트워크 입출력부(270)은 네트워크를 통해 사용자 단말(110)과 연결되기 위한 통신 환경을 제공하고, 예를 들어, LAN(Local Area Network), MAN(Metropolitan Area Network), WAN(Wide Area Network) 및 VAN(Value Added Network) 등의 통신을 위한 어댑터를 포함할 수 있다. 또한, 네트워크 입출력부(270)는 학습 데이터의 무선 전송을 위해 WiFi, 블루투스 등의 근거리 통신 기능이나 4G 이상의 무선 통신 기능을 제공하도록 구현될 수 있다.The network input/output unit 270 provides a communication environment for connection to the user terminal 110 through a network, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), and It may include an adapter for communication such as VAN (Value Added Network). Additionally, the network input/output unit 270 may be implemented to provide short-range communication functions such as WiFi and Bluetooth or wireless communication functions of 4G or higher for wireless transmission of learning data.

도 3은 도 1의 중요 키워드 도출 장치의 기능적 구성을 설명하는 도면이다.FIG. 3 is a diagram explaining the functional configuration of the important keyword derivation device of FIG. 1.

도 3을 참조하면, 중요 키워드 도출 장치(130)는 임베딩 학습부(310), 키워드 리스트 생성부(330), 임베딩 공간 통합부(350), 주변 단어 리스트 생성부(370), 고객 중심 키워드 추천부(390) 및 제어부(도 3에 미도시함)를 포함할 수 있다.Referring to FIG. 3, the important keyword derivation device 130 includes an embedding learning unit 310, a keyword list creation unit 330, an embedding space integration unit 350, a surrounding word list creation unit 370, and a customer-oriented keyword recommendation unit. It may include a unit 390 and a control unit (not shown in FIG. 3).

이때, 중요 키워드 도출 장치(130)는 상기의 기능적 구성들을 동시에 모두 포함해야 하는 것은 아니며, 각각의 실시예에 따라 상기의 구성들 중 일부를 생략하거나, 상기의 구성들 중 일부 또는 전부를 선택적으로 포함하여 구현될 수도 있다. 또한, 중요 키워드 도출 장치(130)는 상기 구성들 중 일부를 선택적으로 포함하는 독립된 모듈로서 구현될 수 있으며, 각 모듈들 간의 연동을 통해 본 발명에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 방법을 수행할 수도 있다. 이하, 각 구성들의 동작을 구체적으로 설명한다.At this time, the important keyword derivation device 130 does not have to include all of the above functional components at the same time, and depending on each embodiment, some of the above components may be omitted, or some or all of the above components may be selectively used. It may also be implemented including. In addition, the important keyword derivation device 130 may be implemented as an independent module that selectively includes some of the above components, and performs the deep learning-based customer perspective important keyword derivation method according to the present invention through linkage between each module. You may. Hereinafter, the operation of each component will be described in detail.

임베딩 학습부(310)는 기업 관점 정보와 고객 관점 정보를 포함하는 텍스트 데이터셋을 기반으로 임베딩(embedding) 학습을 통해 관점별 키워드에 관한 임베딩 공간을 독립적으로 생성할 수 있다. 이를 위하여, 임베딩 학습부(310)는 기업 관점 정보와 고객 관점 정보를 수집하고 이를 기반으로 임베딩 학습을 위한 텍스트 데이터셋을 구축할 수 있다. 예를 들어, 기업 관점 정보는 상품 판매 기업의 경우 자사 상품에 대한 광고 또는 홍보 문구, 제품 설명 등에 관한 텍스트 정보에 해당할 수 있다. 고객 관점 정보는 기업이 판매하는 상품에 대한 고객의 평가, 상품 구매 후기 또는 리뷰 등에 관한 텍스트 정보에 해당할 수 있다.The embedding learning unit 310 can independently create an embedding space for keywords for each perspective through embedding learning based on a text dataset including company perspective information and customer perspective information. To this end, the embedding learning unit 310 can collect corporate perspective information and customer perspective information and build a text dataset for embedding learning based on this. For example, in the case of a company selling products, corporate perspective information may correspond to text information about advertisements or promotional text for its products, product descriptions, etc. Customer perspective information may correspond to text information about customer evaluations of products sold by a company, product purchase reviews or reviews, etc.

즉, 임베딩 학습부(310)는 네트워크를 통해 접근 가능한 웹페이지들에서 크롤링(crawling)을 통해 연관된 텍스트 정보를 추출할 수 있다. 또한, 임베딩 학습부(310)는 사용자 단말(110)로부터 특정 기업의 데이터를 직접 수신하여 연관된 텍스트 정보를 획득할 수도 있다. 이후, 임베딩 학습부(310)는 기업 과 고객 관점에서 각각 독립적으로 구축된 텍스트 데이터셋을 기반으로 임베딩(embedding) 학습을 통해 관점별 키워드에 관한 임베딩 공간을 독립적으로 생성할 수 있다. 여기에서, 임베딩 공간(embedding space)은 임베딩 벡터(embedding vector)가 분포하는 벡터 공간(vector space)에 해당할 수 있다. 즉, 임베딩 학습은 텍스트 데이터셋에 포함된 텍스트 데이터들을 벡터 공간으로 매핑하는 과정을 반복적으로 수행하여 텍스트와 벡터 사이의 변환 관계를 학습하는 과정에 해당할 수 있다.That is, the embedding learning unit 310 can extract related text information through crawling from web pages accessible through a network. Additionally, the embedding learning unit 310 may directly receive data of a specific company from the user terminal 110 and obtain related text information. Afterwards, the embedding learning unit 310 can independently create an embedding space for keywords for each perspective through embedding learning based on text datasets independently constructed from the company and customer perspectives. Here, the embedding space may correspond to a vector space in which embedding vectors are distributed. In other words, embedding learning may correspond to a process of learning the transformation relationship between text and vectors by repeatedly performing the process of mapping text data included in the text dataset into vector space.

일 실시예에서, 임베딩 학습부(310)는 기업 관점 정보에 관한 제1 텍스트 데이터셋 및 고객 관점 정보에 관한 제2 텍스트 데이터셋 각각에 대해 Word2Vec을 포함하는 임베딩 학습 모델을 적용하여 기업 관점 임베딩 공간 및 고객 관점 임베딩 공간을 각각 생성할 수 있다. 여기에서, Word2Vec은 텍스트를 벡터로 변환하는 다양한 임베딩 기법 중 하나로서 신경망(Neural Network) 모델을 사용하여 단어 간의 연관성을 학습하는 알고리즘에 해당할 수 있다. 예를 들어, 임베딩 학습부(310)는 기업과 고객 관점의 단어들 각각을 Word2Vec을 통해 독립적으로 학습할 수 있고, 학습 결과로서 기업과 고객 관점의 단어들 각각에 매핑되는 독립된 임베딩 공간을 생성할 수 있다.In one embodiment, the embedding learning unit 310 applies an embedding learning model including Word2Vec to each of the first text dataset regarding corporate perspective information and the second text dataset relating to customer perspective information to create a corporate perspective embedding space. and customer perspective embedding spaces can be created, respectively. Here, Word2Vec is one of various embedding techniques that convert text into vectors and may correspond to an algorithm that learns associations between words using a neural network model. For example, the embedding learning unit 310 can independently learn each of the words from the company and customer perspectives through Word2Vec, and as a learning result, generate an independent embedding space that is mapped to each of the words from the company and customer perspectives. You can.

즉, 기업 관점 임베딩 공간은 기업 관점의 단어들이 매핑되는 벡터 공간에 해당하고, 고객 관점 임베딩 공간은 고객 관점의 단어들이 매핑되는 벡터 공간에 해당할 수 있다. 예를 들어, 기업 관점 임베딩 공간은 상품 정보 임베딩 공간에 대응될 수 있고, 고객 관점 임베딩 공간은 상품 리뷰 임베딩 공간에 대응될 수 있다. 한편, 임베딩 학습부(310)를 통해 생성된 상품 리뷰 임베딩 공간과 상품 정보 임베딩 공간에는 키워드 이외에 일반 용어들도 포함될 수 있으며, 이는 임베딩 공간의 완결성과 딥러닝 학습을 위한 것일 수 있다.In other words, the company perspective embedding space may correspond to a vector space into which words from the company perspective are mapped, and the customer perspective embedding space may correspond to a vector space into which words from the customer perspective are mapped. For example, the company perspective embedding space may correspond to the product information embedding space, and the customer perspective embedding space may correspond to the product review embedding space. Meanwhile, the product review embedding space and the product information embedding space created through the embedding learning unit 310 may include general terms in addition to keywords, which may be for the completeness of the embedding space and deep learning learning.

키워드 리스트 생성부(330)는 기업 관점 임베딩 공간 상에서 복수의 키워드들을 선별하여 기업 관점 키워드 리스트를 생성할 수 있다. 여기에서, 기업 관점 키워드 리스트는 기업 관점 정보, 즉 상품 설명 등에 포함된 단어들 중에서 기업 관점에서 중요한 가치를 갖는 키워드들의 집합에 해당할 수 있다. 키워드 리스트 생성부(330)는 기업 관점 임베딩 공간 상에 분포하는 단어들 중에서 키워드들을 선별하여 키워드 리스트를 생성할 수 있으며, 이를 위하여 다양한 키워드 추출 알고리즘을 활용할 수 있다.The keyword list generator 330 may select a plurality of keywords in the enterprise perspective embedding space and generate a corporate perspective keyword list. Here, the corporate perspective keyword list may correspond to a set of keywords that have important value from the corporate perspective among words included in corporate perspective information, that is, product descriptions, etc. The keyword list generator 330 can generate a keyword list by selecting keywords from words distributed in the enterprise perspective embedding space, and for this purpose, various keyword extraction algorithms can be used.

일 실시예에서, 키워드 리스트 생성부(330)는 기업 관점 임베딩 공간 상에 분포하는 키워드들 중에서 KeyBERT를 포함하는 키워드 추출 모델을 적용하여 출력된 스코어(score)를 기준으로 상위 N개(상기 N은 자연수)의 키워드들을 결정하여 기업 관점 키워드 리스트를 생성할 수 있다. 보다 구체적으로, 키버트(KeyBERT)는 버트(BERT) 모델을 기반으로 정의된 키워드 추출 모델로서 문서 레벨에서의 주제를 파악하도록 하고 N-gram을 위해 단어를 임베딩하여 코사인 유사도를 기반으로 어떤 N-gram 단어 또는 구가 문서와 가장 유사한지를 도출하는 모델에 해당할 수 있다. 키워드 리스트 생성부(330)는 사전에 구축된 keyBERT 모델을 이용하여 키워드별 스코어를 결정하고, 해당 스코어를 기준으로 키워드들을 정렬하여 특정 개수(Top-N 개)만큼의 키워드들을 선별한 다음 기업 관점 키워드 리스트를 생성할 수 있다.In one embodiment, the keyword list generator 330 selects the top N (where N is By determining keywords (natural numbers), you can create a keyword list from a corporate perspective. More specifically, KeyBERT is a keyword extraction model defined based on the BERT model to identify topics at the document level and embed words for N-grams to extract any N-gram based on cosine similarity. gram may correspond to a model that derives whether a word or phrase is most similar to a document. The keyword list generator 330 determines the score for each keyword using a pre-built keyBERT model, sorts the keywords based on the score, selects a certain number (Top-N) of keywords, and then analyzes them from a corporate perspective. You can create a keyword list.

임베딩 공간 통합부(350)는 기업 관점 임베딩 공간과 고객 관점 임베딩 공간을 통합하여 고객 관점 통합 임베딩 공간을 생성할 수 있다. 즉, 임베딩 공간 통합부(350)는 서로 다른 임베딩 공간에 존재하는 임베딩 값들을 정렬하는 동작을 수행할 수 있으며, 이를 통해 기업 관점의 상품 정보 임베딩을 고객 관점의 상품 리뷰 임베딩 공간으로 매핑할 수 있다. 고객 관점 통합 임베딩 공간은 서로 다른 임베딩 공간이 통합된 결과로서 임베딩 공간 통합부(350)에 의해 생성될 수 있다.The embedding space integration unit 350 may integrate the enterprise perspective embedding space and the customer perspective embedding space to create a customer perspective integrated embedding space. In other words, the embedding space integrator 350 can perform an operation of sorting embedding values existing in different embedding spaces, and through this, product information embedding from the company's perspective can be mapped to the product review embedding space from the customer's perspective. . The customer perspective integrated embedding space may be created by the embedding space integration unit 350 as a result of integrating different embedding spaces.

일 실시예에서, 임베딩 공간 통합부(350)는 기업 관점 임베딩 공간을 입력으로 사용하고 고객 관점 임베딩 공간을 출력으로 사용하는 오토인코더(AutoEncoder) 기반의 임베딩 얼라인먼트(embedding alignment)를 수행하여 고객 관점 통합 임베딩 공간을 생성할 수 있다. 임베딩 공간 통합부(350)는 압축과 복원에 탁월한 성능을 제공하는 오토인코더 구조를 기반으로 서로 다른 임베딩 공간들 간의 임베딩 얼라인먼트를 수행할 수 있다. 여기에서, 오토인코더는 인코더-디코더(encoder-decoder) 구조로 정의되는 신경망 모델에 해당할 수 있으며, 인코더를 통해 입력된 신호를 변환한 다음 디코더를 통해 변환된 신호를 복원하는 과정을 통해 학습이 진행될 수 있다. 임베딩 얼라인먼트는 오토인코더 모델에 대한 학습 단계와 오토인코더 모델을 통한 추론 단계를 통해 수행될 수 있다.In one embodiment, the embedding space integration unit 350 integrates the customer perspective by performing AutoEncoder-based embedding alignment using the enterprise perspective embedding space as input and the customer perspective embedding space as output. An embedding space can be created. The embedding space integrator 350 can perform embedding alignment between different embedding spaces based on an autoencoder structure that provides excellent performance in compression and restoration. Here, the autoencoder may correspond to a neural network model defined by an encoder-decoder structure, and learning is performed through the process of converting the signal input through the encoder and then restoring the signal converted through the decoder. It can proceed. Embedding alignment can be performed through a learning step for an autoencoder model and an inference step through the autoencoder model.

일 실시예에서, 임베딩 공간 통합부(350)는 기업 관점 임베딩 공간 및 고객 관점 임베딩 공간에 공통으로 분포하는 공통 키워드들 중에서 기업 관점 키워드 리스트에 포함되지 않는 키워드들을 대상으로 오토인코더 모델에 대한 학습을 수행할 수 있다. 일 실시예에서, 임베딩 공간 통합부(350)는 공통 키워드들 중에서 기업 관점 키워드 리스트에 포함된 키워드들과 기업 관점 임베딩 공간 상에만 분포하는 키워드들을 대상으로 오토인코더 모델을 적용하여 고객 관점 임베딩 공간 상의 임베딩 값으로 매핑할 수 있다. 일 실시예에서, 임베딩 공간 통합부(350)는 공통 키워드들 중에서 기업 관점 키워드 리스트에 포함된 키워드들에 대해서는 고객 관점 임베딩 공간 상의 벡터값을 임베딩 값으로 대체할 수 있다. 이에 대해서는 도 7 내지 9를 통해 보다 자세히 설명한다.In one embodiment, the embedding space integration unit 350 learns an autoencoder model for keywords that are not included in the enterprise perspective keyword list among common keywords commonly distributed in the enterprise perspective embedding space and the customer perspective embedding space. It can be done. In one embodiment, the embedding space integrator 350 applies an autoencoder model to keywords included in the enterprise perspective keyword list among common keywords and keywords distributed only in the enterprise perspective embedding space to generate data in the customer perspective embedding space. It can be mapped to embedding values. In one embodiment, the embedding space integrator 350 may replace vector values in the customer perspective embedding space with embedding values for keywords included in the company perspective keyword list among common keywords. This will be explained in more detail through FIGS. 7 to 9.

주변 단어 리스트 생성부(370)는 기업 관점 키워드 리스트의 각 키워드를 기준으로 기업 관점 임베딩 공간 및 고객 관점 통합 임베딩 공간 상에서 주변 단어들을 각각 선별하여 기업 및 고객 중심의 키워드 주변 단어 리스트들을 독립적으로 생성할 수 있다. 여기에서, 주변 단어는 임베딩 공간 상에 분포하는 단어들 중에서 특정 키워드와 상대적으로 연관성 높은 단어들에 해당할 수 있고, 주변 단어 리스트는 주변 단어들의 집합으로 정의될 수 있다.The surrounding word list generator 370 selects the surrounding words in the corporate perspective embedding space and the customer perspective integrated embedding space based on each keyword in the corporate perspective keyword list, and independently generates company and customer-oriented keyword surrounding word lists. You can. Here, the surrounding words may correspond to words that are relatively highly related to a specific keyword among words distributed in the embedding space, and the surrounding word list may be defined as a set of surrounding words.

먼저, 주변 단어 리스트 생성부(370)는 키워드를 기준으로 각 임베딩 공간 상에서 주변 단어들을 선정하여 각 주변 단어 리스트를 생성할 수 있으며, 주변 단어의 선정은 기업 관점 임베딩 공간에서 keyBERT를 통해 추출된 키워드들을 기준으로 수행될 수 있다. 주변 단어 리스트 생성부(370)에 의해 생성되는 주변 단어 리스트는 임베딩 공간에 존재하는 개별 단어의 의미가 해당 공간에 동시 출현하는 단어들의 분포에 따라 결정된다는 분포 가설에 기반한 것으로, 키워드 자체의 의미 변화를 주변 단어를 사용하여 더욱 세밀하게 파악하는 과정에 활용될 수 있다.First, the surrounding word list generator 370 can generate a list of surrounding words by selecting surrounding words in each embedding space based on the keyword, and the selection of surrounding words is based on keywords extracted through keyBERT in the enterprise perspective embedding space. It can be performed based on these. The surrounding word list generated by the surrounding word list generator 370 is based on the distribution hypothesis that the meaning of individual words existing in the embedding space is determined by the distribution of words co-occurring in the space, and changes in the meaning of the keyword itself It can be used in the process of understanding in more detail using surrounding words.

또한, 주변 단어 리스트 생성부(370)에 의해 생성되는 주변 단어 리스트는 선정된 임베딩 공간에 따라 기업 중심 키워드 주변 단어 리스트와 고객 중심 키워드 주변 단어 리스트로 구분될 수 있다. 기업 중심 키워드 주변 단어 리스트는 기업의 관점에서 연관성 높은 것으로 추정되는 주변 단어들의 집합에 대응될 수 있고, 고객 중심 키워드 주변 단어 리스트는 고객의 관점에서 연관성 높은 것으로 추정되는 주변 단어들의 집합에 대응될 수 있다. 특히, 기업 중심 키워드의 경우와 달리 고객 중심 키워드의 경우 통합된 임베딩 공간 상에서 주변 단어들이 선정됨으로써 기존 방식에서는 발견되지 않았던 고객 관점의 중요 키워드들이 도출될 수 있다.Additionally, the surrounding word list generated by the surrounding word list generator 370 may be divided into a word list surrounding company-centered keywords and a word list surrounding customer-centered keywords according to the selected embedding space. The list of words around a company-centric keyword may correspond to a set of surrounding words that are estimated to be highly relevant from the company's perspective, and the list of words around a customer-centric keyword may correspond to a set of surrounding words that are estimated to be highly relevant from the customer's perspective. there is. In particular, unlike in the case of company-centered keywords, in the case of customer-centered keywords, important keywords from the customer's perspective that were not found in existing methods can be derived by selecting surrounding words in the integrated embedding space.

일 실시예에서, 주변 단어 리스트 생성부(370)는 각 키워드를 중심으로 기업 및 고객 중심의 키워드 주변 단어 리스트들의 개별 주변 단어들을 각 키워드에 연결하여 키워드 주변 단어 네트워크를 생성할 수 있다. 이때, 키워드 주변 단어 네트워크의 노드는 각 키워드 및 개별 주변 단어들 각각에 대응되고, 노드 간 에지는 각 키워드와 개별 주변 단어들 간의 연결 관계에 대응될 수 있다. 즉, 키워드 주변 단어 네트워크는 키워드와 주변 단어들 간의 연결 관계를 표현한 그래프(graph)에 해당할 수 있다. 키워드 주변 단어 네트워크의 노드들은 대응되는 키워드와 주변 단어에 따라 구분될 수 있으며, 주변 단어 간에도 기업 및 고객 관점에 따라 구분될 수 있다.In one embodiment, the surrounding word list generator 370 may generate a keyword surrounding word network by connecting individual neighboring words from company- and customer-oriented keyword neighboring word lists to each keyword, centered on each keyword. At this time, the nodes of the keyword-surrounding word network may correspond to each keyword and individual neighboring words, and the edges between nodes may correspond to the connection relationships between each keyword and individual neighboring words. In other words, the word network surrounding a keyword may correspond to a graph expressing the connection relationship between the keyword and surrounding words. Nodes in the keyword-surrounding word network can be classified according to the corresponding keyword and surrounding words, and surrounding words can also be distinguished according to the company and customer perspectives.

고객 중심 키워드 추천부(390)는 각 키워드를 기준으로 기업 및 고객 중심의 키워드 주변 단어 리스트들을 상호 비교하여 고객 관점 중요 키워드를 결정할 수 있다. 고객 중심 키워드 추천부(390)는 동일한 키워드에 대해 각 키워드 주변 단어 리스트의 단어들을 상호 비교하여 주변 단어가 크게 바뀐 단어들을 식별할 수 있다. 고객 중심 키워드 추천부(390)는 주변 단어가 크게 바뀐 키워드들을 기반으로 고객 관점 중요 키워드를 결정하거나 또는 크게 바뀐 주변 단어들 자체를 기반으로 고객 관점 중요 키워드를 결정할 수도 있다.The customer-centered keyword recommendation unit 390 can determine important keywords from the customer's perspective by comparing word lists surrounding the company- and customer-centered keywords based on each keyword. The customer-centered keyword recommendation unit 390 may identify words in which the surrounding words have changed significantly by comparing words in a list of words surrounding each keyword for the same keyword. The customer-centered keyword recommendation unit 390 may determine important keywords from the customer's perspective based on keywords whose surrounding words have changed significantly, or may determine important keywords from the customer's perspective based on the surrounding words themselves whose surrounding words have changed significantly.

일 실시예에서, 고객 중심 키워드 추천부(390)는 각 키워드를 기준으로 기업 및 고객 중심의 키워드 주변 단어 리스트들에서 서로 중복되지 않는 주변 단어들을 고객 관점 중요 키워드로 결정할 수 있다. 예를 들어, 키워드 A에 대해 연결된 기업 중심의 키워드 주변 단어 리스트가 {a, b}이고 고객 중심의 키워드 주변 단어 리스트가 {b, c}인 경우 고객 중심 키워드 추천부(390)는 단어 c를 선택하여 고객 관점 중요 키워드에 추가할 수 있다. 고객 중심 키워드 추천부(390)는 기업 관점 키워드 리스트의 모든 키워드들을 대상으로 고객 관점 중요 키워드를 결정한 다음 해당 단어들을 고객 중심의 추천 키워드로 제공할 수 있다.In one embodiment, the customer-centered keyword recommendation unit 390 may determine, based on each keyword, surrounding words that do not overlap with each other in the list of words surrounding the company- and customer-centered keywords as important keywords from the customer's perspective. For example, if the list of words around a company-oriented keyword linked to keyword A is {a, b} and the list of words around a customer-oriented keyword is {b, c}, the customer-oriented keyword recommendation unit 390 selects word c. You can select and add them to important keywords from a customer perspective. The customer-oriented keyword recommendation unit 390 may determine important keywords from the customer's perspective among all keywords in the company's perspective keyword list and then provide the corresponding words as customer-oriented recommended keywords.

제어부(도 3에 미도시함)는 중요 키워드 도출 장치(130)의 전체적인 동작을 제어하고, 임베딩 학습부(310), 키워드 리스트 생성부(330), 임베딩 공간 통합부(350), 주변 단어 리스트 생성부(370) 및 고객 중심 키워드 추천부(390) 간의 제어 흐름 또는 데이터 흐름을 관리할 수 있다.The control unit (not shown in FIG. 3) controls the overall operation of the important keyword derivation device 130, and includes the embedding learning unit 310, the keyword list generating unit 330, the embedding space integration unit 350, and the surrounding word list. Control flow or data flow between the creation unit 370 and the customer-centered keyword recommendation unit 390 can be managed.

도 4는 본 발명에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 방법을 설명하는 순서도이다.Figure 4 is a flowchart explaining a method of deriving important keywords from a customer perspective based on deep learning according to the present invention.

도 4를 참조하면, 중요 키워드 도출 장치(130)는 임베딩 학습부(310)를 통해 기업 관점 정보와 고객 관점 정보를 포함하는 텍스트 데이터셋을 기반으로 임베딩(embedding) 학습을 통해 관점별 키워드에 관한 임베딩 공간을 독립적으로 생성할 수 있다(단계 S410). 중요 키워드 도출 장치(130)는 키워드 리스트 생성부(330)를 통해 기업 관점 임베딩 공간 상에서 복수의 키워드들을 선별하여 기업 관점 키워드 리스트를 생성할 수 있다(단계 S430).Referring to FIG. 4, the important keyword derivation device 130 learns about keywords for each perspective through embedding learning based on a text dataset including company perspective information and customer perspective information through the embedding learning unit 310. The embedding space can be created independently (step S410). The important keyword derivation device 130 may select a plurality of keywords in the enterprise perspective embedding space through the keyword list generator 330 to generate a corporate perspective keyword list (step S430).

또한, 중요 키워드 도출 장치(130)는 임베딩 공간 통합부(350)를 통해 기업 관점 임베딩 공간과 고객 관점 임베딩 공간을 통합하여 고객 관점 통합 임베딩 공간을 생성할 수 있다(단계 S450). 중요 키워드 도출 장치(130)는 주변 단어 리스트 생성부(370)를 통해 기업 관점 키워드 리스트의 각 키워드를 기준으로 기업 관점 임베딩 공간 및 고객 관점 통합 임베딩 공간 상에서 주변 단어들을 각각 선별하여 기업 및 고객 중심의 키워드 주변 단어 리스트들을 독립적으로 생성할 수 있다(단계 S470). 중요 키워드 도출 장치(130)는 고객 중심 키워드 추천부(390)를 통해 각 키워드를 기준으로 기업 및 고객 중심의 키워드 주변 단어 리스트들을 상호 비교하여 고객 관점 중요 키워드를 결정할 수 있다(단계 S490).In addition, the important keyword derivation device 130 may integrate the enterprise perspective embedding space and the customer perspective embedding space through the embedding space integration unit 350 to create a customer perspective integrated embedding space (step S450). The important keyword derivation device 130 selects the surrounding words in the corporate perspective embedding space and the customer perspective integrated embedding space based on each keyword in the corporate perspective keyword list through the surrounding word list generator 370 to create company- and customer-oriented keywords. Lists of words surrounding the keyword can be independently generated (step S470). The important keyword derivation device 130 may determine important keywords from the customer's perspective by comparing word lists surrounding the company- and customer-oriented keywords based on each keyword through the customer-oriented keyword recommendation unit 390 (step S490).

도 5는 본 발명에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 과정을 설명하는 도면이다.Figure 5 is a diagram illustrating the process of deriving important keywords from a customer perspective based on deep learning according to the present invention.

도 5를 참조하면, 본 발명에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 방법은 상품 군에 따라 수집되어 구축된 기업별 및 고객별 데이터셋을 기반으로 수행될 수 있다. 구체적으로, 중요 키워드 도출 방법은 1)기업 상품 리뷰 Word2Vec 학습 단계, 2)기업 상품 정보의 Word2Vec 학습 단계, 3)KeyBERT기반 키워드 추출 단계, 4)AutoEncoder기반 임베딩 얼라인먼트 단계, 5) 기업 관점의 키워드 리스트의 주변 단어를 고객 관점의 통합 임베딩 공간에서 추출 단계, 6) 해당 리스트의 주변 단어를 기업 관점의 상품 정보 임베딩 공간에서 추출 단계 및 7) 각각의 키워드 주변 단어 리스트를 비교하여 고객 중심 키워드 추천을 완성하는 단계 순으로 수행될 수 있다.Referring to FIG. 5, the deep learning-based method of deriving important keywords from a customer perspective according to the present invention can be performed based on company- and customer-specific data sets collected and constructed according to product groups. Specifically, the important keyword derivation method is 1) corporate product review Word2Vec learning stage, 2) corporate product information Word2Vec learning stage, 3) KeyBERT-based keyword extraction stage, 4) AutoEncoder-based embedding alignment stage, and 5) keyword list from the corporate perspective. 6) extracting surrounding words from the integrated embedding space from the customer's perspective, 6) extracting surrounding words from the list from the product information embedding space from the company's perspective, and 7) completing customer-centered keyword recommendation by comparing word lists surrounding each keyword. It can be performed in the order of steps.

이를 통해, 본 발명에 따른 딥러닝 기반 고객 관점 중요 키워드 도출 방법은 기존의 고객 키워드 분석에서 발견하지 못한 고객 키워드 도출이 가능하고 도출된 키워드의 중요도 순위 보정에 활용할 수 있다. 또한, 관점 중요 키워드 도출 방법은 기업과 고객 도메인이 가진 맥락을 유지하면서도 기업과 고객 도메인을 연결할 수 있는 방식을 적용함으로써 각 도메인이 가질 수 있는 어휘의 관계를 보존하면서도 도메인을 아우를 수 있는 어휘 확장이 가능할 수 있다.Through this, the deep learning-based customer perspective important keyword derivation method according to the present invention can derive customer keywords that were not found in existing customer keyword analysis and can be used to correct the importance ranking of the derived keywords. In addition, the method of deriving perspective important keywords applies a method that can connect the company and customer domains while maintaining the context of the company and customer domains, thereby preserving the lexical relationship that each domain may have and expanding the vocabulary to encompass the domains. This may be possible.

도 6은 본 발명에 따른 키버트 기반의 키워드 도출 과정의 일 실시예를 설명하는 도면이다.Figure 6 is a diagram illustrating an embodiment of the keybert-based keyword derivation process according to the present invention.

도 6을 참조하면, 키버트 기반의 키워드 도출 과정은 KeyBERT를 통한 전체 단어 중 선별 키워드를 확정하는 단계에 해당할 수 있다. 즉, 해당 과정에서는 KeyBERT를 통해 추출한 스코어를 기준으로 Top-N 개를 기업 관점의 키워드로 지정하는 동작이 수행될 수 있다. 해당 과정을 통해 선별된 키워드들은 최종 키워드 주변 단어 도출을 위한 리스트 목록으로 사용될 수 있다.Referring to Figure 6, the keybert-based keyword derivation process may correspond to the step of determining selected keywords among all words through KeyBERT. In other words, in this process, an operation can be performed to designate the Top-N keywords as keywords from the company's perspective based on the scores extracted through KeyBERT. Keywords selected through this process can be used as a list of words to derive words around the final keyword.

도 6에서, 기업 관점 임베딩 공간에서 keyBERT를 이용하여 각 키워드들의 가중치를 산출할 수 있다. 가중치 값을 기준으로 상위 3개의 키워드를 선별한 결과 배터리, 경량, 디스플레이 순으로 키워드들이 결정될 수 있으며, 해당 키워드들은 기업 관점 키워드에 해당할 수 있다. 만약 고객 관점 임베딩 공간에서 동일한 과정을 통해 키워드를 선별하면 경량, 배터리, 배송 순으로 결정될 수 있으며, 해당 키워드들은 고객 관점 키워드에 해당할 수 있다.In Figure 6, the weight of each keyword can be calculated using keyBERT in the enterprise perspective embedding space. As a result of selecting the top three keywords based on the weight value, keywords can be determined in the order of battery, light weight, and display, and these keywords may correspond to keywords from a corporate perspective. If keywords are selected through the same process in the customer perspective embedding space, the order of light weight, battery, and delivery may be determined, and the corresponding keywords may correspond to customer perspective keywords.

도 7 내지 9는 본 발명에 따른 오토인코더 기반의 임베딩 얼라인먼트 과정의 일 실시예를 설명하는 도면이다.7 to 9 are diagrams illustrating an embodiment of an autoencoder-based embedding alignment process according to the present invention.

도 7 내지 9를 참조하면, 본 발명에 따른 오토인코더 기반의 임베딩 얼라인먼트 과정은 오토인코더 모델에 대한 학습 단계(도 7)와 오토인코더 모델을 통한 추론 단계(도 8)로 구분될 수 있다. 도 7에서, 오토인코더 모델에 대한 학습 단계는 기업 관점과 고객 관점의 키워드들 중에서 공통되는 키워드들을 대상으로 수행될 수 있다. 다만, 도 7의 빗금친 영역 내의 키워드들은 기업 관점과 고객 관점의 공통된 키워드들 중에서 기업 관점에서 중요하다고 판단되어 선별된 키워드(예를 들어, 기업 관점 키워드 리스트에 포함된 키워드)에 해당하기 때문에 해당 키워드를 제외한 나머지 영역 내의 공통된 키워드들 만을 사용하여 학습이 진행될 수 있다.Referring to FIGS. 7 to 9, the autoencoder-based embedding alignment process according to the present invention can be divided into a learning step for the autoencoder model (FIG. 7) and an inference step through the autoencoder model (FIG. 8). In Figure 7, the learning step for the autoencoder model can be performed on common keywords among keywords from the company's perspective and the customer's perspective. However, the keywords in the shaded area in Figure 7 correspond to keywords that are judged to be important from the company's perspective and are selected among keywords common to the company's perspective and the customer's perspective (for example, keywords included in the company's perspective keyword list). Learning can be conducted using only common keywords in the remaining areas excluding keywords.

도 8에서, 오토인코더 모델을 통한 추론 단계는 학습 단계에서 제외한 영역의 키워드들과 기업 관점 키워드에만 존재하는 단어들을 대상으로 추론 과정이 수행될 수 있다. 즉, 이전 학습 단계에서 사전 학습된 비대칭 오토인코더를 얼라인먼트 모델로 사용하여, 추론 대상 단어들에 대한 임베딩 값을 추론하는 동작이 수행될 수 있다. 오토인코더로 추론된 기업 관점 키워드들의 임베딩 값은 고객 관점 임베딩 공간 상의 임베딩 값을 의미하므로 고객 관점 임베딩 공간에 매핑될 수 있다.In Figure 8, the inference step using the autoencoder model may be performed on keywords in areas excluded from the learning step and words that exist only in corporate perspective keywords. That is, an operation of inferring embedding values for inference target words can be performed by using the asymmetric autoencoder pre-trained in the previous learning step as an alignment model. The embedding values of the corporate perspective keywords inferred by the autoencoder refer to the embedding values in the customer perspective embedding space, so they can be mapped to the customer perspective embedding space.

도 9를 참조하면, 기업 관점 키워드들 중에서 고객 관점 키워드에 존재하지 않는 단어들(예를 들어, 충전, 배터리, 대용량 등)은 추론을 통해 고객 관점 임베딩 공간으로 매핑되어 통합될 수 있고, 기업 관점 키워드들 중에서 고객 관점 키워드에 존재하는 단어들(예를 들어, 배송, 화면)은 추론을 통해 도출된 벡터 값으로 대체될 수 있으며, 이를 통해 통합된 고객 관점의 키워드 공간(즉, 고객 관점 통합 임베딩 공간)이 도출될 수 있다.Referring to Figure 9, among the corporate perspective keywords, words that do not exist in the customer perspective keywords (e.g., charging, battery, large capacity, etc.) can be mapped and integrated into the customer perspective embedding space through inference, and the corporate perspective Among the keywords, words that exist in customer perspective keywords (e.g., delivery, screen) can be replaced with vector values derived through inference, which can be used to create the integrated customer perspective keyword space (i.e., customer perspective integrated embedding). space) can be derived.

도 10은 본 발명에 따른 키워드 주변 단어들의 비교 과정의 일 실시예를 설명하는 도면이다.Figure 10 is a diagram illustrating an embodiment of a comparison process of words surrounding a keyword according to the present invention.

도 10을 참조하면, 키워드 주변 단어 리스트는 기업 임베딩 공간에서 선정된 주변 단어 또는 고객 통합 임베딩 공간에서 선정된 주변 단어들로 구성될 수 있으며, 각각 기업 중심 키워드 주변 단어 리스트와 고객 중심 키워드 주변 단어 리스트에 대응될 수 있다.Referring to Figure 10, the keyword surrounding word list may be composed of surrounding words selected from the enterprise embedding space or surrounding words selected from the customer integrated embedding space, and are respectively a company-centered keyword surrounding word list and a customer-centered keyword surrounding word list. can correspond to .

한편, 중요 키워드 도출 장치(130)는 키워드 주변 단어 리스트를 기반으로 기업 중요 키워드(1010)와 기업 관점 키워드(1050) 및 고객 관점 키워드(1030) 간의 연결 관계를 키워드 주변 단어 네트워크로 표현할 수 있다. 즉, 키워드 주변 단어 네트워크는 기업 중요 키워드(1010)를 중심으로 기업 및 고객 중심 키워드 주변 단어 리스트의 단어들을 상호 연결하여 그래프 구조로 표현될 수 있다.Meanwhile, the important keyword derivation device 130 may express the connection relationship between the important corporate keyword 1010, the corporate viewpoint keyword 1050, and the customer viewpoint keyword 1030 as a network of words surrounding the keyword, based on the list of words surrounding the keyword. In other words, the keyword-surrounding word network can be expressed in a graph structure by interconnecting words in the word list surrounding corporate- and customer-oriented keywords centered on the corporate-important keyword (1010).

특히, 도 10에 도시된 바와 같이, 중요 키워드 도출 장치(130)는 키워드 주변 단어 네트워크를 시각화하여 제공할 수 있으며, 기업 중요 키워드(1010), 기업 관점 키워드(1050) 및 고객 관점 키워드(1030) 각각은 시각적으로 구분되어 표시될 수 있다. 또한, 동일한 기업 중요 키워드(1010)에 대해 기업 및 고객 관점의 공통 키워드의 경우 다른 키워드들과 구분되도록 표시될 수 있다. 예를 들어, 도 10에서, 기업 중요 키워드인 '디스플레이'에 대해 '모니터'는 기업 및 고객 관점의 공통 키워드에 해당할 수 있다.In particular, as shown in FIG. 10, the important keyword derivation device 130 can visualize and provide a word network around the keyword, including corporate important keywords (1010), corporate perspective keywords (1050), and customer perspective keywords (1030). Each can be displayed visually distinctly. Additionally, for the same corporate important keyword 1010, common keywords from the corporate and customer perspectives may be displayed to be distinguished from other keywords. For example, in Figure 10, for 'display', which is an important corporate keyword, 'monitor' may correspond to a common keyword from the corporate and customer perspectives.

본 발명에 따른 중요 키워드 도출 장치(130)는 서로 다른 키워드 주변 단어 리스트에서 키워드는 동일하지만 주변 단어가 크게 바뀐 단어들을 식별할 수 있다. 이를 통해, 중요 키워드 도출 장치(130)는 주변 단어 목록이 바뀐 키워드를 고객 중심의 중요 키워드로 추천할 수 있으며, 더 나아가 주변 단어 자체를 키워드로 선정해 더 세부적인 결과 해석을 도출할 수도 있다.The important keyword derivation device 130 according to the present invention can identify words in which the keyword is the same but the surrounding words are significantly changed from a list of words surrounding different keywords. Through this, the important keyword derivation device 130 can recommend keywords whose list of surrounding words has changed as customer-oriented important keywords, and can further select the surrounding words themselves as keywords to derive a more detailed interpretation of the results.

예를 들어, 기업 관점과 고객 관점의 키워드 주변 단어 리스트로부터 도 10의 키워드 주변 단어 네트워크가 도출될 수 있다. 키워드 주변 단어 네트워크는 전체적인 관점에서 구성 단어들을 손쉽게 파악할 수 있는 이점을 제공할 수 있다.For example, the keyword-surrounding word network of FIG. 10 can be derived from the keyword-surrounding word list from the company's perspective and the customer's perspective. A word network surrounding a keyword can provide the advantage of easily identifying constituent words from an overall perspective.

또한, 도 10은 중요 기업 단어인 '배터리', '경량', '디스플레이'에 대해서 기업과 고객 관점에서의 주변 단어를 연결한 예시에 해당할 수 있다. 이때, 각 관점의 주변 단어는 코사인 유사도가 높은 순으로 상위 2개 단어가 추출될 수 있다.Additionally, Figure 10 may correspond to an example of connecting surrounding words from the company and customer perspectives to the important corporate words 'battery', 'lightweight', and 'display'. At this time, the top two words surrounding each viewpoint may be extracted in order of high cosine similarity.

구축된 네트워크를 살펴보면 동일한 기업 중요 키워드라도 관점 별로 다른 단어에 연결되어 있음을 확인할 수 있다. 먼저, 단어 '배터리'에 대해서는 고객 중심 키워드 주변 단어 결과로 '대용량', '충전'이 연결될 수 있고, 기업 중심 키워드 주변 단어 결과로 '고출력', '대용량'이 연결될 수 있다. 또한, 단어 '경량'에 대해서는 고객 중심 키워드 주변 단어 결과로 '가벼움', '무게'가 연결될 수 있고, 기업 중심 키워드 주변 단어 결과로 '고성능', '고출력'이 연결될 수 있다. 이때, 단어 '고출력'은 각 관점에서 다른 기업 중요 키워드로부터 도출되었지만 서로 연결되는 키워드에 해당할 수 있다.If you look at the built network, you can see that even the same important keywords for the company are connected to different words from different perspectives. First, for the word 'battery', 'large capacity' and 'charging' can be linked as word results around customer-centered keywords, and 'high output' and 'large capacity' can be linked as word results around company-centered keywords. Additionally, for the word 'lightweight', 'light' and 'weight' can be linked as word results around customer-centered keywords, and 'high performance' and 'high output' can be linked as word results around company-centered keywords. At this time, the word 'high output' is derived from important keywords for different companies from each perspective, but may correspond to keywords that are connected to each other.

마지막으로, 단어 '디스플레이'에 대해서는 고객 중심 키워드 주변 단어 결과로 '화면', '모니터'가 연결될 수 있고, 기업 중심 키워드 주변 단어 결과로 '액정', '모니터'가 연결될 수 있다. 이때, 단어 '모니터'는 동일한 기업 중요 키워드를 기준으로 각 관점에서 공통으로 도출된 단어에 해당할 수 있으며, 이 경우 중요 키워드 도출 장치(130)에 의해 시각화되는 과정에서 다른 관점 키워드들과 구분되도록 표시될 수 있다.Lastly, for the word 'display', 'screen' and 'monitor' can be linked as results of words around customer-centered keywords, and 'liquid crystal' and 'monitor' can be linked as results of words around company-centered keywords. At this time, the word 'monitor' may correspond to a word commonly derived from each perspective based on the same important keyword for the company, and in this case, it is distinguished from keywords from other perspectives in the process of visualization by the important keyword derivation device 130. can be displayed.

결과적으로, 중요 키워드 도출 장치(130)는 기업 중요 키워드와 연결된 고객 관점의 단어로부터 고객 추천 키워드를 선택할 수 있다. 이를 기반으로, 중요 키워드 도출 장치(130)는 기업과 고객 관점에서의 키워드 중에서 겹치지 않은 고객 관점에서의 단어인 '충전', '대용량', '가벼움', '무게', '화면'을 선정하여 고객 중심의 추천 키워드로서 제공할 수 있다.As a result, the important keyword deriving device 130 can select customer recommended keywords from words from the customer's perspective linked to the company's important keywords. Based on this, the important keyword derivation device 130 selects words from the customer's perspective that do not overlap, such as 'charge', 'large capacity', 'light', 'weight', and 'screen', among keywords from the company and customer perspectives. It can be provided as a customer-centered recommended keyword.

한편, 중요 키워드 도출 장치(130)는 도출된 고객 중심 키워드에 다양한 텍스트 마이닝 기법에 적용하여 추가 분석을 수행할 수도 있다. 예를 들어, 중요 키워드 도출 장치(130)는 도출된 고객 중심 키워드와 유사한 키워드를 선별하여 고객 중심 키워드를 확장할 수 있다. 또한, 중요 키워드 도출 장치(130)는 도출된 고객 중심 키워드를 기반으로 동시에 출현한 키워드를 추출하여 고객의 중심 주제를 선정할 수 있다.Meanwhile, the important keyword derivation device 130 may perform additional analysis by applying various text mining techniques to the derived customer-oriented keywords. For example, the important keyword derivation device 130 may select keywords similar to the derived customer-centered keywords to expand the customer-centered keywords. Additionally, the important keyword derivation device 130 may extract keywords that appear at the same time based on the derived customer-centered keywords and select a customer-centered topic.

이에 더하여, 기업에서 본 발명에 따른 중요 키워드 도출 방법을 활용한다면 고객 가치 파악을 위한 고객 심층 분석과 기업이 놓치고 있던 고객의 이상 신호 분석에 적용할 수 있고, 더 나아가 고객 중심 키워드로부터 고객 감성이 포함된 단어들을 추출하여 고객 친화적인 마케팅 전략 수립에 이용할 수 있다.In addition, if a company utilizes the method for deriving important keywords according to the present invention, it can be applied to in-depth analysis of customers to identify customer value and analysis of abnormal signals from customers that the company has missed. Furthermore, customer emotions can be included from customer-centered keywords. The words can be extracted and used to establish a customer-friendly marketing strategy.

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although the present invention has been described above with reference to preferred embodiments, those skilled in the art may make various modifications and changes to the present invention without departing from the spirit and scope of the present invention as set forth in the claims below. You will understand that you can do it.

100: 중요 키워드 도출 시스템
110: 사용자 단말 130: 중요 키워드 도출 장치
150: 데이터베이스
210: 프로세서 230: 메모리
250: 사용자 입출력부 270: 네트워크 입출력부
310: 임베딩 학습부 330: 키워드 리스트 생성부
350: 임베딩 공간 통합부 370: 주변 단어 리스트 생성부
390: 고객 중심 키워드 추천부
100: Important keyword derivation system
110: User terminal 130: Important keyword derivation device
150: database
210: Processor 230: Memory
250: user input/output unit 270: network input/output unit
310: Embedding learning unit 330: Keyword list creation unit
350: Embedding space integration unit 370: Nearby word list generation unit
390: Customer-centered keyword recommendation unit

Claims (14)

기업 관점 정보와 고객 관점 정보를 포함하는 텍스트 데이터셋을 기반으로 임베딩(embedding) 학습을 통해 관점별 키워드에 관한 임베딩 공간을 독립적으로 생성하는 임베딩 학습부;
기업 관점 임베딩 공간 상에서 복수의 키워드들을 선별하여 기업 관점 키워드 리스트를 생성하는 키워드 리스트 생성부;
상기 기업 관점 임베딩 공간과 고객 관점 임베딩 공간을 통합하여 고객 관점 통합 임베딩 공간을 생성하는 임베딩 공간 통합부;
상기 기업 관점 키워드 리스트의 각 키워드를 기준으로 상기 기업 관점 임베딩 공간 및 상기 고객 관점 통합 임베딩 공간 상에서 주변 단어들을 각각 선별하여 기업 및 고객 중심의 키워드 주변 단어 리스트들을 독립적으로 생성하는 주변 단어 리스트 생성부; 및
상기 각 키워드를 기준으로 상기 기업 및 고객 중심의 키워드 주변 단어 리스트들을 상호 비교하여 고객 관점 중요 키워드를 결정하는 고객 중심 키워드 추천부;를 포함하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치.
An embedding learning unit that independently creates an embedding space for keywords for each perspective through embedding learning based on a text dataset containing corporate perspective information and customer perspective information;
a keyword list generator that selects a plurality of keywords in the enterprise perspective embedding space and generates a enterprise perspective keyword list;
an embedding space integration unit that integrates the enterprise-view embedding space and the customer-view embedding space to create a customer-view integrated embedding space;
a surrounding word list generator that independently generates company- and customer-oriented keyword surrounding word lists by selecting neighboring words in the corporate viewpoint embedding space and the customer viewpoint integrated embedding space based on each keyword in the corporate viewpoint keyword list; and
A customer-oriented keyword recommendation unit that determines customer-oriented important keywords by comparing word lists surrounding the company- and customer-oriented keywords based on each keyword. A deep learning-based customer-oriented keyword derivation device including a customer-oriented keyword recommendation unit.
제1항에 있어서, 상기 임베딩 학습부는
상기 기업 관점 정보에 관한 제1 텍스트 데이터셋 및 상기 고객 관점 정보에 관한 제2 텍스트 데이터셋 각각에 대해 Word2Vec을 포함하는 임베딩 학습 모델을 적용하여 상기 기업 관점 임베딩 공간 및 상기 고객 관점 임베딩 공간을 각각 생성하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치.
The method of claim 1, wherein the embedding learning unit
An embedding learning model including Word2Vec is applied to each of the first text dataset regarding the enterprise perspective information and the second text dataset regarding the customer perspective information to generate the enterprise perspective embedding space and the customer perspective embedding space, respectively. A deep learning-based customer perspective key keyword derivation device characterized by:
제1항에 있어서, 상기 키워드 리스트 생성부는
상기 기업 관점 임베딩 공간 상에 분포하는 키워드들 중에서 KeyBERT를 포함하는 키워드 추출 모델을 적용하여 출력된 스코어(score)를 기준으로 상위 N개(상기 N은 자연수)의 키워드들을 결정하여 상기 기업 관점 키워드 리스트를 생성하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치.
The method of claim 1, wherein the keyword list generator
Among the keywords distributed in the enterprise perspective embedding space, the top N keywords (where N is a natural number) are determined based on the score output by applying a keyword extraction model including KeyBERT to create the enterprise perspective keyword list. A deep learning-based customer perspective important keyword derivation device characterized by generating.
제1항에 있어서, 상기 임베딩 공간 통합부는
상기 기업 관점 임베딩 공간을 입력으로 사용하고 상기 고객 관점 임베딩 공간을 출력으로 사용하는 오토인코더(AutoEncoder) 기반의 임베딩 얼라인먼트(embedding alignment)를 수행하여 상기 고객 관점 통합 임베딩 공간을 생성하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치.
The method of claim 1, wherein the embedding space integration unit
Deep characterized in that the customer-view integrated embedding space is generated by performing AutoEncoder-based embedding alignment using the enterprise-view embedding space as input and the customer-view embedding space as output. Learning-based customer perspective important keyword derivation device.
제4항에 있어서, 상기 임베딩 공간 통합부는
상기 기업 관점 임베딩 공간 및 상기 고객 관점 임베딩 공간에 공통으로 분포하는 공통 키워드들 중에서 상기 기업 관점 키워드 리스트에 포함되지 않는 키워드들을 대상으로 오토인코더 모델에 대한 학습을 수행하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치.
The method of claim 4, wherein the embedding space integration unit
Deep learning-based customer, characterized in that an autoencoder model is trained on keywords that are not included in the enterprise perspective keyword list among common keywords commonly distributed in the enterprise perspective embedding space and the customer perspective embedding space. Perspective important keyword derivation device.
제5항에 있어서, 상기 임베딩 공간 통합부는
상기 공통 키워드들 중에서 상기 기업 관점 키워드 리스트에 포함된 키워드들과 상기 기업 관점 임베딩 공간 상에만 분포하는 키워드들을 대상으로 상기 오토인코더 모델을 적용하여 상기 고객 관점 임베딩 공간 상의 임베딩 값으로 매핑하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치.
The method of claim 5, wherein the embedding space integration unit
Among the common keywords, the autoencoder model is applied to keywords included in the enterprise perspective keyword list and keywords distributed only in the enterprise perspective embedding space and mapped to embedding values in the customer perspective embedding space. Deep learning-based customer perspective key keyword derivation device.
제6항에 있어서, 상기 임베딩 공간 통합부는
상기 공통 키워드들 중에서 상기 기업 관점 키워드 리스트에 포함된 키워드들에 대해서는 상기 고객 관점 임베딩 공간 상의 벡터값을 상기 임베딩 값으로 대체하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치.
The method of claim 6, wherein the embedding space integration unit
A deep learning-based customer-perspective important keyword derivation device, characterized in that for keywords included in the corporate-perspective keyword list among the common keywords, vector values in the customer-perspective embedding space are replaced with the embedding values.
제1항에 있어서, 상기 주변 단어 리스트 생성부는
상기 각 키워드를 중심으로 상기 기업 및 고객 중심의 키워드 주변 단어 리스트들의 개별 주변 단어들을 상기 각 키워드에 연결하여 키워드 주변 단어 네트워크를 생성하고,
상기 키워드 주변 단어 네트워크의 노드는 상기 각 키워드 및 상기 개별 주변 단어들 각각에 대응되고, 노드 간 에지는 상기 각 키워드와 상기 개별 주변 단어들 간의 연결 관계에 대응되는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치.
The method of claim 1, wherein the surrounding word list generator
Centering on each keyword, individual surrounding words from the company- and customer-oriented keyword surrounding word lists are connected to each keyword to create a network of keywords surrounding the keyword,
A deep learning-based customer perspective, characterized in that the nodes of the network of words surrounding the keyword correspond to each of the keywords and the individual surrounding words, and the edges between nodes correspond to the connection relationships between each keyword and the individual surrounding words. Device for deriving important keywords.
제1항에 있어서, 상기 고객 중심 키워드 추천부는
상기 각 키워드를 기준으로 상기 기업 및 고객 중심의 키워드 주변 단어 리스트들에서 서로 중복되지 않는 주변 단어들을 상기 고객 관점 중요 키워드로 결정하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치.
The method of claim 1, wherein the customer-centered keyword recommendation unit
A deep learning-based customer perspective important keyword derivation device characterized in that, based on each keyword, surrounding words that do not overlap with each other in the company- and customer-oriented keyword surrounding word lists are determined as the customer perspective important keywords.
제8항에 있어서, 상기 고객 중심 키워드 추천부는
상기 키워드 주변 단어 네트워크를 시각화하여 표시하고 상기 키워드 주변 단어 네트워크 상에서 상기 고객 관점 중요 키워드를 강조하여 표시하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 장치.
The method of claim 8, wherein the customer-centered keyword recommendation unit
A deep learning-based customer perspective important keyword derivation device, characterized in that it visualizes and displays a network of words around the keyword and highlights and displays the important keywords from the customer perspective on the word network around the keyword.
임베딩 학습부를 통해 기업 관점 정보와 고객 관점 정보를 포함하는 텍스트 데이터셋을 기반으로 임베딩(embedding) 학습을 통해 관점별 키워드에 관한 임베딩 공간을 독립적으로 생성하는 단계;
키워드 리스트 생성부를 통해 기업 관점 임베딩 공간 상에서 복수의 키워드들을 선별하여 기업 관점 키워드 리스트를 생성하는 단계;
임베딩 공간 통합부를 통해 상기 기업 관점 임베딩 공간과 고객 관점 임베딩 공간을 통합하여 고객 관점 통합 임베딩 공간을 생성하는 단계;
주변 단어 리스트 생성부를 통해 상기 기업 관점 키워드 리스트의 각 키워드를 기준으로 상기 기업 관점 임베딩 공간 및 상기 고객 관점 통합 임베딩 공간 상에서 주변 단어들을 각각 선별하여 기업 및 고객 중심의 키워드 주변 단어 리스트들을 독립적으로 생성하는 단계; 및
고객 중심 키워드 추천부를 통해 상기 각 키워드를 기준으로 상기 기업 및 고객 중심의 키워드 주변 단어 리스트들을 상호 비교하여 고객 관점 중요 키워드를 결정하는 단계;를 포함하는 딥러닝 기반 고객 관점 중요 키워드 도출 방법.
Independently generating an embedding space for keywords for each perspective through embedding learning based on a text dataset including company perspective information and customer perspective information through an embedding learning unit;
Generating a corporate viewpoint keyword list by selecting a plurality of keywords in the corporate viewpoint embedding space through a keyword list generator;
Integrating the company perspective embedding space and the customer perspective embedding space through an embedding space integration unit to create a customer perspective integrated embedding space;
Through the surrounding word list generation unit, surrounding words are selected from the corporate perspective embedding space and the customer perspective integrated embedding space based on each keyword in the business perspective keyword list, respectively, to independently generate company and customer-oriented keyword surrounding word lists. step; and
A method of deriving important keywords from a customer perspective based on deep learning, including a step of determining important keywords from a customer perspective by comparing word lists around the company- and customer-oriented keywords based on each keyword through a customer-oriented keyword recommendation unit.
제11항에 있어서, 상기 고객 관점 통합 임베딩 공간을 생성하는 단계는
상기 기업 관점 임베딩 공간을 입력으로 사용하고 상기 고객 관점 임베딩 공간을 출력으로 사용하는 오토인코더(AutoEncoder) 기반의 임베딩 얼라인먼트(embedding alignment)를 수행하여 상기 고객 관점 통합 임베딩 공간을 생성하는 단계를 포함하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 방법.
The method of claim 11, wherein the step of generating the customer perspective integrated embedding space is
Comprising the step of generating the customer perspective integrated embedding space by performing AutoEncoder-based embedding alignment using the enterprise perspective embedding space as an input and the customer perspective embedding space as an output. A deep learning-based method for deriving important keywords from a customer perspective.
제12항에 있어서, 상기 고객 관점 통합 임베딩 공간을 생성하는 단계는
상기 기업 관점 임베딩 공간 및 상기 고객 관점 임베딩 공간에 공통으로 분포하는 공통 키워드들 중에서 상기 기업 관점 키워드 리스트에 포함되지 않는 키워드들을 대상으로 오토인코더 모델에 대한 학습을 수행하는 단계를 포함하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 방법.
The method of claim 12, wherein the step of generating the customer perspective integrated embedding space is
Characterized in that it includes the step of performing learning on an autoencoder model for keywords that are not included in the enterprise perspective keyword list among common keywords commonly distributed in the enterprise perspective embedding space and the customer perspective embedding space. Deep learning-based method of deriving important keywords from customer perspective.
제13항에 있어서, 상기 고객 관점 통합 임베딩 공간을 생성하는 단계는
상기 공통 키워드들 중에서 상기 기업 관점 키워드 리스트에 포함된 키워드들과 상기 기업 관점 임베딩 공간 상에만 분포하는 키워드들을 대상으로 상기 오토인코더 모델을 적용하여 상기 고객 관점 임베딩 공간 상의 임베딩 값으로 매핑하는 단계를 포함하는 것을 특징으로 하는 딥러닝 기반 고객 관점 중요 키워드 도출 방법.
The method of claim 13, wherein the step of generating the customer perspective integrated embedding space is
Among the common keywords, applying the autoencoder model to keywords included in the enterprise perspective keyword list and keywords distributed only in the enterprise perspective embedding space includes mapping them to embedding values in the customer perspective embedding space. A deep learning-based method of deriving important keywords from a customer perspective.
KR1020220066162A 2022-05-30 2022-05-30 Deep learning-based customer perspective key keyword derivation device and method KR102656015B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220066162A KR102656015B1 (en) 2022-05-30 2022-05-30 Deep learning-based customer perspective key keyword derivation device and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220066162A KR102656015B1 (en) 2022-05-30 2022-05-30 Deep learning-based customer perspective key keyword derivation device and method

Publications (2)

Publication Number Publication Date
KR20230166332A KR20230166332A (en) 2023-12-07
KR102656015B1 true KR102656015B1 (en) 2024-04-09

Family

ID=89163445

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220066162A KR102656015B1 (en) 2022-05-30 2022-05-30 Deep learning-based customer perspective key keyword derivation device and method

Country Status (1)

Country Link
KR (1) KR102656015B1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001117935A (en) 1999-10-19 2001-04-27 Fujitsu Ltd Device and method for accessing text information and recording medium
JP2010256960A (en) 2009-04-21 2010-11-11 Nec Corp System, method and program for determining degree of similarity
CN113590763A (en) 2021-09-27 2021-11-02 湖南大学 Similar text retrieval method and device based on deep learning and storage medium
KR102334236B1 (en) 2021-08-31 2021-12-02 (주)네오플로우 Method and application of meaningful keyword extraction from speech-converted text data

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140081721A (en) 2012-12-21 2014-07-01 정철우 System and method for deducting imporant keyword using textmining, and a medium having computer readable program for executing the method
KR102075505B1 (en) * 2018-03-29 2020-02-10 네이버 주식회사 Method and system for extracting topic keyword

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001117935A (en) 1999-10-19 2001-04-27 Fujitsu Ltd Device and method for accessing text information and recording medium
JP2010256960A (en) 2009-04-21 2010-11-11 Nec Corp System, method and program for determining degree of similarity
KR102334236B1 (en) 2021-08-31 2021-12-02 (주)네오플로우 Method and application of meaningful keyword extraction from speech-converted text data
CN113590763A (en) 2021-09-27 2021-11-02 湖南大学 Similar text retrieval method and device based on deep learning and storage medium

Also Published As

Publication number Publication date
KR20230166332A (en) 2023-12-07

Similar Documents

Publication Publication Date Title
Lecue On the role of knowledge graphs in explainable AI
US7792786B2 (en) Methodologies and analytics tools for locating experts with specific sets of expertise
CN104115145B (en) Generation represents to meet the visualization of the display group of the label of the content instance in the object of search criteria
US20160171376A1 (en) Inferred Facts Discovered through Knowledge Graph Derived Contextual Overlays
US20180131803A1 (en) Mobile data insight platforms for data analysis
US20170185910A1 (en) Steering graph mining algorithms applied to complex networks
US10102246B2 (en) Natural language consumer segmentation
US10599777B2 (en) Natural language processing with dynamic pipelines
US10984333B2 (en) Application usage signal inference and repository
EP3539019A1 (en) Dynamic insight objects for user application data
US8458187B2 (en) Methods and systems for visualizing topic location in a document redundancy graph
Peng et al. Unsupervised cross-domain named entity recognition using entity-aware adversarial training
US8332395B2 (en) Graphically searching and displaying data
Sharma et al. A Comparative Analysis on Various Business Intelligence (BI), Data Science and Data Analytics Tools
CN111295652B (en) Automatically connecting external data to business analysis process
US11062330B2 (en) Cognitively identifying a propensity for obtaining prospective entities
US20190171756A1 (en) Cognitive decision system for security and log analysis using associative memory mapping in graph database
US11532174B2 (en) Product baseline information extraction
KR102656015B1 (en) Deep learning-based customer perspective key keyword derivation device and method
US10831347B2 (en) Cognitive computing to identify key events in a set of data
US9747375B2 (en) Influence personal benefit from dynamic user modeling matching with natural language statements in reviews
US9286349B2 (en) Dynamic search system
CN107526830A (en) It is easy to the quick method and apparatus for searching information
US20210174014A1 (en) Visualization of the Entities and Relations in a Document
US9940395B2 (en) Influence business benefit from user reviews and cognitive dissonance

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant