KR20230114440A - Method, system, and computer program for personalized recommendation based on topic of interest - Google Patents

Method, system, and computer program for personalized recommendation based on topic of interest Download PDF

Info

Publication number
KR20230114440A
KR20230114440A KR1020220010593A KR20220010593A KR20230114440A KR 20230114440 A KR20230114440 A KR 20230114440A KR 1020220010593 A KR1020220010593 A KR 1020220010593A KR 20220010593 A KR20220010593 A KR 20220010593A KR 20230114440 A KR20230114440 A KR 20230114440A
Authority
KR
South Korea
Prior art keywords
keyword
topic
relationship
subject
interest
Prior art date
Application number
KR1020220010593A
Other languages
Korean (ko)
Inventor
김동현
김충기
양민철
황현동
유혜수
장예훈
이정태
Original Assignee
네이버 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네이버 주식회사 filed Critical 네이버 주식회사
Priority to KR1020220010593A priority Critical patent/KR20230114440A/en
Priority to JP2022174072A priority patent/JP2023108590A/en
Publication of KR20230114440A publication Critical patent/KR20230114440A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions

Abstract

관심 주제 기반 개인화 추천을 위한 방법, 시스템, 및 컴퓨터 프로그램이 개시된다. 인터넷 상에서 사용되는 키워드에 대해 언어 모델(language model)을 이용하여 상기 키워드의 주제를 생성하여 상기 키워드와 상기 주제 간의 관계를 구축하고, 상기 키워드와 상기 주제 간의 관계를 이용하여 인터넷 상의 사용자의 활동에 대응되는 적어도 하나의 관심 주제를 선정하고, 상기 관심 주제를 기초로 상기 사용자에 대해 개인화된 추천 정보를 제공할 수 있다.A method, system, and computer program for topic-of-interest-based personalized recommendations are disclosed. For keywords used on the Internet, a subject of the keyword is created using a language model to establish a relationship between the keyword and the subject, and a relationship between the keyword and the subject is used to determine the activity of the user on the Internet. At least one corresponding topic of interest may be selected, and personalized recommendation information for the user may be provided based on the topic of interest.

Description

관심 주제 기반 개인화 추천을 위한 방법, 시스템, 및 컴퓨터 프로그램{METHOD, SYSTEM, AND COMPUTER PROGRAM FOR PERSONALIZED RECOMMENDATION BASED ON TOPIC OF INTEREST}METHOD, SYSTEM, AND COMPUTER PROGRAM FOR PERSONALIZED RECOMMENDATION BASED ON TOPIC OF INTEREST}

아래의 설명은 개인화 추천 기술에 관한 것이다.The description below relates to personalized recommendation technology.

일반적으로 인터넷 상품 추천은 개인의 구매 이력에 기반하여 개인에게 최적화된 상품을 선별하여 추천할 수 있다.In general, Internet product recommendation may select and recommend products optimized for the individual based on the individual's purchase history.

상품 추천을 위해 주로 사용되는 방법으로, 상품을 추천할 대상 사용자와 구매 이력이 유사한 사용자들을 선별하고 유사 사용자들이 구매한 상품 중 추천 대상 사용자가 구매하지 않은 상품을 추천해주는 협업 필터링(Collaborative Filtering)이나, 여러 사용자의 구매 기록을 이용하여 상품 별로 동시 구매 가능성 또는 동시 클릭 가능성이 높은 상품을 추천하는 연관 규칙 마이닝(Association Rule Mining)과 같은 알고리즘 등이 이용될 수 있다.As a method mainly used for product recommendation, Collaborative Filtering, which selects users with similar purchase histories to the target user for product recommendation, and recommends products that the target user did not purchase among products purchased by similar users. , Algorithms such as Association Rule Mining, which recommends products with a high possibility of simultaneous purchase or simultaneous clicks for each product using purchase records of multiple users, may be used.

예컨대, 한국등록특허 제10-0882716호(등록일 2009년 02월 02일)에는 사용자 단말기에 설치된 정보 추천 에이전트에서 인식한 상품의 상품 코드, 상품명 또는 모델명 등을 이용하여 상품에 대한 상품 정보를 자동으로 추천하는 기술이 개시되어 있다.For example, Korean Patent Registration No. 10-0882716 (registered on February 2, 2009) automatically provides product information about a product by using the product code, product name, or model name of the product recognized by the information recommendation agent installed on the user terminal. A recommended technique is disclosed.

언어 모델(language model)을 이용하여 키워드와 주제 간의 의미론적 관계(semantic relation)를 나타내는 새로운 개념의 관심사 데이터를 생성할 수 있다.Interest data of a new concept representing a semantic relation between a keyword and a subject may be generated using a language model.

키워드와 주제의 관계를 이용하여 인터넷 상의 사용자의 행동을 명시적인 단어로 표현 가능한 관심 주제로 요약할 수 있다.Using the relationship between keywords and topics, users' behavior on the Internet can be summarized into topics of interest that can be expressed in explicit words.

사용자의 관심 주제라는 명시적인 이유를 근거로 해당 사용자에게 개인화된 추천을 제공할 수 있다.Personalized recommendations can be provided to the user based on the explicit reason that the subject is of interest to the user.

컴퓨터 시스템에서 실행되는 방법에 있어서, 상기 컴퓨터 시스템은 메모리에 포함된 컴퓨터 판독가능한 명령들을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 상기 방법은, 상기 적어도 하나의 프로세서에 의해, 인터넷 상에서 사용되는 키워드에 대해 언어 모델(language model)을 이용하여 상기 키워드의 주제를 생성하여 상기 키워드와 상기 주제 간의 관계를 구축하는 단계; 및 상기 적어도 하나의 프로세서에 의해, 상기 키워드와 상기 주제 간의 관계를 이용하여 인터넷 상의 사용자의 활동에 대응되는 적어도 하나의 관심 주제를 선정하는 단계; 및 상기 적어도 하나의 프로세서에 의해, 상기 관심 주제를 기초로 상기 사용자에 대해 개인화된 추천 정보를 제공하는 단계를 포함하는 방법을 제공한다.A method executed on a computer system, the computer system comprising at least one processor configured to execute computer readable instructions contained in a memory, the method comprising: a keyword used by the at least one processor on the Internet; constructing a relationship between the keyword and the subject by generating a subject of the keyword using a language model for the subject; and selecting, by the at least one processor, at least one topic of interest corresponding to the activity of the user on the Internet using the relationship between the keyword and the topic. and providing, by the at least one processor, personalized recommendation information for the user based on the subject of interest.

일 측면에 따르면, 상기 키워드와 상기 주제 간의 관계를 구축하는 단계는, 키워드 예시와 해당 키워드의 주제로 이루어진 예시 데이터를 이용하여 타겟 키워드에 대한 프롬프트(prompt)를 구성하는 단계; 및 상기 프롬프트를 상기 언어 모델의 입력으로 하여 상기 예시 데이터의 패턴에 따라 상기 타겟 키워드의 주제를 생성하는 단계를 포함할 수 있다.According to one aspect, the step of establishing a relationship between the keyword and the subject may include constructing a prompt for a target keyword using example data consisting of a keyword example and a subject of the keyword; and generating a subject of the target keyword according to a pattern of the example data by using the prompt as an input of the language model.

다른 측면에 따르면, 상기 키워드와 상기 주제 간의 관계를 구축하는 단계는, 인터넷 상의 정보 검색 또는 정보 분류에 사용되는 키워드에 대해 해당 키워드를 사용하는 사용자의 관심사로 표현하기 위한 주제를 생성하는 단계를 포함할 수 있다.According to another aspect, the step of establishing a relationship between the keyword and the subject includes generating a subject to be expressed as an interest of a user using the keyword for a keyword used for information search or information classification on the Internet. can do.

또 다른 측면에 따르면, 상기 키워드와 상기 주제 간의 관계를 구축하는 단계는, 상기 언어 모델을 통해 생성된 주제들 간의 유사도를 기초로 주제 그룹을 생성하는 단계; 및 상기 주제 그룹을 대상으로 상기 주제 간의 관계에 기반한 임베딩 학습을 통해 상기 키워드에 대해 적어도 하나의 대표 주제를 선정하는 단계를 포함할 수 있다.According to another aspect, the constructing of the relationship between the keyword and the subject may include generating a subject group based on a similarity between the subjects generated through the language model; and selecting at least one representative topic for the keyword through embedding learning based on the relationship between the topics for the topic group.

또 다른 측면에 따르면, 상기 주제 그룹을 생성하는 단계는, 검색 기록에 포함된 복수 개의 검색어에 대해 각 검색어를 주제로 치환한 후 치환된 주제를 연결하여 문장(sentence)으로 표현하고 상기 검색어 각각을 단어(word)로 표현하여 임베딩 학습을 수행함으로써 유사 관계에 있는 주제를 그룹핑하는 단계를 포함할 수 있다.According to another aspect, the generating of the subject group may include substituting each search word with a subject for a plurality of search words included in a search record, connecting the replaced subjects to express a sentence, and expressing each of the search words as a sentence. A step of grouping subjects having a similar relationship by performing embedding learning by expressing them in words may be included.

또 다른 측면에 따르면, 상기 주제 그룹을 생성하는 단계는, 상기 키워드에 대해 상기 언어 모델에서 생성된 후보 주제를 연결하여 문장으로 표현하고 상기 후보 주제 각각을 단어로 표현하여 임베딩 학습을 수행함으로써 유사 관계에 있는 주제를 그룹핑하는 단계를 포함할 수 있다.According to another aspect, the generating of the subject groups may include linking candidate subjects generated by the language model to the keywords and expressing them as sentences, and performing embedding learning by expressing each of the candidate subjects as words, thereby performing similarity relationship. It may include grouping the topics in .

또 다른 측면에 따르면, 상기 주제 그룹을 생성하는 단계는, 상기 키워드와 상기 언어 모델에서 생성된 후보 주제에 대해 행렬 분해(MF, matrix factorization)를 수행함으로써 유사 관계에 있는 주제를 그룹핑하는 단계를 포함할 수 있다.According to another aspect, the generating of the topic groups includes grouping topics having a similar relationship by performing matrix factorization (MF) on the keyword and candidate topics generated from the language model. can do.

또 다른 측면에 따르면, 상기 키워드에 대해 적어도 하나의 대표 주제를 선정하는 단계는, 상기 주제 간의 포함 관계와 동등 관계 중 적어도 하나의 관계를 파악하여 그래프 임베딩(graph embedding)을 수행하는 단계; 및 상기 그래프 임베딩을 이용한 상기 키워드와 상기 주제 간의 확률을 기반으로 상기 대표 주제를 선정하는 단계를 포함할 수 있다.According to another aspect, the selecting of at least one representative subject for the keyword may include performing graph embedding by identifying at least one relationship between an inclusion relationship and an equivalence relationship between the topics; and selecting the representative topic based on a probability between the keyword and the topic using the graph embedding.

또 다른 측면에 따르면, 상기 관심 주제를 선정하는 단계는, 상기 사용자에 의해 입력된 검색어와 상기 사용자가 클릭한 상품의 태그 중 적어도 하나의 활동 키워드와 관계가 설정된 주제를 상기 관심 주제로 선정할 수 있다.According to another aspect, in the step of selecting a topic of interest, a topic having a relationship with at least one activity keyword among a search word input by the user and a tag of a product clicked by the user may be selected as the topic of interest. there is.

또 다른 측면에 따르면, 상기 사용자에 대해 개인화된 추천 정보를 제공하는 단계는, 상기 관심 주제와 관계가 설정된 키워드 중 상기 사용자의 활동과 관련된 적어도 하나의 키워드를 연관 키워드로 추천하는 단계를 포함할 수 있다.According to another aspect, the providing of personalized recommendation information to the user may include recommending at least one keyword related to the activity of the user among keywords having a relationship with the topic of interest as a related keyword. there is.

또 다른 측면에 따르면, 상기 사용자에 대해 개인화된 추천 정보를 제공하는 단계는, 상기 관심 주제와 관계가 설정된 키워드 중 상기 사용자의 활동과 관련된 적어도 하나의 키워드를 연관 키워드로 선정하는 단계; 및 인터넷 상의 아이템 중 상기 연관 키워드와 관련된 아이템을 추천하는 단계를 포함할 수 있다.According to another aspect, the providing of the personalized recommendation information for the user may include selecting at least one keyword related to the activity of the user among keywords having a relationship with the topic of interest as a related keyword; and recommending an item related to the relevant keyword among items on the Internet.

또 다른 측면에 따르면, 상기 연관 키워드와 관련된 아이템을 추천하는 단계는, 상기 사용자의 프로필 정보와 상기 관심 주제 중 적어도 하나를 이용하여 추천 아이템을 선정하는 단계를 포함할 수 있다.According to another aspect, recommending an item related to the relevant keyword may include selecting a recommended item using at least one of profile information of the user and the subject of interest.

상기 방법을 상기 컴퓨터 시스템에 실행시키기 위해 컴퓨터 판독가능한 기록 매체에 저장되는 컴퓨터 프로그램을 제공한다.A computer program stored in a computer readable recording medium is provided to execute the method in the computer system.

컴퓨터 시스템에 있어서, 메모리에 포함된 컴퓨터 판독가능한 명령들을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 인터넷 상에서 사용되는 키워드에 대해 언어 모델을 이용하여 상기 키워드의 주제를 생성하여 상기 키워드와 상기 주제 간의 관계를 구축하고, 상기 키워드와 상기 주제 간의 관계를 이용하여 인터넷 상의 사용자의 활동에 대응되는 적어도 하나의 관심 주제를 선정하고, 상기 관심 주제를 기초로 상기 사용자에 대해 개인화된 추천 정보를 제공하는 것을 특징으로 하는 컴퓨터 시스템을 제공한다.A computer system comprising at least one processor configured to execute computer readable instructions contained in a memory, wherein the at least one processor generates a subject of a keyword using a language model for a keyword used on the Internet. to establish a relationship between the keyword and the subject, select at least one topic of interest corresponding to a user's activity on the Internet using the relationship between the keyword and the subject, and personalize the user based on the topic of interest It provides a computer system characterized by providing recommended information.

본 발명의 실시예들에 따르면, 대규모 언어 모델을 이용하여 키워드와 주제 간의 의미론적 관계를 나타내는 새로운 개념의 관심사 데이터를 생성할 수 있다.According to embodiments of the present invention, interest data of a new concept representing a semantic relationship between a keyword and a subject may be generated using a large-scale language model.

본 발명의 실시예들에 따르면, 키워드와 주제의 관계를 이용하여 인터넷 상의 사용자의 행동을 명시적인 단어로 표현 가능한 관심 주제로 요약할 수 있다.According to embodiments of the present invention, a user's behavior on the Internet can be summarized into a topic of interest that can be expressed in explicit words by using a relationship between a keyword and a topic.

본 발명의 실시예들에 따르면, 사용자의 관심 주제라는 명시적인 이유를 근거로 해당 사용자에게 개인화된 추천을 제공할 수 있다.According to embodiments of the present invention, a personalized recommendation may be provided to a corresponding user based on an explicit reason that the subject is of interest to the user.

도 1은 본 발명의 일실시예에 따른 네트워크 환경의 예를 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 컴퓨터 시스템의 예를 도시한 블록도이다.
도 3은 본 발명의 일실시예에 따른 컴퓨터 시스템의 프로세서가 포함할 수 있는 구성요소의 예를 도시한 도면이다.
도 4는 본 발명의 일실시예에 따른 컴퓨터 시스템이 수행할 수 있는 방법의 일례를 도시한 순서도이다.
도 5는 본 발명의 일실시예에 있어서 프롬프트를 이용한 데이터 생성 과정의 일례를 설명하기 위한 순서도이다.
도 6 내지 도 7은 본 발명의 일실시예에 있어서 데이터 생성 예시를 도시한 것이다.
도 8 내지 도 11은 본 발명의 일실시예에 있어서 주제 선정 과정의 예시를 도시한 것이다.
도 12 내지 도 14는 본 발명의 일실시예에 있어서 개인화 추천 과정의 예시를 도시한 것이다.
1 is a diagram illustrating an example of a network environment according to an embodiment of the present invention.
2 is a block diagram illustrating an example of a computer system according to one embodiment of the present invention.
3 is a diagram showing an example of components that may be included in a processor of a computer system according to an embodiment of the present invention.
4 is a flowchart illustrating an example of a method that a computer system may perform according to an embodiment of the present invention.
5 is a flowchart illustrating an example of a data generation process using a prompt in an embodiment of the present invention.
6 to 7 show examples of data generation in one embodiment of the present invention.
8 to 11 show an example of a subject selection process in one embodiment of the present invention.
12 to 14 show examples of a personalized recommendation process in one embodiment of the present invention.

이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

본 발명의 실시예들은 개인화 추천 기술에 관한 것이다.Embodiments of the present invention relate to personalized recommendation technology.

본 명세서에서 구체적으로 개시되는 것들을 포함하는 실시예들은 인터넷 상의 사용자의 행동을 명시적인 단어(즉, 관심 주제)로 요약할 수 있고 사용자의 관심 주제를 이용하여 인터넷 상의 아이템을 개인화하여 추천할 수 있다.Embodiments, including those specifically disclosed herein, can summarize a user's behavior on the Internet in explicit words (i.e., topics of interest) and use the user's topics of interest to personalize and recommend items on the Internet. .

본 발명의 실시예들에 따른 개인화 추천 시스템은 적어도 하나의 컴퓨터 시스템에 의해 구현될 수 있으며, 본 발명의 실시예들에 따른 개인화 추천 방법은 개인화 추천 시스템에 포함되는 적어도 하나의 컴퓨터 시스템을 통해 수행될 수 있다. 이때, 컴퓨터 시스템에는 본 발명의 일실시예에 따른 컴퓨터 프로그램이 설치 및 구동될 수 있고, 컴퓨터 시스템은 구동된 컴퓨터 프로그램의 제어에 따라 본 발명의 실시예들에 따른 개인화 추천 방법을 수행할 수 있다. 상술한 컴퓨터 프로그램은 컴퓨터 시스템과 결합되어 개인화 추천 방법을 컴퓨터에 실행시키기 위해 컴퓨터 판독 가능한 기록매체에 저장될 수 있다.The personalized recommendation system according to embodiments of the present invention may be implemented by at least one computer system, and the personalized recommendation method according to embodiments of the present invention is performed through at least one computer system included in the personalized recommendation system. It can be. At this time, a computer program according to an embodiment of the present invention may be installed and driven in the computer system, and the computer system may perform the personalized recommendation method according to the embodiments of the present invention under the control of the driven computer program. . The above-described computer program may be combined with a computer system and stored in a computer readable recording medium to execute a personalized recommendation method on a computer.

도 1은 본 발명의 일실시예에 따른 네트워크 환경의 예를 도시한 도면이다. 도 1의 네트워크 환경은 복수의 전자 기기들(110, 120, 130, 140), 복수의 서버들(150, 160) 및 네트워크(170)를 포함하는 예를 나타내고 있다. 이러한 도 1은 발명의 설명을 위한 일례로 전자 기기의 수나 서버의 수가 도 1과 같이 한정되는 것은 아니다. 또한, 도 1의 네트워크 환경은 본 실시예들에 적용 가능한 환경들 중 하나의 예를 설명하는 것일 뿐, 본 실시예들에 적용 가능한 환경이 도 1의 네트워크 환경으로 한정되는 것은 아니다.1 is a diagram illustrating an example of a network environment according to an embodiment of the present invention. The network environment of FIG. 1 shows an example including a plurality of electronic devices 110 , 120 , 130 , and 140 , a plurality of servers 150 and 160 , and a network 170 . 1 is an example for explanation of the invention, and the number of electronic devices or servers is not limited as shown in FIG. 1 . In addition, the network environment of FIG. 1 only describes one example of environments applicable to the present embodiments, and the environment applicable to the present embodiments is not limited to the network environment of FIG. 1 .

복수의 전자 기기들(110, 120, 130, 140)은 컴퓨터 장치로 구현되는 고정형 단말이거나 이동형 단말일 수 있다. 복수의 전자 기기들(110, 120, 130, 140)의 예를 들면, 스마트폰(smart phone), 휴대폰, 내비게이션, 컴퓨터, 노트북, 디지털방송용 단말, PDA(Personal Digital Assistants), PMP(Portable Multimedia Player), 태블릿 PC, 게임 콘솔(game console), 웨어러블 디바이스(wearable device), IoT(internet of things) 디바이스, VR(virtual reality) 디바이스, AR(augmented reality) 디바이스 등이 있다. 일례로 도 1에서는 전자 기기(110)의 예로 스마트폰의 형상을 나타내고 있으나, 본 발명의 실시예들에서 전자 기기(110)는 실질적으로 무선 또는 유선 통신 방식을 이용하여 네트워크(170)를 통해 다른 전자 기기들(120, 130, 140) 및/또는 서버(150, 160)와 통신할 수 있는 다양한 물리적인 컴퓨터 시스템들 중 하나를 의미할 수 있다.The plurality of electronic devices 110, 120, 130, and 140 may be fixed terminals implemented as computer devices or mobile terminals. Examples of the plurality of electronic devices 110, 120, 130, and 140 include a smart phone, a mobile phone, a navigation device, a computer, a laptop computer, a digital broadcast terminal, a personal digital assistant (PDA), and a portable multimedia player (PMP). ), tablet PC, game console, wearable device, internet of things (IoT) device, virtual reality (VR) device, augmented reality (AR) device, and the like. As an example, FIG. 1 shows the shape of a smartphone as an example of the electronic device 110, but in the embodiments of the present invention, the electronic device 110 substantially uses a wireless or wired communication method to transmit other information via the network 170. It may refer to one of various physical computer systems capable of communicating with the electronic devices 120 , 130 , and 140 and/or the servers 150 and 160 .

통신 방식은 제한되지 않으며, 네트워크(170)가 포함할 수 있는 통신망(일례로, 이동통신망, 유선 인터넷, 무선 인터넷, 방송망)을 활용하는 통신 방식뿐만 아니라 기기들간의 근거리 무선 통신 역시 포함될 수 있다. 예를 들어, 네트워크(170)는, PAN(personal area network), LAN(local area network), CAN(campus area network), MAN(metropolitan area network), WAN(wide area network), BBN(broadband network), 인터넷 등의 네트워크 중 하나 이상의 임의의 네트워크를 포함할 수 있다. 또한, 네트워크(170)는 버스 네트워크, 스타 네트워크, 링 네트워크, 메쉬 네트워크, 스타-버스 네트워크, 트리 또는 계층적(hierarchical) 네트워크 등을 포함하는 네트워크 토폴로지 중 임의의 하나 이상을 포함할 수 있으나, 이에 제한되지 않는다.The communication method is not limited, and short-distance wireless communication between devices as well as a communication method utilizing a communication network (eg, a mobile communication network, a wired Internet, a wireless Internet, and a broadcasting network) that the network 170 may include may also be included. For example, the network 170 may include a personal area network (PAN), a local area network (LAN), a campus area network (CAN), a metropolitan area network (MAN), a wide area network (WAN), and a broadband network (BBN). , one or more arbitrary networks such as the Internet. In addition, the network 170 may include any one or more of network topologies including a bus network, a star network, a ring network, a mesh network, a star-bus network, a tree or a hierarchical network, and the like. Not limited.

서버(150, 160) 각각은 복수의 전자 기기들(110, 120, 130, 140)과 네트워크(170)를 통해 통신하여 명령, 코드, 파일, 콘텐츠, 서비스 등을 제공하는 컴퓨터 장치 또는 복수의 컴퓨터 장치들로 구현될 수 있다. 예를 들어, 서버(150)는 네트워크(170)를 통해 접속한 복수의 전자 기기들(110, 120, 130, 140)로 제1 서비스를 제공하는 시스템일 수 있으며, 서버(160) 역시 네트워크(170)를 통해 접속한 복수의 전자 기기들(110, 120, 130, 140)로 제2 서비스를 제공하는 시스템일 수 있다. 보다 구체적인 예로, 서버(150)는 복수의 전자 기기들(110, 120, 130, 140)에 설치되어 구동되는 컴퓨터 프로그램으로서의 어플리케이션을 통해, 해당 어플리케이션이 목적하는 서비스(일례로, 개인화 추천 서비스 등)를 제1 서비스로서 복수의 전자 기기들(110, 120, 130, 140)로 제공할 수 있다. 다른 예로, 서버(160)는 상술한 어플리케이션의 설치 및 구동을 위한 파일을 복수의 전자 기기들(110, 120, 130, 140)로 배포하는 서비스를 제2 서비스로서 제공할 수 있다.Each of the servers 150 and 160 communicates with the plurality of electronic devices 110, 120, 130, and 140 through the network 170 to provide commands, codes, files, contents, services, and the like, or a computer device or a plurality of computers. It can be implemented in devices. For example, the server 150 may be a system that provides a first service to a plurality of electronic devices 110, 120, 130, and 140 accessed through the network 170, and the server 160 may also include a network ( It may be a system that provides a second service to a plurality of electronic devices 110, 120, 130, and 140 accessed through 170). As a more specific example, the server 150 provides a service (for example, a personalized recommendation service, etc.) for which the application is intended through an application as a computer program that is installed and driven in the plurality of electronic devices 110, 120, 130, and 140. may be provided to the plurality of electronic devices 110, 120, 130, and 140 as the first service. As another example, the server 160 may provide a service for distributing files for installing and running the above-described application to the plurality of electronic devices 110, 120, 130, and 140 as a second service.

도 2는 본 발명의 일실시예에 따른 컴퓨터 시스템의 예를 도시한 블록도이다. 앞서 설명한 복수의 전자 기기들(110, 120, 130, 140) 각각이나 서버들(150, 160) 각각은 도 2를 통해 도시된 컴퓨터 시스템(200)에 의해 구현될 수 있다.2 is a block diagram illustrating an example of a computer system according to one embodiment of the present invention. Each of the plurality of electronic devices 110 , 120 , 130 , and 140 or each of the servers 150 and 160 described above may be implemented by the computer system 200 shown in FIG. 2 .

이러한 컴퓨터 시스템(200)은 도 2에 도시된 바와 같이, 메모리(210), 프로세서(220), 통신 인터페이스(230) 그리고 입출력 인터페이스(240)를 포함할 수 있다.As shown in FIG. 2 , the computer system 200 may include a memory 210, a processor 220, a communication interface 230, and an input/output interface 240.

메모리(210)는 컴퓨터에서 판독 가능한 기록매체로서, RAM(random access memory), ROM(read only memory) 및 디스크 드라이브와 같은 비소멸성 대용량 기록장치(permanent mass storage device)를 포함할 수 있다. 여기서 ROM과 디스크 드라이브와 같은 비소멸성 대용량 기록장치는 메모리(210)와는 구분되는 별도의 영구 저장 장치로서 컴퓨터 시스템(200)에 포함될 수도 있다. 또한, 메모리(210)에는 운영체제와 적어도 하나의 프로그램 코드가 저장될 수 있다. 이러한 소프트웨어 구성요소들은 메모리(210)와는 별도의 컴퓨터에서 판독 가능한 기록매체로부터 메모리(210)로 로딩될 수 있다. 이러한 별도의 컴퓨터에서 판독 가능한 기록매체는 플로피 드라이브, 디스크, 테이프, DVD/CD-ROM 드라이브, 메모리 카드 등의 컴퓨터에서 판독 가능한 기록매체를 포함할 수 있다. 다른 실시예에서 소프트웨어 구성요소들은 컴퓨터에서 판독 가능한 기록매체가 아닌 통신 인터페이스(230)를 통해 메모리(210)에 로딩될 수도 있다. 예를 들어, 소프트웨어 구성요소들은 네트워크(170)를 통해 수신되는 파일들에 의해 설치되는 컴퓨터 프로그램에 기반하여 컴퓨터 시스템(200)의 메모리(210)에 로딩될 수 있다.The memory 210 is a computer-readable recording medium and may include a random access memory (RAM), a read only memory (ROM), and a permanent mass storage device such as a disk drive. Here, a non-perishable mass storage device such as a ROM and a disk drive may be included in the computer system 200 as a separate permanent storage device distinct from the memory 210 . Also, an operating system and at least one program code may be stored in the memory 210 . These software components may be loaded into the memory 210 from a computer-readable recording medium separate from the memory 210 . The separate computer-readable recording medium may include a computer-readable recording medium such as a floppy drive, a disk, a tape, a DVD/CD-ROM drive, and a memory card. In another embodiment, software components may be loaded into the memory 210 through the communication interface 230 rather than a computer-readable recording medium. For example, software components may be loaded into memory 210 of computer system 200 based on a computer program installed by files received over network 170 .

프로세서(220)는 기본적인 산술, 로직 및 입출력 연산을 수행함으로써, 컴퓨터 프로그램의 명령을 처리하도록 구성될 수 있다. 명령은 메모리(210) 또는 통신 인터페이스(230)에 의해 프로세서(220)로 제공될 수 있다. 예를 들어, 프로세서(220)는 메모리(210)와 같은 기록 장치에 저장된 프로그램 코드에 따라 수신되는 명령을 실행하도록 구성될 수 있다.The processor 220 may be configured to process commands of a computer program by performing basic arithmetic, logic, and input/output operations. Instructions may be provided to processor 220 by memory 210 or communication interface 230 . For example, processor 220 may be configured to execute received instructions according to program codes stored in a recording device such as memory 210 .

통신 인터페이스(230)는 네트워크(170)를 통해 컴퓨터 시스템(200)이 다른 장치(일례로, 앞서 설명한 저장 장치들)와 서로 통신하기 위한 기능을 제공할 수 있다. 일례로, 컴퓨터 시스템(200)의 프로세서(220)가 메모리(210)와 같은 기록 장치에 저장된 프로그램 코드에 따라 생성한 요청이나 명령, 데이터, 파일 등이 통신 인터페이스(230)의 제어에 따라 네트워크(170)를 통해 다른 장치들로 전달될 수 있다. 역으로, 다른 장치로부터의 신호나 명령, 데이터, 파일 등이 네트워크(170)를 거쳐 컴퓨터 시스템(200)의 통신 인터페이스(230)를 통해 컴퓨터 시스템(200)으로 수신될 수 있다. 통신 인터페이스(230)를 통해 수신된 신호나 명령, 데이터 등은 프로세서(220)나 메모리(210)로 전달될 수 있고, 파일 등은 컴퓨터 시스템(200)이 더 포함할 수 있는 저장 매체(상술한 영구 저장 장치)로 저장될 수 있다.The communication interface 230 may provide a function for the computer system 200 to communicate with other devices (eg, storage devices described above) through the network 170 . For example, a request, command, data, file, etc. generated according to a program code stored in a recording device such as the memory 210 by the processor 220 of the computer system 200 is controlled by the communication interface 230 to the network ( 170) to other devices. Conversely, signals, commands, data, files, etc. from other devices may be received into computer system 200 via communication interface 230 of computer system 200 via network 170 . Signals, commands, or data received through the communication interface 230 may be transferred to the processor 220 or the memory 210, and files may be stored as storage media that the computer system 200 may further include (described above). permanent storage).

입출력 인터페이스(240)는 입출력 장치(250)와의 인터페이스를 위한 수단일 수 있다. 예를 들어, 입력 장치는 마이크, 키보드 또는 마우스 등의 장치를, 그리고 출력 장치는 디스플레이, 스피커와 같은 장치를 포함할 수 있다. 다른 예로 입출력 인터페이스(240)는 터치스크린과 같이 입력과 출력을 위한 기능이 하나로 통합된 장치와의 인터페이스를 위한 수단일 수도 있다. 입출력 장치(250)는 컴퓨터 시스템(200)과 하나의 장치로 구성될 수도 있다.The input/output interface 240 may be a means for interface with the input/output device 250 . For example, the input device may include a device such as a microphone, keyboard, or mouse, and the output device may include a device such as a display or speaker. As another example, the input/output interface 240 may be a means for interface with a device in which functions for input and output are integrated into one, such as a touch screen. The input/output device 250 may be configured as one device with the computer system 200 .

또한, 다른 실시예들에서 컴퓨터 시스템(200)은 도 2의 구성요소들보다 더 적은 혹은 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들어, 컴퓨터 시스템(200)은 상술한 입출력 장치(250) 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다.Also, in other embodiments, computer system 200 may include fewer or more elements than those of FIG. 2 . However, there is no need to clearly show most of the prior art components. For example, the computer system 200 may be implemented to include at least some of the aforementioned input/output devices 250 or may further include other elements such as a transceiver and a database.

이하에서는 관심 주제 기반 개인화 추천을 위한 방법 및 시스템의 구체적인 실시예를 설명하기로 한다.Hereinafter, specific embodiments of a method and system for subject-of-interest-based personalized recommendation will be described.

도 3은 본 발명의 일실시예에 따른 컴퓨터 시스템의 프로세서가 포함할 수 있는 구성요소의 예를 도시한 블록도이고, 도 4는 본 발명의 일실시예에 따른 컴퓨터 시스템이 수행할 수 있는 개인화 추천 방법의 일례를 도시한 순서도이다.3 is a block diagram illustrating an example of components that may be included in a processor of a computer system according to an embodiment of the present invention, and FIG. It is a flowchart showing an example of a recommendation method.

본 실시예에 따른 컴퓨터 시스템(200)은 클라이언트를 대상으로 클라이언트 상에 설치된 전용 어플리케이션이나 컴퓨터 시스템(200)과 관련된 웹/모바일 사이트 접속을 통해 개인화 추천 서비스를 제공할 수 있다.The computer system 200 according to this embodiment may provide a personalized recommendation service to a client through a dedicated application installed on the client or access to a web/mobile site related to the computer system 200 .

컴퓨터 시스템(200)의 프로세서(220)는 이후 설명될 개인화 추천 방법을 수행하기 위한 구성요소로서 도 3에 도시된 바와 같이, 데이터 생성부(310), 관심 주제 선정부(320), 및 개인화 추천부(330)를 포함할 수 있다. 실시예에 따라 프로세서(220)의 구성요소들은 선택적으로 프로세서(220)에 포함되거나 제외될 수도 있다. 또한, 실시예에 따라 프로세서(220)의 구성요소들은 프로세서(220)의 기능의 표현을 위해 분리 또는 병합될 수도 있다.The processor 220 of the computer system 200 is a component for performing a personalized recommendation method to be described later, and as shown in FIG. 3, the data generator 310, the topic of interest selection unit 320, and the personalized recommendation A portion 330 may be included. Depending on embodiments, components of the processor 220 may be selectively included in or excluded from the processor 220 . Also, components of the processor 220 may be separated or merged to express functions of the processor 220 according to embodiments.

이러한 프로세서(220) 및 프로세서(220)의 구성요소들은 이후 설명될 개인화 추천 방법이 포함하는 단계들을 수행하도록 컴퓨터 시스템(200)을 제어할 수 있다. 예를 들어, 프로세서(220) 및 프로세서(220)의 구성요소들은 메모리(210)가 포함하는 운영체제의 코드와 적어도 하나의 프로그램의 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다.The processor 220 and components of the processor 220 may control the computer system 200 to perform steps included in a personalized recommendation method to be described later. For example, the processor 220 and components of the processor 220 may be implemented to execute instructions according to an operating system code and at least one program code included in the memory 210 .

여기서, 프로세서(220)의 구성요소들은 컴퓨터 시스템(200)에 저장된 프로그램 코드가 제공하는 명령에 따라 프로세서(220)에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다. 예를 들어, 컴퓨터 시스템(200)이 키워드와 주제 간의 관계를 나타내는 관심사 데이터를 생성하도록 상술한 명령에 따라 컴퓨터 시스템(200)을 제어하는 프로세서(220)의 기능적 표현으로서 데이터 생성부(310)가 이용될 수 있다.Here, elements of the processor 220 may be representations of different functions performed by the processor 220 according to instructions provided by program codes stored in the computer system 200 . For example, the data generator 310 is a functional expression of the processor 220 that controls the computer system 200 according to the above-described instructions so that the computer system 200 generates interest data representing a relationship between a keyword and a subject. can be used

프로세서(220)는 컴퓨터 시스템(200)의 제어와 관련된 명령이 로딩된 메모리(210)로부터 필요한 명령을 읽어들일 수 있다. 이 경우, 상기 읽어들인 명령은 프로세서(220)가 이후 설명될 개인화 추천 방법을 실행하도록 제어하기 위한 명령을 포함할 수 있다.The processor 220 may read necessary commands from the memory 210 loaded with commands related to the control of the computer system 200 . In this case, the read command may include a command for controlling the processor 220 to execute a personalized recommendation method to be described later.

이후 설명될 개인화 추천 방법이 포함하는 단계들은 도시된 순서와 다른 순서로 수행될 수 있으며, 단계들 중 일부가 생략되거나 추가의 과정이 더 포함될 수 있다.Steps included in the personalized recommendation method to be described later may be performed in an order different from the shown order, and some of the steps may be omitted or additional processes may be further included.

도 4를 참조하면, 단계(S410)에서 데이터 생성부(310)는 키워드와 주제 간의 의미론적 관계를 나타내는 새로운 개념의 관심사 데이터를 생성할 수 있다. 데이터 생성부(310)는 인터넷 상에서 사용되는 키워드 각각에 대하여 해당 키워드에 어울리는 주제를 생성할 수 있다. 이때, 키워드는 검색 시 사용되는 키워드인 검색어, 어떤 정보의 메타데이터로 부여된 키워드나 분류를 나타내는 태그 등 인터넷 상의 정보 검색이나 정보 분류에서 사용되는 모든 키워드를 포괄하여 의미할 수 있다. 예를 들어, 데이터 생성부(310)는 구매할 상품을 찾기 위한 목적으로 사용되는 쇼핑성 검색어, 쇼핑 추천에 사용되는 쇼핑성 태그 등을 대상으로 관심사 데이터를 생성할 수 있다. 키워드 '곤약면'과 주제 '다이어트' 간의 관계가 구축되어 있다고 가정한다면, 사용자 A가 검색어 '곤약면'을 이용하여 상품을 검색하거나 태그 '곤약면'이 부여된 상품을 클릭한다고 할 때, 사용자 A의 행동에서 나타나는 관심사를 명시적인 단어, '다이어트'로 요약할 수 있다. 일례로, 데이터 생성부(310)는 언어 모델을 이용하여 검색어나 태그 등으로 사용되는 키워드에 대해 해당 키워드를 사용하는 사용자의 관심사로 표현할 수 있는 주제를 생성함으로써 키워드와 주제 간의 관계를 나타내는 관심사 데이터를 생성할 수 있다. 데이터 생성부(310)는 언어 모델의 입력문이 되는 프롬프트(prompt)를 통해 주어진 키워드와 어울리는 주제를 만들어 키워드와 주제 간의 관계를 구축할 수 있다. 키워드와 주제 간의 관계 데이터는 일정 주기를 단위로 업데이트될 수 있다.Referring to FIG. 4 , in step S410, the data generating unit 310 may generate interest data of a new concept representing a semantic relationship between a keyword and a subject. The data generator 310 may generate a topic suitable for each keyword used on the Internet. In this case, the keyword may include all keywords used in information search or information classification on the Internet, such as a search word used in a search, a keyword given as metadata of certain information, or a tag indicating a classification. For example, the data generating unit 310 may generate interest data for a shopping property search word used for the purpose of finding a product to purchase, a shopping property tag used for shopping recommendation, and the like. Assuming that the relationship between the keyword 'konjac noodles' and the topic 'diet' is established, when user A searches for a product using the search term 'konjac noodles' or clicks a product with the tag 'konjac noodles', The concern expressed in A's behavior can be summed up in an explicit word: 'diet'. For example, the data generator 310 creates a topic that can be expressed as a user's interest using the keyword for a keyword used as a search term or tag using a language model, thereby interest data representing a relationship between a keyword and a topic. can create The data generator 310 may build a relationship between a keyword and a topic by creating a topic suitable for a given keyword through a prompt that is an input sentence of the language model. Relationship data between keywords and subjects may be updated at regular intervals.

단계(S420)에서 관심 주제 선정부(320)는 키워드와 주제 간의 관계를 이용하여 인터넷 상의 사용자의 활동에 대응되는 적어도 하나의 주제를 사용자의 관심 주제로 선정할 수 있다. 관심 주제 선정부(320)는 사용자 활동 키워드(실시간으로 입력되는 검색어, 또는 최근 일정 기간 동안의 검색어나 클릭 상품의 태그 등)를 기준으로 해당 키워드와 관계가 설정된 주제를 해당 사용자의 관심 주제로 선정할 수 있다.In step S420, the interest topic selector 320 may select at least one topic corresponding to the user's activity on the Internet as the user's interest topic by using the relationship between the keyword and the topic. The topic of interest selection unit 320 selects a topic related to the keyword as a topic of interest for the user based on a user activity keyword (a search word entered in real time, a search word for a recent period of time, or a tag of a clicked product, etc.) can do.

단계(S430)에서 개인화 추천부(330)는 사용자의 관심 주제를 기초로 개인화된 추천을 제공할 수 있다. 개인화 추천부(330)는 사용자의 관심 주제와 관계가 설정된 키워드를 이용하여 개인화 추천 정보를 제공할 수 있다. 일례로, 개인화 추천부(330)는 사용자의 관심 주제에 속하는 키워드(검색어, 태그 등) 중 적어도 하나의 키워드를 연관 키워드로 추천할 수 있다. 이때, 개인화 추천부(330)는 임베딩 방법론(예를 들어, word2vec, FastText 등)을 통해 키워드 간의 유사도를 측정할 수 있으며, 사용자의 관심 주제에 속하는 키워드 중 사용자 활동 키워드와 유사한 키워드를 연관 키워드로 선정할 수 있다. 또한, 개인화 추천부(330)는 행렬 분해(MF, matrix factorization) 모델을 통해 사용자의 관심 주제에 속하는 키워드 중 사용자가 선호하는 키워드를 연관 키워드로 선정할 수 있다. 사용자를 U라 하고 사용자 활동 키워드들을 I라 할 때 U×I 사이즈의 인터랙션 데이터에 대해 행렬 분해를 수행함으로써 사용자에 대해 키워드 별 선호도를 구할 수 있다. 사용자의 관심 주제에 속하는 키워드를 대상으로 선호도를 구한 후 일정 레벨 이상의 선호도를 가진 키워드를 사용자 활동 키워드의 연관 키워드로 추천할 수 있다. 사용자 활동 키워드가 일정 레벨 이상 누적된 사용자에 대해서는 행렬 분해 모델을 이용하여 연관 키워드를 추천할 수 있고, 사용자 활동 키워드가 일정 레벨 미만인 사용자에 대해서는 임베딩 방법론을 이용하여 연관 키워드를 추천할 수 있다. 다른 예로, 개인화 추천부(330)는 사용자의 관심 주제에 따라 연관 키워드를 기초로 인터넷 상의 아이템을 추천할 수 있다. 예를 들어, 개인화 추천부(330)는 연관 키워드와 관련된 아이템으로, 여러 사용자들이 연관 키워드를 검색어로 입력한 후 클릭한 상품 중 일부를 추천 상품으로 제공할 수 있다. 이때, 클릭 상품 중 최근 클릭 상품에 가중치를 두어 우선적으로 추천되도록 적용할 수 있다. 또한, 클릭 상품 중 사용자의 프로필 정보(예를 들어, 성별, 연령, 위치 등)와 매칭되는 다른 사용자 또는 사용자와 관심 주제가 동일한 다른 사용자에 의해 클릭된 상품을 해당 사용자의 추천 상품으로 선정할 수 있다.In step S430, the personalized recommendation unit 330 may provide personalized recommendations based on the user's subject of interest. The personalized recommendation unit 330 may provide personalized recommendation information using a keyword related to a subject of interest of the user. For example, the personalized recommendation unit 330 may recommend at least one keyword among keywords (search words, tags, etc.) belonging to a topic of interest of the user as a related keyword. At this time, the personalized recommendation unit 330 may measure the similarity between keywords through an embedding methodology (eg, word2vec, FastText, etc.), and among keywords belonging to the user's interest topic, keywords similar to user activity keywords may be used as related keywords. can be selected In addition, the personalized recommendation unit 330 may select a keyword preferred by the user among keywords belonging to a subject of interest of the user as a related keyword through a matrix factorization (MF) model. Assuming that the user is U and the user activity keywords are I, it is possible to obtain the user's preference for each keyword by performing matrix decomposition on the interaction data of size U×I. After obtaining preference for keywords belonging to the user's interest topic, keywords having a preference level of a certain level or higher may be recommended as related keywords of user activity keywords. For users whose user activity keywords have accumulated at or above a certain level, relevant keywords may be recommended using a matrix decomposition model, and for users whose user activity keywords are below a certain level, related keywords may be recommended using an embedding methodology. As another example, the personalized recommendation unit 330 may recommend items on the Internet based on related keywords according to the subject of interest of the user. For example, the personalized recommendation unit 330 is an item related to a related keyword, and may provide some of products clicked after various users input a related keyword as a search term as recommended products. At this time, among the click products, the most recent click product may be weighted so that it is recommended first. In addition, among clicked products, products clicked by other users who match the user's profile information (eg, gender, age, location, etc.) or by other users who have the same interest topic as the user can be selected as the user's recommended product. .

사용자의 관심 주제를 기초로 추천되는 아이템을 쇼핑 상품으로 설명하고 있으나, 이에 한정되는 것은 아니다. 예를 들어, 카페, 블로그, 뉴스, 동영상 등 다양한 플랫폼이나 채널 등의 컨텐츠를 추천 아이템으로 활용할 수 있다.Items recommended based on the subject of interest of the user are described as shopping products, but are not limited thereto. For example, contents such as various platforms or channels such as cafes, blogs, news, and videos may be used as recommended items.

도 5는 본 발명의 일실시예에 있어서 프롬프트를 이용한 데이터 생성 과정의 일례를 설명하기 위한 순서도이다.5 is a flowchart illustrating an example of a data generation process using a prompt in an embodiment of the present invention.

도 5를 참조하면, 단계(S501)에서 프로세서(220)는 예시 데이터셋을 이용하여 언어 모델의 입력 프롬프트를 구성할 수 있다. 프로세서(220)는 사전에 정해진 키워드와 해당 키워드의 주제를 정답이 정해진 예시 데이터로 이용할 수 있다. 미리 정해진 예시 데이터 쌍 이외에 별도의 데이터셋이 존재할 수 있으며, 실시예에 따라서는 데이터셋 내에서 키워드와 해당 키워드의 주제로 이루어진 예시 데이터 쌍을 선정하여 이용할 수 있다. 프로세서(220)는 주어진 NLP 문제의 특성이 잘 반영된 전용 프롬프트 템플릿을 제작할 수 있으며, 이때 프롬프트 템플릿에는 태스크의 정의나 메타 정보가 포함될 수 있다. 다시 말해, 프로세서(220)는 데이터셋에서 선택된 예시 데이터들을 이용하여 자연어 형태의 프롬프트를 구성할 수 있으며, 이때 프롬프트는 언어 모델이 이해할 수 있는 형식으로 제작되어 언어 모델의 입력으로 주어진다. 프로세서(220)는 예시 데이터가 레이블이 있는 데이터일 경우 레이블 정보와 함께 입력문이 만들어질 수 있도록 프롬프트를 설계할 수 있다. 프롬프트의 형식 자체는 다양하게 구성될 수 있으며, 일례로 프롬프트는 키워드 예시와 해당 키워드의 주제가 예시로 구성될 수 있다. 본 실시예에서 프롬프트는 적어도 하나 이상의 키워드와 해당 키워드의 주제로 이루어진 예시 데이터 쌍과, 타겟 키워드로 구성될 수 있다. 프롬프트 구성의 상세한 방법은 이하에서 도6을 참조하여 설명한다.Referring to FIG. 5 , in step S501, the processor 220 may construct an input prompt of a language model using an example dataset. The processor 220 may use a predetermined keyword and a subject of the keyword as example data for which a correct answer is determined. A separate data set may exist in addition to a predetermined example data pair, and depending on an embodiment, an example data pair consisting of a keyword and a subject of the corresponding keyword may be selected and used in the data set. The processor 220 may create a dedicated prompt template in which characteristics of a given NLP problem are well reflected. In this case, the prompt template may include a task definition or meta information. In other words, the processor 220 may construct a prompt in the form of a natural language using example data selected from the dataset, and in this case, the prompt is produced in a format that the language model can understand and given as an input to the language model. When the example data is labeled data, the processor 220 may design a prompt so that an input sentence can be created together with label information. The form itself of the prompt may be configured in various ways, and for example, the prompt may be composed of an example keyword and an example subject of the keyword. In this embodiment, the prompt may be composed of at least one keyword, an example data pair consisting of a subject of the keyword, and a target keyword. A detailed method of configuring the prompt will be described with reference to FIG. 6 below.

단계(S502)에서 프로세서(220)는 단계(S501)에서 구성된 프롬프트를 언어 모델에 입력하여 언어 모델로부터 주어진 타겟 키워드의 주제를 이해할 수 있다. 프로세서(220)는 프롬프트 입력문을 언어 모델에 입력한 후 언어 모델의 생성 내지는 완성 기능을 통한 언어 생성 결과로서 타겟 키워드의 주제를 얻을 수 있다. 프로세서(220)는 프롬프트를 언어 모델로 입력하여 언어 모델을 통해 프롬프트에 포함된 예시의 자연어 패턴을 분석함으로써 해당 패턴을 가지는 새로운 결과를 얻을 수 있다.In step S502, the processor 220 inputs the prompt configured in step S501 to the language model to understand the subject of the given target keyword from the language model. The processor 220 may obtain the subject of the target keyword as a language generation result through a language model generation or completion function after inputting the prompt input sentence into the language model. The processor 220 may obtain a new result having a corresponding pattern by inputting a prompt into a language model and analyzing an example natural language pattern included in the prompt through the language model.

도 6 내지 도 7은 본 발명의 일실시예에 있어서 데이터 생성 예시를 도시한 것이다.6 to 7 show examples of data generation in one embodiment of the present invention.

도 6을 참조하면, 프로세서(220)는 예시 데이터로 선정된 키워드 예시와 해당 키워드에 대한 관심사로 표현할 수 있는 주제로 이루어진 예시 데이터 쌍을 이용하여 언어모델의 입력문이 되는 프롬프트(610)를 구성할 수 있다.Referring to FIG. 6 , the processor 220 configures a prompt 610 serving as an input sentence of a language model using a pair of example data consisting of a keyword example selected as example data and a subject that can be expressed as an interest in the keyword. can do.

프로세서(220)는 적어도 하나의 예시 데이터 쌍과 타겟 키워드로 구성된 프롬프트(610)를 언어 모델의 입력으로 하여 언어 모델이 타겟 키워드에 대한 주제를 생성하도록 할 수 있다. 즉, 언어 모델의 완성 기능을 통해 타겟 키워드의 내용에 해당되는 주제를 생성할 수 있다.The processor 220 may use the prompt 610 including at least one example data pair and the target keyword as an input of the language model, and cause the language model to generate a topic for the target keyword. That is, a topic corresponding to the content of the target keyword may be generated through the completion function of the language model.

프로세서(220)는 [키워드+주제] 형태의 예시 데이터 쌍과 [타겟 키워드]로 구성된 프롬프트(610)를 이용하여 프롬프트에 포함된 예시 데이터의 패턴을 따라 타겟 키워드에 대한 주제를 생성할 수 있다.The processor 220 may generate a topic for the target keyword according to a pattern of example data included in the prompt using the prompt 610 composed of example data pairs in the form of [keyword+topic] and [target keyword].

다시 말해, 프로세서(220)는 키워드와 해당 키워드의 주제를 예시로 제공하여 예시의 패턴에 따라 타겟 키워드에 해당되는 주제를 생성할 수 있다.In other words, the processor 220 may provide a keyword and a subject of the corresponding keyword as an example, and generate a subject corresponding to the target keyword according to the pattern of the example.

도 7을 참조하면, 프로세서(220)는 언어 모델(700)을 이용하여 주어진 키워드(701)에 대해 해당 키워드(701)에 어울리는 후보 주제(702)를 만들 수 있다. 예를 들어, 언어 모델(700)은 키워드 '곤약면'가 주어지면 해당 키워드의 주제로 다이어트, 다이어트 음식, 다이어트 음료, 닭가슴살 브랜드, 체지방 관리, 인바디, 디톡스 다이어트 등이 생성될 수 있다.Referring to FIG. 7 , the processor 220 may create a candidate topic 702 suitable for a given keyword 701 by using a language model 700 . For example, when the keyword 'konjac noodles' is given, the language model 700 may create diet, diet food, diet drink, chicken breast brand, body fat management, in-body, and detox diet as the subject of the keyword.

언어 모델(700)에서 만들어지는 후보 주제(702)는 언어 모델(700)의 특성(다양성, 우연성 등) 상 워딩은 다르지만 같은 의미의 단어, 범주가 서로 다른 단어 등 일관되지 않는 단어를 생성하는 문제가 있다.Candidate topics 702 created from the language model 700 generate inconsistent words, such as words with the same meaning or words with different categories, even though the wording is different due to the characteristics (diversity, contingency, etc.) of the language model 700 there is

프로세서(220)는 키워드(701)와의 관계를 구축하기 위해 언어 모델(700)에서 만들어진 후보 주제(702)를 그룹핑하여 대표 주제를 선정할 필요가 있다.The processor 220 needs to select a representative topic by grouping the candidate topics 702 created in the language model 700 in order to establish a relationship with the keyword 701 .

도 8 내지 도 11은 본 발명의 일실시예에 있어서 주제 선정 과정의 예시를 도시한 것이다.8 to 11 show an example of a subject selection process in one embodiment of the present invention.

먼저, 프로세서(220)는 키워드에 대해 생성된 후보 주제를 대상으로 주제들 간의 유사도를 기초로 유사 관계에 있는 주제를 선별할 수 있다.First, the processor 220 may select a topic having a similar relationship based on a degree of similarity between the topics among the candidate topics generated for the keyword.

일례로, 도 8을 참조하면, 프로세서(220)는 행렬 분해(MF)를 기초로 키워드와 언어 모델에서 생성된 후보 주제를 모델링하는 방법을 통해 유사 관계에 있는 주제를 그룹핑할 수 있다.For example, referring to FIG. 8 , the processor 220 may group topics having a similar relationship through a method of modeling candidate topics generated from a keyword and a language model based on matrix decomposition (MF).

다른 예로, 도 9를 참조하면, 프로세서(220)는 키워드에 대해 생성된 후보 주제를 모두 연결하여(concatenate) 문장(sentence)으로 표현하고 각 후보 주제를 개별 단어로 표현하여 임베딩 학습을 수행함으로써 유사 관계에 있는 주제를 그룹핑할 수 있다.As another example, referring to FIG. 9 , the processor 220 concatenates all candidate topics generated for a keyword, expresses them as a sentence, expresses each candidate topic as an individual word, and performs embedding learning, thereby performing embedding learning. You can group related topics.

또 다른 예로, 프로세서(220)는 사용자가 검색한 기록을 관심사를 표현한 주제로 치환한 후 임베딩 학습을 수행할 수 있다. 도 10을 참조하면, 사용자 검색 기록이 <곤약면, 프로틴, 시서스가루, 병아리콩스낵, 곤약쫀드기>와 같을 때 검색어 각각을 주제에 해당되는 단어로 치환한 후 치환된 주제를 모두 연결하여 문장으로 표현하고 검색어 각각을 개별 단어로 표현하여 임베딩 학습을 수행함으로써 유사 관계에 있는 주제를 그룹핑할 수 있다.As another example, the processor 220 may perform embedding learning after substituting a record searched by a user for a subject expressing interest. Referring to FIG. 10, when the user's search record is equal to <konjac noodles, protein, cissus flour, chickpea snacks, and konjac jjondugi>, each search word is replaced with a word corresponding to the subject, and then all replaced subjects are connected to form a sentence. , and each search word is expressed as an individual word to perform embedding learning, thereby grouping topics in a similar relationship.

다음으로, 프로세서(220)는 유사 관계에 있는 주제 그룹에서 대표 주제를 선정할 수 있다. 프로세서(220)는 주제들 간의 유사도를 기초로 그룹핑 된 주제 그룹을 대상으로 주제 간의 관계를 파악함으로써 대표되는 주제를 선정할 수 있다.Next, the processor 220 may select a representative subject from a subject group having a similar relationship. The processor 220 may select a representative topic by identifying a relationship between topics in a subject group grouped based on a degree of similarity between the topics.

일례로, 프로세서(220)는 인터넷 상에서 키워드를 분류하는 카테고리(예를 들어, 검색어 카테고리 등)를 이용하여 주제 간의 관계를 구축할 수 있다. 예를 들어, 도 11에 도시한 바와 같이 검색어 <단백질쉐이크통, 퀘스트프로틴바, 나이키크루, 휠라퍼포먼스팬트, 젝시믹스조거, 아디다스티셔츠, 덤벨, 버티테스트매트, 원판5kg, 케틀벨, 번머신>이 모두 카테고리 '홈트'에 해당되고, 그 중 <나이키크루, 휠라퍼포먼스팬트, 젝시믹스조거, 아디다스티셔츠>가 카테고리 '운동복'에 해당되고, <덤벨, 버티테스트매트, 원판5kg, 케틀벨, 번머신>가 카테고리 '운동기구'에 해당된다고 가정한다. 언어 모델을 통해 주제 '홈트', '운동복', '운동기구'가 생성된다고 할 때, '운동복'에 속하는 검색어가 '홈트'에 포함되므로 주제 '홈트'와 '운동복' 간의 관계를 구축할 수 있고, '운동기구'에 속하는 검색어가 '홈트'에 포함되므로 주제 '홈트'와 '운동기구' 간의 관계를 구축할 수 있다.For example, the processor 220 may build relationships between subjects by using categories (eg, search word categories, etc.) for classifying keywords on the Internet. For example, as shown in FIG. 11, the search term <protein shake barrel, quest protein bar, Nike Crew, Fila Performance Pants, Jeximix Jogger, Adidas T-shirt, dumbbell, vertitest mat, disc 5kg, kettlebell, burn machine> All of them belong to the category 'Homet', and among them, <Nike Crew, Fila Performance Pants, Jexi Mix Jogger, Adidas T-shirt> fall under the category 'Sportswear', and <Dumbbell, Vertitest Mat, Disc 5kg, Kettlebell, Burn Machine> It is assumed that corresponds to the category 'exercise equipment'. When the topics 'Holmt', 'Sportswear', and 'Sportswear' are created through the language model, it is possible to build a relationship between the topics 'Holmt' and 'Sportswear' because search words belonging to 'Sportswear' are included in 'Holmt'. And since the search word belonging to 'sports equipment' is included in 'Holmt', it is possible to build a relationship between the subject 'Holmt' and 'Sports equipment'.

다른 예로, 프로세서(220)는 단어의 포함 관계와 동등 관계를 이용하여 주제 간의 관계를 구축할 수 있다. 먼저, 프로세서(220)는 유사 관계에 있는 주제 그룹에서 포함 관계에 있는 주제를 찾는다. 예를 들어, 주제 A '다이어트'는 주제 B '다이어트 식단'에 완전히 포함되는 단어이기 때문에 주제 B는 주제 A에 속한다(포함 관계)고 가정한다. 또한, 주제 A에 a1, a2, a3라는 단어가 포함되고 주제 B에 a1, a2, a3, b1, b2라는 단어가 포함되는 경우 주제 B는 주제 A를 완전히 포함하기 때문에 주제 A는 주제 B에 속한다(포함 관계)고 가정한다. 다음으로, 프로세서(220)는 포함 관계에 있는 주제를 제외한 나머지 주제 중에서 동등 관계에 있는 주제를 찾는다. 예를 들어, 키워드 C에 대해 주제 C1, C2, C3가 생성된 경우 주제 C1, C2, C3는 동등한 관계라고 가정한다. 프로세서(220)는 주제 간의 포함 관계와 동등 관계를 이용하여 그래프 임베딩(예를 들어, Knowledge Graph Embedding 등)을 수행할 수 있다. 다시 말해, 그래프 임베딩에서 사용되는 관계로 포함 관계와 동등 관계를 적용할 수 있다. 주제 간의 관계를 표현한 그래프 임베딩 후에 각 키워드에 대해 어떤 주제에 속하는지를 확률적으로 구하여 확률 기준으로 대표 주제를 결정할 수 있다. 확률 이외에 주제 간의 관계에 기반한 계층 구조에서 일정 뎁스(depth)의 주제를 대표 주제로 선정할 수 있다.As another example, the processor 220 may establish a relationship between subjects by using an inclusion relationship and an equivalence relationship of words. First, the processor 220 searches for a subject having an inclusion relationship in a subject group having a similar relationship. For example, we assume that topic B belongs to topic A (inclusion relationship) because topic A 'diet' is a word that is completely included in topic B 'diet diet'. Also, if topic A contains the words a1, a2, a3 and topic B contains the words a1, a2, a3, b1, b2, then topic A belongs to topic B because topic B completely contains topic A. (inclusion relationship) is assumed. Next, the processor 220 searches for a subject having an equivalent relationship among subjects other than subjects having an inclusive relationship. For example, if topics C1, C2, and C3 are generated for keyword C, it is assumed that topics C1, C2, and C3 are equivalent. The processor 220 may perform graph embedding (eg, knowledge graph embedding, etc.) using the inclusive relationship and the equivalence relationship between subjects. In other words, as a relationship used in graph embedding, an inclusive relationship and an equivalence relationship can be applied. After embedding a graph representing the relationship between topics, it is possible to determine a representative topic based on probability by probabilistically obtaining which topic belongs to each keyword. In addition to probability, a topic of a certain depth may be selected as a representative topic in a hierarchical structure based on relationships between topics.

여기서, 프로세서(220)는 대표 주제를 선정하기 위한 기준을 튜닝할 수 있으며, 예를 들어 주제 간에 단어가 얼마나 겹치는지를 파악하거나 주제 간에 유사도를 비교하는 등 정량적이면서도 정성적인 품질 튜닝을 진행할 수 있다.Here, the processor 220 may tune a criterion for selecting a representative topic, and perform quantitative and qualitative quality tuning, such as determining how much words overlap between topics or comparing similarities between topics, for example.

또한, 프로세서(220)는 주제 간의 관계를 기반으로 넓은 범주의 주제를 제거하는 후처리 로직을 진행할 수 있다. 일례로, 프로세서(220)는 주제 간의 관계에 기반한 계층 구조에서 하위 계층의 주제가 임계치 이상으로 많은 주제를 대표 주제 선정 대상에서 제외시킬 수 있다.Also, the processor 220 may perform post-processing logic that removes a wide range of subjects based on relationships between subjects. For example, the processor 220 may exclude topics in a hierarchical structure based on relationships between topics from a representative topic selection target, in which the number of topics in a lower layer is greater than or equal to a threshold value.

프로세서(220)는 각 키워드에 대해 다양한 주제가 생성되는 경우 주제 간의 관계에 기반한 임베딩 학습을 통해 대표할 수 있는 적어도 하나의 주제를 최종적으로 선정하여 해당 키워드와의 관계를 구축할 수 있다.When various topics are generated for each keyword, the processor 220 may finally select at least one representative topic through embedding learning based on a relationship between topics to establish a relationship with the corresponding keyword.

도 12 내지 도 14는 본 발명의 일실시예에 있어서 개인화 추천 과정의 예시를 도시한 것이다.12 to 14 show examples of a personalized recommendation process in an embodiment of the present invention.

도 12를 참조하면, 프로세서(220)는 사용자가 검색 서비스 화면(1200) 상에 검색어(1201)를 입력하는 경우 검색어(1201)에 대응되는 검색 결과에 개인화 추천 정보(1210)를 포함하여 제공할 수 있다.Referring to FIG. 12 , when a user inputs a search word 1201 on a search service screen 1200, the processor 220 includes personalized recommendation information 1210 in search results corresponding to the search word 1201 and provides the same. can

일례로, 프로세서(220)는 검색어(1201)에 해당되는 키워드와 관계가 설정된 주제를 해당 사용자의 관심 주제(1211)로 선정한 후 관심 주제(1211)에 속하는 키워드 중에서 검색어(1201)와 유사하거나 사용자가 선호하는 키워드인 연관 키워드(1212)를 개인화 추천 정보(1210)로 제공할 수 있다.For example, the processor 220 selects a topic related to a keyword corresponding to the search term 1201 as a topic of interest 1211 of the corresponding user, and then selects a keyword similar to the search term 1201 or a user belonging to the topic of interest 1211. The related keyword 1212, which is a preferred keyword, may be provided as the personalized recommendation information 1210.

다른 예로, 프로세서(220)는 검색어(1201)에 대해 연관 키워드(1212)와 관련된 아이템(1213)을 개인화 추천 정보(1210)로 제공할 수 있다. 예를 들어, 아이템(1213)은 연관 키워드(1212)가 태그로 등록된 상품, 다른 사용자들이 연관 키워드(1212)로 검색하여 클릭한 상품, 또는 사용자와 프로필(성별이나 연령 등)이 유사한 다른 사용자가 클릭한 상품 등으로 선정될 수 있다.As another example, the processor 220 may provide an item 1213 related to a keyword 1212 related to the search word 1201 as the personalized recommendation information 1210 . For example, the item 1213 is a product registered as a tag with the related keyword 1212, a product that other users searched for and clicked on with the related keyword 1212, or another user whose profile (gender, age, etc.) is similar to that of the user. may be selected as a clicked product.

도 13을 참조하면, 프로세서(220)는 사용자가 개인화 추천 영역(1310)이 포함된 서비스 화면(1300)에 접근하는 경우 최근 일정 기간 동안의 사용자 활동을 기초로 해당 사용자의 관심 주제(1311)를 제공할 수 있다. 이때, 프로세서(220)는 사용자 활동 키워드(최근 일정 기간 동안의 검색어나 클릭 상품의 태그 등)와 관계가 설정된 주제를 해당 사용자의 관심 주제(1311)로 선정하여 개인화 추천 영역(1310)에 노출할 수 있다.Referring to FIG. 13 , when the user accesses the service screen 1300 including the personalized recommendation area 1310, the processor 220 selects a topic of interest 1311 of the user based on user activity during a recent period. can provide At this time, the processor 220 selects a subject related to a user's activity keyword (a search term for a recent period or a tag of a clicked product, etc.) as a subject of interest 1311 of the user and exposes it to the personalized recommendation area 1310. can

프로세서(220)는 개인화 추천 영역(1310)에 노출된 관심 주제(1311) 중 특정 주제가 선택되는 경우, 도 14에 도시한 바와 같이 선택 주제(1411)에 속하는 키워드 중 사용자 활동 키워드와 유사하거나 사용자가 선호하는 키워드인 연관 키워드(1412)를 개인화 추천 영역(1310)을 통해 제공할 수 있다.When a specific topic is selected from among the topics of interest 1311 exposed on the personalized recommendation area 1310, the processor 220, as shown in FIG. A related keyword 1412 that is a preferred keyword may be provided through the personalized recommendation area 1310 .

프로세서(220)는 연관 키워드(1412)와 함께 연관 키워드(1412)와 관련된 아이템(1413)을 개인화 추천 영역(1310)에 노출할 수 있다. 예를 들어, 아이템(1413)은 연관 키워드(1412)가 태그로 등록된 상품, 다른 사용자들이 연관 키워드(1412)로 검색하여 클릭한 상품, 또는 사용자와 프로필 또는 관심 주제(1311)가 유사한 다른 사용자가 클릭한 상품 등으로 선정될 수 있다.The processor 220 may expose the relevant keyword 1412 and an item 1413 related to the relevant keyword 1412 to the personalized recommendation area 1310 . For example, the item 1413 is a product registered as a tag with a related keyword 1412, a product clicked by other users after searching for the related keyword 1412, or another user whose profile or interest topic 1311 is similar to that of the user. may be selected as a clicked product.

이처럼 본 발명의 실시예들에 따르면, 대규모 언어 모델을 이용하여 키워드와 주제 간의 의미론적 관계를 나타내는 새로운 개념의 데이터를 생성할 수 있고, 키워드와 주제의 관계 데이터를 기초로 인터넷 상의 사용자의 행동을 명시적인 단어(관심 주제)로 요약하여 이를 근거로 해당 사용자에게 개인화된 추천을 제공할 수 있다.As described above, according to the embodiments of the present invention, it is possible to generate new conceptual data representing a semantic relationship between a keyword and a subject using a large-scale language model, and based on the data on the relationship between a keyword and a subject, users' behavior on the Internet can be determined. It can be summarized in explicit words (topics of interest), based on which it can provide personalized recommendations to that user.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The devices described above may be implemented as hardware components, software components, and/or a combination of hardware components and software components. For example, devices and components described in the embodiments include a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA), and a programmable PLU (programmable logic unit). logic unit), microprocessor, or any other device capable of executing and responding to instructions. The processing device may run an operating system (OS) and one or more software applications running on the operating system. A processing device may also access, store, manipulate, process, and generate data in response to execution of software. For convenience of understanding, there are cases in which one processing device is used, but those skilled in the art will understand that the processing device includes a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that it can include. For example, a processing device may include a plurality of processors or a processor and a controller. Other processing configurations are also possible, such as parallel processors.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.Software may include a computer program, code, instructions, or a combination of one or more of the foregoing, which configures a processing device to operate as desired or processes independently or collectively. You can command the device. The software and/or data may be embodied in any tangible machine, component, physical device, computer storage medium or device to be interpreted by or to provide instructions or data to a processing device. there is. Software may be distributed on networked computer systems and stored or executed in a distributed manner. Software and data may be stored on one or more computer readable media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 이때, 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수 개의 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 어플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer readable medium. In this case, the medium may continuously store a program executable by a computer or temporarily store the program for execution or download. In addition, the medium may be various recording means or storage means in the form of a single or combined hardware, but is not limited to a medium directly connected to a certain computer system, and may be distributed on a network. Examples of the medium include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROM and DVD, magneto-optical media such as floptical disks, and ROM, RAM, flash memory, etc. configured to store program instructions. In addition, examples of other media include recording media or storage media managed by an app store that distributes applications, a site that supplies or distributes various other software, and a server.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described with limited examples and drawings, those skilled in the art can make various modifications and variations from the above description. For example, the described techniques may be performed in an order different from the method described, and/or components of the described system, structure, device, circuit, etc. may be combined or combined in a different form than the method described, or other components may be used. Or even if it is replaced or substituted by equivalents, appropriate results can be achieved.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents of the claims are within the scope of the following claims.

Claims (20)

컴퓨터 시스템에서 실행되는 방법에 있어서,
상기 컴퓨터 시스템은 메모리에 포함된 컴퓨터 판독가능한 명령들을 실행하도록 구성된 적어도 하나의 프로세서를 포함하고,
상기 방법은,
상기 적어도 하나의 프로세서에 의해, 인터넷 상에서 사용되는 키워드에 대해 언어 모델(language model)을 이용하여 상기 키워드의 주제를 생성하여 상기 키워드와 상기 주제 간의 관계를 구축하는 단계; 및
상기 적어도 하나의 프로세서에 의해, 상기 키워드와 상기 주제 간의 관계를 이용하여 인터넷 상의 사용자의 활동에 대응되는 적어도 하나의 관심 주제를 선정하는 단계; 및
상기 적어도 하나의 프로세서에 의해, 상기 관심 주제를 기초로 상기 사용자에 대해 개인화된 추천 정보를 제공하는 단계
를 포함하는 방법.
In a method executed on a computer system,
The computer system includes at least one processor configured to execute computer readable instructions contained in a memory;
The method,
generating, by the at least one processor, a subject of the keyword using a language model for a keyword used on the Internet, and establishing a relationship between the keyword and the subject; and
selecting, by the at least one processor, at least one topic of interest corresponding to an activity of a user on the Internet using a relationship between the keyword and the topic; and
providing, by the at least one processor, personalized recommendation information for the user based on the subject of interest;
How to include.
제1항에 있어서,
상기 키워드와 상기 주제 간의 관계를 구축하는 단계는,
키워드 예시와 해당 키워드의 주제로 이루어진 예시 데이터를 이용하여 타겟 키워드에 대한 프롬프트(prompt)를 구성하는 단계; 및
상기 프롬프트를 상기 언어 모델의 입력으로 하여 상기 예시 데이터의 패턴에 따라 상기 타겟 키워드의 주제를 생성하는 단계
를 포함하는 방법.
According to claim 1,
Establishing a relationship between the keyword and the subject,
configuring a prompt for a target keyword using example data consisting of a keyword example and a topic of the keyword; and
generating a subject of the target keyword according to a pattern of the example data by using the prompt as an input of the language model;
How to include.
제1항에 있어서,
상기 키워드와 상기 주제 간의 관계를 구축하는 단계는,
인터넷 상의 정보 검색 또는 정보 분류에 사용되는 키워드에 대해 해당 키워드를 사용하는 사용자의 관심사로 표현하기 위한 주제를 생성하는 단계
를 포함하는 방법.
According to claim 1,
Establishing a relationship between the keyword and the subject,
A step of creating a topic to be expressed as an interest of a user who uses the keyword for a keyword used for information search or information classification on the Internet.
How to include.
제1항에 있어서,
상기 키워드와 상기 주제 간의 관계를 구축하는 단계는,
상기 언어 모델을 통해 생성된 주제들 간의 유사도를 기초로 주제 그룹을 생성하는 단계; 및
상기 주제 그룹을 대상으로 상기 주제 간의 관계에 기반한 임베딩 학습을 통해 상기 키워드에 대해 적어도 하나의 대표 주제를 선정하는 단계
를 포함하는 방법.
According to claim 1,
Establishing a relationship between the keyword and the subject,
generating a topic group based on a similarity between the topics generated through the language model; and
Selecting at least one representative topic for the keyword through embedding learning based on the relationship between the topics for the topic group
How to include.
제4항에 있어서,
상기 주제 그룹을 생성하는 단계는,
검색 기록에 포함된 복수 개의 검색어에 대해 각 검색어를 주제로 치환한 후 치환된 주제를 연결하여 문장(sentence)으로 표현하고 상기 검색어 각각을 단어(word)로 표현하여 임베딩 학습을 수행함으로써 유사 관계에 있는 주제를 그룹핑하는 단계
를 포함하는 방법.
According to claim 4,
The step of creating the subject group,
For a plurality of search words included in the search record, each search word is replaced with a subject, the replaced subject is connected and expressed as a sentence, and each of the search words is expressed as a word to perform embedding learning. Steps to group topics in
How to include.
제4항에 있어서,
상기 주제 그룹을 생성하는 단계는,
상기 키워드에 대해 상기 언어 모델에서 생성된 후보 주제를 연결하여 문장으로 표현하고 상기 후보 주제 각각을 단어로 표현하여 임베딩 학습을 수행함으로써 유사 관계에 있는 주제를 그룹핑하는 단계
를 포함하는 방법.
According to claim 4,
The step of creating the subject group,
Grouping topics having a similar relationship by connecting candidate topics generated by the language model to the keywords to express sentences and performing embedding learning by expressing each of the candidate topics as words.
How to include.
제4항에 있어서,
상기 주제 그룹을 생성하는 단계는,
상기 키워드와 상기 언어 모델에서 생성된 후보 주제에 대해 행렬 분해(MF, matrix factorization)를 수행함으로써 유사 관계에 있는 주제를 그룹핑하는 단계
를 포함하는 방법.
According to claim 4,
The step of creating the subject group,
Grouping topics having a similar relationship by performing matrix factorization (MF) on candidate topics generated from the keyword and the language model.
How to include.
제4항에 있어서,
상기 키워드에 대해 적어도 하나의 대표 주제를 선정하는 단계는,
상기 주제 간의 포함 관계와 동등 관계 중 적어도 하나의 관계를 파악하여 그래프 임베딩(graph embedding)을 수행하는 단계; 및
상기 그래프 임베딩을 이용한 상기 키워드와 상기 주제 간의 확률을 기반으로 상기 대표 주제를 선정하는 단계
를 포함하는 방법.
According to claim 4,
Selecting at least one representative topic for the keyword,
performing graph embedding by identifying at least one relationship between an inclusion relationship and an equivalence relationship between the subjects; and
Selecting the representative topic based on the probability between the keyword and the topic using the graph embedding
How to include.
제1항에 있어서,
상기 관심 주제를 선정하는 단계는,
상기 사용자에 의해 입력된 검색어와 상기 사용자가 클릭한 상품의 태그 중 적어도 하나의 활동 키워드와 관계가 설정된 주제를 상기 관심 주제로 선정하는 것
을 특징으로 하는 방법.
According to claim 1,
The step of selecting the topic of interest is,
Selecting, as the topic of interest, a topic having a relationship with at least one activity keyword among a search word input by the user and a tag of a product clicked by the user.
A method characterized by.
제1항에 있어서,
상기 사용자에 대해 개인화된 추천 정보를 제공하는 단계는,
상기 관심 주제와 관계가 설정된 키워드 중 상기 사용자의 활동과 관련된 적어도 하나의 키워드를 연관 키워드로 추천하는 단계
를 포함하는 방법.
According to claim 1,
Providing personalized recommendation information for the user,
recommending at least one keyword related to the activity of the user among keywords having a relationship with the topic of interest as a related keyword;
How to include.
제1항에 있어서,
상기 사용자에 대해 개인화된 추천 정보를 제공하는 단계는,
상기 관심 주제와 관계가 설정된 키워드 중 상기 사용자의 활동과 관련된 적어도 하나의 키워드를 연관 키워드로 선정하는 단계; 및
인터넷 상의 아이템 중 상기 연관 키워드와 관련된 아이템을 추천하는 단계
를 포함하는 방법.
According to claim 1,
Providing personalized recommendation information for the user,
selecting at least one keyword related to the activity of the user among keywords having a relationship with the subject of interest as a related keyword; and
Step of recommending an item related to the related keyword among items on the Internet
How to include.
제11항에 있어서,
상기 연관 키워드와 관련된 아이템을 추천하는 단계는,
상기 사용자의 프로필 정보와 상기 관심 주제 중 적어도 하나를 이용하여 추천 아이템을 선정하는 단계
를 포함하는 방법.
According to claim 11,
The step of recommending an item related to the related keyword,
Selecting a recommended item using at least one of the user's profile information and the subject of interest
How to include.
제1항 내지 제12항 중 어느 한 항의 방법을 상기 컴퓨터 시스템에 실행시키기 위해 컴퓨터 판독가능한 기록 매체에 저장되는 컴퓨터 프로그램.A computer program stored in a computer readable recording medium to execute the method of any one of claims 1 to 12 in the computer system. 컴퓨터 시스템에 있어서,
메모리에 포함된 컴퓨터 판독가능한 명령들을 실행하도록 구성된 적어도 하나의 프로세서
를 포함하고,
상기 적어도 하나의 프로세서는,
인터넷 상에서 사용되는 키워드에 대해 언어 모델을 이용하여 상기 키워드의 주제를 생성하여 상기 키워드와 상기 주제 간의 관계를 구축하고,
상기 키워드와 상기 주제 간의 관계를 이용하여 인터넷 상의 사용자의 활동에 대응되는 적어도 하나의 관심 주제를 선정하고,
상기 관심 주제를 기초로 상기 사용자에 대해 개인화된 추천 정보를 제공하는 것
을 특징으로 하는 컴퓨터 시스템.
In a computer system,
at least one processor configured to execute computer readable instructions contained in memory;
including,
The at least one processor,
Creating a subject of the keyword using a language model for a keyword used on the Internet to establish a relationship between the keyword and the subject;
selecting at least one topic of interest corresponding to a user's activity on the Internet using the relationship between the keyword and the topic;
Providing personalized recommendation information for the user based on the topic of interest.
Characterized by a computer system.
제14항에 있어서,
상기 적어도 하나의 프로세서는,
키워드 예시와 해당 키워드의 주제로 이루어진 예시 데이터를 이용하여 타겟 키워드에 대한 프롬프트를 구성하고,
상기 프롬프트를 상기 언어 모델의 입력으로 하여 상기 예시 데이터의 패턴에 따라 상기 타겟 키워드의 주제를 생성하는 것
을 특징으로 하는 컴퓨터 시스템.
According to claim 14,
The at least one processor,
Construct a prompt for a target keyword using example data consisting of keyword examples and topics of the keyword;
Generating a subject of the target keyword according to a pattern of the example data by using the prompt as an input of the language model.
Characterized by a computer system.
제14항에 있어서,
상기 적어도 하나의 프로세서는,
인터넷 상의 정보 검색 또는 정보 분류에 사용되는 키워드에 대해 해당 키워드를 사용하는 사용자의 관심사로 표현하기 위한 주제를 생성하는 것
을 특징으로 하는 컴퓨터 시스템.
According to claim 14,
The at least one processor,
For keywords used in information retrieval or information classification on the Internet, creating topics to express the interest of users using the keywords.
Characterized by a computer system.
제14항에 있어서,
상기 적어도 하나의 프로세서는,
상기 언어 모델을 통해 생성된 주제들 간의 유사도를 기초로 주제 그룹을 생성하고,
상기 주제 그룹을 대상으로 상기 주제 간의 관계에 기반한 임베딩 학습을 통해 상기 키워드에 대해 적어도 하나의 대표 주제를 선정하는 것
을 특징으로 하는 컴퓨터 시스템.
According to claim 14,
The at least one processor,
Create a topic group based on a similarity between topics generated through the language model;
Selecting at least one representative topic for the keyword through embedding learning based on the relationship between the topics targeting the topic group
Characterized by a computer system.
제17항에 있어서,
상기 적어도 하나의 프로세서는,
검색 기록에 포함된 복수 개의 검색어에 대해 각 검색어를 주제로 치환한 후 치환된 주제를 연결하여 문장으로 표현하고 상기 검색어 각각을 단어로 표현하여 임베딩 학습을 수행함으로써 유사 관계에 있는 주제를 그룹핑하는 것
을 특징으로 하는 컴퓨터 시스템.
According to claim 17,
The at least one processor,
For a plurality of search terms included in the search record, after substituting each search term with a topic, connecting the replaced topic to express it as a sentence, and expressing each of the search terms as a word to perform embedding learning, thereby grouping topics with similar relationships
Characterized by a computer system.
제17항에 있어서,
상기 적어도 하나의 프로세서는,
상기 주제 간의 포함 관계와 동등 관계 중 적어도 하나의 관계를 파악하여 그래프 임베딩을 수행하고,
상기 그래프 임베딩을 이용한 상기 키워드와 상기 주제 간의 확률을 기반으로 상기 대표 주제를 선정하는 것
을 특징으로 하는 컴퓨터 시스템.
According to claim 17,
The at least one processor,
Graph embedding is performed by identifying at least one relationship between an inclusion relationship and an equivalence relationship between the subjects,
Selecting the representative topic based on the probability between the keyword and the topic using the graph embedding
Characterized by a computer system.
제14항에 있어서,
상기 적어도 하나의 프로세서는,
상기 관심 주제와 관계가 설정된 키워드 중 상기 사용자의 활동과 관련된 적어도 하나의 키워드를 연관 키워드로 추천하거나 또는 상기 인터넷 상의 아이템 중 상기 연관 키워드와 관련된 아이템을 추천하는 것
을 특징으로 하는 컴퓨터 시스템.
According to claim 14,
The at least one processor,
Recommending at least one keyword related to the activity of the user among keywords having a relationship with the topic of interest as a related keyword or recommending an item related to the related keyword among items on the Internet
Characterized by a computer system.
KR1020220010593A 2022-01-25 2022-01-25 Method, system, and computer program for personalized recommendation based on topic of interest KR20230114440A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020220010593A KR20230114440A (en) 2022-01-25 2022-01-25 Method, system, and computer program for personalized recommendation based on topic of interest
JP2022174072A JP2023108590A (en) 2022-01-25 2022-10-31 Method, system, and computer program for personalized recommendation based on topic of interest

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220010593A KR20230114440A (en) 2022-01-25 2022-01-25 Method, system, and computer program for personalized recommendation based on topic of interest

Publications (1)

Publication Number Publication Date
KR20230114440A true KR20230114440A (en) 2023-08-01

Family

ID=87475250

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220010593A KR20230114440A (en) 2022-01-25 2022-01-25 Method, system, and computer program for personalized recommendation based on topic of interest

Country Status (2)

Country Link
JP (1) JP2023108590A (en)
KR (1) KR20230114440A (en)

Also Published As

Publication number Publication date
JP2023108590A (en) 2023-08-04

Similar Documents

Publication Publication Date Title
Ni et al. Perceive your users in depth: Learning universal user representations from multiple e-commerce tasks
KR101778679B1 (en) Method and system for classifying data consisting of multiple attribues represented by sequences of text words or symbols using deep learning
US11216509B2 (en) Dynamic faceting for personalized search and discovery
Malhotra et al. An intelligent approach to design of E-Commerce metasearch and ranking system using next-generation big data analytics
KR20180121466A (en) Personalized product recommendation using deep learning
RU2725659C2 (en) Method and system for evaluating data on user-element interactions
JP2021140716A (en) Method and apparatus for providing recommended item based on selection for item
KR20210018384A (en) Method and system of real-time graph-based embedding for personalized content recommendation
Jiang et al. Cloud service recommendation based on unstructured textual information
US20190019233A1 (en) Real time recommendation engine
US9767204B1 (en) Category predictions identifying a search frequency
CN108153909B (en) Keyword putting word-expanding method and device, electronic equipment and storage medium
US11531655B2 (en) Automatically improving data quality
US20210326494A1 (en) Automatically and intelligently exploring design spaces
US11659247B2 (en) Systems and methods for evaluating models that generate recommendations
Fletcher A quality-based web api selection for mashup development using affinity propagation
US10474670B1 (en) Category predictions with browse node probabilities
CN111339406A (en) Personalized recommendation method, device, equipment and storage medium
Lytvyn et al. An Intelligent System of the Content Relevance at the Ex-ample of Films According to User Needs
US10387934B1 (en) Method medium and system for category prediction for a changed shopping mission
JP2023162154A (en) Method, computer device and computer program for providing recommendation information based on local knowledge graph
CN115618126A (en) Search processing method, system, computer readable storage medium and computer device
US20190019217A1 (en) Group formation and recommendations based on trigger events
KR20230114440A (en) Method, system, and computer program for personalized recommendation based on topic of interest
Li et al. The media-oriented cross domain recommendation method