KR101925950B1 - Method and device for recommending contents based on inflow keyword and relevant keyword for contents - Google Patents

Method and device for recommending contents based on inflow keyword and relevant keyword for contents Download PDF

Info

Publication number
KR101925950B1
KR101925950B1 KR1020160179331A KR20160179331A KR101925950B1 KR 101925950 B1 KR101925950 B1 KR 101925950B1 KR 1020160179331 A KR1020160179331 A KR 1020160179331A KR 20160179331 A KR20160179331 A KR 20160179331A KR 101925950 B1 KR101925950 B1 KR 101925950B1
Authority
KR
South Korea
Prior art keywords
content
search
candidate
contents
word
Prior art date
Application number
KR1020160179331A
Other languages
Korean (ko)
Other versions
KR20180075234A (en
Inventor
성인재
Original Assignee
주식회사 카카오
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 카카오 filed Critical 주식회사 카카오
Priority to KR1020160179331A priority Critical patent/KR101925950B1/en
Publication of KR20180075234A publication Critical patent/KR20180075234A/en
Application granted granted Critical
Publication of KR101925950B1 publication Critical patent/KR101925950B1/en

Links

Images

Classifications

    • G06F17/3064
    • G06F17/30867

Abstract

본 발명에 따르는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법은, (a) 컨텐츠 추천장치에 접속하여 컨텐츠 검색을 수행한 사용자들의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록을 기초로, 각 컨텐츠에 대한 유입검색어를 추출하는 단계; (b) 후보 컨텐츠들의 유입검색어들을 식별한 후, 상기 식별된 유입검색어를 기준으로 상기 후보 컨텐츠들을 정렬함으로써 역색인 정보를 생성하는 단계; 및 (c) 타겟 사용자의 단말의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 추출한 유입검색어와 상기 역색인 정보에 포함된 후보 컨텐츠의 유입검색어 간의 관심도에 관한 점수를 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 단계를 포함하며,상기 컨텐츠에 대한 유입검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 전 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드이다.According to the present invention, there is provided a content recommendation method based on an influential search term for content, comprising the steps of: (a) selecting, based on a search record of users who accessed the content recommendation apparatus, Extracting an inflow search term for the keyword; (b) generating reverse index information by sorting the candidate contents based on the identified input query word after identifying influent search words of candidate contents; And (c) calculating scores of interest between the input search word extracted from the search record of the target user's terminal and the selection input record of the search result content and the influential search word of the candidate content included in the inverse index information, Wherein the input search word for the content includes at least one of a search window input keyword received from the content recommendation device and a search keyword input keyword received from the content recommendation device before receiving the user input for the link information of the content, to be.

Description

컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치{METHOD AND DEVICE FOR RECOMMENDING CONTENTS BASED ON INFLOW KEYWORD AND RELEVANT KEYWORD FOR CONTENTS}[0001] METHOD AND APPARATUS FOR RECOMMENDING CONTENTS [0002] BASED ON INFLOW KEYWORD AND RELEVANT KEYWORD FOR CONTENTS [

본 발명은 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a content recommendation method and recommendation apparatus based on an input search word and an associated search term for contents.

인터넷 기술의 발전에 따라, 최근에는 포털 사이트 등과 같은 검색엔진에 사용자의 관심사와 대응하는 컨텐츠의 추천기술이 많이 적용되어 있다. Recently, according to the development of Internet technology, a recommendation technique of contents corresponding to user's interest is applied to a search engine such as a portal site.

종래의 컨텐츠 추천기술 중 하나는 서버에 접속한 타겟 사용자에게 비슷한 기호를 가지는 다른 다수의 사용자들이 많이 조회한 컨텐츠를 기준으로 추천하는 협업필터링(collaborative filtering)이다. 주로 비슷한 기호를 가지는 다수의 사용자들의 관심사를 반영하기 때문에, 타겟 사용자의 관심사와 일치할 확률이 높기는 하나, 타겟 사용자의 관심사를 직접 반영하지 않기 때문에 지속적인 관심을 갖는 특정 주제의 컨텐츠에 대해 추천 받기 원하는 사용자를 만족시키기는 어렵다. One of the conventional content recommendation techniques is collaborative filtering in which a target user connected to the server is recommended based on contents viewed by many other users having similar symbols. Because it reflects the interests of many users with similar preferences, it is likely to match the interests of the target user, but it does not directly reflect the interests of the target user. It is difficult to satisfy a desired user.

한편, 종래의 다른 컨텐츠 추천기술에 따르면, 사용자가 조회한 컨텐츠의 텍스트와 추천후보 군에 속한 컨텐츠들의 텍스트들을 분석하여, 추천후보 군 중 매칭된 컨텐츠를 사용자에게 추천하는 기술이 있다. 그러나, 이러한 기술의 경우, 텍스트 분석의 상대적인 정확도가 떨어지기 때문에 항상 사용자의 관심사에 맞는 컨텐츠가 제공될 수 없으며, 그 분석과정에 있어서 상당한 부하가 소요된다는 문제점이 있다. Meanwhile, according to another conventional content recommendation technique, there is a technique of analyzing the text of the content searched by the user and the texts of the contents belonging to the recommendation candidate group, and recommending matched contents among the recommended candidate groups to the user. However, in the case of this technique, since the relative accuracy of the text analysis is lowered, it is not always possible to provide contents suitable for the user's interest, and a considerable load is required in the analysis process.

한국 공개특허공보 제10-2016-01216878호 (2016.10.20 공개)Korean Patent Laid-Open Publication No. 10-2016-01216878 (published Oct. 20, 2016)

본 발명은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 컨텐츠에 대한 유입검색어를 기초로 사용자에게 컨텐츠를 추천해주는 기술을 제공하는 것을 목적으로 한다. It is an object of the present invention to provide a technique for recommending contents to a user on the basis of an input search word for contents.

나아가, 본 발명은 유입검색어 뿐만 아니라 컨텐츠에 대한 연관검색어까지 고려하여 사용자에게 컨텐츠를 추천해주는 기술을 제공하는 것을 목적으로 한다. It is another object of the present invention to provide a technique for recommending contents to a user in consideration of not only an incoming search word but also an associated search term for the content.

본 발명의 일 실시예에 따르는, 컨텐츠 추천장치에 의해 수행되는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법은, (a) 컨텐츠 추천장치에 접속하여 컨텐츠 검색을 수행한 사용자들의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록을 기초로, 각 컨텐츠에 대한 유입검색어를 추출하는 단계; (b) 후보 컨텐츠들의 유입검색어들을 식별한 후, 상기 식별된 유입검색어를 기준으로 상기 후보 컨텐츠들을 정렬함으로써 역색인 정보를 생성하는 단계; 및 (c) 타겟 사용자의 단말의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 추출한 유입검색어와 상기 역색인 정보에 포함된 후보 컨텐츠의 유입검색어 간의 관심도에 관한 점수를 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 단계를 포함하며,상기 컨텐츠에 대한 유입검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 전 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드이다.According to an embodiment of the present invention, a content recommendation method based on an influential search term for content, which is performed by a content recommendation apparatus, includes the steps of: (a) Extracting an influential search word for each content based on a selection input record for the content; (b) generating reverse index information by sorting the candidate contents based on the identified input query word after identifying influent search words of candidate contents; And (c) calculating scores of interest between the input search word extracted from the search record of the target user's terminal and the selection input record of the search result content and the influential search word of the candidate content included in the inverse index information, Wherein the input search word for the content includes at least one of a search window input keyword received from the content recommendation device and a search keyword input keyword received from the content recommendation device before receiving the user input for the link information of the content, to be.

본 발명의 다른 실시예에 따르는, 컨텐츠 추천장치에 의해 수행되는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법은, (a) 컨텐츠 추천장치에 접속하여 컨텐츠 검색을 수행한 사용자들의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록을 기초로, 각 컨텐츠에 대한 유입검색어 및 연관검색어를 추출하는 단계; (b) 후보 컨텐츠들의 유입검색어들 및 연관검색어들을 식별한 후, 상기 식별된 유입검색어들 및 연관검색어들을 기준으로 상기 후보 컨텐츠들을 정렬함으로써 역색인 정보를 생성하는 단계; 및 (c) 타겟 사용자의 단말의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 추출한 유입검색어와 연관검색어 및 상기 역색인 정보에 포함된 후보 컨텐츠의 유입검색어와 연관검색어 간의 관심도에 관한 점수를 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 단계를 포함하며, 상기 컨텐츠에 대한 유입검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 바로 직전에 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드이고, 상기 컨텐츠에 대한 연관검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 전 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드 중 상기 유입검색어를 제외한 나머지 검색어이다. According to another embodiment of the present invention, a content recommendation method based on an influential search term for content, which is performed by a content recommendation apparatus, includes: (a) a search history of users who access the content recommendation apparatus, Extracting an influential search word and an associated search term for each content based on a selection input record for the content; (b) generating inverse index information by identifying influent search terms and associated search terms of candidate content, and then sorting the candidate content based on the identified influent search terms and associated search terms; And (c) calculating a score related to the interest between the influent search word extracted from the search history of the terminal of the target user and the selection input record of the search result content, the related search word extracted from the input search term, and the influent search word included in the inverse index information, Selecting candidate content among the candidate contents and providing the selected candidate content to the terminal of the target user, wherein the influent search word for the content includes a recommendation of the content recommendation right before receiving the user input for the link information of the content, And the related search word for the content is a search word excluding the input search word among the search window input keywords received by the content recommendation apparatus before receiving the user input for the link information of the content .

본 발명의 또 다른 실시예에 따르는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천장치는, 상기 컨텐츠 추천장치에 접속하여 컨텐츠 검색을 수행한 사용자들의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록을 기초로, 각 컨텐츠에 대한 유입검색어를 추출하는 컨텐츠 검색어 추출부; 후보 컨텐츠들의 유입검색어들을 식별한 후, 상기 식별된 유입검색어를 기준으로 상기 후보 컨텐츠들을 정렬함으로써 역색인 정보를 생성하는 역색인 생성부; 및 타겟 사용자의 단말의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 추출한 유입검색어와 상기 역색인 정보에 포함된 후보 컨텐츠의 유입검색어 간의 관심도에 관한 점수를 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 추천 컨텐츠 제공부를 포함하며, 상기 컨텐츠에 대한 유입검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 전 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드이다.According to another embodiment of the present invention, a content recommendation apparatus based on an influential search term for content may further include a content recommendation apparatus for recommending content based on a search record of users who accessed the content recommendation apparatus, A content query extracting unit for extracting an influential search word for each content; An inverse index generating unit for generating inverse index information by sorting the candidate contents based on the identified influent search word after identifying influent search words of candidate contents; And calculating a score of interest between the input search word extracted from the search record of the terminal of the target user and the selection input record of the search result content and the influential search word of the candidate content included in the inverse index information, And a recommendation content providing unit for providing the selected content to the terminal of the target user, wherein the influent search word for the content is a search window input keyword received by the content recommendation apparatus before receiving the user input for the link information of the content .

본 발명의 또 다른 실시예에 따르는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천장치는, 상기 컨텐츠 추천장치에 접속하여 컨텐츠 검색을 수행한 사용자들의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록을 기초로, 각 컨텐츠에 대한 유입검색어 및 연관검색어를 추출하는 컨텐츠 검색어 추출부; 후보 컨텐츠들의 유입검색어들 및 연관검색어들을 식별한 후, 상기 식별된 유입검색어들 및 연관검색어들을 기준으로 상기 후보 컨텐츠들을 정렬함으로써 역색인 정보를 생성하는 역색인 생성부; 및 타겟 사용자의 단말의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 추출한 유입검색어와 연관검색어 및 상기 역색인 정보에 포함된 후보 컨텐츠의 유입검색어와 연관검색어 간의 관심도에 관한 점수를 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 추천 컨텐츠 제공부를 포함하며, 상기 컨텐츠에 대한 유입검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 바로 직전에 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드이고, 상기 컨텐츠에 대한 연관검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 전 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드 중 상기 유입검색어를 제외한 나머지 검색어이다. According to another embodiment of the present invention, a content recommendation apparatus based on an influential search term for content may further include a content recommendation apparatus for recommending content based on a search record of users who accessed the content recommendation apparatus, A content search term extraction unit for extracting an influent search term and an associated search term for each content; An inverse index generating unit for generating inverse index information by sorting the candidate contents based on the identified influent search terms and related search terms after identifying influent search terms and related search terms of candidate contents; And calculating a score of an influential search word and an associated search term extracted from a selective input record of a search result of the terminal of the target user and a search result of the search result, and a score of an interest between an influential search word and an associated search word of candidate content included in the inverse index information, And a recommended content providing unit for providing recommended content among the candidate contents to the terminal of the target user, wherein the incoming search word for the content includes a content recommendation message And the related search term for the content is a search term other than the influent term among the search window input keywords received by the content recommendation apparatus before receiving the user input for the link information of the content.

본 발명은 컨텐츠에 대한 유입검색어 및 연관검색어와 타겟 사용자의 프로파일 벡터를 기초로 컨텐츠를 추천해줌에 따라, 사용자의 관심사를 정확히 파악할 수 있고, 이를 기초로 사용자의 관심사에 맞는 정확한 컨텐츠를 제공해줄 수 있다. According to the present invention, contents are recommended based on an influential search word and an associated search word for a content and a profile vector of a target user, so that it is possible to accurately grasp a user's interest and provide accurate contents according to the user's interest have.

또한, 컨텐츠를 구성하는 텍스트들을 분석하지 않고, 단순히 유입검색어와 연관검색어를 기초로 컨텐츠를 추천하므로, 종래의 기술보다 더욱 서버의 부하를 줄일 수 있다. In addition, since the content is recommended based on the input search word and the related search term simply without analyzing the texts constituting the content, the load on the server can be further reduced compared to the conventional technique.

도 1은 본 발명의 일 실시예에 따르는 시스템의 구조도이다.
도 2는 본 발명의 일 실시예에 따르는 컨텐츠 추천장치의 구성에 대한 블록도이다.
도 3은 본 발명의 일 실시예에 따르는 컨텐츠에 대한 유입검색어와 연관검색어의 의미를 설명하기 위한 개념도이다.
도 4는 본 발명의 일 실시예에 따르는 컨텐츠 별로 생성될 수 있는 주제어 프로파일 벡터들과 연관어 프로파일 벡터의 예시를 나타내는 개념도이다.
도 5는 본 발명의 일 실시예에 따라, 유입검색어 또는 연관검색어를 기준으로 컨텐츠들을 정렬하여 나타내는 역색인 정보의 예시를 나타내는 개념도이다.
도 6은 본 발명의 일 실시예에 따라, 타겟 사용자의 프로파일 벡터를 이용하여 주제어 기반 추천 컨텐츠와 연관어 기반 추천 컨텐츠를 추출하는 과정을 개념적으로 나타낸 개념도이다.
도 7은 본 발명의 일 실시예에 따르는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법을 설명하기 위한 순서도이다.
1 is a structural diagram of a system according to an embodiment of the present invention.
2 is a block diagram of a configuration of a content recommendation apparatus according to an embodiment of the present invention.
FIG. 3 is a conceptual diagram for explaining the meaning of an input search word and an associated search word for content according to an embodiment of the present invention.
4 is a conceptual diagram illustrating an example of profile profile vectors and association profile vectors that can be generated for each content according to an exemplary embodiment of the present invention.
FIG. 5 is a conceptual diagram illustrating an example of inverse index information that sorts and represents contents based on an input search word or an associated search word, according to an embodiment of the present invention.
FIG. 6 is a conceptual view conceptually illustrating a process of extracting keyword-based recommendation content and association-based recommendation content using a profile vector of a target user according to an embodiment of the present invention.
FIG. 7 is a flowchart illustrating a content recommendation method based on an influential search term for content according to an exemplary embodiment of the present invention. Referring to FIG.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings, which will be readily apparent to those skilled in the art. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In order to clearly illustrate the present invention, parts not related to the description are omitted, and similar parts are denoted by like reference characters throughout the specification.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.Throughout the specification, when a part is referred to as being "connected" to another part, it includes not only "directly connected" but also "electrically connected" with another part in between . Also, when an element is referred to as " comprising ", it means that it can include other elements as well, without departing from the other elements unless specifically stated otherwise.

본 명세서에 있어서 '부(部)'란, 하드웨어에 의해 실현되는 유닛(unit), 소프트웨어에 의해 실현되는 유닛, 양방을 이용하여 실현되는 유닛을 포함한다. 또한, 1 개의 유닛이 2 개 이상의 하드웨어를 이용하여 실현되어도 되고, 2 개 이상의 유닛이 1 개의 하드웨어에 의해 실현되어도 된다. 한편, '~부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, '~부'는 어드레싱 할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '~부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '~부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '~부'들로 결합되거나 추가적인 구성요소들과 '~부'들로 더 분리될 수 있다. 뿐만 아니라, 구성요소들 및 '~부'들은 디바이스 또는 보안 멀티미디어카드 내의 하나 또는 그 이상의 CPU들을 재생시키도록 구현될 수도 있다.In this specification, the term " part " includes a unit realized by hardware, a unit realized by software, and a unit realized by using both. Further, one unit may be implemented using two or more hardware, or two or more units may be implemented by one hardware. On the other hand, 'to' is not limited to software or hardware, 'to' may be configured to be an addressable storage medium, and may be configured to play one or more processors. Thus, by way of example, 'parts' may refer to components such as software components, object-oriented software components, class components and task components, and processes, functions, , Subroutines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays, and variables. The functions provided in the components and components may be further combined with a smaller number of components and components or further components and components. In addition, the components and components may be implemented to play back one or more CPUs in a device or a secure multimedia card.

이하에서 언급되는 "사용자 단말"은 네트워크를 통해 서버나 타 단말에 접속할 수 있는 컴퓨터나 휴대용 단말기로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop) 등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, 스마트폰(smart phone), 태블릿 PC, 웨어러블 디바이스뿐만 아니라, 블루투스(BLE, Bluetooth Low Energy), NFC, RFID, 초음파(Ultrasonic), 적외선, 와이파이(WiFi), 라이파이(LiFi) 등의 통신 모듈을 탑재한 각종 디바이스를 포함할 수 있다. The " user terminal " mentioned below may be implemented as a computer or a portable terminal capable of accessing a server or other terminal through a network. Here, the computer includes, for example, a notebook computer, a desktop computer, a laptop computer, and the like, each of which is equipped with a web browser (WEB Browser), and the portable terminal may be a wireless communication device (BLE, Bluetooth Low Energy), NFC, RFID, Ultrasonic, Infrared, WiFi, and LiFi as well as smart phones, tablet PCs and wearable devices. And may include various devices mounted thereon.

"네트워크"는 단말들 및 서버들과 같은 각각의 노드 상호 간에 정보 교환이 가능한 연결 구조를 의미하는 것으로, 근거리 통신망(LAN: Local Area Network), 광역 통신망(WAN: Wide Area Network), 인터넷 (WWW: World Wide Web), 유무선 데이터 통신망, 전화망, 유무선 텔레비전 통신망 등을 포함한다. 무선 데이터 통신망의 일례에는 3G, 4G, 5G, 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), WIMAX(World Interoperability for Microwave Access), 와이파이(Wi-Fi), 블루투스 통신, 적외선 통신, 초음파 통신, 가시광 통신(VLC: Visible Light Communication), 라이파이(LiFi) 등이 포함되나 이에 한정되지는 않는다.The term " network " means a connection structure in which information can be exchanged between each node such as terminals and servers, and includes a local area network (LAN), a wide area network (WAN) : World Wide Web), wired / wireless data communication network, telephone network, wired / wireless television communication network, and the like. Examples of wireless data communication networks include 3G, 4G, 5G, 3GPP, LTE, WIMAX, Wi-Fi, Bluetooth, infrared, Communications, Visible Light Communication (VLC), LiFi, and the like.

이하 도면을 참조하여, 본 발명의 일 실시예를 구체적으로 설명하도록 한다. Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.

도 1을 참조하면, 본 발명의 일 실시예에 따르는 시스템은 사용자 단말(100) 및 서버(200)를 포함한다. Referring to FIG. 1, a system according to an embodiment of the present invention includes a user terminal 100 and a server 200.

서버(200)는 포털 사이트 등에서 제공되는 검색엔진(즉, 임의의 검색어에 대해 온라인 상에 개재된 모든 컨텐츠들 중 대응하는 컨텐츠를 검색결과로 제공해주는 서비스)을 운영하는 서버(200)일 수 있다. 서버(200)는 컨텐츠에 대한 유입검색어 기반으로 컨텐츠를 추천하는 장치를 의미할 수도 있다. The server 200 may be a server 200 operating a search engine provided in a portal site or the like (i.e., a service for providing corresponding contents among all the contents interposed on the online for an arbitrary search word) . The server 200 may also refer to a device that recommends content based on an entry query for content.

즉, 사용자 단말(100)이 화면 상에서 임의의 검색어를 입력할 경우, 사용자 단말(100)에서 서버(200)로 검색어에 관한 쿼리가 전송되고, 서버(200)는 그에 대응하는 컨텐츠들을 사용자 단말(100)로 전송할 수 있다. That is, when the user terminal 100 inputs an arbitrary search term on the screen, the query related to the search term is transmitted from the user terminal 100 to the server 200, and the server 200 transmits the corresponding contents to the user terminal 100).

이러한 과정에 있어서, 사용자 단말(100)이 검색엔진의 검색창에 입력한 검색어는 사용자 단말(100)의 쿠키(cookie)에 기록되거나 서버(200)에 기록될 수 있다. 그리고, 서버(200)는 사용자 단말(100)에서 입력된 컨텐츠에 대한 검색어들을 추출하여 사용자의 관심정보를 정확하게 도출할 수 있으며, 기존의 컨텐츠들 중 사용자의 관심정보와 매칭되는 컨텐츠들을 선정하여 사용자 단말(100)로 추천 컨텐츠로서 제공할 수 있다. In this process, the search term entered by the user terminal 100 into the search window of the search engine may be recorded in the cookie of the user terminal 100 or may be recorded in the server 200. The server 200 can extract the search terms of the content input from the user terminal 100 to accurately derive the user's interest information and select contents matching the user's interest information among the existing contents, And can be provided as recommended content to the terminal 100.

본 발명의 일 실시예는 추천 컨텐츠를 제공함에 있어, 사용자 단말(100)에서 입력된 컨텐츠에 대한 유입검색어와 연관검색어를 기초로 추천 컨텐츠를 선정하며, 이에 대한 자세한 동작과정은 아래에서 구체적으로 설명하도록 한다. In one embodiment of the present invention, the recommendation contents are selected based on an input search word and an associated search term for the contents input from the user terminal 100 in providing the recommendation contents, .

본 발명의 일 실시예에 따르는 서버(200)는 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법을 수행하기 위한 프로그램(또는 애플리케이션)이 저장된 메모리와 위 프로그램을 실행하는 프로세서를 포함하여 구성될 수 있다. 여기서 프로세서는 메모리에 저장된 프로그램의 실행에 따라 다양한 기능을 수행할 수 있는데, 각 기능에 따라 프로세서에 포함되는 세부 모듈들을 도 2와 같이, 컨텐츠 검색어 추출부(210), 타겟 사용자 정보 추출부(220), 역색인 생성부(230) 및 추천 컨텐츠 제공부(240)로 나타낼 수 있다. The server 200 according to an exemplary embodiment of the present invention may be configured to include a processor that executes a program and a memory in which a program (or an application) for performing a content recommendation method based on an input query based on content is stored. Here, the processor may perform various functions according to the execution of the program stored in the memory. As shown in FIG. 2, the detailed modules included in the processor are classified into a content query extracting unit 210, a target user information extracting unit 220 ), An inverse index generator 230, and a recommended content provider 240.

컨텐츠 검색어 추출부(210)는 서버(200)에 접속하여 컨텐츠 검색을 수행한 사용자들의 검색기록과 그 검색기록에 수반하여 검색결과로 제공된 컨텐츠들을 선택 입력(예를 들어, 클릭)한 기록을 기초로, 각 컨텐츠에 대한 유입검색어와 연관검색어를 추출한다. The content query term extracting unit 210 extracts a search record of users who have accessed the server 200 and have performed content search, and a record of selecting and inputting (e.g., clicking) the content provided as a search result along with the search record And extracts an influential search term and an associated search term for each content.

여기서 컨텐츠에 대한 유입검색어란, 컨텐츠로 직접적으로 유입하게 만든 키워드로서, 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 바로 직전에 서버(200)에서 수신한 검색창 입력 키워드를 의미한다. 다르게 말하면, "특허"라는 키워드를 검색엔진의 검색창에 입력한 후, 표시된 검색결과들 중 특정 컨텐츠의 링크에 대한 사용자의 선택 입력(예를 들면, 클릭, 터치)이 발생하였다면 위의 "특허"라는 키워드가 특정 컨텐츠의 유입검색어가 될 수 있다. Herein, an influent search term for content means a keyword entered directly into the content, which means a search window input keyword received by the server 200 right before receiving a user input for link information of the content. In other words, after the user inputs a keyword "patent" into the search window of the search engine and a user's selection input (eg, click and touch) on the link of the specific content among the displayed search results occurs, &Quot; may be an influent search word of a specific content.

컨텐츠에 대한 연관검색어란, 컨텐츠로의 유입에 간접적으로 관여한 키워드로서, 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 전 서버(200)에서 수신한 검색창 입력 키워드 중 해당 유입검색어를 제외한 나머지 검색어를 의미한다. 이 나머지 검색어는 통상적으로 한 세션(예를 들어, 사용자가 서버(200)에 의한 검색엔진 서비스에 접속한 후 벗어나기 전까지의 활동구간) 내에서 입력된 검색어들을 의미한다. 다르게 말하면, "변리사", "상표"와 같은 키워드를 검색창에 입력하면서 웹 서핑을 수행하다가 "특허"라는 키워드를 입력한 후 특정 컨텐츠의 링크에 대한 사용자의 클릭이 발생하였다면, "변리사", "상표"는 특정 컨텐츠에 대한 연관검색어가 될 수 있다. 또는, 사용자가 "상표"를 검색한 후, 임의의 컨텐츠와 관련된 링크를 클릭한 뒤, 해당 페이지 내에 개재된 특정 컨텐츠의 링크를 클릭하였다면, "상표"가 특정 컨텐츠의 연관검색어가 될 수 있다. The related search term for the content is a keyword indirectly involved in the flow of the content, and is a keyword that is input before the user input for the link information of the content, . This remaining search term usually refers to search terms input in one session (for example, an activity interval before the user leaves the search engine service by server 200). In other words, if a user clicks on a link of a specific content after inputting a keyword "patent" while performing a web surfing while inputting keywords such as "patent attorney" and "trademark" in a search window, "patent attorney" A " trademark " may be an associated search term for a particular content. Alternatively, if a user searches for a " trademark ", clicks a link related to an arbitrary content, and then clicks a link of a specific content placed in the page, the " trademark "

예를 들어, 도 3을 참조하면, 사용자들이 하단의 컨텐츠('양상문이 옳았다'는 제목의 기사)로 유입되기 바로 직전에 입력한 키워드가 "LG 트윈스", "양상문", "LG"였다면, 이들 키워드가 그 컨텐츠에 대한 유입검색어가 된다. 한편, 유입검색어를 입력하기 전 "기아타이거즈", "와일드카드", "포스트시즌" 등의 키워드가 검색창에 입력되었다면, 이들 키워드가 그 컨텐츠에 대한 연관검색어가 된다. For example, referring to FIG. 3, if the keywords input by the users immediately before entering the bottom content (the article titled "The sentence is correct") were "LG Twins", " These keywords become influent search words for the content. On the other hand, if keywords such as " Kia Tigers ", " wild card ", and " post season " are input into the search window before inputting the influent search word,

컨텐츠 검색어 추출부(210)는 사용자 단말(100)이나 서버(200)에 기록된 사용자들의 로그정보들을 기초로 사용자들의 검색기록을 파악할 수 있다. 검색기록을 기초로 사용자가 어떤 컨텐츠를 조회하였으며, 검색창에 어떤 키워드를 입력하였는지 파악할 수 있다. The content search term extraction unit 210 can grasp the search history of the users based on the log information of the users recorded in the user terminal 100 or the server 200. [ Based on the search history, it is possible to grasp what contents the user has viewed and which keyword is entered in the search window.

이어서, 컨텐츠 검색어 추출부(210)는 유입검색어에 대한 주제어 프로파일 벡터를 생성하고, 연관검색어에 대한 연관어 프로파일 벡터를 생성한다. 유입검색어는 그 컨텐츠를 유입하는 데에 직접적인 기여를 한 키워드이므로, 다르게 해석하면 그 컨텐츠의 주제어라고도 할 수 있다. Next, the content query term extraction unit 210 generates a main keyword profile vector for the incoming query word and generates a related word profile vector for the associated keyword word. Since the influent query is a keyword that directly contributes to the influx of the content, it can be said as a main word of the content if interpreted differently.

예를 들어, 도 4와 같이, 어느 한 컨텐츠에 대해서는 다수의 유입검색어와 다수의 연관검색어가 도출될 수 있다. 이때, 각 사용자마다 그 컨텐츠에 대한 유입검색어와 연관검색어가 무엇인지 찾고, 얼마나 많은 사용자들이 특정 유입검색어 또는 특정 연관검색어를 활용했는지 여부에 따라 주제어 프로파일 벡터와 연관어 프로파일 벡터의 값이 다르게 결정될 수 있다. 도 4에서는 도시된 컨텐츠('양상문이 옳았다'는 제목의 기사)에 대해서는 "LG 트윈스"가 가장 높은 주제어 프로파일 벡터의 값을 가지며, "와일드카드"가 가장 높은 연관어 프로파일 벡터의 값을 가지는 것으로 나타나 있다. For example, as shown in FIG. 4, a plurality of influent search words and a plurality of related search words can be derived for any content. At this time, the value of the associative profile vector may be determined differently depending on whether each user has an influent search word and an associated search word for the content, and how many users have utilized a specific influent search word or a specific related search word have. In FIG. 4, the "LG Twins" has the highest value of the subject keyword profile vector and the "wildcard" has the highest value of the association profile vector for the content shown in the figure (the article titled " Is shown.

컨텐츠 검색어 추출부(210)는, 최근 미리 설정된 기간 동안 사용자의 클릭이 발생한 컨텐츠를 선정하고, 선정된 컨텐츠에 대한 복수의 유입검색어와 연관검색어들 중 입력 횟수가 가장 높은 순위 별로 또는 상위 몇 개의 유입검색어와 연관검색어들에 대해서 주제어 및 연관어 프로파일 벡터를 생성할 수 있다. 컨텐츠 검색어 추출부(210)는 모든 컨텐츠 검색어에 대해 동일한 값을 설정하거나, 해당 컨텐츠 검색어의 클릭 유입수를 기초로 하거나 아래와 같은 수학식 1을 이용하여 벡터를 생성하고, 유닛 벡터(크기가 1인 벡터)로 정규화(노멀라이징)하여 최종적인 벡터값을 산정할 수 있다. The content search term extraction unit 210 selects the content in which a user's click has occurred for a predetermined period of time in advance and searches for the content having the highest input count among the plurality of influent search terms related to the selected content and the related search terms, It is possible to generate a keyword and associate profile vector for the search term and related search term. The content search term extracting unit 210 sets the same value for all of the content search terms or generates a vector based on the click inflow number of the content search term or using Equation 1 as below, ) To normalize (normalize) the final vector value.

[수학식 1][Equation 1]

Figure 112016127524147-pat00001
Figure 112016127524147-pat00001

위 수학식1에서, clickskwd ^contents 는 특정 유입검색어 또는 연관검색어의 입력후 타겟 컨텐츠에 대한 클릭이 발생된 횟수를 의미하고, clicks total 는 최근 미리 설정된 기간동안 검색 결과로 노출된 모든 컨텐츠에 대한 전체 클릭수를 의미하고, clicks kwd 는 특정 유입검색어 또는 연관검색어에 대한 입력후 임의의 컨텐츠 클릭이 발생된 횟수를 의미하고, clicks contents 는 검색 결과로 노출된 타겟 컨텐츠에 대한 전체 클릭수를 의미한다.In the equation (1), clicks kwd ^ contents means the number of times a click is generated on a target content after inputting a specific input query or an associated search word, and clicks total indicates a number of times Means all clicks, clicks kwd is the number of times that an arbitrary content click occurs after inputting a specific input query or an associated search word, and clicks contents is the total number of clicks of the target content exposed as a search result.

이때, "클릭수"는 현재로부터 일정기간 전까지의 과거에 대해 집계한 결과 내에서 산정된다. 한편, "클릭수"를 "클릭한 사용자 수"로 대체할 경우, 동일 사용자의 반복 행동에 의한 값을 제거할 수 있다. At this time, the " clicks " is calculated within the result of counting the past from a certain period to the present. On the other hand, when the " number of clicks " is replaced with " number of users who click ", the value due to the repeat action of the same user can be removed.

타겟 사용자 정보 추출부(220)는 타겟 사용자의 프로파일 벡터를 생성한다. 예를 들어, 타겟 사용자 정보 추출부(220)는 타켓 사용자의 단말에서 일정기간동안 조회됐던 컨텐츠들의 주제어 프로파일 벡터들을 더하여 타겟 사용자의 프로파일 벡터를 생성한다. 타겟 사용자 정보 추출부(220)는 소정기간 동안의 타겟 사용자 단말의 검색기록과 과 그 검색기록에 수반하여 검색결과로 제공된 컨텐츠들을 선택 입력한 기록을 기초로 사용자가 조회한 컨텐츠들과 그 컨텐츠들의 유입검색어를 파악할 수 있으며, 파악된 유입검색어에 대응하는 주제어 프로파일 벡터들을 식별한다. 또한, 유입검색어가 너무 많은 경우, 해당 벡터항의 스칼라 값이 높은 상위 몇 개의 유입검색어만 타겟 사용자 프로파일 벡터로 구성되도록 할 수도 있다. 예를 들어, 타겟 사용자 프로파일 벡터는 도 6에 도시된 프로파일 벡터와 같이 구성될 수 있다. The target user information extracting unit 220 generates a profile vector of the target user. For example, the target user information extractor 220 adds the main subject profile vectors of the contents that have been searched for a predetermined period at the target user's terminal, thereby generating a profile vector of the target user. The target user information extracting unit 220 extracts the contents retrieved by the user based on the retrieval record of the target user terminal for a predetermined period and the records obtained by selecting and inputting the contents provided as the retrieval result along with the retrieval records, The inflow search word can be grasped, and the keyword profiles corresponding to the inflow search word identified are identified. In addition, if the incoming query is too large, only the top few influent queries with high scalar values of the vector terms may be configured as the target user profile vector. For example, the target user profile vector may be configured as the profile vector shown in FIG.

한편, 추가 실시예로서, 타겟 사용자 정보 추출부(220)는 컨텐츠의 연관검색어를 추출하고, 연관어 프로파일 벡터를 생성하여, 유입검색어와 연관검색어를 함께 포함하는 타겟 사용자 프로파일 벡터를 구성할 수도 있다. Meanwhile, as a further embodiment, the target user information extracting unit 220 may extract an associated search word of the content, generate a related-word profile vector, and configure a target user profile vector including the input query and the associated query .

역색인 생성부(230)는 주제어 프로파일 벡터 상의 유입검색어들 또는 연관어 프로파일 벡터 상의 연관검색어들을 기준으로 후보 컨텐츠들이 정렬된 역색인정보를 생성할 수 있다.The inverse index generator 230 may generate inverse index information in which the candidate contents are sorted based on the influential search words on the main keyword profile vector or the related search words on the related word profile vector.

구체적으로, 역색인 생성부(230)는 현재로부터 미리 설정된 기간 내에 생성된 컨텐츠들을 후보 컨텐츠들로 필터링한다. 이때의 미리 설정된 기간은 타겟 사용자의 프로파일 벡터를 도출하기 위해 타겟 사용자가 조회한 컨텐츠를 검색하기 위해 설정되는 기간보다 작을 수 있다. 이때, 역색인 생성부(230)는 컨텐츠의 카테고리 별로 상기 미리 설정된 기간을 다르게 설정하여 상기 후보 컨텐츠들을 필터링할 수 있다. 예를 들어, 뉴스와 같이 시의성이 중요한 컨텐츠의 경우, 최근 몇시간 이내의 컨텐츠들로 필터링할 수 있으며, 블로그나 소셜미디어 등과 같은 그 밖의 컨텐츠의 경우 일(day) 또는 주(week) 단위의 컨텐츠들로 필터링할 수 있다. Specifically, the inverse index generator 230 filters the contents generated within a predetermined period from the current time as candidate contents. In this case, the preset period may be shorter than the period set for searching for the content viewed by the target user in order to derive the profile vector of the target user. At this time, the inverse index generator 230 may filter the candidate contents by setting the predetermined period differently for each category of contents. For example, content that is important in terms of time, such as news, can be filtered by content within the last few hours. In the case of other contents such as a blog or social media, content of a day or week . ≪ / RTI >

이어서, 역색인 생성부(230)는 후보 컨텐츠의 주제어 프로파일 벡터와 연관어 프로파일 벡터를 색인한다. 후보 컨텐츠의 주제어 프로파일 벡터와 연관어 프로파일 벡터들은 컨텐츠 검색어 추출부(210)에서 이미 생성되어 있는 것일 수 있다 .그리고 역색인 생성부(230)는 주제어 프로파일 벡터 상의 유입검색어와 연관어 프로파일 벡터 상의 연관검색어를 식별하고, 각 검색어(즉, 유입검색어와 연관검색어)마다 검색어에 대응하는 후보 컨텐츠들의 집합을 구성함으로써 역색인 정보를 생성한다. 이때, 각 집합 내에서 주제어 프로파일 벡터의 벡터항 스칼라값이 높은 순서로 후보 컨텐츠를 정렬하여 역색인 정보를 생성한다. Then, the inverse index generator 230 indexes the main word profile vector of the candidate content and the associative profile vector. The profile vector of the candidate content and the associated profile vectors may have already been generated by the content search term extraction unit 210. The inverse index generation unit 230 may generate an inverse search term on the main profile profile vector and an association And generates the inverse index information by constructing a set of candidate contents corresponding to each search term for each search term (i.e., an influential search term and an associated search term). In this case, the inverse index information is generated by arranging the candidate contents in the descending order of the vector anti-scalar value of the subject keyword profile vector in each set.

예를 들어, 도 5를 참조하면, LG 트윈스라는 유입검색어를 추출한 경우, 각 후보 컨텐츠마다 LG 트윈스라는 유입검색어에 대한 주제어 프로파일 벡터를 색인할 수 있다. "KIA.LG 와일드카드 결정전 티켓 35분만에 매진"이라는 제목의 컨텐츠(이하, A 컨텐츠)와 "[SS포토]LG 트윈스, 와일드카드 승리를 위한 유광점퍼"라는 제목의 컨텐츠(이하, B 컨텐츠)는 각각 "LG트윈스"와 "양상문"을 유입검색어로 포함할 수 있다. 이 경우, A 컨텐츠는 LG 트윈스에 대한 주제어 프로파일 벡터에 대해 0.6값을 가질 수 있고, B 컨텐츠는 LG 트윈스에 대한 주제어 프로파일 벡터에 대해 0.5 값을 가질 수 있다. 역색인 생성부(230)는 컨텐츠 별로 검색어에 대한 색인을 생성하는 것이 아니라, "역으로" "LG 트윈스"라는 유입검색어를 기준으로 높은 값을 갖는 컨텐츠들을 차례로 정렬함으로써 유입검색어 역색인 정보를 생성할 수 있다. 또한, 연관검색어에 대해서도 마찬가지의 과정을 수행하여 연관검색어 역색인 정보를 생성할 수도 있다. For example, referring to FIG. 5, when an incoming search word LG twins is extracted, a keyword profile vector for an incoming search term LG twins may be indexed for each candidate content. The contents (hereinafter referred to as "A content") titled "KIA.LG wild card match ticket sold out in 35 minutes" (hereafter referred to as A content) and the content titled "Glossy jumper for winning [SS photo] LG twins and wild card" Can include "LG Twins" and "Yang Sansum" as influent search words, respectively. In this case, the A content may have a value of 0.6 for the main word profile vector for the LG Twins, and the B content may have a value of 0.5 for the main word profile vector for the LG Twins. The inverse index generation unit 230 generates indexes of the incoming query terms by sequentially sorting the contents having a high value based on the incoming query term " LG Twins " can do. In addition, it is also possible to generate the related term inverse index information by performing a similar process for the related term.

이때, 각 유입검색어 또는 각 연관검색어마다 정렬된 컨텐츠들에 있어서, 역색인 생성부(230)는 최상위 순위로부터 소정의 순위까지만 랭크된 후보 컨텐츠들을 선정함으로써 역색인 정보에 포함되는 후보 컨텐츠들의 개수를 필터링 할 수도 있다. At this time, in the contents sorted for each influential search word or each associated search term, the inverse index generator 230 selects the candidate contents ranked only from the highest ranking to a predetermined rank, thereby calculating the number of candidate contents included in the inverse index information It can also be filtered.

추천 컨텐츠 제공부(240)는, 타겟 사용자의 단말의 로그정보로부터 추출한 유입검색어 및 역색인 정보에 포함된 후보 컨텐츠의 유입검색어와 연관검색어 간의 관심도에 관한 점수를 계산함으로써, 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공한다. 구체적으로, 타겟 사용자의 단말에서 조회된 컨텐츠들의 주제어 프로파일 벡터들로부터 추출한, 타겟 사용자의 프로파일 벡터와 역색인 정보에 포함된 후보 컨텐츠의 주제어 프로파일 벡터 및 연관어 프로파일 벡터 간의 관심도에 관한 점수를 계산하여 추천 컨텐츠들을 선정할 수 있다. The recommended content providing unit 240 calculates a score related to the degree of interest between the incoming search word and the associated search word of the candidate content included in the influent search word and inverse index information extracted from the log information of the target user terminal, And provides it to the terminal of the target user. Specifically, the score of interest between the target user's profile vector extracted from the main subject profile vectors of the content searched at the terminal of the target user, the main subject profile vector of the candidate content included in the inverse index information, and the association profile vector is calculated Recommended content can be selected.

먼저, 추천 컨텐츠 제공부(240)는 타겟 사용자의 프로파일 벡터와 유입검색어 역색인 정보에 포함된 후보 컨텐츠 별 주제어 프로파일 벡터와 연관검색어 역색인 정보에 포함된 후보 컨텐츠 별 연관어 프로파일 벡터를 내적하여 상기 후보 컨텐츠들의 점수를 계산한다. 이때의 점수가 위의 관심도에 관한 점수일 수 있다. First, the recommended content providing unit 240 internalizes the profile profile vector of the candidate content included in the profile vector of the target user, the candidate profile content vector of the candidate content, and the profile profile vector of each candidate content included in the related keyword inverse index information, Calculate the score of the candidate content. The score at this time may be a score regarding the above interest.

구체적으로, 추천 컨텐츠 제공부(240)는 타겟 사용자의 프로파일 벡터 상의 벡터값의 스칼라값이 0이 아닌 주제어(즉, 유입검색어)를 추출한다. 예를 들어, 도 6의 타겟 사용자의 프로파일 벡터 내의 주제어들은 모두 벡터값이 0 보다 크기 때문에 타겟 사용자의 프로파일 벡터 내의 모든 유입검색어를 추출한다. 이어서, 추천 컨텐츠 제공부(240)는 타겟 사용자의 프로파일 벡터의 주제어와 대응하는 역색인 정보 내의 유입검색어와 연관검색어와 대응하는 후보 컨텐츠들을 검색함으로써, 타겟 사용자의 프로파일 벡터에 속하는 주제어들의 후보 컨텐츠 집합을 수집한다. 예를 들어, 도 6에서 타겟 사용자의 프로파일 벡터 내에 "LG 트윈스"라는 검색어와 대응하는 검색어가 유입검색어 역색인 정보 또는 연관검색어 역색인 정보에 있는지 판단하고, 해당 역색인 정보 내에서 "LG 트윈스"에 관하여 정렬된 후보 컨텐츠들을 하나의 집합으로 추출한다. 이후, 타겟 사용자의 프로파일 벡터와 후보 컨텐츠 집합 내의 각 컨텐츠 별 프로파일 벡터의 값을 내적한다. 이 경우, 각 후보 컨텐츠 별로 내적값이 산출되고 이것이 점수가 될 수 있다.Specifically, the recommended content providing unit 240 extracts a keyword having a scalar value of a vector value on the profile vector of the target user that is not equal to zero (i.e., an influential search word). For example, the subject keywords in the target user's profile vector in FIG. 6 all extract all the influent search terms in the profile vector of the target user because the vector value is greater than zero. Then, the recommended content providing unit 240 retrieves the candidate content corresponding to the input search word and the associated search term in the inverse index information corresponding to the keyword of the target user's profile vector, thereby generating a candidate content set Lt; / RTI > For example, in FIG. 6, it is judged whether the search word corresponding to the search term " LG Twins " is included in the influent term index information or the related term index information in the profile vector of the target user. And extracts the sorted candidate contents as one set. Then, the value of the profile vector of the target user and the profile vector of each content in the candidate content set are discarded. In this case, an inner product value is calculated for each candidate content, and this can be a score.

이러한 과정을 통해, 크게 유입검색어와 연관검색어 별로 주제어에 관한 후보 컨텐츠들의 점수와 연관어에 관한 후보 컨텐츠들의 점수가 별도로 계산됨으로써, 주제어 기반 추천 컨텐츠와 연관어 기반 추천 컨텐츠에 대한 두가지 군이 도출될 수 있다. Through this process, scores of candidate contents related to the keyword and the score of the candidate contents related to the keyword are separately calculated by the influent keyword and the related keyword, so that two groups of keyword-based recommendation content and associative word recommendation content are derived .

그리고 추천 컨텐츠 제공부(240)는 각 군 내에서 각 후보 컨텐츠의 점수가 높은 순으로 랭킹화하여, 랭킹값에 따라 소정 개수의 후보 컨텐츠를 추천 컨텐츠로 상기 사용자 단말(100)에 제공할 수 있다. The recommended content providing unit 240 may rank the candidate content items in descending order of the score of each candidate content item and provide a predetermined number of candidate contents to the user terminal 100 as recommendation contents according to the ranking value .

이때, 추천 컨텐츠 제공부(240)는 주제어에 관한 컨텐츠와 연관어에 관한 컨텐츠를 번갈아가면서 제공할 수도 있고, 주제어에 관한 컨텐츠들의 집합을 사용자 단말(100)에 제공되는 리스트의 상단에 제공한 뒤, 연관어에 관한 컨텐츠들의 집합을 후순위로 제공할 수도 있다. At this time, the recommended content providing unit 240 may alternatively provide the contents related to the main language and the related words alternately, or may provide a set of contents related to the main language to the top of the list provided to the user terminal 100 , And may provide a subset of the content related to the associated word.

이하, 본 발명의 일 실시예에 따르는, 컨텐츠에 관한 유입검색어 기반의 컨텐츠 추천방법에 대하여 구체적으로 설명하도록 한다. Hereinafter, a content recommendation method based on an influential search term related to a content according to an embodiment of the present invention will be described in detail.

이하의 방법은 상술한 서버(200)에 의해 수행되는 것이므로, 이하에서 생략된 내용이 있다고 하더라도, 상술한 내용으로부터 갈음하도록 한다. The following method is performed by the above-described server 200, so that even if there is an omission in the following, the above description is omitted.

서버(200)는 먼저, 각 컨텐츠에 대하여, 서버(200)에 접속한 모든 사용자의 검색 클릭 로그로부터 컨텐츠들의 유입검색어와 연관검색어를 추출한다(S110).The server 200 first extracts an entry search word and an associated search term of content from search click logs of all users connected to the server 200 for each content (S110).

서버(200)는 유입검색어에 대한 주제어 프로파일 벡터와 연관검색어에 관한 연관어 프로파일 벡터를 생성한다(S120).The server 200 generates a main keyword profile vector for the incoming query and an associated keyword profile vector for the associated keyword (S120).

또한, 서버(200)는 타겟 사용자에 관한 검색기록과 이에 수반된 검색결과 컨텐츠 클릭 기록에 남겨진, 타겟 사용자가 조회한 컨텐츠들과 이들 컨텐츠의 주제어 프로파일 벡터를 이용하여 타겟 사용자의 프로파일 벡터를 생성한다(S130).In addition, the server 200 generates a profile vector of the target user using the contents retrieved by the target user and the subject keyword profile vectors of the contents, which are left in the search record related to the target user and the search result content click record accompanying the search record (S130).

이어서, 서버(200)는 후보 컨텐츠들을 선정하고, 후보 컨텐츠들로부터 추출된 유입검색어와 연관검색어를 기반으로 역색인 정보를 생성한다(S140). 구체적으로, 각 검색어 별로 컨텐츠들을 분류하되, 해당 검색어에 대한 프로파일 벡터 값이 높은 순으로 정렬하여 분류할 수 있다. Next, the server 200 selects the candidate contents, and generates the index information based on the input keyword and the related keyword extracted from the candidate contents (S140). Specifically, the contents can be classified according to each search word, and the profile vector values for the search terms can be sorted and sorted in descending order.

이어서, 서버(200)는 역색인 정보와 타겟 사용자의 프로파일 벡터를 기초로 타겟 사용자의 관심사항과 매칭되는 추천 컨텐츠를 선정하여 타겟 사용자 단말(100)로 제공한다(S150). 이때, 역색인 정보 내의 각 컨텐츠 별 프로파일 벡터와 타겟 사용자의 프로파일 벡터를 내적하여, 내적 결과 점수값이 가장 높은 순으로 사용자의 관심사항과 가장 잘 매칭되는 것으로 간주하여 추천할 수 있다. Then, the server 200 selects recommended content matching the target user's interest based on the inverse index information and the profile vector of the target user, and provides the selected recommended content to the target user terminal 100 (S150). At this time, the profile vector of each content in the inverse index information and the profile vector of the target user are deduced, and it can be recommended that the inner product result score is best matched with the user's interest in the order of highest score.

본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. One embodiment of the present invention may also be embodied in the form of a recording medium including instructions executable by a computer, such as program modules, being executed by a computer. Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. In addition, the computer readable medium may include both computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data.

본 발명의 방법 및 시스템은 특정 실시예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.While the methods and systems of the present invention have been described in connection with specific embodiments, some or all of those elements or operations may be implemented using a computer system having a general purpose hardware architecture.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.It will be understood by those skilled in the art that the foregoing description of the present invention is for illustrative purposes only and that those of ordinary skill in the art can readily understand that various changes and modifications may be made without departing from the spirit or essential characteristics of the present invention. will be. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive. For example, each component described as a single entity may be distributed and implemented, and components described as being distributed may also be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.

100: 사용자 단말 200: 서버
210: 컨텐츠 검색어 추출부 220: 타겟 사용자 정보 추출부
230: 역색인 생성부 240: 추천 컨텐츠 제공부
100: user terminal 200: server
210: content search term extraction unit 220: target user information extraction unit
230: an inverse indexing unit 240: a recommended content providing unit

Claims (17)

컨텐츠 추천장치에 의해 수행되는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법에 있어서,
(a) 컨텐츠 추천장치에 접속하여 컨텐츠 검색을 수행한 사용자들의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록을 기초로, 각 컨텐츠에 대한 유입검색어를 추출하는 단계;
(b) 후보 컨텐츠들의 유입검색어들을 식별한 후, 상기 식별된 유입검색어를 기준으로 상기 후보 컨텐츠들을 정렬함으로써 역색인 정보를 생성하는 단계; 및
(c) 타겟 사용자의 단말의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 추출한 유입검색어와 상기 역색인 정보에 포함된 후보 컨텐츠의 유입검색어 간의 관심도에 관한 점수를 상기 유입검색어들에 관한 벡터 내적을 기반으로 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 단계를 포함하며,
상기 컨텐츠에 대한 유입검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 전 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드인 것인, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
A content recommendation method based on an influential search term for content, which is performed by a content recommendation apparatus,
(a) extracting an influential search word for each content based on a search record of users who have accessed the content recommendation apparatus and search for the content, and a selective input record of the search result content;
(b) generating reverse index information by sorting the candidate contents based on the identified input query word after identifying influent search words of candidate contents; And
(c) a score related to the degree of interest between the input search word extracted from the search record of the target user's terminal and the selection input record of the search result content and the influential search word of the candidate content included in the inverse index information, Selecting candidate content among the candidate contents and providing the selected candidate contents to the terminal of the target user,
Wherein the influent search word for the content is a search window input keyword received by the content recommendation device before receiving a user input for the link information of the content.
제 1 항에 있어서,
(a-1) 상기 (a) 단계 후, 상기 유입검색어에 대한 주제어 프로파일 벡터를 생성하는 단계; 및
(a-2) 상기 타겟 사용자의 단말의 소정 기간 내 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 상기 타겟 사용자가 입력한 적어도 하나의 유입검색어를 추출하고, 상기 타겟 사용자의 유입검색어에 대한 주제어 프로파일 벡터로 구성된 상기 타겟 사용자의 프로파일 벡터를 생성하는 단계를 더 포함하는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
The method according to claim 1,
(a-1) generating a main language profile vector for the incoming query after the step (a); And
(a-2) extracting at least one influent keyword inputted by the target user from search records within a predetermined period of time of the target user's terminal and selective input records for the search result content, Further comprising generating a profile vector of the target user configured with a profile vector.
제 2 항에 있어서,
상기 타겟 사용자의 프로파일 벡터는,
복수의 유입검색어 및 각 유입검색어에 대응하는 주제어 프로파일 벡터를 포함하는 것인, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
3. The method of claim 2,
The profile vector of the target user may include:
Wherein the input profile includes a plurality of influent search terms and a subject profile vector corresponding to each influent search term.
제 2 항에 있어서,
상기 (b) 단계는, 상기 후보 컨텐츠들의 각 유입검색어마다, 상기 유입검색어를 포함하는 후보 컨텐츠들을 정렬하되, 상기 유입검색어의 주제어 프로파일 벡터의 스칼라 값을 기준으로 정렬한 역색인 정보를 생성하는 단계를 포함하고,
상기 (c) 단계는, 상기 타겟 사용자의 프로파일 벡터와 상기 역색인 정보에 포함된 후보 컨텐츠의 주제어 프로파일 벡터를 기초로 후보 컨텐츠들의 점수를 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 단계를 포함하며,
상기 주제어 프로파일 벡터는 상기 유입검색어에 대한 입력 후 발생된 컨텐츠의 클릭수 기반으로 산출되어 생성되는 것인, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
3. The method of claim 2,
The step (b) includes the steps of: sorting candidate contents including the influent search word for each influent search word of the candidate contents, and generating inverse index information sorted on the basis of a scalar value of a main word profile vector of the influent search word Lt; / RTI >
In the step (c), a score of the candidate contents is calculated based on the profile vector of the target user and the main language profile vector of the candidate content included in the inverse index information, thereby selecting the recommended contents among the candidate contents, To a user's terminal,
Wherein the main keyword profile vector is calculated and generated based on the number of clicks of the content generated after inputting the input query word.
제 4 항에 있어서,
상기 (b) 단계는,
(b-1) 전체 컨텐츠들 중 현재로부터 미리 설정된 기간 내에 생성된 컨텐츠들을 후보 컨텐츠들로 필터링하되, 컨텐츠의 카테고리 별로 상기 미리 설정된 기간을 다르게 설정하여 상기 후보 컨텐츠들을 필터링하는 단계를 포함하는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
5. The method of claim 4,
The step (b)
(b-1) filtering the contents generated within a predetermined period from the current time among the entire contents with candidate contents, and filtering the candidate contents by setting the predetermined period differently for each category of contents Based content recommendation method.
제 4 항에 있어서,
상기 (b) 단계는,
(b-2) 상기 후보 컨텐츠의 주제어 프로파일 벡터들을 추출한 후, 상기 추출된 주제어 프로파일 벡터에 대한 유입검색어들을 식별하고, 상기 각 유입검색어마다, 유입검색어에 대응하는 후보 컨텐츠들의 집합을 구성함으로써 상기 역색인 정보를 생성하되, 각 집합 내에서 상기 유입검색어의 주제어 프로파일 벡터의 스칼라 값이 높을수록 상위에 정렬하는 단계
를 포함하는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
5. The method of claim 4,
The step (b)
(b-2) extracting main subject profile vectors of the candidate content, identifying influent search terms for the extracted subject keyword profile vector, constructing a set of candidate contents corresponding to the influent search word for each of the influent search words, And arranging the index information in a higher order as the scalar value of the main word profile vector of the influent search word is higher in each set
Wherein the content recommendation method is based on an inflow search term for content.
제 6 항에 있어서,
상기 (b-2) 단계는,
각 유입검색어마다, 최상위 순위로부터 소정의 순위까지 랭크된 후보 컨텐츠들을 선정하여, 상기 역색인 정보를 필터링하는 단계를 포함하는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
The method according to claim 6,
The step (b-2)
And selecting candidate content ranked from a highest ranking to a predetermined rank for each entry query, and filtering the inverse index information.
제 4 항에 있어서,
상기 (c) 단계는,
(c-1) 상기 타겟 사용자의 프로파일 벡터와 상기 역색인 정보에 포함된 후보 컨텐츠의 주제어 프로파일 벡터를 내적하여 상기 후보 컨텐츠들의 점수를 계산하는 단계를 포함하는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
5. The method of claim 4,
The step (c)
(c-1) calculating a score of the candidate content by inserting a subject keyword profile vector of the candidate content included in the profile vector of the target user and the inverse index information, Way.
제 8 항에 있어서,
상기 (c-1) 단계는,
상기 타겟 사용자의 프로파일 벡터에 포함된 적어도 하나의 주제어 프로파일 벡터 중 스칼라값이 0이 아닌 주제어 프로파일 벡터의 유입검색어를 추출하고, 상기 추출된 유입검색어와 대응하는 상기 역색인 정보 내의 유입검색어와 후보 컨텐츠들을 검색함으로써, 상기 타겟 사용자의 프로파일 벡터에 속하는 유입검색어들의 후보 컨텐츠 집합을 수집하는 단계; 및
상기 후보 컨텐츠 집합에 속하는 후보 컨텐츠들의 주제어 프로파일 벡터와 상기 타겟 사용자의 프로파일 벡터를 내적함으로써 각 후보 컨텐츠의 점수를 계산하는 단계를 포함하는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
9. The method of claim 8,
The step (c-1)
Extracting an influent keyword of a subject profile vector having a non-zero scalar value among at least one subject profile vector included in the profile vector of the target user, extracting an influential search word in the inverse index information corresponding to the extracted influent keyword, Collecting a candidate content set of influent search terms belonging to the profile vector of the target user by searching for the candidate content set; And
And calculating a score of each candidate content by subtracting a subject keyword profile vector of candidate contents belonging to the candidate content set and a profile vector of the target user.
제 8 항에 있어서,
상기 (c) 단계는,
(c-2) 상기 각 후보 컨텐츠의 점수가 높은 순으로 랭킹화하여, 랭킹값에 따라 소정 개수의 후보 컨텐츠를 상기 추천 컨텐츠로 상기 사용자 단말에 제공하는 단계를 포함하는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
9. The method of claim 8,
The step (c)
(c-2) ranking the candidate contents in descending order of scores, and providing a predetermined number of candidate contents as the recommended contents to the user terminal according to a ranking value; .
컨텐츠 추천장치에 의해 수행되는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법에 있어서,
(a) 컨텐츠 추천장치에 접속하여 컨텐츠 검색을 수행한 사용자들의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록을 기초로, 각 컨텐츠에 대한 유입검색어 및 연관검색어를 추출하는 단계;
(b) 후보 컨텐츠들의 유입검색어들 및 연관검색어들을 식별한 후, 상기 식별된 유입검색어들 및 연관검색어들을 기준으로 상기 후보 컨텐츠들을 정렬함으로써 역색인 정보를 생성하는 단계; 및
(c) 타겟 사용자의 단말의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 추출한 유입검색어와 연관검색어 및 상기 역색인 정보에 포함된 후보 컨텐츠의 유입검색어와 연관검색어 간의 관심도에 관한 점수를 상기 유입검색어들과 상기 연관검색어들에 관한 벡터 내적을 기반으로 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 단계를 포함하며,
상기 컨텐츠에 대한 유입검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 바로 직전에 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드이고,
상기 컨텐츠에 대한 연관검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 전 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드 중 상기 유입검색어를 제외한 나머지 검색어인 것인, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
A content recommendation method based on an influential search term for content, which is performed by a content recommendation apparatus,
(a) extracting an influential search word and an associated search term for each content based on a search record of users who have connected to the content recommendation apparatus and search for the content, and a selection input record of the search result content;
(b) generating inverse index information by identifying influent search terms and associated search terms of candidate content, and then sorting the candidate content based on the identified influent search terms and associated search terms; And
(c) an input search word and an associated search term extracted from a selective input record of search results and content of a search result of a target user, and a score related to an interest between an influential search word and an associated search word of candidate content included in the inverse index information, Selecting candidate content among the candidate contents and providing the selected candidate contents to the terminal of the target user by calculating based on the search words and the intra-vector related to the related search words,
Wherein the input search word for the content is a search window input keyword received by the content recommendation device immediately before receiving a user input for the link information of the content,
Wherein the related search term for the content is a search word input keyword received from the content recommendation apparatus before receiving the user input for the link information of the content, How to recommend content.
제 11 항에 있어서,
(a-1) 상기 (a) 단계 후, 상기 유입검색어에 대한 주제어 프로파일 벡터와 상기 연관검색어에 대한 연관어 프로파일 벡터를 생성하는 단계; 및
(a-2) 상기 타겟 사용자의 단말의 소정 기간 내 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 상기 타겟 사용자가 입력한 적어도 하나의 유입검색어를 추출하고, 상기 타겟 사용자의 유입검색어에 대한 주제어 프로파일 벡터로 구성된 상기 타겟 사용자의 프로파일 벡터를 생성하는 단계를 더 포함하는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
12. The method of claim 11,
(a-1) generating a main word profile vector for the incoming search word and a related word profile vector for the associated keyword after the step (a); And
(a-2) extracting at least one influent keyword inputted by the target user from search records within a predetermined period of time of the target user's terminal and selective input records for the search result content, Further comprising generating a profile vector of the target user configured with a profile vector.
제 12 항에 있어서,
상기 (b) 단계는, 상기 식별된 각 유입검색어와 각 연관검색어마다, 상기 유입검색어를 포함하는 후보 컨텐츠들과 상기 연관검색어를 포함하는 후보 컨텐츠들을 정렬하되, 상기 후보 컨텐츠의 주제어 프로파일 벡터의 스칼라 값과 연관어 프로파일 벡터의 스칼라 값을 기준으로 정렬한 역색인 정보를 생성하는 단계를 포함하고,
상기 (c) 단계는, 상기 타겟 사용자의 프로파일 벡터와 상기 역색인 정보에 포함된 후보 컨텐츠의 주제어 프로파일 벡터 및 연관어 프로파일 벡터를 기초로 후보 컨텐츠들의 점수를 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 단계를 포함하며,
상기 주제어 프로파일 벡터는 상기 유입검색어에 대한 입력 후 발생된 컨텐츠의 클릭수 기반으로 산출되어 생성되는 것이며, 상기 연관어 프로파일 벡터는 상기 연관검색어에 대한 입력 후 발생된 컨텐츠의 클릭수 기반으로 산출되어 생성되는 것인, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
13. The method of claim 12,
Wherein the step (b) comprises: arranging candidate contents including the input search word and candidate contents including the associated search term for each of the identified influent search words and each associated search term, And generating inverse index information sorted based on a scalar value of an association profile vector,
The step (c) may include calculating a score of the candidate content based on the profile vector of the target user, the main language profile vector of the candidate content included in the inverse index information, and the association profile profile vector, And providing the selected terminal to the terminal of the target user,
Wherein the keyword profile vector is calculated and generated on the basis of the number of clicks of the content generated after inputting the input query word and the associative word profile vector is calculated based on the number of clicks of the content generated after inputting the related keyword The content recommendation method based on an inflow search term for the content.
제 13 항에 있어서,
상기 (c) 단계는,
(c-1) 상기 타겟 사용자의 프로파일 벡터와 상기 역색인 정보에 포함된 후보 컨텐츠의 주제어 프로파일 벡터를 내적하여 주제어에 관한 상기 후보 컨텐츠들의 점수를 계산하고, 상기 타겟 사용자의 프로파일 벡터와 상기 역색인 정보에 포함된 후보 컨텐츠의 연관어 프로파일 벡터를 내적하여 연관어에 관한 상기 후보 컨텐츠들의 점수를 계산하는 단계를 포함하는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
14. The method of claim 13,
The step (c)
(c-1) calculating a score of the candidate content related to a main keyword by inserting a main keyword profile vector of the candidate content included in the profile vector of the target user and the inverse index information, And calculating a score of the candidate content with respect to the association word by interpolating the association word profile vector of the candidate content included in the information.
제 14 항에 있어서,
상기 (c) 단계는,
(c-2) 상기 각 후보 컨텐츠의 점수가 높은 순으로 랭킹화하여, 랭킹값에 따라 상기 추천 컨텐츠를 제공하되, 상기 주제어에 관한 컨텐츠와 상기 연관어에 관한 컨텐츠를 번갈아가며 제공하거나, 상기 주제어에 관한 컨텐츠들과 상기 연관어에 관한 컨텐츠들을 구분하고 상기 연관어에 관한 컨텐츠를 후순위로 제공하는 단계를 포함하는, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천방법.
15. The method of claim 14,
The step (c)
(c-2) ranking the scores of the candidate contents in descending order, providing the recommendation contents according to a ranking value, and alternately providing contents related to the main language and contents related to the association word, And providing contents related to the related word in a rearranged manner. The method of claim 1, wherein the contents are related to the related words.
컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천장치에 있어서,
상기 컨텐츠 추천장치에 접속하여 컨텐츠 검색을 수행한 사용자들의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록을 기초로, 각 컨텐츠에 대한 유입검색어를 추출하는 컨텐츠 검색어 추출부;
후보 컨텐츠들의 유입검색어들을 식별한 후, 상기 식별된 유입검색어를 기준으로 상기 후보 컨텐츠들을 정렬함으로써 역색인 정보를 생성하는 역색인 생성부; 및
타겟 사용자의 단말의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 추출한 유입검색어와 상기 역색인 정보에 포함된 후보 컨텐츠의 유입검색어 간의 관심도에 관한 점수를 상기 유입검색어들에 관한 벡터 내적을 기반으로 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 추천 컨텐츠 제공부를 포함하며,
상기 컨텐츠에 대한 유입검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 전 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드인 것인, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천장치.
A content recommendation apparatus based on an influent search term for content,
A content query extracting unit for extracting an influential search word for each content based on a search record of users who have connected to the content recommendation apparatus and search for content and a selection input record of the search result content;
An inverse index generating unit for generating inverse index information by sorting the candidate contents based on the identified influent search word after identifying influent search words of candidate contents; And
Based on the in-vocabulary extracted from the search record of the terminal of the target user and the selection input record of the search result content and the score of the interest between the influent search word of the candidate content included in the inverse index information, And a recommendation contents providing unit for selecting recommended contents among the candidate contents and providing the selected contents to the terminal of the target user,
Wherein the influent search word for the content is a search window input keyword received by the content recommendation apparatus before receiving a user input for link information of the content.
컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천장치에 있어서,
상기 컨텐츠 추천장치에 접속하여 컨텐츠 검색을 수행한 사용자들의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록을 기초로, 각 컨텐츠에 대한 유입검색어 및 연관검색어를 추출하는 컨텐츠 검색어 추출부;
후보 컨텐츠들의 유입검색어들 및 연관검색어들을 식별한 후, 상기 식별된 유입검색어들 및 연관검색어들을 기준으로 상기 후보 컨텐츠들을 정렬함으로써 역색인 정보를 생성하는 역색인 생성부; 및
타겟 사용자의 단말의 검색기록과 검색결과 컨텐츠에 대한 선택 입력 기록으로부터 추출한 유입검색어와 연관검색어 및 상기 역색인 정보에 포함된 후보 컨텐츠의 유입검색어와 연관검색어 간의 관심도에 관한 점수를 상기 유입검색어들과 상기 연관검색어들에 관한 벡터 내적을 기반으로 계산함으로써, 상기 후보 컨텐츠들 중 추천 컨텐츠들을 선정하여 상기 타겟 사용자의 단말로 제공하는 추천 컨텐츠 제공부를 포함하며,
상기 컨텐츠에 대한 유입검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 바로 직전에 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드이고,
상기 컨텐츠에 대한 연관검색어는 상기 컨텐츠의 링크정보에 대한 사용자 입력을 수신하기 전 상기 컨텐츠 추천장치에서 수신한 검색창 입력 키워드 중 상기 유입검색어를 제외한 나머지 검색어인 것인, 컨텐츠에 대한 유입검색어 기반의 컨텐츠 추천장치.

A content recommendation apparatus based on an influent search term for content,
A content query extracting unit for extracting an influential search word and an associated search term for each content based on a search record of users who have connected to the content recommendation apparatus and search for content and a selection input record of the search result content;
An inverse index generating unit for generating inverse index information by sorting the candidate contents based on the identified influent search terms and related search terms after identifying influent search terms and related search terms of candidate contents; And
The input search term and the related search term extracted from the selective input record of the search result of the target user terminal and the search result contents, and the score of the interest between the influent search term and the related search term of the candidate content included in the inverse index information, And a recommended content providing unit for selecting the recommended content among the candidate contents and providing the selected content to the terminal of the target user,
Wherein the input search word for the content is a search window input keyword received by the content recommendation device immediately before receiving a user input for the link information of the content,
Wherein the related search term for the content is a search word input keyword received from the content recommendation apparatus before receiving the user input for the link information of the content, Content recommendation apparatus.

KR1020160179331A 2016-12-26 2016-12-26 Method and device for recommending contents based on inflow keyword and relevant keyword for contents KR101925950B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160179331A KR101925950B1 (en) 2016-12-26 2016-12-26 Method and device for recommending contents based on inflow keyword and relevant keyword for contents

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160179331A KR101925950B1 (en) 2016-12-26 2016-12-26 Method and device for recommending contents based on inflow keyword and relevant keyword for contents

Publications (2)

Publication Number Publication Date
KR20180075234A KR20180075234A (en) 2018-07-04
KR101925950B1 true KR101925950B1 (en) 2018-12-06

Family

ID=62913267

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160179331A KR101925950B1 (en) 2016-12-26 2016-12-26 Method and device for recommending contents based on inflow keyword and relevant keyword for contents

Country Status (1)

Country Link
KR (1) KR101925950B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190123667A (en) 2018-04-11 2019-11-01 주식회사 에이에스디코리아 Method for managing contents and cloud server for executing the same

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611471B (en) * 2019-02-25 2023-12-26 阿里巴巴集团控股有限公司 Searching method and device and electronic equipment
CN111538903B (en) * 2020-04-17 2023-03-31 抖音视界有限公司 Method and device for determining search recommended word, electronic equipment and computer readable medium
CN111797308B (en) * 2020-06-16 2023-11-28 北京达佳互联信息技术有限公司 Resource recommendation method and device, electronic equipment and medium
KR20220039075A (en) * 2020-09-21 2022-03-29 삼성전자주식회사 Electronic device, contents searching system and searching method thereof
CN112148857A (en) * 2020-09-23 2020-12-29 中国电子科技集团公司第十五研究所 Military official document automatic generation system and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190123667A (en) 2018-04-11 2019-11-01 주식회사 에이에스디코리아 Method for managing contents and cloud server for executing the same

Also Published As

Publication number Publication date
KR20180075234A (en) 2018-07-04

Similar Documents

Publication Publication Date Title
US11710054B2 (en) Information recommendation method, apparatus, and server based on user data in an online forum
KR101925950B1 (en) Method and device for recommending contents based on inflow keyword and relevant keyword for contents
CN107862022B (en) Culture resource recommendation system
KR101322679B1 (en) An assistant―adviser using the semantic analysis of community exchanges
US9536003B2 (en) Method and system for hybrid information query
US9235646B2 (en) Method and system for a search engine for user generated content (UGC)
RU2670494C2 (en) Method for processing search requests, server and machine-readable media for its implementation
US20150205580A1 (en) Method and System for Sorting Online Videos of a Search
CN102708174B (en) Method and device for displaying rich media information in browser
US20170154116A1 (en) Method and system for recommending contents based on social network
US9501580B2 (en) Method and apparatus for automated selection of interesting content for presentation to first time visitors of a website
US11514498B2 (en) System and method for intelligent guided shopping
JP6728178B2 (en) Method and apparatus for processing search data
CN105378730A (en) Social media content analysis and output
US9245010B1 (en) Extracting and leveraging knowledge from unstructured data
KR102601545B1 (en) Geographic position point ranking method, ranking model training method and corresponding device
JP5952711B2 (en) Prediction server, program and method for predicting future number of comments in prediction target content
JP5341847B2 (en) Search query recommendation method, search query recommendation device, search query recommendation program
KR101621735B1 (en) Recommended search word providing method and system
US9020863B2 (en) Information processing device, information processing method, and program
US10387934B1 (en) Method medium and system for category prediction for a changed shopping mission
KR101556020B1 (en) System and method for recommending blog based on interest according to age and sex
CN103514237B (en) A kind of method and system obtaining user and Document personalization feature
KR101132431B1 (en) System and method for providing interest information
CN113626638A (en) Short video recommendation processing method and device, intelligent terminal and storage medium

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
FPAY Annual fee payment

Payment date: 20190329

Year of fee payment: 6